Nan'ao, China • 23.4207° N, 117.0218° W
ChatGPT 做个人知识库的成本计算
昨天,我把我收藏的吴军老师的文章输入到向量数据库中。还不清楚通过向量数据库搭建个人知识库原理的童鞋,可以看我 下面的两条动态
我粗略地计算了一下成本,其实是微乎其微的 😌。只要 OpenAI 的价格保持不变,我目前不打算探索其他开源大模型的方案。在把内容录入到向量数据库的过程中,只会用到向量映射的模型 text-embedding-ada-002-v2,而这个模型的价格,又极其良心,不信你看👇🏻
OpenAI text-embedding-ada 收费价格
昨晚将多篇文章录入向量数据库调用 API 的计费记录 以我最近录入的一篇文章为例,文章总共含有 3712 个字符。通过 text-embedding-ada 模型进行映射后,总共消耗了 7300 个 token。那么,这个成本换算成人民币是多少呢?
OpenAI 官方 tokenizer 计算器
7.3 × $0.0004 = $0.00292
0.00292 × 7 = ¥0.02044
3.7K+ 个字符两分钱💰!在后续的测试中,我发现每次查询只会对搜索词进行向量映射,而搜索词更短,因此成本几乎可以忽略。按照它给我带来价值计算,这个投资的 ROI 可真的太高了。 目前看来,我实验的基于 ChatGPT 插件和向量数据库的方案,相比其他非网页端的方案,它的一大优点是可以在抽取到向量数据库的内容后,直接利用网页端 GPT-4 的能力对提取到的内容进行更深入的多轮对话。这个方案在成本,灵活性和使用体验上,都有明显的优势。 当然,这个知识库方案并非是银弹,不要以为好像有了它,你就可以做甩手掌柜了 😅。要想将它运用到实际的生活工作中,依然面临如何准确提取信息,如何稳定唤醒搜索插件等方面的挑战,这个部分我还在沉淀,等后续有成果,再爬上来分享~
Other projects
© 2023
Build my mindset system
Nan'ao, China • 23.4207° N, 117.0218° W
ChatGPT 做个人知识库的成本计算
昨天,我把我收藏的吴军老师的文章输入到向量数据库中。还不清楚通过向量数据库搭建个人知识库原理的童鞋,可以看我 下面的两条动态
我粗略地计算了一下成本,其实是微乎其微的 😌。只要 OpenAI 的价格保持不变,我目前不打算探索其他开源大模型的方案。在把内容录入到向量数据库的过程中,只会用到向量映射的模型 text-embedding-ada-002-v2,而这个模型的价格,又极其良心,不信你看👇🏻
OpenAI text-embedding-ada 收费价格
昨晚将多篇文章录入向量数据库调用 API 的计费记录 以我最近录入的一篇文章为例,文章总共含有 3712 个字符。通过 text-embedding-ada 模型进行映射后,总共消耗了 7300 个 token。那么,这个成本换算成人民币是多少呢?
OpenAI 官方 tokenizer 计算器
7.3 × $0.0004 = $0.00292
0.00292 × 7 = ¥0.02044
3.7K+ 个字符两分钱💰!在后续的测试中,我发现每次查询只会对搜索词进行向量映射,而搜索词更短,因此成本几乎可以忽略。按照它给我带来价值计算,这个投资的 ROI 可真的太高了。 目前看来,我实验的基于 ChatGPT 插件和向量数据库的方案,相比其他非网页端的方案,它的一大优点是可以在抽取到向量数据库的内容后,直接利用网页端 GPT-4 的能力对提取到的内容进行更深入的多轮对话。这个方案在成本,灵活性和使用体验上,都有明显的优势。 当然,这个知识库方案并非是银弹,不要以为好像有了它,你就可以做甩手掌柜了 😅。要想将它运用到实际的生活工作中,依然面临如何准确提取信息,如何稳定唤醒搜索插件等方面的挑战,这个部分我还在沉淀,等后续有成果,再爬上来分享~
Other projects
© 2023
Build my mindset system
Nan'ao, China • 23.4207° N, 117.0218° W
ChatGPT 做个人知识库的成本计算
昨天,我把我收藏的吴军老师的文章输入到向量数据库中。还不清楚通过向量数据库搭建个人知识库原理的童鞋,可以看我 下面的两条动态
我粗略地计算了一下成本,其实是微乎其微的 😌。只要 OpenAI 的价格保持不变,我目前不打算探索其他开源大模型的方案。在把内容录入到向量数据库的过程中,只会用到向量映射的模型 text-embedding-ada-002-v2,而这个模型的价格,又极其良心,不信你看👇🏻
OpenAI text-embedding-ada 收费价格
昨晚将多篇文章录入向量数据库调用 API 的计费记录 以我最近录入的一篇文章为例,文章总共含有 3712 个字符。通过 text-embedding-ada 模型进行映射后,总共消耗了 7300 个 token。那么,这个成本换算成人民币是多少呢?
OpenAI 官方 tokenizer 计算器
7.3 × $0.0004 = $0.00292
0.00292 × 7 = ¥0.02044
3.7K+ 个字符两分钱💰!在后续的测试中,我发现每次查询只会对搜索词进行向量映射,而搜索词更短,因此成本几乎可以忽略。按照它给我带来价值计算,这个投资的 ROI 可真的太高了。 目前看来,我实验的基于 ChatGPT 插件和向量数据库的方案,相比其他非网页端的方案,它的一大优点是可以在抽取到向量数据库的内容后,直接利用网页端 GPT-4 的能力对提取到的内容进行更深入的多轮对话。这个方案在成本,灵活性和使用体验上,都有明显的优势。 当然,这个知识库方案并非是银弹,不要以为好像有了它,你就可以做甩手掌柜了 😅。要想将它运用到实际的生活工作中,依然面临如何准确提取信息,如何稳定唤醒搜索插件等方面的挑战,这个部分我还在沉淀,等后续有成果,再爬上来分享~
Other projects
© 2023