ChatGPT 做个人知识库的成本计算

昨天，我把我收藏的吴军老师的文章输入到向量数据库中。还不清楚通过向量数据库搭建个人知识库原理的童鞋，可以看我下面的两条动态

动态 1

动态 2

我粗略地计算了一下成本，其实是微乎其微的 😌。只要 OpenAI 的价格保持不变，我目前不打算探索其他开源大模型的方案。在把内容录入到向量数据库的过程中，只会用到向量映射的模型 text-embedding-ada-002-v2，而这个模型的价格，又极其良心，不信你看👇🏻

OpenAI text-embedding-ada 收费价格

昨晚将多篇文章录入向量数据库调用 API 的计费记录以我最近录入的一篇文章为例，文章总共含有 3712 个字符。通过 text-embedding-ada 模型进行映射后，总共消耗了 7300 个 token。那么，这个成本换算成人民币是多少呢？

OpenAI 官方 tokenizer 计算器

7.3 × $0.0004 = $0.00292
0.00292 × 7 = ¥0.02044

3.7K+ 个字符两分钱💰！在后续的测试中，我发现每次查询只会对搜索词进行向量映射，而搜索词更短，因此成本几乎可以忽略。按照它给我带来价值计算，这个投资的 ROI 可真的太高了。目前看来，我实验的基于 ChatGPT 插件和向量数据库的方案，相比其他非网页端的方案，它的一大优点是可以在抽取到向量数据库的内容后，直接利用网页端 GPT-4 的能力对提取到的内容进行更深入的多轮对话。这个方案在成本，灵活性和使用体验上，都有明显的优势。当然，这个知识库方案并非是银弹，不要以为好像有了它，你就可以做甩手掌柜了 😅。要想将它运用到实际的生活工作中，依然面临如何准确提取信息，如何稳定唤醒搜索插件等方面的挑战，这个部分我还在沉淀，等后续有成果，再爬上来分享~

Other projects

Community

吉光卡片

一键文字排版美化工具

Build my mindset system

ChatGPT 做个人知识库的成本计算

7.3 × $0.0004 = $0.002920.00292 × 7 = ¥0.02044

7.3 × $0.0004 = $0.00292
0.00292 × 7 = ¥0.02044