logo icon

浅谈用 AI Agents 提升创作效率

横向比较了三个大语言模型,花了钱的还是不一样的,目前来说 OpenAI 完胜,明显是一个聪明蛋子。 羊驼🦙除了开源外,没看到任何优势。同样的 prompt 词,它的回答像个呆头鹅。

谈谈最近玩 AI 的体悟
谈谈最近玩 AI 的体悟

我现在用的还不深,主要用它来写文章,结论是AI Agents 特别值得投资。在信息类的内容,或者确定性比较强场景下,它的能力非常突出,比如让它写专业术语,操作步骤等。当然短板也很明显,就是让它稍微发挥一下创造力或者联想能力,即使再怎么调 prompt,它的回答都很捞(也可能是我的姿势不对 🫠

另外,如果你也跟我一样用 API 的话,会发现里面参数也很多, TOP-K、TOP-P 等等啥的都可以调,成为合格的炼丹师没啥奥秘,不!也可以说有一个终极奥义——菜就多练🤣
除 Prompt 外,炼丹的秘诀全部由三个参数决定,分别是 Temperature,Top K 和 Top P。平衡使用它们最终决定了你文章的生成质量。我自己使用下来,感觉这三个参数分别调节的严谨性、连贯性和可读性,不一定对啊。但我体感是这样的。
调节 Temperature 等参数的示意图
调节 Temperature 等参数的示意图

调节 Temperature 等参数的示意图

Temperature ,中文翻译过来叫做采样温度。这个值越低,生成的内容会更严谨,比较适合写技术文档、新闻报道等严肃的题材;越往上泽越适合创作型的内容,比如故事啊,随笔啊,博客文章,温度再高点的话,就可以让它去写诗歌了,温度越高就越随性,会损失掉一部分的连贯性。

TOP-K 代表模型会在前多少个词中选择生成下一个词。你这个值给的越大,它可选择的词就越多,当然内容也就越不可控,如果你希望严谨性比较高,那就把它调小一点,内容会更连贯,逻辑更严谨。如果你喜欢风格更随性,不拘一格一点的,那就给它拉满。

TOP-P 也称核采样,是根据累计概率动态调整候选单词的集合。具体来说,模型会从累计概率达到 P 的所有单词中进行选择。

举个简单的例子,假设模型给出了以下单词及其概率:

  • 单词 A: 0.4

  • 单词 B: 0.3

  • 单词 C: 0.2

  • 单词 D: 0.1

如果你设定 P=0.8,那么模型会选择累计概率达到 0.8 的前几个单词(在这个例子中是单词 A 和 B),然后从这两个单词中随机选择下一个输出的单词。

也就是说 Top P 采样可以在生成合理且连贯的内容的同时,保留一定的创造性。你如果想让它写的保守一点,就把这个值调低一点,如果你希望它灵活一点,那就调高一点吧。

炼丹这玩意得一点一点调,别上来就猴急,prompt、top-k、top-k 等等参数一起搞,这样即使搞成了下次还是不知道具体哪个参数起了作用。丹练完了也多看看,收尾的工作还是得你来,包括注入人味儿、校稿等等。

总的来说,搭 AI Agents 的 ROI 非常高,尤其是在常规类的内容生产上。我之前写文章的工作流是收集材料、构思、写稿、配图、润色、写摘要、多平台分发:

张小吉童鞋未采用 AI Agents 前写文章的流程示意图
张小吉童鞋未采用 AI Agents 前写文章的流程示意图

张小吉童鞋未采用 AI Agents 前写文章的流程示意图

有了 AI Agents 的接入后,简化成了先内容规划的类型和场景、写目录/内容/摘要等 prompt、调参、注入人味润色文章、配图和多平台分发:

通过 n8n 快速搭建小红书图集内容的工作流
通过 n8n 快速搭建小红书图集内容的工作流

张小吉同学采用 AI Agents 之后写文章的流程示意图

看似只节省了一个步骤,但前面那些最费时的工作,全让 AI 干了,也明显减少了一些写稿纠结的时间。并且我还发现拿 AI 写文章的场景,必然是设计内容的规模化和结构化,不然边际成本太高了。所以也慢慢养成了先设计框架,再来写东西的习惯,对于培养自己自顶向下,成体系化的思考非常有益。

另外,不管用的是自己的 token,还是公司采购的,都省着点花,调试的时候优先采用免费的 API ,比如 Google 的 Genemi、等到调的差不多了,切到正式环境的时候,再调优考虑最终选哪个模型。
多花点耐心,总能雕出🌸的,共勉 🙌

© 2023

Build my mindset system