弗吉尼亚理工大学和微软的研究人员两周前发现了一种新方法AoT,可以对抗思想树ToT,将所需的查询显著减少100倍。是的,您没有看错——这将显著提速增效。
01 为什么选择 AoT
大型语言模型 (LLM) 非常强大,但它们并不完美。Prompt Engineering之所以存在,是因为能持续获得高质量的输出,这也是现阶段生成式AI的强需求。
许多性能最佳且广泛采用的方法计算量很大,很多LLM模型干脆不支持,不是这些LLM没有能力而是硬件消耗根本不划算。例如,思想树(ToT)方法就需要多轮查询,它遍历数个分支和节点,吃掉很多资源,很多朋友可能已经体验过复杂一些的ToT编写的Prompt在LLM上的表现了。
AoT 可能已经解决了这个棘手的问题,为LLM提供了结构化的推理路径。这应该是一种在不影响输出质量的情况下提高效率的解决方案。
02 AoT 的工作原理
AoT 在模仿算法思维。喜欢写结构化Prompt的朋友用AoT大有可为,下面几个步骤可作为Step或者workflow直接抄走即用:
- 定义问题:AoT 首先明确说明问题。
- 收集信息:AoT 会提示LLM获取必要信息。
- 分析信息:LLM会分析收集的信息。
- 提出假设:提出一个初始解决方案。
- 测试假设:LLM反驳假设,设想潜在结果。
- 得出结论:LLM提供完善的解决方案。
AoT 算法确保LLM不会在多轮对话中散焦或漫无目的地徘徊。
03实验: 24得数游戏
实验:
研究人员从4nums.com上提取了 24 得数游戏的 100 轮比赛数据。游戏很简单,它必须使用四个给定的数字,仅使用基本的算术运算即可得出最终答案 24。标准提示和思维链 (CoT) 在 5 次框架下进行评估,思想树 (ToT) 的实施宽度为 5(b=5)。对于 AoT,使用与标准提示相同的 5-shot 框架。这些方法被采样了 100 次,并记录了平均成功率。GPT-4是唯一使用的模型,温度设置为0。
AoT 的完整Prompt如下:(这是24得数实验游戏中使用的AoT提示词的完整版本。)
使用数字和基本算术运算 (+ - * /) 来获得 24。在考虑后续步骤时,不要选择会产生负数或小数的运算。为了帮助计算,括号中的数字表示运算后剩下的数字,并且按降序排列。
我们做的另一件事是,当括号中只剩下两个数字时,我们检查是否只能通过基本算术运算(+ - * /)得出 24。
关于这个想法的一些例子:
• (21 2) 否,因为 21 + 2 = 23、21 - 2 = 19、21 * 2 = 42、21 / 2 = 10.5,其中没有一个等于 24。
• (30 6) 30 - 6 = 24 是
• (8 3) 8 * 3 = 24 是
• (12 8) 没有
• (48 2) 48 / 2 = 24 是
最重要的是,不要放弃,所有给出的数字确实都有解。
04 AoT超越算法的能力
研究人员进行了测试,看看 AoT 是否能够超越其设计的算法(深度优先搜索,DFS)。如果可以的话,这将表明LLM不仅有潜力复制,而且有超越算法效率的潜力。结果是,AoT 表现相当不错。
该图显示,与 DFS 相比,AoT 系统地访问更少的节点。这意味着 AoT 能够以更少的步骤(更少的节点访问)获得正确的最终答案。AoT能够集成深度优先算法的统一策略,同时还集成智能递归推理来限制所需的步骤。
05 AoT提示词-两条Prompt模板
这也许是您需要的:
第一条:创意写作
写一篇连贯的四段短文。每段的最后一句必须是:{0}
首先,为一篇连贯的文章制定五个不同的计划,然后写作。您的输出应采用以下格式:
计划1:你的计划。
计划2:你的计划。
计划3:你的计划。
计划4:你的计划。
计划5:你的计划。
其次,给出一个指示和几个计划,决定哪个选择最合适最有前途。详细分析每个选择,然后在最后一行“最好的”中总结。选项是{{s}}”,其中s是选项的整数id。
第三,根据所选的计划以最连贯的方式写文章。
添加“章节:”,然后在下面写文章。
章节:你在这里的章节。
最后,以最连贯的方式精炼文章,但你仍然要结束每一篇文章,像以前一样用给定的句子进行分段。
最后一段:
最后一段。
第二条:AoT通用模板
“[必要信息]。
——”
文章转载自公众号“AI修猫Prompt”,作者AI修猫Prompt
发评论,每天都得现金奖励!超多礼品等你来拿
登录 后,在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则