大模型靠“深呼吸”数学成绩再涨8分！AI自己设计提示词效果胜人类

2024-10-25 阅读 92 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

模型不同，最佳提示词也不同

优化问题无处不在，基于导数和梯度的算法是强大的工具，但现实应用中也经常遇到梯度不适用的情况。

为解决这个问题，团队开发了新方法OPRO，也就是通过提示词优化（Optimization by PROmpting）。

不是形式化定义优化问题然后用程序求解，而是用自然语言描述优化问题，并要求大模型生成新的解决方案。

一图流总结，就是对大模型的一种递归调用。

大模型靠“深呼吸”数学成绩再涨8分！AI自己设计提示词效果胜人类

每一步优化中，以之前生成的解决方案和评分作为输入，大模型生成新的方案并评分，再将其添加到提示词中，供下一步优化使用。

大模型靠“深呼吸”数学成绩再涨8分！AI自己设计提示词效果胜人类

论文主要使用谷歌的PaLM 2和Bard中的text-bison版本作为评测模型。

再加上GPT-3.5和GPT-4，共4种模型作为优化器。

结果表明，不光不同模型设计出的提示词风格不同，适用的提示词风格也不同。

此前在GPT系列上的AI设计出的最优提示词是“Let’s work this out in a step by step way to be sure we have the right answer.”

这个提示词使用APE方法设计，论文发表在ICLR 2023上，在GPT-3（text-davinci-002）上超过人类设计的版本“Let’s think step by step”。

大模型靠“深呼吸”数学成绩再涨8分！AI自己设计提示词效果胜人类

但这次在谷歌系PaLM 2和Bard上，APE版本作为基线就还不如人类版本。

大模型靠“深呼吸”数学成绩再涨8分！AI自己设计提示词效果胜人类

OPRO方法设计出来的新提示词中，“深呼吸”和“拆解这个问题”对PaLM来说效果最好。

对text-bison版的Bard大模型来说，则更倾向于详细的提示词。

大模型靠“深呼吸”数学成绩再涨8分！AI自己设计提示词效果胜人类

另外论文还展示了大模型在数学优化器上的潜力。

线性回归作为连续优化问题的示例。

大模型靠“深呼吸”数学成绩再涨8分！AI自己设计提示词效果胜人类

旅行商问题作为离散优化问题的示例。

大模型靠“深呼吸”数学成绩再涨8分！AI自己设计提示词效果胜人类

仅仅通过提示，大模型就能找到不错的解决方案，有时甚至匹敌或超过手动设计的启发式算法。

但团队也认为大模型还无法替代传统基于梯度的优化算法，当问题规模较大（如节点数量较多的旅行商问题）时，OPRO方法表现就不好。

对于未来改进方向，团队提出当前大模型还无法有效利错误案例，仅提供错误案例无法让大模型捕捉捕捉到错误的原因。

一个有前景的方向是结合关于错误案例的更丰富的反馈，并总结优化轨迹中高质量和低质量生成提示的关键特征差异。

这些信息可能帮助优化器模型更高效地改进过去生成的提示，并可能进一步减少提示优化所需的样本数量。

论文放出大量最优提示词

论文来自谷歌与DeepMind合并后的部门，但作者以原谷歌大脑团队为主，包括Quoc Le、周登勇。

共同一作为康奈尔大学博士毕业的复旦校友Chengrun Yang，和UC伯克利博士毕业的上交大校友陈昕昀。

团队还在论文中给出了大量实验中得到的最优提示词，包括电影推荐、恶搞电影名字等实用场景。

大模型靠“深呼吸”数学成绩再涨8分！AI自己设计提示词效果胜人类

该文章中提到的完整中英文原版报告，请添加官方客服微信openai，免费领取

参考链接：[1]https://x.com/emollick/status/1700207590607552740

文章转载自微信公众号”量子为“

日本艺术生被AI逼上绝路

关联网址

关联标签

#AI #大模型

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3732 用户在看

AI写作网站自动的生成文章可以用吗？

298 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

263 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

235 用户在看

大模型靠“深呼吸”数学成绩再涨8分！AI自己设计提示词效果胜人类

模型不同，最佳提示词也不同

日本艺术生被AI逼上绝路

英伟达参投，MIT华人女科学家研发AI模型融资2亿美元！

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3732 用户在看

AI写作网站自动的生成文章可以用吗？

298 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

263 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

235 用户在看

大模型靠“深呼吸”数学成绩再涨8分！AI自己设计提示词效果胜人类

模型不同，最佳提示词也不同

日本艺术生被AI逼上绝路

英伟达参投，MIT华人女科学家研发AI模型融资2亿美元！

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿