首个全自动科学发现AI系统，Transformer作者创业公司Sakana AI推出AI Scientist

2024-08-18 阅读 49 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

关于AI Scientist

AI Scientist 有三个主要阶段：（1）创意生成，（2）实验迭代，（3）论文撰写。撰写完成后，研究人员会引入并验证 LLM 生成的评论，以评估所生成论文的质量。

首个全自动科学发现AI系统，Transformer作者创业公司Sakana AI推出AI Scientist

图示：端到端 LLM 驱动的科学发现过程 AI Scientist 的概念说明。（来源：论文）

研究人员为 AI Scientist 提供了一个起始代码模板，该模板可重现流行模型或基准的轻量级基线训练运行。例如，这可能是针对莎士比亚作品训练小型 transformer 的代码，这是自然语言处理中的经典概念验证训练运行，可在几分钟内完成。

然后，AI Scientist 就可以自由探索任何可能的研究方向。该模板还包括一个 LaTeX 文件夹，其中包含样式文件和节标题以及简单的绘图代码。一般来说，每次运行都是从与主题领域相关的代表性小规模实验开始的。

研究人员解释道：「专注于小规模实验并不是我们方法的根本限制，而只是出于计算效率的因素，以及我们这边设备的计算限制。」

为什么写论文很重要？

鉴于科学家的总体目标是实现科学发现的自动化，为什么研究人员要让 AI Scientist 像人类科学家一样写论文呢？例如，以前的人工智能系统（如 FunSearch 和 GNoME）曾经在受限领域产生了令人印象深刻的科学发现，但它们并不能撰写论文。

该团队认为，AI Scientist 撰写科学论文来传播其发现至关重要，原因如下：首先，撰写论文为人类提供了一种高度可解释的方法，使人类能够从所学知识中受益；其次，在现有的机器学习会议框架内审查书面论文使科学家能够标准化评估；第三，自现代科学诞生以来，科学论文一直是传播研究成果的主要媒介。

由于论文可以使用自然语言，并包含情节和代码，因此它可以灵活地描述任何类型的科学研究和发现。几乎任何其他可以想到的格式都被锁定在某种数据或科学类型中。在出现更优的替代方案（或可能由人工智能发明）之前，该团队相信训练 AI Scientist 撰写科学论文对于其融入更广泛的科学界至关重要。

首个全自动科学发现AI系统，Transformer作者创业公司Sakana AI推出AI Scientist

图示：由 AI Scientist 完全自主生成的《Adaptive Dual-Scale Denoising》论文预览。（来源：论文）

关于成本

这里的框架非常灵活，可以有效地开展机器学习各个子领域的研究，包括基于 transformer 的语言建模、神经网络学习动态和扩散建模。该系统的成本效益很高，每篇论文的成本约为 15 美元，可生成与会议类相关的论文，凸显了其使研究民主化（提高其可及性）和加速科学进步的能力。

例如，研究人员对 AI Scientist 的初步定性分析表明，生成的论文可以提供广泛的信息和新颖性，或者至少包含值得未来研究的想法。

按照当下的标准，该团队为 AI Scientist 进行实验分配的实际计算量也非常小。值得注意的是，研究人员在一周内生成数百篇论文的实验大部分仅使用单个 8×NVIDIA H100 节点运行。如果大规模扩大搜索和过滤范围，可能会产生质量更高的论文。

在这个项目中，运行 AI Scientist 的大部分成本与 LLM API 编码和论文写作的成本相关。相比之下，由于该团队为降低总体成本而施加的限制，运行 LLM 审阅器相关的成本以及进行实验的计算费用可以忽略不计。

当然，如果 AI Scientist 被应用到其他科学领域或用于更大规模的计算实验，这种成本分摊在未来可能会发生变化。

开放与封闭模型

为了定量评估和优化生成的论文，研究人员首先创建并验证了自动论文审阅器。结果表明，虽然还有很大的优化空间，但 LLM 能够产生相当准确的评论，并在各个指标上取得与人类相当的结果。

首个全自动科学发现AI系统，Transformer作者创业公司Sakana AI推出AI Scientist

图示：Violin 图显示了 AI Scientist 审阅者在三个领域和四个基础模型中为人工智能生成的论文的评分分布。（来源：论文）

将这个审阅器应用于 AI Scientist 生成的论文，使科学家能够将论文评估范围扩大到人工检查之外。研究人员发现 Sonnet 3.5 始终能生成最好的论文，其中一些论文的分数甚至超过了自动论文审阅器在标准机器学习会议上的接受门槛。

但是，该团队没有理由期望 AI Scientist 像 Sonnet 3.5 这样的单一模型能够保持领先地位。研究人员认为所有前沿 LLM（包括开放模型）都将继续优化改进。LLM 之间的竞争会使它们的商品化和能力都大幅增强。

首个全自动科学发现AI系统，Transformer作者创业公司Sakana AI推出AI Scientist

图示：使用 GPT-4o 对 ICLR 2022 OpenReview 数据上的 AI Scientist 的论文审查流程进行评估。（来源：论文）

在这个项目中，研究人员研究了各种专有的 LLM，包括 GPT-4o 和 Sonnet，但也探索了使用 DeepSeek 和 Llama-3 等开放模型。发现开放模型具有显著的优势，例如成本更低、可用性有保证、透明度更高、灵活性更高，尽管质量略差。

未来，研究人员的目标是利用所提出的发现过程，在使用开放模型的闭环系统中产生自我改进的人工智能。

未来方向

对 AI Scientist 的直接改进可能包括集成视觉功能以更好地处理图表和图形，结合人类反馈和交互来改进人工智能的输出，并使 AI Scientist 能够通过从互联网上提取新数据和模型来自动扩大其实验范围，前提是这样做是安全的。

此外，AI Scientist 可以跟进其最佳想法，甚至可以以自参考的方式直接对自己的代码进行研究。事实上，该项目的大部分代码都是由 Aider 编写的。将框架扩展到其他科学领域可以进一步扩大其影响力，为自动化科学发现的新时代铺平道路。

至关重要的是，未来的工作应该解决可靠性和幻觉问题，可能通过对报告的结果进行更深入的自动验证来实现。这可以通过直接链接代码和实验来实现，或者通过查看自动验证器是否可以独立重现结果来实现。

结语

AI Scientist 标志着机器学习科学发现新时代的开始：将 AI 智能体的变革性优势带入 AI 本身的整个研究过程，并让科学家更接近一个可以释放无限且经济实惠的创造力和创新，来解决世界上最具挑战性的问题的世界。

最终，「我们设想一个完全由人工智能驱动的科学生态系统，不仅包括人工智能驱动的研究人员，还包括审稿人、领域主席和整个会议。然而，我们并不认为人类科学家的作用会减弱。随着我们适应新技术并向食物链上游移动，科学家的作用将发生变化。」研究人员在论文里表示。

虽然 AI Scientist 的当前迭代展示了在成熟理念（如扩散建模或 Transformers）之上进行创新的强大能力，但此类系统最终是否能够提出真正颠覆范式的理念仍是一个悬而未决的问题。

未来版本的 AI Scientist 是否能够提出像扩散建模一样具有影响力的想法，或者提出下一个 Transformer 架构？机器最终是否能够发明像人工神经网络或信息理论一样基本的概念？

「我们相信 AI Scientist 将成为人类科学家的绝佳伙伴，但只有时间才能告诉我们。」

GitHub 开源地址：http://github.com/SakanaAI/AI-Scientist

论文链接：https://arxiv.org/abs/2408.06292

参考内容：

http://sakana.ai/ai-scientist/

https://x.com/SakanaAILabs/status/1823178623513239992

https://mp.weixin.qq.com/s/-jjXBJAkdMEyl2JhRgwdaA

文章来自于微信公众号机器之心作者ScienceAI

首个全自动科学发现AI系统，Transformer作者创业公司Sakana AI推出AI Scientist

AI成为「耗电大户」，除了新能源，还需要芯片创新

关联网址

关联标签

#AI

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3733 用户在看

AI写作网站自动的生成文章可以用吗？

300 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

265 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

238 用户在看

首个全自动科学发现AI系统，Transformer作者创业公司Sakana AI推出AI Scientist

关于AI Scientist

为什么写论文很重要？

关于成本

开放与封闭模型

未来方向

结语

AI成为「耗电大户」，除了新能源，还需要芯片创新

世界模型又近了？MIT惊人研究：LLM已模拟现实世界，绝非随机鹦鹉！

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3733 用户在看

AI写作网站自动的生成文章可以用吗？

300 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

265 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

238 用户在看

首个全自动科学发现AI系统，Transformer作者创业公司Sakana AI推出AI Scientist

关于AI Scientist

为什么写论文很重要？

关于成本

开放与封闭模型

未来方向

结语

AI成为「耗电大户」，除了新能源，还需要芯片创新

世界模型又近了？MIT惊人研究：LLM已模拟现实世界，绝非随机鹦鹉！

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿