智能体的ChatGPT时刻！DeepMind通用AI向人类玩家进化，开始理解游戏

2024-03-14 阅读 42 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

AI 已经不甘心只作 NPC 了

谷歌与八家游戏工作室合作，在九款不同的视频游戏中对 SIMA 进行了训练和测试，包括《无人天空》、《拆迁（Teardown）》、《英灵神殿》和《模拟山羊 3》。

智能体的ChatGPT时刻！DeepMind通用AI向人类玩家进化，开始理解游戏

SIMA 产品组合中的每款游戏都是全新的互动世界，包括一系列需要学习的技能，从简单的导航和菜单使用，到开采资源、驾驶飞船或制作头盔。

智能体的ChatGPT时刻！DeepMind通用AI向人类玩家进化，开始理解游戏

同时，谷歌还使用了四个研究环境 — 包括使用 Unity 构建的一个名为「建筑实验室」的新环境。在这个实验室中，智能体需要用积木搭建雕塑，以测试对物体的操作能力以及对物理世界的直观理解。

然后，谷歌在游戏组合中记录成对的人类玩家，其中一名玩家观察并指导另一名玩家，以捕获语言指令。随后让玩家自由玩游戏，重新观察他们的行为，并记录下可能导致其游戏行为的指令。

所有这些都被提供给 SIMA ，以学习预测屏幕上接下来会发生什么。通过在不同的游戏世界学习，SIMA 捕捉到了语言与游戏行为之间的联系。

「这项研究标志着首次有 AI 智能体证明自己能够理解各种游戏世界，并能像人类一样按照自然语言指令在游戏世界中执行任务。」谷歌表示。

SIMA 并不只是一个由 AI 驱动的 NPC ，而是游戏中影响结果的另一个「玩家」。

谷歌还指出，SIMA 的研究并不是为了获得高分。对于 AI 系统来说，学会玩一款视频游戏固然是技术层面的重大突破，但学会在各种游戏环境中遵从指令，可以让 AI 智能体在任何环境中发挥更大的作用。

在技术报告中，谷歌也展示了如何通过语言界面将高级 AI 模型的能力转化为现实世界中有用的行动。

智能体的ChatGPT时刻！DeepMind通用AI向人类玩家进化，开始理解游戏

技术报告：

https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/sima-generalist-ai-agent-for-3d-virtual-environments/Scaling%20Instructable%20Agents%20Across%20Many%20Simulated%20Worlds.pdf

SIMA：通用 AI 智能体来了

SIMA 的组件包括预训练好的视觉模型，以及一个包含内存并输出键盘和鼠标操作的主模型，如下图所示。

具体来讲，SIMA 包含了一个专为精确图像语言映射而设计的模型和一个预测屏幕上接下来会发生什么的视频模型。谷歌根据 SIMA 产品组合中特定于 3D 设置的训练数据对这两个模型进行了微调。

智能体的ChatGPT时刻！DeepMind通用AI向人类玩家进化，开始理解游戏

下图为 SIMA 智能体架构细节。

智能体的ChatGPT时刻！DeepMind通用AI向人类玩家进化，开始理解游戏

作为一种 AI 智能体，谷歌的 SIMA 可以感知和理解各种环境，然后采取行动来实现指定的目标。

重要的是，SIMA 既不需要访问游戏的源代码，也不需要定制的 API。它只需要两个输入：屏幕上的图像以及用户提供的简单自然语言指令。SIMA 使用键盘和鼠标输出来控制游戏中的核心角色来执行这些指令。人类可以使用这个简单的界面，这意味着 SIMA 可以与任何虚拟环境进行交互。

下图为 SIMA 数据中的指令。

智能体的ChatGPT时刻！DeepMind通用AI向人类玩家进化，开始理解游戏

当前版本的 SIMA 通过 600 项基础技能进行评估，涵盖导航（例如「左转」）、对象交互（「爬梯子」）和菜单使用（「打开地图」）。

智能体的ChatGPT时刻！DeepMind通用AI向人类玩家进化，开始理解游戏

谷歌训练 SIMA 执行简单任务，大约 10 秒内就能完成。

智能体的ChatGPT时刻！DeepMind通用AI向人类玩家进化，开始理解游戏

SIMA 智能体的轨迹如下图所示。

智能体的ChatGPT时刻！DeepMind通用AI向人类玩家进化，开始理解游戏

谷歌希望未来的智能体能够处理需要高级战略规划和多个子任务才能完成的任务，例如「寻找资源和建立营地」。这是人工智能的一个重要目标，虽然大型语言模型已经演化出了能够捕获世界知识并生成规划的强大系统，但它们目前缺乏代表人类采取行动的能力。

跨游戏的强泛化能力

谷歌证明，受过多种游戏训练的智能体比仅学习如何玩一种游戏的智能体表现更好。

在谷歌的评估中，SIMA 智能体在一组九个 3D 游戏上进行了训练，其表现显著优于仅在每个单独的游戏上进行训练的所有专业智能体。

更重要的是，平均而言，接受过除一款游戏之外的所有游戏训练的智能体在这个未见过游戏上的表现几乎与专门训练过的智能体一样好。因此，这种在全新环境中发挥作用的能力凸显了 SIMA 超越其训练的泛化能力。

谷歌表示，这是一个很有潜力的初步结果，不过 SIMA 需要进行更多的研究才能在见过和未见过游戏中达到人类水平。

此外，SIMA 的性能依赖于语言。在控制测试中，智能体没有接受任何语言训练或指令，它的行为方式虽适当但漫无目的。例如，智能体可能会收集资源（这是一种常见行为），而不是按照指令去走。

谷歌评估了 SIMA 按照指令完成近 1500 个具体游戏内（in-game）任务的能力，其中部分使用了人类裁判。作为基线比较，谷歌使用环境专用 SIMA 智能体的性能（经过训练和评估以遵循单个环境中的指令）作为评估指标。

如下图所示，谷歌与三种类型的通用 SIMA 智能体进行了比较，每种智能体都经过多个环境的训练。

智能体的ChatGPT时刻！DeepMind通用AI向人类玩家进化，开始理解游戏

未来，谷歌期待在更多训练环境中进一步构建 SIMA，并纳入更强大的模型，从而提高 SIMA 对高级语言指令的理解能力以实现更复杂的目标。当然，随着 SIMA「暴露」在更多的训练世界中，谷歌希望它变得更加通用。

参考链接：

https://deepmind.google/discover/blog/sima-generalist-ai-agent-for-3d-virtual-environments/

https://www.technologyreview.com/2024/03/13/1089764/an-ai-that-can-play-goat-simulator-is-a-step-towards-more-useful-ai/

https://www.fastcompany.com/91058360/deepmind-new-ai-agent-video-games

文章来自于微信公众号 “机器之心”

标普云发布财税大模型&BPai财税智能体，AI让财税更轻松

关联网址

关联标签

#AI

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3735 用户在看

AI写作网站自动的生成文章可以用吗？

300 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

265 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

238 用户在看

智能体的ChatGPT时刻！DeepMind通用AI向人类玩家进化，开始理解游戏

AI 已经不甘心只作 NPC 了

SIMA：通用 AI 智能体来了

跨游戏的强泛化能力

标普云发布财税大模型&BPai财税智能体，AI让财税更轻松

4万亿个晶体管，单机可训练比GPT4大10倍的模型，最快最大的芯片面世

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3735 用户在看

AI写作网站自动的生成文章可以用吗？

300 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

265 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

238 用户在看

智能体的ChatGPT时刻！DeepMind通用AI向人类玩家进化，开始理解游戏

AI 已经不甘心只作 NPC 了

SIMA：通用 AI 智能体来了

跨游戏的强泛化能力

标普云发布财税大模型&BPai财税智能体，AI让财税更轻松

4万亿个晶体管，单机可训练比GPT4大10倍的模型，最快最大的芯片面世

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿