AI又一突破，用AI理解AI，MIT推出多模态自动可解释智能体MAIA

2024-08-03 阅读 31 收藏 0 评论 0 限时评论得现金

粉丝 0 文章 6432 收藏 0

01 真实效果怎么样？

现有的自动化可解释性方法仅仅是一次性地对数据进行标记或可视化，而 MAIA 则能够生成假设，设计实验来测试它们，并通过迭代分析来改进其理解。通过将预训练的视觉-语言模型（VLM）与可解释性工具库相结合，该多模态方法可以通过编写和运行针对特定模型的定向实验来响应用户查询，不断改进其方法，直到能够提供全面的答案。

MAIA 框架的核心是一个由预训练的多模态模型（如 GPT-4V）驱动的智能体，该智能体能够自动执行实验以解释其他系统的行为。它通过将可解释性子例程组合成 Python 程序来实现这一点。

AI又一突破，用AI理解AI，MIT推出多模态自动可解释智能体MAIA

图 | MAIA 架构

研究团队在神经元描述范式上评估 MAIA，研究显示，MAIA 在真实模型和合成神经元数据集上均取得了优异的描述效果，预测能力优于基线方法，并与人类专家相当。

AI又一突破，用AI理解AI，MIT推出多模态自动可解释智能体MAIA

图 | 评估 MAIA 描述

此外，MAIA 在移除虚假特征和揭示偏见方面都表现出良好的应用潜力，可以帮助人类用户更好地理解模型行为，并改进模型的性能和公平性。

02 用 MAIA 移除虚假特征

虚假特征会影响模型在真实世界场景中的鲁棒性。MAIA 可以识别并移除模型中的虚假特征，从而提高模型的鲁棒性。研究团队使用 ResNet-18 在 Spawrious 数据集上进行训练，该数据集中包含四种不同背景的狗品种。

在数据集中，每个狗品种与特定背景（例如雪，丛林，沙漠，海滩）虚假相关，而在测试集中，品种-背景配对是混乱的。研究团队使用 MAIA 来找到一个最终层神经元的子集，该神经元可以独立于虚假特征鲁棒地预测单个狗的品种，只需改变用户提示中的查询。

结果显示，MAIA 可以有效地移除模型中的虚假特征，从而提高模型的鲁棒性。

视频 | MAIA 对狗的品种和背景之间的虚假相关性进行选择。

视频 | MAIA 对单一的狗品种有选择性，独立于它的背景。

03 用 MAIA 揭示偏见

模型可能存在偏见，导致其在某些情况下表现不佳。而 MAIA 可以自动揭示模型中的偏见。研究团队使用 ResNet-152 在 ImageNet 上进行训练，并使用 MAIA 检查模型输出中的偏见。

在实验过程中，MAIA 被提示生成与特定类别相关的图像，并观察模型对这些图像的响应。之后，MAIA 发现了一些模型对特定子类或与特定类别相关的图像有偏好。

这表明 MAIA 可以帮助识别模型中的偏见，从而改进模型。

AI又一突破，用AI理解AI，MIT推出多模态自动可解释智能体MAIA

图｜MAIA 模型偏见检测

04 不足与展望

虽然 MAIA 在自动可解释性方面展现出巨大潜力，但仍存在一些局限性。

首先，MAIA 的解释能力受限于其使用的工具，如 Stable Diffusion 和 GPT-4。这些工具的局限性（例如图像生成质量、成本、访问限制）会直接影响 MAIA 的性能。未来可以考虑开发更强大的内部工具，或寻找开源替代方案，以提高系统的可靠性和可访问性。

其次，MAIA 的解释并非形式化验证，而是基于实验结果和自然语言描述。这可能导致解释存在偏差或误导。未来可以考虑将形式化验证方法（例如因果推理、理论分析）融入 MAIA，以提高解释的准确性和可靠性。

此外，MAIA 无法完全避免常见错误，例如确认偏差、过度解释、小样本结论等。未来可以考虑引入自我反思机制，使 MAIA 能够识别和纠正自身错误，并提高解释的鲁棒性。

展望未来，这篇论文的共同作者 Rott Shaham 表示：“我认为我们实验室的下一步自然是要超越人工系统，将这些类似的实验应用于人类感知。传统上，这需要手动设计和测试刺激，这是一个劳动密集型的过程。有了我们的智能体，我们可以扩大这个过程，同时设计和测试大量的刺激。”

本文来自微信公众号“学术头条”（ID：SciTouTiao），作者：学术头条

AI又一突破，用AI理解AI，MIT推出多模态自动可解释智能体MAIA

高端鼠标歇菜了，要用AI闯出一片天？

关联网址

关联标签

#AI

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3661 用户在看

AI写作网站自动的生成文章可以用吗？

261 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

184 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

155 用户在看

AI又一突破，用AI理解AI，MIT推出多模态自动可解释智能体MAIA

01 真实效果怎么样？

02 用 MAIA 移除虚假特征

03 用 MAIA 揭示偏见

04 不足与展望

高端鼠标歇菜了，要用AI闯出一片天？

AI进内娱，群众不答应？

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3661 用户在看

AI写作网站自动的生成文章可以用吗？

261 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

184 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

155 用户在看

AI又一突破，用AI理解AI，MIT推出多模态自动可解释智能体MAIA

01 真实效果怎么样？

02 用 MAIA 移除虚假特征

03 用 MAIA 揭示偏见

04 不足与展望

高端鼠标歇菜了，要用AI闯出一片天？

AI进内娱，群众不答应？

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿