曝Bengio新动向：世界模型+数学证明，确保AI系统正常运作

2024-08-08 阅读 29 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

“受保护的AI”

Safeguarded AI项目被划分为三个技术领域，每个领域都有特定的目标和预算：

支架（Scaffolding），构建一个可扩展、可互操作的语言和平台，用于维护现实世界模型/规范并检查证明文件。
机器学习（Machine Learning），使用前沿AI帮助领域专家构建一流的复杂现实世界动力学的数学模型，并利用前沿AI训练自主系统。
应用（Applications），在关键的网络-物理操作环境中部署一个由“把关AI”保护的自主AI系统，通过量化的安全保障释放重要的经济价值。

曝Bengio新动向：世界模型+数学证明，确保AI系统正常运作

官方表示，Bengio加入后将特别关注TA3和TA2，在整个计划中提供科学战略建议。

ARIA还计划投入1800万英镑（约合RMB1.64亿）成立一个非营利组织，领导TA2的研发工作。

Safeguarded AI项目总监是前Twitter高级软件工程师David “davidad” Dalrymple，去年9月份加入ARIA。

对于Bengio的到来，Dalrymple还在X（原推特）上传了俩人的合照：

曝Bengio新动向：世界模型+数学证明，确保AI系统正常运作

关于“构建一个负责理解和降低其它AI Agent风险的AI系统”的具体方法，David “davidad” Dalrymple、Yoshua Bengio等人写了份文件。

曝Bengio新动向：世界模型+数学证明，确保AI系统正常运作

其中提出了一套称为“Guaranteed Safe AI（保证安全的AI）”的模式，主要是通过三个核心相互作用量化AI系统的安全保障：

世界模型，提供数学描述，阐述AI系统如何影响外部世界，并妥善处理贝叶斯和奈特不确定性
安全规范，定义哪些效果是可接受的数学描述
验证器，提供证明AI符合安全规范的可审计证书

曝Bengio新动向：世界模型+数学证明，确保AI系统正常运作

他们还为创建世界模型的策略，划分了L0-L5安全等级：

Level 0：没有明确的世界模型。关于世界的假设隐含在AI系统的训练数据和实现细节中。
Level 1：使用经过训练的黑盒世界模拟器作为世界模型。
Level 2：使用机器学习生成的概率因果模型的生成模型，可以通过检查它是否为特定的人类制作的模型（例如科学文献中提出的模型）分配足够的可信度来进行测试。
Level 3：使用（一个或多个）概率因果模型（或它们的分布），可能在机器学习的帮助下生成，这些模型经过人类领域专家的全面审核。
Level 4：使用关于真实世界现象的世界模型，这些模型被正式验证为基本物理定律的合理抽象。
Level 5：不依赖具体的世界模型，而是使用覆盖所有可能世界的全局性安全规范。

曝Bengio新动向：世界模型+数学证明，确保AI系统正常运作

“AI风险”备受学术圈关注

“AI风险”一直是行业大佬们关注的焦点话题之一。

Hinton离职谷歌，就是为了自由地讨论AI风险问题。

之前，更是有吴恩达、Hinton、LeCun、哈萨比斯等AI巨佬们线上“对喷”的大型场面。

吴恩达曾表示：

对AI的最大担忧其实是，AI风险被过度鼓吹，导致开源和创新被严苛规定所压制。

某些人传播（AI灭绝人类的）恐惧，只是为了搞钱。

曝Bengio新动向：世界模型+数学证明，确保AI系统正常运作

DeepMind CEO哈萨比斯则认为：

这不是恐吓。AGI的风险如果不从现在就开始讨论，后果可能会很严重。

我不认为我们会想在危险爆发之前才开始做防范。

曝Bengio新动向：世界模型+数学证明，确保AI系统正常运作

Bengio之前还和Hinton、姚期智、张亚勤等人工智能大拿，发表了一封公开信《在快速进步的时代管理人工智能风险（Managing AI RIsks in an Era of Rapid Progress）》。

曝Bengio新动向：世界模型+数学证明，确保AI系统正常运作

其中就指出人类必须认真对待AGI在这10年或下一个10年内在许多关键领域超越人类能力的可能。建议监管机构应该对AI发展全面洞察，尤其警惕那些在价值数十亿美元的超级计算机上训练出来的大模型。

就在一个月前，Bengio还以“Reasoning through arguments against taking AI safety seriously（回应反对认真对待AI安全的观点）”为题写了一篇文章，其中分享了他的最新想法，感兴趣的家人可以康康～

文章来源于“量子位”，作者“西风”

奥特曼晒“草莓”引热议，神秘新模型现身竞技场，网友第一波实测来了

关联网址

关联标签

#AI #大模型

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3666 用户在看

AI写作网站自动的生成文章可以用吗？

261 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

185 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

159 用户在看

曝Bengio新动向：世界模型+数学证明，确保AI系统正常运作

“受保护的AI”

“AI风险”备受学术圈关注

文章来源于“量子位”，作者“西风”

奥特曼晒“草莓”引热议，神秘新模型现身竞技场，网友第一波实测来了

一手实测字节版Sora，人人免费试用，iOS安卓都能玩

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3666 用户在看

AI写作网站自动的生成文章可以用吗？

261 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

185 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

159 用户在看

曝Bengio新动向：世界模型+数学证明，确保AI系统正常运作

“受保护的AI”

“AI风险”备受学术圈关注

文章来源于“量子位”，作者“西风”

奥特曼晒“草莓”引热议，神秘新模型现身竞技场，网友第一波实测来了

一手实测字节版Sora，人人免费试用，iOS安卓都能玩

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿