OpenAI：如GPT-5太危险，董事会有权阻止奥特曼发布

2023-12-20 阅读 33 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

三个安全团队，分管当下和未来

对于不同时间尺度的AI风险，OpenAI成立了三个团队来分别应对。

OpenAI：如GPT-5太危险，董事会有权阻止奥特曼发布

安全系统团队（Safety Systems）负责当下，减少现有模型如ChatGPT的滥用，由翁丽莲领导。

OpenAI：如GPT-5太危险，董事会有权阻止奥特曼发布

新成立准备团队（Preparedness）负责不久的将来，识别和管理GPT-5等正在开发的前沿模型带来的新风险，由MIT教授Aleksander Madry领导。

OpenAI：如GPT-5太危险，董事会有权阻止奥特曼发布

超级对齐团队（Superalignment）负责遥远的未来，给超越人类的超级智能安全性奠定基础，由Ilya Sutskever和Jan Leike领导。

OpenAI：如GPT-5太危险，董事会有权阻止奥特曼发布

四种安全风险，最高灾难级

对于开发中的前沿模型，OpenAI主要跟踪4个类别的安全风险：

网络安全
CBRN（化学、生物、放射性、核威胁）
说服能力
模型自主性

评估期间将增加2倍的有效计算量把模型推向极限，并制作“记分卡”，分为“低、中、高、重大危险”四个等级。

网络安全风险，定义为利用模型破坏计算机系统的机密性、完整性、可用性。

OpenAI：如GPT-5太危险，董事会有权阻止奥特曼发布

CBRN风险，专注于与模型辅助创建化学、生物、放射性和/或核威胁相关的风险。

OpenAI：如GPT-5太危险，董事会有权阻止奥特曼发布

说服风险，侧重于与说服人们改变他们的信念或采取行动有关的风险。

通常强大的说服力很少见，需要大量人力（例如一对一对话，或者精心制作的媒体内容）；然而，模型可以在能力范围内使所有内容几乎零成本生成。

OpenAI：如GPT-5太危险，董事会有权阻止奥特曼发布

模型自主性风险就是比较科幻的那种，AI改进自己、阻止自己被关机、逃出实验室了。

OpenAI：如GPT-5太危险，董事会有权阻止奥特曼发布

采取缓解措施后，四个方面得分取最高值作为一个模型的总评分。

只有缓解后风险评分为“中”或更低时才能部署
只有缓解后风险评分为“高”或更低时才能进一步开发
对缓解前为“高”或“重大风险”的模型采取额外安全措施

下图仅为示例模板，不代表当前模型的评分。

OpenAI：如GPT-5太危险，董事会有权阻止奥特曼发布

此外准备团队还将定期安全演习，对业务和公司自身文化进行压力测试，发现紧急问题并快速响应。

也将延续开发GPT-3.5和GPT-4时的传统，邀请第三方组成红队，对模型做独立评估。

最后，OpenIA还透露已开创一项新的研究，衡量风险如何随模型规模扩大而演变，提前预测风险，尝试解决“未知的未知”。

参考链接：

[1]https://openai.com/safety/preparedness

[2]https://twitter.com/OpenAI/status/1736809603311280489

文章来自于微信公众号“量子位”（ID: QbitAI)，作者 “梦晨”

AI把OpenAI内斗魔改成晋江文学，插图也能画，最新工具爆火，网友冲崩服务器

关联网址

关联标签

#AI

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3661 用户在看

AI写作网站自动的生成文章可以用吗？

261 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

184 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

155 用户在看

OpenAI：如GPT-5太危险，董事会有权阻止奥特曼发布

三个安全团队，分管当下和未来

四种安全风险，最高灾难级

文章来自于微信公众号“量子位”（ID: QbitAI)，作者 “梦晨”

AI把OpenAI内斗魔改成晋江文学，插图也能画，最新工具爆火，网友冲崩服务器

大模型只有免费了才能迎来应用大爆发｜昆仑万维方汉@MEET2024

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3661 用户在看

AI写作网站自动的生成文章可以用吗？

261 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

184 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

155 用户在看

OpenAI：如GPT-5太危险，董事会有权阻止奥特曼发布

三个安全团队，分管当下和未来

四种安全风险，最高灾难级

文章来自于微信公众号“量子位”（ID: QbitAI)，作者 “梦晨”

AI把OpenAI内斗魔改成晋江文学，插图也能画，最新工具爆火，网友冲崩服务器

大模型只有免费了才能迎来应用大爆发｜昆仑万维方汉@MEET2024

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿