Trump当选概率有多大？UC伯克利CAIS联手打造「AI预言家」，吊打人类分析师

2024-09-11 阅读 25 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

AI预言家优于市场预测

为了测试AI预言家的表现，作者们借助Metaculus平台的问题对其进行了评估。

为了比较的公正性，AI预言家与人工预言家使用相同的信息。

值得注意的是，GPT-4o的数据仅囊括2023年10月之前的，因此研究者将新闻和文章都限定在该日期前，要求539和人类分别计算Metaculus中177个事件发生的概率。

针对这177个事件，Metaculus自身模型的预测准确率为87.0%，而FiveThirtyNine将其提升至87.7%±1.4。

相对于市场预测，AI预言家具有多种其无法比拟的优势。如，它能在几秒内快速生成预测，速度比当前市场预测高了几个数量级。

不仅速度更快，还不需要额外的奖励机制去优化预测，在精度相当的情况下，显然AI预言家更具性价比。

局限性

虽然作者放话表示，AI预言家已经优于人类预测员，但这个机器人依旧存在不少工程和性能上的局限性。

比如，539依旧会对无效查询做出回应，因为作者还没给它加上拒绝功能。

实时更新知识库这方面，也有显著的缺陷，毕竟它还没能接上推特的API。

5G冲浪的网友可以马上知道推特上的热门事件，但如果涉及到预训练所用的知识库盲区，539就一无所知。

比如，刚刚完成预训练的539还不知道Joe Biden已经退选，如果不重新过一遍知识库，依旧会傻傻地预测Biden当选的概率。

Trump当选概率有多大？UC伯克利CAIS联手打造「AI预言家」，吊打人类分析师

尤其是对于那些迫在眉睫、即将见分晓的事件，这种迟钝的反应是完全比不上人类的。

更重要的是，当前的「AI预言家」没有经过微调，还未达到最优精度，仅仅是依据工程化的Prompt检索并撰写总结报告。

Trump当选概率有多大？UC伯克利CAIS联手打造「AI预言家」，吊打人类分析师

可通过单击forecast.safe.ai中的齿轮图标找到它的prompt

此外，「自动化偏见」（automation bias）也是一个重要的问题，推特评论区也有网友问到。

Trump当选概率有多大？UC伯克利CAIS联手打造「AI预言家」，吊打人类分析师

「自动化偏见」是社会心理学领域的发现，即人类倾向于过度依赖自动化系统的建议，而忽略而忽略非自动化方式产生的矛盾信息，即使这些信息是正确的。

作者表示，这个问题或许可以通过优化界面来改进或避免。

尽管机器人在广度、速度和准确性方面通常表现优异，但在某些特定方面，它依旧比不上人类。

比如在非常依赖专业知识的金融领域，539对市场的预测能力还没有被验证。

它的预测还可能忽视尾部风险，造成「自证预言」。如果改进这一缺陷，AI预言家的预测精度可能会得到极大的提升。

研究者称，最初将其称为超人，并不是指它在各个方面都无懈可击，只是想表达AI预言家的预测能力并不比人类逊色。

就像何恺明大神也会宣称PReLU网络在ImageNet上有「超人性能」一样，虽然也会犯人类不可能犯的错误，但不耽误AI在某些方面匹配甚至超越人类表现。

Trump当选概率有多大？UC伯克利CAIS联手打造「AI预言家」，吊打人类分析师

「AI预言家」能干什么

如果说，以维基百科为代表的认知技术，推动了人类参与知情讨论、维持现实共识，以及构建共同的世界观，那么未来AI的用途，可能会走得更远。

作为中立的智能第三方，「AI预言家」或许可以改进决策和公共话语，有助于缓和极端、立场两极分化的事件。

完善聊天机器人功能

将AI预测功能集成到AI聊天机器人或个人AI助手中，可以辅助决策、规避风险。

例如，可以为政策制定者们提供值得信赖、公正的概率评估，还可以帮助量化专家规避风险。

Trump当选概率有多大？UC伯克利CAIS联手打造「AI预言家」，吊打人类分析师

补充新闻报道

AI预言家还可用来补充新闻报道，比如帮助预测加州AI安全法案SB 1047成功签署的可能性。

Trump当选概率有多大？UC伯克利CAIS联手打造「AI预言家」，吊打人类分析师

美国著名天文学家Carl Sagan曾说过，「如果单纯积累力量而不增长智慧，人类必定会走向自我毁灭的道路」。

不可否认，未来AI技术将不断变强，而其所具备的预测能力也有望为我们提供预警式和启发式的建议。

网友评论

「AI预言家」这个项目可以说是看点十足，很能吸引眼球，但推特上的网友大多持负面评论。

有人认为这只是给GPT-4o套了个壳、做了点提示工程，本质上是一个「新闻阅读器」的应用。

Trump当选概率有多大？UC伯克利CAIS联手打造「AI预言家」，吊打人类分析师

还有人指责作者「路走歪了」，除了炒作，这类项目完全看不到价值或实际功用。

Trump当选概率有多大？UC伯克利CAIS联手打造「AI预言家」，吊打人类分析师

此外，也有技术方面的质疑。

因为作者提到，在评估时允许机器人接入互联网，在有日期截断的前提下，防止它得知事件结果。

但「日期截断」这个功能完全不可靠，反例一抓一大把，因此评估结果也是靠不住的。

Trump当选概率有多大？UC伯克利CAIS联手打造「AI预言家」，吊打人类分析师

其中的技术含量究竟有多少？所谓「超越人类表现」的评估结果到底能告诉我们什么？

看来只有等技术报告发布后才能得知了。

文章来源于“新智元”，作者“新智元”

让不足百元的AI数字人替人打工，风平智能获近亿元A轮系列融资

关联网址

关联标签

#AI #AI技术

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3633 用户在看

AI写作网站自动的生成文章可以用吗？

218 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

161 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

132 用户在看

Trump当选概率有多大？UC伯克利CAIS联手打造「AI预言家」，吊打人类分析师

AI预言家优于市场预测

为了测试AI预言家的表现，作者们借助Metaculus平台的问题对其进行了评估。

局限性

完善聊天机器人功能

补充新闻报道

网友评论

让不足百元的AI数字人替人打工，风平智能获近亿元A轮系列融资

深度丨字节AI硬件团队爆出！智能耳机将集成豆包，团队由收购的Oladance和36氪创始人的硬件公司组成

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3633 用户在看

AI写作网站自动的生成文章可以用吗？

218 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

161 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

132 用户在看

Trump当选概率有多大？UC伯克利CAIS联手打造「AI预言家」，吊打人类分析师

AI预言家优于市场预测

为了测试AI预言家的表现，作者们借助Metaculus平台的问题对其进行了评估。

局限性

完善聊天机器人功能

补充新闻报道

网友评论

让不足百元的AI数字人替人打工，风平智能获近亿元A轮系列融资

深度丨字节AI硬件团队爆出！智能耳机将集成豆包，团队由收购的Oladance和36氪创始人的硬件公司组成

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿