GPT-4o一夜被赶超，Anthropic推出Claude 3.5，网友3分钟克隆马里奥游戏

2024-06-22 阅读 54 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

01.生成2倍速，多项能力赶超GPT-4o

Claude 3.5 Sonnet在其公布的GPQA、MMLU、HumanEval等所有测评中，都超越了OpenAI的GPT-4o，仅数学能力得分略低于GPT-4o。

GPT-4o一夜被赶超，Anthropic推出Claude 3.5，网友3分钟克隆马里奥游戏

在AI搜索引擎创企Perplexity的试用评估中，Claude 3.5也获得了优于GPT-4o的表现。Claude 3.5 Sonnet现已在付费AI搜索引擎Perplexity Pro上推出。

GPT-4o一夜被赶超，Anthropic推出Claude 3.5，网友3分钟克隆马里奥游戏

在社交媒体X，不少第三方测评团队也给出了试用结论，相比于GPT-4o，Claude 3.5 Sonnet几乎成了推理、语言、编程、数据分析、数学和指令遵循方面的“六边形战士”。

GPT-4o一夜被赶超，Anthropic推出Claude 3.5，网友3分钟克隆马里奥游戏

Claude 3.5 Sonnet不仅超过其已发最强模型Claude 3 Opus，在速度和成本方面，Claude 3.5 Sonnet也与Anthropic的中端型号Claude 3 Sonnet旗鼓相当——运行速度是Claude 3 Opus的两倍，成本仅1/5。

在内部代理编码评估中，Claude 3.5 Sonnet成功解决了64%的问题，表现优于仅解决了38%的Claude 3 Opus。在得到指导和相关工具后，Claude 3.5 Sonnet 能够独立编写、编辑和执行代码，并具备复杂的推理和故障排除能力。

有网友在社交平台X贴出使用体验，仅仅25秒，Claude 3.5 Sonnet帮他编写了一个功能整齐的游戏程序。

GPT-4o一夜被赶超，Anthropic推出Claude 3.5，网友3分钟克隆马里奥游戏

02.最强视觉模型，多测评超GPT-4o，图表识别能力炸场

Claude 3.5 Sonnet也是Anthropic目前最强大的视觉模型。

它在标准视觉基准测试中超越了Claude 3 Opus。对于需要视觉推理的任务，如解释图表和图形，这些改进尤为显著。此外，Claude 3.5 Sonnet还能准确地从质量不高的图像中转录文本。

如下图所示，在多项权威测评中Claude 3.5 Sonnet超过了GPT-4o，在所有测评中超越了Gemini 1.5 Pro。

GPT-4o一夜被赶超，Anthropic推出Claude 3.5，网友3分钟克隆马里奥游戏

如下图所示，Claude 3.5 Sonnet可以快速识别PDF文件内容并输出折线图。

GPT-4o一夜被赶超，Anthropic推出Claude 3.5，网友3分钟克隆马里奥游戏

当被继续要求生成网页演示内容，Claude 3.5 Sonnet也可以胜任。

GPT-4o一夜被赶超，Anthropic推出Claude 3.5，网友3分钟克隆马里奥游戏

03.颠覆对话式协作，交互升级，四步编程并渲染游戏

现在，Anthropic还将在Claude.ai上推出Artifacts这一新功能，相当于一个预览功能，用以丰富用户与Claude的互动方式。

当用户请求Claude生成代码片段、文本文档或网站设计等内容时，这些Artifacts将在一个专用窗口中与对话一同展示。这为用户提供了一个动态工作区，他们可以实时查看、编辑和构建Claude的创作，将AI生成的内容融入自己的项目和工作流程中。

这一功能的推出标志着Claude从对话式AI向协作式工作环境的进化。

如下图所示，如果要搭建一款游戏并预览效果，用户进需要四个步骤。

首先，输入文本让Claude 3.5 Sonnet生成一个特定大小和风格的角色。

GPT-4o一夜被赶超，Anthropic推出Claude 3.5，网友3分钟克隆马里奥游戏

然后，让Claude 3.5 Sonnet为类似风格的视觉要素编程。

GPT-4o一夜被赶超，Anthropic推出Claude 3.5，网友3分钟克隆马里奥游戏

紧接着，一个整体的游戏页面被搭建出来，用户可以随时看到代码的生成过程。

GPT-4o一夜被赶超，Anthropic推出Claude 3.5，网友3分钟克隆马里奥游戏

最后，就连游戏运行起来的效果，用户也可以通过Artifacts模式进行预览。

在社交媒体X上，有网友称“这太疯狂了”，认为工件+渲染窗口是最佳的编码方式。

GPT-4o一夜被赶超，Anthropic推出Claude 3.5，网友3分钟克隆马里奥游戏

作为Anthropic对安全和透明度的承诺，Anthropic最近已将Claude 3.5 Sonnet提供给英国人工智能安全研究所（UK AISI）进行部署前的安全评估，并与美国人工智能安全研究所（US AISI）分享了结果。

Anthropic称其模型开发的核心原则之一是保护隐私。除非用户明确允许，否则Anthropic不会使用用户提交的数据来训练生成模型。Anthropic称其到目前为止未使用任何用户数据来训练生成模型。

04.结语：OpenAI劲敌出手，追击GPT-4o

Anthropic被认为是OpenAI最强竞争对手之一，Claude 3.5 Sonnet是Claude 3.5系列首款产品，今年晚些时候推出的Claude 3.5 Haiku和Claude 3.5 Opus，是等待OpenAI的后招。

除了研发下一代模型系列，Anthropic还在开发支持企业应用的功能和模式，包括与企业应用程序的集成。Anthropic的团队还在探索诸如“记忆”这样的功能，让Claude能够记住用户的偏好和特定的交互历史，从而提供更加个性化和高效的用户体验。

本文来自微信公众号“智东西”（ID：zhidxcom），作者：李水青

「期货大王」OpenAI，正在被全面超越？

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3633 用户在看

AI写作网站自动的生成文章可以用吗？

218 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

161 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

132 用户在看

GPT-4o一夜被赶超，Anthropic推出Claude 3.5，网友3分钟克隆马里奥游戏

01.生成2倍速，多项能力赶超GPT-4o

02.最强视觉模型，多测评超GPT-4o，图表识别能力炸场

03.颠覆对话式协作，交互升级，四步编程并渲染游戏

04.结语：OpenAI劲敌出手，追击GPT-4o

「期货大王」OpenAI，正在被全面超越？

搜索进入AI蓝海时代：谁在成为新玩家？

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3633 用户在看

AI写作网站自动的生成文章可以用吗？

218 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

161 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

132 用户在看

GPT-4o一夜被赶超，Anthropic推出Claude 3.5，网友3分钟克隆马里奥游戏

01.生成2倍速，多项能力赶超GPT-4o

02.最强视觉模型，多测评超GPT-4o，图表识别能力炸场

03.颠覆对话式协作，交互升级，四步编程并渲染游戏

04.结语：OpenAI劲敌出手，追击GPT-4o

「期货大王」OpenAI，正在被全面超越？

搜索进入AI蓝海时代：谁在成为新玩家？

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿