马斯克的xAI连发两款新模型，有进步但还谈不上领先

2024-08-15 阅读 46 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

热门

由于Grok的图像生成功能没有任何限制，已经有不少用户借此进行政治人物图像创作，但ChatGPT会拒绝生成这类图像。

“Grok的进度是火箭。”马斯克如此兴奋地在X上宣布Grok-2的到来。

当地时间8月14日，xAI发布了Grok-2和Grok-2mini两款AI模型的测试版。其中，Grok-2是该公司推理能力最强的语言模型，而轻量化模型Grok-2mini则是Grok-2的“兄弟产品”，试图实现小参数体型下的强功能。

xAI在博客文章中表示，Grok-2的早期预览版相较于Grok-1.5有了重大进步，具有聊天、编码和推理方面的前沿功能。

该公司声称，Grok-2的早期版本以“sus-column-r”的名称进行测试，在LMSYS排行榜上的表现优于Anthropic公司的Claude 3.5 Sonnet和OpenAI的GPT-4-Turbo。LMSYS排行榜通过在大语言模型间进行随机匿名的一对一“对战”，并基于ELO评级系统得出排名。

马斯克的xAI连发两款新模型，有进步但还谈不上领先

图源：xAI

sus-column-r（Grok 2早期版本）现已公开，凭借超过12000个社区投票，sus-column-r在总体排行榜上获得了第3名，与GPT-4o相当。它在编码获得第2名、困难提示获得第4名，数学方面也取得第2名。

xAI还通过AI导师系统测试Grok与新的模型互动表现，Grok-2重点评估模型在两个关键领域的能力：遵循指示和提供准确、真实的信息。Grok-2在推理检索到的内容和工具使用能力方面表现出显著进步，例如正确识别缺失信息、通过事件序列进行推理以及丢弃不相关的帖子。

此外，xAI通过一系列学术基准对Grok-2模型进行了评估，这些基准包括推理、阅读理解、数学、科学和编码。该公司表示，“在研究生水平的科学知识、常识和数学竞赛问题等领域的表现可与其他前沿模型相媲美。”

马斯克正在将xAI与其收购的社交媒体“X”深度绑定——Grok-2和Grok-2mini将对X的增强搜索功能、深入了解帖子以及改进回复功能提供支持，尽管此前xAI曾因使用X用户数据进行训练而遭致反对。

此次更新的一大亮点是，Grok-2模型可以在X上生成图像，其生图模型使用了近期大火的 Flux.1模型，但目前仅限于X上的Premium和Premium+用户。

由于Grok的图像生成功能没有任何限制，已经有不少用户借此进行政治人物图像创作，例如有用户利用Grok-2生成美国首任总统华盛顿的图片，该帖子还被马斯克转载。然而，OpenAI的ChatGPT会拒绝生成这类图像，避免政治风险。

马斯克的xAI连发两款新模型，有进步但还谈不上领先

图源：X

值得注意的是，Grok-2和Grok-2mini目前仍处于测试阶段。该公司预计，本月晚些时候将通过其企业API向开发人员提供这两种模型。即将推出的API建立在新的定制技术堆栈上，允许多区域推理部署，以实现全球低延迟访问，同时提供增强安全功能，例如强制性多因素身份验证、流量统计数据和高级计费分析。

在与OpenAI分道扬镳后，马斯克曾预测2029年将会实现通用人工智能，而他所创办的xAI最终目标是让消费者、企业甚至所有人都可以使用AI产品，并变成有用的工具。其希望通过AI去帮助人们解决复杂的科学和数学问题，并且“理解”宇宙。

xAI的动作也在不断加速。该公司于2024年1月进行了首次融资，金额为1.35亿美元；5月完成了60亿美元的B轮融资，公司估值也从此前的180亿美元飙升至250亿美元，成为美国又一家AI独角兽。

到了7月，马斯克表示，xAI团队已经开始在“孟菲斯超级集群”上进行训练。该集群由10万个液冷H100 GPU组成，目标是在今年12月前训练出“按每项指标衡量都是世界上最强大的人工智能”。

他的野心还不止于此，曾透露xAI计划打造一台超级计算机“算力的超级工厂”，预计规模是市场上最强大竞争对手的四倍。

作为大模型的“后来者”，马斯克认为xAI可以在人工智能领域带来新的突破和创新，同时强调竞争有利于推动整个行业的进步，避免形成一家公司在人工智能领域占主导地位的单极世界。

但从其最新发布的两款模型来看，并未表现出超越行业的创新性，仍处于追赶者的角色。Grok-2要想在与OpenAI、谷歌等一众科技公司的竞争中突围，需拿出更强有力的产品才行。

文章来源于“36氪的朋友们”

AI大模型有多不好干？周鸿祎都辞去董事会主席亲自做销售了

关联网址

关联标签

#AI #AI模型 #大模型

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3733 用户在看

AI写作网站自动的生成文章可以用吗？

300 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

264 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

238 用户在看

马斯克的xAI连发两款新模型，有进步但还谈不上领先

AI大模型有多不好干？周鸿祎都辞去董事会主席亲自做销售了

Vchoo.ai COO：AI生成视频的核心是让用户成为故事大师，而非技术达人

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3733 用户在看

AI写作网站自动的生成文章可以用吗？

300 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

264 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

238 用户在看

马斯克的xAI连发两款新模型，有进步但还谈不上领先

AI大模型有多不好干？周鸿祎都辞去董事会主席亲自做销售了

Vchoo.ai COO：AI生成视频的核心是让用户成为故事大师，而非技术达人

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿