60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

2024-09-12 阅读 31 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

模型架构

现场的介绍中，Pixtral 12B的架构如下图所示。

它包含了一个多模态Transformer解码器，还有视觉Transformer编码器，能够理解原生的图像和文档。

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

正如开头所述，新模型是基于Nemo 12B完成搭建，关于训练数据目前仍在保密中。

开发者关系主管Sophia Yang表示，「Pixtral 12B独特之处在于，能够原生支持任意数量、大小的图像」。

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

它能够快速处理小图像，还可以精准处理真实世界和高分辨率的图像。而且，扔出一个图文混杂的大型文档，也能信手拈来。

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

Pixtral 12B的上下文长度为128k。

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

根据初始测试者的分享，这个24GB模型架构共有40层，14336个隐藏维度，32个注意力头，用于广泛的计算处理。

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

在视觉方面，它还有一个专用的视觉编码器，可支持1024×1024图像分辨率，以及24个隐藏层用于高级图像处理。

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

然而，当Mistral最终通过API提供该模型时，可能会有所改变。

就性能来说，Pixtral 12B在多模态知识和推理基准（MMMU、MathVista）、多模态问答基准（ChatQA、DocVQA、VQAv2）上，完全碾压当前领先的同等参数的模型。

比如，Qwen2-VL、LLaVA-OV、Phi-3 Vision等。

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

而在指令跟随（多模态、文本）、文本理解（科学、数学、代码）基准上，Pixtral 12B表现也非常出色。

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

或许多模态模型对于我们来说，屡见不鲜，但Pixtral 12B对于Mistral来说是开创历史。

自去年成立以来，Mistral凭借开源媲美OpenAI等领先实验室大模型，一路走红得到AI社区的认可。

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

几个月前，它以60亿美金估值，完成6.4亿美元新一轮融资，并随之推出了一款GPT-4级别的模型——Mistral Large 2。

此外，他们在今年，还推出了一个专家混合模型Mixtral 8x22B，包含了一个编码模型Codestral，以及一个数学推理和科学发现的模型。

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

Mistral或许有实力，成为下一个OpenAI。

穿上皮夹克，和老黄炉边谈话

更让人惊喜的是，大会现场，还上演了经典「皮夹克帮」集结的一幕。

创始人Arthur Mensch穿上皮夹克和老黄坐在台前，开启了炉边谈话，一起探讨了未来AI和算力问题。

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

老黄表示，在英伟达，GPU的设计、性能、耗能等方面问题，仍将持续优化。

他们希望利用AI先去探索巨大设计空间的可能性，然后再进行收缩，最终专注于有前景的解决方案。

老黄还认为：推理在今天是一次性的，但在未来不会是这样。为了实现这一点，还需把推理速度提高到一个数量级。

因为，利用GPU做推理面临着显著的困难，英伟达90%的工程师都投在了推理，而非训练中。

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

当然，英伟达对推理技术架构的探索，仍在继续。老黄希望NVLink能够实现低延迟高吞吐量的推理设计。

对于AI未来的探索，老黄表示自己最喜欢的AI应用，便是创建数字人。

他希望，未来公司会有数百万个智能体数字员工，可以自主相互交流，运营业务。

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

此外，他还讨论了英伟达在「类人机器人」领域的大量工作。

而它的发展，受到了老黄所言的「3台计算机问题」的瓶颈制约——

第一台用于训练多模态模型，第二台用于精确物理模拟和生成合成数据（NVIDIA Omniverse），第三台是机器人体内的计算机（即将推出的NVIDIA Thor）。

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

最后，老黄还回顾了英伟达历史，「在1993年成立之时，我们在GPU领域还没有竞争对手，到1994年有10个，1995年有50个，然后有100个，竞争对手迅速增加」。

在竞争这么激烈领域中，英伟达能够有所成，一定程度上，可以归咎于你所做的事情与做这些事情的原因不同。

英伟达是PC游戏行业的最大推动者，他们通过创建计算平台、生态系统来创造一个新市场，使之成为「家庭的一部分」。

他们最先在游戏领域做到了这一点，然后是科学计算，现在是AI。

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

大佬发现「华点」：又来一个评测造假的？

前两天，所谓的「开源新王」Reflection 70B才刚刚深陷Benchmark造假争议。

如今，相似的剧情再次上演。

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

随着峰会现场的照片大范围流出，Hugging Face技术负责人Philipp Schmid也在第一时间发现，Mistral AI放出的跑分和Qwen 2 VL 7B的官方数据大相径庭。

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

把数据补全到柱状图中后可以看道，Pixtral 12B在多项评测中的成绩都明显不如Qwen 2 VL 7B。

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

也就是说，Mistral AI的首个多模态模型，被一个参数量小了近42%的模型，吊打了！

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

此外，还有网友指出，别说数据有问题，他们连模型的名字好像都没写对……

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

文章来源于“新智元”，作者“新智元”

腾讯最新万亿参数异构MoE上线，技术细节首次曝光！权威评测国内第一，直逼GPT-4o

关联网址

关联标签

#AI #大模型

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3633 用户在看

AI写作网站自动的生成文章可以用吗？

218 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

161 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

132 用户在看

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

模型架构

腾讯最新万亿参数异构MoE上线，技术细节首次曝光！权威评测国内第一，直逼GPT-4o

李彦宏内部讲话流出：曝大模型「刷榜」潜规则，谈三大认知误区

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3633 用户在看

AI写作网站自动的生成文章可以用吗？

218 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

161 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

132 用户在看

60亿AI独角兽Mistral祭出磁力链，首个多模态Pixtral 12B登场！但被大佬曝出评测造假

模型架构

腾讯最新万亿参数异构MoE上线，技术细节首次曝光！权威评测国内第一，直逼GPT-4o

李彦宏内部讲话流出：曝大模型「刷榜」潜规则，谈三大认知误区

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿