Mistral多模态大模型来了！120亿参数，原生支持任意大小/数量图像，公司估值已达420亿

2024-09-12 阅读 41 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

超越Qwen、LLaVA等

虽然目前模型的训练数据、细节都未公开，但是通过模型代码网友们发现了更多细节。

1、先进架构：40层网络、14336隐藏维度大小、32个注意力头。

2、视觉能力：专用视觉编码器，支持1024×1024图像大小和24个隐藏层，用于高级图像处理。

3、更大词汇量：131072tokens，支持更细致语言理解和生成。

4、使用GeLU(用于视觉适配器)和2D RoPE(用于视觉编码器)。

5、Patch大小：16×16像素。

6、在mistral_common中支持tokenizer。

7、模型权重bf16。

Mistral多模态大模型来了！120亿参数，原生支持任意大小/数量图像，公司估值已达420亿

与此同时，还有人在放出了Mistral发布会上公布的模型基准情况。

Mistral多模态大模型来了！120亿参数，原生支持任意大小/数量图像，公司估值已达420亿

Pixtral 12B和Qwen2-VL-7B、LLaVA-OV-7B、Phi-3 Vision做了对比。

多模态知识和推理、QA等方面都表现不错。

Mistral多模态大模型来了！120亿参数，原生支持任意大小/数量图像，公司估值已达420亿

欧洲版OpenAI估值达60亿美元

最近几个月Mistral的动作还是非常密集的。

今年6月，他们通过股权债务融资完成约6.4亿美元B轮融资。估值已达60亿美元（折合人民币约420亿）。

完成融资后，他们便发布了Mistral Large 2旗舰模型、SMoE模型Mistral 8×22B以及开源模型Codestral等。

目前，微软、AWS、Snowflake等巨头均投资Mistral。尤其是微软的入股，使得Mistral成为OpenAI以外，微软Azure第二个商业闭源模型供应商。这也进一步夯实了Mistral“欧洲版OpenAI”的地位。

参考链接：

[1]https://x.com/_philschmid/status/1833954941624615151

[2]https://venturebeat.com/ai/pixtral-12b-is-here-mistral-releases-its-first-ever-multimodal-ai-model/

[3]https://x.com/theresanaiforit/status/1833784474342977627

文章来自于微信公众号“量子位”，作者“明敏”

李彦宏揭开大模型认知误区：开源解决不了效率问题，大模型之间差距越来越大

关联网址

关联标签

#AI #大模型

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3664 用户在看

AI写作网站自动的生成文章可以用吗？

261 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

185 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

158 用户在看

Mistral多模态大模型来了！120亿参数，原生支持任意大小/数量图像，公司估值已达420亿

超越Qwen、LLaVA等

欧洲版OpenAI估值达60亿美元

李彦宏揭开大模型认知误区：开源解决不了效率问题，大模型之间差距越来越大

小心！AI能「看懂」你的唇语，悄悄话不再安全！

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3664 用户在看

AI写作网站自动的生成文章可以用吗？

261 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

185 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

158 用户在看

Mistral多模态大模型来了！120亿参数，原生支持任意大小/数量图像，公司估值已达420亿

超越Qwen、LLaVA等

欧洲版OpenAI估值达60亿美元

李彦宏揭开大模型认知误区：开源解决不了效率问题，大模型之间差距越来越大

小心！AI能「看懂」你的唇语，悄悄话不再安全！

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿