最强开源编程大模型一夜易主：精通80+语言，仅22B

2024-05-30 阅读 49 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

开源编程模型的新王者

Codestral的参数量为22B，支持32k的上下文窗口。

在开发过程中，研究人员使用了80多种编程语言的代码数据对Codestral进行了训练。

其中既包括Python、Java、C++和Bash等这些流行语言，也有像Fortran、COBOL这样的古早语言。

值得一提的是，其中的COBOL诞生于1959年，但至今全球仍有43%的银行系统依赖它，然而另一方面，现在会用的人数却寥寥无几，而且普遍年事已高。

AI工具对COBOL的支持，或许将成为解决COBOL人才极度紧缺问题的一种途径。

说回到Codestral，虽然参数量只有不到三分之一，但测评成绩已经大幅超过了70B的Code Llama。

对于Python语言，研发团队使用了HumanEval（pass@1）和MBPP评估了Codestral的Python代码生成能力，用CruxEval来评估输出预测，以及用RepoBench评估Codestral在远程存储库中的代码补全能力。

结果，Codestral在其中的三项测试中都取得了最佳成绩，并对Llama 3和Code Llama形成了全面超越。

数据库方面，在针对SQL的Spider测试中，Codestral的表现也与通用模型Llama3十分接近。

最强开源编程大模型一夜易主：精通80+语言，仅22B

对于其他一些编程语言，Codestral和通用版Llama3各有胜负，平均成绩则小幅超过了Llama3，但相对于Code Llama的优势是十分明显的。

最强开源编程大模型一夜易主：精通80+语言，仅22B

另外，Codestral还支持FIM（fill-in-the-middle），也就是可以对现有代码进行填充补全。

在Python、JS和Java三种语言当中，Codestral都取得了接近或超过90%的HumanEvalFIM评分，平均成绩91.6%，超过了参数量更大的DeepSeek Coder 33B。

最强开源编程大模型一夜易主：精通80+语言，仅22B

速度方面，使用在线对话版本，只要三秒钟就能构建出一个带有顶部banner和侧边栏的HTML框架。

最强开源编程大模型一夜易主：精通80+语言，仅22B

不仅性能表现优异，形式上，Codestral支持的使用方式也多种多样。

Mistral已经把模型权重上传到了HuggingFace，有条件的可以自行下载部署。

以及LangChAIn、LlamaIndex，还有开头提到的Ollama等这些大模型框架，以及Mistral自家的开发者平台La Plateforme当中都已经支持使用Codestral。

专属API也正在赶来的路上，正在进行为期8周的测试，期间开发者可以免费使用。

最强开源编程大模型一夜易主：精通80+语言，仅22B

如果还是不会部署的话，也可以到Mistral的在线对话平台Le Chat当中，直接使用网页进行对话。

最强开源编程大模型一夜易主：精通80+语言，仅22B

当然，开发者更关心的，可能还是能不能集成到IDE中使用。

对此，官方暂未推出原生的IDE支持，不过已经有Continue.dev、Tabnine等第三方插件支持了Codestral，可以通过这些插件在VSCode和JetBrains系列IDE中使用。

One More Thing

与Codestral一同官宣的，还有Mistral全新的“非生产”（Non-Production）许可协议，简称MNPL。

本次发布的CodeStral使用的许可协议也正是MNPL，按照规定仅可用于研究目的，不能进行商用。

最强开源编程大模型一夜易主：精通80+语言，仅22B

并且，这份协议对“非商用”的界定也十分严格，即使仅将其用于公司内部事务也不被允许。

有开源作者就此吐槽，他们用我代码的时候从未征求我的意见，为什么还反过来要求我遵守他们的规定，这实在是太荒谬了。

最强开源编程大模型一夜易主：精通80+语言，仅22B

而Mistral这边的解释则是，如果放开商业用途，可能无法得到使用者对模型研发的贡献。

最强开源编程大模型一夜易主：精通80+语言，仅22B

官方同时也表示，虽然Codestral不能商用，但并不意味着之后的其他开源模型也是如此，同时明确表示后续会继续发布基于Apache 2.0协议的其他模型。

最强开源编程大模型一夜易主：精通80+语言，仅22B

参考链接：

[1]https://mistral.ai/news/codestral/

[2]https://x.com/GuillaumeLample/status/1795820710750744839

[3]https://www.theverge.com/2024/5/29/24166334/mistral-debuts-a-coding-assistant-called-codestral

文章来源于：微信公众号量子位，作者：克雷西

最强开源编程大模型一夜易主：精通80+语言，仅22B

腾讯AI助手App元宝来了，公众号作者必备

关联网址

关联标签

#AI #AI工具 #大模型

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3734 用户在看

AI写作网站自动的生成文章可以用吗？

300 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

265 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

238 用户在看

最强开源编程大模型一夜易主：精通80+语言，仅22B

开源编程模型的新王者

One More Thing

腾讯AI助手App元宝来了，公众号作者必备

用硅模拟人脑，进度条走到了1/80

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3734 用户在看

AI写作网站自动的生成文章可以用吗？

300 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

265 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

238 用户在看

最强开源编程大模型一夜易主：精通80+语言，仅22B

开源编程模型的新王者

One More Thing

腾讯AI助手App元宝来了，公众号作者必备

用硅模拟人脑，进度条走到了1/80

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿