网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

2024-05-13 阅读 9 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

Llama 3 120B竟意外能打

这两天，社交网络上出现了各种关于Llama3 120B玩法。

比如推导解释一些理论，Omega假设。

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

有创造一些新单词，比如prefaceate、driftift等

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

并且给它一个完整的解释和定义。

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

甚至还有人整了个评测，去评估这个来路不明的大模型。结果在创意写作测试中成绩还不错，排名第6，超过GPT-4、Claude3-HAIku等模型。

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

既然如此，这个非官方的大模型Llama3 120B又是怎么来的呢？

据作者介绍，它是用MergeKit制作，将Meta官方LIama3 70B模型合并（Self-Merge）

MergeKit咋是专门用来合并预训练模型的工具包，合并可以完全在 CPU 上运行，也可以使用低至8GB的VRAM进行加速。在GitHub上已经收获3.6k星。

目前支持Llama、Mistral、GPT-NeoX、StableLM 等模型。

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

作者Maxime Labonne是一位资深机器学习专家，目前在一家通用大模型创业公司LiquidAI工作。

他博士毕业于巴黎理工学院，他在2019年开始研究大语言模型和图神经网络，并将他们应用到不同环境中，比如研发、工业、金融等，撰写过书籍《Hands-On Graph Neural Networks using Python》。

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

他也是开发者社区的活跃开发者，在HuggingFace上发布过各种LLM，例如AlpahMonarch-7B、Beyonder-4x7B、Phixtral 和 NeuralBeagle14。以及一些工具，例如 LLM AutoEval、LazyMergekit、LazyZxolotl 和 AutoGGUF。

在GitHub上他的关于大模型课程，收获29.5K Star。

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

不过对于这个「缝合」大模型的使用，作者建议可以用来创意写作。

在多方评估中可以看到，它有时候会出现神经混乱，但写作风格不错。另外有时候还会出现拼写错误，并且非常喜欢大写字母。

而且由于觉得这个版本的推理能力比较差，于是作者再做了个225B的。

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

网友：看完更期待官方400B了

有网友猜测为什么LIama3-120B能这么强。

一方面，LIama3-70B自己确实很强，刚发布时就迅速跃居排行榜榜首。HuggingFace上显示，上个月下载次数就超过了27万次。

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

lmsysorg就深入分析了LIama3的实力，简单来说，LIama3在开放式写作和创意问题上击败了顶尖模型，但在封闭式数学和编码问题上就稍弱一点。

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

不过随着提示词变得更加复杂，LIama3的能力也就下降得很明显。

以及在输出内容上面，LIama3的输出比其他模型更友好，也更具对话性。

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

除此之外，也有网友分析这与模型深度有关。

事实上与LIama3-70B唯一的区别是额外的Layer，甚至是复制的，没有新的训练数据。。

这意味着，120B大模型的智能水平是从模型的深度产生的。“这不仅仅是训练数据的函数，它是数据和深度的结合”。

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

有网友尝试本地部署，Ollama上已经支持下载。网友表示：它使用48 GB VRAM + 38 GB 系统 RAM。

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

啊这……走了走了。

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

有提供GGUF形式的LMStudioAI，也很直接地说：不适合内存不足的人。

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

原作者也很逗趣地表示：是时候跟你的RAM做告别了。

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

但不管怎么说，已经在期待更多官方型号了。

比如，400B那种。

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

本文来自微信公众号”量子位“

一线创业者圆桌讨论：多模态 AI 的创业机会在于「有用」

关联网址

关联标签

#AI #大模型

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

2824 用户在看

AI写作网站自动的生成文章可以用吗？

137 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

74 用户在看

“如何选择最佳AI写作工具？这些秘诀一定要知道！”

63 用户在看

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

Llama 3 120B竟意外能打

网友：看完更期待官方400B了

一线创业者圆桌讨论：多模态 AI 的创业机会在于「有用」

OpenAI，没有“王炸”

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

2824 用户在看

AI写作网站自动的生成文章可以用吗？

137 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

74 用户在看

“如何选择最佳AI写作工具？这些秘诀一定要知道！”

63 用户在看

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

Llama 3 120B竟意外能打

网友：看完更期待官方400B了

一线创业者圆桌讨论：多模态 AI 的创业机会在于「有用」

OpenAI，没有“王炸”

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿