1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

2024-06-06 阅读 48 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

模型升级：0.1元写2本《红楼梦》

如今，平台上已经全线接入新模型，由ChatGLM3-6B升级为GLM-4-9B，堪称“最能打的小模型”，已经全面超过了 Llama3-8B-Instruct。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

在开放平台上，它变成GLM-4 Flash版本，价格相对于GLM-3-Turbo再次降价10倍，仅仅0.1元，就可以拥有一百万tokens，足够写两本四大名著了！

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

如果小模型不能满足需求，新推出的GLM-4-Air性能更加强大。它的性能跟和此前的GLM-4-0116相仿，但价格仅为前者的百分之一！一百万tokens，仅需一元。

而许多企业应用到深水区时，对速度也有极高的要求，在此基础之上，智谱加入了极速版。

效果不变，但推理速度直升162%。71 token每秒，相当于每秒可以直出100多个汉字！

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

并且，GLM-4-0116也同时升级了。

就在今天，智谱推出了GLM-4-0520，它的综合能力，已经提升了11.9%。

真正做过模型的应用的人，都明白这意味着什么：虽然在数字上看来只是一点点的提升，但这已经进一步提升了模型的天花板，极大扩展应用的范围，降低应用的成本。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

如今，智谱AI已经拥有全模型矩阵。

无论是GLM-4V，还是CogView-3，降价都达到了50%-60%——一张图只需一毛钱。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

开放平台升级：3步训出一个私有模型

每个企业都希望构建自己的私有模型。虽然开源生态让模型训练门槛大幅降低，但对于绝大多数企业，这个过程依然太复杂。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

为此，智谱AI也全面升级了自己的平台，仅仅三步——准备数据、创建微调任务、部署模型，就能让企业训出一个私有模型了！

这个过程中，不需要任何代码功底。而且，GLM-4全系列模型都支持这样的微调。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

针对企业，智谱AI提供了两种模式：LoRA微调和全参微调。

LoRA微调，可以说是性价比之王，用更低的成本达到较好的结果。

全参微调，相当于是探索模型微调的极限。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

可以看到，训练成本可以降低到87%。在LoRA微调上，GLM-4每千token只需要四毛钱，GLM-4-Air则只需要三分钱。

比起训练千亿模型动辄需要的多台A100、A800，显然门槛已经大幅降低。

而即使是全参微调的情况下，GLM-4每千token也只需要六毛钱，GLM-4-Air则只需要五分钱。

下面这个例子，是一个发生在客户身上的真实实验。

客户需要模型能够提供某领域专业化的咨询服务，于是，智谱AI尝试为客户做了微调。

他们选择了6000条语料，折合下来是一千万token。

训练后，模型的可用性从60%，直接上升到了89%！

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

这不是一个简单的提升，而是一个本质性的飞跃，让模型从不可用，变成了完全可用，进一步探索了模型使用的边界。

所以，这次微调的成本是多少？

答案令人惊诧——如果使用LoRA的话，成本仅为300元！即使选择全参，也只需要500元。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

这个具体的demo，可以让我们深刻地体会到，如今训练出一个私有模型是多么容易。

另外，在AllTools的API平台上，智能体的能力能让大模型从解决一个单一任务，变成处理一个复杂任务。

在企业端，这样让使用模型的能力大幅度放开。

从此，每一家企业都能制作自己的智能体，以及智能体平台。

它可以让模型更好拆解任务，更好调用上下文function call的能力，还为企业提供了常用的一些智能体插件。

包括代码解释器、知识库检索增强、函数调用能力等等。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

开放平台地址：bigmodel.cn

国内开源，影响世界

另一边，国内模型开源掀起的风浪，已然波及到全世界。

而坚持开源，是智谱AI一直以来的传统。

他们不仅是国产LLM的领头羊，也是大模型学术生态、开源生态中，不可忽视，首屈一指的中国力量。

目前为止，智谱AI已经有三代模型全部开源。

6B系列开源模型，在Github上已累计获得超过6万star，相当于Llama系列模型的star总数，超过了Grok和其他所有模型；在Hugging Face上吸引了超过1300万次下载，四周Hugging Face趋势榜第一。

GPT-4发布的同一天，团队首次开源了ChatGLM-6B模型，随后6月开源了二代6B模型，并首次引入GQA、FlashAttention技术，将模型上下文扩充到32K，并加速了生成速度。

紧接着10月，三代6B模型开源，支持128K上下文。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

GLM-4 9B系列，免费开源

今天，智谱带来了第四代开源模型最新成果——GLM-4-9B。

显然，这次开源模型最大的变化是，参数规模从6B升级到了9B，并首次拥有了多模态能力。

而且，基于强大基座模型，GLM-4-9B不仅拥有更强的基础能力，更长的上下文，更精准的函数调用和All Tools能力。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

比起上一代ChatGLM3-6B，在5倍的计算量下，GLM-4 9B的性能从61.4提升到了72.4，中英文综合能力提升40%。

另外，在与训练量更多的Llama-3-8B-Instruct较量中，GLM-4-9B毫不逊色。

具体来说，英文方面，第四代模型小幅领先，而在中文学科方面实现了50%的提升。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

1M上下文，一次读完2本《红楼梦》

除此以外，GLM-4-9B的上下文从128K扩展到了1M，可同时处理200万字的输入。

这相当于，能够一次读完2本《红楼梦》，又或是125篇论文。

在长度为128K的LongBench-Chat上，GLM-4-9B-Chat模型相比上一代提升了20%。同时，在长度为1M的大海捞针测试中，GLM-4-9B-Chat-1M获得了「全绿」的成绩。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

演示中，在1M版本模型中，输入《三体》的三本全集，共90万字的内容。

然后，给模型prompt「请仔细阅读上面的三部小说，如果让你给这个小说写第四部，你会怎么写，请给出大纲」。

模型给出了比较合理的续写规划。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

另外，GLM-4-9B函数调用能力，比上一代大幅提升40%。

在UC伯克利函数调用Leaderboard上，9B模型函数调用能力，即可媲美GPT-4-Turbo。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

智谱AI在开源仓库中，还提供了一个完整的All Tools Demo，开发者可以在本地拥有一个轻量级的清言平替。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

比如，先用网页搜索「马拉松的世界纪录」，然后用代码解释器去计算「跑步平均速度」。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

计算平均速度

All Tools还有非常多的组合，开发者可以自行去探索。

多模态比肩GPT-4V

除了文本模型，这次一并开源了多模态模型GLM-4V-9B。

最新模型采用了与CogVLM2相似的架构设计，能够处理高达1120 x 1120分辨率的输入，并通过降采样技术有效减少了token的开销。

与CogVLM的不同之处在于，GLM-4V-9B并没有通过引入额外的视觉专家来增加参数量，而是采用了直接混合文本和图片数据的方式进行训练。

这种训练方法使得GLM-4V-9B模型能够同时具备强大的文本和视觉处理能力，实现了真正的多模态学习。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

它能够以13B总参数激活量，超越了一众多模态模型，甚至比肩GPT-4V。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

不如看看，GLM-4V-9B在实际任务中的表现。

比如，让模型去识别T恤上的公式印花——麦克斯韦方程式。

你甚至，还可以追问关于方程组的细节，模型可以凭借自己的文本能力完成回答。

这从另一方面印证了，并没有因为引入多模态能力，而丧失模型原本的文本能力。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

在下面这个例子中，是截取清华大学网络学堂的一个网页截图，并要求模型翻译成HTML代码。

GLM-4V-9B就可以识别出其中元素，并翻译成相应的代码。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

整体来说，GLM-4-9B模型共有9.4B参数，是在10T的高质量多语言数据上，完成了预训练，几乎利用了所有网页数据。

其数据量是ChatGLM3-6B模型的3倍还要多。

与此同时，智谱AI采用了FP8精度进行高效的预训练并成功收敛，比起上一代模型，训练效率提升3.5倍。

由此，智谱AI将参数规模从6B扩展至9B，并将预训练计算量增加了5倍。

基于文本基座，打造的多模态模型GLM-4V-9B，完全融合了文本和视觉模型，并与GPT-4V不相上下。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

成立于2019年，智谱AI用了4年的时间从一家明星创业公司，跻身为国内头部AI独角兽。

一直以来，外界对智谱的印象是，清华系国家队，全面对标OpenAI技术领先，to B气质强烈。

智谱不仅在大模型的能力上向OpenAI看齐，而且在投资领域布局上也不遑多让，深受资本青睐。

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

过去一年中，他们完成了3次基座大模型升级迭代，这次OpenDay 核心展示了面向AGI愿景的完整产品矩阵，透传出未来商业化的模式。

智谱AI正把MaaS商业模式提升到新的境界。MaaS平台2.0的诞生，将会进一步扩大智谱生态朋友圈。

文章来源于“新智元”，作者“新智元”

从46款AI教育产品，看全球八大市场用户学习偏好

关联网址

关联标签

#AI #AI技术 #大模型 #技术突破

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3733 用户在看

AI写作网站自动的生成文章可以用吗？

300 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

265 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

238 用户在看

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

模型升级：0.1元写2本《红楼梦》

开放平台升级：3步训出一个私有模型

GLM-4 9B系列，免费开源

1M上下文，一次读完2本《红楼梦》

多模态比肩GPT-4V

从46款AI教育产品，看全球八大市场用户学习偏好

AI「末日」突然来临，公司同事集体变蠢！只因四大聊天机器人同时宕机

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3733 用户在看

AI写作网站自动的生成文章可以用吗？

300 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

265 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

238 用户在看

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

模型升级：0.1元写2本《红楼梦》

开放平台升级：3步训出一个私有模型

GLM-4 9B系列，免费开源

1M上下文，一次读完2本《红楼梦》

多模态比肩GPT-4V

从46款AI教育产品，看全球八大市场用户学习偏好

AI「末日」突然来临，公司同事集体变蠢！只因四大聊天机器人同时宕机

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿