GPT-4太烧钱，微软想甩掉OpenAI？曝出Plan B：千块GPU专训「小模型」，开启必应内测

2023-09-27 阅读 36 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

更「精炼」的模型，必应先尝鲜

今年2月，微软正式发布新必应（New Bing），其中结合了ChatGPT和自家的普罗米修斯（Prometheus）模型。

在GPT-4公布后，微软紧接着宣布，GPT-4整合到必应中，将搜索体验带上了一个新台阶。

微软搜索主管Mikhail Parakhin近日表示，Bing Chat目前在「创意」和「精准」模式下使用的是100%的GPT-4。

而在平衡模式下（多数用户选择的模式），微软用普罗米修斯模型，以及图灵语言模型（Turing language models）作为补充。

GPT-4太烧钱，微软想甩掉OpenAI？曝出Plan B：千块GPU专训「小模型」，开启必应内测

普罗米修斯模型是技能和技术的集合体。而图灵模型不如GPT-4强大，旨在识别和回答简单的问题，并将更难的问题传递给GPT-4。

微软内部，已经将其手头的2000块GPU中的大部分，都投入到了「小模型」的训练当中。当然，这与微软提供给OpenAI的芯片数量相比，只能说是小巫见大巫了。

不过，这些模型可以执行比GPT-4更简单的任务，也是微软为破冰所作的努力。

打破OpenAI束缚

多年来，微软与OpenAI这两家公司，保持着千丝万缕的联系。

但是，随着ChatGPT，微软必应等全家桶竞相推出，微软与OpenAI也开始秘密开展市场角逐战。

尽管微软的努力仍处于早期阶段，但纳德拉正带领微软，为自家AI产品开辟一条不完全依赖OpenAI的路。

普罗米修斯模型是技能和技术的集合体。而图灵模型不如GPT-4强大，旨在识别和回答简单的问题，并将更难的问题传递给GPT-4。

不过，这些模型可以执行比GPT-4更简单的任务，也是微软为破冰所作的努力。

打破OpenAI束缚

多年来，微软与OpenAI这两家公司，保持着千丝万缕的联系。

但是，随着ChatGPT，微软必应等全家桶竞相推出，微软与OpenAI也开始秘密开展市场角逐战。

尽管微软的努力仍处于早期阶段，但纳德拉正带领微软，为自家AI产品开辟一条不完全依赖OpenAI的路。

GPT-4太烧钱，微软想甩掉OpenAI？曝出Plan B：千块GPU专训「小模型」，开启必应内测

他们清楚地知道，自身没有OpenAI的计算资源，也没有大量的人类审查员来反馈LLM回答的问题，以便工程师改进模型。

过去一年里，随着几波研究人员的离职，包括一些转入微软内部的产品团队，研究部门的人才也在不断流失。

对微软自身来说，在没有OpenAI帮助的情况下，开发高质量的LLM，可以在未来几年，两家公司讨论续签合作关系时赢得更多谈判筹码。

GPT-4太烧钱，微软想甩掉OpenAI？曝出Plan B：千块GPU专训「小模型」，开启必应内测

微软AI研究主管Peter Lee

目前，两者交易对双方都有利。

微软投资OpenAI一百多亿美元，作为回报，能够在微软产品中永久使用OpenAI 现有知识产权的独家权利。

此外，微软还将获得OpenAI 75%的理论运营收益，直到其初始投资偿还为止，并且将获得利润的49%，直到达到一定上限为止。

GPT-4太烧钱，微软想甩掉OpenAI？曝出Plan B：千块GPU专训「小模型」，开启必应内测

现在，微软希望通过与OpenAI，以及其他AI企业的现有联盟，在一个不确定的时期内增加至少100亿美元的新收入。

Oﬃce 365全家桶在得到GPT-4能力加持，已经出现了早期的收入增长迹象。

微软还在7月份表示，已有超过2.7万家公司为代码编写工具GitHub Copilot付费了。

Statista统计，2023年除了微软云服务比例最大，加速生产力商业流程的软件产品收入占比也在逐渐增加。

GPT-4太烧钱，微软想甩掉OpenAI？曝出Plan B：千块GPU专训「小模型」，开启必应内测

然鹅，讽刺的是，微软与OpenAI的交易条款，也间接地帮助微软努力摆脱对OpenAI的依赖。

当用户使用必应时，微软可以访问OpenAI模型输出的结果。

目前，微软正在利用这些数据，创建更加「精炼」的模型。内部研究人员的研究结果表明，这些模型可以用更少的计算资源产生类似的结果。

「小模型」的探索

在OpenAI的阴影下度过一年后，微软的一些研究人员找到了全新的目标——制造一个模仿GPT-4的「蒸馏」模型。

今年6月，微软训练了一个算力消耗只有GPT-4十分之一的模型——Orca。

为了创建这个Orca，微软将GPT-4生成的数百万个答案输入到了一个更为基本的开源模型之中，并以此教它模仿GPT-4。

GPT-4太烧钱，微软想甩掉OpenAI？曝出Plan B：千块GPU专训「小模型」，开启必应内测

对应中英文原版论文PDF，请添加官方微信 openai178 免费领取

结果显示，Orca不仅超过了其他的SOTA指令微调模型，而且在BigBench Hard（BBH）等复杂的零样本推理基准中，实现了比Vicuna-13B翻倍的性能表现。

此外，Orca在BBH基准上还实现了与ChatGPT持平的性能，在SAT、LSAT、GRE和GMAT等专业和学术考试中只有4%的性能差距，并且都是在没有思维链的零样本设置下测量的。

GPT-4太烧钱，微软想甩掉OpenAI？曝出Plan B：千块GPU专训「小模型」，开启必应内测

甚至，在某些情况下，Orca的表现与OpenAI的免费版ChatGPT不相上下。

GPT-4太烧钱，微软想甩掉OpenAI？曝出Plan B：千块GPU专训「小模型」，开启必应内测

类似的，微软还公布了一款参数量不到GPT-4千分之一的模型——phi-1。

由于采用了「教科书级」的高质量训练数据，phi-1在数学和逻辑问题上的熟练程度，完全不亚于5倍于它的开源模型。

GPT-4太烧钱，微软想甩掉OpenAI？曝出Plan B：千块GPU专训「小模型」，开启必应内测

对应中英文原版论文PDF，请添加官方微信 openai178 免费领取

随后，微软在研究「一个LLM有多小，才能达到一定的能力」上更进了一步，推出了只有13亿参数的模型phi-1.5。

GPT-4太烧钱，微软想甩掉OpenAI？曝出Plan B：千块GPU专训「小模型」，开启必应内测

对应中英文原版论文PDF，请添加官方微信 openai178 免费领取

phi-1.5展现出了许多大模型具备的能力，能够进行「一步一步地思考」，或者进行一些基本上下文学习。

GPT-4太烧钱，微软想甩掉OpenAI？曝出Plan B：千块GPU专训「小模型」，开启必应内测

结果显示，phi-1.5在常识推理和语言技能上的表现，与规模10倍于它的模型旗鼓相当。

同时，在多步推理上，还远远超过了其他大模型。

GPT-4太烧钱，微软想甩掉OpenAI？曝出Plan B：千块GPU专训「小模型」，开启必应内测

虽然目前还不清楚，像Orca和Phi这样的「小模型」是否真的能与更大的SOTA模型（如GPT-4）相媲美。但它们巨大的成本优势，加强了微软继续推动相关研究的动力。

据一位知情人士透露，团队在发布Phi之后，首要任务就是验证此类模型的质量。

在即将要发表的论文中，研究人员又提出了一种基于对比学习的方法，让工程师们可以教模型区分高质量和低质量的响应，从而改进Orca。

同时，微软其他的团队也正在紧锣密鼓地开发全新的多模态大模型，也就是一种既能解释又能生成文本和图像的LLM。

GPT-4太烧钱，微软想甩掉OpenAI？曝出Plan B：千块GPU专训「小模型」，开启必应内测

显然，像Orca和Phi这样的模型，可以帮助微软降低为客户提供AI功能时所需的计算成本。

据一位在职员工透露，微软的产品经理已经在测试如何使用Orca和Phi而不是OpenAI的模型，来处理必应聊天机器人的查询了。比如，总结小段文本、回答是或者否，这种相对简单的问题。

此外，微软还在权衡是否向Azure云客户提供Orca模型。

据知情人士透露，Orca论文一经发表，就有客户来询问何时能用上了。

但问题在于，如果真要这样操作的话，微软是不是还需要找Meta拿个许可。毕竟后者对哪些公司可以将其开源LLM进行商业化，还是有所限制的。

参考资料：

https://www.theinformation.com/articles/how-microsoft-is-trying-to-lessen-its-addiction-to-openai-as-ai-costs-soar?rc=epv9gi

https://the-decoder.com/microsoft-seeks-plan-b-for-more-cost-effective-ai-sidestepping-openais-gpt-4/

文章转载自微信公众号“新智元”

达利欧：人工智能将颠覆日常生活最快明年面临重大变革

关联网址

关联标签

#AI #AI模型 #大模型

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3660 用户在看

AI写作网站自动的生成文章可以用吗？

261 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

183 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

155 用户在看

GPT-4太烧钱，微软想甩掉OpenAI？曝出Plan B：千块GPU专训「小模型」，开启必应内测

更「精炼」的模型，必应先尝鲜

打破OpenAI束缚

打破OpenAI束缚

「小模型」的探索

对应中英文原版论文PDF，请添加官方微信 openai178 免费领取

对应中英文原版论文PDF，请添加官方微信 openai178 免费领取

对应中英文原版论文PDF，请添加官方微信 openai178 免费领取

达利欧：人工智能将颠覆日常生活最快明年面临重大变革

估值达900亿美元！传OpenAI拟出售数亿美元股票

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3660 用户在看

AI写作网站自动的生成文章可以用吗？

261 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

183 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

155 用户在看

GPT-4太烧钱，微软想甩掉OpenAI？曝出Plan B：千块GPU专训「小模型」，开启必应内测

更「精炼」的模型，必应先尝鲜

打破OpenAI束缚

打破OpenAI束缚

「小模型」的探索

对应中英文原版论文PDF，请添加官方微信 openai178 免费领取

对应中英文原版论文PDF，请添加官方微信 openai178 免费领取

对应中英文原版论文PDF，请添加官方微信 openai178 免费领取

达利欧：人工智能将颠覆日常生活 最快明年面临重大变革

估值达900亿美元！传OpenAI拟出售数亿美元股票

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

达利欧：人工智能将颠覆日常生活最快明年面临重大变革