大模型推理成本降10倍、速度快20倍，AI Infra公司「趋境科技」在推理端开创模型落地新路径

2024-08-20 阅读 53 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

“推理端的优化，天花板比训练端更高”

AI Infra的主要优化方向，是模型的训练和推理过程。

大模型训练，包括参数调优、数据训练等环节，让模型具备执行相应任务的能力。2023年，在大炼模型的背景下，目前主流的Infra玩家，比如大厂、硅基流动和潞晨科技，都位于训练优化这一层，帮助下游客户提高训练效率、降低训练成本。

趋境科技告诉《智能涌现》，随着模型架构逐渐收敛于Transformer及其变种，训练优化的技术壁垒和提升空间正在缩小。事实上，大多数模型的算力利用率（MFU）已经超过50%，而领先企业与开源框架之间的差距也不超过10%。

相比之下，推理端的优化则蕴含更大的潜力。趋境科技团队表示，推理过程直接影响到模型在实际应用中的决策和任务执行能力，决定了AI技术能否真正为企业带来实际价值。

2023是模型训练的元年，2024年则是模型推理的元年。随着AI应用场景的多样化，推理端的优化空间更为广阔而富有挑战，这正是趋境科技决定在此时入场的原因。

趋境科技原创的推理端优化路径，是名为“以存换算”的思路。通过将历史知识进行模块化预处理，同时将其处理的中间结果提前缓存，在实际的使用过程中仅需少量计算即可响应用户需求。

这一方案能够将RAG（检索增强生成）场景下的推理成本降低10倍，响应时延降低20倍。

先瞄准大模型应用最广泛的场景：RAG（检索增强生成）

具体到落地场景，B端客户的RAG（检索增强生成），是趋境科技Infra主要瞄准的领域。

看起来高深的RAG，其实是时下大模型应用最为广泛的一个场景。所谓的RAG，就像是给大模型外挂了一个专业数据库，当大模型需要处理复杂的专业任务时，就会优先检索相关数据，从而显著提高响应速度和准确性。常见的知识库问答系统、智能客服等领域，都离不开RAG。

而从RAG场景切入的原因在于，一方面，RAG为后续产品规模化提供了一个广阔的市场，据陈超介绍，RAG在大模型落地场景的占比，达到了70%左右。

另一方面，趋境科技仍处于建立品牌认知阶段，从大场景切入，有助于客户建立品牌认知。

在这一场景下，趋境科技为B端客户提供的解决方案是一套集成了芯片、大模型等软硬件的AI知识库推理一体机。

这个端到端的解决方案采用了趋境科技原创的“以存换算”思路。与此同时，根据客户的具体需求，该方案通过组合不同厂商的芯片、模型，提供最低成本的部署选项。

下一个模型大规模落地的场景是什么？趋境科技给出的答案是：多模态RAG。团队告诉《智能涌现》，无论是图像识别还是语音交互，多模态技术都将在企业业务中扮演不可或缺的角色。目前，趋境科技已经开始布局该领域，预计明年将推出多模态RAG解决方案。

以下是两位发起人的评价：

趋境科技发起人、真知创投创始人兼董事长任旭阳表示：

趋境科技另辟蹊径采用“以存换算”的技术路径，大幅降低大模型部署成本的同时显著提升性能，为大模型应用的快速普及铺平道路。真知创投携手清华系顶尖技术团队联合创立趋境科技。我们期待这支“企业家+科学家”的 AI Infra团队能够持续引领创新，帮助企业以前所未有的低成本和高效率应用大模型！

趋境科技发起人，清华大学计算机科学与技术系长聘教授、IEEE Fellow 武永卫表示：

大模型正在深刻变革信息供给的模式，同时我们也面临核心计算硬件的高墙壁垒，从计算机系统的角度出发，通过软硬协同的存算平衡设计，大幅提升给定计算硬件的效能是一条破局之路。趋境科技以计算机系统创新为切入点，专注于大模型推理应用的极致效能，值得期待。

文章来源“ 智能涌现“，作者” 智能涌现“

终于有AI会主动追问了，百度这个设计不错

关联网址

关联标签

#AI #AI技术 #大模型

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3734 用户在看

AI写作网站自动的生成文章可以用吗？

300 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

265 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

238 用户在看

大模型推理成本降10倍、速度快20倍，AI Infra公司「趋境科技」在推理端开创模型落地新路径

“推理端的优化，天花板比训练端更高”

先瞄准大模型应用最广泛的场景：RAG（检索增强生成）

终于有AI会主动追问了，百度这个设计不错

智能体工作流开源项目大盘点，20个项目轻松构建Agentic Workflow

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3734 用户在看

AI写作网站自动的生成文章可以用吗？

300 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

265 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

238 用户在看

大模型推理成本降10倍、速度快20倍，AI Infra公司「趋境科技」在推理端开创模型落地新路径

“推理端的优化，天花板比训练端更高”

先瞄准大模型应用最广泛的场景：RAG（检索增强生成）

终于有AI会主动追问了，百度这个设计不错

智能体工作流开源项目大盘点，20个项目轻松构建Agentic Workflow

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿