又有一家 ” 清华系 ” 前沿芯片创企浮出水面。

本月初,国内 Chiplet 芯片设计创企北极雄芯宣布完成新一轮超亿元融资。这是继去年 10 月获得 1.5 亿元天使轮融资后,北极雄芯拿下的又一笔亿级融资。韦豪创芯、中芯熙诚、讯飞创投、丰年资本、正为资本均在其股东阵容。

这家 2021 年 7 月成立的年轻创企,在今年 2 月推出了国内首款基于异构 Chiplet 集成的智能处理芯片 ” 启明 930″,成为国内第一家流片成功 Chiplet 异构集成 AI 芯片的公司。

清华孵出一家Chiplet黑马!连拿亿级融资,首款AI芯片已跑通,ZAKER对话创始人

▲启明 930 实物(左)、启明 930 板卡(右)

北极雄芯的创始人、首席科学家马恺声,是清华大学交叉信息研究院助理教授、博士生导师。图灵奖得主、中科院院士、清华大学交叉信息研究院院长姚期智,现任北极雄芯的首席科学顾问。

过去四年,马恺声带领团队在架构拆分设计、高速互联接口、国产供应链封装等各项 Chiplet 基础技术研发层面取得了一系列成功。

英伟达 A100、AMD MI300、特斯拉 D1、苹果 M1 Ultra 等经典 AI 芯片产品均采用了 Chiplet 架构。基于 Chiplet 架构的高性能解决方案,能够有效降低云边端 AI 芯片的设计门槛,潜在市场规模巨大。而马恺声对此积累颇深。

近日,芯东西与这位国内 Chiplet 领域的前沿学者进行了一场深度对话,不仅回顾了其如何前瞻性地选择在 Chiplet 赛道创业,还解读了北极雄芯背后的核心技术积累。

01.

用 Chiplet 架构解决行业痛点

三年积累迎来产业风口

马恺声与 Chiplet 的缘分,是在加入清华后开始的。

2018 年,从宾夕法尼亚州立大学毕业后,马恺声进入清华大学交叉信息核心技术研究院,成为其中除量子芯片外主攻应用芯片研发的 ” 第一人 “。在这里,众多专家专注于研究 AI 在不同行业的应用,所涉及的场景及算法差异性极大,而马恺声负责底层硬件支持。” 按照每 2-3 年做一款 AI 芯片的进度,我得做几十年。” 马恺声说,这样的研发速度,对于飞速发展的 AI 行业而言,只能是杯水车薪。

恰巧在这时,电动汽车的滑板底盘技术给了他灵感。

所谓滑板底盘,就是将电动车的制动、悬架、电动传动、电池等部件以模块化形式集成,这样不同车型可以根据需求组装相应模块。

无独有偶。苏州芯片创企贝塔微打造的工具,可以低成本快速批量生产芯片,与半导体产业头部玩家德州仪器的电源管理芯片 DC-DC、AC-DC 抢市场。

在这些启发下,马恺声开始集中琢磨一个问题:怎么能快速、低成本的做芯片,还能满足 AI+ 各行各业的需求

Chiplet,就这样闯进了马恺声的研究主线。

Chiplet 常被译为 ” 芯粒 “、” 小芯片 “,通过将一整颗 SoC 的功能模块解耦,分别设计制造采用不同制程工艺的 chiplets,再通过 2.5D/3D 先进封装技术集成在一起。这种异构集成的设计理念,不仅有助于降低芯片研发成本,而且能够有效缓解各行业算力需求方在差异化需求、性能、成本、算法迭代周期、供应链保障等各方面的核心痛点。

清华孵出一家Chiplet黑马!连拿亿级融资,首款AI芯片已跑通,ZAKER对话创始人

嗅到巨大商业价值后,2019 年,马恺声意气风发地率领团队投入 Chiplet 研发。

早期依托于西安交叉信息核心技术研究院的孵化支持,团队完成了启明 910、启明 920 等几代 AI 加速模块的研发;2021 年 7 月,北极雄芯公司成立并获得图灵创投、SEE Fund、红杉等天使轮投资,马恺声正式踏上创业之路。

2022 年初,Intel、AMD 等国际半导体产业巨头成立 Chiplet 产业联盟发布 UCIe 1.1 规范,Chiplet 在市场上的关注度渐起。

一切开始步入正轨。

02.

主攻云边端 AI 推理

智能驾驶成重点突破口

理想很丰满,现实却很骨感。

” 在芯片领域,大家都很保守,你不把(产品)跑通,客户看不到产品就会选择观望,不会贸然采用 Chiplet 路线。” 马恺声说。

实际操作中,不同场景的需求并不收敛,如何在不同场景的硬件需求中找到最大交集?如何有效的解耦其中共性的部分以及差异化的部分?这是做 Chiplet 无法绕开的一大难题。

带着这样的思考,马恺声联合团队深挖潜在客户需求,综合考虑 Chiplet 的技术特性和经济效益后,北极雄芯将选择先从云边端 AI 推理入手AI 加速智能驾驶为重点场景突破口,先做出具有代表性的 Chiplet 架构芯片,再通过方案授权或联合研发等方式向其它行业拓展。

清华孵出一家Chiplet黑马!连拿亿级融资,首款AI芯片已跑通,ZAKER对话创始人

▲ Chiplet 技术演示(图源:北极雄芯官网)

例如在智能驾驶领域,单一芯片很难同时兼顾不同档次车型在产品差异化、迭代周期、成本控制上的需求;AI 推理加速方面,市场对高性能算力的需求将从 ” 通用化 ” 向 ” 专用化 ” 转变。这些趋势都与 Chiplet 架构将大型 SoC 芯片的模块拆分成芯粒的技术路线相契合。

” 无论是人工智能服务器,还是智能驾驶高性能计算平台,我们看到的均是千亿级别的潜在市场,并且认为 Chiplet 架构在其中能够提供独特的商业价值。” 马恺声对 Chiplet 的商业价值及市场前景非常乐观。

03.

两年半跑通首颗 Chiplet 芯片

筑起三大核心技术壁垒

从设计、制造、互联、封装、工具链等全部跑通,在这件事上,我们应该是国内第一家。” 马恺声谈道

今年 2 月,北极雄芯发布了首个基于 Chiplet 架构的 ” 启明 930″ 芯片,可用于 AI 推理、工业智能等不同场景

清华孵出一家Chiplet黑马!连拿亿级融资,首款AI芯片已跑通,ZAKER对话创始人

启明 930 基于 12nm 工艺,采用了北极雄芯自研的第三代 “MUSE” 核心架构 NPU,搭配北极雄芯构筑的完整算法、编译、软件工具链体系,使得自研 NPU 在主流 AI 模型应用上的平均芯片利用率超过 70%

清华孵出一家Chiplet黑马!连拿亿级融资,首款AI芯片已跑通,ZAKER对话创始人

这是首个基于 Chiplet 异构集成并完成流片及国产封装全链路成功验证的高性能计算 SoC,中央控制芯粒采用 RISC-V CPU 核心,同时可通过高速接口搭载多个功能型芯粒,做到 8~20T 的算力灵活拓展,支持主流 AI 算子。

目前,启明 930 已与多家 AI 下游场景合作伙伴进行测试。

由于基于全国产基板材料以及 2.5D 封装,启明 930 的成本更加可控。北极雄芯还提供了与其芯片配套的基础驱动、框架支持、应用层全栈式的应用部署工具。

清华孵出一家Chiplet黑马!连拿亿级融资,首款AI芯片已跑通,ZAKER对话创始人

” 把十几个小芯粒封装在一起,并且部署相应的任务,这块芯片能跑通,是一个非常复杂的工程。” 马恺声感慨道,” 如何在架构定义层面进行纵向拆解?需要支持哪些算法?在哪个模块做?IP 如何集成?如何实现高速互联通讯?如何解决应力问题?如何解决供电散热材料?” ……最后,北极雄芯联合将近10 家厂商一起才跑通了启明 930。

据他回忆:” 启明 930 从研发、流片、回片,折腾了将近两半年的时间。”,因为之前从未有人完整的在国产供应链跑通全部。

在这背后,北极雄芯积累了三大核心技术。

一是 ““,明确 Chiplet 的拆解与定义;二是 ““,解决 Chiplet 的互连与通信;三是 ““,负责 Chiplet 与封装优化。

其中,基于芯粒划分方法学,能降低跨芯粒数据通信负担;采用低 ” 芯粒税 ” 的架构定义,可以降低芯粒化带来的面积负担;内部 Chiplet-Actuary 成本模型,能实现高性价比复用。

清华孵出一家Chiplet黑马!连拿亿级融资,首款AI芯片已跑通,ZAKER对话创始人

▲北极雄芯对于 Chiplet 的拆解与定义

北极雄芯自主研发的 PBLink D2D 互连接口,能实现高速高带宽与低延时的芯粒通信,同时符合国内《芯粒互联接口标准》及车规级 D2D 接口标准。

在封装方面,为了促进供应链国产化,低线数的 PBLink D2D 接口可以满足国内基板的层数要求(≤ 8 层),多芯粒与封装协同布局同步优化封装利用率等。

04.

预告芯片量产路线图

下一代 Chiplet 产品正在紧密研发

基于产学研结合的多年积累,北极雄芯已经完成了首个基于 Chiplet 异构集成芯片的试生产验证,并向下游客户交付了首个隐私安全计算芯粒产品。

北极雄芯也陆续与经纬恒润、海星智驾、山东云海国创等多家下游场景方达成战略合作,致力于共同推动 Chiplet 在智能驾驶、AI 服务器等各行业场景的应用。

马恺声认为,Chiplet 的市场发展已经很清晰,他预计到 2030 年,超过一半的高性能 AI 计算芯片以及智能驾驶相关主控芯片均会采用 Chiplet 架构。

市场研究机构 Omdia 的数据也显示,到 2024 年 Chiplet 的市场规模将达到 58 亿美元,2035 年市场规模将进一步扩大到 570 亿美元。

目前北极雄芯正投入下一代高性能通用型芯粒以及 AI 计算芯粒的研发。据马恺声透露,其下一代产品预计将于2024 年回片测试成功并开始小规模量产,预计将率先在部分高性能计算、商专车、低速无人驾驶等场景实现小批量使用,并按节奏逐步进入乘用车智能驾驶领域。

面向未来,当下蓬勃发展的大模型机器人产业,也让马恺声看到了 Chiplet 落地应用的诸多机遇。

不同于此前人形机器人的传统控制算法,现在人形机器人采用端到端控制,基于模型输出电机怎么转的指令。

这样一来,机器人的每个自由度都是一个电机,每个电机都需要一套模型,模型的计算速度要更快,才能让机器人收到反馈、做指令更灵活。

此外,大模型包含训练和推理的需求,可能两年之后,随着产业发展较为成熟,推理需求将进一步被释放出来。

在这些机遇中,基于国内尚有差距的供应链、工艺等,如何做出高性价比的系统,是北极雄芯要做的事。这些拥有巨大潜力的应用场景的出现,也为马恺声继续探索 Chiplet 增添了更多动力。

05.

拆解 Chiplet 发展三大拦路虎

发布国产供应链 Chiplet 互联标准

对于国内 Chiplet 发展面临的挑战,马恺声重点谈及三个环节。

首先是生产制造环节,如何尽可能基于国内自主可控的供应链实现 Chiplet 芯片的量产,摆脱受制于国外先进制程的枷锁,用国内成熟制程工艺技术实现满足需求的性能。

其次是如何拆分芯片模块,并通过不同工艺制程生产,使其商业化达到最优。

还有封测环节,国内封装基本材料与国外存在差距,先进封装的量产成本高,因此做 Chiplet 既要考虑通过国产封装供应链来优化芯粒、接口设计,还要考虑成本。

难题摆在眼前,北极雄芯也在积极推进 Chiplet 接口标准的制定。

早在 2020 年,其团队即与国内上下游共同建立了中国 Chiplet 产业联盟(CCLL),专注于 Chiplet 架构在各领域应用的前沿探索。今年年初,交叉信息核心技术研究院牵头、中国 Chiplet 产业联盟共同起草的《芯粒互联接口标准》ACC 1.0 高速串口标准《车规级芯粒互连接口标准》ACC_RV 1.0正式发布。

清华孵出一家Chiplet黑马!连拿亿级融资,首款AI芯片已跑通,ZAKER对话创始人

相比于 UCIe 标准,ACC 标准更关注针对国产供应链的优化,适合对供应链自主可控程度要求高、量产成本敏感的下游领域,能满足其商业落地的需求。

马恺声坦言,虽然UCIe 已经发布一段时间,但市场上至今还没有相对成熟的支持所有频点的满足标准的产品,而真正下场做各个 ” 芯粒 ” 的企业更是寥寥无几

他认为,标准应该先让大家能用起来,基于各场景的真实商业需求以及国内相关供应链的完备程度来制定标准。往后看,北极雄芯计划进一步投入高速互联芯粒接口等 Chiplet 基础技术的研发。

在这个过程中,他将 Chiplet 的发展和工艺进步看作 ” 正交 ” 关系,在工艺制程发展受光刻机等关键设备及半导体材料制约的情况下,接下来 10-15 年内,Chiplet 或许会贡献出不一样的东西。

06.

结语:高性能计算 Chiplet 需求渐起

国内新生势力挑起大梁

北极雄芯希望在 Chiplet 产业中扮演怎样的角色?马恺声用一句话加以概括:” 北极雄芯希望基于国产化的供应链,用最大的自主可控程度,做出不错的系统应用。”

如今北极雄芯的核心研发团队,已经聚集了有中兴、华为、紫光、英特尔、Cadence、Marvell 等国内外知名半导体企业背景,拥有不同工艺多款芯片成功流片经验的一批芯片人才。

随着系统级芯片集成进入后摩尔时代,加上国内先进制程供应受阻,基于 Chiplet 的创新思路成为国内半导体产业发展的重要途径。在时代浪潮中,北极雄芯致力于成为基于 Chiplet 架构定制化高性能计算解决方案的领航者,从 AI 在各领域落地的实际应用需求出发,协助各行业 ” 用小芯片,做大芯片 “。

文章转载自ZAKWER,作者程茜

关联网址

关联标签

文章目录

发评论,每天都得现金奖励!超多礼品等你来拿

后,在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则
暂无评论...