英伟达摊上大事儿了

2024-08-05 阅读 45 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

硅谷巨头的“白月光”

当采用Blackwell架构的B100/B200芯片在GTC大会亮相后，知名华尔街投行Keybanc Capital Markets发出了一份预测：

“Blackwell芯片将推动英伟达数据中心业务的收入，从2024财年（截至2024年1月）的475亿美元增长到2025年的2000多亿美元。”

众所周知，在大模型的训练与部署中，英伟达的高性能算卡居功至伟，但BlackWell真的能凭一己之力带动业绩翻倍上涨吗？

答案是完全有可能，甚至未来五年内，硅谷巨头之间的军备竞赛，在硬件层面将完全基于Blackwell架构芯片展开。

首先需要明确的是，Blackwell并不是一种芯片，而是一个平台，可以把它看作是过去Hooper架构的延伸，但性能却实现了全方位的碾压。

在Blackwell架构的芯片上，英伟达承袭了H200上“拼装芯片”的思路，采用统一内存架构+双芯配置，将2枚GPU Die(裸晶)拼接到一个GPU上，实现192GB HBM3e内存及8TB/s显存带宽。

相较于前代产品Hooper架构GPU，Blackwell结构GPU单芯片训练性能（FP8）是Hooper架构的2.5倍，推理性能（FP4）是Hooper架构的5倍。

Blackwell架构的能耗表现也异常优秀，在GTC大会现场，黄仁勋曾提到过一个举证：

“训练一个1.8万亿参数的模型，需要8000个Hopper GPU和15MW的电力，而2000个Blackwell GPU就能完成这项工作，耗电量仅为4MW。

除了性能与功耗外，Blackwell架构真正的杀手锏是其使用了“第二代Transformer引擎”以及“第五代NVLink网络技术”。

前者通过对每个神经元使用4位而不是8位的精度，使得计算能力、带宽和模型参数规模翻倍。后者则是大幅提升了GPU集群的通信效率，最高支持多达576个GPU间的无缝高速通信,解决了万亿参数混合专家模型通信瓶颈的问题。

在科技巨头们重金押注AI、自建数据中心的今天，Blackwell架构芯片所展示出的特性，让他们实在没有理由拒绝。

不过，就是这样一个具有划时代意义的平台，很可能存在设计缺陷。

正如上文所提到的，英伟达的设计思路是将两枚Die封装在一个GPU上，来实现性能的大幅度提升，但这也带来了隐患。根据《The Information》援引知情人士的爆料，最近几周当台积电的工程师为量产做准备工作时，发现这个架构的连接处设计存在缺陷，会导致芯片的良率和产能受到较为严重的影响。

因此，原定的量产计划被终止，英伟达需要重新对Blackwell进行版图设计，而在此之后，台积电也不得再进行一轮试生产工作。

谁会受伤？

同样受这一设计缺陷影响的，可能还有同样采用Blackwell架构的英伟达RTX50系列显卡。

根据最新曝料，原本预计在今年第四季发布的Blackwell RTX 50系列，将在明年1月7-10日举办的CES 2025大展上才会发布。与B100/B200这类用于AI的高性能GPU显卡不同，RTX系列是英伟达面向游戏玩家开发的显卡序列，如果不同如期发布，所带来的负面影响同样不容小觑。

当然，最受伤的还是硅谷的互联网巨头们。

在AI热潮下，科技巨头动辄豪掷数十亿美元购买高性能计算卡也屡见不鲜，而在Blackwell问世后，这些公司似乎为其准备了更多的”弹药“。

据最新季度财报显示，微软、Alphabet、亚马逊和Meta在2024年前六个月的资本支出大幅增加。不仅如此，为了在AI军备赛中保持领先地位，这些巨头还纷纷上调了支出指引，预示着对GPU的采购需求有增无减。

而这些热钱，大部分都流向了“卖铲人”英伟达。

作为英伟达最大客户之一，微软内部定下了到 2024 年底囤积 180 万块 AI 芯片的目标，计划在明年 1 月向 OpenAI 提供采用 Blackwell 芯片的服务器。金融服务公司 DA Davidson 的分析师估计，去年微软在英伟达芯片上花费了 45 亿美元（325.6 亿元人民币），并计划在 2024 年将拥有的 GPU 数量增加两倍。

同样摩拳擦掌的还有Meta，在Blackwell于GTC大会上亮相的第二天，扎克伯格就发布声明表示，Meta计划将使用Blackwell来训练Llama模型。另据扎克伯格在今年年初的披露，Meta计划在年底前储备约60万枚高性能GPU，其中采用Hopper架构的H100芯片将占35万枚，而剩下的25万芯片，大概率会把位置留给Blackwell架构芯片。

值得一提的是，号称要自行研发AI芯片的马斯克，也对Blackwell展现出了极大的兴趣，他计划在2025年购买30万块 B200 GPU，金额高达90亿美元（652亿元人民币）。这批新GPU将升级X现有的 AI GPU 集群，该集群目前由10万块上一代H100 GPU组成。

随着下一代大模型所需算力的翻倍提升，各巨头间的算力军备竞赛又卷上了新高度，也让AI巨头对Blackwell B200的需求与日俱增，而这次英伟达出乎意料的延期，让这场看不到尽头的战争变得更加扑朔迷离。

文章来源“虎嗅”，作者·“王欣喜”

对话蔚来001号员工李天舒：《Her》里的AI会先在你的车上实现

关联网址

关联标签

#AI #大模型

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3732 用户在看

AI写作网站自动的生成文章可以用吗？

298 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

263 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

235 用户在看

英伟达摊上大事儿了

硅谷巨头的“白月光”

对话蔚来001号员工李天舒：《Her》里的AI会先在你的车上实现

Meta的Llama 3是合成数据训练？数据荒了解一下

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3732 用户在看

AI写作网站自动的生成文章可以用吗？

298 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

263 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

235 用户在看

英伟达摊上大事儿了

硅谷巨头的“白月光”

对话蔚来001号员工李天舒：《Her》里的AI会先在你的车上实现

Meta的Llama 3是合成数据训练？数据荒了解一下

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿