英特尔突袭英伟达H100，新AI芯片训练快40%，推理快50%，CEO蹦迪庆祝

2024-04-10 阅读 45 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

硬刚英伟达的Gaudi 3

英特尔表示，Gaudi 3已经在Llama上做了测试，可以有效地训练或部署AI大模型，包括文生图的Stable Diffusion和语音识别的Whisper等等。

英特尔突袭英伟达H100，新AI芯片训练快40%，推理快50%，CEO蹦迪庆祝

在现场，基辛格也展示了集成最新英特尔芯片的AI PC，能够快速处理的多项任务，例如快速处理邮件：

英特尔突袭英伟达H100，新AI芯片训练快40%，推理快50%，CEO蹦迪庆祝

再如语音处理：

英特尔突袭英伟达H100，新AI芯片训练快40%，推理快50%，CEO蹦迪庆祝

以及图像渲染：

英特尔突袭英伟达H100，新AI芯片训练快40%，推理快50%，CEO蹦迪庆祝

英特尔演示操作的同事还非常调皮地展示了用AI PC生成的卡通版基辛格：

英特尔突袭英伟达H100，新AI芯片训练快40%，推理快50%，CEO蹦迪庆祝

据了解，Gaudi 3采用5纳米工艺制造，与历代Gaudi其它性能上的具体对比，如下表所示：

英特尔突袭英伟达H100，新AI芯片训练快40%，推理快50%，CEO蹦迪庆祝

英特尔表示，Gaudi 3芯片将在今年的第三季度向客户大规模提供，包括戴尔、惠普和超微电脑在内的公司将使用该芯片。

至于具体的价格，目前英特尔方面还并未透露。

不过更令人意外的是，Gaudi 3还只是在这次英特尔Vision活动中发布的产品之一。

Xeon，步入第六代

没错，去年年底英特尔刚刚上市第五代Xeon，仅时隔数个月，第六代Xeon又来了！

（英特尔这次还真没有挤牙膏）

在现场，基辛格还亲切地叫它“little baby”：

英特尔突袭英伟达H100，新AI芯片训练快40%，推理快50%，CEO蹦迪庆祝

第六代Xeon包含两种架构，分别是Sierra Forest和Granite Rapids。

Sierra Forest基于英特尔更小、低功耗的E-cores，而Granite Rapids则由更大但性能更高的P-cores 组成。

基辛格在现场称二者像双胞胎：

英特尔突袭英伟达H100，新AI芯片训练快40%，推理快50%，CEO蹦迪庆祝

更具体而言，Sierra Forest架构的英特尔Xeon 6处理器，其机架密度提高2.7倍。

客户能以近3:1的比例替换旧系统，大幅降低能耗，帮助其实现可持续发展目标。

而Sierra Forest架构的英特尔Xeon 6处理器包含了对MXFP4数据格式的软件支持。

与使用FP16的第四代Xeon处理器相比，可将下一个token的延迟时间最多缩短6.5倍，能够运行700亿参数的Llama-2模型。

英特尔突袭英伟达H100，新AI芯片训练快40%，推理快50%，CEO蹦迪庆祝

至于英特尔Xeon 6处理大模型的速度到底有多快，基辛格做了更加直接的对比。

他将第四代、第五代和最新的第六代Xeon放到了一起，来了一个现场速度的大比拼。

英特尔突袭英伟达H100，新AI芯片训练快40%，推理快50%，CEO蹦迪庆祝

从直观的生成速度来看，第六代Xeon明显要比“前任们”快上许多。

具体到精确的延时数值，第六代Xeon运行Llama 2 70B只有82ms。

英特尔突袭英伟达H100，新AI芯片训练快40%，推理快50%，CEO蹦迪庆祝

同等条件下，第六代Xeon与“前任们”的延时数值对比如下：

英特尔突袭英伟达H100，新AI芯片训练快40%，推理快50%，CEO蹦迪庆祝

据了解，Sierra Forest架构的第六代Xeon处理器将于今年第二季度推出。

网友揭秘英特尔“秘方”

这场硬刚英伟达的发布会，同样也激起了不少网友们的热议。

例如Gaudi 3封装的一处细节，即使用HBM2e存储芯片，有网友对此表示惊讶：

他们使用的是HBM2e，这是英伟达A100在2020年使用的。

而最先进的HBM3e英特尔原本也计划采用，但很可能因为供应不足，这次没能抢到足够的订单。

英特尔突袭英伟达H100，新AI芯片训练快40%，推理快50%，CEO蹦迪庆祝

对此，这位网友进一步表示：

这是英特尔的秘方之一。

他们总能靠旧技术赶上/超越新技术，直到当前的技术在生产、获取和集成上变得更容易。

实际上，制造优势也是英特尔在半导体领域的关键优势之一，作为半导体产业的开创者之一，英特尔几乎拥有芯片产业的所有资源和要素能力。

但何时能够和英伟达全面一较高下？这也是不少网友关注的问题：

这次英特尔硬刚的是H100/H200，那什么时候可以对标英伟达最新的“核弹”B200？

或许答案只有交给时间来回答。

但无论如何，英特尔此次的发布，确实是给AIGC时代的算力，多提供了一项“快好省”的选择。

参考链接：

[1]https://www.anandtech.com/show/21342/intel-introduces-gaudi-3-accelerator-going-bigger-and-aiming-higher

[2]https://www.servethehome.com/intel-vision-2024-keynote-live-coverage/

[3]https://news.ycombinator.com/item?id=39981032

文章来源公众号“量子位”，作者“金磊假装”

谷歌最强大模型免费开放了！长音频理解功能独一份，100万上下文敞开用

关联网址

关联标签

#AI #大模型

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3735 用户在看

AI写作网站自动的生成文章可以用吗？

300 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

265 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

238 用户在看

英特尔突袭英伟达H100，新AI芯片训练快40%，推理快50%，CEO蹦迪庆祝

硬刚英伟达的Gaudi 3

Xeon，步入第六代

网友揭秘英特尔“秘方”

文章来源公众号“量子位”，作者“金磊假装”

谷歌最强大模型免费开放了！长音频理解功能独一份，100万上下文敞开用

7B超越百亿级，北大开源aiXcoder-7B最强代码大模型，企业部署最佳选择

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3735 用户在看

AI写作网站自动的生成文章可以用吗？

300 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

265 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

238 用户在看

英特尔突袭英伟达H100，新AI芯片训练快40%，推理快50%，CEO蹦迪庆祝

硬刚英伟达的Gaudi 3

Xeon，步入第六代

网友揭秘英特尔“秘方”

文章来源公众号“量子位”，作者“金磊 假装”

谷歌最强大模型免费开放了！长音频理解功能独一份，100万上下文敞开用

7B超越百亿级，北大开源aiXcoder-7B最强代码大模型，企业部署最佳选择

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

文章来源公众号“量子位”，作者“金磊假装”