运行LIama2得8400万元！最快AI推理芯片成本推算引热议

2024-02-21 阅读 42 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

“每个人都在做数学”

参与到Groq成本问题讨论的，有计算机学生，也有同提供推理服务的云厂商，甚至还有Groq前员工大战现员工……好不热闹。

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

摘取几个有代表性的，我们来看看大家都是如何看待的。

首先一个粗略估计，一张卡的价格约为2万美元，内存又仅为0.23GB。

那么为单个LLama 70B模型服务，就需要购买大约320张卡（实际上更多），包括服务器在内大约花费1千万美元……

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

而要是跟英伟达的H100对比，情况又是如何？

Lepton的贾扬清也参与进来，算了一笔账。除了基本价格，他还从能源功耗、性能、运营成本等角度进行了分析。

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

最终总结出这几个核心观点：

对于LLaMA 70b模型，使用572张卡来计算，每年电费将花费25.4万美元；
使用4张H100卡可以实现Groq一半的性能，如今8卡H100盒子的价格约为30万美元。
如果运营三年，Groq 的硬件采购成本为1144万美元，运营成本为76.2万美元。相比起来H100采购和运营成本更低。

值得一提的是，在Groq给出的基准测试中，也包括了Lepton在内，推理速度大概是Lepton的三倍。

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

贾扬清还透露，他跟Groq创始人是旧相识了：

在谷歌时就相互知道。

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

不过在这些讨论中，也有其他算法。

比如有网友反应，按照单个Token价格这个维度来计算，情况又是如何呢？

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

没关系，还有更专业的分析师会出手。

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

不过根据他的计算，每100万Tokens的花费，Groq性价比是要高一些。

除此之外，还有一些其他的讨论，像是否支持加速任何Transformer？

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

Groq在线答疑

由于大家过于关注，Groq忍不住亲自下场解答。

是时候再发一个常见问题帖子来澄清了。

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

主要有以下几点：

采用开源模型，适应我们的编译器，然后运行它，仅此而已。
我们token价格很实惠很高效，因为从芯片到系统都自己搞，没有中间商；
不会出售芯片，但第三方供应商除外；公布的销售数据有偏差。
我们的目标客户不是单卡用户。

另外还在持续地在线答疑中……

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

所以Groq是否能真的撼动住英伟达的地位，估计还得再等一等。

不过昨天英伟达股价倒是异动了一波……

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

参考链接：

[1]https://twitter.com/GroqInc/status/1760113134566576558

[2]https://twitter.com/swyx/status/1760065636410274162

[3]https://news.ycombinator.com/item?id=39428880

[4]https://twitter.com/JayScambler/status/1759372542530261154

[5]https://twitter.com/DZhang50/status/1759839771487297637

文章来自于微信公众号“量子位”（ID: QbitAI)，作者 “白交”

Karpathy新视频又火了：从头构建GPT Tokenizer

关联网址

关联标签

#AI #大模型

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3732 用户在看

AI写作网站自动的生成文章可以用吗？

297 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

262 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

233 用户在看

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

“每个人都在做数学”

Groq在线答疑

文章来自于微信公众号“量子位”（ID: QbitAI)，作者 “白交”

Karpathy新视频又火了：从头构建GPT Tokenizer

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3732 用户在看

AI写作网站自动的生成文章可以用吗？

297 用户在看

AI批改英语作文，质量和数量都完爆人类老师改卷

262 用户在看

科大讯飞AI会议记录，让你丢掉纸笔，开会再也不焦虑

233 用户在看

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

“每个人都在做数学”

Groq在线答疑

文章来自于微信公众号“量子位”（ID: QbitAI)，作者 “白交”

Karpathy新视频又火了：从头构建GPT Tokenizer

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿