网易首页 > 网易号 > 正文 申请入驻

老黄200亿「钞能力」回应谷歌:联手Groq,补上推理短板

0
分享至

Jay 发自 凹非寺量子位 | 公众号 QbitAI

老黄稳准狠,谷歌的TPU威胁刚至,就钞能力回应了。

200亿美元说砸就砸,只为拉拢一家炙手可热的「铲子新工厂」——Groq

这无疑也标志这家芯片巨头,面向AI新时代的一次重大布局。但在某种程度上,也的确反映出老黄对包括TPU在内等一众新芯片范式的担忧。

所以,Groq究竟能为英伟达带来什么?

针对这个问题,知名科技投资人Gavin Baker发表了自己的观点。

而他的这一连串技术剖析,纷纷指向了英伟达帝国防守最薄弱的那块领土——推理

  • 推理方面,Groq LPU的速度远超GPU、TPU,以及目前所见的任何ASIC。



这一观点得到大量网友点赞:

  • GPU架构根本无法满足推理市场对低延迟的需求,片外HBM显存速度实在太慢了。



但也有网友指出,LPU所采用的SRAM,或许并不能胜任长下文decode。

对此,Gavin认为英伟达可以通过产品「混搭」的方式解决。



下面具体来看——

Groq:英伟达斥200亿美元购入的一剂疫苗

Gavin认为,GPU在新时代水土不服的根本原因在于——推理过程的两个阶段,prefill和decode,对芯片能力有截然不同的要求。

先看prefill:

这一步,简单来说就是让模型「读题」,把用户提供的关键信息在脑子里记好,用于后续调用。

读题过程中,模型会一次性吃下用户所给的上下文,所有输入token都可以同时计算。

这正是GPU最擅长的舞台,其为图形处理而生,可以一次性计算数千个像素,天生适合处理并行任务。

在这个准备阶段,模型不用急着响应用户问题。即便有延迟,模型也完全可以通过显示「思考中」来掩盖等待时间。

因此,相比「速度」,prefiil需要芯片有更大的上下文容量。

但到了decode,这套逻辑不再适用。

decode是串行任务,必须得一个一个token挨着算。更重要的是,用户还会亲眼看到token被一个个「打」出来的过程。这种情况下,延迟对用户体验来说是致命的。

然而,GPU的数据主要存放在HBM,而不是紧贴算力核心的片上存储。这意味着,每生成一个token,GPU都需要重新从内存中读取数据。

这时候,GPU的问题就暴露出来了——大部分算力都处于闲置,FLOPs根本用不满,常常在等内存把数据搬过来,实际计算量远小于prefill。



相比之下,Groq有更好的解决方案——LPU

比起HBM,LPU使用直接集成在芯片硅片中的SRAM。这种片上存储的模式不需要读取数据,这让其速度比GPU快100倍。即使只处理单个用户,它也能跑出每秒300–500个token的速度,并能始终保持满负荷运转。

事实证明,在速度这一块,LPU几乎打遍天下无敌手——不仅是GPU,就连TPU,以及市面上绝大多数ASIC都难以望其项背。

但这并非没有代价的。

相比GPU,LPU的内存容量小的多。单颗Groq的LPU芯片,片上SRAM只有230MB。

作为对比,即便是英伟达的H200 GPU,也配备了高达141GB的HBM3e显存。

结果就是:你必须把成百上千颗LPU芯片连在一起,才能跑起一个模型

以Llama-3 70B为例,用英伟达GPU的话,只需要两到四张卡,塞进一个小型服务器盒子里就能搞定。而同样的模型,需要数百颗LPU,占地面积也将远大于使用GPU的数据中心。

这意味着,即便单颗LPU价格更低,整体硬件投资依然会非常巨大。

因此,AI公司在考虑LPU时,最重要的问题是——

用户是否愿意为「速度」付费?



对于这个问题,一年前的市场还不无法给出答案。但从Groq如今的业绩情况来看已经非常明确:「速度」是个真实存在的巨大需求,并且仍在高速成长

而对英伟达而言,这不仅是一个新的业务盘,更是一个颠覆者暗流涌动的高风险地带。倘若错失这个风口,英伟达在AI时代的机会可能会被新玩家颠覆,就像英伟达当年通过游戏业务颠覆其他竞争对手一样。

为了抵抗这些竞争者蚕食自己的护城河,英伟达选择注射名为Groq的疫苗。希望通过人才收购引入新血液,补齐这块低延迟场景的推理短板,帮助英伟达这艘巨舰摆脱创新者窘境。

「铲子」进入新时代

TPU的崛起,给英伟达的金钟罩撕开了一道裂缝。

通过自研芯片,谷歌成功摆脱了对英伟达天价GPU的依赖,这在很大程度上帮助谷歌削薄了训练和推理成本,这让谷歌在服务大量免费用户的情况下,依然能维持相当健康的财务账面。

谷歌通过Gemini 3 Pro的绝地翻盘,证明了GPU并非AI时代的唯一解。在技术周期高速迭代的背景下,作为AI「心脏」的芯片,也需要根据不同的发展阶段做出相应的调整。

随着基础模型的进展放缓,AI竞争的重点开始从训练层转向应用层。而在AI应用市场,「速度」对用户体验而言至关重要。

而这次人才收购Groq,虽然也是变相承认了公司在推理赛道的不足,但同样标志着英伟达帝国的又一次扩张。

称霸预训练的英伟达,这次要借Groq的东风,入局竞争对手喷涌而出的「推理大陆」。

而在这个新市场,英伟达或许不再能像如今这样风光。

正如Groq CEO所言,推理芯片是项高销量、低利润的苦活。这与即便炒到天价也有客户抢着要,毛利率高达70-80%的GPU截然不同。


[1]https://x.com/gavinsbaker/status/2004562536918598000
[2]https://www.uncoveralpha.com/p/the-20-billion-admission-why-nvidia

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
广东大哥吐槽河南媳妇做饭菜像闹饥荒,网友笑喷了:有得吃就行

广东大哥吐槽河南媳妇做饭菜像闹饥荒,网友笑喷了:有得吃就行

金汐
2026-01-23 01:07:48
特朗普:美国正调集重兵前往伊朗

特朗普:美国正调集重兵前往伊朗

界面新闻
2026-01-23 13:11:44
从千年名茶到化学试剂:我们的茶叶怎么了?

从千年名茶到化学试剂:我们的茶叶怎么了?

富贵说
2026-01-21 11:19:58
“底薪3000元24小时待岗”,32岁程序员周末猝死,妻子:若时光倒流,一定逼他辞职!公司去年三季报净利润8.67亿元

“底薪3000元24小时待岗”,32岁程序员周末猝死,妻子:若时光倒流,一定逼他辞职!公司去年三季报净利润8.67亿元

每日经济新闻
2026-01-22 22:43:06
泽连斯基批评国际社会对伊朗袖手旁观:政权杀够人就能继续掌权

泽连斯基批评国际社会对伊朗袖手旁观:政权杀够人就能继续掌权

桂系007
2026-01-22 23:58:04
特朗普警告欧洲:若抛售美国资产,将面临大规模报复;格陵兰岛协议将赋予美方“全面军事进入权”,且不会支付费用

特朗普警告欧洲:若抛售美国资产,将面临大规模报复;格陵兰岛协议将赋予美方“全面军事进入权”,且不会支付费用

每日经济新闻
2026-01-23 00:03:02
国运到了!中方拿下50亿吨价值24000万亿全球最大铁矿,澳铁矿牌废了

国运到了!中方拿下50亿吨价值24000万亿全球最大铁矿,澳铁矿牌废了

芯火相承
2026-01-22 19:03:47
刚刚,杨兰兰本人澳洲出庭!正式低头承认!

刚刚,杨兰兰本人澳洲出庭!正式低头承认!

澳洲红领巾
2026-01-23 11:40:24
没有阳刚之气就别演“大侠”,《镖人》中谢霆锋,给内娱上了一课

没有阳刚之气就别演“大侠”,《镖人》中谢霆锋,给内娱上了一课

糊咖娱乐
2026-01-22 11:48:48
女子在丈夫瘫痪期间另交男友并怀孕,要求离婚,丈夫不同意!离婚官司开打,岳父竟是女婿的代理人……

女子在丈夫瘫痪期间另交男友并怀孕,要求离婚,丈夫不同意!离婚官司开打,岳父竟是女婿的代理人……

环球网资讯
2026-01-23 08:26:52
一夜之间!金饰1克突破1500元

一夜之间!金饰1克突破1500元

南方都市报
2026-01-23 11:02:43
你有刷新你三观的亲戚吗?网友:所以啊,本零零后断亲是必然的

你有刷新你三观的亲戚吗?网友:所以啊,本零零后断亲是必然的

带你感受人间冷暖
2025-12-22 00:05:14
河南开封万岁山一NPC演员雪中静立被误以为是假人,景区:有保暖措施,期间会安排换班

河南开封万岁山一NPC演员雪中静立被误以为是假人,景区:有保暖措施,期间会安排换班

台州交通广播
2026-01-22 23:24:46
马克西绝杀上篮遭杜兰特封盖,但回放显示应是干扰球

马克西绝杀上篮遭杜兰特封盖,但回放显示应是干扰球

懂球帝
2026-01-23 11:13:11
一坐高铁就犯困?有旅客称系二氧化碳浓度超标,铁路客服回应

一坐高铁就犯困?有旅客称系二氧化碳浓度超标,铁路客服回应

中国能源网
2026-01-23 09:13:04
怪不得委内瑞拉的代总统这么配合美国,原来人家也得到了实惠!

怪不得委内瑞拉的代总统这么配合美国,原来人家也得到了实惠!

青青子衿
2026-01-23 01:25:07
央行:为保持银行体系流动性充裕,2026年1月23日,中国人民银行将以固定数量、利率招标、多重价位中标方式开展9000亿元MLF操作,期限为1年期

央行:为保持银行体系流动性充裕,2026年1月23日,中国人民银行将以固定数量、利率招标、多重价位中标方式开展9000亿元MLF操作,期限为1年期

每日经济新闻
2026-01-22 17:26:07
米兰冬奥会中国参赛运动员名单公示:谷爱凌、苏翊鸣等在列

米兰冬奥会中国参赛运动员名单公示:谷爱凌、苏翊鸣等在列

界面新闻
2026-01-23 09:22:23
炸裂!50岁网红自称"性商教母",教狐系媚术浴室玩法,狂敛2400万

炸裂!50岁网红自称"性商教母",教狐系媚术浴室玩法,狂敛2400万

派大星纪录片
2026-01-22 14:56:51
央视四个字力挺,吴京《镖人》仍被抵制,网友给出的理由出奇一致

央视四个字力挺,吴京《镖人》仍被抵制,网友给出的理由出奇一致

阿纂看事
2026-01-21 19:10:57
2026-01-23 13:24:49
量子位 incentive-icons
量子位
追踪人工智能动态
12050文章数 176362关注度
往期回顾 全部

科技要闻

TikTok守住了算法"灵魂" 更握紧了"钱袋子"

头条要闻

32岁猝死程序员一人干六七人的工作 上月到手薪资披露

头条要闻

32岁猝死程序员一人干六七人的工作 上月到手薪资披露

体育要闻

跑个步而已,他们在燃什么?

娱乐要闻

刘大锤曝料 将王星越的“体面”撕粉碎

财经要闻

茂名首富,这次糟了

汽车要闻

“四十不惑”的吉利 信力不信命

态度原创

艺术
健康
本地
亲子
军事航空

艺术要闻

现在的春联太俗了,还是过去的“老对联”高雅!

打工人年终总结!健康通关=赢麻了

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

亲子要闻

没有过敏原为什么孩子还是起荨麻疹?

军事要闻

美军首艘“高超导弹战舰”出海测试

无障碍浏览 进入关怀版