网易首页 > 网易号 > 正文 申请入驻

老黄200亿“钞能力”回应谷歌:联手Groq,补上推理短板

0
分享至

Jay 发自 凹非寺量子位 | 公众号 QbitAI

老黄稳准狠,谷歌的TPU威胁刚至,就钞能力回应了。

200亿美元说砸就砸,只为拉拢一家炙手可热的「铲子新工厂」——Groq

这无疑也标志这家芯片巨头,面向AI新时代的一次重大布局。但在某种程度上,也的确反映出老黄对包括TPU在内等一众新芯片范式的担忧。

所以,Groq究竟能为英伟达带来什么?

针对这个问题,知名科技投资人Gavin Baker发表了自己的观点。

而他的这一连串技术剖析,纷纷指向了英伟达帝国防守最薄弱的那块领土——推理

推理方面,Groq LPU的速度远超GPU、TPU,以及目前所见的任何ASIC。


Gavin Baker

这一观点得到大量网友点赞:

GPU架构根本无法满足推理市场对低延迟的需求,片外HBM显存速度实在太慢了。


网友观点

但也有网友指出,LPU所采用的SRAM,或许并不能胜任长下文decode。

对此,Gavin认为英伟达可以通过产品「混搭」的方式解决。


Gavin Baker

下面具体来看——

Groq:英伟达斥200亿美元购入的一剂疫苗

Gavin认为,GPU在新时代水土不服的根本原因在于——推理过程的两个阶段,prefill和decode,对芯片能力有截然不同的要求。

先看prefill:

这一步,简单来说就是让模型「读题」,把用户提供的关键信息在脑子里记好,用于后续调用。

读题过程中,模型会一次性吃下用户所给的上下文,所有输入token都可以同时计算。

这正是GPU最擅长的舞台,其为图形处理而生,可以一次性计算数千个像素,天生适合处理并行任务。

在这个准备阶段,模型不用急着响应用户问题。即便有延迟,模型也完全可以通过显示「思考中」来掩盖等待时间。

因此,相比「速度」,prefiil需要芯片有更大的上下文容量。

但到了decode,这套逻辑不再适用。

decode是串行任务,必须得一个一个token挨着算。更重要的是,用户还会亲眼看到token被一个个「打」出来的过程。这种情况下,延迟对用户体验来说是致命的。

然而,GPU的数据主要存放在HBM,而不是紧贴算力核心的片上存储。这意味着,每生成一个token,GPU都需要重新从内存中读取数据。

这时候,GPU的问题就暴露出来了——大部分算力都处于闲置,FLOPs根本用不满,常常在等内存把数据搬过来,实际计算量远小于prefill。

相比之下,Groq有更好的解决方案——LPU

比起HBM,LPU使用直接集成在芯片硅片中的SRAM。这种片上存储的模式不需要读取数据,这让其速度比GPU快100倍。即使只处理单个用户,它也能跑出每秒300–500个token的速度,并能始终保持满负荷运转。

事实证明,在速度这一块,LPU几乎打遍天下无敌手——不仅是GPU,就连TPU,以及市面上绝大多数ASIC都难以望其项背。

但这并非没有代价的。

相比GPU,LPU的内存容量小的多。单颗Groq的LPU芯片,片上SRAM只有230MB。

作为对比,即便是英伟达的H200 GPU,也配备了高达141GB的HBM3e显存。

结果就是:你必须把成百上千颗LPU芯片连在一起,才能跑起一个模型

以Llama-3 70B为例,用英伟达GPU的话,只需要两到四张卡,塞进一个小型服务器盒子里就能搞定。而同样的模型,需要数百颗LPU,占地面积也将远大于使用GPU的数据中心。

这意味着,即便单颗LPU价格更低,整体硬件投资依然会非常巨大。

因此,AI公司在考虑LPU时,最重要的问题是——

用户是否愿意为「速度」付费?

对于这个问题,一年前的市场还不无法给出答案。但从Groq如今的业绩情况来看已经非常明确:「速度」是个真实存在的巨大需求,并且仍在高速成长

而对英伟达而言,这不仅是一个新的业务盘,更是一个颠覆者暗流涌动的高风险地带。倘若错失这个风口,英伟达在AI时代的机会可能会被新玩家颠覆,就像英伟达当年通过游戏业务颠覆其他竞争对手一样。

为了抵抗这些竞争者蚕食自己的护城河,英伟达选择注射名为Groq的疫苗。希望通过人才收购引入新血液,补齐这块低延迟场景的推理短板,帮助英伟达这艘巨舰摆脱创新者窘境。

「铲子」进入新时代

TPU的崛起,给英伟达的金钟罩撕开了一道裂缝。

通过自研芯片,谷歌成功摆脱了对英伟达天价GPU的依赖,这在很大程度上帮助谷歌削薄了训练和推理成本,这让谷歌在服务大量免费用户的情况下,依然能维持相当健康的财务账面。

谷歌通过Gemini 3 Pro的绝地翻盘,证明了GPU并非AI时代的唯一解。在技术周期高速迭代的背景下,作为AI「心脏」的芯片,也需要根据不同的发展阶段做出相应的调整。

随着基础模型的进展放缓,AI竞争的重点开始从训练层转向应用层。而在AI应用市场,「速度」对用户体验而言至关重要。

而这次人才收购Groq,虽然也是变相承认了公司在推理赛道的不足,但同样标志着英伟达帝国的又一次扩张。

称霸预训练的英伟达,这次要借Groq的东风,入局竞争对手喷涌而出的「推理大陆」。

而在这个新市场,英伟达或许不再能像如今这样风光。

正如Groq CEO所言,推理芯片是项高销量、低利润的苦活。这与即便炒到天价也有客户抢着要,毛利率高达70-80%的GPU截然不同。

参考链接:[1]https://x.com/gavinsbaker/status/2004562536918598000[2]https://www.uncoveralpha.com/p/the-20-billion-admission-why-nvidia

本文来自微信公众号“量子位”,作者:关注前沿科技,36氪经授权发布。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
19岁中卫崛起,曼联新星让阿莫林的转会难题迎刃而解!马奎尔咋办

19岁中卫崛起,曼联新星让阿莫林的转会难题迎刃而解!马奎尔咋办

夜白侃球
2025-12-29 22:55:06
美国又要完蛋了吗?谈谈斩杀线

美国又要完蛋了吗?谈谈斩杀线

十柱
2025-12-27 16:41:22
Lisa又被骂低俗!穿高衩衣、裸露屁股 网友崩溃:带坏小孩子

Lisa又被骂低俗!穿高衩衣、裸露屁股 网友崩溃:带坏小孩子

桑葚爱动画
2025-12-24 16:21:15
一休哥长大后为什么变成淫僧?背后有极其恐怖的地狱故事|文史宴

一休哥长大后为什么变成淫僧?背后有极其恐怖的地狱故事|文史宴

文史宴
2025-12-28 20:20:26
黄晓明带儿子和妈妈包饺子,摘了假发套发量很艺术,儿子很像杨颖

黄晓明带儿子和妈妈包饺子,摘了假发套发量很艺术,儿子很像杨颖

笑饮孤鸿非
2025-12-24 01:09:08
最新消息!樊振东将在波尔家里过圣诞节,大概率缺席乒超总决赛

最新消息!樊振东将在波尔家里过圣诞节,大概率缺席乒超总决赛

凤幻洋
2025-12-23 15:53:27
我资助的女生在清华演讲:施舍者的钱充满优越感,我感到屈辱

我资助的女生在清华演讲:施舍者的钱充满优越感,我感到屈辱

张道陵秘话
2025-12-01 10:23:21
悲催!孕检时才发现老婆曾7次流产,老婆矢口否认并报警!

悲催!孕检时才发现老婆曾7次流产,老婆矢口否认并报警!

闲侃闲侃
2025-12-28 09:37:50
中国国航第9架C919飞机入列

中国国航第9架C919飞机入列

界面新闻
2025-12-29 13:50:11
慢慢你就知道,越是独来独往、不合群的人,人品往往越没问题

慢慢你就知道,越是独来独往、不合群的人,人品往往越没问题

诗词中国
2025-12-28 18:09:15
内斗再开?国民党中央委员选举,朱立伦大获成功,郑丽文排名靠后

内斗再开?国民党中央委员选举,朱立伦大获成功,郑丽文排名靠后

近史阁
2025-12-29 13:48:13
不被允许的欲望:老年人性需求正在演变为重大公共卫生风险

不被允许的欲望:老年人性需求正在演变为重大公共卫生风险

黑噪音
2025-12-27 20:51:40
湖南男子勾引杀父仇人妻子玩弄10年后,一夜杀尽仇家13人

湖南男子勾引杀父仇人妻子玩弄10年后,一夜杀尽仇家13人

星河逍遥游
2024-12-29 15:11:01
善恶终有报!移居英国遭警察半夜抄家,这位过气歌手终成“笑话”

善恶终有报!移居英国遭警察半夜抄家,这位过气歌手终成“笑话”

老范谈史
2025-12-29 17:02:02
畜生父亲韦乐被判死刑,法庭上高喊:我这辈子不亏

畜生父亲韦乐被判死刑,法庭上高喊:我这辈子不亏

墨染尘香
2024-12-11 22:00:48
成都一4S店爆炸后续!警方通报来了,隔壁店说真话,真吵内容曝光

成都一4S店爆炸后续!警方通报来了,隔壁店说真话,真吵内容曝光

丁丁鲤史纪
2025-12-29 15:21:20
“黄河画家”徐惠君126平尺巨幅画作被人无意“泼墨”,本人称:该画作估价380万元,不会追查肇事者,希望网友提供补救建议,让墨渍成为神来之笔

“黄河画家”徐惠君126平尺巨幅画作被人无意“泼墨”,本人称:该画作估价380万元,不会追查肇事者,希望网友提供补救建议,让墨渍成为神来之笔

极目新闻
2025-12-29 20:27:57
交警紧急提醒:6-15 年老车年检新规落地,别再被黄牛坑了钱

交警紧急提醒:6-15 年老车年检新规落地,别再被黄牛坑了钱

复转这些年
2025-12-29 16:29:34
海南封关运作后,就相当于中国版的新加坡正式上线了。

海南封关运作后,就相当于中国版的新加坡正式上线了。

流苏晚晴
2025-12-21 16:05:12
原来他早已离世,患病3年女儿不管不问,死后为争遗产闹上法庭

原来他早已离世,患病3年女儿不管不问,死后为争遗产闹上法庭

白浅娱乐聊
2025-12-29 02:52:57
2025-12-30 01:39:00
36氪 incentive-icons
36氪
让一部分人先看到未来
150301文章数 2847626关注度
往期回顾 全部

科技要闻

肉搏非洲,传音不想只当个卖手机的

头条要闻

东部战区战士:收复宝岛台湾 已做好真打实打准备

头条要闻

东部战区战士:收复宝岛台湾 已做好真打实打准备

体育要闻

“史上最贵”的世界杯,球迷成了韭菜

娱乐要闻

44岁林俊杰官宣恋情 带23岁女友见家长

财经要闻

翁杰明:宏观数据与居民微观感受存在差距

汽车要闻

“路”要越走越深,猛士的智能越野时代来了

态度原创

本地
家居
艺术
公开课
军事航空

本地新闻

即将过去的2025年,对重庆的影响竟然如此深远

家居要闻

东方雅韵 温馨恬适

艺术要闻

你绝对不知道的寺庙布局秘密,快来看看!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

东部战区发布的AI视频 一个细节意味深长

无障碍浏览 进入关怀版