![]()
1万亿美元,这是接下来21个月英伟达GPU订单的收入预期。
刚过去的GTC大会,黄仁勋不再讲芯片的故事了。他瞄准了更大的叙事:token经济。一块更有野心、也更持久的市场蛋糕。
这篇文章拆解英伟达的五层蛋糕生态。一万亿美元怎么算出来的?Groq的LPU带来什么新机会?黄仁勋在光通信上的提前布局,以及Scale-across(跨区域扩展)的AI工厂。还有OpenClaw之后,token经济学将如何改写算力市场的规则。
2026年GTC的叙事建立在两个背景:一是AI应用真正落地;二是OpenClaw爆火带动全球agent生态。这让黄仁勋在演讲中高呼:推理拐点已经到来。
新云厂商GMI Cloud创始人Alex Yeh透露,北美需求暴增来自多模态和编程,而OpenClaw带来的token需求主要来自中国。北美开发者早已习惯用Claude Cowork做agent任务,OpenClaw虽从硅谷火出圈,但远没有国内那么卷。
有了推理需求飙升和OpenClaw爆火这两个趋势,黄仁勋的叙事逻辑彻底变了:以前卖芯片给云厂商和AI公司,如今要卖token给全世界每一家公司。
这也是我参加今年keynote的最大感受。PPT上满屏的小心心,黄仁勋的姿态是we love everybody。今年GTC最关键的主题是"生态",而不是"芯片"。
早在GTC前几天,英伟达就放出"AI五层蛋糕"的文章造势。简单来说,老黄给外界画了一个更大的饼。
黄仁勋去年说,Blackwell和Vera Rubin的订单收入到2026年底会达到5000亿美元。这次直接上调一倍:到2027年底,光是这两款GPU架构的订单收入,预计达1万亿美元。
注意,这还不包括新发的CPU和基于Groq的LPU等其他产品线。他在媒体闭门会上专门澄清,只为让外界直观感受GPU业务的增长。
各大企业的算力CapEx(资本支出)还将继续上涨。一边是推理需求攀升,另一边是前沿模型竞争白热化,训练需求也不会降低。
为什么今年不强调单芯片,连Rubin下一代架构Feynman也只是略微一提?除了要把叙事拔高到"AI factory"、给所有人卖token,更现实的约束是产能跟不上。市面上疯狂缺卡,最先进的卡买不到,两三年前的H100、H200用了几年还能超原价卖。软件生态和配置也跟不上老黄的速度,再强调单卡性能提升,对市场毫无意义。
所以一万亿的收入规模并不算过度乐观,而是真有这需求量。但黄仁勋显然不满足于此。当token成为大宗商品,"算力即收入",他要把"AI五层蛋糕"全部打透,让英伟达持续成为AI产业线中最赚钱的机器。
这五层蛋糕从下到上:能源层(电力等基础供应)、芯片层(英伟达的核心业务)、基建层(云厂商及数据中心,含土地、供电、冷却、网络等)。前三层统称AI工厂。再往上是模型层(OpenAI、Gemini、Anthropic及英伟达自研开源模型),最上是应用层(机器人、自动驾驶、工业制造、编程、企业级AI Agent等)。
老黄在布什么局?这五层他都能吃透吗?
![]()
嘉宾任杨认为,每层中若玩家水平相近、无绝对领先者,利润就会被摊薄,即"being commoditized"(同质化)。议价权最终回到有绝对领先和垄断的层——也就是英伟达的芯片层。
最终还是要靠卖芯片。但在其他层,英伟达要扶持自己的软件生态、定义规则。就像CUDA的护城河,一旦在新市场定义范式,市场爆发时大家发现最好用的还是英伟达平台,最后买的依然是英伟达的算力和卡。
基建层,谷歌云和AWS议价权太强,英伟达就扶持CoreWeave、Nebius等新云平台竞争。模型层,开源模型发了一堆,还专门组织全球核心开源模型论坛,试图长期削弱顶级闭源模型的议价权。应用层,自动驾驶和机器人研发不停,提前卡位等爆发。
老黄时刻关注其他层,但最赚钱、盯得最紧的始终是芯片层。这次GTC传达两个信号。
第一个信号:基于Groq的LPU。对Groq的非独家技术授权交易去年12月才宣布,200亿美元现金,英伟达史上最大交易。Groq创始人Jonathan Ross爆料,老黄只花了三周就做决定。
到如今GTC才3个月,产品已出来。老黄卷起来,确实没其他人什么事。
为什么要"收编"Groq?GPU架构即使强如Vera Rubin,擅长高吞吐并行计算,做prefill(上下文预处理)和attention(注意力计算)很厉害,但在超高速token生成(decode)上就没那么给力。token生成只能一个一个来,整个过程串行链式,对每一步延迟极其敏感。
"高吞吐"和"低延迟"互相矛盾,很难两全。Groq就是这个矛盾的解法。
Groq通过SRAM设计,天生适合推理和token生成。Ross打动黄仁勋的类比是:强大的GPU像"18轮大卡车",但推理任务像"最后一公里配送",更适合灵活高效的面包车。要为美国建物流网络,卡车和面包车都需要。
OpenClaw之后的Agent时代,老黄通过与Groq的深度合作解决token生成挑战,这是关键一步。Groq新芯片融入英伟达体系后,宣称将解锁3000亿美金增量市场。200亿花得值。
但SRAM有难题:贵、占面积、容量做不大。单颗Groq 3 LPU只有500MB SRAM,Rubin GPU是288GB HBM4,差500多倍,存不下万亿参数模型。英伟达的解法是用Dynamo软件把推理拆成两半:Vera Rubin负责prefill和attention,Groq负责decode和token生成。
一颗Rubin GPU配8颗Groq 3 LPU,统一为一个推理单元。Groq 3 LPX整机把256颗LPU装进一个机架,提供128GB SRAM、40PB/s带宽、315 PFLOPS推理算力和640TB/s互连带宽。
这笔交易还面临反垄断潜在调查,涉嫌"变相收购"(虽是硅谷巨头AI时代的基本操作)。但LPU已与三星合作量产,预计Q3出货,Vera Rubin机架已在微软Azure运行。
联手Groq还有战略意义:打出ASIC反击战。ASIC是专项芯片,不如GPU通用,却是各大科技巨头自研重点,云厂商也在扶持ASIC试图蚕食英伟达利润率和议价权。谷歌TPU、Groq本身都是ASIC。英伟达这次告诉外界:我也可以做ASIC,还跟自己的GPU结合,性能更强。
芯片层第二个关键词:CPU,有种"枯木逢春"的感觉。AI agent时代token经济崛起,不但救了Groq,连老古董CPU也重新成为香饽饽。
![]()
GPU擅长训练和运行AI模型,但Agent工作负载增长,系统需要传输海量数据、协调跨多智能体的工作流程,CPU在现代AI基础设施中的重要性丝毫不亚于GPU。
英伟达发布Vera CPU,"全球首款专为代理式AI与强化学习时代打造的处理器",效率是传统机架级CPU的2倍,速度提升50%。AI编程明星公司Cursor站台,说提升了整体吞吐量和效率,给客户带来更快速灵敏的编程agent体验。
芯片层还有个秘密武器CPX。去年9月AI基础设施峰会推出,专门针对长语境推理优化,代表GPU设计的全新类别。能处理百万级tokens的软件编程和生成式视频,速度和效率突破性提升,被认为能进一步稳固英伟达在推理上的优势。
有意思的是,老黄这次演讲根本没提CPX。业界很好奇,GPU、CPU、LPU、CPX这套组合拳,是否会进一步拉开与竞争对手的差距。
五层蛋糕互相支撑又互相牵制,黄仁勋要整合五层,确保英伟达在每一层都有话语权。扶持竞争对手的竞争对手、自研开源模型、在不同领域开放合作定义行业入口和范式。
英伟达的叙事早已不是"芯片"而已。黄仁勋手握单芯片的名场面已成过去。未来是完整的AI factory,是更宏大的token经济学。护城河也早已超越CUDA,让竞争对手更难攻破它的生态帝国。
黄仁勋一直在布局下一个爆发的产业,对前沿技术极其敏锐。这次发布会上没太多提共封装光学CPO,以及数据中心的Scale-up(纵向扩容)和Scale-out(横向扩容)。
但3月初,英伟达分别向光子技术巨头Lumentum和Coherent各注资20亿美元,锁定数十亿美元采购承诺及未来产能权益。这两家都是CPO核心供应链,业内人士认为这是为下一代"吉瓦级AI工厂"铺垫光互联底座。
产业还在讨论Scale-up和Scale-out,而黄仁勋已在思考再下一步:Scale-across(跨域扩展),不同数据中心的互联怎么解决。还有更遥远的布局,比如演讲中提到的太空数据中心。
最后聊聊芯片和数据中心供应链的现状。如果大家还记得五层蛋糕,能源和数据中心供应链的基础层,决定芯片产能,决定AI模型和应用能否得到足够算力支撑,决定AI的进程。
GTC期间跟供应链朋友聊天,信息是:缺,什么都短缺。
Alex表示,最近全球地缘政治特别是中东波动让能源价格异常波动,给全球AI数据中心能源供应带来更高不确定性。能源大概占token定价的10%左右,而让token价格居高不下的,还是供应链短缺带来的价格飙升,特别是内存方向。
会展现场访问到内存市场的决定性大赢家三星,他们认为紧缺状态至少要持续到2027年底。
Agentic时代来临,很多范式会变化,有机遇也有挑战。GTC会依然是AI行业的指路标,我们也会继续关注以上产业和方向。一年后的GTC大会,我们的世界会被AI加速多少?
三星的人说完"2027年底",旁边一位采购经理默默把笔记本合上了。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.