![]()
1万亿美元,这是接下来21个月英伟达GPU订单的收入预期。
刚过去的GTC大会,黄仁勋不再讲芯片的故事了。他瞄准了更大的叙事:token经济。一块更有野心、也更持久的市场蛋糕。
这篇文章,我们拆解英伟达的五层蛋糕生态体系。一万亿美元怎么算出来的?基于Groq的LPU带来什么新机会?黄仁勋在光通信上的提前布局,以及Scale-across(跨区域扩展)的AI工厂前景。还有OpenClaw的里程碑之后,英伟达押注的token经济学将如何发展,给算力市场带来什么挑战?
2026年GTC的叙事建立在两个背景:一是AI应用真正落地;二是OpenClaw爆火带动全球agent生态。这让黄仁勋在演讲中高呼:推理拐点已经到来。
新云厂商GMI Cloud创始人Alex Yeh告诉我们,北美需求暴增来自多模态和编程,而OpenClaw带来的token需求主要来自中国。
这个观察和我们最近在硅谷的探讨一致。北美用户,特别是技术背景的开发者,已经很适应用Claude Cowork做agent任务。所以虽然OpenClaw从硅谷火出圈,但远没有国内那么卷。
有了推理需求飙升和OpenClaw爆火这两个趋势,黄仁勋的演讲逻辑和去年完全不同:以前英伟达卖芯片给云厂商和AI公司,如今,老黄要卖token给全世界每一家公司。
这也是我参加今年keynote的最大感受。看看PPT上的小心心,就知道黄仁勋的姿态是we love everybody(我们拥抱所有人)。今年GTC最关键的主题是"生态",不是"芯片"。
GTC前几天,英伟达放出"AI五层蛋糕"的文章造势,预示黄仁勋强调的是垂直整合能力和生态,而非单芯片。
简单说,老黄给外界画了一张更大的饼。
先说这一万亿。去年GTC,黄仁勋说Blackwell和Vera Rubin的订单收入到2026年底会达5000亿美元。这次,预期直接翻倍:到现在到2027年底,光是这两款GPU架构的订单收入,预计达1万亿美元。
注意,这不包括英伟达新发的CPU和基于Groq的LPU等其他产品线。他在媒体闭门会上专门澄清,只为让外界直观感受GPU业务的增长。
对于各大企业的算力CapEx(资本支出),我们的嘉宾认为还将继续上涨。一边是推理需求上涨,另一边是随着前沿模型竞争白热化,训练需求也不会降低。
为什么今年不强调单芯片,连Rubin下一代架构Feynman也只略微一提?除了要把叙事拔高到"AI factory"、给所有人卖token,还因为产能跟不上,市面上疯狂缺卡。最先进的卡买不到,两三年前的H100、H200用了几年甚至能超原价卖。软件生态和各种配置也跟不上老黄的速度,再强调单卡性能提升,对市场没意义。
所以,光是GPU售卖,这一万亿美元并不算过度乐观,而是真有这需求量。但黄仁勋显然不满足。当token成为大宗商品,"算力即收入",他要打透"AI五层蛋糕",让英伟达持续成为AI产业线中最赚钱的机器。
这五层蛋糕从下到上:能源层(电力等基础供应)、芯片层(英伟达的核心业务)、基建层(云厂商及数据中心,含土地、供电、冷却、网络等)。前三层统称AI工厂。再往上,模型层有OpenAI、Gemini、Anthropic等顶尖模型,以及英伟达自研的开源模型。应用层则是机器人、自动驾驶、工业制造、编程和企业级AI Agent等。
![]()
老黄在布什么局?五层蛋糕他都能吃透吗?
我们的嘉宾任杨认为,每层中若玩家水平差不多,没有绝对领先或垄断者,利润就会被摊薄,这叫"being commoditized"(同质化)。议价权最终回到有绝对领先和垄断的那层——英伟达的芯片层。
最终还是要靠卖芯片。但在其他层,英伟达要扶持自己的软件生态,定义规则。就像CUDA的护城河,一旦在新市场定义范式,市场爆发时大家发现最好用的还是英伟达平台,最后买的依然是英伟达的算力和卡。
比如基建层,看到谷歌云、AWS有强议价权后,英伟达扶持了CoreWeave、Nebius等新云平台来竞争。模型层,英伟达开源各种大小模型,这次还专门组织全球核心开源模型论坛,试图长期削弱SOTA(最顶尖)闭源模型的议价权。应用层,英伟达也在研发自动驾驶和机器人,提前布局生态位。
老黄时刻关注其他层级,但最赚钱、盯得最紧的始终是芯片层。这次GTC传达出两个信号。
第一个信号:基于Groq的LPU。对Groq的非独家技术授权交易去年12月才宣布,200亿美元现金,英伟达史上最大交易之一。
Groq创始人Jonathan Ross在福布斯采访中爆料,这笔交易老黄只花了三周就决定。到GTC才3个月,产品已出来。老黄和英伟达卷起来,真没其他人什么事。
为什么要"收编"Groq?
GPU架构,即使强如Vera Rubin,擅长高吞吐并行计算,做prefill(上下文预处理)和attention(注意力计算)很厉害,但在超高速token生成(decode)上就没那么给力。token生成只能一个一个来,整个过程是串行链式,对每一步延迟极其敏感。
"高吞吐"和"低延迟"本身矛盾,很难两全。Groq就是这个矛盾的解法。
Groq通过SRAM设计,天生适合推理和token生成。Ross打动黄仁勋的类比是:强大的GPU像"18轮大卡车",但推理任务像"最后一公里配送",更适合灵活高效的面包车。他对老黄说,要为美国建物流网络,最佳答案是:卡车和面包车都需要。
OpenClaw之后的Agent时代,老黄通过与Groq的深度技术与人才合作,解决了token生成的挑战,这是关键一步。Groq新芯片融入英伟达体系后,宣称将解锁3000亿美元增量市场。这200亿,花得值了。
但SRAM有难题:贵、占面积、容量做不大。单颗Groq 3 LPU只有500MB SRAM,Rubin GPU是288GB HBM4,差500多倍,根本存不下万亿参数模型。
英伟达的解法是用Dynamo软件把推理拆成两半:Vera Rubin GPU负责prefill和attention,Groq负责decode和token生成。
一颗Rubin GPU配8颗Groq 3 LPU,统一为一个推理单元。Groq 3 LPX整机把256颗LPU装进一个机架,提供128GB SRAM、40PB/s带宽、315 PFLOPS推理算力和640TB/s互连带宽。
这笔交易还面临反垄断潜在调查,涉嫌"变相收购"(虽已是硅谷巨头AI时代的基本操作)。但LPU已和三星合作量产,预计Q3出货,Vera Rubin机架已在微软Azure运行。
![]()
联手Groq还有战略意义:打出ASIC反击战。ASIC是专项芯片,不如GPU通用,但如今是各大科技巨头自研重点,云厂商也在扶持ASIC试图蚕食英伟达利润率和议价权。谷歌TPU、Groq本身都是ASIC。英伟达这次告诉外界:我也能做ASIC,还跟我自己的GPU结合,性能更强。
芯片层第二个关键词:CPU,有种"枯木逢春"的感觉。AI agent时代token经济崛起,不但救了Groq,连老古董CPU也重新成为香饽饽。
GPU擅长训练和运行AI模型,但Agent工作负载增长,系统需要传输海量数据、协调跨多智能体的工作流程,CPU在现代AI基础设施中的重要性丝毫不亚于GPU。
这次GTC,英伟达发布Vera CPU,"全球首款专为代理式AI与强化学习时代打造的处理器",效率是传统机架级CPU的2倍,速度提升50%。AI编程明星公司Cursor也为Vera CPU站台,说提升了整体吞吐量和效率,给客户带来更快速灵敏的编程agent体验。
芯片层还有个秘密武器:CPX。
去年9月AI基础设施峰会推出,专门针对长语境推理优化,代表GPU设计的全新类别。能处理百万级tokens的软件编程和生成式视频,在速度和效率上实现突破,被认为能进一步稳固英伟达在推理上的优势。
有意思的是,老黄这次演讲根本没提CPX。业界很好奇,英伟达这套组合拳——GPU、CPU、LPU、CPX,是否会进一步拉开与竞争对手的差距。
五层蛋糕互相支撑又互相牵制。黄仁勋要做的是整合五层,确保英伟达在每一层都有话语权:扶持甲方的竞争对手、自研开源模型、在不同领域保持开放合作来定义行业入口和范式。
英伟达的叙事早已不是"芯片"而已。黄仁勋手握单芯片的名场面已成为过去。未来,是完整的AI factory,是更宏大的token经济学。这让英伟达的护城河也早已超越CUDA,让竞争对手更难攻破它的生态帝国。
黄仁勋一直在布局下一个即将爆发的产业,对前沿技术非常敏锐。这次发布会上,他没太多提共封装光学CPO,以及数据中心的Scale-up(纵向扩容)和Scale-out(横向扩容)。
但英伟达3月初分别向光子技术巨头Lumentum和Coherent各注资20亿美元,锁定数十亿美元采购承诺及未来产能权益。这两家都是CPO核心供应链,业内人士认为,黄仁勋在准备为下一代"吉瓦级AI工厂"铺垫光互联底座。
产业还在讨论Scale-up和Scale-out,而行业人士说,黄仁勋已在思考再下一步:Scale-across(跨域扩展),即不同数据中心的互联怎么解决。
还有更遥远的布局,包括演讲中提到的太空数据中心等。
最后,聊聊芯片和数据中心供应链的现状。如果大家还记得五层蛋糕,能源和数据中心供应链的基础层,决定了芯片产能,决定了AI模型和应用能否得到足够算力支撑,决定了AI进程。
GTC期间跟供应链朋友聊天,信息是:缺,什么都短缺。
Alex表示,最近全球地缘政治,特别是中东波动让能源价格异常波动,给全球AI数据中心能源供应带来更高不确定性。能源部分大概占token定价的10%左右,而让token价格居高不下的,还是供应链短缺带来的价格飙升,特别是内存方向。
我们在会展现场访问到内存市场的决定性大赢家三星,他们认为紧缺状态至少要持续到2027年底。
Agentic时代来临,很多范式会变化,有机遇也有挑战。GTC会依然是AI行业的指路标,我们也会继续关注以上产业和方向。不知道一年后的GTC,我们的世界会被AI加速多少?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.