00:27
21世纪经济报道记者 倪雨晴
AI芯片战场的竞争,正愈演愈烈。
6月25日,三条消息集中出现。英伟达的2026年股东大会上,公司创始人兼CEO黄仁勋继续强化AI基建、AI工厂和“Token经济”的叙事;OpenAI联手博通,发布首款自研AI推理芯片Jalapeño,试图把模型、产品和底层硬件更紧密地绑定;高通发布了数据中心整体战略,推出Dragonfly数据中心产品组合,并拿下Meta、微软等客户。
三家巨头的不同布局,背后却指向同一条产业主线——AI算力需求仍在扩张,但竞争焦点正在发生变化。AI训练时代,市场关注GPU供给、模型参数和数据中心集群规模;AI推理时代,每个Token的成本、功耗、延迟、吞吐和商业转化能力成为关键。
英伟达仍然站在AI芯片产业的中心位置。但它的客户、伙伴和潜在对手,正在同时变成新的竞争者。AI芯片战场,也由此从单一GPU竞赛,进入GPU、ASIC、CPU、内存、网络和软件生态共同竞争的新阶段。
英伟达守擂:有用的AI已来、算力就是收入
在这次股东大会上,英伟达继续强调了强劲的成绩单。
黄仁勋表示,英伟达过去一年收入增长65%至2160亿美元,运营利润增长60%至1300亿美元,数据中心收入增长68%至1940亿美元。Blackwell正在从云厂商、AI实验室扩展到工业、企业、主权AI等更多场景,模型公司和超大规模客户已经累计部署了数十万颗Blackwell GPU。
但比财务数据更值得关注的是,黄仁勋继续重新定义AI算力的商业语言。
他谈道,计算机行业每10到15年就会经历一次重置,从大型机到PC,从互联网到云,再到移动云,而这一次重置更大。过去60年,是人类编写软件,计算机执行指令;如今,AI让计算机能够理解、推理、规划、使用工具,并完成有用的工作。
由此,黄仁勋指向的产业判断是:数据中心不再只是存储、检索和传输信息的地方,而是制造数字智能的“AI工厂”。
这一表述背后,是英伟达试图将GPU需求从硬件采购升级为智能生产资料。在传统数据中心时代,服务器承载的是存储、检索、计算和网络服务;在AI数据中心时代,服务器生产的是Token,而Token进一步转化为代码、答案、设计、客服、数字员工和企业流程。
黄仁勋直言:“当AI能够做有用的工作,Token就变得有价值;当Token能够盈利,对计算的需求就会加速。”他还强调,“有用的AI已经到来,而且它是有利润的,因此算力就是收入。”
这也是英伟达在回应市场质疑,过去一年,随着AI基础设施投资持续升温,外界不断追问巨额AI资本开支是否会形成泡沫?算力需求增长是否可持续?AI应用的投资回报率能否兑现?
黄仁勋给出的答案是,AI基础设施建设并不是短周期。他在股东问答中表示,AI不只是一个模型,而是计算范式的根本改变。过去的计算主要是检索、存储和发送信息,现在则是通过AI生成智能。他进一步解释,Token是智能的基本单位,在新型数据中心即AI工厂中被制造出来,并被货币化形成收入。
他还把这一轮AI基础设施建设类比为电网、交通系统和互联网,称其周期将以数十年计,并认为这可能成为人类历史上最大规模的基础设施建设之一。换言之,英伟达想告诉投资者的不是“GPU还会卖得很好”,而是“AI算力会像电力一样成为长期基础设施”。
与此同时,机构预测推理需求持续增长。TrendForce集邦咨询向21世纪经济报道记者提供的数据显示,北美五大云端服务供应商(CSP)为扩大AI训练和推理应用部署,2026年对整柜式(rack-scale)AI Server的采购意愿明显提高,不仅有望占据全球60%以上的NVIDIA GB/VR需求量,也将同步带动五大厂商总AI训练算力年增逾56%、总AI推理算力年成长高达122%。
从去年开始,英伟达就把叙事重点从训练转向推理,而英伟达的护城河不只是GPU本身。黄仁勋反复强调,英伟达拥有芯片、系统、算法和软件的端到端协同,也拥有CUDA生态、庞大装机基础和超过7000个应用支持。这意味着,英伟达的竞争优势不是某一颗芯片,而是一套完整的AI基础设施平台。
推理时代大乱斗:OpenAI、高通们重写分工
而英伟达越是强调Token经济,也越会吸引更多玩家进入。但是推理不同于训练,它更贴近应用、更贴近成本、更贴近客户场景。一旦AI进入大规模商用阶段,模型公司、云厂商、芯片公司都不会满足于只做英伟达GPU的采购方。
他们也希望形成自己的全栈AI解决方案,来降本增效。这正是OpenAI、高通等产业链上的厂商在同一时间进入聚光灯下的原因。
OpenAI发布AI芯片Jalapeño,是一个信号。这款芯片由OpenAI和博通共同开发,是OpenAI首款自研AI加速器。OpenAI将其称为Intelligence Processor,定位非常明确,它不是面向通用计算,也不是直接替代所有GPU,而是从一开始就围绕大语言模型推理设计。
00:06
OpenAI官方称,Jalapeño的设计重点包括kernel、内存移动、网络和服务模式,面向ChatGPT、Codex、API以及未来Agentic产品等高频推理场景。工程样片已经在实验室运行机器学习负载,包括GPT-5.3-Codex-Spark相关负载。
这意味着,OpenAI并不是简单做一颗芯片,而是在尝试把模型、产品、芯片和数据中心基础设施串起来。过去,AI公司主要在模型层竞争,现在它们开始延伸,打造“模型—产品—算力—数据中心”的闭环。
OpenAI之外,谷歌、亚马逊、Meta、微软等公司都在不同程度推进芯片项目,它们都是英伟达的客户。它们并不是放弃GPU,而是希望在训练、推理、搜索、推荐、广告、Agent等不同负载之间,建立更加多元的算力组合。
高通的入局,则代表另一类竞争者。
高通过去最被市场熟知的是手机芯片,但它正在发力AI数据中心。高通提出,到2029财年,非手机业务收入目标提升至400亿美元,其中数据中心收入目标超过150亿美元。与此同时,手机业务只占其QCT芯片收入约三分之一。
这是一场明显的战略转身。从产品组合看,高通推出Dragonfly数据中心平台,Meta和微软是重要的客户。其中,高通与Meta宣布多代数据中心CPU合作,Dragonfly C1000 CPU计划支持Meta下一代服务器集群。
高通还宣布收购AI软件公司Modular,补齐软件栈能力。这一点尤其重要,英伟达之所以强大,不只是因为GPU性能领先,更因为CUDA及其生态长期绑定了开发者、框架和应用。高通要在数据中心重新站稳,就必须解决不同硬件架构之间的软件适配问题。
一位业内人士向记者分析道,AI芯片产业正在进入分层竞争的阶段。
第一层仍是前沿训练和超大规模GPU集群。英伟达凭借GPU、NVLink、网络、系统、CUDA和客户基础,仍然占据核心位置;第二层是大规模推理,这里的竞争更复杂,英伟达Blackwell、谷歌TPU、OpenAI定制ASIC、亚马逊Trainium/Inferentia、Meta自研芯片、高通AI加速器等,都可能在不同场景中争夺份额;第三层是CPU、内存、网络和系统集成,未来AI数据中心的竞争,将越来越像系统工程,而不只是单颗芯片的性能对比。
从产业趋势看,AI算力的胜负手和系统经济性息息相关。英伟达正在把Token定义为数字智能的基本单位,OpenAI正在把Token成本纳入自有基础设施,高通则试图以通信基因切入AI数据中心。巨头们路径不同,把AI芯片角逐推向新的浪潮。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.