AI推理群雄逐鹿：英伟达守擂，OpenAI等攻擂|高通|微软|黄仁勋|gpu|知名企业|高带宽内存|openai

AI推理群雄逐鹿：英伟达守擂，OpenAI等攻擂

分享至

00:27

21世纪经济报道记者倪雨晴

AI芯片战场的竞争，正愈演愈烈。

6月25日，三条消息集中出现。英伟达的2026年股东大会上，公司创始人兼CEO黄仁勋继续强化AI基建、AI工厂和“Token经济”的叙事；OpenAI联手博通，发布首款自研AI推理芯片Jalapeño，试图把模型、产品和底层硬件更紧密地绑定；高通发布了数据中心整体战略，推出Dragonfly数据中心产品组合，并拿下Meta、微软等客户。

三家巨头的不同布局，背后却指向同一条产业主线——AI算力需求仍在扩张，但竞争焦点正在发生变化。AI训练时代，市场关注GPU供给、模型参数和数据中心集群规模；AI推理时代，每个Token的成本、功耗、延迟、吞吐和商业转化能力成为关键。

英伟达仍然站在AI芯片产业的中心位置。但它的客户、伙伴和潜在对手，正在同时变成新的竞争者。AI芯片战场，也由此从单一GPU竞赛，进入GPU、ASIC、CPU、内存、网络和软件生态共同竞争的新阶段。

英伟达守擂：有用的AI已来、算力就是收入

在这次股东大会上，英伟达继续强调了强劲的成绩单。

黄仁勋表示，英伟达过去一年收入增长65%至2160亿美元，运营利润增长60%至1300亿美元，数据中心收入增长68%至1940亿美元。Blackwell正在从云厂商、AI实验室扩展到工业、企业、主权AI等更多场景，模型公司和超大规模客户已经累计部署了数十万颗Blackwell GPU。

但比财务数据更值得关注的是，黄仁勋继续重新定义AI算力的商业语言。

他谈道，计算机行业每10到15年就会经历一次重置，从大型机到PC，从互联网到云，再到移动云，而这一次重置更大。过去60年，是人类编写软件，计算机执行指令；如今，AI让计算机能够理解、推理、规划、使用工具，并完成有用的工作。

由此，黄仁勋指向的产业判断是：数据中心不再只是存储、检索和传输信息的地方，而是制造数字智能的“AI工厂”。

这一表述背后，是英伟达试图将GPU需求从硬件采购升级为智能生产资料。在传统数据中心时代，服务器承载的是存储、检索、计算和网络服务；在AI数据中心时代，服务器生产的是Token，而Token进一步转化为代码、答案、设计、客服、数字员工和企业流程。

黄仁勋直言：“当AI能够做有用的工作，Token就变得有价值；当Token能够盈利，对计算的需求就会加速。”他还强调，“有用的AI已经到来，而且它是有利润的，因此算力就是收入。”

这也是英伟达在回应市场质疑，过去一年，随着AI基础设施投资持续升温，外界不断追问巨额AI资本开支是否会形成泡沫？算力需求增长是否可持续？AI应用的投资回报率能否兑现？

黄仁勋给出的答案是，AI基础设施建设并不是短周期。他在股东问答中表示，AI不只是一个模型，而是计算范式的根本改变。过去的计算主要是检索、存储和发送信息，现在则是通过AI生成智能。他进一步解释，Token是智能的基本单位，在新型数据中心即AI工厂中被制造出来，并被货币化形成收入。

他还把这一轮AI基础设施建设类比为电网、交通系统和互联网，称其周期将以数十年计，并认为这可能成为人类历史上最大规模的基础设施建设之一。换言之，英伟达想告诉投资者的不是“GPU还会卖得很好”，而是“AI算力会像电力一样成为长期基础设施”。

与此同时，机构预测推理需求持续增长。TrendForce集邦咨询向21世纪经济报道记者提供的数据显示，北美五大云端服务供应商（CSP）为扩大AI训练和推理应用部署，2026年对整柜式（rack-scale）AI Server的采购意愿明显提高，不仅有望占据全球60%以上的NVIDIA GB/VR需求量，也将同步带动五大厂商总AI训练算力年增逾56%、总AI推理算力年成长高达122%。

从去年开始，英伟达就把叙事重点从训练转向推理，而英伟达的护城河不只是GPU本身。黄仁勋反复强调，英伟达拥有芯片、系统、算法和软件的端到端协同，也拥有CUDA生态、庞大装机基础和超过7000个应用支持。这意味着，英伟达的竞争优势不是某一颗芯片，而是一套完整的AI基础设施平台。

推理时代大乱斗：OpenAI、高通们重写分工

而英伟达越是强调Token经济，也越会吸引更多玩家进入。但是推理不同于训练，它更贴近应用、更贴近成本、更贴近客户场景。一旦AI进入大规模商用阶段，模型公司、云厂商、芯片公司都不会满足于只做英伟达GPU的采购方。

他们也希望形成自己的全栈AI解决方案，来降本增效。这正是OpenAI、高通等产业链上的厂商在同一时间进入聚光灯下的原因。

OpenAI发布AI芯片Jalapeño，是一个信号。这款芯片由OpenAI和博通共同开发，是OpenAI首款自研AI加速器。OpenAI将其称为Intelligence Processor，定位非常明确，它不是面向通用计算，也不是直接替代所有GPU，而是从一开始就围绕大语言模型推理设计。

00:06

OpenAI官方称，Jalapeño的设计重点包括kernel、内存移动、网络和服务模式，面向ChatGPT、Codex、API以及未来Agentic产品等高频推理场景。工程样片已经在实验室运行机器学习负载，包括GPT-5.3-Codex-Spark相关负载。

这意味着，OpenAI并不是简单做一颗芯片，而是在尝试把模型、产品、芯片和数据中心基础设施串起来。过去，AI公司主要在模型层竞争，现在它们开始延伸，打造“模型—产品—算力—数据中心”的闭环。

OpenAI之外，谷歌、亚马逊、Meta、微软等公司都在不同程度推进芯片项目，它们都是英伟达的客户。它们并不是放弃GPU，而是希望在训练、推理、搜索、推荐、广告、Agent等不同负载之间，建立更加多元的算力组合。

高通的入局，则代表另一类竞争者。

高通过去最被市场熟知的是手机芯片，但它正在发力AI数据中心。高通提出，到2029财年，非手机业务收入目标提升至400亿美元，其中数据中心收入目标超过150亿美元。与此同时，手机业务只占其QCT芯片收入约三分之一。

这是一场明显的战略转身。从产品组合看，高通推出Dragonfly数据中心平台，Meta和微软是重要的客户。其中，高通与Meta宣布多代数据中心CPU合作，Dragonfly C1000 CPU计划支持Meta下一代服务器集群。

高通还宣布收购AI软件公司Modular，补齐软件栈能力。这一点尤其重要，英伟达之所以强大，不只是因为GPU性能领先，更因为CUDA及其生态长期绑定了开发者、框架和应用。高通要在数据中心重新站稳，就必须解决不同硬件架构之间的软件适配问题。

一位业内人士向记者分析道，AI芯片产业正在进入分层竞争的阶段。

第一层仍是前沿训练和超大规模GPU集群。英伟达凭借GPU、NVLink、网络、系统、CUDA和客户基础，仍然占据核心位置；第二层是大规模推理，这里的竞争更复杂，英伟达Blackwell、谷歌TPU、OpenAI定制ASIC、亚马逊Trainium/Inferentia、Meta自研芯片、高通AI加速器等，都可能在不同场景中争夺份额；第三层是CPU、内存、网络和系统集成，未来AI数据中心的竞争，将越来越像系统工程，而不只是单颗芯片的性能对比。

从产业趋势看，AI算力的胜负手和系统经济性息息相关。英伟达正在把Token定义为数字智能的基本单位，OpenAI正在把Token成本纳入自有基础设施，高通则试图以通信基因切入AI数据中心。巨头们路径不同，把AI芯片角逐推向新的浪潮。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.