网易首页 > 网易号 > 正文 申请入驻

从“卖铲子”到“开工厂”,英伟达跃向“词元时代”

0
分享至



当词元成为统一计量单位,谁能以更低成本生产更多词元,谁就掌握新的定价权。

文|胡嘉琦

ID | BMR2004

在2026年的英伟达年度开发者大会(GTC)上,CEO黄仁勋抛出一个判断:AI竞争的本质是词元(Token)生产效率的竞争。在GTC大会上,英伟达将词元定义为现代AI的基本单位,是支撑科学探索、虚拟世界以及物理世界机器运行的基石。

如今,这家靠GPU称霸AI时代的芯片巨头,正在将战场从“训练”转向“推理”,从“堆算力”转向“降成本”。

尽管GPU依然稀缺、依然重要,但“拥有算力”本身,正在让位于“如何使用算力”。综合科技媒体TechRadar发布的报告数据,当前部分企业场景算力利用率甚至不足10%,这意味着,AI产业的价值正在从“卖算力”向“用算力”转移。AWS、Microsoft Azure等云厂商,已开始从调度和计费方式入手争夺定价权。

这迫使英伟达调整战略,黄仁勋公开表示,英伟达不再只是卖GPU,而是构建“AI工厂”。《商学院》记者从英伟达方面获悉,英伟达正通过全栈架构,将数据中心重新定义为词元生产系统,使词元从技术单位逐渐变为产业计价单位。

01

词元经济时代来临

行业开始用“每美元词元产出”和“每瓦词元产出”来衡量能力,词元不再只是模型内部变量,更成为AI经济中的基础单位。

衡量AI公司的标尺正在发生根本变化:计算的基本单位开始从GPU转向词元。

英伟达加速计算产品总监Dave Salvator认为,系统效率则取决于词元处理速度与单位成本。

《商学院》记者从英伟达方面获悉,其加速计算团队长期跟踪超大规模计算与AI数据中心演进,并判断AI正在进入以词元为核心计量单位的新阶段。在这一体系中,词元不再只是模型内部的中间变量,正在成为AI经济的基础单位。

中国社会科学院研究生院特聘导师柏文喜认为,词元经济下,商业天花板在“量”上被放大,但在“利润率”上开始承压。词元经济将算力的计量方式,从“卖硬件”转向“卖结果”,直接扩展了市场规模。当词元消耗从万亿级走向百万亿级,需求呈指数级增长。

这对英伟达而言,是典型的双刃剑:一方面,增量空间被显著打开,推理算力的需求规模正在向训练算力的百倍量级演进,叠加智能体带来的毫秒级高并发与长链路任务,底层算力基础设施必须重构,这为整个行业创造了新的增长曲线。

另一方面,利润结构正在被压缩。当前行业算力利用率普遍在30%—60%,大量GPU处于低效或闲置状态。当客户开始按词元付费,本质上只为“有效产出”买单,利用率压力将向上游传导。对英伟达来说,这意味着商业逻辑必须转变,不再是尽可能多地卖出GPU,而是让每一张卡产生更多词元。这也正是黄仁勋推动“AI工厂”的底层逻辑,把算力从静态资产变成持续运转的生产系统。

这一拐点的本质,是GPU厂商定价权的迁移,从过去依赖供给稀缺形成的“稀缺性溢价”,转向由系统效率决定的“效率溢价”。当词元成为统一计量单位,谁能以更低成本生产更多词元,谁就掌握新的定价权。

如今,行业开始用“每美元词元产出”和“每瓦词元产出”来衡量能力,词元不再只是模型内部变量,更成为AI经济中的基础单位。其直接结果是,竞争焦点从模型能力转向词元成本,在相同硬件条件下,不同系统的词元效率差异,足以拉开数量级的商业回报差距,AI产业由此进入“词元经济”阶段。

02

从卖算力到卖效率:英伟达的新命题

英伟达做的所有动作,本质上都是在嵌入生产过程本身,让自己不只是卖GPU,而是参与定义词元如何被生产出来。

英伟达并不直接卖词元,但它通过控制生成路径来参与定义词元。在“AI工厂”框架下,英伟达正祭出一套“组合拳”:

Dynamo这类开源推理系统,解决“词元怎么更高效地产生”。

很多能力也在被软件化并开源,英伟达TensorRT-LLM接入各种框架,优化缓存和数据流动,本质都是在压低单位词元的浪费。

英伟达还在用一款面向“AI工厂”的逻辑仿真平台DSX Air做仿真,在硬件进数据中心之前就先跑一遍系统,对计算、网络、存储、编排与安全进行全栈模拟与验证,把可能的瓶颈提前暴露出来。这让优化不再发生在上线之后,而是提前在设计阶段完成。

由此,“AI工厂”的构建逻辑,从“上线后调优”,变为“建设前定型”。

据英伟达方面披露,这一机制带来三项直接变化:部署周期从数月缩短至数天;首个词元生成时间从数周压缩至数天甚至数小时;系统集成与故障排查被前移至仿真阶段完成。

汇生国际资本总裁黄立冲认为,如今,硬件已经从“卖卡”进入“被结果检验”的阶段。英伟达、云厂商、模型公司、Agent OS、算力优化平台都在同一条链上,但每一层利润点不同。AI产业不是单中心替代,而是多层护城河重估。英伟达做的所有动作,不管是开源软件还是系统化设计,本质上都是在嵌入生产过程本身,让自己不只是卖GPU,而是参与定义词元如何被生产出来。

英伟达2026财年第四季度收入达到681亿美元,同比增长约73%;数据中心收入623亿美元,同比增长约75%,仍然保持高速增长,需求主要来自Agentic AI和AI Factory(“AI工厂”)带来的持续计算负载。

但长期来看,黄立冲认为,一旦客户开始按词元、按任务、按结果来衡量成本,GPU就不再是“越多越好”的线性扩张,而要进入单位经济的比较框架。客户会直接问三个问题:同样100万词元,谁的成本更低;同样一个客服或投研Agent,谁的延迟更低、成功率更高;以及整个系统的账单是否足够透明。竞争从“供给多少算力”,转向“单位算力的经济效率”。

黄立冲表示,第一,采购语言的变化。企业是否从“买多少卡”转向“买多少词元产能、多少任务吞吐”。一旦发生这种变化,说明算力已经被产品化为服务能力,而不是硬件规模。第二,计量体系的变化。收入与成本指标是否从FLOPS转向cost per token、tokens per watt、tokens per dollar。第三,系统优化的外溢效应。包括软件调度、缓存机制、路由策略、小模型分流以及专用芯片设计,是否持续把同样任务的GPU消耗压低。如果单位任务越来越“省卡”,说明价值正在从硬件规模转向系统效率。

因此,黄立冲认为,英伟达的天花板并不是单向变化的,英伟达在AI总需求爆发阶段被放大,但在词元经济成为主导之后,又被重新拉回到单位效率约束之中。如果它只是一个GPU厂商,天花板会被压缩;但如果它把GPU、网络、软件、机柜与推理优化整合为“AI工厂”,那么它面对的就不再是芯片市场,而是整个AI生产系统的规模。

黄立冲说:“词元经济不是在削弱GPU,而是在淘汰低效GPU。最终决定定价权的,不是谁拥有更多算力,而是谁能让词元更便宜、更稳定、更可控。这个逻辑与AI经营系统是一致的:资本市场不会一直奖励我有AI项目,而会奖励可规模复制、可审计归因、可治理回滚的经营系统能力。”

03

英伟达的护城河

“AI工厂”战略本质上是将竞争维度从单一芯片性能上移至系统效率层面。

词元经济并没有消解英伟达的护城河,但改变了其形态。过去,护城河建立在GPU性能与供给稀缺之上;而现在,则转向系统整合能力与成本控制能力。

英伟达并不直接销售词元,也不参与API定价,但通过GPU架构、NVLink互联、整机系统以及CUDA生态(英伟达的一套让开发者高效调用硬件算力的通用语言与工具包),深度影响词元的生成路径与成本函数。

因此,CUDA不只是工具,而是贯穿训练到推理的一整套体系,又通过GeForce连接开发者,再通过CUDA-X进入汽车、金融、医疗、工业等行业。英伟达做的事情其实很简单:尽量让不同产业运行在同一套计算框架里。黄仁勋在 GTC 2026 上提到一个例子:Fireworks AI 和 Lynn 两家公司在没有更换任何硬件的情况下,仅通过英伟达更新软件栈和推理算法,就把词元生成速度从每秒约 700 个提升到接近 5000 个。这说明,不增加硬件投入,仅靠调度和推理优化,也能把“产出效率”明显抬上去。

这种提升并不只来自芯片本身,更依赖软件体系的持续打磨。《商学院》记者从英伟达获悉,CUDA 平台目前已有约 600 万开发者。人越多,生态越丰富;生态一旦形成,后来者切换的难度也就跟着上来了。

这种“难”,不只是换个工具那么简单。主流框架对 CUDA 绑定很深,切换平台往往要重写代码,同时,开发、调试、优化的一整套流程也要跟着重来。更重要的是,工程师多年积累的调优经验,很难直接迁移。再加上围绕CUDA沉淀下来的开源项目和社区支持,一旦离开,效率和资源会大量流失。

在GitHub 上,与CUDA相关的项目已达数万,英伟达的工具链也逐渐成为AI研究中的通用选择。相比硬件,这套由开发者、工具和项目构成与成本函数的体系更难被替代。时间积累下来的使用习惯和安装基础,才是CUDA真正的护城河。

奥优国际董事长张玥更关注词元经济带来的商业变化。她提到一个很直接的转折:客户不再只是买GPU,而是开始直接买结果。算力从资产,变成服务,而且是持续消耗的那种。AI应用越多,这种消耗就越明显。在这个过程中,英伟达一边用CUDA稳住生态,一边用DGX往上走,慢慢把“卖芯片”变成“交付整套能力”。

知名财经作家、眺远影响力研究院院长高承远认为:客户一旦把算力、数据和开发环境都放进来,就很难再迁出去,收入形态也随之改变,更接近持续收费而不是一次性交易。价格怎么定,也不再完全跟着硬件周期走,而是看资源和效率情况。

护城河的变化也在这里得以体现。CUDA、TensorRT这些软件和GPU深度绑定,性能不再是单点突破,而是整套系统一起发挥作用,这让替代变得更难。与此同时,另一层竞争开始出现,比如调度能力、异构算力利用率、Agent的组织方式。人工智能基础设施及智算云提供商九章云极则选择把GPU用得更“满”,直接冲击按卡计费的模式。不过短期看,这类变化更多还是影响云厂商和边际需求,还没有真正动到最底层。

柏文喜认为,英伟达正从“卖GPU”走向“卖系统”,这既是其既有优势的延续,也是对产业竞争格局变化的主动重构。“AI工厂”战略本质上是将竞争维度从单一芯片性能上移至系统效率层面,即把AI基础设施从“存储与处理数据”的数据中心,重塑为“生产智能”的工厂,其核心指标也由硬件性能转向单位能耗对应的产出能力。

如今,行业开始出现分层。英伟达在高端训练上的优势仍然稳,但在推理和规模化应用这一侧,云厂商的话语权在变强。价格也不再由单一一方决定,而是分散在不同环节。

在这样的背景下,“AI工厂”成为黄仁勋重新定义数据中心的关键,它更像一个生产系统,而不是设备集合。DGX这类产品,本质上是把硬件、软件和运行环境一起交付,客户买到的,不再是一块GPU,而是一种持续产出能力。走到这一步,英伟达的位置也发生了变化,更接近基础设施本身,而不只是芯片供应商。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一旦任务落到某部门头上,部门第一反应不是“我怎么把它干好”,而是“我还能拉上谁”。

一旦任务落到某部门头上,部门第一反应不是“我怎么把它干好”,而是“我还能拉上谁”。

碧翰烽
2026-05-11 07:17:40
孙颖莎王曼昱的教练还有这一面?马琳在世乒赛“修行”:每一场都是新开始

孙颖莎王曼昱的教练还有这一面?马琳在世乒赛“修行”:每一场都是新开始

上观新闻
2026-05-10 21:58:07
职称要倒查十年了

职称要倒查十年了

新浪财经
2026-05-10 14:14:04
重庆车祸后续:女司机身份被扒,当地人曝技术差,挪车都要人指挥

重庆车祸后续:女司机身份被扒,当地人曝技术差,挪车都要人指挥

南城无双
2026-05-11 02:17:55
泽连斯基警告:俄军一旦恢复大规模空袭,乌军远程打击将立刻重启

泽连斯基警告:俄军一旦恢复大规模空袭,乌军远程打击将立刻重启

桂系007
2026-05-11 04:50:35
张本美和丢冠并无沮丧!笑着解说男团决赛 击败王曼昱直言有收获

张本美和丢冠并无沮丧!笑着解说男团决赛 击败王曼昱直言有收获

颜小白的篮球梦
2026-05-11 06:52:19
别被孙颖莎的“大心脏”骗了!台湾解说惊呼背后,藏着3大真相

别被孙颖莎的“大心脏”骗了!台湾解说惊呼背后,藏着3大真相

格斗社
2026-04-03 20:24:03
特朗普拒绝中方要求,美媒连忙警告:别摆架子,中国不期待你访华

特朗普拒绝中方要求,美媒连忙警告:别摆架子,中国不期待你访华

影孖看世界
2026-05-10 23:17:13
德云社弟子大洗牌!3人自断后路,岳云鹏边缘,烧饼一哥地位稳了

德云社弟子大洗牌!3人自断后路,岳云鹏边缘,烧饼一哥地位稳了

白面书誏
2026-05-08 15:52:08
为了冲10%增长,越南赌场KTV全面松绑

为了冲10%增长,越南赌场KTV全面松绑

凤眼论
2026-05-10 22:14:23
大伯出狱全家没人接,我开车去接他,他偷偷塞我一张卡说有1200万

大伯出狱全家没人接,我开车去接他,他偷偷塞我一张卡说有1200万

千秋文化
2026-05-09 20:08:48
打过科兴疫苗的朋友,最近一定要提高警惕!千万不要被骗!

打过科兴疫苗的朋友,最近一定要提高警惕!千万不要被骗!

网络易不易
2026-05-10 11:34:41
FIFA以1.2亿美元“贱卖”世界杯转播权,CCTV该不该接?

FIFA以1.2亿美元“贱卖”世界杯转播权,CCTV该不该接?

新浪财经
2026-05-10 18:02:01
巴萨2-0皇马 提前3轮夺冠

巴萨2-0皇马 提前3轮夺冠

上游新闻
2026-05-11 07:12:03
尼克斯横扫费城:唐斯与恩比德的命运与角色

尼克斯横扫费城:唐斯与恩比德的命运与角色

张佳玮写字的地方
2026-05-11 06:55:13
她18岁为人母,25岁四登春晚,跟逃犯睡了6年却不知对方身份?

她18岁为人母,25岁四登春晚,跟逃犯睡了6年却不知对方身份?

白面书誏
2026-05-09 14:59:44
大S女儿开通社媒!只关注徐家人没理睬爸爸,还点赞大S具俊晔合照

大S女儿开通社媒!只关注徐家人没理睬爸爸,还点赞大S具俊晔合照

萌神木木
2026-05-10 18:12:46
赢球还道歉?梁靖崑赛后哽咽全程不敢看镜头,心里是憋了多大委屈

赢球还道歉?梁靖崑赛后哽咽全程不敢看镜头,心里是憋了多大委屈

乐悠悠娱乐
2026-05-10 11:56:28
胎压2.5是谎言?干了十年汽修,我来告诉你真正的标准!

胎压2.5是谎言?干了十年汽修,我来告诉你真正的标准!

娱乐圈的笔娱君
2026-05-10 01:52:36
普京表态引发关注,双方启动交换战俘,俄乌冲突“正走向结束”?

普京表态引发关注,双方启动交换战俘,俄乌冲突“正走向结束”?

环球网资讯
2026-05-11 07:00:15
2026-05-11 09:32:49
商学院杂志 incentive-icons
商学院杂志
本号由《中国经营报》社有限公司主办,为商业领袖提供管理实践与方法
7122文章数 22743关注度
往期回顾 全部

科技要闻

股价一年暴涨160%!谷歌凭什么?

头条要闻

男子将女邻居手机号写在公厕致其频遭骚扰 一审获缓刑

头条要闻

男子将女邻居手机号写在公厕致其频遭骚扰 一审获缓刑

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

"手搓汽车"曝光:伪造证件、电池以旧代新

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

游戏
本地
房产
数码
军事航空

IGN10分新游玩法太迷!玩家称其“纯看动画通关”

本地新闻

用苏绣的方式,打开江西婺源

房产要闻

低价甩卖!海口这个地标商业,无人接盘!

数码要闻

Valve老款ZOTAC Steam主机十年后再营业:显存仅3GB 仍能跑通《丝之歌》!

军事要闻

伊朗革命卫队深夜警告

无障碍浏览 进入关怀版