网易首页 > 网易号 > 正文 申请入驻

当黄仁勋和吴泳铭喊出同一个英文单词

0
分享至

文|邱晓芬

编辑|苏建勋

美国旧金山当地时间3月16日,英伟达GTC 2026大会正式开幕。在英伟达创始人兼CEO黄仁勋两个小时慷慨激昂的主题演讲中,贯穿的一个关键词是——Token。


△ 黄仁勋,图源:发布会截图

无独有偶,在GTC 2026的前一天,阿里巴巴宣布成立Token事业群——这是地位与淘天电商、阿里云一般的核心独立事业群。这个新事业群里,阿里也明确了“创造Token、输送Token、应用Token”链路。

Token,是大模型处理文本信息时的基本语义单位。当你输入一段文本时,模型会先通过分词器,将文本切割成一系列Token。这些Token随即被转换为数值向量,被输送到GPU里进行大规模矩阵计算。

在过去,AI产业链上的不同角色,有各自关注的指标和评价标准——底层大模型团队关注模型参数规模、上层的应用团队则用户增长和日活跃度,云服务团队关注算力的利用率和实际收入。

阿里巴巴CEO吴泳铭在内部指出,AI Agent极度依赖Token,未来将进入一个“需求大爆炸”的时期。

而阿里和英伟达此次前后脚强调token,传递的讯号是,在Agent时代来临时,两家巨头希望从技术、产品和商业维度,先行统一度量衡。

或许到不远未来,AI领域的一切指标都要加上一个后缀:“/ 1M tokens”。

万亿叙事:从数据中心到token工厂

“推理拐点已然到来”,黄仁勋在GTC演讲中指出。过去两年,推理计算量增长了约一万倍,使用量增长了约100倍。百万倍的增长,背后实际可感的变化是,AI的作用逐渐从原来的感知、到生成、到推理,再到能工作。

在这个变化下,黄仁勋在演讲中指出,token与AI企业收入的相关性也越来越清晰——一个企业能获得更多算力,就能生成更多token,收入就能提升,同时反哺AI变得更加智能。

这条传递链路下,英伟达是背后最大的受益者,目标也日渐激进。

2025年的GTC上,黄仁勋预测,Blackwell和Rubin平台在2026年之前采购订单规模预期是5000亿美元。而此次GTC上,他给出明年的新目标是,这一数字将翻倍到1万亿美元以上。这一雄心,很快得到二级市场的反应,一度推动英伟达的股价上涨4.3%。

为了支撑这一万亿增长目标,黄仁勋提出了英伟达的全新叙事——从数据中心到token工厂。


△英伟达的收入构成,图源:发布会截图

黄仁勋认为,在未来,每一家AI公司、云服务商,都应该以token工厂的效率作为核心经营指标。

甚至,未来的token还将成为全新的“大宗商品”,并将以吞吐量、交互速度为分类标准重新定价。

黄仁勋在演讲中,将token分为四个价格区间——

免费层:高吞吐、低交互速度区域,主要以广告模式变现;

中级层(每百万token=3美元)、高级层(每百万token=6美元):吞吐量和交互速度平衡,主要是主流付费领域;

高速层(每百万token=45美元)、超高速层(每百万token=150美元):高溢价且高交互领域,也是Rubin架构和未来架构主攻的新市场。

黄仁勋强调,英伟达的三大架构都将让客户在免费层,实现极高的吞吐量,而在最高价值的推理层级上,英伟达的新架构吞吐量效率将提升35倍。


△黄仁勋的token经济学,图源:发布会截图

英伟达不再只是GPU芯片公司

不过,要实现万亿美金token工厂的雄心壮志,英伟达就不能和以前一样只是一家GPU公司。

英伟达显然也在改变自己的产品路线,不再简单粗暴堆算力,而是更关注整个平台的综合能力,尤其是推理表现

此次GTC上,黄仁勋交出了新答卷:专门为智能体推理设计了计算系统Vera Rubin——由7款新芯片、5个机架系统、1台超级计算机构成。

据介绍,Vera Rubin主要有以下几项亮点:

①GPU部分:72块GPU通过NVLink高速互联,不仅加速前填充(Prefill)的计算速度,同时保证生成Token时的响应速度(KV Cache);

②Vera CPU:当智能体调用工具时,往往涉及大量重复逻辑的操作、条件判断的操作,这都是GPU不擅长的。因此,英伟达设计了全新的Vera CPU,充当“调度员”,处理控制任务,解放GPU。Vera CPU还是全球唯一用LPDDR5的数据中心CPU。(作者注:低功耗的LPDDR5内存一般用于旗舰手机上)


△Vera CPU,图源:发布会截图

③BlueField 4 + CX 9存储平台:AI工厂需要大量数据处理,为此,英伟达重新构建了一个专为AI数据流优化的存储网络。

④CPO Spectrum-X交换机:将光引擎与交换机芯片封装在一起,是全球首款光封装光学以太网交换机,改变了过去传统的可插拔模块。

⑤完全使用液冷方案,安装时间从两天缩短到两个小时

据黄仁勋介绍,Vera Rubin将在2026年下半年开始出货,在具体使用时,Vera Rubin系统的优势表现在,推理速度将比上一代Blackwell Ultra快5倍,同时Token成本降低10倍,且在MoE模型里只需过去1/4的GPU。

值得注意的是,英伟达不久前收购了Groq LPU平台,并将其融入了英伟达的计算体系当中。

不过,大而全的Vera Rubin要与短小精悍的Groq LPU融合,必然会产生芯片调度问题。为此,英伟达专门为其打造了一个操作系统Dynamo。

可以把Dynamo操作系统理解为一个指挥家,将不同的特性的计算任务,分配给更合适的硬件执行,实现效率最大化。

黄仁勋建议,若工作负载以高吞吐为主,建议100% Vera Rubin;若大量工作负载为代码生成等高价值token生成诉求,可引入部分Groq芯片运用,比如25%。


△Groq 3 LPU,图源:发布会截图

目前,Groq LP30已进入量产,由三星代工,预计Q3出货。据介绍,这种异构协同设计,将使得数据中心在单位功耗下实现了35倍的性能飞跃,并且同时兼顾超低延迟、高价值推理服务。

除了Vera Rubin之外,英伟达方面还预告了下一代的GPU架构Vera Rubin Ultra(2028年推出)、Feynman架构。

概括而言,3D堆叠、LPU集成、异构存储、CPO(共封装光学)、铜互联都是未来英伟达平台的核心技术点。


△英伟达的平台路线构成(Blackwell、Rubin、Feynamn),图源:发布会截图

英伟达版OpenClaw,来了

此次演讲中,黄仁勋除了阐述野心,还把篇幅留给了当前大热的OpenClaw——作为人类历史上最受欢迎的开源项目,OpenClaw用几周的时间就超过了Linux过去三十年的成绩。

他认为,OpenClaw有着三大功能:能够解决管理资源(工具、大语言模型)、分解问题且调用智能体、多模态输出并执行,为此,OpenClaw本质上是一个智能体操作系统,地位和HTML、Linux一样重要。

在黄仁勋看来,未来,OpenClaw将重塑企业IT。未来,每一家SaaS公司将成为AaaS公司,在提供工具之外,还将提供每一个特定领域的AI智能体,“一个原本2万亿美元规模的产业,即将成长为数万亿美元规模”。

不过,黄仁勋也提出警示,当智能体可以自由调用企业的敏感数据和代码,OpenClaw将衍生安全风险。因此,英伟达也与OpenClaw的开发者Peter Steinberger合作,推出了企业版本NeMo Claw。

据介绍,NeMo Claw不仅集成了英伟达完整的智能体工具包,还提供了一系列的措施(网络护栏、隐私路由等),保证企业方的数据安全。


△ 英伟达版本OpenClaw,图源:发布会截图

黄仁勋甚至表示,在未来的硅谷的求职场景中,token可能会成为工程师们年薪总包的一部分,”入职附带token配额”,成为硅谷的新晋招聘话题。

图形学的“GPT时刻”

发布会开场,黄仁勋首先发布了神经渲染(Neural Rendering)技术DLSS 5,他将其称之为下一代图形计算技术、“图形学的GPT时刻”。

具体而言,在DLSS 5中,英伟达由两部分构成:在3D图形和结构化数据的基础上,融入生成式AI和概率计算。

两个部分各有贡献——3D图形和结构化数据,负责提供一个确定性的、符合物理规律的虚拟世界框架;生成式AI和概率计算,则用于填充这个“框架”,在原有的基础上,补充逼真的细节和动态变化。

黄仁勋称,这两种理念的融合,将使得制作的内容美观、经验、且可控。不过,要把这种新的范式推广到游戏之外的行业,比如金融、医疗、制造,首先要解决数据海量、异构的问题。

黄仁勋在演讲中也发表了他对于目前数据的看法。

当前,世界上大部分的数据形态存在形式是数据库、PDF、音频、视频。其中,有九成都是非结构化数据,在多模态感知与理解技术出现前,数据很难被高效查询和检索。

为此,英伟达推出了两个全新的数据工具,黄仁勋称其为全网最复杂的数据处理系统:

cuDF——处理确定性的结构化数据,比如表格、日志等。(对应前述DLSS 5中的“3D图形和结构化数据”部分)

cuVS——处理概率性的非结构化数据,比如通过AI模型把文本、图像、音视频等数据转换成语义向量。(对应前述DLSS 5中的“生成式AI和概率计算”部分)

目前,这两个数据平台已经被整合进IBM、戴尔、谷歌云等云服务和OEM体系中。

黄仁勋两个小时的演讲,提示了一个趋势,当AI的竞争从“模型竞赛”进入“生产力竞赛”,大家将不会像几年前一样抢GPU、抢算力,而是要抢夺token生产的主导权。

具体到行动上,英伟达提供的是从底层芯片(Rubin/Feynman)、异构架构(GPU+LPU+CPU)、系统设计(全液冷机柜)、再上层操作系统(OpenClaw、NemoClaw)、工具(DLSS5、cuDF、cuVS)的生产力套件,希望让token生产过程也像制造业一般,效率化、批量化。

end

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
为何说年龄超过80岁的人:即便身体健康,也没有多少来日方长?

为何说年龄超过80岁的人:即便身体健康,也没有多少来日方长?

芹姐说生活
2026-05-10 14:11:36
2.16万一把椅子!丰田皇冠驾驶座被改成办公椅:限量70把需抽签

2.16万一把椅子!丰田皇冠驾驶座被改成办公椅:限量70把需抽签

快科技
2026-05-10 20:05:15
尊界S800高定版亮相:200万级定价,华为要重新定义超豪华

尊界S800高定版亮相:200万级定价,华为要重新定义超豪华

灰度测试中
2026-05-09 21:59:06
刘强东在夜市与人拼桌!被误以为是人家爸,很多粉丝涌上去要合影

刘强东在夜市与人拼桌!被误以为是人家爸,很多粉丝涌上去要合影

童叔不飙车
2026-05-09 20:43:37
长得太美被导演占为己有,25岁生下3个孩子,如今个个都给她争光

长得太美被导演占为己有,25岁生下3个孩子,如今个个都给她争光

揽星河的笔记
2026-05-07 20:18:36
记者:山西输在了自己身上,刘传兴下场后进攻和篮板全都没了

记者:山西输在了自己身上,刘传兴下场后进攻和篮板全都没了

懂球帝
2026-05-10 22:35:26
遗憾官宣!陈赫直播透露:李晨加盟五哈彻底受阻,多次协调无果

遗憾官宣!陈赫直播透露:李晨加盟五哈彻底受阻,多次协调无果

一盅情怀
2026-05-10 17:29:06
陪玩陪睡根本不够!认干爹、舔手指,背地里的阴暗面完全藏不住了

陪玩陪睡根本不够!认干爹、舔手指,背地里的阴暗面完全藏不住了

杰丝聊古今
2026-05-03 13:35:27
张皓嘉三分绝杀,谁注意赵睿?下意识不防,赛后开心祝贺其绝杀!

张皓嘉三分绝杀,谁注意赵睿?下意识不防,赛后开心祝贺其绝杀!

篮球资讯达人
2026-05-10 00:14:53
伊朗革命卫队或将发动猛烈打击

伊朗革命卫队或将发动猛烈打击

参考消息
2026-05-10 10:36:03
德媒主编访华归来:深圳街头看到的一幕,让我为欧洲捏了一把冷汗

德媒主编访华归来:深圳街头看到的一幕,让我为欧洲捏了一把冷汗

補懂事的孩紙
2026-05-10 15:27:34
盲人女孩盲道上被电动车撞倒,肇事男子竟质问:“不看路啊”……最新消息

盲人女孩盲道上被电动车撞倒,肇事男子竟质问:“不看路啊”……最新消息

大风新闻
2026-05-10 20:42:04
队友惊呆了 姆巴佩最后5分钟退出训练+无缘国家德比 6战巴萨仅1胜

队友惊呆了 姆巴佩最后5分钟退出训练+无缘国家德比 6战巴萨仅1胜

风过乡
2026-05-10 20:58:17
换机无数才敢说真话:iPhone 14 Pro Max,才是苹果无可替代的巅峰

换机无数才敢说真话:iPhone 14 Pro Max,才是苹果无可替代的巅峰

叮当当科技
2026-05-10 15:22:07
尴尬!网红神裤成审美灾难,网友称市场有需求,有些人恨不得裸奔

尴尬!网红神裤成审美灾难,网友称市场有需求,有些人恨不得裸奔

火山詩话
2026-05-09 19:50:52
朱国华被枪毙后,康克清震怒:你们出了问题,都是在折腾你们爷爷

朱国华被枪毙后,康克清震怒:你们出了问题,都是在折腾你们爷爷

文史漫笔
2026-05-08 21:30:03
调查发现:经常吃苹果的人,不出半年时间,身体会出现这几个变化

调查发现:经常吃苹果的人,不出半年时间,身体会出现这几个变化

摇感军事
2026-05-09 20:58:21
街拍美女,身材真好

街拍美女,身材真好

蓝色海洋009
2026-05-10 07:36:29
甲钴胺立大功!医生研究发现:老人吃甲钴胺,或能缓解4种症状

甲钴胺立大功!医生研究发现:老人吃甲钴胺,或能缓解4种症状

39健康网
2026-05-10 19:33:58
特斯拉降价,扯下电动汽车成本的遮羞布——电动车的成本有多低?

特斯拉降价,扯下电动汽车成本的遮羞布——电动车的成本有多低?

社会日日鲜
2026-05-10 09:26:48
2026-05-10 22:52:49
36氪 incentive-icons
36氪
让一部分人先看到未来
151327文章数 2848758关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

谈判陷僵局 世界杯转播费报价大幅降低央视仍不接招

头条要闻

谈判陷僵局 世界杯转播费报价大幅降低央视仍不接招

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

数码
旅游
游戏
本地
公开课

数码要闻

Q1中国客厅智能设备线上市场:显示设备销量全线下滑

旅游要闻

一路向前,自在骑行!田园社骑行驿站成为庆云打卡新地标

《流放之路2》有望在5月底获得Steam Deck认证

本地新闻

用苏绣的方式,打开江西婺源

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版