网易首页 > 网易号 > 正文 申请入驻

黄仁勋塑造“Token经济学” 英伟达拥抱智能体时代

0
分享至

3月17日凌晨,被誉为AI“超级碗”与AI“春晚”的英伟达GTC开幕,“AI教主”、英伟达创始人兼CEO黄仁勋再次站在舞台中央,用一场技术风暴刷新着物理极限。

英伟达宣布,Vera Rubin(最新芯片架构)目前已有七款新芯片全面投入生产,Vera Rubin平台正在开启 Agentic AI新时代,构建全球最大的AI工厂。

具体而言,这些芯片产品包括:NVIDIA Vera CPU(英伟达已进军服务器CPU),NVIDIA Rubin GPU(GPU王牌产品),NVIDIA NVLink 6(第六代NVLink交换机芯片,芯片内部互联),NVIDIA ConnectX-9 SuperNIC(超级网卡),NVIDIA BlueField-4 DPU (存储芯片),NVIDIA Spectrum-6 (以太网交换机芯片,支持CPO技术),以及新集成的 NVIDIA Groq 3 LPU(收编Groq后的首款芯片)。

可以看到,芯片家族中不仅有大家平常熟知的CPU、GPU产品,还包括来自Groq的LPU,以及存储芯片、交换机芯片等全系产品。这些芯片又能够组成5款机架,在数据中心运行。

“Vera Rubin是一次代际跃迁——七个突破性芯片、五种机架、一台巨型超级计算机——为AI的每一个阶段提供动力,”黄仁勋表示,“随着Vera Rubin的推出,Agentic AI的拐点已经到来,并将开启历史上最大规模的基础设施建设。”

在演讲中,黄仁勋还预测,Blackwell与Rubin的AI芯片,到2027年底的收入将达到1万亿美元,相比去年10月的5000亿美元销售预测,已经翻倍。

这场发布会可谓“前所未有”,这不单单是GPU、也不单是某一项技术升级,黄仁勋再次强调“Token”经济学,并贯彻AI“五层蛋糕”理论。

一个趋势是,巨头们正在不断聚集能力,补齐短板,延伸上下游,形成更加强大的壁垒。单一比拼芯片、性能等单打独斗的阶段已经过去,一场全方位的系统级激烈竞赛正在上演。

Vera Rubin的彻底革新:从单芯片到系统级时代

作为Blackwell的跨代接力者,英伟达定于2026年下半年量产的Rubin (R100) 架构。在核心底层,该架构全面转场台积电3nm (N3P) 工艺,其标志性的Vera CPU(基于88核自研Olympus 架构)与Rubin GPU通过1.8 TB/s的NVLink-C2C技术实现了物理意义上的同封装集成。

这种“去PCIe化”的紧耦合设计,让算力不再受限于传统链路,单GPU在NVFP4精度下的推理算力增至50 PFlops,训练算力达35 PFlops,其规模化推理能效较Blackwell提升了5倍之多。

在应用场景层面,Rubin是专门为 “代理型AI(Agentic AI)” 与长上下文推理打造的数字工厂心脏。它引入了Transformer Engine 3.0与Inference Context Memory存储平台,通过BlueField-4 DPU卸载存储管理压力,使得AI智能体能够处理数万个Token的上下文关联,并进行多步逻辑推理与实时决策,平台配备了支持硅光子技术(CPO)的Spectrum-X Ethernet Photonics网络,单机柜NVL72的内部互联总带宽达到260 TB/s,相当于全球互联网跨境带宽总和的数倍。

英伟达还推出了Vera CPU机架,它是基于英伟达MGX构建的高密度液冷基础设施,集成256个Vera CPU,以提供可扩展、节能的容量,并具备世界级单线程性能。与GPU计算机架一起,它们为大规模Agentic AI和强化学习提供CPU基础——Vera 的效率是传统CPU的两倍,速度提升50%。

目前,与英伟达合作部署Vera CPU的客户包括阿里巴巴、字节跳动、Meta和Oracle Cloud Infrastructure,以及CoreWeave、Lambda、Nebius和Nscale。Vera已经全面投产,并将在今年下半年供货。

传统的数据中心、AI基建正在面临新的变革。黄仁勋表示:“在AI时代,智能Token是新的货币,而 AI工厂是生成这些Token的基础设施。通过 Vera Rubin DSX AI Factory 参考设计和 Omniverse DSX Blueprint(数字孪生蓝图),我们正在提供构建世界上最高生产力AI工厂的基础,加速首次收入时间,并最大化规模和能源效率。”

Groq LPU推理芯片:与GPU构建混合算力帝国

再看非常受关注的Groq芯片。

2025年底,英伟达通过200亿美元战略授权并深度集成的Groq LPU (Language Processing Unit) 架构,是精准猎杀延迟、开启实时交互时代的“超音速截击机”。

英伟达表示,此次推出的Groq 3 LPX(机架)标志着加速计算的一个里程碑。LPX机架包含256个LPU处理器,具有128GB片上SRAM和640 TB/s的扩展带宽。当与Vera Rubin NVL72一起部署时,Rubin GPU和LPU通过共同计算AI模型每一层来提升解码速度,从而为每个输出Token提供计算。

同时,LPX采用全液冷设计,并基于MGX基础设施构建,将无缝集成到下一代Vera Rubin AI工厂中,并将在今年下半年提供。

进入推理时代,英伟达在GPU之外,融合了新的架构,大幅提升效率。

在技术架构上,Groq LPU抛弃了传统GPU中复杂的缓存管理、分支预测和指令重排等“猜测性”硬件设计,转而采用一种确定性流水线架构。这种设计将硬件复杂度彻底剥离至编译器层,使得数据在芯片内的流动如同精密的传送带,没有任何不可控的抖动(Jitter)。

在实战应用场景中,由英伟达技术加持的LPX机架,正成为“代理型AI(Agentic AI)”与“实时语音交互”的唯一救星。在自动驾驶辅助系统或高频交易机器人中,任何毫秒级的计算波动都可能导致决策失效,而LPU的确定性算力保证了任务执行时间永远恒定。

对于需要多步推理甚至涉及数百次模型调用的复杂Agent链条,LPU能将原本需要数分钟的串联思考缩短至数秒,使得AI能够像人类一样进行自然、流利的实时对话与协同。为了承载这一全新的计算范式,英伟达将LPU单元通过NVFusion技术无缝嵌入其庞大的CUDA生态,通过 disaggregated(解耦式)架构将训练好的权重从GPU快速调度至LPU推理阵列。

在这一能力加持下,英伟达将训练和推理分离,构建了一个混合算力帝国:GPU负责在后方深耕万亿参数模型的训练与长文本预处理,而LPU阵列则在前方防线以10倍于对手的能效比与极速响应,统治着万亿级的实时推理市场,正式宣告了“推理即时化”时代的到来。

英伟达版“龙虾”面世:拥抱智能体时代

与此同时,英伟达围绕AI代理(Agent)、开放模型以及跨行业应用发布了一系列重要进展。最受开发者关注的一项发布,是面向OpenClaw社区推出的NemoClaw软件栈。近期,开源项目OpenClaw在开发者社区迅速走红,被不少业内人士视为“个人AI操作系统”的雏形。

黄仁勋也高度评价了OpenClaw。“OpenClaw向所有人打开了AI的下一个前沿,并成为历史上增长最快的开源项目,”黄仁勋表示,“与传统AI应用不同,OpenClaw的目标是让AI代理像应用程序一样持续运行,能够自主规划任务、调用工具,并完成复杂工作流程。”

在这一框架下,NemoClaw提供了一整套基础软件能力,使开发者可以通过一条命令安装NVIDIA Nemotron模型以及新发布的OpenShell运行时环境,并为AI代理增加安全与隐私控制能力。借助OpenShell提供的隔离沙箱环境,AI代理在访问工具和数据时可以遵循既定的安全策略与隐私规则,从而在提升效率的同时保证数据安全。

NemoClaw还支持本地模型与云端模型的混合调用。开发者可以在用户专用设备上运行Nemotron模型,同时通过隐私路由访问云端的前沿模型,从而在保证数据隐私的同时获得更强的计算能力。英伟达表示,NemoClaw可以运行在多种专用计算平台上,包括搭载GeForce RTX显卡的PC和笔记本电脑、RTX PRO工作站,以及DGX Station和DGX Spark系统,为全天候运行的AI代理提供稳定算力。

在推动AI代理平台发展的同时,英伟达也在加速构建开放模型生态。此次大会上,英伟达宣布成立Nemotron Coalition(Nemotron联盟),联合全球多家领先AI实验室与模型开发机构,共同推进开放前沿模型的发展。

除了生态层面的合作,英伟达也同步扩展了多条开放模型产品线,以支持AI代理、物理智能以及医疗科研等不同领域的发展。其中,NVIDIA Nemotron 3系列模型进一步强化多模态理解能力,推出Ultra、Omni和VoiceChat等多个版本。相关模型能够同时处理语言、视觉与语音信息,使AI代理不仅可以进行自然对话,还能够完成复杂推理任务,并从视频和文档等多种数据来源中提取关键信息。

除了数字世界中的AI代理,英伟达还在推动人工智能进入现实世界。此次发布的新模型包括用于机器人和自动驾驶系统的多种基础模型。例如,NVIDIA Isaac GR00T N1.7是一款面向类人机器人的视觉语言行动模型,能够支持机器人在现实环境中进行感知、推理和行动决策。

NVIDIA Alpamayo 1.5则面向自动驾驶场景,通过导航提示、多摄像头支持以及可配置摄像头参数等能力提升车辆推理能力;而即将推出的NVIDIA Cosmos 3则被称为首个统一“世界生成、物理推理和行动仿真”的世界基础模型,有望帮助机器人和自动驾驶系统在复杂环境中完成训练与决策。

从AI代理平台到开放模型生态,再到机器人、自动驾驶与生命科学等应用领域,英伟达正在逐步搭建一个覆盖数字世界与物理世界的AI技术体系。随着更多开发者和企业加入开放模型与AI代理生态,这一体系也有望进一步推动人工智能在全球范围内的创新与落地。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
丑鞋出海卖爆了,卖家狂赚400万

丑鞋出海卖爆了,卖家狂赚400万

跨境派Pro
2026-05-09 14:14:21
宝马新车提回家 引擎盖现一窝猫 4S店:检测洗车未发现 愿提供检查与关怀补偿

宝马新车提回家 引擎盖现一窝猫 4S店:检测洗车未发现 愿提供检查与关怀补偿

快科技
2026-05-09 20:16:11
画大饼丑闻!40亿投资迟迟不到位,斯威士兰直接曝光台当局赖账

画大饼丑闻!40亿投资迟迟不到位,斯威士兰直接曝光台当局赖账

健身狂人
2026-05-10 15:02:05
山姆成“欠款大户”?雨花客厅北区法拍公告披露:山姆欠租887万元

山姆成“欠款大户”?雨花客厅北区法拍公告披露:山姆欠租887万元

扬子晚报
2026-05-10 20:25:23
徐帆回应离婚9个月后,冯小刚和其前任同聚,和养女关系引争议

徐帆回应离婚9个月后,冯小刚和其前任同聚,和养女关系引争议

小武侃风云
2026-05-11 03:29:15
Nice!杜兰特点赞!勇士第一笔重磅签约

Nice!杜兰特点赞!勇士第一笔重磅签约

篮球实战宝典
2026-05-10 19:42:35
中央明确!6月1日全国开始统一执行,居民自来水将迎7大变化

中央明确!6月1日全国开始统一执行,居民自来水将迎7大变化

美食格物
2026-05-10 15:13:10
赖着不走、不达目的绝不返程!美国国会代表团在华超长滞留

赖着不走、不达目的绝不返程!美国国会代表团在华超长滞留

健身狂人
2026-05-10 19:30:43
互联网是有记忆的,她的黑历史一大堆啊!

互联网是有记忆的,她的黑历史一大堆啊!

BenSir本色说
2026-04-15 22:38:07
演都不演了!母亲节大S女儿小玥儿开通账号,不到24小时遭网暴

演都不演了!母亲节大S女儿小玥儿开通账号,不到24小时遭网暴

大中国
2026-05-11 09:09:55
果不其然,特朗普访华又生变数?中方提的要求,美方竟然一口回绝

果不其然,特朗普访华又生变数?中方提的要求,美方竟然一口回绝

说历史的老牢
2026-05-10 05:43:22
0-2落后!王皓激励:“老梁相信自己 就当输了” 梁靖崑随后连赢3局

0-2落后!王皓激励:“老梁相信自己 就当输了” 梁靖崑随后连赢3局

林子说事
2026-05-10 19:03:18
早田希娜赛后痛哭:一局都没拿下满是愧疚,辜负了所有人的支持

早田希娜赛后痛哭:一局都没拿下满是愧疚,辜负了所有人的支持

懂球帝
2026-05-10 23:29:40
一日夫妻百日恩?这一次,马伊琍和文章联手给娱乐圈“上了一课”

一日夫妻百日恩?这一次,马伊琍和文章联手给娱乐圈“上了一课”

情感大头说说
2026-05-10 15:12:56
张凌赫爆红后《刺棠》女主换人!王玉雯被资本抛弃,田曦薇捡漏?

张凌赫爆红后《刺棠》女主换人!王玉雯被资本抛弃,田曦薇捡漏?

手工制作阿歼
2026-05-10 20:46:17
黄紫昌:对手每个球员都踢得非常合理,我们队也非常团结

黄紫昌:对手每个球员都踢得非常合理,我们队也非常团结

懂球帝
2026-05-10 21:19:24
我的两个舅舅,一个用690万投进股市,一个把690万存进余额宝

我的两个舅舅,一个用690万投进股市,一个把690万存进余额宝

起飞做故事
2026-05-07 15:49:53
以静制动!北京使出杀威棒

以静制动!北京使出杀威棒

柳扶风
2026-05-11 09:22:46
为什么说阳痿、跑步、心梗,成了“斩杀”中年男性的“三件套”?

为什么说阳痿、跑步、心梗,成了“斩杀”中年男性的“三件套”?

医药养生保健报社
2026-04-28 17:59:19
脑科学警告:父母这4句口头禅,正在闭合孩子大脑,12岁后难弥补

脑科学警告:父母这4句口头禅,正在闭合孩子大脑,12岁后难弥补

新东方家庭教育
2026-05-07 17:14:19
2026-05-11 10:20:49
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
247026文章数 744228关注度
往期回顾 全部

科技要闻

股价一年暴涨160%!谷歌凭什么?

头条要闻

美国经济学家:"台独"是中美共同的敌人 意味着战争

头条要闻

美国经济学家:"台独"是中美共同的敌人 意味着战争

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

"手搓汽车"曝光:伪造证件、电池以旧代新

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

本地
时尚
教育
数码
公开课

本地新闻

用苏绣的方式,打开江西婺源

轻松拿捏又甜又酷的造型,试试这些轻熟穿搭,温柔有女人味儿

教育要闻

发表第一篇文章就被人大复印资料转载,这位教师是怎么做到的?

数码要闻

消息称雷克沙存储卡产品6月1日起涨价,涨幅最高25%

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版