CES 2026的特别演讲中不能没有NVIDIA黄仁勋,在正式开展前夕,NVIDIA创始人兼CEO黄仁勋用物理AI的故事主线描述了下一代AI的可能性。与此同时,Vera Rubin这位暗物质研究先驱、天文学家,也终于随着NVIDIA下一代CPU和GPU正式发布被更多人所记住。
![]()
下一代AI计算平台Vera Rubin不仅仅是算力的再度提升,也将全面覆盖更多商用领域,包括自动驾驶、机器人、医疗、通用AI。2.5吨的Vera Rubin NVL72出现在老黄背后那一刻,一场高度协同设计、彻底淘汰传统水冷模组的最前沿AI解决方案,被提上议程。
![]()
Blackwell到Vera Rubin:6颗芯片一次更换
黄仁勋上来就给了一个大招,Blackwell的解决方案已经走到了传统计算基础设施的尽头,就换而言之,过去十年投下去的约10万亿美元传统计算基础设施,必须被加速计算与AI重做一遍,否则无法支撑每年10倍模型体量和5倍生成内容的增长速度。
![]()
因此Vera Rubin的升级是一整套解决方案,包括双芯片封装的Rubin GPU,ARM v9 144核的Vera CPU。这样的前提下,需要BlueField-4 DPU外挂16TB的KV-Cache,以及NVLink Switch 7提供1.8TB/s的传输总线,2个1.6Tbps的光收发芯片,一组效率高达94%的DC/DC电源模组,主打一个猛上加猛,一整套解决方案安装到整机也冷的NVL72机组上,重量达到2.5吨。
![]()
![]()
重归重,带来的性能飞跃也是非常直接的。相比上一代Blackwell,Rubin的NVFP4推理性能提升5倍,训练性能提升3.5倍,HBM4内存带宽提升2.8倍,NVLink互连带宽翻倍,生成token成本降至现在的1/10。
![]()
![]()
![]()
例如运行相同70B参数MoE模型的时候,Blackwell生成2048 token需要1.8秒,弹道了Rubin仅需要0.35秒,并且能耗降低60%。
另外,在BlueField-4 DPU的加持下,KV-Cache可以帮助GPU显存卸载到机架共享的内存池上,每颗GPU都可以额外扩展16TB高速内存,从而实现近乎无限的长对话、长视频理解。
![]()
![]()
新硬件搭配全新的NVFP4下还能更进一步,NVFP4可以保持>99.2%精度的前提下,把每次推理的位宽砍半,同时显存带宽需求减半,进而实现成本降到上一代1/10。黄仁勋在演讲上表示,模型大小年增长10倍,生成内容年增长5倍,而用户愿意为每token支付的费用年降10倍,因此只有靠全栈协同设计才能活下去。
![]()
目前Vera Rubin已经在台积电N3产线流片,计划在2026Q2规模出货,戴尔、HPE、联想、Supermicro等OEM会在2026年下半年开始整机交付,从而启动新一轮的AI算力迭代。
![]()
物理AI近在咫尺
AI加速的意义已经在现实中被得以展现,当2个BDXdroids走上演讲台就是最直接的证明。现在的AI已经跑通了从虚拟到物理、再由物理回馈虚拟AI的闭环,通过训练、仿真、部署的路径加速物理AI的可行性。
![]()
![]()
![]()
而这整个过程也已经由NVIDIA跑通,先使用DGX进行训练,然后通过Omniverse、Cosmos在孪生世界进行仿真,最后通过AGX、Orin展开机器人部署,一气呵成。
![]()
更重要的是,NVIDIA在现场宣布三大物理AI支柱已经开源,Cosmos World基础模型可以完成视频到动作的联合训练,GROOT 1.6人形机器人推理模型提供32自由度协调,Isaac Lab Arena仿真安全测试框架包含了50万条机器人轨迹基准。这套为了卖更多GPU而打造免费软件生态的形式在GeForce消费端屡试不爽,大多数时候NVIDIA提供的软件生态不仅免费,用起来还挺高效,很快就会让人欲罢不能。
![]()
![]()
物理AI当然不会仅限制在机器人。黄仁勋在现场正式发布了自动驾驶智能体Alpamayo,这是一个会思考的自动驾驶,现场的DEMO视频演示了一段搭载Alpamayo的自动驾驶系统由驰骋在旧金山,从傍晚的夕阳落日到华灯初上,这套自动驾驶系统很好的规避了所有可能出现的意外状况,并且一边开车一边用自然语言解释驾驶逻辑,比如前方施工时,如何做出一个类似人类的自然判断,进而给出合理解决方案。
![]()
![]()
![]()
在发布Alpamayo的同时,NVIDIA也同步宣布Alpamayo R1模型开源,提供权重、数据集、训练脚本、CarSim/CarMaker接口,2025款梅赛德斯奔驰CLA已经展开测试,并将在北美地展开OTA推送。
![]()
![]()
在Alpamayo R1开源的同时,NVIDIA还放出了多个开源模型,包括蛋白质复合体结构预测的OpenFold3,多蛋白相互作用生成预测的Evolve2,两公里内的气象模拟模型Eath-2,12小时化学污染扩散模型ForecastNet-Chem。10T token多模态开源数据集中包含了45.5万蛋白质结构、100TB车载传感器数据,鼓励学术机构自由下载。
![]()
AI生态的开源进阶时
黄仁勋在现场强烈表扬了AI的开源生态。在2024年,开源AI落后闭源AI有18个月的差距,在2026年的现在,这个差距只剩6个月,来自中国的DeepSeek-R1、Qwen2.5、Kimi k1.5为开源AI创造出了无数可能。
![]()
当开源与闭源无限接近,黄仁勋表示,任何企业和个人都有机会推动AI从语言理解的拐点,转向理解物理的拐点,NVIDIA也将从数据中心AI公司,变成物理世界AI基础设施的公司。
![]()
![]()
无论如何,NVIDIA都在扮演制造工具的角色,从最初制造游戏运行的工具,到现在制造AI加速的工具,推动一个生态往更广阔的领域发展。有意思的是,在近几十年中,AI概念被尝试和热捧了数次,而只有这一次AI的火把终于被完全点燃,成功从虚拟世界走向现实的物理世界,成为人类文明进程中的一个全新注脚,这一刻的星光闪耀时,无论是NVIDIA还是无数研究AI领域的工作者们,都值得称赞。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.