网易首页 > 网易号 > 正文 申请入驻

英伟达Rubin平台量产:整合6款全新芯片,推理Token成本降低10倍

0
分享至


1月6日,英伟达(NVIDIA)首席执行官黄仁勋在CES2026展会发表主题演讲,正式推出最新的英伟达Rubin平台,并表示“已全面投入量产”。

Rubin平台由6款全新芯片组成,涵盖Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4 DPU及Spectrum-6以太网交换机的极致协同设计,整合为一台性能惊人的AI超级计算机,可以大幅缩短AI训练时间并降低推理Token生成成本。目前,这六款芯片已从合作制造方处回厂,并通过部分关键测试,整体进度正按计划推进。


据英伟达公布的数据,Rubin平台的训练性能达到前代Blackwell的3.5倍,运行AI软件的性能提升5倍。此外,其推理每个代币(Token)生成成本相较于英伟达Blackwell平台可降低多达10倍,与前一代相比,英伟达Rubin平台在训练MoE模型时所需的GPU数量减少至原来的四分之一,进一步推动人工智能的普及应用。

具体来说,Rubin平台带来了五项关键创新,包括最新一代的英伟达NVLink互连技术、Transformer引擎、机密计算(Confidential Computing)与RAS引擎,以及英伟达Vera CPU。这些突破将加速代理式人工智能、高级推理能力和超大规模混合专家(MoE)模型的推理。

新一代Vera CPU基于新一代Armv9.2架构的定制化核心(代号Olympus),专为代理推理设计,总共集成了88个核心、176线程(支持英伟达空间多线程技术),配备1.8 TB/s NVLink-C2C一致性内存互联通道,支持1.5 TB系统内存(为Grace平台的3倍),通过SOCAMM LPDDR5X实现1.2 TB/s内存带宽,并具备机架级机密计算能力。这些特性共同带来相较于Grace平台2倍的数据处理、压缩及CI/CD性能提升。


Rubin GPU集成第三代Transformer引擎,具备硬件加速自适应压缩功能,可为AI推理提供50 petaflops的NVFP4算力。每个GPU带宽达3.6TB/s,而Vera Rubin NVL72机架的整体带宽更提升至260TB/s。


ConnectX-9 SuperNIC通过InfiniBand和以太网支持每端口800Gb/s的速度,为千兆级人工智能计算工作负载提供强大支持。它提供了极其快速、高效的网络连接,显著提升了人工智能工厂和云平台的系统性能。

强大的网络连接助力 NVIDIA ConnectX-9 SuperNIC 推动加速、千兆级人工智能计算架构的下一波创新。ConnectX-9 SuperNICs 与下一代 NVIDIA Spectrum-X 以太网和 NVIDIA Quantum-X800 网络平台无缝集成,为 NVIDIA Rubin GPU 提供高达每秒 1.6 Tb/s 的吞吐量。


这些平台提供了万亿参数GPU计算、分解服务架构和代理式人工智能应用所需的稳健性、功能集和可扩展性。凭借增强的能效,ConnectX-9 SuperNIC支持创建运营数十万台GPU的可持续人工智能数据中心,确保为人工智能的发展提供面向未来的基础设施。

ConnectX-9 SuperNIC还可提供增强的可编程输入/输出(IO)和基于遥测的拥塞控制功能,实现了业界领先的网络性能和峰值人工智能(AI)工作负载效率。此外,ConnectX-9 InfiniBand SuperNIC扩展了NVIDIA可扩展分层聚合与归约协议(SHARP)™的功能,以增强NVIDIA在高性能计算环境中的网络内计算能力,从而进一步提升科学计算工作负载、大规模训练和推理的整体效率和性能。

NVIDIA BlueField-4一款专为千兆级推理打造的新型人工智能原生存储基础设施所需的800G DPU,可助力智能体人工智能的加速与扩展。其整合了64核心的Grace CPU和ConnectX-9 SuperNIC,相比BlueField-3实现2倍网络传输能力、6倍计算性能与3倍内存带宽提升。据介绍,英伟达推理上下文内存存储平台通过扩展GPU内存容量,构建起上下文内存支撑架构,实现节点间的高速数据共享。相较于传统存储方案,该平台可使每秒令牌处理量提升最高5倍,能效提升最高5倍。


第六代NVLink交换机为Rubin平台提供网络架构,采用400G SerDes技术,每CPU支持3.6 TB/s全对全带宽,总带宽达28.8 TB/s,支持14.4 TFLOPS FP8网络内计算,并采用100%液冷设计方案。


所有这些技术最终汇聚于英伟达Vera Rubin NVL72机架系统,集成了72颗英伟达Rubin GPU、36颗英伟达Vera CPU、英伟达NVLink 6、英伟达ConnectX-9 SuperNIC以及英伟达BlueField-4 DPU。相较Blackwell平台实现显著性能跃升。

具体数据如下:NVFP4推理性能提升5倍(达3.6 EFLOPS)、NVFP4训练性能提升3.5倍(达2.5 EFLOPS)、LPDDR5x内存容量提升2.5倍(达54 TB)、HBM4显存容量提升1.5倍(达20.7 TB)、HBM4显存带宽提升2.8倍(达1.6 PB/s)、纵向扩展带宽提升2倍(达260 TB/s)。


英伟达同时还发布Spectrum-X以太网共封装光学解决方案,提供102.4 Tb/s横向扩展交换架构,集成200G硅光共封装技术,在大规模部署中可实现95%的有效带宽利用率。该系统能效提升5倍,可靠性增强10倍,应用程序运行效率提高5倍。


此外,英伟达还推出了NVIDIA DGX SuperPOD™作为大规模部署Rubin系统的参考架构,集成了NVIDIA DGX Vera Rubin NVL72或DGX Rubin NVL8系统,并搭配了NVIDIA BlueField-4 DPU、NVIDIA ConnectX-9 SuperNIC、NVIDIA InfiniBand网络以及NVIDIA Mission Control软件。


此外,针对主流数据中心市场,英伟达还将推出NVIDIA DGX Rubin NVL8配置方案。这是一款通过NVLink连接8颗Rubin GPU的服务器主板,用于支持基于x86的生成式AI平台。HGX Rubin NVL8平台可加速AI与高性能计算(HPC)工作负载的训练、推理及科学计算。

英伟达透露,包括亚马逊AWS、谷歌云、微软Azure和甲骨文云在内的多家云服务商将于2026年率先部署基于Vera Rubin的实例。此外,CoreWeave、Lambda、Nebius和Nscale等云合作伙伴也将陆续跟进。

编辑:芯智讯-浪客剑

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
购洗碗机遭丈夫砸家后续:女子回应披露更多细节,家当下仍有外债

购洗碗机遭丈夫砸家后续:女子回应披露更多细节,家当下仍有外债

天天热点见闻
2026-01-09 08:34:00
大跳水!暴跌95%,国产葡萄酒彻底崩了?

大跳水!暴跌95%,国产葡萄酒彻底崩了?

毒sir财经
2026-01-08 19:13:41
又一行业没落!曾是世界第一,如今18家大国企几乎全军覆没

又一行业没落!曾是世界第一,如今18家大国企几乎全军覆没

朔方瞭望
2026-01-08 09:50:55
广湛高铁工地工人从桥面扔铁模板砸中一放牛老人致死,事故调查报告公布

广湛高铁工地工人从桥面扔铁模板砸中一放牛老人致死,事故调查报告公布

澎湃新闻
2026-01-09 18:42:27
股票交易异常波动公告涉嫌重大遗漏 天普股份被证监会立案调查

股票交易异常波动公告涉嫌重大遗漏 天普股份被证监会立案调查

财闻
2026-01-09 20:10:51
江苏省人大常委会副主任张宝娟转任南京市政协党组书记

江苏省人大常委会副主任张宝娟转任南京市政协党组书记

澎湃新闻
2026-01-09 20:52:26
洗碗机砸家后续:丈夫降薪,妻子爱美,每月多次海底捞,朋友发声

洗碗机砸家后续:丈夫降薪,妻子爱美,每月多次海底捞,朋友发声

李健政观察
2026-01-09 17:44:57
现场腾起巨大火球!美空军一架F16C战机坠毁 ,飞行员弹射逃生

现场腾起巨大火球!美空军一架F16C战机坠毁 ,飞行员弹射逃生

每日经济新闻
2026-01-09 16:38:02
哈佛发现:高血脂不用治,治好都是误诊?告诉您5个血脂真相!

哈佛发现:高血脂不用治,治好都是误诊?告诉您5个血脂真相!

岐黄传人孙大夫
2026-01-08 10:06:20
上海一小区突发火灾,多辆非机动车被烧毁,还殃及一辆商务车

上海一小区突发火灾,多辆非机动车被烧毁,还殃及一辆商务车

环球网资讯
2026-01-09 20:05:13
山姆499元羽绒服充绒400克卖爆,多个门店已断货,二手平台有人加价数十元出售,客服:补货时间未知

山姆499元羽绒服充绒400克卖爆,多个门店已断货,二手平台有人加价数十元出售,客服:补货时间未知

极目新闻
2026-01-09 12:45:05
特朗普势在必得格陵兰岛,欧洲还能争取何种“交易”?

特朗普势在必得格陵兰岛,欧洲还能争取何种“交易”?

澎湃新闻
2026-01-09 18:09:09
一名女性遭遇已婚985高校博士后“恋爱骗局”后:举报、起诉、制作PDF……

一名女性遭遇已婚985高校博士后“恋爱骗局”后:举报、起诉、制作PDF……

极目新闻
2026-01-09 19:14:25
北海道五岁男孩被卷进中国产扶手梯身亡?厂家惊呼“我们当时压根没卖给日本啊!”

北海道五岁男孩被卷进中国产扶手梯身亡?厂家惊呼“我们当时压根没卖给日本啊!”

日本通
2026-01-09 10:33:55
朴槿惠出狱生活:住别墅,与小10岁律师为伴,如今生活安逸

朴槿惠出狱生活:住别墅,与小10岁律师为伴,如今生活安逸

策略述
2026-01-09 13:02:41
泰国这次厉害了!泰国警方称3名国人携带8628张电话卡!

泰国这次厉害了!泰国警方称3名国人携带8628张电话卡!

荆楚寰宇文枢
2026-01-08 22:51:38
突发两大利好!A股站上4100点、3万亿成交,AI应用取代商业航天?

突发两大利好!A股站上4100点、3万亿成交,AI应用取代商业航天?

看财经show
2026-01-09 16:51:11
俄外交部:特朗普已下令释放被扣押油轮上的俄公民

俄外交部:特朗普已下令释放被扣押油轮上的俄公民

上观新闻
2026-01-09 18:30:06
“一家三口被撞亡案”被告廖某宇被判死缓,被害人母亲:他面无表情,其父全程戴口罩;被害人律师:将会申请抗诉

“一家三口被撞亡案”被告廖某宇被判死缓,被害人母亲:他面无表情,其父全程戴口罩;被害人律师:将会申请抗诉

极目新闻
2026-01-09 11:19:24
59年,赫鲁晓夫当众呵斥陈毅:你是中国元帅,但政治上得听我的!

59年,赫鲁晓夫当众呵斥陈毅:你是中国元帅,但政治上得听我的!

古书记史
2026-01-09 00:17:48
2026-01-09 21:55:00
芯智讯 incentive-icons
芯智讯
聚焦科技万象,报道前沿资讯。
7969文章数 32042关注度
往期回顾 全部

科技要闻

市场偏爱MiniMax:开盘涨42%,市值超700亿

头条要闻

女子"出轨"已婚985高校博士后 看到其聊天记录吓傻了

头条要闻

女子"出轨"已婚985高校博士后 看到其聊天记录吓傻了

体育要闻

金元时代最后的外援,来中国8年了

娱乐要闻

关晓彤鹿晗风波后露面 不受影响状态佳

财经要闻

投资必看!瑞银李萌给出3大核心配置建议

汽车要闻

助跑三年的奇瑞 接下来是加速还是起跳?

态度原创

健康
教育
数码
本地
军事航空

这些新疗法,让化疗不再那么痛苦

教育要闻

女生发明“咯噔字体”,老师0分让她看清现实:别挑战考试的底线

数码要闻

明基海外推出MOBIUZ EX271UZ显示器,4K 240Hz QD - OLED面板

本地新闻

云游内蒙|“包”你再来?一座在硬核里酿出诗意的城

军事要闻

特朗普:已开始从委石油资源中赚钱

无障碍浏览 进入关怀版