网易首页 > 网易号 > 正文 申请入驻

第八代NVLink凭什么横扫七项AI训练基准?

0
分享至

周三凌晨,MLPerf Training 6.0的结果公布了。这个行业公认的AI训练性能基准测试,这次加入了两个全新的混合专家模型预训练任务:DeepSeek-V3 671B和GPT-OSS-20B。在所有七个基准测试中,只有一个平台提交了完整结果——NVIDIA Blackwell。

“NVIDIA的Blackwell平台统治了MLPerf Training 6.0。”这句来自官方博客的话,背后是一组具体数字:七项测试全部拿下最快训练时间,包括那两个新增的混合专家模型任务。更值得注意的是,在DeepSeek-V3 671B这个6710亿参数的超大规模模型上,他们动用了8192个GPU——这是MLPerf训练测试历史上规模最大的Blackwell集群。


GB300 NVL72机架级系统是这次测试的焦点。相比上一代GB200 NVL72,它在相同规模下实现了最高1.6倍的训练速度提升。三个关键改进驱动了这个跳跃:NVFP4精度带来了更高的计算密度,内存容量扩大,功耗上限提升让GPU能够持续保持在峰值性能区间。NVIDIA还同步展示了NVFP4训练方法,这套方案在提升性能的同时,满足了大规模预训练、小规模预训练和微调任务对精度的严格要求。

混合专家模型在大规模训练时面临一个棘手的通信问题:令牌必须跨GPU路由,找到对应的专家子网络。这跟推理阶段的“全对全”通信挑战如出一辙。NVIDIA的应对方案是第五代NVLink交换器——把机架内72个GPU通过高带宽连接成一个统一的计算和内存池,让它们像一块巨型GPU那样工作。按NVIDIA的说法,正是NVLink的带宽优势,让混合专家模型的训练在规模扩展时保持快速高效。

为了支撑这种规模的分布式训练,NVIDIA提供了两条互补的扩展网络路径:基于InfiniBand的Quantum平台和基于以太网的Spectrum-X平台。这两种方案给了数据中心基础设施选型的灵活度,可以根据自身情况构建大型集群。在DeepSeek-V3 671B的训练提交结果中,8192个GPU正是通过NVLink互联协作完成的。

这次全面胜出的背景是芯片竞争格局的变化。谷歌的TPU v6、AMD的MI400、Cerebras的CS-3在过去几轮MLPerf测试中都拿出了有竞争力的成绩。但NVIDIA这次同时做到了单系统性能最快、最大规模分布式训练结果领先,并且是唯一在所有基准测试中提交结果的厂商。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
乌克兰正赢得战争:目标每月杀伤俄军从3.5万提升至5万,用无人机改变战局

乌克兰正赢得战争:目标每月杀伤俄军从3.5万提升至5万,用无人机改变战局

可达鸭面面观
2026-06-18 11:59:01
她是毛新宇前妻,服务员出身北大毕业,结婚3年无子女 今定居北京

她是毛新宇前妻,服务员出身北大毕业,结婚3年无子女 今定居北京

以茶带书
2026-06-17 19:25:25
世界杯首秀后,哈兰德的头绳火了,网友追问“在哪买的?怎么跑都不掉”

世界杯首秀后,哈兰德的头绳火了,网友追问“在哪买的?怎么跑都不掉”

极目新闻
2026-06-17 19:59:52
罗翔说:电视上演的都是,给你多少万,离开我女儿;而现实中却是,给我们多少万,否则离开我女儿

罗翔说:电视上演的都是,给你多少万,离开我女儿;而现实中却是,给我们多少万,否则离开我女儿

背包旅行
2026-06-18 14:23:32
前线国门紧闭,后方门户洞开?为何中国对印度移民大开方便之门?

前线国门紧闭,后方门户洞开?为何中国对印度移民大开方便之门?

静夜史君
2026-06-17 01:15:26
韩国队世界杯训练场出现无人机,墨西哥军方出手击落,嫌疑人携机逃跑

韩国队世界杯训练场出现无人机,墨西哥军方出手击落,嫌疑人携机逃跑

红星新闻
2026-06-18 09:42:23
中国女排VS法国,开球时间有变化,老将化身教练,庄宇珊一锤定音

中国女排VS法国,开球时间有变化,老将化身教练,庄宇珊一锤定音

体育大学僧
2026-06-18 11:07:07
最高法发布渎职典型案例:四川一交通局长索贿1.3亿元被判死缓

最高法发布渎职典型案例:四川一交通局长索贿1.3亿元被判死缓

新京报
2026-06-18 12:12:06
太惨了!福建海参厂老板被同学拉去赌球,输了2200万,烧炭自杀

太惨了!福建海参厂老板被同学拉去赌球,输了2200万,烧炭自杀

水晶的视界
2024-12-05 06:00:12
两天都等不及?特朗普在G7峰会上当众签了美伊备忘录,但给自己留了后路

两天都等不及?特朗普在G7峰会上当众签了美伊备忘录,但给自己留了后路

新民晚报
2026-06-18 11:49:36
李小冉的白是真的名不虚传

李小冉的白是真的名不虚传

喜欢历史的阿繁
2026-06-18 15:17:19
大风追踪 | 老人入住精神病院7年后查出梅毒:病历失真、患者转运、诊疗责任仍待查,哈尔滨道外区卫健局介入

大风追踪 | 老人入住精神病院7年后查出梅毒:病历失真、患者转运、诊疗责任仍待查,哈尔滨道外区卫健局介入

大风新闻
2026-06-18 15:50:10
这回中国可能真要栽大跟头,投资的钱估计要全砸进去收不回来!

这回中国可能真要栽大跟头,投资的钱估计要全砸进去收不回来!

云鹏叙事
2026-06-17 19:55:03
杭州深山老林里,一辆酷炫的路特斯跑车趴窝了近半年,轮胎也全瘪了,每天都有人去打卡拍照,是被主人遗弃了?

杭州深山老林里,一辆酷炫的路特斯跑车趴窝了近半年,轮胎也全瘪了,每天都有人去打卡拍照,是被主人遗弃了?

都市快报橙柿互动
2026-06-18 10:53:52
武汉江岸龙门吊倾倒致1死1伤调查报告:2人涉重大责任事故罪被刑拘

武汉江岸龙门吊倾倒致1死1伤调查报告:2人涉重大责任事故罪被刑拘

澎湃新闻
2026-06-18 14:16:26
安理会传来消息,中方大获全胜,15国统一战线,美方也投下赞成票

安理会传来消息,中方大获全胜,15国统一战线,美方也投下赞成票

观星赏月
2026-06-17 12:58:22
哈兰德女友身份曝光:身价2亿欧,20岁未婚生子

哈兰德女友身份曝光:身价2亿欧,20岁未婚生子

梦想的旅途照进现实
2026-06-18 10:08:29
AIEC 2026:今天起,Agent开始成为企业里的「新员工」

AIEC 2026:今天起,Agent开始成为企业里的「新员工」

机器之心Pro
2026-06-17 12:56:34
10斤小龙虾能剥出多少虾肉?小伙预测至少2斤,结果属实“打脸”

10斤小龙虾能剥出多少虾肉?小伙预测至少2斤,结果属实“打脸”

邹小蘑菇
2026-06-17 11:32:32
“敢打,我就敢送!”曾放出狠话鼻子朝天的郭台铭,如今怎么样了

“敢打,我就敢送!”曾放出狠话鼻子朝天的郭台铭,如今怎么样了

秋姐居
2026-06-17 19:28:51
2026-06-18 16:48:49
码上闲叙
码上闲叙
有态度网友ytd
273文章数 64关注度
往期回顾 全部

科技要闻

库克承认扛不住了,苹果涨价“不可避免”

头条要闻

老人住精神病院7年查出梅毒 身上大量色斑病历却无恙

头条要闻

老人住精神病院7年查出梅毒 身上大量色斑病历却无恙

体育要闻

波切蒂诺:我仍对西班牙有信心

娱乐要闻

39岁梅西不愧是人生赢家!

财经要闻

沃什“首秀”:刻意的模糊?

汽车要闻

惊出冷汗!重庆实测奥迪A5L,华为智驾这波操作绝了…

态度原创

手机
教育
亲子
公开课
军事航空

手机要闻

vivo X Fold6折叠屏手机预热,IPX8+IPX9级双重防水

教育要闻

2026年太残酷了,1290万高中生+1270万大学毕业生

亲子要闻

两个孩子合作还原魔方,不到十秒就完成了,网友:环太平洋机候选甲驾驶员

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗外交部:美伊已签署谅解备忘录

无障碍浏览 进入关怀版