网易首页 > 网易号 > 正文 申请入驻

Nvidia用288块GPU刷榜,AMD和Intel却各打各的

0
分享至


4月1日,MLCommons发布了MLPerf Inference v6.0的测试结果。这个被业内视为AI芯片"高考"的基准测试,第一次加入了多模态和视频模型。三家巨头——Nvidia、AMD、Intel——都交了卷,但阅卷老师头疼了:他们用的考卷不一样。

Nvidia搬出了288块GPU的巨型集群,AMD单挑Nvidia的B200/B300,Intel则跑去和桌面显卡较劲。三家都在自己的赛道宣布胜利,真正的横向对比几乎不可能。更蹊跷的是,Google最新的Ironwood TPU和Cerebras这类专用推理芯片,这次集体缺席。

288块GPU:Nvidia的"饱和式攻击"

Nvidia的打法可以用一个老梗形容:火力不足恐惧症。他们提交了所有新增测试项的结果,包括DeepSeek-R1的交互式场景、多模态模型Qwen3-VL-235B、OpenAI的GPT-OSS-120B,以及文生视频模型WAN-2.2-T2V。

最夸张的配置是四台GB300-NVL72系统通过Quantum-X800 InfiniBand互联,总共288块Blackwell Ultra GPU。这套系统跑出了每秒约249万token的吞吐量,创下MLPerf Inference有史以来最大规模提交记录。

但Nvidia真正想秀的不是硬件堆料,而是软件优化。同样是DeepSeek-R1的服务器场景,六个月前的首次提交和这次相比,性能提升了2.7倍——硬件完全没变。合作方Nebius通过一系列软件层面的调整实现了这一跃升,Nvidia称token生产成本因此被砍掉60%以上。

具体手段包括:把基础计算操作加速并融合,减少GPU空转开销;开源框架Nvidia Dynamo将文本生成的两个阶段(处理输入和生成新token)解耦并分别优化;针对DeepSeek-R1这类"专家混合"模型,Wide Expert Parallel把专家权重分散到更多GPU上,避免单卡成为瓶颈;交互场景下batch size较小时,Multi-Token Prediction一次性生成多个token而非逐个生成。甚至连更老的Llama 3.1 405B,服务器性能也提升了1.5倍。

AMD的"田忌赛马":只打能赢的仗

AMD的策略明显不同。他们选择了单节点8卡配置,对标Nvidia的B200和B300,但刻意避开了DeepSeek-R1和Qwen3-VL这两个新增测试项。

这种选择性提交在基准测试中并不罕见——厂商通常会避开自家架构不擅长的负载。AMD的MI300X和MI350系列在部分传统LLM推理任务上确实有竞争力,但面对需要大规模专家并行的MoE模型,或者多模态的视觉-语言任务,可能暂时还拿不出有说服力的数字。

Intel的路径更偏门。他们拿数据中心GPU Max系列去和Nvidia的RTX Pro工作站显卡对比,本质上是在找一个自己能赢的细分市场。这种错位竞争在MLPerf历史上多次出现,但读者需要清醒认识到:不同市场定位的产品,数字再漂亮也不具备直接可比性。

缺席者比参赛者更值得玩味

这次测试的沉默者名单,比提交者更有信息量。Google的Ironwood TPU——被官方称为"专为推理设计"的下一代芯片——完全没有露面。考虑到Ironwood在今年初才正式发布,Google可能还在调试软件栈,或者对当前性能不够自信。

Cerebras的缺席同样耐人寻味。这家以晶圆级芯片闻名的公司,一直在鼓吹其WSE-3在推理吞吐量上的优势。但MLPerf的测试规则要求提交可复现的标准化结果,Cerebras的自定义软件栈和稀疏计算模式,可能暂时还无法适配这套评价体系。

这种"叫好不叫座"的现象在AI芯片圈反复上演:专用架构在特定场景下理论效率极高,但面对真实世界的多样化负载,通用GPU的灵活性往往更占上风。

软件优化还能榨出多少油水?

Nvidia的2.7倍纯软件提升,揭示了一个被低估的行业现实:AI推理的性能天花板,远不只是晶体管数量和内存带宽。同样的Blackwell硬件,六个月前后的表现天差地别,说明软件栈的成熟度正在成为新的竞争壁垒。

这对追赶者既是机会也是陷阱。机会在于,硬件差距可以通过软件优化部分弥补;陷阱在于,Nvidia的CUDA生态和配套工具链积累了近20年,短期难以复制。AMD的ROCm和Intel的oneAPI都在快速迭代,但每当他们追上一个版本,Nvidia又发布了新的优化路径。

DeepSeek-R1这类MoE模型的兴起,让软件优化的复杂度再上台阶。传统Dense模型所有参数同时激活,而MoE每次只调用部分"专家"子网络,这对并行策略、内存调度和负载均衡都提出了新要求。Nvidia的Wide Expert Parallel方案,本质上是在用更多的GPU来摊薄单个专家的内存压力——这又回到了那个老问题:算力换效率,堆料换性能。

MLPerf Inference v6.0的另一个信号是测试负载的多元化。从纯文本到视觉-语言,再到视频生成,AI模型的输入输出形态正在爆炸式增长。这对芯片架构的通用性提出了更高要求,也可能让专用推理芯片的设计更加困难——你今天优化的场景,明年可能就被新模型架构颠覆。

当Nvidia用288块GPU重新定义"规模"的边界时,AMD和Intel的选择或许暗示了另一种生存策略:不在正面战场硬碰硬,而是找到自己的生态位。但问题是,这个生态位会不会随着模型规模的持续膨胀而不断收窄?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
潘玮柏去四川吃路边摊,干5大碗面鼻涕往下流,还加了蒸蛋和抄手

潘玮柏去四川吃路边摊,干5大碗面鼻涕往下流,还加了蒸蛋和抄手

冷紫葉
2026-04-05 19:46:51
再恩爱也没用!上海38岁陈成去世,烟酒不沾,死因曝光,妻儿悲痛

再恩爱也没用!上海38岁陈成去世,烟酒不沾,死因曝光,妻儿悲痛

北纬的咖啡豆
2026-03-09 16:55:53
大量的大学生无法就业,为什么教育还要逼着孩子们拼命学习?

大量的大学生无法就业,为什么教育还要逼着孩子们拼命学习?

李老师讲最真教育
2026-04-05 19:09:33
确认离队!广东队迎来换帅最佳人选,比李春江更适合取代杜锋?

确认离队!广东队迎来换帅最佳人选,比李春江更适合取代杜锋?

绯雨儿
2026-04-05 15:13:41
菲尔兹奖得主牵头近2000名数学家拒绝赴美,数学家大会陷入争议

菲尔兹奖得主牵头近2000名数学家拒绝赴美,数学家大会陷入争议

DeepTech深科技
2026-04-04 12:10:59
笑麻了!清明上坟熊孩子把老祖宗的金砖豪车顺走,网友:赶紧管管

笑麻了!清明上坟熊孩子把老祖宗的金砖豪车顺走,网友:赶紧管管

另子维爱读史
2026-04-05 22:57:23
火腿肠三巨头的衰落告诉我们什么:产品没变,时代变了

火腿肠三巨头的衰落告诉我们什么:产品没变,时代变了

富贵说
2026-04-05 18:42:13
美论坛:为什么中国在明确我们不会偿还的情况下还要购买美债?

美论坛:为什么中国在明确我们不会偿还的情况下还要购买美债?

共工之锚
2026-04-06 00:15:47
吴邦国委员长之父吴忠性简介:解放前拒绝去台湾,被誉为测绘将军

吴邦国委员长之父吴忠性简介:解放前拒绝去台湾,被誉为测绘将军

兴趣知识
2026-03-24 16:24:08
田曦薇从小就是班花级别,这美貌不要太出众!

田曦薇从小就是班花级别,这美貌不要太出众!

动物奇奇怪怪
2026-04-05 17:08:34
4月10-15号,属兔人三件事跑不掉!尤其第二件,再忙也要看

4月10-15号,属兔人三件事跑不掉!尤其第二件,再忙也要看

叮当当科技
2026-04-06 02:38:28
4.5日晚间,多家上市公司,突发重磅利好,下周二,要起飞了

4.5日晚间,多家上市公司,突发重磅利好,下周二,要起飞了

风风顺
2026-04-06 01:00:03
尘埃落定…… 齐达内多年等待,终于圆梦!执掌法国国家队

尘埃落定…… 齐达内多年等待,终于圆梦!执掌法国国家队

夜白侃球
2026-04-05 21:50:34
川崎毫无征兆,车价暴降!张雪机车让日系车商集体慌了!

川崎毫无征兆,车价暴降!张雪机车让日系车商集体慌了!

达文西看世界
2026-04-05 20:14:06
发现一个奇怪现象:越是独来独往、没有朋友、不合群的人,人品往往越没问题,慢慢你就知道了

发现一个奇怪现象:越是独来独往、没有朋友、不合群的人,人品往往越没问题,慢慢你就知道了

LULU生活家
2026-01-11 17:53:51
33岁程序员午休健身时猝死!公司:属于工作时间,人社局:不算工伤!法院判了……

33岁程序员午休健身时猝死!公司:属于工作时间,人社局:不算工伤!法院判了……

环球网资讯
2026-04-05 13:56:06
活久见!考上公务员的堂弟,在家宴沉默寡言,面对镜头却侃侃而谈

活久见!考上公务员的堂弟,在家宴沉默寡言,面对镜头却侃侃而谈

火山詩话
2026-04-06 10:42:06
特朗普帮了中国大忙,中国首次成为全球第一,日本完全被踩在脚下

特朗普帮了中国大忙,中国首次成为全球第一,日本完全被踩在脚下

小小科普员
2026-03-26 00:27:10
求你了红星新闻:打假前,先学点循证医学常识

求你了红星新闻:打假前,先学点循证医学常识

不正确
2026-04-04 11:54:47
8500亿美债无人接盘!中方明确表态:已彻底告别“救美时代”

8500亿美债无人接盘!中方明确表态:已彻底告别“救美时代”

傲傲讲历史
2026-04-05 20:55:19
2026-04-06 11:52:49
码上闲叙
码上闲叙
有态度网友ytd
1258文章数 10关注度
往期回顾 全部

数码要闻

Mac跑AI模型更方便了,消息称苹果已为英伟达、AMD外置显卡开绿灯

头条要闻

媒体:美军拯救大兵有奇怪之处 未展示飞行员获救照片

头条要闻

媒体:美军拯救大兵有奇怪之处 未展示飞行员获救照片

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

乔任梁离世10年 父母曝舞台光鲜的背后

财经要闻

118吨!这家央行,大幅抛售黄金!

科技要闻

前同事被蒸馏成Token,AI能否偷走职场经验

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

艺术
手机
家居
本地
教育

艺术要闻

20位中国当代名家的25幅油画

手机要闻

vivo X300s / X300 Ultra维修备件价格公布,199换电池

家居要闻

温馨多元 爱的具象化

本地新闻

跟着歌声游安徽,听古村回响

教育要闻

“占穷人便宜,就这下场”,抠搜家长怒斥:这种小孩以后别来我家

无障碍浏览 进入关怀版