网易首页 > 网易号 > 正文 申请入驻

最新英伟达经济学:每美元性能是AMD的15倍,买越多省越多是真的

0
分享至

梦晨 发自 凹非寺量子位 | 公众号 QbitAI

为什么AI算力霸主永远是英伟达?

不算不知道,一算吓一跳:在英伟达平台每花一美元,获得的性能是AMD的15倍。

尽管英伟达卖的更贵,但只要买齐一套,就更省钱。



来自Signal65的一份最新详尽报告揭示了这个现实,一定条件下生成同样数量的token,英伟达的成本只有AMD的十五分之一。

这份报告基于SemiAnalysis Inference MAX的公开基准测试数据,时间跨度从2025年10月到12月,覆盖了从密集模型到前沿MoE推理模型的全场景测试。



黄仁勋的“买的越多,省的越多”原来是真的。



MoE时代:8卡系统撞上Scaling天花板

AI模型正在经历一场架构革命,打开Artificial Analysis排行榜就会发现,智能度排名前十的开源模型清一色都是MoE(Mixture of Experts,专家混合)推理模型。



另一项来自OpenRouter的数据显示,超过50%的token流量正在被路由到推理模型上。



MoE架构的核心思路是把模型参数拆分成多个专门化的“专家”子网络,每个token只激活其中一小部分。

以经典的DeepSeek-R1为例,它拥有6710亿总参数,但每个token只激活370亿——这让它能以更低的计算成本提供前沿级别的智能。



问题随之而来。当专家分布在多块GPU上时,GPU之间的通信延迟会导致计算单元空闲等待数据,这些空闲时间直接转化为服务商的成本。

报告指出,无论是英伟达B200还是AMD MI355X,所有8卡系统在超出单节点规模后都会撞上“扩展天花板”(scaling ceiling)。

英伟达GB200 NVL72的解法是把72块GPU通过NVLink连接成一个单一域,提供130 TB/s的互联带宽。

在软件层面,整个系统就像一块巨型GPU一样运作。配合英伟达Dynamo推理框架的分离式预填充-解码调度和动态KV缓存路由,这套架构能够有效突破8卡系统的通信瓶颈。

模型越复杂,英伟达的优势越明显

报告测试了三类典型模型:模型越复杂,英伟达的优势越明显。

在密集模型Llama 3.3 70B上,英伟达B200对比AMD MI355X的领先幅度相对温和。

在基线交互性(30 tokens/sec/user)下,B200的性能约为MI355X的1.8倍;当交互性要求提升到110 tokens/sec/user时,这一差距扩大到6倍以上。



中等规模的MoE模型GPT-OSS-120B开始让差距变得更加显著。

这款OpenAI开源模型拥有1170亿总参数,但每个token只激活约51亿参数。在2025年12月的测试数据中,100 tokens/sec/user交互性下B200的性能接近MI355X的3倍。

在更符合推理模型需求的250 tokens/sec/user条件下,差距扩大到6.6倍。



两个平台的绝对性能相比10月都有显著提升,英伟达的峰值吞吐从约7000 tokens/sec跃升至14000以上,AMD则从约6000提升到8500左右,但相对差距反而拉大了。



真正的分水岭出现在前沿推理模型DeepSeek-R1上。

这款模型集MoE路由、大参数规模和高强度推理生成于一身,对基础设施的要求极为苛刻。

测试结果显示:在25 tokens/sec/user交互性下,GB200 NVL72的每GPU性能是H200的10倍、MI325X的16倍;在60 tokens/sec/user下,相比H200的优势扩大到24倍,相比MI355X达到11.5倍;在75 tokens/sec/user下,GB200 NVL72的性能是B200单节点配置的6.5倍,是MI355X的28倍。



更关键的是,GB200 NVL72能够达到竞争平台根本无法企及的水平,在28卡配置下可以输出超过275 tokens/sec/user,而MI355X在相当吞吐水平下的峰值只有75 tokens/sec/user。

Token经济学:贵了1.86倍,便宜了15倍

直觉上,性能更强的平台应该更贵。事实也确实如此:根据Oracle Cloud的公开定价,GB200 NVL72的每GPU每小时价格为16美元,MI355X为8.60美元,前者是后者的1.86倍。

如果参照CoreWeave的定价,GB200 NVL72相比上一代H200的价格也贵了约1.67倍。



但报告的计算揭示了一个反直觉的结论:

在25 tokens/sec/user交互性下,GB200 NVL72的性能优势为5.85倍,除以1.86倍的价格溢价,每美元性能仍是MI355X的3.1倍。

在75 tokens/sec/user交互性下,28倍的性能优势除以1.86倍的价格,每美元性能达到MI355X的15倍,这意味着生成同等数量的token,英伟达平台的成本只有AMD的十五分之一。



与上一代产品的对比同样惊人。

报告估算在DeepSeek-R1的典型工作负载下,GB200 NVL72相比H200的性能提升约20倍。



而GB200 NVL72价格仅上涨1.67倍,换算下来每美元性能提升约12倍,单token成本降至H200的十二分之一。



MoE推理让网络成为推理成本的瓶颈,而机柜级的GB200 NVL72恰好解决了这个问题。价值的衡量标准正在从单纯的算力转向“每美元能产出多少智能”。

报告在结论中指出,AMD的竞争力并未被完全否定——在密集模型和容量驱动的场景下,MI325X和MI355X仍有用武之地。

AMD的机柜级解决方案Helios也在开发中,可能在未来12个月内缩小差距。

但就当前的前沿推理模型而言,从芯片到互联到软件的端到端平台设计,已经成为成本效益的决定性因素。


[1]https://signal65.com/research/ai/from-dense-to-mixture-of-experts-the-new-economics-of-ai-inference/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国产顶级神剧,只可惜,央视播完就禁了

国产顶级神剧,只可惜,央视播完就禁了

独立鱼
2026-03-23 21:22:17
女人其实比男人更开放、更大胆、更热烈、更需要刺激

女人其实比男人更开放、更大胆、更热烈、更需要刺激

加油丁小文
2026-03-24 11:55:30
东契奇43+6+7无缘今日最佳球员!因为约基奇23+21+19创4项纪录!

东契奇43+6+7无缘今日最佳球员!因为约基奇23+21+19创4项纪录!

Tracy的篮球博物馆
2026-03-26 13:49:54
网友吐槽别糊弄老百姓了,又是天才少年发国际论文,谁家的公子?

网友吐槽别糊弄老百姓了,又是天才少年发国际论文,谁家的公子?

眼光很亮
2026-03-08 01:43:40
李连杰当面一句“我刚换了心脏”,谢苗脸唰一下白了,气都不敢喘

李连杰当面一句“我刚换了心脏”,谢苗脸唰一下白了,气都不敢喘

西楼知趣杂谈
2026-02-28 21:36:48
真不识货 被邱彪弃用之人 如今场均22.8分6.8助攻 得分全联盟第3

真不识货 被邱彪弃用之人 如今场均22.8分6.8助攻 得分全联盟第3

男足的小球童
2026-03-26 16:08:26
回旋镖来了?大疆被曝“像素级”抄袭

回旋镖来了?大疆被曝“像素级”抄袭

蓝字计划
2026-03-26 09:38:42
胖东来再立功,自选眼镜超市火爆,7亿近视人配镜应花多少钱?

胖东来再立功,自选眼镜超市火爆,7亿近视人配镜应花多少钱?

匀枫财技大兜底
2026-03-25 10:26:15
油价暴涨100%,越南开启“地狱”生存模式:车停着不开,肉按片买

油价暴涨100%,越南开启“地狱”生存模式:车停着不开,肉按片买

温读史
2026-03-26 05:53:39
CBA焦点战今夜打响!CCTV5不直播!青岛争前4,北控广州冲季后赛

CBA焦点战今夜打响!CCTV5不直播!青岛争前4,北控广州冲季后赛

老吴说体育
2026-03-26 09:53:13
养生|大便后你用几张纸?用纸量判断你的身体情况

养生|大便后你用几张纸?用纸量判断你的身体情况

A活着
2026-03-24 19:25:23
5分钟开通国家免费电视!不用机顶盒、不连网,永久免费

5分钟开通国家免费电视!不用机顶盒、不连网,永久免费

叮当当科技
2026-03-20 03:29:51
内塔尼亚胡:48小时内加紧摧毁伊朗军工设施

内塔尼亚胡:48小时内加紧摧毁伊朗军工设施

参考消息
2026-03-26 15:47:05
给机关事业单位退休人员发生活补贴合理合规,看看这些地方的做法

给机关事业单位退休人员发生活补贴合理合规,看看这些地方的做法

郭爱华追问教育
2026-03-25 06:25:09
李鑫姐夫身份后续:别猜了!不是体制内领导,真实身份很接地气

李鑫姐夫身份后续:别猜了!不是体制内领导,真实身份很接地气

潮鹿逐梦
2026-03-26 11:54:35
烧了18.6万美元让AI连轴肝了17天,它产出了166篇论文

烧了18.6万美元让AI连轴肝了17天,它产出了166篇论文

酷玩实验室
2026-03-25 18:25:49
徐州正在严查!多一个都不行

徐州正在严查!多一个都不行

无线徐州
2026-03-26 17:35:28
外媒:扎哈罗娃警告称,俄将严厉回应西方国家针对有关船只采取的不友好行为

外媒:扎哈罗娃警告称,俄将严厉回应西方国家针对有关船只采取的不友好行为

环球网资讯
2026-03-26 18:05:41
停炸五天的真正含义:伊朗被迫进入二选一困局

停炸五天的真正含义:伊朗被迫进入二选一困局

斌闻天下
2026-03-26 07:45:03
旧手机回收迎涨价潮?记者实探:先别扔,涨得最多的是这一类

旧手机回收迎涨价潮?记者实探:先别扔,涨得最多的是这一类

小兔子发现大事情
2026-03-26 13:37:06
2026-03-26 19:03:01
量子位 incentive-icons
量子位
追踪人工智能动态
12348文章数 176424关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

原正部级刘慧被开除党籍:结交政治骗子 匿名诬告他人

头条要闻

原正部级刘慧被开除党籍:结交政治骗子 匿名诬告他人

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
家居
本地
手机
公开课

教育要闻

2026高考捡漏指南:西安藏着4所“就业王炸”院校,考生闭眼冲

家居要闻

傍海而居 静观蝴蝶海

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

手机要闻

顶配Ultra旗舰!vivo X300 Ultra配置公布:骁龙8E5+2K/144Hz直屏、8.19mm机身

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版