网易首页 > 网易号 > 正文 申请入驻

黄仁勋、苏姿丰点赞:英伟达、AMD 力挺 InferenceMAX 开源新基准

0
分享至

IT之家 10 月 11 日消息,科技媒体 Tom's Hardware 昨日(10 月 10 日)发布博文,报道称分析机构 SemiAnalysis 近日发布了一款名为 InferenceMax 的开源 AI 基准测试套件,专注于衡量在真实 AI 推理(模型实际运行)场景下,由驱动、内核、框架等组成的整个软件堆栈的综合效率。

IT之家援引博文介绍,人工智能领域的焦点几乎完全集中在芯片交易和 GPU 等硬件发展上,现有的基准测试也大多只关注硬件性能,因此 InferenceMax 希望提供一个开源且厂商中立的 AI 基准测试套件。该项目以滚动发布的方式,每晚更新测试结果,从而能够动态追踪软件更新对性能的持续影响。


InferenceMax 引入了两个相互制约的关键性能指标。其一是“吞吐量”,指在单位时间内处理更多并发请求的能力,这有利于最大化 GPU 利用率;其二是“交互性”,指为单个用户提供更快响应速度的能力,例如在聊天机器人场景中。


在两者之间取得理想平衡(即帕累托前沿曲线上的最佳点)至关重要。最终,对于服务提供商而言,衡量投资回报的终极标准是“总拥有成本”(TCO),即处理每百万 token 所需花费的美元。InferenceMax 致力于估算不同硬件采购或租赁方案下的 TCO,为用户提供最具经济效益的选择依据。

InferenceMax 的初步测试提供了一些颠覆性的见解。例如,尽管英伟达的 B200 在原始速度上遥遥领先,但在综合考量 TCO 后,AMD 的 MI335X 在特定场景下展现出了极强的竞争力,这表明,最快的芯片不一定是最经济高效的选择。

同时,测试也暴露了 AMD 在 FP4(4 位浮点格式)内核方面尚有改进空间,目前依赖该数学格式的场景仍由英伟达芯片主导。这些发现凸显了单纯比较硬件参数的局限性,软件优化与成本效益正成为评估 AI 性能的关键。

InferenceMax 的开发过程得到了英伟达、AMD 及多家云服务商的深度协作。这种合作不仅帮助项目获取了真实的硬件与软件配置方案,还意外地发现了两大巨头软件堆栈中的多个错误。

例如,项目组协助 AMD 修复了其 ROCm 软件中的问题,并建议 AMD 提供更优的默认配置以简化性能调优。对于英伟达,测试则暴露了其新款 Blackwell 驱动在快速启停实例时存在初始化相关的障碍。

英伟达首席执行官黄仁勋表示:

在长上下文推理的推动下,推理需求呈指数级增长。NVIDIA Grace Blackwell NVL72 正是为这个充满思考力的 AI 新时代而生。NVIDIA 通过持续的硬件和软件创新来满足这一需求,从而赋能 AI 的未来发展。 通过频繁的基准测试,InferenceMax 让业界能够清晰地了解 LLM 推理在实际工作负载下的性能。结果显而易见:搭载 TRT-LLM 和 Dynamo 的 Grace Blackwell NVL72 可提供无与伦比的单位成本和单位兆瓦性能,为全球生产力最高、成本效益最高的 AI 工厂提供支持。

AMD 首席执行官苏姿丰表示:

开放式协作正在推动人工智能创新的新时代。开源 InferenceMax 基准测试为社区提供透明的每日结果,从而激发信任并加速进步。 它凸显了我们的 AMD Instinct MI300、MI325X 和 MI355X GPU 在不同工作负载下具有竞争力的 TCO 性能,彰显了我们平台的强大实力以及我们致力于让开发人员实时了解软件进度的承诺。

IT之家附上参考地址

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国实现全民双休的可能性为零。

中国实现全民双休的可能性为零。

流苏晚晴
2026-01-19 18:34:51
炸了!曼联世纪互换曝光:甩卖拉什福德,锁定世界顶级新星

炸了!曼联世纪互换曝光:甩卖拉什福德,锁定世界顶级新星

澜归序
2026-01-20 02:33:53
1949年傅作义任水利部长遭闲置,主席当面质问,周恩来听闻当即发火

1949年傅作义任水利部长遭闲置,主席当面质问,周恩来听闻当即发火

磊子讲史
2026-01-14 10:12:21
从排队抢位到无人问津,火遍全国的社区食堂,为何凉得这么快?

从排队抢位到无人问津,火遍全国的社区食堂,为何凉得这么快?

知识TNT
2026-01-19 15:16:13
社会运行逻辑:穷人不生孩子,富人的阶层就会倒退

社会运行逻辑:穷人不生孩子,富人的阶层就会倒退

舒山有鹿
2026-01-19 09:02:09
江苏大一女生开养老院,无人入住却有近400名客户,员工全是60后

江苏大一女生开养老院,无人入住却有近400名客户,员工全是60后

不写散文诗
2026-01-19 21:23:55
出生人口跌破800万!会对地产、消费带来巨大影响,预计明年总人口跌破14亿

出生人口跌破800万!会对地产、消费带来巨大影响,预计明年总人口跌破14亿

爆角追踪
2026-01-19 12:55:54
斯基拉:尤文加价至3300万欧报价马特塔,水晶宫要至少3500万

斯基拉:尤文加价至3300万欧报价马特塔,水晶宫要至少3500万

懂球帝
2026-01-20 08:17:37
董路:王钰栋4场0球 再不发挥真说不过去 U23国足做好3点能进2球

董路:王钰栋4场0球 再不发挥真说不过去 U23国足做好3点能进2球

星Xin辰大海
2026-01-20 08:07:05
性感霸王龙,湖人队替补中锋蒂姆打猛龙后解释了他引人注目的T恤

性感霸王龙,湖人队替补中锋蒂姆打猛龙后解释了他引人注目的T恤

好火子
2026-01-20 02:00:37
高峰也没想到,他当年抛弃的儿子,如今开始给那英争光了

高峰也没想到,他当年抛弃的儿子,如今开始给那英争光了

趣文说娱
2026-01-04 16:34:24
52岁复出屠榜?这位阿姨才是真正的业界钢铁侠!

52岁复出屠榜?这位阿姨才是真正的业界钢铁侠!

素然追光
2026-01-06 05:50:03
弘一法师:不要太操心你的孩子和在意的亲人,每个人都有自己的命

弘一法师:不要太操心你的孩子和在意的亲人,每个人都有自己的命

木言观
2026-01-18 13:56:24
成都警方通报东御街男子打人事件:已对黄某涵(男,16岁)立案调查,网传其所谓"特殊背景"等信息纯属捏造

成都警方通报东御街男子打人事件:已对黄某涵(男,16岁)立案调查,网传其所谓"特殊背景"等信息纯属捏造

扬子晚报
2026-01-19 12:29:55
携怀孕岳母旅游后,双双坠崖身亡,警方勘察背包后傻眼:不是人

携怀孕岳母旅游后,双双坠崖身亡,警方勘察背包后傻眼:不是人

罪案洞察者
2025-11-04 13:49:14
1600万买下爵士1%股份,韦德如今赚了多少?网友:难以置信

1600万买下爵士1%股份,韦德如今赚了多少?网友:难以置信

篮球看比赛
2026-01-19 11:20:05
德国总理:如有必要 欧盟 将对美国加征关税

德国总理:如有必要 欧盟 将对美国加征关税

每日经济新闻
2026-01-20 08:25:46
贾国龙最新发言,又更新了一条朋友圈:预制菜和我为什么站出来?

贾国龙最新发言,又更新了一条朋友圈:预制菜和我为什么站出来?

陈语丝
2026-01-19 06:47:55
火箭队补强倒计时!3人被问价,火箭4大引援目标曝光

火箭队补强倒计时!3人被问价,火箭4大引援目标曝光

蛋疼体育
2026-01-19 23:24:34
男子酒后因孩子成绩与妻子激烈争吵,血管从胸口撕裂到大腿近40cm,全家吓懵

男子酒后因孩子成绩与妻子激烈争吵,血管从胸口撕裂到大腿近40cm,全家吓懵

观威海
2026-01-06 09:22:04
2026-01-20 08:56:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
325382文章数 606892关注度
往期回顾 全部

科技要闻

去年预亏60亿后再投百亿 两大车企紧抱华为

头条要闻

女子订3间双床房被告知是3张单人床 退订扣80%违约金

头条要闻

女子订3间双床房被告知是3张单人床 退订扣80%违约金

体育要闻

错失英超冠军奖牌,他却在德甲成为传奇

娱乐要闻

吴磊起诉白珊珊诽谤,白珊珊称被盗号

财经要闻

2026股市猜想

汽车要闻

徐军:冲击百万销量,零跑一直很清醒

态度原创

房产
旅游
数码
游戏
公开课

房产要闻

中旅・三亚蓝湾发布会揭秘自贸港好房子高阶形态

旅游要闻

重庆黔江:峡谷梅香引客来

数码要闻

荣耀Magic8 RSR体验:7999元买个不强调影像的超大杯,反而对了?

《生化危机9》里昂武器库展示 新场景图公布

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版