网易首页 > 网易号 > 正文 申请入驻

黄仁勋、苏姿丰点赞:英伟达、AMD 力挺 InferenceMAX 开源新基准

0
分享至

IT之家 10 月 11 日消息,科技媒体 Tom's Hardware 昨日(10 月 10 日)发布博文,报道称分析机构 SemiAnalysis 近日发布了一款名为 InferenceMax 的开源 AI 基准测试套件,专注于衡量在真实 AI 推理(模型实际运行)场景下,由驱动、内核、框架等组成的整个软件堆栈的综合效率。

IT之家援引博文介绍,人工智能领域的焦点几乎完全集中在芯片交易和 GPU 等硬件发展上,现有的基准测试也大多只关注硬件性能,因此 InferenceMax 希望提供一个开源且厂商中立的 AI 基准测试套件。该项目以滚动发布的方式,每晚更新测试结果,从而能够动态追踪软件更新对性能的持续影响。


InferenceMax 引入了两个相互制约的关键性能指标。其一是“吞吐量”,指在单位时间内处理更多并发请求的能力,这有利于最大化 GPU 利用率;其二是“交互性”,指为单个用户提供更快响应速度的能力,例如在聊天机器人场景中。


在两者之间取得理想平衡(即帕累托前沿曲线上的最佳点)至关重要。最终,对于服务提供商而言,衡量投资回报的终极标准是“总拥有成本”(TCO),即处理每百万 token 所需花费的美元。InferenceMax 致力于估算不同硬件采购或租赁方案下的 TCO,为用户提供最具经济效益的选择依据。

InferenceMax 的初步测试提供了一些颠覆性的见解。例如,尽管英伟达的 B200 在原始速度上遥遥领先,但在综合考量 TCO 后,AMD 的 MI335X 在特定场景下展现出了极强的竞争力,这表明,最快的芯片不一定是最经济高效的选择。

同时,测试也暴露了 AMD 在 FP4(4 位浮点格式)内核方面尚有改进空间,目前依赖该数学格式的场景仍由英伟达芯片主导。这些发现凸显了单纯比较硬件参数的局限性,软件优化与成本效益正成为评估 AI 性能的关键。

InferenceMax 的开发过程得到了英伟达、AMD 及多家云服务商的深度协作。这种合作不仅帮助项目获取了真实的硬件与软件配置方案,还意外地发现了两大巨头软件堆栈中的多个错误。

例如,项目组协助 AMD 修复了其 ROCm 软件中的问题,并建议 AMD 提供更优的默认配置以简化性能调优。对于英伟达,测试则暴露了其新款 Blackwell 驱动在快速启停实例时存在初始化相关的障碍。

英伟达首席执行官黄仁勋表示:

在长上下文推理的推动下,推理需求呈指数级增长。NVIDIA Grace Blackwell NVL72 正是为这个充满思考力的 AI 新时代而生。NVIDIA 通过持续的硬件和软件创新来满足这一需求,从而赋能 AI 的未来发展。 通过频繁的基准测试,InferenceMax 让业界能够清晰地了解 LLM 推理在实际工作负载下的性能。结果显而易见:搭载 TRT-LLM 和 Dynamo 的 Grace Blackwell NVL72 可提供无与伦比的单位成本和单位兆瓦性能,为全球生产力最高、成本效益最高的 AI 工厂提供支持。

AMD 首席执行官苏姿丰表示:

开放式协作正在推动人工智能创新的新时代。开源 InferenceMax 基准测试为社区提供透明的每日结果,从而激发信任并加速进步。 它凸显了我们的 AMD Instinct MI300、MI325X 和 MI355X GPU 在不同工作负载下具有竞争力的 TCO 性能,彰显了我们平台的强大实力以及我们致力于让开发人员实时了解软件进度的承诺。

IT之家附上参考地址

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
湖南19岁男生和母亲新疆自驾游,父亲发现纸篓异物,崩溃了

湖南19岁男生和母亲新疆自驾游,父亲发现纸篓异物,崩溃了

纸鸢奇谭
2024-10-13 19:26:30
iOS26.1千万别乱更新,这3部iPhone能升级,另外4部再等等

iOS26.1千万别乱更新,这3部iPhone能升级,另外4部再等等

3C毒物
2025-11-10 00:05:41
全新本田奥德赛惊艳曝光,内饰换一体式大屏,搭载3.5LV6发动机!

全新本田奥德赛惊艳曝光,内饰换一体式大屏,搭载3.5LV6发动机!

周哥一影视
2025-11-09 12:34:05
香港知名男星宣布复出,两度退出娱乐圈,举家移民澳洲失败

香港知名男星宣布复出,两度退出娱乐圈,举家移民澳洲失败

桑葚爱动画
2025-11-10 10:33:20
11月10日俄乌:西尔斯基制定B计划和C计划

11月10日俄乌:西尔斯基制定B计划和C计划

山河路口
2025-11-10 19:33:29
莫大的质疑,上海海港:到底冤不冤?

莫大的质疑,上海海港:到底冤不冤?

话体坛
2025-11-11 00:18:52
小鹏天塌了,机器人“胸部造型”冲上热搜!

小鹏天塌了,机器人“胸部造型”冲上热搜!

互联网品牌官
2025-11-10 18:16:35
55+35+31!联盟第1!这就是雷霆给他4年2.85亿美金超级顶薪的原因

55+35+31!联盟第1!这就是雷霆给他4年2.85亿美金超级顶薪的原因

世界体育圈
2025-11-10 15:46:28
哈佛研究:吃一个西红柿,就等于喝了一大口可乐,真的还是假的?

哈佛研究:吃一个西红柿,就等于喝了一大口可乐,真的还是假的?

泠泠说史
2025-11-10 14:17:05
大难临头各自飞?"手表风波"仅5月,玲花官宣好消息,曾毅被抛弃

大难临头各自飞?"手表风波"仅5月,玲花官宣好消息,曾毅被抛弃

素衣读史
2025-11-10 16:20:13
58-52!浙江淘汰上海,丁伟给卢伟上一课 半决赛上演另类浙江德比

58-52!浙江淘汰上海,丁伟给卢伟上一课 半决赛上演另类浙江德比

萌兰聊个球
2025-11-10 18:02:28
有个瘦瘦的女朋友是啥体验?网友:硌得慌,影响夫妻生活和谐

有个瘦瘦的女朋友是啥体验?网友:硌得慌,影响夫妻生活和谐

带你感受人间冷暖
2025-10-29 00:10:07
早就想打!日媒首次爆料:中国双航母出动时日军战机已做战斗准备

早就想打!日媒首次爆料:中国双航母出动时日军战机已做战斗准备

诗意世界
2025-08-21 13:13:50
沈伯洋家族的灭顶之灾!抗中反噬,全家崩塌!

沈伯洋家族的灭顶之灾!抗中反噬,全家崩塌!

古装影视解说阿凶
2025-11-10 14:28:11
安徽一对夫妻杀人后潜逃20年,各自另组家庭,谁料,妻子成公司高管丈夫成大老板

安徽一对夫妻杀人后潜逃20年,各自另组家庭,谁料,妻子成公司高管丈夫成大老板

LULU生活家
2025-11-06 18:29:11
蒋万安再次亮明立场,坚持反对两岸统一,郑丽文也让大陆寒心

蒋万安再次亮明立场,坚持反对两岸统一,郑丽文也让大陆寒心

徐徐道史
2025-11-10 11:34:59
稀土牌桌风云:中俄合作是假象,美欧正联手掀翻棋盘

稀土牌桌风云:中俄合作是假象,美欧正联手掀翻棋盘

麦芽是个小趴菜
2025-11-11 00:29:33
记吃不记打:俄罗斯大幅加税,中国汽车出口骤降58%

记吃不记打:俄罗斯大幅加税,中国汽车出口骤降58%

山河路口
2025-11-10 20:04:38
“keep fighting!!!”贝爷点赞张家界荒野求生挑战赛:唤起了我野外探险的回忆

“keep fighting!!!”贝爷点赞张家界荒野求生挑战赛:唤起了我野外探险的回忆

极目新闻
2025-11-10 17:56:36
同学聚会每人出9800元,我没去,隔天警察上门:昨夜你同学出事了

同学聚会每人出9800元,我没去,隔天警察上门:昨夜你同学出事了

红豆讲堂
2025-11-05 16:50:03
2025-11-11 01:40:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
314473文章数 606731关注度
往期回顾 全部

科技要闻

荷兰“玩脱”后,大众本田终于拿到芯片了

头条要闻

德军司令:柏林已做好与莫斯科开战的准备

头条要闻

德军司令:柏林已做好与莫斯科开战的准备

体育要闻

重返诺坎普!梅西:希望有一天能回来

娱乐要闻

51岁周迅的现状 给中年女性提了个醒?

财经要闻

北大医药董事长被抓 巨额资金去向不明

汽车要闻

智能又务实 奇瑞瑞虎9X不只有性价比

态度原创

本地
旅游
游戏
教育
公开课

本地新闻

这届干饭人,已经把博物馆吃成了食堂

旅游要闻

非遗市集、沉浸式游园……这场“非遗快闪”走进写字楼→

游戏喜加一 / Steam 商店页面 UI 全新上线

教育要闻

传说中的“死亡211”,你的目标院校在里面么?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版