网易首页 > 网易号 > 正文 申请入驻

黄仁勋、苏姿丰点赞:英伟达、AMD 力挺 InferenceMAX 开源新基准

0
分享至

IT之家 10 月 11 日消息,科技媒体 Tom's Hardware 昨日(10 月 10 日)发布博文,报道称分析机构 SemiAnalysis 近日发布了一款名为 InferenceMax 的开源 AI 基准测试套件,专注于衡量在真实 AI 推理(模型实际运行)场景下,由驱动、内核、框架等组成的整个软件堆栈的综合效率。

IT之家援引博文介绍,人工智能领域的焦点几乎完全集中在芯片交易和 GPU 等硬件发展上,现有的基准测试也大多只关注硬件性能,因此 InferenceMax 希望提供一个开源且厂商中立的 AI 基准测试套件。该项目以滚动发布的方式,每晚更新测试结果,从而能够动态追踪软件更新对性能的持续影响。

InferenceMax 引入了两个相互制约的关键性能指标。其一是“吞吐量”,指在单位时间内处理更多并发请求的能力,这有利于最大化 GPU 利用率;其二是“交互性”,指为单个用户提供更快响应速度的能力,例如在聊天机器人场景中。

在两者之间取得理想平衡(即帕累托前沿曲线上的最佳点)至关重要。最终,对于服务提供商而言,衡量投资回报的终极标准是“总拥有成本”(TCO),即处理每百万 token 所需花费的美元。InferenceMax 致力于估算不同硬件采购或租赁方案下的 TCO,为用户提供最具经济效益的选择依据。

InferenceMax 的初步测试提供了一些颠覆性的见解。例如,尽管英伟达的 B200 在原始速度上遥遥领先,但在综合考量 TCO 后,AMD 的 MI335X 在特定场景下展现出了极强的竞争力,这表明,最快的芯片不一定是最经济高效的选择。

同时,测试也暴露了 AMD 在 FP4(4 位浮点格式)内核方面尚有改进空间,目前依赖该数学格式的场景仍由英伟达芯片主导。这些发现凸显了单纯比较硬件参数的局限性,软件优化与成本效益正成为评估 AI 性能的关键。

InferenceMax 的开发过程得到了英伟达、AMD 及多家云服务商的深度协作。这种合作不仅帮助项目获取了真实的硬件与软件配置方案,还意外地发现了两大巨头软件堆栈中的多个错误。

例如,项目组协助 AMD 修复了其 ROCm 软件中的问题,并建议 AMD 提供更优的默认配置以简化性能调优。对于英伟达,测试则暴露了其新款 Blackwell 驱动在快速启停实例时存在初始化相关的障碍。

英伟达首席执行官黄仁勋表示:

在长上下文推理的推动下,推理需求呈指数级增长。NVIDIA Grace Blackwell NVL72 正是为这个充满思考力的 AI 新时代而生。NVIDIA 通过持续的硬件和软件创新来满足这一需求,从而赋能 AI 的未来发展。 通过频繁的基准测试,InferenceMax 让业界能够清晰地了解 LLM 推理在实际工作负载下的性能。结果显而易见:搭载 TRT-LLM 和 Dynamo 的 Grace Blackwell NVL72 可提供无与伦比的单位成本和单位兆瓦性能,为全球生产力最高、成本效益最高的 AI 工厂提供支持。

AMD 首席执行官苏姿丰表示:

开放式协作正在推动人工智能创新的新时代。开源 InferenceMax 基准测试为社区提供透明的每日结果,从而激发信任并加速进步。 它凸显了我们的 AMD Instinct MI300、MI325X 和 MI355X GPU 在不同工作负载下具有竞争力的 TCO 性能,彰显了我们平台的强大实力以及我们致力于让开发人员实时了解软件进度的承诺。

IT之家附上参考地址

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
俄国命运攸关,中国作壁上观?为何俄罗斯被动,中国却不两肋插刀

俄国命运攸关,中国作壁上观?为何俄罗斯被动,中国却不两肋插刀

静夜史君
2026-07-02 03:00:07
上海申花官宣夏季转会窗首位新援!

上海申花官宣夏季转会窗首位新援!

中超伪球迷
2026-07-04 15:51:42
0-0,中甲第2与中甲第3握手言和,深圳青年人终结2连败

0-0,中甲第2与中甲第3握手言和,深圳青年人终结2连败

俯身冲顶
2026-07-04 20:55:41
梦鸽李天一赴美不归?看到85岁李双江“现状”,原来杨洪基没说谎

梦鸽李天一赴美不归?看到85岁李双江“现状”,原来杨洪基没说谎

阿纂看事
2024-11-05 11:54:58
“明星失业”冲上热搜,娱乐圈最大的泡沫终于破了

“明星失业”冲上热搜,娱乐圈最大的泡沫终于破了

万物新世相
2026-07-01 22:14:53
苏州政协原副主席金海龙5月被查后,吴中政协原副主席戈福林被查

苏州政协原副主席金海龙5月被查后,吴中政协原副主席戈福林被查

江南江南
2026-07-04 16:18:08
不换人!男篮12人飞往韩国,2媒体人炮轰集训,1人含蓄,1人扎心

不换人!男篮12人飞往韩国,2媒体人炮轰集训,1人含蓄,1人扎心

萌兰聊个球
2026-07-04 13:55:38
一觉醒来,WTT美国大满贯,国乒传来三大振奋人心的好消息!

一觉醒来,WTT美国大满贯,国乒传来三大振奋人心的好消息!

田先生篮球
2026-07-04 06:54:57
茅台还是那个茅台,顶流资本用真金白银投票

茅台还是那个茅台,顶流资本用真金白银投票

钛媒体APP
2026-07-04 12:07:23
蔡康永日本办画展,林志玲头发油腻、面黄肌瘦,小S周杰伦送花篮

蔡康永日本办画展,林志玲头发油腻、面黄肌瘦,小S周杰伦送花篮

眼底星碎
2026-07-04 01:39:32
日本人乘坐中国高铁后,愤怒说出三大“缺点”,让人无力反驳

日本人乘坐中国高铁后,愤怒说出三大“缺点”,让人无力反驳

快乐彼岸
2026-07-02 06:21:59
看见就想吐的AI演员

看见就想吐的AI演员

新浪财经
2026-07-04 00:40:07
列治文沉船上全是华人青年!6死4伤!3米巨浪、没穿救生衣、坏掉的侧门…

列治文沉船上全是华人青年!6死4伤!3米巨浪、没穿救生衣、坏掉的侧门…

起喜电影
2026-07-04 08:18:45
英格兰墨西哥对更改开球时间不满,国际足联将维持原定时间

英格兰墨西哥对更改开球时间不满,国际足联将维持原定时间

舟望停云
2026-07-04 10:57:24
西安赛格事件发酵!网传商户进场押50万再加装修,没开业百万套牢

西安赛格事件发酵!网传商户进场押50万再加装修,没开业百万套牢

火山詩话
2026-07-04 07:13:15
山东男篮后场补强遇阻,北控新帅基本确定,青岛报价新疆年轻内线

山东男篮后场补强遇阻,北控新帅基本确定,青岛报价新疆年轻内线

中国篮坛快讯
2026-07-04 20:31:12
7月4日,基本养老金的调整通知公布了吗?工龄低于20年能涨3.5%吗

7月4日,基本养老金的调整通知公布了吗?工龄低于20年能涨3.5%吗

小谈食刻美食
2026-07-04 07:34:34
中国为啥不用自研的北斗系统,仍然使用美国GPS,难道技不如人?

中国为啥不用自研的北斗系统,仍然使用美国GPS,难道技不如人?

古书奇谈
2026-07-03 15:23:15
拍一半坐地起价被赶出剧组,烧掉千万胶片,这剧至今仍是神作

拍一半坐地起价被赶出剧组,烧掉千万胶片,这剧至今仍是神作

手工制作阿歼
2026-07-04 17:32:44
她预言了自己的死亡!!

她预言了自己的死亡!!

梳子姐
2026-07-01 20:01:45
2026-07-04 22:00:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
353156文章数 607331关注度
往期回顾 全部

科技要闻

韬定律论文V2版,充工程细节和实测数据

头条要闻

13年前收礼被偷拍的县长被查 偷拍他的父子此前被判刑

头条要闻

13年前收礼被偷拍的县长被查 偷拍他的父子此前被判刑

体育要闻

揭法国锋线最大优势 有人比姆巴佩还快?

娱乐要闻

白鹿打戏抠图惹非议 连累丞磊遭扒皮

财经要闻

韩国股市杠杆失控:450亿美元资金狂飙

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

教育
旅游
健康
时尚
公开课

教育要闻

弥勒老师学生课堂喊麦“暑期安全”!#暑期安全 #弥勒融媒

旅游要闻

暑期旅游旺季开启 青岛凭借“避暑+海滨+美食”的多元体验进入AI交互最热门目的地城市前三名

听说少吃点能抗衰老?专家讲解!

别再说"露肩衣服 "难驾驭!看看这几组日常穿搭,大方有回头率

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版