网易首页 > 网易号 > 正文 申请入驻

MLPerf揭榜:拆解“黄金标准”背后的AI存储新姿势

0
分享至

文 | 智能相对论

作者 | 叶远风

大模型正在进入普遍万亿参数时代。

一方面,算力的重要性近一步提升;另一方面,万亿参数的压力同样给到了存储——如果说过去AI计算对存储性能的需求似乎还不那么急迫,那么现在存储性能能否跟上,正在很大程度上决定AI创新的成败。

企业如何选择最能契合需要的存储产品方案?

不久前,全球权威AI性能评测组织公布最新MLPerf® Storage v2.0基准测试结果,这份权威榜单,除了直接给出企业如何选择供应商的参考,更给出了一份存储面向万亿参数时代如何演进的答案。



与真实场景需求共舞,MLPerf“黄金标准”再进化

2018年,早在大模型还没起势时,谷歌、英伟达、英特尔、哈佛大学等 70余家顶尖科技企业和学术机构就联合推动发起了MLPerf,要通过统一框架避免厂商自测的片面性,覆盖训练、推理、存储、HPC等全场景测试,为用户提供客观采购依据。

到目前为止,MLPerf已经被公认为AI硬件性能的“黄金标准”,全球头部企业(英伟达、谷歌、AMD、华为等)均定期提交测试结果。

可以看到,无论发起者还是参与者都是当下最前沿的科技企业,有着对AI计算发展最深度的理解,这使得MLPerf并非AI时代很多榜单那样的“奥数竞赛”(只为了刷分数而与现实需要脱节),而是一直来源于现实,并且指导现实技术进化。

因此,看待MLPerf榜单,绝不能仅仅从参数排行来看,而更应该关注它背后的规则逻辑,这些规则逻辑代表着AI计算实践过程中最符合企业实际需要的现实。

典型如,MLPerf存储基准测试在规则上的变化过程,去年该测试进行了一次适应性升级到了V1.0版本(这次是2.0版本,规则沿用),最大的不同是核心指标发生变化,即在给定的训练模型和GPU型号下,存储系统能支持的GPU数量,而非每GPU带宽值或每计算节点带宽值——这次的MLPerf存储基准测试,其目标就是满足一定加速器利用率的前提下,测试出存储系统能够支持的最大加速器数量以及能够提供的最大带宽。

规则变更的背景,是万亿参数时代到来,训练数据集的规模正从TB级别上升至PB级,存储系统必须具备强大的扩展能力和对大规模AI集群的支持能力,毕竟,支持更多的GPU数量将会决定系统性能的“上限”(固定资产投资方面也更能摊薄边际成本),只纠结单个GPU性能数据的参考意义并不大。

华为OceanStor A系列存储联合济南超级计算技术研究院(JNIST)的合作解决方案,在此次MLPerf测试中获得单存储设备、每U存储设备及单客户端性能等榜单上的全球第一,原因就在于此。

从直接的参数性能来看,在Training场景中,单台8U双节点架构的OceanStor A800获得单存储设备性能第一,持续提供698 GiB/s的稳定带宽:



单台2U双节点架构的OceanStor A600获得每U设备及单客户端性能第一,其中每U带宽稳定达108 GiB/s,单客户端带宽达104 GiB/s:



同样的命题,显著的领先,离不开华为OceanStor A800以单台8U双节点架构可支撑255张H100 GPU训练数据吞吐需求,而OceanStor A600以单台2U双节点架构的可支撑76张H100 GPU训练场景的吞吐需求。

不是有人“打榜”到了第一,而是一贯来源于实际需求的MLPerf在告诉业界什么才是最符合需要的,这才是“黄金标准”的内涵。

如此,MLPerf也才能反过来引导和推进技术创新,带来英伟达Blackwell的FP4精度、TensorRT-LLM框架优化、Untether AI芯片能效提升等“榜单测试反哺技术创新”的经典案例。

值得一提的是,多加速器支持并不是所有场景的AI存储需求都十分迫切,那些足够有实力的厂商要想充分体现自己在新需求下的能力,必须选择更能压榨性能的用例。因此可以看到华为存储在MLPerf Storage Traning场景下3D U-Net、Resnet50、cosmoflow三个用例中,选择了(在H100算力卡下)3D U-Net这个对存储带宽压力最大的训练用例,这样才能将其多加速器支持进行最极致的展现,充分表达存储产品的性能。



“强化协同下的资源池化”——AI计算、存储发展趋势殊途同归

不久前的世界人工智能大会上,384块昇腾910C组合在一起昇腾384超节点成为全场焦点:



以更多的芯片数量进行AI计算,资源“池化”集群获得高算力(昇腾384超节点总算力高达300 PFLOPS),类似的还有英伟达的NVIDIA GB200 NVL72集群系统,72个GPU实现180 PFLOPS算力。

MLPerf在存储方面评测规则及胜出厂商的玩法,其实与这种AI计算性能的发展逻辑同向而行。当多芯片资源的池化整合大大拉升AI计算的能力上限,对应地,存储去支持更多的GPU数量、实现总带宽突破而不纠结对单个GPU支撑能力数据,也是大势所趋。

在这个过程中,协同能力是关键——不能“无脑堆砌”,“强化协同下的资源池化”才有意义。英伟达用于卡间互联的NVLink技术以及传统铜缆传递数据支撑不起更庞大的集群,其集群算力比不过有光通信支持的昇腾超节点。

在AI存储对多GPU的支持这里,也存在类似的现象。

由于多GPU计算存在“木桶效应”,在一个计算Step中,某一个GPU数据延迟会造成其他加速器“等待”,最终拖慢整个Step使得利用率降低、无法获得预期的带宽,存储必须做到在高带宽压力下(意味着更多GPU),也能够给训练系统提供稳定的低时延(提升利用效率),华为OceanStor A系列存储正是与合作伙伴JNIST一起解决了这一“既要又要”难题才最终登顶榜首。

换句话说,在AI存储这里,不是你想要支撑更多GPU就能支撑起来的,做好协同才能不断提升带宽上限,否则“加法”的效率会越来越低。

“屏蔽复杂性”,存储创新回归IT服务本质

“强化协同下的资源池化”对企业而言究竟意味着什么?

答案是IT供应商的本质任务——屏蔽复杂性,无论是AI计算还是AI存储,企业只需要索求一个最终的结果,有限预算下更强大的算力或者更高的带宽,各种复杂技术协同都由供应商来解决。

这个底层逻辑推动着那些优质存储厂商的发展,登顶MLPerf的华为OceanStor A系列产品,在更体系化的层面是华为AI存储解决方案的一部分,后者在更整体上帮助企业全面屏蔽复杂性,才有了前者的“出街”。



具体来看,数据在当下已经成为企业的重要资产,但过去普遍的基础设施分开建设的做法,让企业们形成了“烟囱式”数据孤岛,这是数字化时代留给智能化时代的负面遗产,它很“复杂”,严重影响到企业的AI创新。

而华为存储站了出来,基于过去长期服务企业的经验,帮助企业“屏蔽复杂性”,构建起了统一的AI数据湖解决方案。不管企业数据再乱、再复杂,需要支撑AI计算的时候,华为的方案创新都能帮助企业“抹平”数据到计算的鸿沟,智能分级流动,打破数据孤岛,保证AI数据高效供给,大幅提升AI集群算力利用率,节省大模型训练时间。

这是一种“瞌睡遇枕头”式的创新,在这个创新体系中,除了OceanStor A系列,华为存储还提供大容量存储池,满足企业多模态、万亿参数大模型容量诉求,以及数据保护全面保障数据安全。

顺着这个思路往下看,很多存储创新都更能够被理解,例如当企业需要不同类型的数据范式时,华为存储构建PB级KV Cache全局共享资源池,不仅10倍提升推理吞吐,还内置RAG知识库,各种“杂七杂八”的数据形式都被支持,企业不需要直面这些“复杂性”,只需要放手发展自己的AI能力即可。

总而言之,MLPerf榜单的“登顶”者,向业界展现的是一系列围绕市场最真实需要的存储创新进化过程,这不是一次简单的“打榜”,而是创新风向的指南针。

*本文图片均来源于网络

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
医生建议:过了70的老人,宁可牙齿缺失,也别在这4种状态去镶牙

医生建议:过了70的老人,宁可牙齿缺失,也别在这4种状态去镶牙

普陀动物世界
2025-09-12 10:34:07
橙色预警!深圳全市进入暴雨防御状态

橙色预警!深圳全市进入暴雨防御状态

国际在线
2025-09-19 18:28:12
国家首次提出,建设超10万台!

国家首次提出,建设超10万台!

中国新闻周刊
2025-09-17 11:32:41
美国单方面宣布:中国统一台湾的权力,被剥夺了。

美国单方面宣布:中国统一台湾的权力,被剥夺了。

时分秒说
2025-09-16 10:53:39
连医美都救不了了!韦雪颜值崩塌,正在步叶珂后尘

连医美都救不了了!韦雪颜值崩塌,正在步叶珂后尘

小椰的奶奶
2025-09-20 02:54:56
【公告精选】三家A股公司将被ST,下周一停牌

【公告精选】三家A股公司将被ST,下周一停牌

证券时报e公司
2025-09-19 23:17:11
荷兰小仙女赢世锦赛女400栏连冠 但除了身高她无法超越麦克劳林

荷兰小仙女赢世锦赛女400栏连冠 但除了身高她无法超越麦克劳林

威猛孟巍
2025-09-19 23:49:36
范世琦方终于回应,否认当晚参与伤害于朦胧,晒证据击碎5大谣言

范世琦方终于回应,否认当晚参与伤害于朦胧,晒证据击碎5大谣言

小海娱计
2025-09-19 18:54:28
刚刚,欧盟公布并批准对俄罗斯的第19轮制裁措施

刚刚,欧盟公布并批准对俄罗斯的第19轮制裁措施

山河路口
2025-09-19 23:27:29
善恶有报,一首歌吃一辈子、改换国籍的苏小明,终是遭到'反噬'

善恶有报,一首歌吃一辈子、改换国籍的苏小明,终是遭到'反噬'

悬崖边上的爱情
2025-09-20 04:25:32
河北养老金二次核算下月启动!这些人能补多少钱?

河北养老金二次核算下月启动!这些人能补多少钱?

野原111
2025-09-20 04:06:00
5个征兆已经出现,预示2026年房价已定,或将超出你的想象!

5个征兆已经出现,预示2026年房价已定,或将超出你的想象!

山丘楼评
2025-09-19 10:08:07
原来这两位央视主持人是夫妻?低调了20年,如今一家三口太幸福了

原来这两位央视主持人是夫妻?低调了20年,如今一家三口太幸福了

古木之草记
2025-09-12 20:02:17
重庆通报:正局级封毅被查

重庆通报:正局级封毅被查

新浪财经
2025-09-19 20:49:05
国产GPU破局时刻:砺算7G100硬刚RTX 4060,图形赛道杀出黑马!

国产GPU破局时刻:砺算7G100硬刚RTX 4060,图形赛道杀出黑马!

O哎财经
2025-09-19 11:16:30
广州俩女生坐公交去北京,跨27市2600公里,途中险些被半挂车撞

广州俩女生坐公交去北京,跨27市2600公里,途中险些被半挂车撞

轩逸阿II
2025-09-19 17:02:25
小心“张云龙”!多名受害者及家属指认:他已诱骗至少4人到柬埔寨同一电诈园区

小心“张云龙”!多名受害者及家属指认:他已诱骗至少4人到柬埔寨同一电诈园区

红星新闻
2025-09-18 20:23:06
公务员禁酒令扩围!下班及节假日饮酒查控加码,舆论争议不断

公务员禁酒令扩围!下班及节假日饮酒查控加码,舆论争议不断

慧眼看世界哈哈
2025-09-19 06:22:56
仅一小时,好评如潮!连追2集后,我敢打包票:这古装大剧必爆

仅一小时,好评如潮!连追2集后,我敢打包票:这古装大剧必爆

崽下愚乐圈
2025-09-19 18:09:03
10月1日起执行!中小学教师房补新政落实,退休教师也能跟着沾光吗?

10月1日起执行!中小学教师房补新政落实,退休教师也能跟着沾光吗?

娱乐的宅急便
2025-09-17 11:45:22
2025-09-20 05:39:00
智能相对论 incentive-icons
智能相对论
智能和车,边评边测;未来和家,且品且鉴
2314文章数 2411关注度
往期回顾 全部

科技要闻

直击iPhone 17开售:消费者偏爱银色橙色

头条要闻

山东入室被抢男婴到15岁没见过汽车 养家从不让他出门

头条要闻

山东入室被抢男婴到15岁没见过汽车 养家从不让他出门

体育要闻

从轮椅到铜牌 他熬了7年:下个目标唱国歌!

娱乐要闻

全智贤被全面抵制!相关代言评论区沦陷

财经要闻

习近平同美国总统特朗普通电话

汽车要闻

对话周光:一个技术理想主义者的“蜕变”

态度原创

艺术
时尚
数码
公开课
军事航空

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

卡其裤+蓝衬衫,简单高级

数码要闻

750万小米空调升级10年免费包修:为用户节省15亿元

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

卫星图像显示以军坦克集结加沙城周围

无障碍浏览 进入关怀版