网易首页 > 网易号 > 正文 申请入驻

为大模型专门优化 浪潮信息发布分布式全闪存储AS13000G7-N系列

0
分享至

北京2024年5月10日 /美通社/ -- 近日,浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列。该系列依托浪潮信息自研分布式文件系统,搭载新一代数据加速引擎DataTurbo,通过盘控协同、GPU直访存储、全局一致性缓存等技术为AI大模型数据归集、训练、数据归档与管理等阶段提供强大存储支撑能力,助力用户加速大模型系统的创新及应用落地。



化解大模型时代的存储挑战 构建坚实的数据存储底座

大模型已经成为驱动数字经济深度创新、引领企业业务变革、加速形成新质生产力的重要动能,随着大模型参数量和数据量的极速膨胀,多源异构数据的传、用、管、存,正在成为制约生成式AI落地的瓶颈之一,用户亟需构建更加高效的存储底座。在数据准备阶段,在规模大、来源广泛、格式多样的原始数据中,筛选和清洗出利用于训练的高质量数据常会耗费大量时间;在模型训练阶段,海量小文件数据加载、Checkpoint数据调用对IO处理效率提出严苛要求;模型训练之后,多个数据资源池无法互通、海量冷数据归档带来较高的数据管理复杂度。

作为率先在业界提出分布式融合存储的厂商,浪潮信息聚焦行业客户的大模型落地需求与核心痛点,基于NVMe SSD研发出高效适配和优化的分布式全闪存储AS13000G7-N系列。硬件方面,AS13000G7-N是一款2U24盘位的全闪存储机型,搭载英特尔®至强®第四、第五代可扩展处理器,支持400 Gb 网卡,同时每盘位可配置15.36TB 大容量NVMe SSD。软件方面,通过集群控制服务将N个节点联成一套具有高扩展性的文件系统;通过分布式元数据服务提升海量小文件读写性能;通过数控分离架构,实现东西向网络优化,降低IO访问时延,提升单节点带宽。在软硬件协同创新下,AS13000G7-N充分满足大模型应用在存储性能和存储容量方面的严苛需求。

具体来说,在数据准备阶段,通过多协议融合互通技术,面对多份、多种协议的数据,存储底层仅保留一份数据,实现数据共享免搬迁;在模型训练阶段,通过大小IO智能识别和缓存预读技术快速保存和恢复checkpoint(检查点)文件,实现TB级训练数据Checkpoint读取耗时从10分钟缩短至10秒内,大幅提升训练过程中数据加载速度;RDMA/RoCE网络连接技术和数控分离架构的设计,实现东西向数据免转发,极限发挥大模型训练中硬件网络带宽性能;基于盘控协同架构,网络数据直通NVMe SSD,进一步提升单盘带宽;在数据归档与管理阶段,AS13000G7-N提供了多元异构存储的统一纳管能力,保障数据资产高效存储与管理,大幅提升存储资源的利用率且最大化数据基础设施投资回报比。



DataTurbo数据加速引擎,全力保障大模型高效训练

在大模型的数据应用全流程中,要想使训练效率达到极致,减少不必要的资源浪费,训练阶段的数据读写性能成为重中之重。而想要提升算力利用率、降低模型训练成本,必须要在数据存储性能上进行创新。

AS13000G7-N系列具备强大的端到端性能优化能力,这也是模型训练阶段最为核心的考量因素。浪潮信息基于计算和存储协同的理念,依托自研分布式文件系统构建了新一代数据加速引擎DataTurbo,在缓存优化、空间均衡、缩短GPU与存储读取路径等方面进行了全面升级。"

  • 智能缓存优化,保障大模型训练速度与质量

AS13000G7-N能够通过对大小IO的智能识别,进行分类治理,小文件采取聚合的操作,大文件采取切片的操作,所有数据以大小均衡的模式保存到全局缓存中,实现小文件性能提升5倍,大文件性能提升10倍。在模型训练中断后,从Checkpoint恢复数据过程中,AS13000G7-N通过缓存预读技术,提前识别数据的冷热程度,加速了重复样本数据的读取,训练加载速度提升10倍。无论是读操作还是写操作,AS13000G7-N采取了字节级(Byte)分布式锁机制,粒度是主流并行文件系统锁机制粒度的几十分之一,确保多个节点访问共享资源时能够安全、有序地进行操作,从而保持训练数据的强一致性和训练质量。

  • 智能空间均衡,高水位下性能无衰减

AS13000G7-N搭载了浪潮信息自主研发的分布式并行客户端技术,相比通用私有客户端,卸载了独立的元数据,实现了元数据和数据节点的高效统一部署,有效提升存储的并发能力,充分利用训练节点网卡的带宽,让GPU算力得到完全释放。同时在存储端,相较于业界主流的文件系统需要在磁盘之上构筑一层文件协议,AS13000G7-N能够直接对裸盘的空间进行均衡排布,并在管理层面设计了智能空间预分技术,能够结合用户前端算力节点数量、训练模型的数量,对存储空间分配进一步进行智能策略预埋。这套组合拳能够使AS13000G7-N在空间利用率达到95%高水位时,依然可以平稳输出强大的性能。在模型训练的空间损耗上,AS13000G7-N相较传统方案,将损耗率降低了85%左右,充分保护了客户在大模型存储上的投资。

  • GPU直通存储,服务万亿参数大模型

当大模型参数在百亿级别,GPU对存储资源的调用效率往往差别不大。但随着大模型从单模态走向多模态,数据量指数型增长,训练效率随之要求更高。从数据层面来看,AS13000G7-N具备和GPU直通的能力,数据流不经过客户端缓存,直接到达存储底层文件系统,缩短GPU与存储的读取路径,这项技术能够使存储读写带宽翻倍,大模型训练加载时间缩短50%。随着万卡万亿参数模型时代的到来,GPU直通存储高效提升数据读写访问的能力将是大模型训练的标配。

通过上述技术创新,分布式全闪存储AS13000G7-N凭借领先的性能和管理优势,能够帮助用户加速大模型的数据归集、提升模型训练效率、简化海量异构数据的管理,从而推动业务智能化变革。浪潮信息将借助AS13000G7-N等存储产品,与合作伙伴加快在场景化方案定制、市场拓展等方面的创新,助力用户构筑人工智能时代最佳数据存储底座。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国前防长卡特突然身亡,任内对华很强硬,死因:突发心脏病

美国前防长卡特突然身亡,任内对华很强硬,死因:突发心脏病

爱钓鱼的超哥呀
2024-06-04 10:59:10
鹏华美女基金经理萧嘉倩赌博式投资!重仓押注致5月收益倒数第一

鹏华美女基金经理萧嘉倩赌博式投资!重仓押注致5月收益倒数第一

机构之家
2024-06-04 11:08:41
36岁,社区打电话催生三胎,我答:没空生,对方一句话差点气死我

36岁,社区打电话催生三胎,我答:没空生,对方一句话差点气死我

婉秋聊育儿
2024-06-03 11:16:04
一干部被查,涉嫌严重违纪违法

一干部被查,涉嫌严重违纪违法

锡望
2024-06-04 11:14:49
张康阳出局第13天,国米宣布:CEO当主席!苏宁系6人被除名

张康阳出局第13天,国米宣布:CEO当主席!苏宁系6人被除名

小豆豆赛事
2024-06-04 18:43:17
贝克汉姆拥抱哈珀看球赛,却被网友质疑太过亲密,女儿大了要避嫌

贝克汉姆拥抱哈珀看球赛,却被网友质疑太过亲密,女儿大了要避嫌

麦大人
2024-06-03 13:30:19
官方正式表态定性!铁头也说已安全回国,但有3个细节很不对劲!

官方正式表态定性!铁头也说已安全回国,但有3个细节很不对劲!

李大娱乐糊涂
2024-06-04 11:46:11
Shams:詹姆斯已经公开表示 他不会参与球队的选帅工作

Shams:詹姆斯已经公开表示 他不会参与球队的选帅工作

直播吧
2024-06-05 06:09:06
朝鲜副国级高官叛逃脱北,曝光金家秘闻:酒池肉林、80万买轩尼诗

朝鲜副国级高官叛逃脱北,曝光金家秘闻:酒池肉林、80万买轩尼诗

猫眼观史
2024-03-25 14:31:14
最脆弱卫冕冠军!欧洲杯未开打损失7员大将,蓝衣军团还有戏吗?

最脆弱卫冕冠军!欧洲杯未开打损失7员大将,蓝衣军团还有戏吗?

体坛老球迷
2024-06-04 21:42:49
南宁地摊经济疯狂泛滥的5个根本原因!现在制止还来得及么?

南宁地摊经济疯狂泛滥的5个根本原因!现在制止还来得及么?

华庭讲美食
2024-06-04 12:01:03
拜登不参加“和平峰会”,乌克兰失落

拜登不参加“和平峰会”,乌克兰失落

环球时报国际
2024-06-05 07:23:12
詹姆斯:也许独行侠今年能夺冠因他们有欧文 没什么词能赞扬他了

詹姆斯:也许独行侠今年能夺冠因他们有欧文 没什么词能赞扬他了

直播吧
2024-06-05 02:36:07
重创?曝德约右膝半月板撕裂!基本无缘温网,难参加最后1届奥运

重创?曝德约右膝半月板撕裂!基本无缘温网,难参加最后1届奥运

我爱英超
2024-06-04 23:45:26
心虚了?穿马面裙进教堂遭群嘲后,女博主连夜删视频,网友不买账

心虚了?穿马面裙进教堂遭群嘲后,女博主连夜删视频,网友不买账

水泥土的搞笑
2024-06-04 22:16:49
女人在过夫妻性生活时,为什么总发出声音?医生:大多数人不了解

女人在过夫妻性生活时,为什么总发出声音?医生:大多数人不了解

皮皮讲文
2024-01-02 10:36:17
余承东不用嘲笑了,180万特斯拉车主,能扔掉手机支架了

余承东不用嘲笑了,180万特斯拉车主,能扔掉手机支架了

互联网.乱侃秀
2024-06-04 12:24:53
34岁男子应聘墓地巡逻员,月薪18000,每天喝茶遛狗。网友羡慕了

34岁男子应聘墓地巡逻员,月薪18000,每天喝茶遛狗。网友羡慕了

扶苏聊历史
2024-06-03 11:49:59
0-0,意大利受挫,同时还付出了1主力伤退的代价,欧洲杯埋隐患

0-0,意大利受挫,同时还付出了1主力伤退的代价,欧洲杯埋隐患

侧身凌空斩
2024-06-05 06:43:09
中菲两国海军快艇在仁爱礁海域爆发“激战”!

中菲两国海军快艇在仁爱礁海域爆发“激战”!

头条爆料007
2024-06-04 18:33:40
2024-06-05 08:52:49
天天财经116
天天财经116
天天在线财经频道官网账号。走近这里,走近财经。
3308文章数 799关注度
往期回顾 全部

科技要闻

马斯克把特斯拉5亿美元AI芯片提前调拨给X

头条要闻

大选结果揭晓 印媒:莫迪浪潮崩溃 印度发生重大转变

头条要闻

大选结果揭晓 印媒:莫迪浪潮崩溃 印度发生重大转变

体育要闻

从英国联赛到NBA,两个美国人相爱相杀

娱乐要闻

杨幂留言为热巴庆生,姐妹情深惹人羡

财经要闻

六年四换帅,茅台到底经历了什么?

汽车要闻

2.0T+云辇-P+天神之眼 方程豹豹8还配软包内装

态度原创

游戏
本地
艺术
旅游
公开课

魂师对决:从海三9环的实战评测看神技效果!目前感觉有点呆啊!

本地新闻

我和我的家乡|踏浪营口,心动不止一夏!

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

旅游要闻

去年中国156人死于户外探险

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版