网易首页 > 网易号 > 正文 申请入驻

郑纬民院士:内存型长记忆存储以存换算,是AI推理新趋势

0
分享至

近日,在中国电子工业标准化技术协会主办的数据存储专业委员会成立大会上,中国工程院院士、清华大学教授郑纬民发表“AI存储是人工智能大模型的关键基座”主题演讲。

中国工程院院士、清华大学教授郑纬民

郑纬民院士介绍到人工智能进入大模型时代有两个特点:第一,基础大模型进入多模态时代,从单纯文本到图片视频等多模态语料信息的综合应用。第二,大模型已真正在金融、医疗、智能制造等多个领域应用。

围绕大模型四个环节,郑纬民院士介绍了大模型训练和推理应用中对存储的挑战和相关技术:

第一个环节,数据获取:大模型训练需要海量的原始语料数据,这些数据获取以后需要存储设备存起来,同时大模型从单模态到多模态,出现数百亿的小文件,文件系统的目录要求可扩展、读写快,需要存储具备低延迟和高可扩展能力。

第二个环节,数据预处理:获取的数据质量太差,好多数据是重复的、低质量的,因此需要进行预处理,将低质量数据变成高质量。有人统计过ChatGPT4这样级别的大模型需要用1万块A100卡训练了11个月,而其中数据预处理可能会占一半以上的时间,真正有效的训练时间只有一半,这跟数据存储的性能有很大关系。

第三个环节,模型训练:模型训练中有很多问题,比如10万块卡组成的系统可靠性是很难保证的,平均一个小时要出一次错,集群可用度非常低。为了快速完成断点续训,需要把CheckPoint点的数据读取出来重新训练,这个时候就很依赖存储系统的性能。高性能的AI存储系统,能够极大缩短断点续训时间,实现AI集群的算力可用度大幅提升。

华为跟清华大学MADSys实验室联合开发了高性能AI存储系统,首次获得国际权威机构MLPerf Storage基准评测第一名,性能密度是第二名的两倍。

第四个环节,模型推理:模型推理是最直接跟AI应用相关的环节,更多的数据、更大的模型以及更长的上下文窗口能够带来更高效的人工智能。但是有个问题,更高的智能要求的推理负载极重,模型参数以及推理过程中产生的KV-Cache都需要很大的存储空间,特别是200万字节的长序列对卡的要求很高。这方面国内优秀的大模型应用Kimi就和清华大学MADSys实验室共同推出了 Mooncake 分离式推理架构,通过把需要共享的KV-Cache保存下来,采用以存换算的思路大幅度提升系统吞吐。

郑纬民院士表示,模型的推理过程是一个复杂的存储系统工程,关键是能够存的多、传的快、性价比高。清华大学 MADSys 实验室联合华为数据存储、9#AISoft、阿里云、面壁、趋境等几家公司共同开发高性能内存型长记忆存储系统,即将开源发布。能够大范围全局共享与持久化KV-Cache,实现以存换算。共建大模型时代下的高性能内存型长记忆存储系统生态,充分发挥存储在大模型下的作用。

最后,郑纬民院士总结道,AI存储是人工智能大模型的关键基座,存储系统存在于大模型生命周期的每一环,是大模型的关键基座,通过以存强算、以存换算,先进的AI存储能够提升训练集群可用度,降低推理成本,提升用户体验。

来源:环球网

声明:此公号(ID:cnzifi)发布内容和图片的目的在于传播更多信息,版权归原作者所有,不为商业用途,如有侵犯,敬请作者与我们联系。

2024中关村“番钛客”金融科技国际创新大赛火热报名中!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“香会”25年,中美两大主角主导安全对话“音量”

“香会”25年,中美两大主角主导安全对话“音量”

环球网资讯
2026-06-01 06:36:08
四人吃火锅要求免单后续:用5000字差评威胁老板,真容曝光已社死

四人吃火锅要求免单后续:用5000字差评威胁老板,真容曝光已社死

娱乐的硬糖吖
2026-06-01 12:26:56
老婆出轨后,我去找对方老婆,谁料他老婆:给你套房,但有个条件

老婆出轨后,我去找对方老婆,谁料他老婆:给你套房,但有个条件

千秋文化
2026-05-29 19:56:40
痛心!山西秦秀宇老师心梗去世,年仅39岁,自称60岁正是闯的年纪

痛心!山西秦秀宇老师心梗去世,年仅39岁,自称60岁正是闯的年纪

小鋭有话说
2026-06-01 12:09:23
汤淼瘫痪19年,母亲妻子另嫁,9岁女儿陪伴,生活有保障

汤淼瘫痪19年,母亲妻子另嫁,9岁女儿陪伴,生活有保障

嘴角上翘的弧度
2026-05-31 22:47:28
摧毁一架特别大飞机,击俄无线电中心!俄罗斯被打得柴油产量锐减

摧毁一架特别大飞机,击俄无线电中心!俄罗斯被打得柴油产量锐减

鹰眼Defence
2026-05-31 16:53:51
肖纯锦临刑在即,其妻哭求陈毅,一通电话救下昔日恩人

肖纯锦临刑在即,其妻哭求陈毅,一通电话救下昔日恩人

唠叨说历史
2026-03-28 15:04:59
他25岁就是军委副主席,建国后仅是部长,为何他一路走低遗憾收场

他25岁就是军委副主席,建国后仅是部长,为何他一路走低遗憾收场

史之铭
2026-06-01 02:53:43
日韩股市创新高

日韩股市创新高

财联社
2026-06-01 08:08:06
江苏一市纪委监委通报:丁汇成被查,涉嫌严重违纪违法

江苏一市纪委监委通报:丁汇成被查,涉嫌严重违纪违法

上观新闻
2026-06-01 13:24:04
新华社权威快报|全国共有少先队员1.12亿名

新华社权威快报|全国共有少先队员1.12亿名

新华社
2026-06-01 08:00:07
华为“韬定律”又让国内的赢学家们自嗨起来

华为“韬定律”又让国内的赢学家们自嗨起来

廖保平
2026-06-01 12:30:02
追梦!同曦为郭昊文开具注销证明 支持CBA本土得分王打NBA夏联

追梦!同曦为郭昊文开具注销证明 支持CBA本土得分王打NBA夏联

醉卧浮生
2026-06-01 17:17:22
把AI超算压缩成台式机,英伟达DGX Station for Windows发布

把AI超算压缩成台式机,英伟达DGX Station for Windows发布

IT之家
2026-06-01 13:09:09
苹果首款智能眼镜即将发布,非常轻便!

苹果首款智能眼镜即将发布,非常轻便!

XCiOS俱乐部
2026-06-01 09:04:01
现役第一驴!连续打了709场比赛!轮休让谁吃了?

现役第一驴!连续打了709场比赛!轮休让谁吃了?

左右为篮
2026-05-31 17:03:10
这跟不穿有啥区别!北京这一夜,31岁徐璐穿透视礼服,属实辣眼睛

这跟不穿有啥区别!北京这一夜,31岁徐璐穿透视礼服,属实辣眼睛

八斗小先生
2026-05-29 19:24:16
突发!费舍尔证实哈登将2年6000万续约骑士,火箭重聚大门已关闭

突发!费舍尔证实哈登将2年6000万续约骑士,火箭重聚大门已关闭

奕辰说球
2026-06-01 09:28:49
上海一市民食用叮咚买菜小龙虾后送医,平台"讨价还价"式理赔引争议

上海一市民食用叮咚买菜小龙虾后送医,平台"讨价还价"式理赔引争议

圆维度
2026-06-01 14:18:12
调查发现:血管最怕的早餐,油条排第五,第一名很多人天天都在吃

调查发现:血管最怕的早餐,油条排第五,第一名很多人天天都在吃

荆医生科普
2026-06-01 15:25:10
2026-06-01 18:35:00
中关村互联网金融研究院
中关村互联网金融研究院
金融科技资讯、研究报告等信息
2116文章数 224关注度
往期回顾 全部

科技要闻

两大芯片巨头打起来了

头条要闻

见习医生网购3元美工刀 拆快递时被割伤神经手无知觉

头条要闻

见习医生网购3元美工刀 拆快递时被割伤神经手无知觉

体育要闻

杰威:如果我没受伤,我们能击败马刺

娱乐要闻

奚梦瑶婚礼现场图!一双儿女当花童

财经要闻

宇树科技科创板IPO过会

汽车要闻

赛力斯联手字节打造"赛豆" 首款跨界车年内推出

态度原创

健康
家居
数码
本地
公开课

尝试干细胞疗法如何避免踩坑?

家居要闻

自信舒展 高背座椅

数码要闻

价保618享国补促销双重优惠!天选7 Pro酷睿版新品到手价7989元起

本地新闻

用剪纸的方式,打开江苏扬州

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版