网易首页 > 网易号 > 正文 申请入驻

郑纬民院士:内存型长记忆存储以存换算,是AI推理新趋势

0
分享至

近日,在中国电子工业标准化技术协会主办的数据存储专业委员会成立大会上,中国工程院院士、清华大学教授郑纬民发表“AI存储是人工智能大模型的关键基座”主题演讲。

中国工程院院士、清华大学教授郑纬民

郑纬民院士介绍到人工智能进入大模型时代有两个特点:第一,基础大模型进入多模态时代,从单纯文本到图片视频等多模态语料信息的综合应用。第二,大模型已真正在金融、医疗、智能制造等多个领域应用。

围绕大模型四个环节,郑纬民院士介绍了大模型训练和推理应用中对存储的挑战和相关技术:

第一个环节,数据获取:大模型训练需要海量的原始语料数据,这些数据获取以后需要存储设备存起来,同时大模型从单模态到多模态,出现数百亿的小文件,文件系统的目录要求可扩展、读写快,需要存储具备低延迟和高可扩展能力。

第二个环节,数据预处理:获取的数据质量太差,好多数据是重复的、低质量的,因此需要进行预处理,将低质量数据变成高质量。有人统计过ChatGPT4这样级别的大模型需要用1万块A100卡训练了11个月,而其中数据预处理可能会占一半以上的时间,真正有效的训练时间只有一半,这跟数据存储的性能有很大关系。

第三个环节,模型训练:模型训练中有很多问题,比如10万块卡组成的系统可靠性是很难保证的,平均一个小时要出一次错,集群可用度非常低。为了快速完成断点续训,需要把CheckPoint点的数据读取出来重新训练,这个时候就很依赖存储系统的性能。高性能的AI存储系统,能够极大缩短断点续训时间,实现AI集群的算力可用度大幅提升。

华为跟清华大学MADSys实验室联合开发了高性能AI存储系统,首次获得国际权威机构MLPerf Storage基准评测第一名,性能密度是第二名的两倍。

第四个环节,模型推理:模型推理是最直接跟AI应用相关的环节,更多的数据、更大的模型以及更长的上下文窗口能够带来更高效的人工智能。但是有个问题,更高的智能要求的推理负载极重,模型参数以及推理过程中产生的KV-Cache都需要很大的存储空间,特别是200万字节的长序列对卡的要求很高。这方面国内优秀的大模型应用Kimi就和清华大学MADSys实验室共同推出了 Mooncake 分离式推理架构,通过把需要共享的KV-Cache保存下来,采用以存换算的思路大幅度提升系统吞吐。

郑纬民院士表示,模型的推理过程是一个复杂的存储系统工程,关键是能够存的多、传的快、性价比高。清华大学 MADSys 实验室联合华为数据存储、9#AISoft、阿里云、面壁、趋境等几家公司共同开发高性能内存型长记忆存储系统,即将开源发布。能够大范围全局共享与持久化KV-Cache,实现以存换算。共建大模型时代下的高性能内存型长记忆存储系统生态,充分发挥存储在大模型下的作用。

最后,郑纬民院士总结道,AI存储是人工智能大模型的关键基座,存储系统存在于大模型生命周期的每一环,是大模型的关键基座,通过以存强算、以存换算,先进的AI存储能够提升训练集群可用度,降低推理成本,提升用户体验。

来源:环球网

声明:此公号(ID:cnzifi)发布内容和图片的目的在于传播更多信息,版权归原作者所有,不为商业用途,如有侵犯,敬请作者与我们联系。

2024中关村“番钛客”金融科技国际创新大赛火热报名中!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美防长放话,中俄管不了美国,话音刚落,中方专机将赴中东

美防长放话,中俄管不了美国,话音刚落,中方专机将赴中东

起喜电影
2026-03-07 19:22:13
田馥甄逼周杰伦离婚!?

田馥甄逼周杰伦离婚!?

八卦疯叔
2026-03-07 10:20:42
迈阿密国际访白宫引争议,主帅:以为只讨论足球

迈阿密国际访白宫引争议,主帅:以为只讨论足球

体坛周报
2026-03-07 14:44:11
A股:周六下午突发1个特大级消息!下周或迎来更大级别大行情?

A股:周六下午突发1个特大级消息!下周或迎来更大级别大行情?

股市皆大事
2026-03-07 15:28:33
年终奖我一毛都没有,打卡离开,退公司群,老板:九千万订单只认你

年终奖我一毛都没有,打卡离开,退公司群,老板:九千万订单只认你

奶茶麦子
2026-03-07 17:26:21
戚薇的这条裙子,但凡腰上有一点赘肉都不敢穿

戚薇的这条裙子,但凡腰上有一点赘肉都不敢穿

动物奇奇怪怪
2026-03-07 15:02:29
挤走董卿、靠爹上位、央视“穷鬼”,龙洋私生活谣言有多离谱?

挤走董卿、靠爹上位、央视“穷鬼”,龙洋私生活谣言有多离谱?

归客历史
2026-03-03 09:18:30
不容错过!3月7日晚19:35!中央5套CCTV5、CCTV5+直播节目表

不容错过!3月7日晚19:35!中央5套CCTV5、CCTV5+直播节目表

宝哥精彩赛事
2026-03-07 19:30:05
火葬场烧尸人:见惯了生离死别,最喜欢年轻漂亮的女尸

火葬场烧尸人:见惯了生离死别,最喜欢年轻漂亮的女尸

吴学华看天下
2024-06-26 12:43:21
夫妻AA制生活了9年,丈夫接婆婆来养老,妻子:滚,休想让我伺候

夫妻AA制生活了9年,丈夫接婆婆来养老,妻子:滚,休想让我伺候

清水家庭故事
2026-03-06 18:40:58
泰山3-0大胜铁人!场上数据一目了然,不是谢文能,头号功臣是他

泰山3-0大胜铁人!场上数据一目了然,不是谢文能,头号功臣是他

球场没跑道
2026-03-07 17:33:05
哈佛华西证实:咖啡真能续命!但90%的人都喝错了

哈佛华西证实:咖啡真能续命!但90%的人都喝错了

爱医斯坦
2026-02-28 10:01:47
我国最稳的3个“铁饭碗”排名:医生不吃香了,第一竟然是它

我国最稳的3个“铁饭碗”排名:医生不吃香了,第一竟然是它

李舟
2026-03-05 18:29:57
92年母亲去世,我考上大学,哥嫂集体沉默,堂嫂塞给我团红布包裹

92年母亲去世,我考上大学,哥嫂集体沉默,堂嫂塞给我团红布包裹

人间百态大全
2026-03-07 06:50:03
汪峰前妻葛荟婕被小7岁男友当众掌掴!自曝分手真相,男方太过分

汪峰前妻葛荟婕被小7岁男友当众掌掴!自曝分手真相,男方太过分

观鱼听雨
2026-03-06 17:26:12
1958年,毛主席批评周总理“离右派剩50米”,不久后总理提出辞职

1958年,毛主席批评周总理“离右派剩50米”,不久后总理提出辞职

海佑讲史
2026-01-26 07:45:05
格局打开!路虎回应魏建军致歉:真诚和担当是最好的代言

格局打开!路虎回应魏建军致歉:真诚和担当是最好的代言

快科技
2026-03-07 11:45:04
王鹤棣官宣沈月,网友:太意外了

王鹤棣官宣沈月,网友:太意外了

背包旅行
2026-03-06 20:03:22
大崩盘倒计时?顶级大牛警告:在“高息时代”,保命比赚钱更重要!

大崩盘倒计时?顶级大牛警告:在“高息时代”,保命比赚钱更重要!

澳洲财经见闻
2026-03-07 15:27:31
英媒曝鲁尼糟了!上周末凌晨三点烂醉而归 贤妻摘下婚戒决心不再忍

英媒曝鲁尼糟了!上周末凌晨三点烂醉而归 贤妻摘下婚戒决心不再忍

劲爆体坛
2026-03-07 11:02:03
2026-03-07 21:00:52
中关村互联网金融研究院
中关村互联网金融研究院
金融科技资讯、研究报告等信息
2103文章数 224关注度
往期回顾 全部

科技要闻

OpenClaw爆火,六位"养虾人"自述与AI共生

头条要闻

特朗普:伊朗今天将遭到极其猛烈的打击

头条要闻

特朗普:伊朗今天将遭到极其猛烈的打击

体育要闻

塔图姆298天走完这段路 只用27分钟征服这座城

娱乐要闻

田亮一家新年全家福!森碟变清纯少女

财经要闻

针对"不敢休、不让休"怪圈 国家出手了

汽车要闻

逃离ICU,上汽通用“止血”企稳

态度原创

旅游
健康
教育
手机
时尚

旅游要闻

六层楼高三角梅花墙,春城再添浪漫打卡地

转头就晕的耳石症,能开车上班吗?

教育要闻

教育纵深 | 清晨的“掌”声

手机要闻

iQOO 16突然曝光:200MP主摄+50MP潜望,但可能只此一杯

这些才是适合普通人的穿搭!搭配腰带、多穿牛仔裤,简单舒适

无障碍浏览 进入关怀版