网易首页 > 网易号 > 正文 申请入驻

郑纬民院士:内存型长记忆存储以存换算,是AI推理新趋势

0
分享至

近日,在中国电子工业标准化技术协会主办的数据存储专业委员会成立大会上,中国工程院院士、清华大学教授郑纬民发表“AI存储是人工智能大模型的关键基座”主题演讲。

中国工程院院士、清华大学教授郑纬民

郑纬民院士介绍到人工智能进入大模型时代有两个特点:第一,基础大模型进入多模态时代,从单纯文本到图片视频等多模态语料信息的综合应用。第二,大模型已真正在金融、医疗、智能制造等多个领域应用。

围绕大模型四个环节,郑纬民院士介绍了大模型训练和推理应用中对存储的挑战和相关技术:

第一个环节,数据获取:大模型训练需要海量的原始语料数据,这些数据获取以后需要存储设备存起来,同时大模型从单模态到多模态,出现数百亿的小文件,文件系统的目录要求可扩展、读写快,需要存储具备低延迟和高可扩展能力。

第二个环节,数据预处理:获取的数据质量太差,好多数据是重复的、低质量的,因此需要进行预处理,将低质量数据变成高质量。有人统计过ChatGPT4这样级别的大模型需要用1万块A100卡训练了11个月,而其中数据预处理可能会占一半以上的时间,真正有效的训练时间只有一半,这跟数据存储的性能有很大关系。

第三个环节,模型训练:模型训练中有很多问题,比如10万块卡组成的系统可靠性是很难保证的,平均一个小时要出一次错,集群可用度非常低。为了快速完成断点续训,需要把CheckPoint点的数据读取出来重新训练,这个时候就很依赖存储系统的性能。高性能的AI存储系统,能够极大缩短断点续训时间,实现AI集群的算力可用度大幅提升。

华为跟清华大学MADSys实验室联合开发了高性能AI存储系统,首次获得国际权威机构MLPerf Storage基准评测第一名,性能密度是第二名的两倍。

第四个环节,模型推理:模型推理是最直接跟AI应用相关的环节,更多的数据、更大的模型以及更长的上下文窗口能够带来更高效的人工智能。但是有个问题,更高的智能要求的推理负载极重,模型参数以及推理过程中产生的KV-Cache都需要很大的存储空间,特别是200万字节的长序列对卡的要求很高。这方面国内优秀的大模型应用Kimi就和清华大学MADSys实验室共同推出了 Mooncake 分离式推理架构,通过把需要共享的KV-Cache保存下来,采用以存换算的思路大幅度提升系统吞吐。

郑纬民院士表示,模型的推理过程是一个复杂的存储系统工程,关键是能够存的多、传的快、性价比高。清华大学 MADSys 实验室联合华为数据存储、9#AISoft、阿里云、面壁、趋境等几家公司共同开发高性能内存型长记忆存储系统,即将开源发布。能够大范围全局共享与持久化KV-Cache,实现以存换算。共建大模型时代下的高性能内存型长记忆存储系统生态,充分发挥存储在大模型下的作用。

最后,郑纬民院士总结道,AI存储是人工智能大模型的关键基座,存储系统存在于大模型生命周期的每一环,是大模型的关键基座,通过以存强算、以存换算,先进的AI存储能够提升训练集群可用度,降低推理成本,提升用户体验。

来源:环球网

声明:此公号(ID:cnzifi)发布内容和图片的目的在于传播更多信息,版权归原作者所有,不为商业用途,如有侵犯,敬请作者与我们联系。

2024中关村“番钛客”金融科技国际创新大赛火热报名中!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
意外!U22国足与乌兹别克斯坦的比赛没开踢,两位主力就确定无缘出战

意外!U22国足与乌兹别克斯坦的比赛没开踢,两位主力就确定无缘出战

懂个球
2025-11-17 23:38:11
11月17日全运会金牌榜:浙江狂揽10金,山东4金继续领跑,广东2金

11月17日全运会金牌榜:浙江狂揽10金,山东4金继续领跑,广东2金

萌兰聊个球
2025-11-17 22:41:34
高市早苗的面相:阴阳蛇相三角克夫克家,所以丈夫瘫痪,没有子女

高市早苗的面相:阴阳蛇相三角克夫克家,所以丈夫瘫痪,没有子女

风月观主
2025-11-17 11:54:57
大梦初醒已为时晚?2大芯片巨头反叛,中国不会再原谅

大梦初醒已为时晚?2大芯片巨头反叛,中国不会再原谅

霁寒飘雪
2025-11-18 09:11:56
大瓜!女子出轨被抓:4年花光男友30万,开房用亲密付,现场火爆

大瓜!女子出轨被抓:4年花光男友30万,开房用亲密付,现场火爆

娜乌和西卡
2025-11-17 10:12:19
太嚣张!山西反杀案当晚申家儿子不在场,郭某夫妇竟对警方撂狠话

太嚣张!山西反杀案当晚申家儿子不在场,郭某夫妇竟对警方撂狠话

爱写的樱桃
2025-11-16 21:36:38
CCTV5直播!林诗栋回家!樊振东马龙王楚钦过关 男团8强对阵表

CCTV5直播!林诗栋回家!樊振东马龙王楚钦过关 男团8强对阵表

好乒乓
2025-11-18 02:14:37
伊朗军官号召民众起义推翻神棍政权

伊朗军官号召民众起义推翻神棍政权

金召点评
2025-11-16 04:00:02
快船激战76人!哈登单节狂轰17分 祖巴茨稳健 科林斯打铁

快船激战76人!哈登单节狂轰17分 祖巴茨稳健 科林斯打铁

胖子喷球
2025-11-18 09:10:36
陈妤颉创28年全运女子百米最佳 先天短跑圣体!中国短跑开启陈时代

陈妤颉创28年全运女子百米最佳 先天短跑圣体!中国短跑开启陈时代

劲爆体坛
2025-11-17 22:30:03
网红博主登山坠崖身亡,两天前怒怼网友,评论区留言一语成谶

网红博主登山坠崖身亡,两天前怒怼网友,评论区留言一语成谶

央小北
2025-11-17 16:02:39
中日交涉开始,最大输家提前浮现,不是64岁早苗,日本民调一边倒

中日交涉开始,最大输家提前浮现,不是64岁早苗,日本民调一边倒

回京历史梦
2025-11-18 10:36:28
录音终局:秦雯的无能与王家卫的选择,他们赌古二活不到胜利那天

录音终局:秦雯的无能与王家卫的选择,他们赌古二活不到胜利那天

动物奇奇怪怪
2025-11-17 13:28:57
全运会战报:女团三连冠出局,梁靖崑终崛起独得2分,陈梦出意外

全运会战报:女团三连冠出局,梁靖崑终崛起独得2分,陈梦出意外

五姑娘台球
2025-11-18 10:53:55
哇,这脸蛋极致又高级,这要是在古代,妥妥的贵妃

哇,这脸蛋极致又高级,这要是在古代,妥妥的贵妃

草莓解说体育
2025-11-16 00:45:56
沙漠下面几乎全是石油,我国缺油年年大量进口,那为啥不开采呢?

沙漠下面几乎全是石油,我国缺油年年大量进口,那为啥不开采呢?

扶苏聊历史
2025-11-17 16:43:13
在大陆提醒公民避免前往日本后,台蛙网民叫嚣:旅游品质提升数倍

在大陆提醒公民避免前往日本后,台蛙网民叫嚣:旅游品质提升数倍

我心纵横天地间
2025-11-17 18:14:39
狗主人的三层小洋楼遭曝光:特别气派不像差钱的人,确实无法调解

狗主人的三层小洋楼遭曝光:特别气派不像差钱的人,确实无法调解

汉史趣闻
2025-11-17 20:16:23
谁说屁股大就不能穿瑜伽裤?黄色T恤搭薄荷绿瑜伽裤,成熟有活力

谁说屁股大就不能穿瑜伽裤?黄色T恤搭薄荷绿瑜伽裤,成熟有活力

小乔古装汉服
2025-11-12 11:46:01
鲜公开毛岸英牺牲真相,内容简短却相当炸裂,真凶并非美国空军

鲜公开毛岸英牺牲真相,内容简短却相当炸裂,真凶并非美国空军

博古通今天下事
2025-11-02 07:00:05
2025-11-18 11:40:49
中关村互联网金融研究院
中关村互联网金融研究院
金融科技资讯、研究报告等信息
2093文章数 224关注度
往期回顾 全部

科技要闻

马斯克破防了!贝索斯62亿美金入局"实体AI"

头条要闻

"中方没有G20见高市早苗计划" 外交部回答斩钉截铁

头条要闻

"中方没有G20见高市早苗计划" 外交部回答斩钉截铁

体育要闻

直到退役那天,“海湾梅西”也没去欧洲踢球

娱乐要闻

曝喻恩泰离婚2年前转移走300箱茅台?

财经要闻

青云租陷兑付危机 集资与放贷的双面生意

汽车要闻

更加豪华 更加全地形 极石ADAMAS

态度原创

艺术
房产
旅游
数码
家居

艺术要闻

优雅浪漫的绘画,美到让人想直接住进去!

房产要闻

大胆预测:三亚湾终极版低密度豪宅可能要来了!

旅游要闻

第二批“世界旅游名山”名单出炉

数码要闻

世界首款微处理器MP944揭秘,比英特尔4004早1年问世

家居要闻

彰显奢华 意式经典风格

无障碍浏览 进入关怀版