网易首页 > 网易号 > 正文 申请入驻

郑纬民院士:内存型长记忆存储以存换算,是AI推理新趋势

0
分享至

近日,在中国电子工业标准化技术协会主办的数据存储专业委员会成立大会上,中国工程院院士、清华大学教授郑纬民发表“AI存储是人工智能大模型的关键基座”主题演讲。

中国工程院院士、清华大学教授郑纬民

郑纬民院士介绍到人工智能进入大模型时代有两个特点:第一,基础大模型进入多模态时代,从单纯文本到图片视频等多模态语料信息的综合应用。第二,大模型已真正在金融、医疗、智能制造等多个领域应用。

围绕大模型四个环节,郑纬民院士介绍了大模型训练和推理应用中对存储的挑战和相关技术:

第一个环节,数据获取:大模型训练需要海量的原始语料数据,这些数据获取以后需要存储设备存起来,同时大模型从单模态到多模态,出现数百亿的小文件,文件系统的目录要求可扩展、读写快,需要存储具备低延迟和高可扩展能力。

第二个环节,数据预处理:获取的数据质量太差,好多数据是重复的、低质量的,因此需要进行预处理,将低质量数据变成高质量。有人统计过ChatGPT4这样级别的大模型需要用1万块A100卡训练了11个月,而其中数据预处理可能会占一半以上的时间,真正有效的训练时间只有一半,这跟数据存储的性能有很大关系。

第三个环节,模型训练:模型训练中有很多问题,比如10万块卡组成的系统可靠性是很难保证的,平均一个小时要出一次错,集群可用度非常低。为了快速完成断点续训,需要把CheckPoint点的数据读取出来重新训练,这个时候就很依赖存储系统的性能。高性能的AI存储系统,能够极大缩短断点续训时间,实现AI集群的算力可用度大幅提升。

华为跟清华大学MADSys实验室联合开发了高性能AI存储系统,首次获得国际权威机构MLPerf Storage基准评测第一名,性能密度是第二名的两倍。

第四个环节,模型推理:模型推理是最直接跟AI应用相关的环节,更多的数据、更大的模型以及更长的上下文窗口能够带来更高效的人工智能。但是有个问题,更高的智能要求的推理负载极重,模型参数以及推理过程中产生的KV-Cache都需要很大的存储空间,特别是200万字节的长序列对卡的要求很高。这方面国内优秀的大模型应用Kimi就和清华大学MADSys实验室共同推出了 Mooncake 分离式推理架构,通过把需要共享的KV-Cache保存下来,采用以存换算的思路大幅度提升系统吞吐。

郑纬民院士表示,模型的推理过程是一个复杂的存储系统工程,关键是能够存的多、传的快、性价比高。清华大学 MADSys 实验室联合华为数据存储、9#AISoft、阿里云、面壁、趋境等几家公司共同开发高性能内存型长记忆存储系统,即将开源发布。能够大范围全局共享与持久化KV-Cache,实现以存换算。共建大模型时代下的高性能内存型长记忆存储系统生态,充分发挥存储在大模型下的作用。

最后,郑纬民院士总结道,AI存储是人工智能大模型的关键基座,存储系统存在于大模型生命周期的每一环,是大模型的关键基座,通过以存强算、以存换算,先进的AI存储能够提升训练集群可用度,降低推理成本,提升用户体验。

来源:环球网

声明:此公号(ID:cnzifi)发布内容和图片的目的在于传播更多信息,版权归原作者所有,不为商业用途,如有侵犯,敬请作者与我们联系。

2024中关村“番钛客”金融科技国际创新大赛火热报名中!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
3 大生肖迎暴富!1 月 11 日起横财扎堆,一路富到春节

3 大生肖迎暴富!1 月 11 日起横财扎堆,一路富到春节

人閒情事
2026-01-10 16:12:38
罗晋携任素汐去祈福后,唐嫣连发三文表态,婚变传闻终于真相大白

罗晋携任素汐去祈福后,唐嫣连发三文表态,婚变传闻终于真相大白

瓜汁橘长Dr
2025-12-29 11:29:56
五十六岁的钟丽缇更加油腻了,从机场出来,150斤的体重惊呆众人

五十六岁的钟丽缇更加油腻了,从机场出来,150斤的体重惊呆众人

可乐谈情感
2026-01-08 06:28:33
国民党新主席提“一国两区”,大陆回应欢迎来访,两岸关系有新变化?

国民党新主席提“一国两区”,大陆回应欢迎来访,两岸关系有新变化?

林子说事
2026-01-09 08:43:58
1972年陈毅追悼会,江青故意无视宋庆龄,毛主席当场下一死命令,事后宋庆龄感慨:主席真聪明

1972年陈毅追悼会,江青故意无视宋庆龄,毛主席当场下一死命令,事后宋庆龄感慨:主席真聪明

寄史言志
2025-12-17 16:08:14
邀约偷铁皮遭拒绝,云南一61岁老妇杀害13岁男孩,一审获死刑

邀约偷铁皮遭拒绝,云南一61岁老妇杀害13岁男孩,一审获死刑

红星新闻
2026-01-09 18:09:30
周末突发!邢宏伟被查

周末突发!邢宏伟被查

中国基金报
2026-01-10 11:09:17
褚时健女儿褚映群自杀于洛阳的真实详情

褚时健女儿褚映群自杀于洛阳的真实详情

吕醿极限手工
2026-01-09 19:43:45
瑾汐回温州看望父母,一张图片让大家觉得伤感,二哈最重姐妹情谊

瑾汐回温州看望父母,一张图片让大家觉得伤感,二哈最重姐妹情谊

阿雹娱乐
2026-01-10 14:25:54
专家脸被打肿!2025年油车销量逆势暴涨,车主:终于明白了!

专家脸被打肿!2025年油车销量逆势暴涨,车主:终于明白了!

老特有话说
2026-01-07 00:30:03
大哥风范,尼日利亚队长恩迪迪表示若足协不发钱将自掏腰包给队友奖金

大哥风范,尼日利亚队长恩迪迪表示若足协不发钱将自掏腰包给队友奖金

懂球帝
2026-01-09 21:55:37
秦海璐春晚彩排被偶遇,穿大衣戴墨镜气场全开,网友:被帅一脸!

秦海璐春晚彩排被偶遇,穿大衣戴墨镜气场全开,网友:被帅一脸!

木子爱娱乐大号
2026-01-09 21:45:16
放弃美籍恢复中国籍,为办理税务需要,“中国刻蚀机之父”套现近1亿

放弃美籍恢复中国籍,为办理税务需要,“中国刻蚀机之父”套现近1亿

观察者网
2026-01-10 08:12:04
温铁军:中国被美国扒掉了两层皮,竟还有人妄想让中国做美的助手

温铁军:中国被美国扒掉了两层皮,竟还有人妄想让中国做美的助手

长星寄明月
2026-01-01 06:06:56
建国初,甚至有部分将帅手握几十万兵力,为何没一人敢拥兵自重?

建国初,甚至有部分将帅手握几十万兵力,为何没一人敢拥兵自重?

文史季季红
2026-01-10 16:30:03
WTT多哈冠军赛:1月10日赛程公布!国乒对决张本美和,两主力内战

WTT多哈冠军赛:1月10日赛程公布!国乒对决张本美和,两主力内战

郝小小看体育
2026-01-10 04:01:46
苹果立大功!美研究发现:其天然成分黄酮类,可使肝脏年轻4.69岁

苹果立大功!美研究发现:其天然成分黄酮类,可使肝脏年轻4.69岁

思思夜话
2026-01-09 10:53:04
深夜利空,8个龙头年报业绩暴雷,5股陷入亏损,千万别踩雷

深夜利空,8个龙头年报业绩暴雷,5股陷入亏损,千万别踩雷

风风顺
2026-01-10 00:57:49
肥肠再次成为关注对象!研究发现:常吃肥肠,身体会收获3大好处

肥肠再次成为关注对象!研究发现:常吃肥肠,身体会收获3大好处

全球军事记
2025-12-29 21:28:37
英国一只长寿小猫30岁了,跟它主人同岁,从不错过任何一顿饭!

英国一只长寿小猫30岁了,跟它主人同岁,从不错过任何一顿饭!

狸猫之一的动物圈
2026-01-06 10:55:08
2026-01-10 17:51:00
中关村互联网金融研究院
中关村互联网金融研究院
金融科技资讯、研究报告等信息
2097文章数 224关注度
往期回顾 全部

科技要闻

传DeepSeek准备第二次震惊全世界

头条要闻

男生遭老师按地上强制要求剪头发 被老师勒脖子骑身上

头条要闻

男生遭老师按地上强制要求剪头发 被老师勒脖子骑身上

体育要闻

怒摔水瓶!杜兰特30+12 难阻火箭遭双杀

娱乐要闻

吴速玲曝儿子Joe是恋爱脑

财经要闻

这不算诈骗吗?水滴保诱导扣款惹众怒

汽车要闻

宝马25年全球销量246.3万台 中国仍是第一大市场

态度原创

旅游
家居
游戏
手机
房产

旅游要闻

人均2万多元的高端团被指名不副实,出行前3天行程突然变更,专属项目取消

家居要闻

木色留白 演绎现代自由

《神界》新作设计将对“读档重来”功能持开放态度

手机要闻

破3000万台!三星Galaxy S25系列手机打破安卓魔咒

房产要闻

66万方!4755套!三亚巨量房源正疯狂砸出!

无障碍浏览 进入关怀版