网易首页 > 网易号 > 正文 申请入驻

DeepSpeed v0.18.1 发布:新增 DataStates 异步检查点引擎,优化 Zero 优化器与存储共享机制

0
分享至


版本发布时间

2025年10月23日

主要更新内容

DeepSpeed v0.18.1 在性能优化、功能扩展与稳定性方面进行了多项改进,尤其在优化器灵活性、学习率控制、检查点引擎以及 HF Accelerate 集成等方面有显著提升。

核心更新一:新增 DataStates-LLM 异步检查点引擎

  • • 引入DataStatesCheckpointEngine,支持异步检查点保存与加载。

  • • 可通过ds_config.json启用:
    .

{     ... 其它配置,     "datastates_ckpt": {         "host_cache_size": 16     } }
  • • 当启用 DataStates 引擎后,可在保存模型、优化器和 MoE 层检查点时根据preserves_storage_sharing()判断是否克隆张量,有效减少内存占用。

  • • 如果未安装datastates-llm库,会自动回退至TorchCheckpointEngine

核心更新二:Zero 优化器增强
  • DeepSpeedZeroOptimizer子类初始化方法支持**kwargs,提升了参数传递的灵活性。

  • • 移除了在 embedding 和 lm_head 层使用 Muon 优化器的设置。

  • • Stage 3 SuperOffload 优化器初始化参数简化,通过**kwargs统一传递,支持cpuadam_cores_perc配置。

核心更新三:学习率支持张量类型
  • update_lr方法支持标量与Tensor 类型学习率,可根据现有param_group['lr']类型自动匹配。

  • • 当当前学习率为Tensor时,会保持原有的张量设备与类型。

核心更新四:存储共享机制优化
  • • 新增preserves_storage_sharing()接口,用于判断检查点引擎是否需要克隆张量,以支持存储共享。

  • • 在 MoE 层、优化器状态以及模型保存流程中根据该机制动态调整张量处理方式,避免无谓的内存复制。

核心更新五:ZenFlow Stage 3 支持
  • • 增加了ZenFlowSelectiveAdamW_stage3,并在 Zero 优化器中集成 ZenFlow Stage 3 功能。

  • • 对优化器初始化流程进行了调整,以便更好地集成 ZenFlow 特性。

核心更新六:Ulysses HF Accelerate 集成
  • • 改进了register_with_transformers方法:

    • • 支持直接传入已加载的 HF 模型对象。

    • • 增加对flash_attention_2flash_attention_3以及sdpa作为注意力实现的支持。

  • • 在数据加载器中增加形状验证,确保张量的seqleninput_ids一致,否则抛出异常,提升数据一致性保障。

核心更新七:内存安全与CI修复
  • • 修复multi_tensor_applysize超过INT_MAX时出现的非法内存访问问题(int改为int64_t)。

  • • 恢复 XPUxpu-max1100CI 流程,移除部分冗余测试以提升运行效率。

主要文件改动
  • deepspeed/datastates/新增 DataStates 配置与引擎实现文件。

  • deepspeed/runtime/checkpoint_engine/新增datastates_checkpoint_engine.py,并在utils.py中集成引擎选择逻辑。

  • deepspeed/runtime/engine.pydeepspeed/runtime/pipe/module.pydeepspeed/runtime/config.py等文件统一集成preserves_storage_sharing()判断逻辑。

  • deepspeed/runtime/lr_schedules.py新增 Tensor 学习率支持。

  • deepspeed/ops/adam/zenflow_torch_adam.py增加 Stage 3 相关优化器类。

  • deepspeed/runtime/superoffload/superoffload_stage3.py优化初始化参数处理。

总结

代码地址:github.com/deepspeedai/DeepSpeed

DeepSpeed v0.18.1 在分布式训练的可扩展性与灵活性方面再次升级,尤其是异步检查点引擎 DataStates的引入,为大模型的高效训练与部署提供了强有力的支持。与此同时,针对优化器、学习率控制以及 HF 模型集成的改进,也使该框架更易于与最新的大模型技术栈适配。

我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
战机坠海后,美航母冲向黄岩岛,中国要拔4根钉子,战区高度戒备

战机坠海后,美航母冲向黄岩岛,中国要拔4根钉子,战区高度戒备

知鉴明史
2025-11-04 19:53:39
立冬转旺运! 3生肖迎来丰收喜气

立冬转旺运! 3生肖迎来丰收喜气

白龙王
2025-11-05 15:52:18
成开拓者教练组成员?翻译亲承只是捡球的 杨瀚森英语进步飞速

成开拓者教练组成员?翻译亲承只是捡球的 杨瀚森英语进步飞速

大嘴爵爷侃球
2025-11-05 20:27:35
以卵击石!沈伯洋集结数百台独举牌,挑衅大陆底线,中央重拳出击

以卵击石!沈伯洋集结数百台独举牌,挑衅大陆底线,中央重拳出击

老谢谈史
2025-11-04 19:09:27
且看2025年西安就业到底有多难?惊呆国人,难道只能躺平吗?

且看2025年西安就业到底有多难?惊呆国人,难道只能躺平吗?

慧翔百科
2025-11-05 11:41:40
长征前后的周恩来,完全是两个人

长征前后的周恩来,完全是两个人

壹贰叁的壹
2024-01-09 09:02:19
突发!美国一机场发生飞机坠毁事故,多人受伤!事发飞机上有28万加仑燃油,警方已发布紧急避难指令

突发!美国一机场发生飞机坠毁事故,多人受伤!事发飞机上有28万加仑燃油,警方已发布紧急避难指令

每日经济新闻
2025-11-05 08:18:06
3-1,25岁曼城旧将阿尔瓦雷斯无敌凌空斩,马竞拒绝欧冠2连败

3-1,25岁曼城旧将阿尔瓦雷斯无敌凌空斩,马竞拒绝欧冠2连败

侧身凌空斩
2025-11-05 05:59:35
43万吨美豆运往中国,一个微妙变化突然出现,中俄贸易额开始下降

43万吨美豆运往中国,一个微妙变化突然出现,中俄贸易额开始下降

花花娱界
2025-11-05 19:32:45
女人早晨上班去买包子,刚吃第一口立马报警:这包子有问题

女人早晨上班去买包子,刚吃第一口立马报警:这包子有问题

悬案解密档案
2025-10-28 16:05:26
一票否决!叙利亚朱拉尼要认清,中方这关不过,俄罗斯力挺也没用

一票否决!叙利亚朱拉尼要认清,中方这关不过,俄罗斯力挺也没用

议纪史
2025-11-04 19:20:03
阿斯:法蒂最近状态有所下滑,摩纳哥更换主帅可能是原因之一

阿斯:法蒂最近状态有所下滑,摩纳哥更换主帅可能是原因之一

懂球帝
2025-11-05 18:34:45
“会打扮”和“不会打扮”的女人:差别有多大?看这些对比就知道

“会打扮”和“不会打扮”的女人:差别有多大?看这些对比就知道

白宸侃片
2025-11-01 11:04:21
武汉一网红桥被封闭,曾因酷似奥特曼变身器引市民打卡

武汉一网红桥被封闭,曾因酷似奥特曼变身器引市民打卡

大风新闻
2025-11-05 13:46:14
对台制裁正式开始?中国商务部出手,外媒:台积电在美难以成功

对台制裁正式开始?中国商务部出手,外媒:台积电在美难以成功

军机Talk
2025-11-05 11:35:10
阿斯利康在青岛追加1.36亿美元投资

阿斯利康在青岛追加1.36亿美元投资

界面新闻
2025-11-05 19:01:40
一代巨匠谢幕,杨振宁遗产分配曝光,翁帆所得远超常人所想!

一代巨匠谢幕,杨振宁遗产分配曝光,翁帆所得远超常人所想!

云深不知在何处
2025-10-28 15:13:13
广东队跳水第三金!王伟莹稳健发挥再夺冠,赛后透露全红婵状态

广东队跳水第三金!王伟莹稳健发挥再夺冠,赛后透露全红婵状态

阿纂看事
2025-11-04 22:53:40
28岁演员“曾舜晞高层新家曝光”:青玉当桌面,岛台也是玉

28岁演员“曾舜晞高层新家曝光”:青玉当桌面,岛台也是玉

乡野小珥
2025-11-04 13:05:48
就差一点达到20000分15000板!霍华德还真不死心啊!

就差一点达到20000分15000板!霍华德还真不死心啊!

篮球大图
2025-11-04 23:26:41
2025-11-05 21:04:49
moonfdd incentive-icons
moonfdd
福大大架构师每日一题
1023文章数 49关注度
往期回顾 全部

科技要闻

大转弯!特朗普再提名马斯克盟友任NASA局长

头条要闻

神二十推迟返回 专家:厘米级空间碎片可致航天器损坏

头条要闻

神二十推迟返回 专家:厘米级空间碎片可致航天器损坏

体育要闻

赢下皇马,会是利物浦的转折点吗?

娱乐要闻

港星林尚武突发心脏病去世

财经要闻

事关加快建设金融强国 中央金融办发声

汽车要闻

智己LS9入局"9系"混战 全尺寸SUV市场迎来新变量

态度原创

本地
家居
时尚
公开课
军事航空

本地新闻

这届干饭人,已经把博物馆吃成了食堂

家居要闻

别样府院 畅享诗意生活

坏了,看到剧本杀鼻祖了!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国“福特”号航母驶往加勒比海

无障碍浏览 进入关怀版