网易首页 > 网易号 > 正文 申请入驻

DeepSpeed v0.18.1 发布:新增 DataStates 异步检查点引擎,优化 Zero 优化器与存储共享机制

0
分享至


版本发布时间

2025年10月23日

主要更新内容

DeepSpeed v0.18.1 在性能优化、功能扩展与稳定性方面进行了多项改进,尤其在优化器灵活性、学习率控制、检查点引擎以及 HF Accelerate 集成等方面有显著提升。

核心更新一:新增 DataStates-LLM 异步检查点引擎

  • • 引入DataStatesCheckpointEngine,支持异步检查点保存与加载。

  • • 可通过ds_config.json启用:
    .

{     ... 其它配置,     "datastates_ckpt": {         "host_cache_size": 16     } }
  • • 当启用 DataStates 引擎后,可在保存模型、优化器和 MoE 层检查点时根据preserves_storage_sharing()判断是否克隆张量,有效减少内存占用。

  • • 如果未安装datastates-llm库,会自动回退至TorchCheckpointEngine

核心更新二:Zero 优化器增强
  • DeepSpeedZeroOptimizer子类初始化方法支持**kwargs,提升了参数传递的灵活性。

  • • 移除了在 embedding 和 lm_head 层使用 Muon 优化器的设置。

  • • Stage 3 SuperOffload 优化器初始化参数简化,通过**kwargs统一传递,支持cpuadam_cores_perc配置。

核心更新三:学习率支持张量类型
  • update_lr方法支持标量与Tensor 类型学习率,可根据现有param_group['lr']类型自动匹配。

  • • 当当前学习率为Tensor时,会保持原有的张量设备与类型。

核心更新四:存储共享机制优化
  • • 新增preserves_storage_sharing()接口,用于判断检查点引擎是否需要克隆张量,以支持存储共享。

  • • 在 MoE 层、优化器状态以及模型保存流程中根据该机制动态调整张量处理方式,避免无谓的内存复制。

核心更新五:ZenFlow Stage 3 支持
  • • 增加了ZenFlowSelectiveAdamW_stage3,并在 Zero 优化器中集成 ZenFlow Stage 3 功能。

  • • 对优化器初始化流程进行了调整,以便更好地集成 ZenFlow 特性。

核心更新六:Ulysses HF Accelerate 集成
  • • 改进了register_with_transformers方法:

    • • 支持直接传入已加载的 HF 模型对象。

    • • 增加对flash_attention_2flash_attention_3以及sdpa作为注意力实现的支持。

  • • 在数据加载器中增加形状验证,确保张量的seqleninput_ids一致,否则抛出异常,提升数据一致性保障。

核心更新七:内存安全与CI修复
  • • 修复multi_tensor_applysize超过INT_MAX时出现的非法内存访问问题(int改为int64_t)。

  • • 恢复 XPUxpu-max1100CI 流程,移除部分冗余测试以提升运行效率。

主要文件改动
  • deepspeed/datastates/新增 DataStates 配置与引擎实现文件。

  • deepspeed/runtime/checkpoint_engine/新增datastates_checkpoint_engine.py,并在utils.py中集成引擎选择逻辑。

  • deepspeed/runtime/engine.pydeepspeed/runtime/pipe/module.pydeepspeed/runtime/config.py等文件统一集成preserves_storage_sharing()判断逻辑。

  • deepspeed/runtime/lr_schedules.py新增 Tensor 学习率支持。

  • deepspeed/ops/adam/zenflow_torch_adam.py增加 Stage 3 相关优化器类。

  • deepspeed/runtime/superoffload/superoffload_stage3.py优化初始化参数处理。

总结

代码地址:github.com/deepspeedai/DeepSpeed

DeepSpeed v0.18.1 在分布式训练的可扩展性与灵活性方面再次升级,尤其是异步检查点引擎 DataStates的引入,为大模型的高效训练与部署提供了强有力的支持。与此同时,针对优化器、学习率控制以及 HF 模型集成的改进,也使该框架更易于与最新的大模型技术栈适配。

我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
戴旭:中美一旦发生战争,美国有实力将中国沿海城市打得稀巴烂?

戴旭:中美一旦发生战争,美国有实力将中国沿海城市打得稀巴烂?

二大爷观世界
2026-01-16 03:04:40
俄罗斯在库页岛发现汉字石碑,我国专家赶到后,碑上内容让人尴尬

俄罗斯在库页岛发现汉字石碑,我国专家赶到后,碑上内容让人尴尬

疯狂的小历史
2026-01-16 11:35:56
谢贤前女友大曝恋爱私隐!三年不碰她,却每天给她做“四哥菜芯”

谢贤前女友大曝恋爱私隐!三年不碰她,却每天给她做“四哥菜芯”

阿纂看事
2026-01-09 10:19:00
-14℃!局部大雪!江苏将迎入冬最强雨雪冰冻天气

-14℃!局部大雪!江苏将迎入冬最强雨雪冰冻天气

扬子晚报
2026-01-16 20:12:54
克鲁尼举家“逃离美国”?川普一语戳破好莱坞左派的虚伪

克鲁尼举家“逃离美国”?川普一语戳破好莱坞左派的虚伪

斌闻天下
2026-01-14 07:15:03
俄国人预测外蒙古可能回归中国,甚至连远东一并归还!

俄国人预测外蒙古可能回归中国,甚至连远东一并归还!

南权先生
2026-01-14 16:43:43
张予曦在北京被偶遇,她的腿又长又细,身材高挑,穿花高跟鞋好美

张予曦在北京被偶遇,她的腿又长又细,身材高挑,穿花高跟鞋好美

徐帮阳
2025-12-21 21:19:31
昆明一小区新老物业交替发生冲突,多人受伤!业主:心理上造成很大恐慌;相关部门已介入处置

昆明一小区新老物业交替发生冲突,多人受伤!业主:心理上造成很大恐慌;相关部门已介入处置

大风新闻
2026-01-16 17:00:18
中俄贸易突然降温:五年来第一次下滑,发生了什么

中俄贸易突然降温:五年来第一次下滑,发生了什么

桂系007
2026-01-14 19:59:42
陪玩陪睡已过时!拳头塞嘴、集体开嫖、戚薇遭殃,阴暗面彻底曝光

陪玩陪睡已过时!拳头塞嘴、集体开嫖、戚薇遭殃,阴暗面彻底曝光

涵豆说娱
2025-11-20 16:35:46
官媒点名揭露阎维文处境,李双江判断获证实

官媒点名揭露阎维文处境,李双江判断获证实

一窥究竟
2026-01-16 01:03:04
利物浦转会动态:8600万镑天价交易获放行,斯洛特突改计划

利物浦转会动态:8600万镑天价交易获放行,斯洛特突改计划

夜白侃球
2026-01-16 21:08:10
老用户成“冤大头”?新号29元100G 老号89元不够用 3招破局不换号

老用户成“冤大头”?新号29元100G 老号89元不够用 3招破局不换号

Thurman在昆明
2026-01-03 15:59:21
环保女郎不见了,J·K·罗琳猛批西方左派的伪善

环保女郎不见了,J·K·罗琳猛批西方左派的伪善

移光幻影
2026-01-14 16:31:11
-7℃!湖北大部中到大雪,还有暴雪!武汉连下两天雪

-7℃!湖北大部中到大雪,还有暴雪!武汉连下两天雪

极目新闻
2026-01-16 19:44:10
深渊凝视:为什么从月球看地球,会让人感到一种彻骨的恐惧?

深渊凝视:为什么从月球看地球,会让人感到一种彻骨的恐惧?

观察宇宙
2026-01-14 17:34:31
金正哲联手张成泽发动朝鲜兵变,因一细节败露,双遭反杀!

金正哲联手张成泽发动朝鲜兵变,因一细节败露,双遭反杀!

阿胡
2024-02-02 14:55:28
深圳一公交广告惹争议,网友:为了孩子怎样都值

深圳一公交广告惹争议,网友:为了孩子怎样都值

映射生活的身影
2026-01-15 13:50:18
黎笋之子黎坚诚坦言:父亲选择同中国开战,是其毕生最大的失策

黎笋之子黎坚诚坦言:父亲选择同中国开战,是其毕生最大的失策

磊子讲史
2025-12-24 11:04:05
今天,送别贺娇龙!现场车辆绵延数公里,上海等地网友跨省送花悼念;母校发文,深切哀悼

今天,送别贺娇龙!现场车辆绵延数公里,上海等地网友跨省送花悼念;母校发文,深切哀悼

新民晚报
2026-01-16 16:09:42
2026-01-17 02:28:49
moonfdd incentive-icons
moonfdd
福大大架构师每日一题
1101文章数 53关注度
往期回顾 全部

科技要闻

贾国龙与罗永浩被禁言,微博CEO回应

头条要闻

罗永浩、贾国龙微博账号均被禁言

头条要闻

罗永浩、贾国龙微博账号均被禁言

体育要闻

全队身价=登贝莱,他们凭什么领跑法甲?

娱乐要闻

李湘翻车,早就有迹可循!

财经要闻

清流|酒店商家在携程和美团之间沦为炮灰

汽车要闻

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

教育
旅游
数码
手机
公开课

教育要闻

2026年研究生招生复试新规!来了!

旅游要闻

北境飘雪南园绽,青秀山用一场菊花展,藏住南宁冬日顶流密码!

数码要闻

熊猫MX34U7 34英寸带鱼屏显示器发布,售价1299元

手机要闻

真我Power再曝,6.78英寸曲面屏、万级大电池

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版