网易首页 > 网易号 > 正文 申请入驻

DeepSpeed v0.18.0 更新详解:DeepCompile、SuperOffload 与 ZeRO 优化全面升级

0
分享至


DeepSpeed 发布了 v0.18.0 版本,本次更新在分布式训练性能优化、内存管理、日志系统、模型检查点等方面进行了大量改进和修复,重点增强了DeepCompileSuperOffload以及ZeRO 优化器的功能。以下为本次版本的详细更新内容:

1. DeepCompile 功能优化与修复

本次更新中,DeepCompile 进行了多项改进,提升了在大型模型与复杂计算图中的表现:

  • ZeRO-3 优化:增强了 allgather 操作在不均匀分片情况下的鲁棒性,并修复了性能分析问题。

  • VLA 类模型支持优化:修复了应用 DeepCompile 到 VLA-like 模型时的错误。

  • 激活释放大小可配置:用户可根据需求配置释放激活的大小,提高显存利用率。

  • 张量别名指定:在 C++ 算子 schema 中明确张量别名关系,减少内存冲突。

  • allgather 与 downcast 融合:提升通信效率与类型转换性能。

  • 启用状态检测:当 DeepCompile 已启用但未激活时,系统可以正确处理此状态。

  • IPG bucket 清理修复:避免因 bucket 清理不当导致的训练过程异常。

  • 最小切割重物化分区策略:在联合计算图分区时采用 min_cut_rematerialization 策略,提高计算与显存的平衡性。

  • 测试增强:在测试失败时显示不匹配的数值,便于定位问题。

2. SuperOffload 模块发布与优化

SuperOffload 在本次版本正式发布,主要应用于大模型训练的显存与存储优化:

  • 功能发布:支持将部分张量及中间结果离线到 NVMe 等存储设备,提高大模型训练的可扩展性。

  • 初始化支持:superoffload 文件夹增加初始化文件,保证模块加载正常。

  • 博客文档更新:增加了 SuperOffload 的技术文档与中文版本,帮助开发者快速上手。

  • NVMe offload 检查点写入优化:修复了在 NVMe offload 张量合并过程中可能发生的保存竞争问题。

3. ZeRO 优化器相关更新

ZeRO 是 DeepSpeed 中用于高效分布式训练的核心技术,本次更新中涉及多个优化:

  • fp16 溢出广播:在 ZeRO-1 中支持 fp16 溢出状态的同步。

  • checkpoint 加载路径优化:当 stage=0 时禁用 ZeRO 检查点加载路径,避免冗余操作。

  • 多子组通用检查点修复:解决了 stage3 多子组情况下加载通用检查点的问题。

  • 跨机器通用检查点加载修复:修复了在多机环境下加载通用检查点的错误。

  • world size 扩展支持:修复了 stage3 在 world size 扩展情况下无法加载通用检查点的错误。

  • ZeRO-0 与自动混合精度集成:在 ZeRO-0 下支持与 torch.autocast 联合使用梯度缩放器。

4. 其他功能与工具更新

除了核心模块外,本次更新还对日志、工具方法、文档等进行了完善:

  • 日志系统优化:在设置日志级别时,同时调整各 logger handler 的级别,确保输出一致性。

  • 设备命名优化:将current_device()更改为current_device_name(),提升可读性。

  • Leaf 模块接口改进

    • • 支持通过配置启用

    • • 放宽匹配条件

    • • 补充文档说明

    • • 简化 hook 实现

  • wall_clock_breakdown 改进:启用后始终记录统计数据,便于性能分析。

  • print_dist 工具:新增分布式打印工具方法,便于调试分布式信息。

  • TiledMLP moe 支持:在 TiledMLP 中增加 mixture-of-experts 支持。

  • 文档更新:进一步明确了 Leaf 模块相关配置说明。

  • 环境支持优化:在.gitignore中加入 venv 文件夹,方便虚拟环境管理。

  • 邮箱地址更新:更新了系统中的邮件地址信息。

总结
DeepSpeed v0.18.0 的更新着重优化了 DeepCompile 与 SuperOffload 两大核心模块,同时在 ZeRO 优化器的稳定性与功能扩展方面也带来了显著提升。新增的工具和文档更新进一步降低了分布式训练的使用门槛,为开发者在超大规模模型训练中的性能、稳定性和可扩展性提供了更强的支持。

我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
广东3消息!朱芳雨正式上诉,徐杰脚踝伤势加重,奎因官方喜讯

广东3消息!朱芳雨正式上诉,徐杰脚踝伤势加重,奎因官方喜讯

多特体育说
2026-01-06 22:43:17
弗莱彻:还没看前队友在群里的聊天,我可能会暂时远离那个群

弗莱彻:还没看前队友在群里的聊天,我可能会暂时远离那个群

懂球帝
2026-01-07 16:25:15
朝鲜谁都不服,却主动将三位中国人写进教科书,还为其树立了铜像

朝鲜谁都不服,却主动将三位中国人写进教科书,还为其树立了铜像

云霄纪史观
2025-12-27 15:49:05
深圳技术大学迎来新任校长!

深圳技术大学迎来新任校长!

南方都市报
2026-01-07 12:15:07
在初创公司上班是一种什么体验?网友:三个月老板成了我的下属

在初创公司上班是一种什么体验?网友:三个月老板成了我的下属

夜深爱杂谈
2025-11-21 20:35:17
佘诗曼陈自瑶同框才知:会打扮和不会打扮的女人差距真的太大了

佘诗曼陈自瑶同框才知:会打扮和不会打扮的女人差距真的太大了

孤酒老巷QA
2026-01-07 13:59:37
韩国大胆提议:建设首尔至北京高铁,但有一个条件,中方须先答应

韩国大胆提议:建设首尔至北京高铁,但有一个条件,中方须先答应

科学发掘
2026-01-06 10:23:28
在寿宴上,舅舅当众羞辱我爸,我却笑着拨通他单位领导的电话

在寿宴上,舅舅当众羞辱我爸,我却笑着拨通他单位领导的电话

红豆讲堂
2026-01-04 11:22:27
甄嬛垂暮之年细思极恐,原来她信任的盟友端妃,竟是一个漫长圈套

甄嬛垂暮之年细思极恐,原来她信任的盟友端妃,竟是一个漫长圈套

卡西莫多的故事
2026-01-06 11:05:29
你见过最牛的临场反应是啥?网友:这个好感动啊,这么好的同学

你见过最牛的临场反应是啥?网友:这个好感动啊,这么好的同学

带你感受人间冷暖
2026-01-01 00:10:10
官媒定调,楼市逻辑已经彻底变了

官媒定调,楼市逻辑已经彻底变了

大川东山再起
2026-01-07 15:58:41
几乎全是假货!利润高达2400%,咋消费者还前赴后继争相购买?

几乎全是假货!利润高达2400%,咋消费者还前赴后继争相购买?

奇思妙想草叶君
2026-01-05 23:13:15
中国股市炒股其实很简单:如果本金有20W,建议死啃520均线战法!

中国股市炒股其实很简单:如果本金有20W,建议死啃520均线战法!

股经纵横谈
2026-01-07 11:45:59
乌军短促突击新战术,无人机炸弹很凶残,俄第136摩步旅旅长死亡

乌军短促突击新战术,无人机炸弹很凶残,俄第136摩步旅旅长死亡

鹰眼Defence
2026-01-06 16:36:02
08年章含之逝世,临终前留下遗言,洪晃因何说:妈妈是个聪明人?

08年章含之逝世,临终前留下遗言,洪晃因何说:妈妈是个聪明人?

雍亲王府
2026-01-07 08:20:03
大布让父母亲向妻子道歉,贝嫂含蓄回应:我们没有什么好抱歉的

大布让父母亲向妻子道歉,贝嫂含蓄回应:我们没有什么好抱歉的

小书生吃瓜
2026-01-03 16:58:09
笑岔气了!果然断句是中国人一生的宿敌,只能说中国文化博大精深

笑岔气了!果然断句是中国人一生的宿敌,只能说中国文化博大精深

夜深爱杂谈
2025-12-19 16:39:58
谁教会了毛泽东打仗?毛泽东认为有3个“老师”,第一个是蒋介石

谁教会了毛泽东打仗?毛泽东认为有3个“老师”,第一个是蒋介石

浩舞默画
2026-01-07 09:47:10
陕西一老汉,把西凤酒灌入茅台瓶,拿去鉴定没想到被行家说是真品

陕西一老汉,把西凤酒灌入茅台瓶,拿去鉴定没想到被行家说是真品

涛哥美食汇
2026-01-06 09:01:22
55岁宣萱罕见露面,嘴巴实在是太大了,笑起来和大猩猩似的

55岁宣萱罕见露面,嘴巴实在是太大了,笑起来和大猩猩似的

阿废冷眼观察所
2026-01-07 02:17:42
2026-01-07 16:40:49
moonfdd incentive-icons
moonfdd
福大大架构师每日一题
1092文章数 53关注度
往期回顾 全部

科技要闻

豪掷世界第一"球" 杨元庆亮出联想AI护城河

头条要闻

中方被问是否计划采取行动帮助马杜罗夫妇 外交部回应

头条要闻

中方被问是否计划采取行动帮助马杜罗夫妇 外交部回应

体育要闻

卖水果、搬砖的小伙,与哈兰德争英超金靴

娱乐要闻

2026年央视春晚彩排:沈腾确定回归

财经要闻

农大教授科普:无需过度担忧蔬菜农残

汽车要闻

蔚来2025百万台收官 一场迟到的自我修复

态度原创

房产
本地
健康
家居
数码

房产要闻

海珠双冠王!中交天翠以强兑现力+生活温度,筑就长期主义产品

本地新闻

云游内蒙|在黄河转身处,遇见不一样的鄂尔多斯

这些新疗法,让化疗不再那么痛苦

家居要闻

宁静不单调 恰到好处的美

数码要闻

先于标准获批,华硕计划2026年内发布首批Wi-Fi 8家用路由器

无障碍浏览 进入关怀版