网易首页 > 网易号 > 正文 申请入驻

分布匹配蒸馏:扩散模型的单步生成优化方法研究

0
分享至


扩散模型在生成高质量图像领域具有显著优势,但其迭代去噪过程导致计算开销较大。分布匹配蒸馏(Distribution Matching Distillation,DMD)通过将多步扩散过程精简为单步生成器来解决这一问题。该方法结合分布匹配损失函数和对抗生成网络损失,实现从噪声图像到真实图像的高效映射,为快速图像生成应用提供了新的技术路径。

分布匹配机制

与传统扩散模型不同,单步生成器并不直接学习完整的数据分布,而是通过强制对齐的方式逼近目标分布。这种方法摒弃了逐步近似的过程,直接建立噪声样本到目标分布的映射关系。

在此过程中,蒸馏机制起到关键作用。预训练模型作为教师网络,提供目标分布的高精度中间表征。

DMD 技术实现流程

阶段 0:系统初始化

  1. 单步生成器基于预训练扩散 unet 进行初始化,时间步设定为T-1
  2. real_unet作为固定权重的教师网络,表征真实数据分布
  3. fake_unet用于对生成器的数据分布进行建模

阶段 1:噪声到图像的生成

生成器接收随机噪声图作为输入,通过单步去噪操作生成图像x,此时生成的图像x符合生成器的概率密度分布p_fake

阶段 2:高斯噪声注入

对生成图像x施加高斯噪声,获得噪声图像xt,在0.2T到0.98T范围内均匀采样时间步t(避开极端噪声状态),噪声注入操作促进p_fake与p_real分布的重叠,为后续分布比较创造条件

阶段 3:双重网络处理

  1. real_unet生成pred_real_image,作为清晰图像的参考近似
  2. fake_unet生成pred_fake_image,反映当前时间步的生成器分布特征

通过对比pred_real_image和pred_fake_image量化真实分布与生成分布的差异

阶段 4:损失计算

计算 x 与 x — grad 之间的均方误差(MSE)作为损失度量。其中 x — grad 表示经过梯度校正的输出,用于减小与真实数据分布的偏差。

阶段 5:假分布更新机制

fake_unet 通过 x 和 pred_fake_image 之间的扩散损失进行参数更新。这一过程使 fake unet 能够追踪生成器分布的动态变化。与传统 unet 使用 xt-1_pred 和 xt-1_gt 计算损失不同,这里采用 xt-1_pred 和 x 之间的损失,使 fake UNet 能够将生成器输出的噪声版本(xt)还原为当前生成器输出 x。

核心问题解析

问题 1:为何 fake_unet 采用 xt-1_pred 和 x0 之间的散度作为损失度量,而非采用 xt-1_pred 和 xt-1_gt 的比较?

选择 xt-1_pred 和 x 之间的散度是基于 fake_unet 的核心功能考虑。其目标是将生成器输出的噪声版本(xt)映射回生成器的当前输出(x)。这种设计确保了 fake_unet 能够准确捕获生成器的动态分布特征,从而提供有效的梯度信息来优化生成器输出。

问题 2:fake_unet的必要性何在?是否可以直接利用预训练的real_unet输出与生成器输出计算 KL 散度?

生成器的设计目标是实现单步完全去噪,而预训练的real_unet在相同时间步内仅能实现部分去噪。这种本质差异导致real_unet输出无法提供有效的 KL 散度用于生成器训练。相比之下,fake_unet通过持续学习生成器的动态分布,能够准确approximation当前生成器输出的特征。通过比较real_unet和fake_unet的输出,可以获得用于优化生成器概率分布的有效梯度方向,从而提升单步图像合成的质量。# 分布匹配损失机制

训练过程中,通过 KL 散度定量评估生成器分布与真实分布之间的差异。

其中 Preal 代表真实数据的概率密度函数,Pfake 表示生成器 Gθ 产生的假分布概率密度函数。

对于高维数据集,直接计算概率密度在计算复杂度上存在显著挑战。例如,对于 32×32 像素的灰度图像,其维度空间为 256¹⁰²⁴,直接计算在实际应用中不可行。

因此,采用分数函数对真实分布和生成分布进行特征表征。

这种方法使得 KL 散度的计算成为可能:Sreal 引导 x 向 Preal 的模态靠近,而 −Sfake 则促使其远离真实分布。

其中 Sreal(x) 为真实数据分布的分数函数,Sfake(x) 为生成数据分布的分数函数,∇θ Gθ(z) 表示生成器输出 x 对参数的梯度。

Sreal(x)−Sfake(x) 表征了真实分数与生成分数的差异。对于生成样本 x,由于其 Sreal 接近零,需要引入扰动以支持扩散模型从 xt 进行去噪。

Sfake 和 Sreal 的定义参考自论文 "Song et al. — Score-based generative modeling through stochastic differential equations"

最终损失函数

技术原理剖析

在时间步 t−1,利用real_unetfake_unet的输出构建梯度,引导生成器的当前输出 x 向real_unet在 t=0 时刻的输出收敛。随后计算生成器原始输出与梯度校正后输出的均方误差(MSE)。这一校正机制确保 x 能够逐步对齐真实数据分布。

损失函数的代码实现

该图展示了不同时间步的损失函数变化,详细说明了多步生成器对单步生成器的训练过程。注意:图中未详细展示weighting_factor相关细节,并对底层分布作出了特定假设。

核心思想在于利用 xfake 和 xreal 之间的差异产生的梯度,将生成器输出引导至real_unet在 t=0 时刻的目标输出。随着训练进行,生成器输出逐步向真实分布靠近,同时带动fake_unet输出的优化。最终,校正后的图像 ∥x−grad∥ 收敛至真实分布。

总结

本文深入探讨了分布匹配蒸馏(DMD)的技术原理和实现机制,着重阐述了其在图像生成领域的应用价值。欢迎学术界同仁就相关技术细节提供建议和讨论,以促进该领域的持续发展。

https://avoid.overfit.cn/post/c8b74a7d05944be5908b583559294a24

作者:Om Rastogi

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美伊新一轮谈判在即 以总理:伊朗必须拆除核设施

美伊新一轮谈判在即 以总理:伊朗必须拆除核设施

财联社
2026-02-16 03:24:20
湖北单亲妈妈嫁65岁美国老头,带儿子移民美国,婚后14年老头去世

湖北单亲妈妈嫁65岁美国老头,带儿子移民美国,婚后14年老头去世

哄动一时啊
2026-02-09 16:56:31
癌的“源头”已发现?咸菜没上榜,第一名大家或许天天都在吃!

癌的“源头”已发现?咸菜没上榜,第一名大家或许天天都在吃!

健康之光
2026-02-11 14:15:20
高云翔现状:45岁发福不刮胡,定居天津有新家庭,今生活天差地别

高云翔现状:45岁发福不刮胡,定居天津有新家庭,今生活天差地别

查尔菲的笔记
2026-02-14 18:04:28
女子回乡建厂5年:当初捧着邀请我来,如今被强拆4000万说没就没

女子回乡建厂5年:当初捧着邀请我来,如今被强拆4000万说没就没

今朝牛马
2026-01-16 18:14:40
没老婆跟着就这状态?汪小菲年会黑脸不配合,兰姐数次破冰全失败

没老婆跟着就这状态?汪小菲年会黑脸不配合,兰姐数次破冰全失败

陈意小可爱
2026-02-14 22:00:09
中央戏剧学院表演系主任王鑫的权多大?震碎三观

中央戏剧学院表演系主任王鑫的权多大?震碎三观

雪中风车
2026-02-15 10:46:55
潮汕婚礼丈母娘火了,打扮娇艳比新娘还抢镜,网友:感觉有点不对

潮汕婚礼丈母娘火了,打扮娇艳比新娘还抢镜,网友:感觉有点不对

梅子的小情绪
2026-02-08 19:59:04
重磅!官方宣布:禁止房子大降价,“限跌令”重出江湖!

重磅!官方宣布:禁止房子大降价,“限跌令”重出江湖!

常州壹楼市
2026-01-17 23:59:54
中国队再降1名+列冬奥奖牌榜第19位 韩媒嘲讽:没主场优势立马下滑

中国队再降1名+列冬奥奖牌榜第19位 韩媒嘲讽:没主场优势立马下滑

风过乡
2026-02-16 07:51:46
垃圾分类突然不提了?真相反转,实际上中国垃圾已成“摇钱树”

垃圾分类突然不提了?真相反转,实际上中国垃圾已成“摇钱树”

深度报
2026-02-14 21:25:25
2026年是红马年,5个生肖要穿红,具体指哪5人要穿红?

2026年是红马年,5个生肖要穿红,具体指哪5人要穿红?

读书文史
2026-02-15 16:50:17
世预赛大名单提前曝光,广东三将无人入选,上海北京成最大赢家

世预赛大名单提前曝光,广东三将无人入选,上海北京成最大赢家

宏远小师哥
2026-02-15 12:37:12
中国平陆运河完成89%,预计2026开通,俄罗斯迫不及待,越南焦虑

中国平陆运河完成89%,预计2026开通,俄罗斯迫不及待,越南焦虑

娱乐圈见解说
2026-02-15 19:40:54
腊月二十八,河北农村禁炮实录

腊月二十八,河北农村禁炮实录

据说说娱乐
2026-02-15 23:27:12
志在3分!巴萨马年首战:客战吉罗纳 捍卫榜首不容有失

志在3分!巴萨马年首战:客战吉罗纳 捍卫榜首不容有失

爱奇艺体育
2026-02-16 08:53:05
离过年仅3天!29岁关晓彤高调官宣喜讯,全网恭喜,鹿晗后悔吗?

离过年仅3天!29岁关晓彤高调官宣喜讯,全网恭喜,鹿晗后悔吗?

喜欢历史的阿繁
2026-02-14 22:12:26
泰王怒斥 “受够了” 定调,自豪泰 193 席拉拢为泰 74 席,封堵改革派 118 席

泰王怒斥 “受够了” 定调,自豪泰 193 席拉拢为泰 74 席,封堵改革派 118 席

流年拾光
2026-02-15 12:32:17
体操冠军傅佳丽跳楼后续:曾被勒索4万礼金,逢年过节都要送礼

体操冠军傅佳丽跳楼后续:曾被勒索4万礼金,逢年过节都要送礼

复转小能手
2026-02-13 20:23:52
王毅在慕安会警告日本,现场爆发激烈掌声,一个原因引发欧洲共鸣

王毅在慕安会警告日本,现场爆发激烈掌声,一个原因引发欧洲共鸣

现代小青青慕慕
2026-02-15 18:47:19
2026-02-16 09:08:49
deephub incentive-icons
deephub
CV NLP和数据挖掘知识
1922文章数 1448关注度
往期回顾 全部

科技要闻

OpenAI拿下OpenClaw,承诺开源绝不动摇

头条要闻

王菲将六登春晚 还未开唱歌曲已经火了

头条要闻

王菲将六登春晚 还未开唱歌曲已经火了

体育要闻

NBA三分大赛:利拉德带伤第三次夺冠

娱乐要闻

2026央视春晚最新剧透 重量级嘉宾登场

财经要闻

2025,中国商业十大意外,黄金只排第九

汽车要闻

奔驰中国换帅:段建军离任,李德思接棒

态度原创

家居
艺术
亲子
时尚
军事航空

家居要闻

中古雅韵 乐韵伴日常

艺术要闻

入选作品选刊 | 2026年“新生活·新风尚·新年画”美术作品展

亲子要闻

“压岁钱”应该什么时候给?

多巴胺失宠了?过年这样穿彩色时髦又减龄

军事要闻

特朗普:在俄乌冲突问题上 泽连斯基必须行动起来

无障碍浏览 进入关怀版