网易首页 > 网易号 > 正文 申请入驻

清华朱军组&NVIDIA提出DDO:扩散/自回归模型训练新范式

0
分享至

文章一作郑凯文为清华大学三年级博士生,研究方向为深度生成模型,曾提出流式扩散模型最大似然估计改进技术 i-DODE,扩散模型高效采样器 DPM-Solver-v3,扩散桥模型采样器 DBIM 以及掩码式离散扩散模型采样器 FHS 等。

清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化(DDO)。该方法将基于似然的生成模型(如扩散模型、自回归模型)隐式参数化为 GAN,从而设计出一种无需额外网络、训练高效的微调方法,并大幅突破传统最大似然训练的性能瓶颈。

  • 论文标题:Direct Discriminative Optimization: Your Likelihood-Based Visual Generative Model is Secretly a GAN Discriminator
  • 论文链接:https://arxiv.org/abs/2503.01103
  • 代码仓库:https://github.com/NVlabs/DDO

背景 | 基于似然的生成模型

近年来,扩散模型(Diffusion Models)和自回归模型(Autoregressive Models)在图像生成中占据主导地位,如 NVIDIA 的 EDM 系列扩散模型和字节跳动以 VAR 为代表的视觉自回归模型。相比 GAN(Generative Adversarial Networks)这类直接优化数据生成过程的隐式生成模型,扩散模型和自回归模型均属于基于似然的生成模型(Likelihood-Based Generative Model),它们显式估计数据的对数似然(log-likelihood),具有训练稳定、样本多样性强、容易规模化的特点

然而,这类模型广泛采用的最大似然估计(Maximum Likelihood Estimation, MLE)训练损失对应的是正向 KL 散度,会导致「mode covering」问题:模型倾向于覆盖所有数据模式而非聚焦主要分布,并且会在低估数据集中任何样本的似然时遭受严厉惩罚,从而使生成结果模糊或失真,在模型容量不足时限制了生成质量。例如,i-DODE 作为专注于似然的模型,虽然在密度估计任务上达到了最先进水平,但在 FID 等视觉质量指标下表现不佳。现有视觉生成模型也往往依赖引导(guidance)方法,如无需分类器的引导(Classifier-Free Guidance, CFG),来抑制低质量生成样本。

方法 | 把生成模型当判别器用,直接优化

为解决 MLE 的局限性,文章考虑使用GAN 式判别的思想,在训练目标中引入反向 KL 散度的成分,强化模型在真实数据附近的密度,同时抑制错误区域,将模型分布由图(a):强调密度覆盖,微调为图(b):强调密度集中,从而提高生成保真度与有限模型容量下的生成质量。然而,直接使用 GAN 损失会引入额外的判别器网络与工程优化上的复杂性,尤其对于扩散/自回归模型这类需要迭代式多步生成的模型。

DDO 首次提出:你训练的似然生成模型,其实已经是一个「隐式判别器」

具体来说,DDO 引入待微调的目标模型和一个冻结的参考模型(均初始化为预训练模型),使用两个模型的对数似然比构造「隐式判别器」,得到可直接应用于扩散模型和自回归模型的 GAN 式优化目标:

DDO 为扩散模型和自回归模型提供了即插即用的新训练目标,其微调后的模型和原模型具有完全相同的网络结构和采样方式,而在生成质量上大大增强

实验 | 无需引导,刷新多项 SOTA

DDO 在多个标准图像生成任务中显著提升已有模型的生成质量,并刷新现有 SOTA

  • ImageNet 512×512 无引导 FID 1.96 → 1.26。
  • ImageNet 64×64 无引导 FID 1.58 → 0.97。
  • CIFAR-10 无引导 FID 1.85 → 1.30。

ImageNet 512x512 生成结果。左:原模型 右:DDO 微调后的模型

肉眼观察发现生成图像的细节和真实度得到显著提升,同时多样性没有受到负面影响

DDO 用于扩散模型时,随着多轮 self-play,FID 指标发生持续下降

更重要的是,DDO无需修改网络结构、不增加推理成本,且与主流 CFG 等引导方法兼容,可叠加使用进一步提升性能。如在视觉自回归模型 VAR 上,微调后的模型通过控制 CFG 的强度,得到的FID-IS 曲线整体显著优于原模型

展望 | 从视觉生成到语言模型对齐

DDO 参数化的灵感来自于语言模型中的直接偏好优化(DPO, Direct Preference Optimization),但其目标从「成对的偏好对齐」扩展到了「分布对齐」,更为通用。DDO 虽然没有「奖励」的概念,但其中使用自生成样本作为负例的思想也与大语言模型中流行的 RL 算法如 GRPO 具有相似性,这允许模型从错误中反思学习。也就是说,GRPO 中负例的作用同样可以解释为使用 reverse KL 散度抑制 mode covering 趋势从而提升生成质量,这在数学推理等任务中具有重要意义。该思路有望扩展至多模态生成等任务,构建统一的对齐范式

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
豫能控股连收7个涨停板

豫能控股连收7个涨停板

证券时报
2026-02-27 10:03:07
美国驻华大使抵京上任,落地后第一句话,让中国不再对他抱有幻想

美国驻华大使抵京上任,落地后第一句话,让中国不再对他抱有幻想

吃货的分享
2026-02-27 17:33:19
这是著名脱口秀演员徐志胜,旁边是他女朋友

这是著名脱口秀演员徐志胜,旁边是他女朋友

小椰的奶奶
2026-02-26 17:55:36
女子遇诈骗怎么也学不会操作,骗子当场被整破防了……

女子遇诈骗怎么也学不会操作,骗子当场被整破防了……

环球网资讯
2026-02-27 17:31:20
50岁男子酷爱喝浓茶,茶叶能占半个杯子!连续5年确诊肾结石,痛到打滚如生孩子!医生提醒→

50岁男子酷爱喝浓茶,茶叶能占半个杯子!连续5年确诊肾结石,痛到打滚如生孩子!医生提醒→

大象新闻
2026-02-26 13:45:08
春节刚结束,蝴蝶兰就被遗弃了,花坛里到处是,捡回家慢慢养

春节刚结束,蝴蝶兰就被遗弃了,花坛里到处是,捡回家慢慢养

向阳生活家
2026-02-26 23:56:24
恭喜,38岁张继科正式上任,亮相浙江新岗位,刘诗雯祝福

恭喜,38岁张继科正式上任,亮相浙江新岗位,刘诗雯祝福

懂球社
2026-02-27 10:58:27
马筱梅产后首表态一句话显格局,小S怒骂,前夫里子面子都丢了

马筱梅产后首表态一句话显格局,小S怒骂,前夫里子面子都丢了

林雁飞
2026-02-27 17:31:22
又摔了一架!印空军一架光辉战斗机在着陆时坠毁

又摔了一架!印空军一架光辉战斗机在着陆时坠毁

看看新闻Knews
2026-02-23 16:36:05
杨植麟暂时挺过风暴

杨植麟暂时挺过风暴

虎嗅APP
2026-02-27 17:11:06
年前100多元一斤,年后价格腰斩!有湖北人已迫不及待下单

年前100多元一斤,年后价格腰斩!有湖北人已迫不及待下单

环球网资讯
2026-02-27 09:52:19
澳门的赌台,大面积关停!不是没人去,而是被“算法”割废的?

澳门的赌台,大面积关停!不是没人去,而是被“算法”割废的?

李橑在北漂
2026-02-27 18:37:42
日本主教练:下半场的第三节我们的节奏乱了;中国是一支强队

日本主教练:下半场的第三节我们的节奏乱了;中国是一支强队

懂球帝
2026-02-27 00:49:11
比电子布还猛!光纤价格飙涨80%   这7大寡头迎戴维斯双击

比电子布还猛!光纤价格飙涨80% 这7大寡头迎戴维斯双击

元芳说投资
2026-02-26 06:00:08
过年如果没人找你吃饭、喝茶、聚会,电话几乎没有,说明3个问题

过年如果没人找你吃饭、喝茶、聚会,电话几乎没有,说明3个问题

木言观
2026-02-23 14:37:20
逃离三亚大溃败!一万四天价机票逼疯打工人,中产游客已穷哭

逃离三亚大溃败!一万四天价机票逼疯打工人,中产游客已穷哭

烈史
2026-02-26 14:51:59
又遇黑暗一天!两架战机黑海坠落,俄军制海权真的一捅就碎?

又遇黑暗一天!两架战机黑海坠落,俄军制海权真的一捅就碎?

说宇宙
2026-02-26 15:44:35
日本右翼发出警告:如果中国敢动用核弹,将有一亿日本人奋起反击

日本右翼发出警告:如果中国敢动用核弹,将有一亿日本人奋起反击

琴音似君语
2026-02-23 01:08:57
巴拿马总统慌了,他才发现:强吞中国18亿资产,居然是自寻死路

巴拿马总统慌了,他才发现:强吞中国18亿资产,居然是自寻死路

起喜电影
2026-02-26 18:34:12
前所未有!特朗普对华做出一项承诺,盟友们都懵了:中国又没求他

前所未有!特朗普对华做出一项承诺,盟友们都懵了:中国又没求他

花寒弦絮
2026-02-27 19:08:23
2026-02-27 20:03:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12374文章数 142571关注度
往期回顾 全部

科技要闻

单张不到五毛!谷歌深夜发布Nano Banana 2

头条要闻

世界经济论坛总裁辞职 曾私信爱泼斯坦称对方"天才"

头条要闻

世界经济论坛总裁辞职 曾私信爱泼斯坦称对方"天才"

体育要闻

一场必须要赢的比赛,男篮何止击败了裁判

娱乐要闻

继网暴谷爱凌后 美国欲没收其全部收入

财经要闻

沈明高提共富建议 百姓持科技股国家兜底

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

本地
健康
教育
手机
军事航空

本地新闻

津南好·四时总相宜

转头就晕的耳石症,能开车上班吗?

教育要闻

最高学费26万!2026济南、青岛私立学费汇总!

手机要闻

三星版“豆包手机”发布 深度绑定AI

军事要闻

美国11架F-22隐形战机抵达以色列

无障碍浏览 进入关怀版