网易首页 > 网易号 > 正文 申请入驻

NeurIPS 2025 | 北大联合小红书提出Uni-Instruct:ImageNet单步...

0
分享至

来源:市场资讯

(来源:机器之心)


近年来,单步扩散模型因其出色的生成性能和极高的推理效率,在图像生成、文本到视频、图像编辑等领域大放异彩。目前主流的训练方法是通过知识蒸馏,最小化学生模型与教师扩散模型之间的分布差异。然而,现有的方法主要集中在两条平行的理论技术路线上:

  • 基于 KL 散度最小化的方法(如 Diff-Instruct[1],DMD[2] 等):收敛速度快,但可能存在模式崩溃问题,进而导致生成性能差。

  • 基于分数散度最小化的方法(如 SIM[3],SiD[4] 等):蒸馏性能更好,但训练收敛较慢。

这两条路线似乎在理论上是割裂的。那么,我们能否将它们统一在一个共同的理论框架下?如果可以,这个统一的框架能否带来更强的模型性能?

来自北京大学、小红书 hi lab 等机构的华人研究者共同提出了名为 Uni-Instruct 的单步生成大一统理论框架,目前已被 NeurIPS 2025 接收。该框架不仅从理论上统一了超过 10 种现有的单步扩散模型蒸馏方法,更是在多项任务上取得了当前最佳(SoTA)性能。


  • 论文标题:Uni-Instruct: One-step Diffusion Model through Unified Diffusion Divergence Instruction

  • 论文地址:https://arxiv.org/abs/2505.20755v4

  • 代码:https://github.com/a-little-hoof/Uni_Instruct

  • 论文单位:北京大学未来技术学院、国家生物医学成像中心、北京大学前沿交叉学科研究院、小红书 hi-lab

  • 论文作者:Yifei Wang, Weimin Bai, Colin Zhang, Debing Zhang, Weijian Luo, He Sun

其中,经过基于展开的 Jeffrey-KL 散度(Expanded Jeffrey-KL divergence)用 Uni-Instruct 蒸馏得到的一步生图模型在 ImageNet-64 数据集上取得了历史历史最低 1.02 的单步生成 FID 指标,远超了 1000 步采样的扩散模型(参见图 2 右表)。

核心贡献:Uni-Instruct 理论框架

研究者们提出了一个名为 Uni-Instruct 的统一理论框架,其核心是创新的 f-散度扩散展开定理(diffusion expansion theory of the f-divergence family)。


简单来说,该定理推广了 De Bruijin 等式,将静态的数据空间教师模型与单步模型之间 f-散度扩展为沿扩散过程的动态散度积分。

虽然原始的展开形式难以直接优化,但团队通过引入新的梯度等价定理,推导出了一个等价且可计算的损失函数。


最令人惊喜的是,这个最终的损失函数梯度,恰好是 Diff-Instruct(DI)梯度和 Score Implicit Matching(SIM)梯度的一个加权组合!


通过选择不同的 f-散度函数(如 KL 散度、卡方散度等),Uni-Instruct 能够恢复出包括 Diff-Instruct[1]、DMD[2]、f-distill[5]、SIM[3]、SiD[4] 在内的十余种现有方法的损失函数。这不仅为理解现有工作提供了全新的高层视角,也标志着单步扩散模型理论大一统。



图注 1: Uni-Instruct 一步生成器在不同基准数据集上的生成效果。左:CIFAR10(无条件);中:CIFAR10(有条件);右:ImageNet 64x64(有条件)。可以看到,生成样本的质量和多样性都非常出色。


图注 2: Uni-Instruct 一步生成模型在不同基准数据集上的评测效果。左:CIFAR10(无条件);右:ImageNet 64x64(有条件)。可以看到,生成样本的质量和多样性都非常出色。Uni-Instruct 模型在两个评测榜单上都取得了巨大性能和效率优势。

实验结果

Uni-Instruct 在多个主流基准测试中取得了破纪录的性能:

  • CIFAR10:

    • 无条件生成 FID 达到 1.46。

    • 条件生成 FID 达到 1.38。

    ImageNet 64x64:

    • 条件生成 FID 达到 1.02,效果显著优于采样步数为 79 步的教师模型(1.02 vs 2.35)!

    这些结果全面超越了 Diff-Instruct、Score Implicit Matching、f-distill、SiDA、DMD、Consistency Model 等之前的所有一步生成模型,甚至远超需要 1000 步采样的标准扩散模型。

    更广泛的应用:

    文本到 3D 生成

    Uni-Instruct 的威力不止于 2D 图像。研究者们将其成功应用于文本到 3D 生成任务,作为一种知识迁移方法,用以指导 NeRF 模型的优化。

    实验结果表明,相比于 SDS 和 VSD 等现有方法,Uni-Instruct 能够在生成 3D 内容的质量和多样性上取得更优异的效果。


    图注 3:左图:ProlificDreamer 右图:Uni-Instruct

    总结与展望

    Uni-Instruct 提供了一个坚实的理论基础,成功地将十余种看似不同的扩散模型蒸馏方法囊括在一个统一的框架之下。这种理论大一统不仅带来了对高效扩散模型的深刻理解,其卓越的实证性能也为高效生成模型的未来研究开辟了新的道路。这项工作是高效生成模型领域的一次重要理论突破,我们期待它能激发更多关于扩散模型知识迁移和高效生成的前沿探索!

    本工作由北京大学计算科学成像实验室本科生王翼飞与博士生柏为民合作完成。本论文的通讯作者罗维俭在北京大学数学院取得博士学位,现供职于小红书 hi lab 任多模态大模型研究员。末位作者为北京大学未来技术学院孙赫助理教授。

    [1] Luo, Weijian, et al. "Diff-instruct: A universal approach for transferring knowledge from pre-trained diffusion models." Advances in Neural Information Processing Systems 36 (2023): 76525-76546.

    [2] Yin, Tianwei, et al. "One-step diffusion with distribution matching distillation." Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2024.

    [3] Luo, Weijian, et al. "One-step diffusion distillation through score implicit matching." Advances in Neural Information Processing Systems 37 (2024): 115377-115408.

    [4] Zhou, Mingyuan, et al. "Score identity distillation: Exponentially fast distillation of pretrained diffusion models for one-step generation." Forty-first International Conference on Machine Learning. 2024.

    [5] Xu, Yilun, Weili Nie, and Arash Vahdat. "One-step Diffusion Models with $f$-Divergence Distribution Matching." arXiv preprint arXiv:2502.15681 (2025).

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
Meta大裁员,做元宇宙的滚!!

Meta大裁员,做元宇宙的滚!!

飞总聊IT
2026-01-14 12:22:45
新中国成立后,中央两度劝李立三离婚,但他都没有应允,周总理随后提出解决方案:让他的妻子放弃原国籍

新中国成立后,中央两度劝李立三离婚,但他都没有应允,周总理随后提出解决方案:让他的妻子放弃原国籍

寄史言志
2026-01-01 22:44:08
拔出萝卜带出泥!闫学晶塌方,中戏毕业照流出,更多天龙人遭殃

拔出萝卜带出泥!闫学晶塌方,中戏毕业照流出,更多天龙人遭殃

温柔看世界
2026-01-13 11:27:16
我是山东人,在南宁待了7天,终于知道为什么大家都喜欢来南宁了

我是山东人,在南宁待了7天,终于知道为什么大家都喜欢来南宁了

娱乐圈的笔娱君
2026-01-14 12:02:17
尺度惊艳,Netflix制作的9分成人动漫,太过瘾了

尺度惊艳,Netflix制作的9分成人动漫,太过瘾了

来看美剧
2026-01-09 17:38:59
中国一口气申报20万颗卫星,意味着什么?

中国一口气申报20万颗卫星,意味着什么?

澎湃新闻
2026-01-13 07:02:30
很多人都患过“带状疱疹”,却不知它和“老年痴呆”有关!了解下

很多人都患过“带状疱疹”,却不知它和“老年痴呆”有关!了解下

岐黄传人孙大夫
2026-01-12 13:00:07
英媒:解雇弗兰克至少需要800万镑,他还有两年半的合同在身

英媒:解雇弗兰克至少需要800万镑,他还有两年半的合同在身

懂球帝
2026-01-13 19:39:12
跳高王子朱建华:奥运会夺铜牌被骂,退役定居美国,如今怎样了?

跳高王子朱建华:奥运会夺铜牌被骂,退役定居美国,如今怎样了?

史虇的生活科普
2026-01-14 11:17:24
1960年杨勇与英国元帅比枪法,毛主席得知后大笑

1960年杨勇与英国元帅比枪法,毛主席得知后大笑

优趣纪史记
2026-01-10 18:33:57
有点过,Shams:东契奇自巴黎奥运会起就一直骂施罗德Bi*ch

有点过,Shams:东契奇自巴黎奥运会起就一直骂施罗德Bi*ch

懂球帝
2026-01-14 08:21:25
中国中铁董事长陈文健、总裁赵佃龙拜会交通运输部部长刘伟

中国中铁董事长陈文健、总裁赵佃龙拜会交通运输部部长刘伟

证券时报
2026-01-13 20:35:04
难以置信!冷战五天,浙江女子拒丈夫提夫妻生活要求,被网友炮轰

难以置信!冷战五天,浙江女子拒丈夫提夫妻生活要求,被网友炮轰

火山诗话
2026-01-13 07:23:45
直落两盘横扫!吴易昺澳网资格赛再胜一场,重返正赛一步之遥

直落两盘横扫!吴易昺澳网资格赛再胜一场,重返正赛一步之遥

全景体育V
2026-01-14 12:47:36
知乎750万浏览:为什么不能对认知低的人太好?

知乎750万浏览:为什么不能对认知低的人太好?

精读君
2026-01-13 10:00:11
警惕!这6种食物被证实“促癌” 很多人每天都在吃

警惕!这6种食物被证实“促癌” 很多人每天都在吃

大象新闻
2026-01-07 21:45:05
队报:阿隆索从未打算主动辞职;任命阿隆索不是老佛爷的决定

队报:阿隆索从未打算主动辞职;任命阿隆索不是老佛爷的决定

懂球帝
2026-01-14 00:03:48
苦战两年,人财两空,哈马斯终于认清形势,宣布将解散加沙政府

苦战两年,人财两空,哈马斯终于认清形势,宣布将解散加沙政府

博览历史
2026-01-13 18:46:43
许国利杀妻案如今已经过去5年,整栋楼还是无人住,为何?

许国利杀妻案如今已经过去5年,整栋楼还是无人住,为何?

阿鄖田间生活
2025-12-03 19:11:23
2026-01-14 13:52:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2019406文章数 5240关注度
往期回顾 全部

科技要闻

美国批准英伟达H200卖给中国,但有条件

头条要闻

一户人家被全楼"孤立":加装电梯没出资 卖房时尴尬了

头条要闻

一户人家被全楼"孤立":加装电梯没出资 卖房时尴尬了

体育要闻

牛津学霸买下儿时主队,让它成为英超黑马

娱乐要闻

何晴去世30天,许亚军终于发声

财经要闻

沪深北交易所提高融资保证金比例

汽车要闻

曝Model Y或降到20万以内!

态度原创

教育
数码
旅游
公开课
军事航空

教育要闻

“我就是不想再被她摆布!”宁波初三女孩用不上学报复妈妈

数码要闻

华硕:TUF GAMING X870-PRO WIFI7 W NEO主板系列首发NitroPath

旅游要闻

从“打卡”到“栖居”: 外国游客为何持续选择中国

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美再发安全警告 敦促美公民立即离开伊朗

无障碍浏览 进入关怀版