网易首页 > 网易号 > 正文 申请入驻

北大联合小红书提出Uni-Instruct:ImageNet生图FID进入1.0时代!

0
分享至

(来源:机器之心Pro)


近年来,单步扩散模型因其出色的生成性能和极高的推理效率,在图像生成、文本到视频、图像编辑等领域大放异彩。目前主流的训练方法是通过知识蒸馏,最小化学生模型与教师扩散模型之间的分布差异。然而,现有的方法主要集中在两条平行的理论技术路线上:

这两条路线似乎在理论上是割裂的。那么,我们能否将它们统一在一个共同的理论框架下?如果可以,这个统一的框架能否带来更强的模型性能?

来自北京大学、小红书 hi lab 等机构的华人研究者共同提出了名为 Uni-Instruct 的单步生成大一统理论框架,目前已被 NeurIPS 2025 接收。该框架不仅从理论上统一了超过 10 种现有的单步扩散模型蒸馏方法,更是在多项任务上取得了当前最佳(SoTA)性能。


其中,经过基于展开的 Jeffrey-KL 散度(Expanded Jeffrey-KL divergence)用 Uni-Instruct 蒸馏得到的一步生图模型在 ImageNet-64 数据集上取得了历史历史最低 1.02 的单步生成 FID 指标,远超了 1000 步采样的扩散模型(参见图 2 右表)。

核心贡献:Uni-Instruct 理论框架

研究者们提出了一个名为 Uni-Instruct 的统一理论框架,其核心是创新的f-散度扩散展开定理(diffusion expansion theory of the f-divergence family)。


简单来说,该定理推广了 De Bruijin 等式,将静态的数据空间教师模型与单步模型之间 f-散度扩展为沿扩散过程的动态散度积分。

虽然原始的展开形式难以直接优化,但团队通过引入新的梯度等价定理,推导出了一个等价且可计算的损失函数。


最令人惊喜的是,这个最终的损失函数梯度,恰好是Diff-Instruct(DI)梯度和 Score Implicit Matching(SIM)梯度的一个加权组合!


通过选择不同的 f-散度函数(如 KL 散度、卡方散度等),Uni-Instruct 能够恢复出包括 Diff-Instruct[1]、DMD[2]、f-distill[5]、SIM[3]、SiD[4] 在内的十余种现有方法的损失函数。这不仅为理解现有工作提供了全新的高层视角,也标志着单步扩散模型理论大一统。



图注 1: Uni-Instruct 一步生成器在不同基准数据集上的生成效果。左:CIFAR10(无条件);中:CIFAR10(有条件);右:ImageNet 64x64(有条件)。可以看到,生成样本的质量和多样性都非常出色。


图注 2: Uni-Instruct 一步生成模型在不同基准数据集上的评测效果。左:CIFAR10(无条件);右:ImageNet 64x64(有条件)。可以看到,生成样本的质量和多样性都非常出色。Uni-Instruct 模型在两个评测榜单上都取得了巨大性能和效率优势。

实验结果

Uni-Instruct 在多个主流基准测试中取得了破纪录的性能:

这些结果全面超越了 Diff-Instruct、Score Implicit Matching、f-distill、SiDA、DMD、Consistency Model 等之前的所有一步生成模型,甚至远超需要 1000 步采样的标准扩散模型。

更广泛的应用:

文本到 3D 生成

Uni-Instruct 的威力不止于 2D 图像。研究者们将其成功应用于文本到 3D 生成任务,作为一种知识迁移方法,用以指导 NeRF 模型的优化。

实验结果表明,相比于 SDS 和 VSD 等现有方法,Uni-Instruct 能够在生成 3D 内容的质量和多样性上取得更优异的效果。


图注 3:左图:ProlificDreamer 右图:Uni-Instruct

总结与展望

Uni-Instruct 提供了一个坚实的理论基础,成功地将十余种看似不同的扩散模型蒸馏方法囊括在一个统一的框架之下。这种理论大一统不仅带来了对高效扩散模型的深刻理解,其卓越的实证性能也为高效生成模型的未来研究开辟了新的道路。这项工作是高效生成模型领域的一次重要理论突破,我们期待它能激发更多关于扩散模型知识迁移和高效生成的前沿探索!

本工作由北京大学计算科学成像实验室本科生王翼飞与博士生柏为民合作完成。本论文的通讯作者罗维俭在北京大学数学院取得博士学位,现供职于小红书 hi lab 任多模态大模型研究员。末位作者为北京大学未来技术学院孙赫助理教授。

[1] Luo, Weijian, et al. "Diff-instruct: A universal approach for transferring knowledge from pre-trained diffusion models." Advances in Neural Information Processing Systems 36 (2023): 76525-76546.

[2] Yin, Tianwei, et al. "One-step diffusion with distribution matching distillation." Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2024.

[3] Luo, Weijian, et al. "One-step diffusion distillation through score implicit matching." Advances in Neural Information Processing Systems 37 (2024): 115377-115408.

[4] Zhou, Mingyuan, et al. "Score identity distillation: Exponentially fast distillation of pretrained diffusion models for one-step generation." Forty-first International Conference on Machine Learning. 2024.

[5] Xu, Yilun, Weili Nie, and Arash Vahdat. "One-step Diffusion Models with $f$-Divergence Distribution Matching." arXiv preprint arXiv:2502.15681 (2025)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
河南男子借大G给朋友当婚车,另一朋友驾驶连撞4车定损41万!新娘:差点毁了婚礼

河南男子借大G给朋友当婚车,另一朋友驾驶连撞4车定损41万!新娘:差点毁了婚礼

极目新闻
2026-02-04 17:11:03
立陶宛活成了笑话!6国排队访华,立陶宛疯狂求和,惨遭无视

立陶宛活成了笑话!6国排队访华,立陶宛疯狂求和,惨遭无视

东极妙严
2026-02-04 16:42:52
金饰价格涨到1600元/克 一夜涨102元

金饰价格涨到1600元/克 一夜涨102元

财联社
2026-02-04 09:20:08
1个月赚5万元又一天亏2万,演员赵佳欣晒基金收益:每天睡醒便钻研黄金、航天、半导体、AI

1个月赚5万元又一天亏2万,演员赵佳欣晒基金收益:每天睡醒便钻研黄金、航天、半导体、AI

扬子晚报
2026-02-04 07:20:37
大抄底,开始了?

大抄底,开始了?

功夫财经
2026-02-04 08:35:05
“三通一达”被实锤?企业要求入职提供体验报告,9个女留子跑了

“三通一达”被实锤?企业要求入职提供体验报告,9个女留子跑了

没有偏旁的常庆
2026-02-02 07:20:03
12306回应取消3次订单会被锁定账户 春运购票超全攻略来了

12306回应取消3次订单会被锁定账户 春运购票超全攻略来了

新京报
2026-02-04 22:24:06
俄方:日本领土上出现有关陆基中导系统必会招致俄方反制

俄方:日本领土上出现有关陆基中导系统必会招致俄方反制

财联社
2026-02-03 16:33:06
影视大佬吴敦离世,享年77岁,贾静雯 林志颖发文悼念

影视大佬吴敦离世,享年77岁,贾静雯 林志颖发文悼念

素素娱乐
2026-02-04 21:38:21
巴拿马变天了?总统拒不服从法院,喊话称哪怕被判了,港口也不停

巴拿马变天了?总统拒不服从法院,喊话称哪怕被判了,港口也不停

梦醉为红颜一笑
2026-02-04 12:25:57
一颗螺丝钉都不留给它们!中方的警告,是给巴拿马最后的改错机会

一颗螺丝钉都不留给它们!中方的警告,是给巴拿马最后的改错机会

现代小青青慕慕
2026-02-04 19:08:18
特朗普惊出一身冷汗:中美已无法开战,一杀手锏让美军无计可施

特朗普惊出一身冷汗:中美已无法开战,一杀手锏让美军无计可施

刘襈说体坛
2026-02-05 02:35:25
上海市正在规划的4条地铁,你最期待哪一条?

上海市正在规划的4条地铁,你最期待哪一条?

天气观察站
2026-02-04 18:56:45
人社部传来好消息!1.5亿退休老人高兴了,2026年养老金或再调整

人社部传来好消息!1.5亿退休老人高兴了,2026年养老金或再调整

姩姩有娱
2026-02-04 15:07:40
真爱还是接盘侠?41岁香港艳星现下嫁山东农村,曾不雅照片满天飞

真爱还是接盘侠?41岁香港艳星现下嫁山东农村,曾不雅照片满天飞

古事寻踪记
2026-02-04 07:10:54
黄金深夜跳水,中概股下挫,网易跌超6%,AMD大跌13%

黄金深夜跳水,中概股下挫,网易跌超6%,AMD大跌13%

21世纪经济报道
2026-02-04 23:48:45
在小县城名声很臭是啥体验?网友:脸皮够厚,一切不成问题

在小县城名声很臭是啥体验?网友:脸皮够厚,一切不成问题

解读热点事件
2026-02-04 00:05:07
中国现在95%的房子,已经没有任何投资价值。

中国现在95%的房子,已经没有任何投资价值。

流苏晚晴
2026-02-04 20:04:16
上海交大发现:吃大蒜能在29小时内降低48%的血糖,是真的吗?

上海交大发现:吃大蒜能在29小时内降低48%的血糖,是真的吗?

新浪财经
2026-02-01 20:01:52
记者:雄鹿不愿在字母哥交易中接收格林,勇士需拉第三方交易

记者:雄鹿不愿在字母哥交易中接收格林,勇士需拉第三方交易

懂球帝
2026-02-05 00:58:05
2026-02-05 04:27:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2109681文章数 5361关注度
往期回顾 全部

科技要闻

太烦人遭投诉!元宝红包链接被微信屏蔽

头条要闻

女子痛斥爱泼斯坦:我一次又一次被强奸 他禽兽不如

头条要闻

女子痛斥爱泼斯坦:我一次又一次被强奸 他禽兽不如

体育要闻

哈登回应交易:不想让自己拖累快船的未来

娱乐要闻

春晚主持人阵容曝光,5位都是老面孔

财经要闻

白银,突然暴涨

汽车要闻

综合续航1730km 5座中级电混SUV吉利银河M7官图发布

态度原创

家居
艺术
亲子
时尚
军事航空

家居要闻

灰白意境 光影奏鸣曲

艺术要闻

133.8亿!深圳自贸时代中心,年内竣工!

亲子要闻

麻腮风疫苗到底要不要给孩子打?听听儿科医生怎么说

60岁的刘嘉玲、章小蕙太美了!港女的魅力从不是少女感

军事要闻

卡扎菲儿子被暗杀:4名蒙面人员闯入住所

无障碍浏览 进入关怀版