网易首页 > 网易号 > 正文 申请入驻

"清华团队 DiffusionNFT:破解扩散模型 RL 困境,效率飙升 25倍

0
分享至

最近AI圈出了个大事,清华朱军教授团队、NVIDIADeepImagination研究组还有斯坦福StefanoErmon团队,一起搞出了个叫DiffusionNFT的新东西。

这玩意儿是扩散模型强化学习的新玩法,直接把之前行业里的老难题给破了。
之前大家都想把强化学习用到扩散模型上,毕竟强化学习在大语言模型里那么成功。

就说FlowGRPO吧,它是把扩散采样拆成一步一步的决策,然后在反向去噪的时候优化,本来想这招能行,但后来发现问题不少。


首先是似然估计的事儿,自回归模型算“靠谱度”能算得很准,扩散模型却得花大功夫近似。

这就像你算数学题,别人直接套公式出结果,你得绕好几个弯子还不一定对,强化学习跟着受影响,优化的时候总偏。

然后是前向和反向对不上,只优化反向去噪,不管前向加噪,模型练着练着就变样了,生成的东西稳定性差得很。

还有采样器也受限制,只能用一阶SDE的,ODE或者更高阶的好东西用不上,白瞎了那些能提效率、提质量的工具。



最后是CFG的问题,要优化俩模型,又慢又费劲儿。

我觉得这些问题堆在一起,就像给扩散模型绑了好几根绳子,想跑也跑不快。
DiffusionNFT:换个思路就“破局”
就在大家愁怎么解这些绳子的时候,三个团队的DiffusionNFT来了,思路直接反过来了。

之前都盯着反向去噪,它偏不,直接在扩散的前向加噪过程上做强化学习。



这步棋走得挺妙,一下子就绕开了之前的坑,这玩意儿的核心机制有三个,我一个个跟你说。

第一个是正负对比,用奖励把样本分成好的(正例)和差的(负例),明确模型该往哪儿好、该避开哪儿。

之前有个叫RFT的方法,只看正例,就像走路只看前面的路,不看脚下的坑,容易栽跟头。

DiffusionNFT加了负例,相当于多了个“避坑指南”,靠谱多了。




第二个是负力感知微调,它挺聪明的,不用额外加判别器,就从目标模型里同时定了正向和反向的策略,把正负对比变成一个训练目标。

本来想这不得搞俩模型才成,后来发现人家一个就搞定了,省了不少事儿。
第三个是强化指导,数学上把优化目标变成了旧策略的偏移量,跟CFG有点像,但不用双模型。

很显然,这又少了一层麻烦,训练起来更顺了,这么设计下来,DiffusionNFT的好处就显出来了。



首先它跟前向过程能对上,练完还是正经的扩散模型,不会变“四不像”,然后采样器随便用,不管是ODE还是SDE,想用啥用啥。

再者不用算似然,只看生成结果和奖励,步骤少了很多,最后不用依赖CFG,想加也能加,灵活得很。
实验数据说话:效率性能都能打
光说不练假把式,人家团队也做了实验,结果还真亮眼,在GenEval任务上,DiffusionNFT只用1k步,得分就从0.24涨到了0.98。



反观FlowGRPO,得用超过5k步才能到0.95,这差距可不是一点点,整体效率比FlowGRPO高3到25倍。

这效率提升,不管是小公司还是大团队,用起来都能省不少成本,就算不用CFG,DiffusionNFT也比原来的模型强。

比如生成风景图,它生成的图在美感、跟文本的对齐度上,都比老模型好不少,我看过一些对比图,确实能看出差别,细节更到位,风格也更统一。
还有多奖励联合优化的实验,在SD3.5-Medium上同时优化好几个指标,像GenEval、OCR、PickScore这些。



最后模型所有指标都超过了原来的SD3.5-Medium,跟只优化单个奖励的FlowGRPO打平,甚至比更大的SD3.5-L和FLUX.1-Dev还强。

搞不清的是,SD3.5-L参数量比SD3.5-Medium多不少,DiffusionNFT居然能让小模型超过大模型,这实力确实够硬。
往后看,DiffusionNFT的用处还挺多,游戏公司用它做场景生成,之前要72小时,现在12小时就能搞定,程序员怕是能少熬几个夜。

医疗影像领域也能用,它的前向一致性好,生成的CT、MRI影像跟真实结构的偏差能降到5%以下,符合医疗的规矩。



多模态生成、大模型对齐这些领域,以后说不定也能用得上,我觉得DiffusionNFT不光是解决了当下的问题,更像是给扩散模型强化学习指了条新路子。

它打破了之前似然估计和反向轨迹的限制,把监督学习和强化学习连了起来。

如此看来,以后生成式AI不管是做图像、,还是多模态内容,都可能用上它的思路。

毫无疑问,这对整个生成式AI行业来说,都是个好消息,能让技术落地更快,成本更低,普通人也能享受到更多AI带来的便利。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
盈利暴跌95%却豪掷236亿抢地王!越秀地产这是赌命还是疯了?

盈利暴跌95%却豪掷236亿抢地王!越秀地产这是赌命还是疯了?

达文西看世界
2026-02-26 17:49:48
一种新型的异性关系,正在中年男女间悄然流行:你知我心我知你意

一种新型的异性关系,正在中年男女间悄然流行:你知我心我知你意

枫红染山径
2026-02-26 00:12:30
酒窝天王被炮友演了

酒窝天王被炮友演了

毒舌扒姨太
2026-02-26 22:32:38
下半年财运一路发!这3个生肖引爆流量红利,生意做大做强!

下半年财运一路发!这3个生肖引爆流量红利,生意做大做强!

毅谈生肖
2026-02-24 15:37:48
破防了!原来只要失业,所有人都一样!网友:人都快抑郁了

破防了!原来只要失业,所有人都一样!网友:人都快抑郁了

另子维爱读史
2026-01-16 21:03:12
微信官宣更新,又发布了 2 个新功能!

微信官宣更新,又发布了 2 个新功能!

全是技能
2026-02-26 11:19:42
特朗普任期或提前两年结束,中美关系又要乱了

特朗普任期或提前两年结束,中美关系又要乱了

妙知
2026-02-26 15:38:21
4所知名医院同一天迎来新领导,1人1984年出生

4所知名医院同一天迎来新领导,1人1984年出生

金水路7号站
2026-02-26 19:43:11
稳了!海港跟北京国安超级杯 央视CCTV有直播 没大腿红魔能赢吗

稳了!海港跟北京国安超级杯 央视CCTV有直播 没大腿红魔能赢吗

80后体育大蜀黍
2026-02-26 20:23:19
英媒:中国将中子弹纳入常规装备,若属实,代理人战争算是废了

英媒:中国将中子弹纳入常规装备,若属实,代理人战争算是废了

我心纵横天地间
2026-01-29 15:24:36
汪小菲喜得三胎仅2天,荒唐事接连发生,马筱梅或走上大S的老路

汪小菲喜得三胎仅2天,荒唐事接连发生,马筱梅或走上大S的老路

揽星河的笔记
2026-02-26 19:35:46
奉劝所有中国人,大家一定要有心理准备,央视已经点出了核心问题

奉劝所有中国人,大家一定要有心理准备,央视已经点出了核心问题

安安说
2026-01-27 11:07:23
中央军委全力反腐败,说明中国人民解放军将要担大任,干大事!

中央军委全力反腐败,说明中国人民解放军将要担大任,干大事!

安安说
2026-01-29 09:33:17
49 岁女子甲状腺癌晚期,丈夫泣诉:一周至少 6 次,怎么劝都没用

49 岁女子甲状腺癌晚期,丈夫泣诉:一周至少 6 次,怎么劝都没用

岐黄传人孙大夫
2026-02-25 18:05:57
120救护车医护人员拒绝抬担架下楼 拖延40分钟 85岁老人抢救无效死亡 法院判了!

120救护车医护人员拒绝抬担架下楼 拖延40分钟 85岁老人抢救无效死亡 法院判了!

闪电新闻
2026-02-26 15:27:12
教师离世未火化遗体,遗孀无法领取补贴,教体局:多次解释政策,须提供火化证明

教师离世未火化遗体,遗孀无法领取补贴,教体局:多次解释政策,须提供火化证明

观威海
2026-02-26 11:02:05
龙洋眼往上瞟,不是看提词器,也不是针打多了,而是一个“硬伤”

龙洋眼往上瞟,不是看提词器,也不是针打多了,而是一个“硬伤”

她时尚丫
2026-02-17 22:41:30
大家不知道的是,妈祖乩童的真实待遇,不只是荣耀这么简单

大家不知道的是,妈祖乩童的真实待遇,不只是荣耀这么简单

观察鉴娱
2026-02-25 10:17:00
打人时有多狂,求和解时就有多怂!看完太解气!

打人时有多狂,求和解时就有多怂!看完太解气!

风起见你
2026-02-25 18:54:43
iPhone18Pro灵动岛瘦身35%?苹果十年刘海屏:真全面屏仍是未知数

iPhone18Pro灵动岛瘦身35%?苹果十年刘海屏:真全面屏仍是未知数

小8说科技
2026-02-27 01:39:47
2026-02-27 04:55:00
阿柒的讯
阿柒的讯
爱生活|爱运动|爱体育|感谢关注
10716文章数 470关注度
往期回顾 全部

科技要闻

单季营收681亿净利429亿!英伟达再次炸裂

头条要闻

美国政府对外交官下令:开始行动

头条要闻

美国政府对外交官下令:开始行动

体育要闻

从排球少女到冰壶女神,她在米兰冬奥练出6块腹肌

娱乐要闻

向华强公开表态 财产留给儿媳妇郭碧婷

财经要闻

中国AI调用量超美国 4款大模型霸榜前5

汽车要闻

40岁的吉利,不惑于内外

态度原创

本地
数码
健康
旅游
公开课

本地新闻

津南好·四时总相宜

数码要闻

三星Galaxy S26全球新品发布

转头就晕的耳石症,能开车上班吗?

旅游要闻

京城灯会点亮文旅融合新画卷

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版