网易首页 > 网易号 > 正文 申请入驻

加速扩散模型,最快1步生成SOTA级图片,字节Hyper-SD开源了

0
分享至

机器之心发布

机器之心编辑部

最近,扩散模型(Diffusion Model)在图像生成领域取得了显著的进展,为图像生成和视频生成任务带来了前所未有的发展机遇。尽管取得了令人印象深刻的结果,扩散模型在推理过程中天然存在的多步数迭代去噪特性导致了较高的计算成本。近期出现了一系列扩散模型蒸馏算法来加速扩散模型的推理过程。这些方法大致可以分为两类:i) 轨迹保持蒸馏;ii) 轨迹重构蒸馏。然而,这两类方法会分别受到效果天花板有限或者或输出域变化这两个问题的限制。

为了解决这些问题,字节跳动技术团队提出了一种名为 Hyper-SD 的轨迹分段一致性模型。Hyper-SD 的开源也得到了Huggingface首席执行官 Clem Delangue的肯定。

该模型是一种新颖的扩散模型蒸馏框架,结合了轨迹保持蒸馏和轨迹重构蒸馏两种策略的优点,在压缩去噪步数的同时保持接近无损的性能。与现有的扩散模型加速算法相比,该方法取得了卓越的加速效果。经过大量实验和用户评测的验证,Hyper-SD 在 SDXL 和 SD1.5 两种架构上都能在 1 到 8 步生成中实现 SOTA 级别的图像生成性能。

  • 项目主页:https://hyper-sd.github.io/
  • 论文链接:https://arxiv.org/abs/2404.13686
  • Huggingface 链接:https://huggingface.co/ByteDance/Hyper-SD
  • 单步生成 Demo 链接:https://huggingface.co/spaces/ByteDance/Hyper-SDXL-1Step-T2I
  • 实时画板 Demo 链接:https://huggingface.co/spaces/ByteDance/Hyper-SD15-Scribble

视频链接:https://mp.weixin.qq.com/s/dqDqlWv1xe-8zayeJCGq8A

现有用于扩散模型加速的蒸馏方法大致可以分为两大类:轨迹保持蒸馏和轨迹重构蒸馏。轨迹保持蒸馏技术旨在维持扩散对应的常微分方程(ODE)的原始轨迹。其原理是通过迫使蒸馏模型和原始模型产生相似的输出来减少推理步骤。然而需要注意的是,尽管能够实现加速,由于模型容量有限以及训练拟合过程中不可避免的误差,这类方法可能导致生成质量下降。相比之下,轨迹重构方法则直接利用轨迹上的端点或真实图像作为监督的主要来源,忽略了轨迹的中间步骤,能够通过重建更有效的轨迹来减少推理步骤的数量,并在有限的步骤内探索模型的潜力,将其从原始轨迹的约束中解放出来。然而,这通常会导致加速模型与原始模型的输出域不一致,从而得到不理想的结果。

本论文提出了一种结合轨迹保持和重构策略优点的轨迹分段一致性模型(简称 Hyper-SD)。具体而言,该算法首先引入轨迹分段一致性蒸馏,在每个段内强制保持一致性,并逐渐减少段的数量以实现全时一致性。这一策略解决了由于模型拟合能力不足和推理误差累积导致的一致性模型性能次优的问题。随后,该算法利用人类反馈学习(RLHF)来提升模型的生成效果,以弥补加速过程中模型生成效果的损失,使其更好地适应低步数推理。最后,该算法使用分数蒸馏来增强一步生成性能,并通过统一的 LORA 实现理想化的全时间步数一致扩散模型,在生成效果上取得了卓越的成果。

方法

1. 轨迹分段一致性蒸馏

一致性蒸馏(CD)[24] 和一致性轨迹模型(CTM)[4] 都旨在通过一次性蒸馏将扩散模型转换为整个时间步范围 [0,T] 的一致性模型。然而,由于模型拟合能力的限制,这些蒸馏模型往往达不到最优性。受到 CTM 中引入的软一致性目标的启发,我们通过将整个时间步范围 [0, T] 划分为 k 段并逐步执行分段一致模型蒸馏来细化训练过程。

在第一阶段,我们设置 k=8 并使用原始扩散模型来初始化 和。起始时间步是从中均匀随机采样的。然后,我们对结束时间步进行采样,其中计算如下:

完整的算法流程如下:

2. 人类反馈学习

3. 一步生成强化

实验

在 SD1.5 和 SDXL 上和目前现有的各种加速算法的定量比较,可以看到 Hyper-SD 显著优于当前最先进的方法

此外,Hyper-SD 能够用一个模型来实现各种不同低步数的推理,上面的定量指标也显示了我们方法在使用统一模型推理时的效果。

在 SD1.5 和 SDXL 上的加速效果可视化直观地展示了 Hyper-SD 在扩散模型推理加速上的优越性。

大量的 User-Study 也表明 Hyper-SD 相较于现有的各种加速算法的优越性。

Hyper-SD 训练得到的加速 LoRA 能够很好地兼容不同的风格的文生图底模。

同时,Hyper-SD 的 LoRA 也能适配现有的 ControlNet,实现低步数下高质量的可控图像生成

总结

论文提出了 Hyper-SD,一个统一的扩散模型加速框架,可以显著提升扩散模型的在低步数情况下的生成能力,实现基于 SDXL 和 SD15 的新 SOTA 性能。该方法通过采用轨迹分段一致性蒸馏,增强了蒸馏过程中的轨迹保存能力,实现接近原始模型的生成效果。然后,通过进一步利用人类反馈学习和变分分数蒸馏提升模型在极端低步数下的潜力,从而产生了更优化、更高效的模型生成效果。论文还开源了用于 SDXL 和 SD15 从 1 到 8 步推理的 Lora 插件,以及专用的一步 SDXL 模型,旨在进一步推动生成式 AI 社区的发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1955年,卫生部要废除中医,毛主席得知消息,直接撤掉两位副部长

1955年,卫生部要废除中医,毛主席得知消息,直接撤掉两位副部长

雍亲王府
2026-06-30 13:45:03
这位像雕塑的刚果球迷,在夜店证明了:他也会动

这位像雕塑的刚果球迷,在夜店证明了:他也会动

快乐加载中21
2026-06-30 00:03:49
胡乔木去世后,季羡林说:有人封他为“左王”,我觉得他是冤枉的

胡乔木去世后,季羡林说:有人封他为“左王”,我觉得他是冤枉的

帝哥说史
2026-06-30 23:25:26
《陈翔六点半》“妹爷”扮演者去世

《陈翔六点半》“妹爷”扮演者去世

喜欢历史的阿繁
2026-06-30 20:33:18
昨日Deepseek封神!三场比赛的赛果和比分全部预测正确

昨日Deepseek封神!三场比赛的赛果和比分全部预测正确

懂球帝
2026-06-30 16:09:14
转让老婆?厦门男子100万出售媳妇儿,女子很赞同,全程听丈夫话

转让老婆?厦门男子100万出售媳妇儿,女子很赞同,全程听丈夫话

兵哥观世界
2026-06-26 04:29:22
父亲正国级、母亲副国级!顶级高干独女,晚年低头“化缘”扶贫

父亲正国级、母亲副国级!顶级高干独女,晚年低头“化缘”扶贫

蹲坑看世界
2026-06-30 08:45:55
4次助攻第1!巴西28岁中场大师崛起:追平济科,辅佐维尼修斯冲冠

4次助攻第1!巴西28岁中场大师崛起:追平济科,辅佐维尼修斯冲冠

李喜林篮球绝杀
2026-06-30 11:52:23
初婚人口跌破1000万,社会将迎来剧变

初婚人口跌破1000万,社会将迎来剧变

谭谈投研
2026-06-29 22:34:09
日本韩国出局!媒体人:黄种人的上限在哪儿?苏炳添天生跑不过博尔特

日本韩国出局!媒体人:黄种人的上限在哪儿?苏炳添天生跑不过博尔特

生活新鲜市
2026-06-30 13:19:41
82年冬,母亲留磨刀人吃了一顿饭,他一句话救了父亲一命

82年冬,母亲留磨刀人吃了一顿饭,他一句话救了父亲一命

灿烂夏天
2025-01-24 21:01:33
有哪些是你去东北才知道的事情?看网友们的真实分享,惊呆了

有哪些是你去东北才知道的事情?看网友们的真实分享,惊呆了

智慧生活笔记
2026-06-29 15:14:18
多家检测机构拒绝个人申请纸尿裤甲酰胺检测

多家检测机构拒绝个人申请纸尿裤甲酰胺检测

财闻
2026-06-30 20:56:42
半夜窗户爬进来个男人,女主人一看身强体壮,干脆放弃报警

半夜窗户爬进来个男人,女主人一看身强体壮,干脆放弃报警

那年秋天
2026-06-30 12:42:18
52岁马国明陪汤洛雯全家逛街!39岁汤洛雯身形暴涨胖成球,孕味浓

52岁马国明陪汤洛雯全家逛街!39岁汤洛雯身形暴涨胖成球,孕味浓

可乐谈情感
2026-06-30 12:42:41
伊朗:超30国官员拟出席已故最高领袖哈梅内伊悼念活动,为保障活动举行,将在部分地区实施临时公共假期安排

伊朗:超30国官员拟出席已故最高领袖哈梅内伊悼念活动,为保障活动举行,将在部分地区实施临时公共假期安排

极目新闻
2026-06-30 22:01:14
Shams:马刺拒绝执行尚帕尼球队选项,并与他3年4500万美元续约

Shams:马刺拒绝执行尚帕尼球队选项,并与他3年4500万美元续约

懂球帝
2026-06-30 05:50:08
荷兰贸易大臣率阿斯麦等17家企业访华!临行承诺:绝不提台湾问题

荷兰贸易大臣率阿斯麦等17家企业访华!临行承诺:绝不提台湾问题

策前论
2026-06-30 23:24:18
突然变脸!库尼亚深情安慰田中碧,发现盐贝健人立刻开启嘲讽模式

突然变脸!库尼亚深情安慰田中碧,发现盐贝健人立刻开启嘲讽模式

新杀猪的秀才
2026-06-30 10:22:12
1994年,哈萨克斯坦为什么把紧挨中国的首都,迁到1000公里外?

1994年,哈萨克斯坦为什么把紧挨中国的首都,迁到1000公里外?

小莜读史
2026-06-30 19:26:01
2026-07-01 00:24:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13401文章数 142685关注度
往期回顾 全部

科技要闻

iPhone18 Pro遭泄密!印度代工商惹祸

头条要闻

坎贝尔承认:中国是最成功渡过难关的国家

头条要闻

坎贝尔承认:中国是最成功渡过难关的国家

体育要闻

大热倒灶压力给到法国 王楚揭法国队隐患

娱乐要闻

广电总局发布2026年“微短剧+”行动计划推荐剧目

财经要闻

万亿“寒王”,历史时刻

汽车要闻

奇瑞风云A9探店 五个理由一定来看看

态度原创

教育
亲子
艺术
本地
公开课

教育要闻

中高考志愿填报防诈提醒 #中高考志愿填报 #阳光高考网 #志愿填报 #市场监管(记者 苏艺)

亲子要闻

✨闪闪小葵花 成长正当时✨ 「寻找闪亮小主角」才艺展示活动 表演现场高光集锦,见证萌娃的舞台魅力~

艺术要闻

首次曝光!北京世贸天阶改造效果图

本地新闻

贵州小城的新目标:举办“村超”世界杯!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版