网易首页 > 网易号 > 正文 申请入驻

ICCV 2025 | EPD-Solver:西湖大学发布并行加速扩散采样算法

0
分享至



本文第一作者是自南洋理工大学的博后朱贝尔和西湖大学的博士生王若禹,主要研究方向分别是 Robust Machine Learning 和 Diffusion Model,该论文已被 ICCV 2025 录用。

近年来,扩散模型(Diffusion Models)凭借出色的生成质量,迅速成为图像、视频、语音、3D 内容等生成任务中的主流技术。从文本生成图像(如 Stable Diffusion),到高质量人脸合成、音频生成,再到三维形状建模,扩散模型正在广泛应用于游戏、虚拟现实、数字内容创作、广告设计、医学影像以及新兴的 AI 原生生产工具中。

其背后的核心机制是 「逐步去噪」 过程:从一张完全随机的图开始,模型通过上百次迭代逐步还原出清晰、真实的图像。这种逐步精化的策略虽然保证了生成质量,却也带来了显著的推理延迟,成为制约其部署效率的瓶颈,尤其在移动设备、实时生成和大规模应用中表现尤为明显。

为了解决这一问题,研究者提出了三种主要的加速思路:一是通过数值求解器(ODE Solvers)减少迭代步数;二是采用模型蒸馏(Distillation)将多步过程压缩为少步甚至一步;三是借助并行计算(Parallelism)加速多个计算路径的推理。然而,每种方法都存在局限:数值求解器在迭代步数极少时往往会损失生成质量;蒸馏方法则需重新训练模型,成本高昂;并行方法虽具潜力,但在低步数场景下仍未被充分挖掘。

为此,西湖大学 AGI 实验室提出了一种融合三类优势的创新方案 ——Ensemble Parallel Direction Solver(EPD-Solver)。该方法以数值求解器为骨架,通过轻量级蒸馏学习获得少量可学习参数,并在每次迭代中并行计算多个方向的梯度,再以加权方式融合,从而有效减少数值积分误差。这种方式不仅无需对模型进行大规模改动,也不会带来额外的延迟开销,成功实现在 3–5 步采样下仍能生成高质量图像。

更进一步,EPD-Solver 还能以 「插件」 的形式应用于现有的主流求解器中,显著提升其生成质量和效率。大量实验表明,在相同计算延迟下,该方法在 CIFAR-10、FFHQ、ImageNet 等多个基准测试中取得了领先的图像生成效果,展示出其在低延迟高质量生成任务中的巨大潜力。



  • 论文题目:Distilling Parallel Gradients for Fast ODE Solvers of Diffusion Models
  • 论文地址:https://arxiv.org/abs/2507.14797
  • 项目地址:https://github.com/BeierZhu/EPD

动机

从宏观层面来看,各类 ODE 求解器都在「如何利用有限的梯度估计去近似积分」上下功夫,如下图所示:





EDM 和 AMED 在 DDIM 的基础上,增加了一次额外梯度评估( tₙ 与 sₙ )来提升积分近似精度。该方法的核心动机是将额外梯度评估扩展到多个时刻,提出 EPD-Solver:



理论支撑(Mean value theorem for vector-valued functions)



方法

参数定义与更新

在每个采样步骤 n 中定义参数集 Θₙ = {τₙᵏ, λₙᵏ, δₙᵏ, oₙ}ₖ₌₁ᴷ,其中:

  • τₙᵏ ∈ (tₙ₊₁, tₙ):第 k 个中间时刻
  • λₙᵏ ≥ 0 且 ∑ₖ λₙᵏ = 1:梯度融合权重
  • δₙᵏ:中间时刻偏移量
  • oₙ:输出尺度扰动参数

推理更新规则



蒸馏训练流程

1. 教师轨迹生成:采用高精度 ODE 解算器(如 DPM-Solver)在扩展时间表 ₜₑₐ 上生成参考状态;

2. 学生轨迹采样:在相同初始噪声 下,使用学生时间表 ₛₜᵤ 采样得到学生状态;

3. 目标函数:针对每步 n,最小化学生与教师状态差异



4. 端到端优化:通过 N 次反向传播,联合优化所有参数 Θ₁:ₙ

插件化集成

EPD‑Plugin 设计为可插拔模块,可无缝集成至现有多步 ODE 求解器(如 iPNDM)。用户仅需替换梯度计算与融合流程,即可在原框架下获得加速与质量提升。





实验结果



1.性能全面领先:在 CIFAR-10、FFHQ、ImageNet 和 LSUN Bedroom 四个数据集的测试中,EPD-Solver (当 K=2 时) 在所有 NFE(函数求值次数)设置下,其 FID 分数均比基线求解器有持续且显著的提升 。

2.低 NFE 场景优势明显:在极低的 NFE 设置(例如 3 NFE)下,EPD-Solver 的优势尤为突出 。例如,在 LSUN Bedroom 数据集上,EPD-Solver 的 FID 分数为 13.21,而次优的基线方法 AMED-Solver 的 FID 分数为 58.21 。

3.插件(Plugin)性能出色:当作为插件(EPD-Plugin)应用于 iPNDM 求解器时,该方法同样表现出色 。尤其是在 NFE 大于 7 的场景,其性能普遍优于 EPD-Solver 。



通过可视化两个随机像素在生成过程中的演变路径,可以观察到 EPD-Solver 的轨迹与「教师」轨迹展现出高度的一致性。相比之下,DDIM、DPM-Solver 和 iPNDM 等其他求解器的轨迹相比教师轨迹明显偏离。



在 Stable Diffusion v1.5 模型上,EPD-Solver 通过在极低的采样步数下(如 8-20 NFE)生成质量远超 DPM-Solver++(2M) 和 AMED-Plugin 等先进求解器,从而展现出显著的加速效果。

结语

通过 EPD-Solver,西湖大学的研究人员展示了如何利用其创新的并行梯度评估机制 ,在不增加单步推理延迟的前提下 ,高效且精确地减小了生图模型每步采样的截断误差,缓解扩散模型在低步数采样下的图像质量退化问题 。

该方法的核心优势在于两点:

1.并行效率与精度提升:通过引入多个可学习的中间时间步梯度评估并将其进行凸组合加权,显著提升了 ODE 积分近似的精度,从而降低了局部截断误差。尤为关键的是,这些额外的梯度计算因其独立性,可实现完全并行化,在保持单步推理零延迟增加的前提下提升了生成质量。

2.训练轻量与即插即用:仅需通过蒸馏方式优化一个极小规模的可学习参数集,避免了代价高昂的扩散模型重训练或微调。该方法还可作为 EPD-Plugin 轻松集成至现有 ODE 采样器(如 iPNDM),进一步扩展其应用范围。

综上,EPD-Solver 突破了扩散模型在低延迟采样时速度与图像质量的核心权衡瓶颈,提供了一种高效、实用且易于部署的新方法。其在多个图像生成基准上显著优于现有先进求解器的实验表现,有力证明了并行计算是推动扩散模型高效采样发展的一个极具潜力的研究方向。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
9连胜联盟第一!却零人入选全明星?这反而是上海男篮恐怖之处

9连胜联盟第一!却零人入选全明星?这反而是上海男篮恐怖之处

你看球呢
2026-01-13 10:44:18
宋庆龄拒绝与孙中山合葬,坦言:她陪我53年,我答应要和她葬一起

宋庆龄拒绝与孙中山合葬,坦言:她陪我53年,我答应要和她葬一起

史之铭
2026-01-12 16:26:19
特朗普大怒,美国对31国发出通牒,不到24小时,英法德对美让步

特朗普大怒,美国对31国发出通牒,不到24小时,英法德对美让步

近史阁
2026-01-13 13:41:22
天安门正对面的那座建筑,究竟有着怎样的来历?又为何能占据这般得天独厚的位置

天安门正对面的那座建筑,究竟有着怎样的来历?又为何能占据这般得天独厚的位置

史海残云
2026-01-13 00:17:14
上海市人大常委会通过一批人事任免,申卫华任市商务委主任

上海市人大常委会通过一批人事任免,申卫华任市商务委主任

澎湃新闻
2026-01-12 22:46:26
为啥唐氏儿“千人一面”?好像都长得一模一样?是什么原因引起的

为啥唐氏儿“千人一面”?好像都长得一模一样?是什么原因引起的

向航说
2026-01-02 00:20:03
不够配合?记者:篮网想看抽签结果再决定是否交易勇士有意的小波特

不够配合?记者:篮网想看抽签结果再决定是否交易勇士有意的小波特

懂球帝
2026-01-13 11:49:22
笑疯了!章泽天首录播客,3000米高山看到花哭,刘嘉玲像哄小姑娘

笑疯了!章泽天首录播客,3000米高山看到花哭,刘嘉玲像哄小姑娘

疯说时尚
2026-01-13 10:09:37
报应来了!捐给美国7千万,满嘴“中国穷关我啥事”,如今破产了

报应来了!捐给美国7千万,满嘴“中国穷关我啥事”,如今破产了

泠泠说史
2026-01-12 18:41:26
津媒:吾米提江伤情不乐观外加杨希停赛,好在刘浩帆即将复出

津媒:吾米提江伤情不乐观外加杨希停赛,好在刘浩帆即将复出

懂球帝
2026-01-13 11:49:22
50岁祖海近照曝光!脸部又肿又僵,胖到认不出,独居北京郊区

50岁祖海近照曝光!脸部又肿又僵,胖到认不出,独居北京郊区

叶公子
2026-01-12 19:00:11
CBA宣布最新决定,徐杰第一碾压胡明轩,郭艾伦仍遥遥领先

CBA宣布最新决定,徐杰第一碾压胡明轩,郭艾伦仍遥遥领先

宗介说体育
2026-01-13 13:59:12
湖人溃败鱼腩送福利,东契奇心态崩两先发变铁匠,一数据遭完败

湖人溃败鱼腩送福利,东契奇心态崩两先发变铁匠,一数据遭完败

谢说篮球
2026-01-13 15:08:59
每天一个水煮蛋是“死亡催化剂”?提醒:想健康吃蛋,5个错别犯

每天一个水煮蛋是“死亡催化剂”?提醒:想健康吃蛋,5个错别犯

健康科普365
2026-01-11 20:30:03
江青被捕后,组织问贺子珍有何要求,她说出了深埋30年的心愿

江青被捕后,组织问贺子珍有何要求,她说出了深埋30年的心愿

传说中的铲史官
2024-07-07 11:30:03
摊牌了!徐帆回应离婚仅5月,冯小刚近况曝光,“小心思”藏不住

摊牌了!徐帆回应离婚仅5月,冯小刚近况曝光,“小心思”藏不住

张例喜欢软软糯糯
2026-01-13 13:47:44
高市斗不过中国,邀6国反华,马克龙打退堂鼓,得罪中方代价太重

高市斗不过中国,邀6国反华,马克龙打退堂鼓,得罪中方代价太重

博览历史
2026-01-12 14:37:15
火箭黄蜂探花互换各取所需,是双赢交易

火箭黄蜂探花互换各取所需,是双赢交易

各生欢喜者
2026-01-13 07:21:50
极限4换1!勇士这是要梭哈一把啊!

极限4换1!勇士这是要梭哈一把啊!

体育新角度
2026-01-13 13:58:57
2026刚开始曝3个大瓜!睡遍男星、人体盛宴、厌恶农村人 个个离谱

2026刚开始曝3个大瓜!睡遍男星、人体盛宴、厌恶农村人 个个离谱

包饺子ai剪辑
2026-01-13 14:46:38
2026-01-13 15:39:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12108文章数 142535关注度
往期回顾 全部

科技要闻

每年10亿美元!谷歌大模型注入Siri

头条要闻

78岁陶华碧"出山救子" 老干妈"触底反弹"1年大卖54亿

头条要闻

78岁陶华碧"出山救子" 老干妈"触底反弹"1年大卖54亿

体育要闻

CBA还能众筹换帅?

娱乐要闻

周杰伦以球员身份参加澳网,C位海报公开

财经要闻

中国一口气申报20万颗卫星,意味着什么?

汽车要闻

限时9.99万元起 2026款启辰大V DD-i虎鲸上市

态度原创

游戏
教育
房产
艺术
军事航空

PS玩家冲!港服节日特惠更新:大镖客、剑星超好价

教育要闻

湖北中考真题,判断大小,答错复读

房产要闻

重磅调规!417亩商改住+教育地块!海口西海岸又要爆发!

艺术要闻

书法争议再起:拙与妍孰优孰劣引发热议

军事要闻

特朗普拿中俄当幌子被北欧官员拆穿:完全不属实

无障碍浏览 进入关怀版