网易首页 > 网易号 > 正文 申请入驻

训练快4倍!ArcFlow用「非线性」魔法实现FLUX/Qwen推理40倍加速

0
分享至



在生成式 AI 的浪潮中,我们见证了从 Stable Diffusion 到 FLUX、Qwen-Image 等大规模扩散模型的画质飞跃。然而,这种飞跃并非没有代价。为了从纯噪声中 “雕刻” 出清晰的图像,这些模型通常需要进行40 到 100 步(NFE)的迭代去噪。这种延迟使得模型很难真正应用于实际的实时生成或大规模服务。

于是,“少步生成”(Few-step Generation)成为了必争之地。对于原本教师模型曲折的生成轨迹,目前的少步加速方案(如 Progressive Distillation, Distribution Matching 等)都在试图做同一件事:把弯路拉直,一步到达终点

然而,原本高维空间的生成轨迹极其复杂,强行 “拉直” 会导致轨迹上的几何失配(Geometric Mismatch)。这直接导致了少步生成时的结构崩坏和细节丢失。

有没有一种方法,既能快,又能顺应原本蜿蜒的生成轨迹?

复旦大学与微软亚洲研究院带来的ArcFlow给出了答案:如果路是弯的,那就学会 “漂移”,而不是把路修直。



  • 论文地址:https://arxiv.org/abs/2602.09014
  • 项目代码:https://github.com/pnotp/ArcFlow

一、 困境:为什么 “走直线” 难以学习?

在扩散模型中,教师模型(Pre-trained Teacher)的生成过程本质上是在高维空间中求解微分方程并进行多步积分。由于图像流形的复杂性,教师模型原本的采样轨迹通常是一条蜿蜒的曲线,其切线方向(即速度场)随时间步不断变化。

为了加速,现有的蒸馏方法(如 Progressive Distillation, Instaflow 等)尝试将这个轨迹压缩成一步直线抵达。它们的逻辑是:既然走曲线慢,那就训练学生模型,把起点(噪声)和终点(图像)之间连成一条直线。如果学生能学会走这条直线,那推理不就只需要一步了吗?

这种策略带来了两个致命问题:

1.几何失配(Geometric Mismatch):教师模型原本的权重是基于曲线轨迹训练出来的。强行让学生模型去拟合一条直线,相当于让它 “背叛” 教师原本的生成先验。这种几何上的不匹配,导致学生模型很难学,或者学出来的东西结构崩坏。

2.学习成本高:为了强行扭转轨迹,学生模型往往需要进行全参数微调(Full Fine-tuning)。这不仅训练慢、显存开销大,而且容易导致 “灾难性遗忘”,破坏大模型原本优秀的泛化能力。

所以我们经常看到:很多蒸馏后的模型,虽然速度快了,但生成质量不稳定,甚至对复杂的 Prompt 理解能力下降。

如果不强制拉直,我们还能怎么快起来?

二、 洞察:速度场不是随机的,它是连续的

ArcFlow 团队重新审视了教师模型的轨迹,根据 ODE 的理论规律,在相邻的时间步之间,去噪的速度方向并不是跳跃式变化的,而是存在极强的相关性。这就像一辆赛车在过弯道,下一秒的方向和速度,很大程度上取决于当前秒的状态和惯性。既然教师模型的轨迹本身就是连续变化的,为什么我们不直接去建模这种 “变化规律”,而不是强行把它改成直线呢?

如果我们能找到一种参数化方法,能够描述这种 “弯曲” 的趋势,那么学生模型就不需要费力去把路拉直,而是可以顺着教师的势能,用极少的步数 “滑” 向终点。

基于这个核心洞察,ArcFlow 诞生了。



三、 ArcFlow 的三大杀手锏



1. 动量参数化(Momentum Parameterization):给生成过程加个 “惯性”

为了捕捉上述的 “速度连续性”,ArcFlow 引入了物理学中经典的 “动量”(Momentum)概念。

在传统方法中,模型在每个时间步独立预测速度。而在 ArcFlow 中,我们将速度场建模为多个连续动量过程的混合。通俗来说,模型不仅预测当前的 “速度”,还预测了一个 “动量因子”(Momentum Factor)。这个因子描述了速度随时间衰减或增强的趋势。这就好比我们知道了物体的初速度和受力情况(动量),哪怕不看中间过程,我们也能通过物理公式直接预判它未来的轨迹是弯曲的还是笔直的。

这一设计让 ArcFlow 能够地构建非线性轨迹。在 2-4 步的极少步数下,这种非线性轨迹比生硬的直线能更精确地贴合教师模型的原始路径。

2. 解析求解器(Analytic Solver):数学层面的 “零误差”

既然已经用 “动量公式” 完美定义了速度随时间的演变规律,那么这条轨迹的积分就是可解析的

也就是说,我们可以推导出一个闭式解(Closed-form Solution)。

这意味着,ArcFlow 不需要像传统求解器那样通过离散步去拟合轨迹。它只需要一次前向传播,就能通过数学公式,精确无误地计算出任意时间间隔后的终端状态。

这种数学层面上的 “零误差” 积分,是 ArcFlow 能够实现高精度流匹配的关键。它消除了传统蒸馏方法中的离散化噪声,让生成的图像细节清晰。

3. 极简训练策略:<5% 参数的 LoRA 微调

这是最让开发者兴奋的一点。

正如前文所说,传统方法因为要 “强行拉直” 轨迹,不得不重写整个模型的参数。而 ArcFlow 选择 “顺势而为”,它的非线性轨迹天然契合教师模型的预训练分布。

因此,ArcFlow 不需要破坏教师模型原本的参数。实验证明,仅需通过 LoRA 微调不到 5% 的参数(主要是为了适应新的动量预测头),就能实现完美的轨迹对齐。

这种策略带来了两大红利:

  • 训练收敛极快:相比 TwinFlow 等全量微调方法,ArcFlow 的收敛速度快了超过 4 倍
  • 保留教师先验:最大程度继承了 FLUX/Qwen 原本庞大的知识库,不像其他蒸馏模型那样容易出现崩坏或画质劣化。

四、 实验数据

团队在Qwen-Image-20BFLUX.1-dev这两个目前最强的开源模型上进行了验证。结果表明,ArcFlow 在速度、质量和效率上实现了的平衡。

1. 推理速度

从原始的 50-100 步迭代,直接压缩至2 步(2 NFE)。在相同硬件上,实现了超过 40 倍加速。

2. 画质表现

在 Geneval、DPG-Bench 等基准测试中,ArcFlow 在 2 步设定下的 FID 和语义一致性得分大部分优于或持平目前的 SOTA 方法。





视觉对比:

从论文展示的效果图来看,在同样的 2 步推理下,其他线性蒸馏方法生成的图像容易出现背景模糊、物体结构扭曲(如折断 / 重影的剑、模糊的背景),尤其是在不同的初始噪声下,其他方法容易出现生成模式相似、多样性坍缩的情况。而 ArcFlow 生成的图像不仅清晰度高,而且保留了教师模型原本的丰富细节和画面多样性。



3. 训练效率

得益于更精准的轨迹拟合和 LoRA 策略,ArcFlow 的训练曲线令人赏心悦目。在相同迭代步数下,ArcFlow 的 FID 分数和画面质量大幅领先。对于没有大规模算力的实验室或个人开发者来说,这大大降低了复现和定制的门槛。





4. 更多效果展示







五、 总结

ArcFlow 提出了一种新的少步蒸馏的解决思路:相较于 “把曲线拉直” 的 “蛮力”,不如顺应原本的模型特征空间,用参数去描述其复杂性。通过动量参数化解析求解器,ArcFlow 避免了不稳定的对抗性目标函数和全参数训练,从而实现了更快的收敛速度和更高效的蒸馏过程。这为未来的高效生成模型研究提供了一个极具潜力的方向。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
事态升级!三亚海鲜商户集体愤怒,官方协会发声,游客仍有条退路

事态升级!三亚海鲜商户集体愤怒,官方协会发声,游客仍有条退路

观察鉴娱
2026-05-10 09:44:36
对于明天周一后A股,我仅说三句话:第一,4200点绝对不是最高点!

对于明天周一后A股,我仅说三句话:第一,4200点绝对不是最高点!

趋势清风侠
2026-05-10 17:45:09
一季度全国结婚登记169.7万对

一季度全国结婚登记169.7万对

第一财经资讯
2026-05-10 10:17:17
国家反诈平台竟成“内鬼”捞钱工具,最坚固的盾,成了最利的刀?

国家反诈平台竟成“内鬼”捞钱工具,最坚固的盾,成了最利的刀?

迷世书童H9527
2026-05-10 10:10:43
大快人心!中国民航新规出炉:日本航空过境中国好日子即将到头!

大快人心!中国民航新规出炉:日本航空过境中国好日子即将到头!

影像温度
2026-05-09 10:27:26
一定要多存钱,大量存钱,特别是2026-2028年。

一定要多存钱,大量存钱,特别是2026-2028年。

老陆不老
2026-05-10 15:37:02
第1现场|俄乌对峙下的红场阅兵:36年来首次未见坦克

第1现场|俄乌对峙下的红场阅兵:36年来首次未见坦克

澎湃新闻
2026-05-09 21:40:28
他活埋近5000红军,逃往国外安享晚年,如今国内竟还有人纪念他!

他活埋近5000红军,逃往国外安享晚年,如今国内竟还有人纪念他!

兴趣知识
2026-05-08 00:23:54
连续潜航超14天 中国造的“麒麟”级潜艇有多厉害?

连续潜航超14天 中国造的“麒麟”级潜艇有多厉害?

环球网资讯
2026-05-10 13:18:11
“你要收费我就卸载”,全网最离不开的AI不装了,口碑大反转

“你要收费我就卸载”,全网最离不开的AI不装了,口碑大反转

果壳
2026-05-09 12:33:57
男子为寻求“刺激”,深夜潜入留守妇女家,2020年十多人被其糟蹋

男子为寻求“刺激”,深夜潜入留守妇女家,2020年十多人被其糟蹋

汉史趣闻
2026-05-10 16:38:24
今晚2.5亿股民要超级兴奋了

今晚2.5亿股民要超级兴奋了

风风顺
2026-05-10 07:12:13
皇马武斗细节曝光:巴尔韦德3次恶铲,欲废楚阿梅尼

皇马武斗细节曝光:巴尔韦德3次恶铲,欲废楚阿梅尼

体坛周报
2026-05-10 15:57:53
史诗级合作!英伟达联手康宁光连接扩产 10倍 5大供应商直接起飞

史诗级合作!英伟达联手康宁光连接扩产 10倍 5大供应商直接起飞

元芳说投资
2026-05-10 06:20:08
河南37岁单亲妈妈与男子网恋遭遇“杀猪盘”,诱惑投资“伦敦金”被骗53万元,事发前在股市赚了七八万

河南37岁单亲妈妈与男子网恋遭遇“杀猪盘”,诱惑投资“伦敦金”被骗53万元,事发前在股市赚了七八万

极目新闻
2026-05-10 20:05:26
想不到的广东:全国最富的省份,7成城市却在平均线以下

想不到的广东:全国最富的省份,7成城市却在平均线以下

风向观察
2026-05-10 19:34:45
普京称俄乌冲突即将结束

普京称俄乌冲突即将结束

每日经济新闻
2026-05-10 09:23:00
母亲节小玥儿为大S和光头的合照点赞,好友列表曝光,没有后妈

母亲节小玥儿为大S和光头的合照点赞,好友列表曝光,没有后妈

魔都姐姐杂谈
2026-05-10 17:01:35
戴安斯抵京后,开口就提出硬性要求,王毅斩钉截铁,对美反将一军

戴安斯抵京后,开口就提出硬性要求,王毅斩钉截铁,对美反将一军

悦心知足
2026-05-09 16:09:34
套路一模一样!2026 年汉坦病毒刚露头,西方又准备好了老剧本

套路一模一样!2026 年汉坦病毒刚露头,西方又准备好了老剧本

魔都姐姐杂谈
2026-05-09 20:58:28
2026-05-10 20:56:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12957文章数 142647关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

罕见一幕 韩国总统、国会议长、执政党党首同日飙泪

头条要闻

罕见一幕 韩国总统、国会议长、执政党党首同日飙泪

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

大S女儿玥儿开通账号,用烟花缅怀母亲

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

亲子
教育
手机
家居
数码

亲子要闻

深圳龙岗区被正式认定为“全国学前教育普及普惠区”

教育要闻

比考上985更稳的路径?这个国家战略新专业,毕业直通央企核心岗

手机要闻

澎湃OS 4被曝六月见!彻底清除MIUI代码、底层重塑!

家居要闻

菁英人居 全能豪宅

数码要闻

微软Win11 Xbox模式实测:英伟达、AMD显卡游戏性能均获提升

无障碍浏览 进入关怀版