网易首页 > 网易号 > 正文 申请入驻

FeRA:基于「频域能量」动态路由,打破扩散模型微调的静态瓶颈

0
分享至



尹博:NUS 计算机工程硕士生、LV Lab 实习生,研究方向是生成式 AI,及参数高效率微调(PEFT)。

胡晓彬:NUS LV Lab Senior Research Fellow, 研究方向是生成式 AI,MLLM Agent 等。

在大模型时代,参数高效微调(PEFT) 已成为将 Stable Diffusion、Flux 等大规模扩散模型迁移至下游任务的标准范式。从 LoRA 到 DoRA,社区不断探索如何用更少的参数实现更好的适配。

然而,现有的微调方法(如 LoRA、AdaLoRA)大多采用「静态」策略:无论模型处于去噪过程的哪个阶段,适配器(Adapter)的参数都是固定不变的。这种「一刀切」的方式忽略了扩散生成过程内在的时序物理规律,导致模型在处理复杂结构与精细纹理时往往顾此失彼。

针对上述问题,新加坡国立大学 LV Lab(颜水成团队) 联合电子科技大学、浙江大学等机构提出 FeRA (Frequency-Energy Constrained Routing) 框架:首次从频域能量的第一性原理出发,揭示了扩散去噪过程具有显著的「低频到高频」演变规律,并据此设计了动态路由机制。

FeRA 摒弃了传统的静态微调思路,通过实时感知潜空间(Latent Space)的频域能量分布,动态调度不同的专家模块。实验结果显示,FeRA 在 SD 1.5、SDXL、Flux.1 等多个主流底座上,于风格迁移和主体定制任务中均实现了远超 baseline 的生成质量。



  • 论文地址: https://arxiv.org/abs/2511.17979
  • 项目主页: https://github.com/YinBo0927/FeRA

研究背景:静态微调与动态生成的错配

扩散生成的「频域时序性」

扩散模型的去噪过程(Denoising Process)本质上是一个从无序到有序的物理演变。研究团队通过对中间层特征的频谱分析发现,这一过程并非各向同性,而是具有鲜明的阶段性特征:

  • 生成初期(高噪声):模型主要致力于恢复图像的低频能量(如整体构图、轮廓)。
  • 生成后期(低噪声):重心逐渐转移至高频能量(如纹理、边缘细节)。

现有方法的局限

然而,LoRA 等主流 PEFT 方法在所有时间步(Timestep)上应用相同的低秩矩阵。这意味着,负责「画轮廓」的参数和负责「描细节」的参数是完全耦合的。这种目标错配(Misalignment)导致了计算资源的浪费:模型不得不在有限的参数空间内权衡结构与细节,往往导致生成的图像要么结构崩坏,要么纹理模糊。

因此,设计一种能够感知当前生成阶段,并「按需分配」算力的动态微调机制,成为突破性能瓶颈的关键。





方法介绍:FeRA 框架

为了解决上述痛点,研究团队提出了 FeRA (Frequency-Energy Constrained Routing)。该框架包含三个核心组件,形成了一个感知 - 决策 - 优化的闭环:

频域能量指示器 (Frequency-Energy Indicator, FEI)

这是 FeRA 的「眼睛」,不同于以往方法仅依赖离散的时间步(Timestep)作为条件,FeRA 利用 高斯差分 (Difference-of-Gaussians, DoG) 算子,在潜空间直接提取特征的频域能量分布。

  • 它将特征分解为多个频带。
  • 实时计算各频带的归一化能量值,形成一个连续的、物理可解释的能量向量。

软频域路由器 (Soft Frequency Router)

这是 FeRA 的「大脑」,基于 FEI 提供的能量信号,路由器通过一个轻量级网络动态计算不同LoRA 专家 (Experts)的权重。

  • 低频主导时:系统自动激活擅长结构生成的专家分支。
  • 高频主导时:平滑过渡到擅长纹理细节的专家分支。 这种机制实现了参数的解耦,让不同的专家专注于其擅长的频域范围。

频域能量一致性正则化 (FECL)

这是 FeRA 的「稳定器」,为了防止微调过程偏离原本的生成轨迹,团队引入了FECL (Frequency-Energy Consistency Loss)。该损失函数强制要求:LoRA 产生的参数更新量(Update),其在频域上的能量分布必须与模型原本的残差误差(Residual Error)保持一致。这确保了微调过程「指哪打哪」,极大地提升了训练稳定性。



实验验证:从风格迁移到主体定制

研究团队在Stable Diffusion 1.5、2.0、3.0、SDXL以及最新的FLUX.1等多个主流底座上进行了广泛测试 。实验涵盖了风格迁移(Style Adaptation)和主体定制(DreamBooth)两大任务。

风格迁移:FID 与 CLIP 的双赢

在 Cyberpunk, Watercolor 等多种风格数据集上,FeRA 在FID(图像质量) 、CLIP Score(语义对齐)和 Style(MLLM 评分)上均取得了最优或次优的成绩。





主体定制:更懂你的 Prompt

在 DreamBooth 任务(如让特定的狗游泳、让特定的茶壶放在草地上)中,FeRA 展示了惊人的文本可控性。

  • 痛点解决:传统方法容易过拟合主体(Identity),导致无法响应新的背景提示词(Prompt)。
  • FeRA 表现:在 CLIP-T(文本对齐度)指标上,FeRA 显著优于 DoRA 和 AdaLoRA 。这意味着它不仅记住了「这只狗」,还能听懂指挥让它「去游泳」。





总结

总的来看,目前的扩散模型微调仍以静态参数叠加为主,在处理复杂的多频段信息时存在天然瓶颈。

LV Lab 颜水成团队 提出的 FeRA 框架,通过引入频域第一性原理,将微调从「参数层面的分解」推进到了「机制层面的对齐」。FeRA 证明了:顺应生成过程的物理规律,利用频域能量进行动态路由,是实现高效、高质量微调的关键路径。

这一工作不仅刷新了各项 SOTA 指标,更为未来扩散模型在视频生成、3D 生成等更复杂任务中的微调提供了极具价值的新思路。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
6000亿杭州联合银行,空降48岁女行长

6000亿杭州联合银行,空降48岁女行长

财经众议院
2026-05-13 17:16:18
陈宝国自曝:拍大宅门时,何赛飞不问青红皂白,直接给我一嘴巴子

陈宝国自曝:拍大宅门时,何赛飞不问青红皂白,直接给我一嘴巴子

她时尚丫
2026-05-12 23:32:24
中印局势升温!残酷现实曝光:中国越是退让,印度对抗得越强硬

中印局势升温!残酷现实曝光:中国越是退让,印度对抗得越强硬

杰丝聊古今
2026-05-14 14:24:47
深圳北回福田建议直接坐高铁,网友对,随便上节车厢很快就到了

深圳北回福田建议直接坐高铁,网友对,随便上节车厢很快就到了

一口娱乐
2026-05-14 11:52:08
英伟达宣布黄仁勋随特朗普访华,最后一刻如何加入?

英伟达宣布黄仁勋随特朗普访华,最后一刻如何加入?

红星新闻
2026-05-13 11:47:14
A股三大股指集体收跌超1.5%,航运、猪肉等板块逆势走强

A股三大股指集体收跌超1.5%,航运、猪肉等板块逆势走强

澎湃新闻
2026-05-14 15:22:27
骑士3-2活塞!米切尔直言不讳,坎宁安谈裁判认清现实,哈登摊牌

骑士3-2活塞!米切尔直言不讳,坎宁安谈裁判认清现实,哈登摊牌

鱼崖大话篮球
2026-05-14 13:04:06
国际逮捕令生效!菲律宾高官栽了,5名议员联手施压:赶紧自首吧

国际逮捕令生效!菲律宾高官栽了,5名议员联手施压:赶紧自首吧

兰妮搞笑分享
2026-05-14 11:56:29
拍三级片赚了几千万,被前妻骗光房产,77岁曹查理在东莞租房养老

拍三级片赚了几千万,被前妻骗光房产,77岁曹查理在东莞租房养老

得得电影
2026-05-14 09:36:44
回顾:缅北女魔头魏榕嗜好!经常“活剥驴耳”,3个闺蜜喜欢观刑

回顾:缅北女魔头魏榕嗜好!经常“活剥驴耳”,3个闺蜜喜欢观刑

飞云如水
2024-11-13 06:54:13
中美谈妥,贝森特握紧中方的手,新的情况发生,外资加仓中国资产

中美谈妥,贝森特握紧中方的手,新的情况发生,外资加仓中国资产

一善一待
2026-05-14 13:26:33
一枚纽扣,挖出潜伏在总参大院十年的国民党王牌特工

一枚纽扣,挖出潜伏在总参大院十年的国民党王牌特工

老范谈史
2026-05-08 02:36:29
广东淘汰第3天,离队首人曝光杜锋拥抱告别,焦泊乔去留谜底揭晓

广东淘汰第3天,离队首人曝光杜锋拥抱告别,焦泊乔去留谜底揭晓

二哥聊球
2026-05-14 11:07:28
真相炸裂!宗庆后3个私生子并非同一母亲,小儿子是别墅管家所生

真相炸裂!宗庆后3个私生子并非同一母亲,小儿子是别墅管家所生

派大星纪录片
2025-07-15 13:28:11
赶紧扔掉!这5种“厨房神器”危害很大,你家厨房可能也有

赶紧扔掉!这5种“厨房神器”危害很大,你家厨房可能也有

Home范
2026-05-03 16:50:03
1950年我军抓获女匪首,她袖口补丁藏着的布条,老政委看后摔茶缸

1950年我军抓获女匪首,她袖口补丁藏着的布条,老政委看后摔茶缸

磊子讲史
2026-03-18 11:38:06
开国十大元帅的另类排名:在党的七大中央委员会的排名

开国十大元帅的另类排名:在党的七大中央委员会的排名

阿器谈史
2026-05-04 14:19:29
32岁女生自述得艾滋病过程,原因是见了一次网友,如今十分后悔

32岁女生自述得艾滋病过程,原因是见了一次网友,如今十分后悔

千秋文化
2026-03-29 20:59:49
中印冲突全面升级:中国避让换来印度强硬对抗

中印冲突全面升级:中国避让换来印度强硬对抗

张鴘喜欢软软糯糯
2026-05-12 16:53:24
回顾:2005年梁海玲器官被切后惨死豪宅,有人透露:她知道的太多

回顾:2005年梁海玲器官被切后惨死豪宅,有人透露:她知道的太多

历来都很现实
2024-09-24 23:58:16
2026-05-14 16:04:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12995文章数 142648关注度
往期回顾 全部

科技要闻

马斯克说会谈很顺利 黄仁勋点赞 库克比耶

头条要闻

男子称火车站走错口遭安检员追打 被认定互殴各拘5天

头条要闻

男子称火车站走错口遭安检员追打 被认定互殴各拘5天

体育要闻

登海报!哈登30+8+6创多项纪录 第8次赢天王山

娱乐要闻

肖战提名金海燕奖,这一步走得太稳

财经要闻

习近平同美国总统特朗普会谈

汽车要闻

云辇-P Ultra降维打击!三轮也能越野?方程豹豹8/豹5闪充版30.58万起

态度原创

家居
房产
手机
数码
军事航空

家居要闻

精神奢享 对话塔尖需求

房产要闻

海南楼市新政要出!拟调公积金贷款额度,最高可贷168万!

手机要闻

联发科官宣与iQOO开展了双方史上最深度技术合作

数码要闻

Keychron J5 Ultra 8K三模机械键盘预售,390元

军事要闻

美以伊战争期间以总理密访阿联酋

无障碍浏览 进入关怀版