网易首页 > 网易号 > 正文 申请入驻

NeurIPS 2025 Spotlight | 中国联通以全局优化重塑扩散模型加速

0
分享至



作者和团队介绍:本文一作是高焕霖和陈平,通讯作者为赵放和廉士国,其他作者还包括石芙源、谭超、刘兆祥、王恺,所有作者均来自联通数据智能有限公司(联通数据科学与人工智能研究院)元景大模型研发团队。

当前,视频生成模型性能正在快速提升,尤其是基于Transformer架构的DiT模型,在视频生成领域的表现已经逐渐接近真实拍摄效果。然而,这些扩散模型也面临一个共同的瓶颈:推理时间长、算力成本高、生成速度难以提升。随着视频生成长度持续增加、分辨率不断提高,这个瓶颈正在成为影响视频创作体验的主要障碍之一。

来自中国联通数据科学与人工智能研究院的研究团队提出了一个全新的思路 :LeMiCa(Lexicographic Minimax Path Caching)——一种无需训练、全局最优建模的缓存加速框架,能在保持画质与一致性的同时,实现高效的推理加速。LeMiCa解决的是一个长期被“局部贪心决策”束缚的老问题:扩散模型是否存在一种真正“全局一致、误差可控、速度极快”的缓存加速路径?研究答案是:有。并且比想象中简单得多。

这项研究已经成功入选 NeurIPS 2025 Spotlight。



论文标题:

LeMiCa: Lexicographic Minimax Path Caching for Efficient Diffusion-Based Video Generation

论文链接:

https://arxiv.org/abs/2511.00090

项目主页:

https://unicomai.github.io/LeMiCa

代码地址:

https://github.com/UnicomAI/LeMiCa

核心亮点:

LeMiCa 如何做到“又快又稳”?

当前主流的缓存加速方法(如TeaCache)采用了“局部贪心”策略:如果相邻时间步之间的变化很小,就选择复用缓存。然而,这种“走一步看一步”的策略忽视了扩散模型的重要特性——早期步骤对生成结果有较高的敏感性,微小的误差可能在后期被不断放大,影响最终画质。同时,许多现有方法需要引入在线判别机制,这会引入额外的计算负担,使得生成过程依然缓慢。

LeMiCa的核心思想是:

“缓存加速并不是局部决策问题,而是一个全局路径优化问题。”

研究团队发现,扩散模型的生成过程其实可以抽象成一个带权有向无环图(DAG) 。每个节点代表一个时间步,每条边代表在两个时间步之间“跳过计算、复用缓存”的行为,边的权重则对应缓存导致的全局误差。这样,缓存策略可以很自然的转化为在DAG中搜索最优路径的问题。



LeMiCa技术实现:从误差建模到图优化

为了准确评估缓存的影响,LeMiCa提出了一种全新的误差度量方法,通过离线构建静态DAG来量化缓存对最终生成视频结果的影响。DAG的构成部分主要有:1)节点:每个时间步;2)边:可能的缓存区间;3)边权重:缓存-复用引发的全局重建误差。具体来说,对于DAG中节点i到j的边权被定义为:



在图构建过程中,我们会对每个时间步进行节点抽象。DAG中的每一条边代表在时间步i到j之间跳过若干步计算、直接复用缓存的行为。为避免图过于庞大,LeMiCa依据“距离越长,缓存误差越大”的先验知识,设置了最大跳跃长度,从而只保留合理的缓存段以减少搜索复杂度。最终,为了保证鲁棒性和泛化性,LeMiCa仅使用少量样本(prompt和seed)离线生成多个DAG并进行融合,最终得到一个静态的、跨任务可复用的全局误差图。

字典序极小化路径优化(Lexicographic Minimax Path):在构建好静态误差图之后,LeMiCa 将缓存调度问题形式化为:在固定预算 B 下,从起点到终点寻找一条最优路径。由于传统的“最短路径”或“局部最优”算法不具备线性可加性,导致最短路径算法不再适用,LeMiCa采用了字典序极小化准则来进行路径搜索。这种优化方式不追求误差总和最小,而是逐层比较路径中各段缓存的误差值,确保:

  • 最大误差被最小化(避免单段灾难性退化)
  • 误差分布更均衡(提升全局一致性)

形式化定义如下:



通过字典序比较,LeMiCa避免了“看似整体误差低但中间崩坏”的路径:

若路径A的最大误差 < 路径B的最大误差 → A 更优
若最大误差相同 → 比较第二大依次类推

实验结果:加速与画质兼得

联通元景大模型研究团队在多个主流视频生成模型中验证了LeMiCa的性能。从结果中可以看到该方法在保留加速前后的视觉一致性具有显著优势,这也正是全局路径视角下的图优化所带来的增益。



从视觉效果上看,LeMiCa生成的视频在结构风格保持、内容一致性方面都显著提升。



即使在高倍加速推理下,也几乎看不出明显退化。



从结果中可以看出,LeMiCa对比其他主流方法,存在以下明显优势:

  1. 极佳的生成效果:结构、纹理和内容一致性全面提升;
  2. 优秀的加速性能:提供2.4×以上的高倍加速推理;

消融实验:

少样本建图,高鲁棒性,场景扩展能力

极少样本建立DAG:LeMiCa仅凭少量样本即可构建高质量缓存路径,单样本已具强性能,20个样本即达到性能饱和,体现了静态缓存策略的高效与稳健。



加速路径的鲁棒性:即使改变采样调度中的轨迹缩放参数得到不同的去噪轨迹,LeMiCa仍有较好的效果,体现了良好的路径鲁棒性。



文生图模型兼容:由于LeMiCa本质上是一个用于扩散模型缓存加速的框架,因此其也适用于文生图模型。我们拿最新的QWen-Image模型进行了实验,得到了同样出色的加速效果:



业界顶级团队推荐

LeMiCa得到了顶级多模态模型研发团队阿里通义千问智谱AI的认可,分别在其官方主页上对LeMiCa进行权威推荐!









总结与展望

LeMiCa以全局优化视角重新定义了扩散视频生成的加速问题。它突破了传统“局部贪心”式缓存策略的局限,将缓存调度建模为有向无环图(DAG)上的全局路径搜索问题。作为一种通用的免训练加速框架,LeMiCa为视频生成带来了“又快又稳”的新范式,联通元景大模型团队希望以此为基石,为业界关于扩散模型的加速和复杂场景生成提供新的思考角度。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
村书记135万接盘集体厂,儿子资本运作套现13亿,全家狂捞17亿

村书记135万接盘集体厂,儿子资本运作套现13亿,全家狂捞17亿

复转这些年
2026-01-14 22:37:51
巴特勒右膝韧带撕裂赛季报销,既是勇士的天灾、也是人祸

巴特勒右膝韧带撕裂赛季报销,既是勇士的天灾、也是人祸

富贵体坛说
2026-01-21 00:10:41
50岁李湘的英伦生活,背后竟藏着不为人知的代价!

50岁李湘的英伦生活,背后竟藏着不为人知的代价!

特约前排观众
2026-01-21 00:05:11
好险!双色球009期:3同尾号助三等奖爆2291注,有人差点清空奖池

好险!双色球009期:3同尾号助三等奖爆2291注,有人差点清空奖池

芭比衣橱
2026-01-21 03:45:19
历史首进决赛,霸榜热搜!中国队一夜创下8大纪录,对手+时间确定

历史首进决赛,霸榜热搜!中国队一夜创下8大纪录,对手+时间确定

侃球熊弟
2026-01-21 02:56:46
记者:方昊在薪资上做出不小的牺牲,也给国安留下了转会费

记者:方昊在薪资上做出不小的牺牲,也给国安留下了转会费

懂球帝
2026-01-20 12:41:28
为什么抖音阿里美团,都动不了携程的垄断地位?

为什么抖音阿里美团,都动不了携程的垄断地位?

25号观察员
2026-01-20 17:46:59
感人!王博豪今晚5镜头太拼了:不愧U23国足唯一留洋球员

感人!王博豪今晚5镜头太拼了:不愧U23国足唯一留洋球员

邱泽云
2026-01-21 02:46:57
快船大败:前10之梦破碎,哈登纪录危矣!

快船大败:前10之梦破碎,哈登纪录危矣!

麦咪熊熊
2026-01-21 00:50:06
摩尔多瓦启动退出独联体法律程序

摩尔多瓦启动退出独联体法律程序

财联社
2026-01-20 05:14:05
1.21股市早8点丨降温容易再涨难·美股又出幺蛾子

1.21股市早8点丨降温容易再涨难·美股又出幺蛾子

沙黾农
2026-01-21 06:21:56
川普:英国“极度愚蠢”;马克龙:我不理解

川普:英国“极度愚蠢”;马克龙:我不理解

寰宇大观察
2026-01-20 16:16:27
警方通报:王某(女,35岁)冒充陕西省领导,称能办理公务员入职,受害人被骗424万元

警方通报:王某(女,35岁)冒充陕西省领导,称能办理公务员入职,受害人被骗424万元

极目新闻
2026-01-20 20:59:34
闷声干大事!汪小菲掌握实证,S妈主动示好和谈,堡垒要打破了

闷声干大事!汪小菲掌握实证,S妈主动示好和谈,堡垒要打破了

前行之路
2026-01-19 09:45:54
冬窗重磅!强援主动求投曼联,两个无解难题成死结

冬窗重磅!强援主动求投曼联,两个无解难题成死结

奶盖熊本熊
2026-01-21 04:01:16
一楼拒交电梯费被告上法庭,败诉后,这张缴费单成了整栋楼的噩梦

一楼拒交电梯费被告上法庭,败诉后,这张缴费单成了整栋楼的噩梦

垛垛糖
2026-01-17 20:25:21
蒙哥马利有多痴情?对寡妇贝蒂一见钟情,甘愿做她两个孩子的继父

蒙哥马利有多痴情?对寡妇贝蒂一见钟情,甘愿做她两个孩子的继父

饭小妹说历史
2026-01-17 09:12:37
只差1票!生涯最强的爱德华兹,全明星首发最大遗珠?

只差1票!生涯最强的爱德华兹,全明星首发最大遗珠?

篮球实录
2026-01-20 23:14:35
10秒!美国发明革命性人体三维全景成像!

10秒!美国发明革命性人体三维全景成像!

徐德文科学频道
2026-01-19 18:56:23
现场记者集体鼓掌!53岁安东尼奥站桌上怒吼:5战封神 玩弄越南队

现场记者集体鼓掌!53岁安东尼奥站桌上怒吼:5战封神 玩弄越南队

风过乡
2026-01-21 06:05:59
2026-01-21 08:12:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12155文章数 142547关注度
往期回顾 全部

科技要闻

走进车间,感受中国低轨卫星互联网“加速度”

头条要闻

加拿大总理:一些大国将经济一体化作为"武器"来使用

头条要闻

加拿大总理:一些大国将经济一体化作为"武器"来使用

体育要闻

勇士遭暴击!巴特勒重伤赛季报销

娱乐要闻

网红版闫学晶!600万粉博主阿爆翻车

财经要闻

李迅雷:2026买房不如租房

汽车要闻

奇瑞张贵兵:墨甲不做秀技术的企业 只做痛点终结者

态度原创

游戏
房产
旅游
时尚
数码

1月XGP新增游戏公布!《死亡搁浅导剪版》等10款

房产要闻

中旅・三亚蓝湾发布会揭秘自贸港好房子高阶形态

旅游要闻

突然火了!浙江一景区惊现奇观

冬季不臃肿穿搭指南来了,奔五奔六照着穿,拿捏温暖与高级感

数码要闻

索尼分拆电视业务将与TCL组建合资公司

无障碍浏览 进入关怀版