网易首页 > 网易号 > 正文 申请入驻

南大、TeleAI推出全新AI生成范式MMPL,让创意一镜到底

0
分享至



向迅之,南京大学 R&L 课题组在读博士生,导师是范琦副教授。研究聚焦图像/视频生成与世界模型等 AIGC 方向。

你是否曾被 AI 生成视频的惊艳开场所吸引,却在几秒后失望于⾊彩漂移、画面模糊、节奏断裂? 当前 AI 长视频⽣成普遍⾯临 “高开低走 ” 的困境:前几秒惊艳夺⽬ ,之后却质量骤降、细节崩坏;更别提帧间串行生成导致的低效问题 —— 动辄数小时的等待,实时预览几乎难以企及。

这—行业难题,如今迎来突破性解法!

南京大学联合 TeleAI 推出长视频自回归生成新范式——Macro-from-Micro Planning( MMPL),重新定义 AI 视频创作流程。

灵感源自电影工业的 “分镜脚本 + 多组并行拍摄” 机制,MMPL 首创 “宏观规划、微观执行 ” 的双层⽣成架构:

  • 先谋全局:在宏观层面统—规划整段视频的叙事脉络与视觉—致性,确保剧情连贯、风格统—;
  • 再精细节:将长视频拆解为多个短片段,并通过并行化⽣成管线⾼效填充每—帧细节,大幅提升速度与稳定性。

成果令人振奋:

  • 实现分钟级⾼质量长视频稳定生成,告别 “虎头蛇尾”;
  • ⽣成效率显著提升,结合蒸馏加速技术,预览帧率最高可达约 32 FPS ,接近实时交互体验;
  • 在色彩—致性、 内容连贯性上全⾯超越传统串行生成方案。

MMPL 不仅是—项技术升级,更是向 “AI 导演” 迈进的重要—步 —— 让机器不仅会 “拍镜头” ,更能 “讲好—个故事”。



  • 论文标题:Macro-from-Micro Planning for High-Quality and Parallelized Autoregressive Long Video Generation
  • 作者:Xunzhi Xiang, Yabo Chen, Guiyu Zhang, Zhongyu Wang, Zhe Gao, Quanming Xiang, Gonghu Shang, Junqi Liu, Haibin Huang, Yang Gao, Chi Zhang, Qi Fan, Xuelong Li
  • 机构 :南京大学;中国电信人工智能研究院;上海交通大学;香港中文大学(深圳);中国科学院大学
  • 论⽂地址:https://arxiv.org/abs/2508.03334
  • 项⽬主页:https://nju-xunzhixiang.github.io/Anchor-Forcing-Page/



传统困境:逐帧⽣成的两大瓶颈

在长视频生成领域,随着时长从几秒扩展到数十秒甚至一分钟以上,主流自回归模型面临两个根本性挑战:

1. 时域漂移(Temporal Drift)

由于每—帧都依赖前—帧生成,微小误差会随时间不断累积,导致画面逐渐 “跑偏”:人物变形、场景错乱、色彩失真等问题频发,严重影响视觉质量。

2. 串⾏瓶颈(Serial Bottleneck)

视频必须逐帧⽣成,⽆法并⾏处理。⽣成 60 秒视频可能需要数分钟乃⾄数⼩时,难以⽀持实时预览或交互式创作。

这些问题使得当前 AI 视频仍停留在 “ 片段级表达” ,难以胜任需要长时连贯性的叙事任务。

创新突破:导演式双层生成框架 MMPL

为解决上述问题,我们提出 Macro-from-Micro Planning( MMPL) —— — 种 “先规划、后填充” 的两阶段生成范式,其核心思想是:

先全局规划,再并行执行。

这—理念借鉴了电影工业中 “导演制定分镜脚本 + 多摄制组并行拍摄” 的协作模式,将长视频生成从 “接龙式绘画” 转变为 “系统性制片 ”。

MMPL 的核心优势在于实现了三大突破:

  • 长时⼀致性:通过宏观规划抑制跨片段漂移;
  • 高效并行性:各片段可独立填充细节,支持多 GPU 并行;
  • 灵活调度性:采用流水线机制,进—步提升资源利用率。

最终,系统可在保证高质量的前提下,实现分钟级、节奏可控的稳定⽣成,结合蒸馏加速方案,预览速度可达 ≥32 FPS ,接近实时交互体验。

效果呈现:更稳、更长 、更快

在统—测试集上,MMPL 显著优于现有方法(如 MAGI 、SkyReels 、CausVid 、Self Foricng 等),在视觉质量、时间—致性和稳定性方面均取得领先。

  • 更稳:无明显色彩漂移、 闪烁或结构崩坏,长时间生成仍保持高保真;
  • 更长: 支持 20 秒、30 秒乃至 1 分钟的连贯叙事,片段衔接自然;
  • 更快:得益于并行填充与自适应调度,长视频生成整体吞吐量大幅提升。

技术解析:两阶段协同工作机制

MMPL 的成功源于其精心设计的 “规划 — 填充” 双阶段架构。整个流程分为两个层次:微观规划( Micro Planning) 和宏观规划( Macro Planning),随后进行并行内容填充(Content Populating)。

第⼀阶段:双层规划,构建稳定骨架



1. Micro Planning: 片段内关键帧联合预测





这些锚点在同—去噪过程中联合生成,彼此之间语义协调、运动连贯;且均以首帧为条件单步预测,避免了多步累积误差。它们共同构成了该片段的 “视觉骨架” ,为后续填充提供强约束。

2. Macro Planning:跨片段叙事⼀致性建模





这种 “分段稀疏连接” 的设计,将误差累积从 T 帧级别降低至 S 段级别( S ≪ T),从根本上缓解了长程漂移问题。

第二阶段:并行填充,释放计算潜能



1. Content Populating:基于锚点的并行细节生成





这意味着: 多个片段可以同时在不同 GPU 上并行⽣成,极大提升效率。

2. Adaptive Workload Scheduling:动态调度,实现流水线加速

为进—步提升资源利用率,我们引入自适应工作负载调度机制,实现 “规划” 与 “填充” 的重叠执行:

当片段 s 的锚点生成后,即可:

  • 立即启动下—片段 s + 1 的 Micro 计划;
  • 同时,片段 s 自身可提前开始中间帧填充,无需等待全局规划完成。

该机制的形式化表达为:





  • 优势:消除冗余,最大化流水线效率;
  • 缺点:每段计算负载更高。

这两种策略可在内存、延迟与吞吐量之间灵活权衡,适配不同部署场景。

结语:从 “会画” 到 “会拍”,AI 开始有了导演思维

当 AI 不再局限于逐帧生成,而是具备了从整体出发的规划能力 —— 理解情节的推进、协调画面的连贯性、控制运动的节奏,长视频生成便迈出了从 “ 片段拼接” 走向 “统—表达” 的关键—步。我们希望,MMPL 能为视频创作提供—种更稳定、更高效的技术路径。借助其近实时的生成能力,创作者可以在快速反馈中不断调整与完善自己的构想,让创意更自由地流动。

也许真正的 “所见即所得” 尚在远方 ,但至少,我们正朝着那个方向,稳步前行。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
镇江一独栋别墅被推倒欲重建?记者辗转多方核实:该工地无合法手续,目前城管局已介入

镇江一独栋别墅被推倒欲重建?记者辗转多方核实:该工地无合法手续,目前城管局已介入

扬子晚报
2026-01-09 10:48:44
值得珍藏:商业航天+国产算力+机器人+全球第一的企业+6G产业链等

值得珍藏:商业航天+国产算力+机器人+全球第一的企业+6G产业链等

Thurman在昆明
2026-01-08 10:06:36
郑州9岁女孩课堂上写试卷时昏倒去世,家属不忍尸检“她怕疼”,当地成立专班调查

郑州9岁女孩课堂上写试卷时昏倒去世,家属不忍尸检“她怕疼”,当地成立专班调查

大风新闻
2026-01-08 14:41:04
里奇保罗霸气回应詹姆斯交易传闻:手握否决权,湖人敢动他试试?

里奇保罗霸气回应詹姆斯交易传闻:手握否决权,湖人敢动他试试?

夜白侃球
2026-01-08 21:33:33
50岁安吉丽娜·朱莉出售洛杉矶2450万美元豪宅,被曝计划移居,“或为摆脱与前夫布拉德·皮特的纠葛”

50岁安吉丽娜·朱莉出售洛杉矶2450万美元豪宅,被曝计划移居,“或为摆脱与前夫布拉德·皮特的纠葛”

鲁中晨报
2026-01-07 15:57:25
“佛爷迟早卖你” 西蒙尼2次挑衅维尼:6万人前2人互骂 阿隆索气炸

“佛爷迟早卖你” 西蒙尼2次挑衅维尼:6万人前2人互骂 阿隆索气炸

风过乡
2026-01-09 06:15:18
4年5500万!场均轰26+7+7,NBA最失望球队,把重建基石便宜卖掉了

4年5500万!场均轰26+7+7,NBA最失望球队,把重建基石便宜卖掉了

巴叔GO聊体育
2026-01-09 12:09:18
闫学晶好友孙涛再发声:谁要是再敢说闫学晶的坏话,我就跟谁急

闫学晶好友孙涛再发声:谁要是再敢说闫学晶的坏话,我就跟谁急

小徐讲八卦
2026-01-08 09:00:40
带娃上厕所被嫂子网暴后续:宝妈“底裤”被扒,更恶心的还在后面

带娃上厕所被嫂子网暴后续:宝妈“底裤”被扒,更恶心的还在后面

游者走天下
2026-01-07 14:19:47
忍无可忍!篮球专家痛批:直播搬到菜市场,CBA早晚要出事

忍无可忍!篮球专家痛批:直播搬到菜市场,CBA早晚要出事

体育哲人
2026-01-08 12:46:07
0-3!向鹏输球原因曝光,张本智和全程吼叫,赢球庆祝动作太嚣张了!

0-3!向鹏输球原因曝光,张本智和全程吼叫,赢球庆祝动作太嚣张了!

好乒乓
2026-01-09 12:26:43
研究发现他汀类药物与阿尔茨海默病认知能力下降速度减缓相关

研究发现他汀类药物与阿尔茨海默病认知能力下降速度减缓相关

医疗前沿
2026-01-03 01:25:54
韩国人给的太多了!辛纳阿卡空降澳网,一场表演赛各赚200万欧

韩国人给的太多了!辛纳阿卡空降澳网,一场表演赛各赚200万欧

全景体育V
2026-01-09 06:31:56
扬言不上春晚一周后,央媒“点名”岳云鹏,郭德纲的话有人信了

扬言不上春晚一周后,央媒“点名”岳云鹏,郭德纲的话有人信了

好贤观史记
2026-01-09 12:11:06
俄油价暴跌至36美元/桶,川普这盘大棋就是:让你没钱

俄油价暴跌至36美元/桶,川普这盘大棋就是:让你没钱

移光幻影
2026-01-08 17:23:48
很多东西正着不好用,一旦你将它反过来,就会打开新世界大门

很多东西正着不好用,一旦你将它反过来,就会打开新世界大门

新住家居
2025-12-21 18:09:16
0-0!英超争冠3强全刹车:阿森纳领先6分,客场不输曼城=夺冠

0-0!英超争冠3强全刹车:阿森纳领先6分,客场不输曼城=夺冠

体育知多少
2026-01-09 07:17:18
0比3惨案!张本智和遭薛飞横扫,多哈奥运备战拉响警报

0比3惨案!张本智和遭薛飞横扫,多哈奥运备战拉响警报

阿晞体育
2026-01-08 12:44:16
罗德里戈:现在我找到了可以发挥作用的新角色,这样更好

罗德里戈:现在我找到了可以发挥作用的新角色,这样更好

懂球帝
2026-01-09 07:45:44
2026-01-09 13:04:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12082文章数 142532关注度
往期回顾 全部

科技要闻

市场偏爱MiniMax:开盘涨42%,市值超700亿

头条要闻

男子开车撞死1家3口获死缓 14秒速度从0飙至129km/h

头条要闻

男子开车撞死1家3口获死缓 14秒速度从0飙至129km/h

体育要闻

世乒赛银牌得主,说自己梦里都是孙颖莎

娱乐要闻

檀健次恋爱风波越演越烈 上学经历被扒

财经要闻

郁亮的万科35年:从"宝万之争"到"活下去"

汽车要闻

更智能更豪华 乐道L90加配置会贵多少?

态度原创

本地
旅游
手机
公开课
军事航空

本地新闻

云游内蒙|“包”你再来?一座在硬核里酿出诗意的城

旅游要闻

落叶水波相映成画 滕州荆河公园成冬日休闲热地

手机要闻

荣耀Magic8 Pro Air定档1月19日:四色可选,至高1TB存储

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:已开始从委石油资源中赚钱

无障碍浏览 进入关怀版