网易首页 > 网易号 > 正文 申请入驻

北大彭宇新团队提出NS-Diff,使扩散模型学会流体与刚体力学

0
分享至



本文是北京大学彭宇新教授团队在文本生成视频领域的最新研究成果,相关论文已被 CVPR 2026 接收



  • 论文标题:NS-Diff: Fluid Navier–Stokes Guided Video Diffusion via Reinforcement Learning
  • 论文链接:http://39.108.48.32/mipl/download_paper.php?fileId=202601
  • 开源代码:https://github.com/PKU-ICST-MIPL/NS-Diff_CVPR2026
  • 实验室网址:https://www.wict.pku.edu.cn/mipl

背景与动机

想象一下,当你让 AI 生成一段「牛奶倒入咖啡产生丝滑旋涡」的视频时,却发现 AI 根本无法生成出你想要的「丝滑旋涡」。虽然如今的 Sora、Wan 等视频生成模型已经能做出如电影般华丽的画面,但它们往往只是「画皮难画骨」—— 因为 AI 并不真正懂得现实世界的物理定律,导致生成的视频经常出现违背常识的「穿帮」镜头。

在物理世界中,液体的流动遵循着复杂的纳维 - 斯托克斯(Navier-Stokes)方程,而刚体的运动则有着严谨的轨迹规律。实现视频生成从「视觉真实」向「物理真实」的跨越,是当前 AIGC 领域的重大挑战。

针对这一难题,北京大学彭宇新教授团队提出了给扩散模型装上「物理引擎」的新方案 ——NS-Diff。该研究将物理约束与强化学习相结合,通过物理动力学检测器和物理条件注入模块,让 AI 像人类一样在生成画面的同时,脑子里还紧绷着一根「物理定律」的弦。

实验表明,NS-Diff 将视频中的运动急动度(jerk)误差降低了 43%,流体发散度降低了 33%,使 AI 生成的每一帧画面不仅好看,而且遵循物理规律。这一成果表明将经典物理约束融入视频生成大模型,是解决视频生成中物理失真问题的有效途径。

技术方案



图 1. 物理引导的视频生成强化学习框架 NS-Diff

本文提出了一种物理引导的视频生成强化学习框架 NS-Diff,将物理约束融入视频扩散过程中,以提升生成视频的物理真实感。其主要贡献包括:(1)噪声鲁棒的物理动力学检测器:设计了可在含噪潜在帧中精准分析运动信息的检测器,实现对刚体与流体区域的有效区分。(2)物理条件潜在注入模块:将速度场、形变梯度等关键物理信息编码,并通过交叉注意力机制注入 DiT 去噪器,从而实现对生成过程的物理引导。(3)强化学习优化模块:引入强化学习,通过策略梯度对流体施加简化的纳维 - 斯托克斯约束,对刚体施加最小化急动度(Jerk)原则,确保了视频生成中动态过程的物理合理性。具体如下:

1. 噪声鲁棒的物理动力学检测器

实现物理引导去噪的关键在于高噪声环境下对运动和材料属性的精准估计。由于去噪过程在隐空间(latent space)中运行,直接在 RGB 帧上使用 ARFlow 是不可行的。为此,本文设计了一种结合隐空间解码的运动估计方案,具体流程如下:

















2. 物理条件潜在注入









3. 物理引导的强化学习优化















4. 物理引导的自适应激活







实验结果

1. 实验设置

本文在 PhysVideoBench 以及 UCF-101(包含 13,320 个真实世界人类动作视频)和 WebVid-10M(包含 1000 万个带有文本描述的互联网视频)。本文从物理合理性和视觉质量两个角度对本文方法进行评估。

(1)物理指标:



2)视觉指标:

  • VBench:综合视频质量指标。本文遵循 VideoJam 的方法计算视频外观和运动质量。
  • Fréchet Video Distance(FVD):衡量真实视频与生成视频之间的分布距离。
  • Frame Consistency:相邻帧的 CLIP 图像嵌入之间的平均余弦相似度,反映了时间上的连贯性。

2. 对比实验结果



表 1. PhysVideoBench 数据集结果

在 PhysVideoBench 上,NS-Diff 在所有指标上均实现了最佳性能。通过潜空间注入(Latent Injection)以及 Jerk / 散度损失(Jerk/divergence losses)引入物理先验,提升了运动的真实性,尤其是在刚体和流体区域。相比于在给定用户外力情况下模拟刚体动力学的 PhysGen,NS-Diff 在不需要预定义外力或模拟的情况下实现了更好的泛化能力,同时保持了更高的保真度和更低的散度误差。实验表明,本文的方法将 Jerk 误差降低了 43%,流体散度降低了 33%,并使 FVD 提升了 22.7%,实现了更高的物理合理性和视觉质量。



表 2. UCF-101 数据集结果

在 UCF-101 基准测试中,本文的 NS-Diff 模型表现出色。具体而言,NS-Diff DiT 1B 版本的 FVD 为 106,帧一致性(Frame Consistency)达到 0.94;而 NS-Diff DiT 11B 版本则进一步将 FVD 降低至 85,帧一致性提升至 0.95。这表明本文的方法不仅提升了运动的物理准确度,还显著增强了生成视频的时间连贯性。



表 3. WebVid-10M 数据集结果

为了评估物理引导学习框架在受限基准测试之外的开放世界场景中的泛化能力,本文在 WebVid-10M 数据集上进行了文本生成视频(Text-to-Video)合成测试。实验旨在测试物理约束(刚体 / 流体动力学)在面对包含新颖物体交互和环境的未知文本描述时,是否仍能保持合理性。本方法在运动质量(FVD)和文图对齐(CLIPSIM)两个指标上均优于 VideoFactory。



图 2. 可视化对比结果

图 2 展示了 NS-Diff 与 ModelScope、PhysGen、Wan2.1 以及 OpenSora2 的视觉效果对比。结果分析表明,本文方法生成的视频在刚体和流体运动方面表现得更加真实,显著减少了诸如物体无故出现或消失、以及非自然的拆分或合并等不符合物理规律的伪影。此外,本文方法还大幅提升了帧间一致性,在处理篮球投篮、火山熔岩流、玻璃破碎等物理密集型场景时,能够比对比模型展现出更高的时间连贯性和运动可信度。

结论

本文提出了一种基于强化学习的物理引导视频扩散框架 NS-Diff。该框架通过抗噪物理动力学检测器,实现了对视频潜空间中刚体与流体区域的精准识别。利用物理条件潜空间注入技术,速度场、变形梯度及材料掩码被有效整合至去噪流程中。此外,本文方法通过强化学习优化机制,将纳维 - 斯托克斯方程与最小急动度(Minimum-Jerk)原则转化为训练约束,强制模型遵循物理运动规律。实验结果表明,NS-Diff 在 PhysVideoBench、UCF-101 等多个基准数据集上超过现有方法,在显著降低物理运动误差的同时,确保了视觉生成质量。研究表明,将经典物理约束深度融合于生成模型,是解决视频生成中物理失真问题的有效途径。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
厅级干部已经成为了高危职业

厅级干部已经成为了高危职业

风向观察
2026-05-04 14:17:07
“差点成恐怖片!”小伙脑子像被炸开一样,这病竟潜伏25年……平时无症状,发作可致命

“差点成恐怖片!”小伙脑子像被炸开一样,这病竟潜伏25年……平时无症状,发作可致命

环球网资讯
2026-05-10 14:53:11
太可怕了!北京多人深夜中招,手机在枕边,钱却被隔空转光

太可怕了!北京多人深夜中招,手机在枕边,钱却被隔空转光

苗苗情感说
2026-05-10 06:48:46
国乒女团VS日本,决赛时间公布,孙颖莎低调,张本美和教练引热议

国乒女团VS日本,决赛时间公布,孙颖莎低调,张本美和教练引热议

体育大学僧
2026-05-09 22:49:57
访陆刚落幕,警方果断出手,替郑丽文出了口恶气,结局大快人心

访陆刚落幕,警方果断出手,替郑丽文出了口恶气,结局大快人心

恋人视角
2026-05-10 03:07:06
同日亮剑!美菲试射战斧抵近国门,我军永兴岛红旗-9B硬核反制

同日亮剑!美菲试射战斧抵近国门,我军永兴岛红旗-9B硬核反制

安珈使者啊
2026-05-10 16:31:56
小马云18岁成年首播,在线人数破7万,与女生接吻刷爆网络!

小马云18岁成年首播,在线人数破7万,与女生接吻刷爆网络!

另子维爱读史
2026-05-10 11:05:38
梦回巅峰!哈登连拿7分杀死比赛!全场起立欢呼,骑士保留悬念

梦回巅峰!哈登连拿7分杀死比赛!全场起立欢呼,骑士保留悬念

体坛小李
2026-05-10 07:00:48
今晚开播!央一48集年代大剧来袭!阵容不错,这剧有黑马潜质

今晚开播!央一48集年代大剧来袭!阵容不错,这剧有黑马潜质

不似少年游
2026-05-10 11:40:37
15公司5月10日中午发布重大利空,大减持公司5家 重组退市公司2家

15公司5月10日中午发布重大利空,大减持公司5家 重组退市公司2家

股市皆大事
2026-05-10 11:30:17
陪玩陪睡根本不够!认干爹、舔手指,背地里的阴暗面完全藏不住了

陪玩陪睡根本不够!认干爹、舔手指,背地里的阴暗面完全藏不住了

杰丝聊古今
2026-05-03 13:35:27
全球最大的公司诞生!市值35万亿,相当于15个阿里,利润超8000亿

全球最大的公司诞生!市值35万亿,相当于15个阿里,利润超8000亿

简易科技
2026-05-10 15:18:40
吞自己的苦果!日媒称:中国多所一流高校已经终止向日本派交换生

吞自己的苦果!日媒称:中国多所一流高校已经终止向日本派交换生

凡知
2026-05-09 12:38:17
笑麻了,原来真实的乡镇公务员是这样的!网友:疑是被编制做局了

笑麻了,原来真实的乡镇公务员是这样的!网友:疑是被编制做局了

另子维爱读史
2026-05-10 10:55:25
伊朗革命卫队或将发动猛烈打击

伊朗革命卫队或将发动猛烈打击

参考消息
2026-05-10 10:36:03
“乡下父母全是这样被骗的”,中职女孩穿廉价警服,过来人说实话

“乡下父母全是这样被骗的”,中职女孩穿廉价警服,过来人说实话

泽泽先生
2026-05-08 18:29:22
活活吓死!网传69岁老人查出肺癌晚期,老伴告知真相后三日便离世

活活吓死!网传69岁老人查出肺癌晚期,老伴告知真相后三日便离世

火山詩话
2026-05-09 21:45:51
果然出事了!特朗普访华遇重大分歧,中方提的要求被美方一口否决

果然出事了!特朗普访华遇重大分歧,中方提的要求被美方一口否决

精彩启程
2026-05-09 23:51:47
中国赢了。这次中国是真的赢了

中国赢了。这次中国是真的赢了

安安说
2026-05-10 11:16:20
国务卿鲁比奥被中国拒之门外,北京宁绕弯传话也不给他开门!

国务卿鲁比奥被中国拒之门外,北京宁绕弯传话也不给他开门!

故事终将光明磊落
2026-05-10 15:02:43
2026-05-10 18:03:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12957文章数 142647关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

县交警队长被举报工作日KTV饮酒 当地:其事先已请假

头条要闻

县交警队长被举报工作日KTV饮酒 当地:其事先已请假

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

大S女儿玥儿开通账号,用烟花缅怀母亲

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

旅游
本地
时尚
健康
公开课

旅游要闻

初夏泰山 青绿漫山野 古建映海棠

本地新闻

用苏绣的方式,打开江西婺源

今年最好看的衬衫竟然是它?太减龄了!

干细胞能让人“返老还童”吗

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版