网易首页 > 网易号 > 正文 申请入驻

MIT与Adobe联手开发AI视频生成工具,画质不输Sora,还能实时修改

0
分享至

如果有机会让你一窥人工智能模型生成视频的幕后过程,你会联想到什么?或许你以为这类似于定格动画的制作方式——先生成大量图像再拼接起来。但对于 OpenAI 的 SORA 和谷歌的 VEO 2 这类“扩散模型”而言,事实并非如此。

这些系统并非逐帧(或称“自回归”)生成视频,而是对整个序列进行同步处理。虽然最终生成的片段往往具有照片级真实感,但处理过程缓慢且无法实时修改。

近日,来自麻省理工学院计算机科学与人工智能实验室(CSAIL)和 Adobe Research 的科学家们开发出了一种名为“CausVid”的混合方法,该模型能够以每秒 9.4 帧的速度实时生成高质量视频,首帧延迟仅为 1.3 秒

这个系统通过全序列扩散模型来训练自回归系统,使其既能快速预测下一帧画面,又能确保画质与连贯性。基于简单文本提示,CausVid 便可实现多种创作:将静态照片转化为动态场景、延长视频时长,甚至在生成过程中根据新指令实时修改内容。

该技术将原本需要 50 个步骤的流程精简为几个动作,实现了快速交互式内容创作。它能打造诸多充满想象力的艺术场景:纸飞机变成天鹅、长毛猛犸象穿越雪原、孩童在水坑中蹦跳。用户还能进行渐进式创作:先输入“生成男子过马路”的初始指令,待人物到达对面人行道时,再追加“他从口袋里掏出笔记本写字”的新元素。

CSAIL 的研究人员表示,该模型可以用于不同的视频编辑任务,例如通过生成与音频翻译同步的视频来帮助观众理解不同语言的直播;还可以帮助在视频游戏中渲染新内容,或快速生成训练模拟来教机器人完成新任务。

CausVid 可以被视为一种“师生模型”。其中,全序列扩散模型充当“老师”。其与驱动 SORA 或 VEO 的强大模型类似,擅长理解视频的整个时间流。它们可以同时预想一个序列的开头、中间和结尾,掌握运动的细微差别、物体的永久性以及场景整体随时间变化的稳定性。这种全面的理解使它们能够生成极其稳定且高分辨率的视频,但一次性处理整个序列需要耗费大量的计算资源,并且速度本身就很慢。

“学生”则是一个更简单的自回归模型。自回归模型根据序列中前一个元素预测下一个元素。在视频环境中,这意味着根据当前帧和前一帧预测下一帧。这种顺序处理本质上比试图一次性弄清楚所有内容要快得多。然而,纯自回归视频生成的尝试经常会失败,最大的陷阱是“错误累积”。想象一下,一个模型在预测每个后续帧时都会犯一些微小的错误。随着时间的推移,这些小错误会累积起来,导致视觉不一致、抖动,以及视频播放过程中质量明显下降。输出可能开始很流畅,但很快就会变得视觉混乱。

CausVid 巧妙地利用了教师模型的预见性,从而避免了这个问题。全序列扩散教师模型能够理解整个视频轨迹,并在训练阶段将其专业知识传授给自回归学生模型。它不仅仅是告诉学生“下一帧是什么样子”,而是训练学生模型理解稳定视频生成所需的底层动态和一致性。本质上,教师模型教会学生如何不仅快速地预测未来帧,而且能够始终如一地预测,并与对整个序列的高级理解保持一致。这与之前缺乏这种总体指导的因果方法有着至关重要的区别。通过对教师模型的高质量输出进行训练,并受益于其全局理解,学生模型可以学会快速预测后续帧,而不会像之前的模型那样陷入累积误差。

当研究人员测试 CausVid 生成 10 秒高清视频的能力时,这款模型展现出卓越的视频制作天赋。其表现远超“OpenSORA”和“MovieGen”等基线模型,生成速度比竞品快达 100 倍,同时能输出最稳定、最高质的视频片段。

团队进一步测试了 CausVid 生成 30秒长视频的稳定性,在画质连贯性方面同样碾压同类模型。这些结果表明,该技术有望实现数小时甚至无限时长的稳定视频生成。有趣的是,作为研究一部分进行的用户调研,为了解 CausVid 性能的实际体验提供了宝贵的见解。相比基于扩散技术的教师模型,用户绝大多数更喜欢学生模型生成的视频。

“自回归模型的速度优势具有决定性意义,”论文作者 Tianwei Yin 指出,“其视频质量可与教师模型媲美,虽然生成耗时更短,但代价是视觉多样性稍逊一筹。”

在使用文本-视频数据集进行的 900 多次提示测试中,CausVid 以 84.27 的综合评分拔得头筹。其在成像质量和拟人动作等指标上表现尤为突出,超越了“Vchitect”和“Gen-3”等顶尖视频生成模型。

尽管 CausVid 已是 AI 视频生成领域的高效突破,但通过精简因果架构,其生成速度有望进一步提升,甚至实现即时生成。Tianwei Yin 表示,若采用特定领域数据集训练,该模型将为机器人和游戏产业产出更优质的视频内容。

专家认为,这种混合系统是对当前受处理速度拖累的扩散模型的重要升级。“现有视频模型的速度远逊于大语言模型或图像生成模型,”未参与该研究的卡内基梅隆大学助理教授 Jun Yan Zhu 评价道,“这项突破性工作显著提升了生成效率,意味着更流畅的串流速度、更强的交互应用潜力,以及更低的碳足迹。”

该研究获得了亚马逊科学中心、光州科学技术院、Adobe、谷歌、美国空军研究实验室及美国空军人工智能加速器的支持。CausVid 技术将于 6 月在国际计算机视觉与模式识别会议(CVPR)正式亮相。

https://news.mit.edu/2025/causevid-hybrid-ai-model-crafts-smooth-high-quality-videos-in-seconds-0506

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国大学“校史虚构大赛”:谁在争抢“第一”?

中国大学“校史虚构大赛”:谁在争抢“第一”?

深度报
2026-05-09 23:35:25
新规落地!手机不用再交月租,联通率先实行,移动电信全都跟上

新规落地!手机不用再交月租,联通率先实行,移动电信全都跟上

笑熬浆糊111
2026-05-09 04:47:09
这才是现场摄影师该干的事!

这才是现场摄影师该干的事!

贵圈真乱
2026-05-10 09:38:47
河南22岁博主连夜开车1300多公里送同学奔丧感动全网:女大学生深夜得知母亲去世,向同校70万粉丝博主求助;博主最新回应:已在返校途中

河南22岁博主连夜开车1300多公里送同学奔丧感动全网:女大学生深夜得知母亲去世,向同校70万粉丝博主求助;博主最新回应:已在返校途中

极目新闻
2026-05-10 20:42:25
“这环境,咋敢生孩子?”女孩因充电器被碰掉绝食,穷人家的公主

“这环境,咋敢生孩子?”女孩因充电器被碰掉绝食,穷人家的公主

妍妍教育日记
2026-05-09 13:31:49
OPPO母亲节活动文案引争议,武汉大学:极不认同文案价值倾向

OPPO母亲节活动文案引争议,武汉大学:极不认同文案价值倾向

界面新闻
2026-05-10 17:42:10
大丫头无缘破不胜魔咒!蒯曼1-3日本最强削球手,国乒陷入绝境

大丫头无缘破不胜魔咒!蒯曼1-3日本最强削球手,国乒陷入绝境

钉钉陌上花开
2026-05-10 20:32:26
小玥儿开通个人账号!发文求救,晒照思念妈妈,外婆和小S是好友

小玥儿开通个人账号!发文求救,晒照思念妈妈,外婆和小S是好友

小娱乐悠悠
2026-05-10 11:32:57
怀化市召开领导干部会议 宣布省委有关人事安排决定

怀化市召开领导干部会议 宣布省委有关人事安排决定

环球网资讯
2026-05-10 16:20:10
孙颖莎3-0!王曼昱决胜局4-11溃败仅20分钟,世界第一强势复仇!

孙颖莎3-0!王曼昱决胜局4-11溃败仅20分钟,世界第一强势复仇!

大秦壁虎白话体育
2026-05-10 19:40:20
重庆黔江一司机因操作不当引发车祸致2死6伤,目击者:不少行人在等红绿灯,肇事车撞倒多人到路边停下

重庆黔江一司机因操作不当引发车祸致2死6伤,目击者:不少行人在等红绿灯,肇事车撞倒多人到路边停下

极目新闻
2026-05-10 19:24:48
打过科兴疫苗的朋友,最近一定要提高警惕!千万不要被骗!

打过科兴疫苗的朋友,最近一定要提高警惕!千万不要被骗!

网络易不易
2026-05-10 11:34:41
伦敦世乒赛:大爆冷!蒯曼1:3不敌日本削球手,国乒1:2落后日本

伦敦世乒赛:大爆冷!蒯曼1:3不敌日本削球手,国乒1:2落后日本

国乒二三事
2026-05-10 20:36:29
马宁争议判罚!国安进球被吹,海港反获点球,VAR介入7分钟

马宁争议判罚!国安进球被吹,海港反获点球,VAR介入7分钟

奥拜尔
2026-05-10 20:28:28
连续潜航超14天 中国造的“麒麟”级潜艇有多厉害?

连续潜航超14天 中国造的“麒麟”级潜艇有多厉害?

环球网资讯
2026-05-10 13:18:11
女子自称住院期间遭医生侵犯,“为录音取证,主动问对方是否喜欢自己”;警方调查后未发现犯罪事实不予立案,涉事医生已被停职

女子自称住院期间遭医生侵犯,“为录音取证,主动问对方是否喜欢自己”;警方调查后未发现犯罪事实不予立案,涉事医生已被停职

大风新闻
2026-05-10 12:29:10
突传死讯!香港知名演员老公在家中离世,坐在轮椅上没了呼吸

突传死讯!香港知名演员老公在家中离世,坐在轮椅上没了呼吸

一盅情怀
2026-05-10 12:46:52
韩国总统、国会议长、执政党党首同日飙泪,此前法官离奇死亡!

韩国总统、国会议长、执政党党首同日飙泪,此前法官离奇死亡!

新民晚报
2026-05-10 09:57:45
法国车手瓦伦丁爆红后硬核带飞队友,还完房贷拉64号入局

法国车手瓦伦丁爆红后硬核带飞队友,还完房贷拉64号入局

可乐谈情感
2026-05-10 20:27:43
未经同意,以色列竟在伊拉克建秘密基地!以色列前外交官:特朗普和内塔尼亚胡相互挖坑

未经同意,以色列竟在伊拉克建秘密基地!以色列前外交官:特朗普和内塔尼亚胡相互挖坑

红星新闻
2026-05-10 19:16:12
2026-05-10 21:36:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16683文章数 514939关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

罕见一幕 韩国总统、国会议长、执政党党首同日飙泪

头条要闻

罕见一幕 韩国总统、国会议长、执政党党首同日飙泪

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

大S女儿玥儿开通账号,用烟花缅怀母亲

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

健康
旅游
房产
时尚
公开课

干细胞能让人“返老还童”吗

旅游要闻

新疆旅游新动向丨从“凑人气”到“留人心” 新疆县域旅游玩出新高度

房产要闻

低价甩卖!海口这个地标商业,无人接盘!

真爱大牌|| 用了4年都不舍得换,终于把小贵的价格也磨下来了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版