网易首页 > 网易号 > 正文 申请入驻

美团发布并开源视频生成模型:部分参数比肩谷歌最先进模型Veo3

0
分享至


10月27日消息,美团LongCat团队今日发布并开源LongCat-Video视频生成模型,以统一模型在文生、图生视频基础任务上达到开源SOTA(最先进水平)。

不同于以往针对单一任务训练的模型,LongCat-Video通过多任务联合训练机制,在同一框架内即可处理零帧、单帧及多帧条件输入。


此外,LongCat-Video重点突破了长视频生成难题,原生支持输出5分钟级别的视频。相比常见模型在长时序生成中易出现的画面漂移、色彩偏移等问题,该模型通过在视频续写任务上的原生预训练,保持了较高的时间一致性与视觉稳定性。

近年来,“世界模型”被业界认为是通往下一代人工智能的核心方向。它能在时空维度上建模物理规律与场景逻辑,使AI具备理解、预测甚至重构现实世界的能力。

在这一背景下,视频生成模型被视为构建“世界模型”的关键路径。通过视频生成任务压缩几何、语义与物理知识,AI可以在数字空间中模拟真实世界的运行过程。

美团LongCat团队表示,LongCat-Video的推出是公司迈向这一目标的关键一步。未来,该模型将与自动驾驶、具身智能等业务相结合,为美团在连接“原子世界”和“比特世界”方面提供技术支撑。


文生视频任务中,LongCat-Video可以根据提示词准确还原不少脑洞大开的画面

据介绍,LongCat-Video可生成720p分辨率、30帧率的高清视频,其突出特点在于能够原生生成长达5分钟的连贯视频内容。模型通过视频续写预训练、块稀疏注意力等机制,旨在解决长视频生成中常见的画面断裂、质量下降等问题,保持时序一致性与运动合理性。

在效率方面,针对高分辨率、高帧率视频生成的计算瓶颈,LongCat-Video通过“二阶段粗到精生成(C2F)+ 块稀疏注意力(BSA)+ 模型蒸馏”三重优化,视频推理速度提升至10.1倍,实现效率与质量的最优平衡。


LongCat-Video视频生成模型视频推理速度提升至10.1倍

在内部评测体系中,美团构建了一套覆盖文本生成视频与图像生成视频两大核心任务的基准,评估维度包括文本对齐、视觉质量、运动质量与总体表现,并在图生视频任务中额外增加了图像一致性指标。

为确保评测的科学性,团队采用人工与自动双轨评估机制,其中人工评价分为绝对打分与相对偏好两种方式,所有样本均由多名标注员独立评分,最终通过加权平均得出结果。

自动评测部分则由内部训练的多模态“判官模型”完成,与人工结果的相关性高达0.92,保证了客观性。

据发布的评测结果显示,LongCat-Video在文生视频任务的四个核心指标中,视觉质量得分几乎与谷歌的Veo3持平,整体质量超越了PixVerse-V5和国内领先的开源模型Wan2.2。


在运动质量方面,LongCat-Video生成的视频动作流畅、镜头移动自然,展现出较强的物理合理性。在文本对齐度上,LongCat-Video表现略差于Veo3。

在图生视频任务中,LongCat-Video画面细节丰富、风格真实,但在图像一致性和动作连贯性上仍有改进空间。技术报告认为,模型在处理高精度参考帧时对细节的保持较为谨慎,这在视觉质量上带来加分,却略微影响了动态平滑度。



LongCat-Video视频生成模型在文生、图生视频基础任务上达到开源SOTA

在公开评测平台VBench 2.0上,LongCat-Video在“常识理解”一项中以70.94%的得分位居所有开源模型第一,总分达到62.11%,仅次于谷歌Veo 3与生数Vidu Q1等商用闭源模型。

作为构建"世界模型"的技术尝试,LongCat-Video未来或可应用于自动驾驶模拟、具身智能等需要长时序建模的场景。该模型的发布标志着美团在视频生成与物理世界模拟领域迈出重要一步。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
杜兰特:我整场都被三个黑鬼防守;球迷:这战术很聪明啊

杜兰特:我整场都被三个黑鬼防守;球迷:这战术很聪明啊

懂球帝
2025-11-07 11:33:11
太炸裂!副院长和主任纵欢后续:手术单当床单,身份被扒不简单!

太炸裂!副院长和主任纵欢后续:手术单当床单,身份被扒不简单!

千言娱乐记
2025-11-06 10:48:47
美荷两国同时发声,对中国独立研发的光刻机技术给予了强烈批评

美荷两国同时发声,对中国独立研发的光刻机技术给予了强烈批评

来科点谱
2025-11-06 13:33:42
快船102-115不敌太阳 球员评价:祖巴茨满分,4人及格,6人崩盘

快船102-115不敌太阳 球员评价:祖巴茨满分,4人及格,6人崩盘

篮球资讯达人
2025-11-07 12:32:30
柬埔寨光速服软了,韩国冻结910亿,将电诈帝国命脉连根拔起

柬埔寨光速服软了,韩国冻结910亿,将电诈帝国命脉连根拔起

百科密码
2025-11-06 17:11:58
副院长和眼科主任不雅事件,出人意料的事情发生了!

副院长和眼科主任不雅事件,出人意料的事情发生了!

仕道
2025-11-07 10:09:16
薄一波晚年反省,当年不该支持此人上台,他给国家带来大麻烦

薄一波晚年反省,当年不该支持此人上台,他给国家带来大麻烦

扬平说史
2025-11-06 20:22:42
我在部队当了5年通讯兵,退伍发现村后头的信号塔每晚都准时闪3下

我在部队当了5年通讯兵,退伍发现村后头的信号塔每晚都准时闪3下

五元讲堂
2025-11-05 10:35:02
全球都在看中国将如何救援航天员!俄罗斯和美国9个月,中国多久

全球都在看中国将如何救援航天员!俄罗斯和美国9个月,中国多久

林子说事
2025-11-06 10:56:02
奥委会急疯了!2036奥运邀约无人接,中国神回复让全球集体沉默

奥委会急疯了!2036奥运邀约无人接,中国神回复让全球集体沉默

霁寒飘雪
2025-11-06 19:35:42
人形机器人里藏真人?何小鹏哽咽再辟谣:大家不敢信它来自中国公司!剪开覆盖件后露出机械件……公司美股大涨9%

人形机器人里藏真人?何小鹏哽咽再辟谣:大家不敢信它来自中国公司!剪开覆盖件后露出机械件……公司美股大涨9%

每日经济新闻
2025-11-06 23:18:07
场均40分11板9助,NBA历史首人!要这么打,本赛季MVP悬念不大了

场均40分11板9助,NBA历史首人!要这么打,本赛季MVP悬念不大了

老梁体育漫谈
2025-11-07 00:53:50
一张AI表格,接管2025年双11

一张AI表格,接管2025年双11

虎嗅APP
2025-11-06 19:22:06
网传河北一法院人均未结案600件,已排到明年7月,官方建议优先调解

网传河北一法院人均未结案600件,已排到明年7月,官方建议优先调解

互联网大观
2025-11-07 09:55:51
飞船外壳疑被击穿,神舟二十号返回任务紧急暂停

飞船外壳疑被击穿,神舟二十号返回任务紧急暂停

元爸体育
2025-11-07 01:11:28
气得发抖!茅台高管张楷怒喊:3000一瓶的飞天,老百姓谁喝得起?

气得发抖!茅台高管张楷怒喊:3000一瓶的飞天,老百姓谁喝得起?

好贤观史记
2025-11-07 08:02:13
“被三个男的围着!”浙江19岁女大学生拍写真,事后委屈大哭……

“被三个男的围着!”浙江19岁女大学生拍写真,事后委屈大哭……

FM93浙江交通之声
2025-10-17 14:16:07
某领导,被伺候舒服了!

某领导,被伺候舒服了!

地产八卦
2025-11-07 07:16:10
“询问其他交易记录,还报警处置”?律师称在银行取钱被追问“资金用途”;银行、反诈中心都说是对方要求

“询问其他交易记录,还报警处置”?律师称在银行取钱被追问“资金用途”;银行、反诈中心都说是对方要求

大风新闻
2025-11-06 15:16:03
诺奖级突破?牙釉质终于可再生了?37亿人牙齿或有救了!

诺奖级突破?牙釉质终于可再生了?37亿人牙齿或有救了!

徐德文科学频道
2025-11-06 21:51:16
2025-11-07 12:48:49
科工力量 incentive-icons
科工力量
观察者网工业科技专栏
160文章数 531关注度
往期回顾 全部

科技要闻

75%赞成!特斯拉股东同意马斯克天价薪酬

头条要闻

美国试射洲际弹道导弹后 俄方几乎整个领导层齐聚克宫

头条要闻

美国试射洲际弹道导弹后 俄方几乎整个领导层齐聚克宫

体育要闻

是天才更是强者,18岁的全红婵迈过三道坎

娱乐要闻

白百何回应东京电影节争议

财经要闻

老登们的社交货币全崩了

汽车要闻

小鹏X9增程版综合续航1606公里 有底气挑战赛那?

态度原创

数码
游戏
家居
本地
公开课

数码要闻

快讯|《移动终端通用快速充电解决方案》发布

免费玩还有绝版奖励!国服《暗黑4》压力测试

家居要闻

现代自由 功能美学居所

本地新闻

这届干饭人,已经把博物馆吃成了食堂

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版