网易首页 > 网易号 > 正文 申请入驻

AI做了个“GTA5”?国产开源世界模型硬刚谷歌,实时交互、分钟级生成

0
分享至


智东西
作者 李水青
编辑 云鹏

智东西8月12日报道,今日,昆仑万维开源自研世界模型Matrix系列中Matrix-Game交互世界模型的升级版本——Matrix-Game 2.0

上周,谷歌DeepMind推出交互式世界模型Genie 3,实现了交互式实时长序列生成,引起产业关注。然而Genie 3并没有开源。昆仑万维Matrix-Game 2.0是业内首个在通用场景上,实现实时长序列交互式生成的世界模型开源方案。这意味着具身智能、游戏、影视及元宇宙多个领域的开发者将获得一个高开放可用的数据合成、模型训练及场景搭建的生产力工具。

Matrix-Game 2.0有以下三大特点:

1、实时蒸馏。采用 “少步扩散” 技术,实现25FPS(帧/秒)的流式视频合成,能以超高速在复杂环境中生成分钟级、高保真的视频。

2、精准动作注入。一个 “鼠标 / 键盘到帧” 模块,可将用户输入作为直接交互嵌入其中,从而在生成的视频中实现帧级控制和动态响应。

3、大规模交互式数据管道。一个适用于虚幻引擎(Unreal Engine)和《侠盗猎车手 5》(GTA5)的可扩展生产系统,能生成约1200小时的高质量交互式视频数据,涵盖多样化场景,且具备帧级真实感。


▲基于Matrix-Game 2.0生成的交互式模型

这款模型的视频生成效果如何?有什么样的应用价值?又有什么技术亮点?本文带大家一探究竟。

项目主页:
https://matrix-game-v2.github.io/
HuggingFace地址:
https://huggingface.co/Skywork/Matrix-Game-2.0
GitHub地址:
https://github.com/SkyworkAI/Matrix-Game

一、低延迟、高帧率、长时序,国产交互式世界模型开源

相较于上一版本,Matrix-Game 2.0更加侧重低延迟、高帧率的长序列交互性能,能够以25 FPS的速度,在多种复杂场景中稳定生成连续视频内容,且生成时长可扩展至分钟级,大幅提升了连贯性与实用性。

在推理速度显著提升的同时,模型依然保持了对物理规律与场景语义的精准理解,支持用户通过简单指令,自由探索、操控并实时构建结构清晰、细节丰富、规则合理的虚拟环境。

在性能测试上,如下图所示,Matrix-Game 2.0在 Minecraft场景的GameWorld Score基准测试中取得了好成绩,在图像质量、美学品质、鼠标指针等多个方面的得分均超过了全球首个实时可玩可交互的世界模型Oasis。


例如在一些无约束、不可控的真实场景,Matrix-Game 2.0可根据用户输入的任意控制指令,如键盘的 W/A/S/D 方向键、鼠标用于视角移动,生成对应的交互世界视频,支持角色的前后左右移动以及视角变换等动态行为。



▲Matrix-Game 2.0支持无约束、不可控的真实场景交互

在GTA游戏场景和Minecraft场景中,Matrix-Game 2.0也支持键盘与鼠标操作,并且能够生成真实感更强、符合物理逻辑的可交互视频。



▲Matrix-Game 2.0支持GTA游戏场景交互

二、自回归扩散生成机制,实时生成长视频

交互式视频生成领域的最新进展展现了扩散模型作为世界模型的潜力。然而,现有的交互式世界模型依赖于双向注意力机制和冗长的推理步骤,严重限制了实时性能。因此,它们难以模拟现实世界的动态。

为了解决这个问题,昆仑万维提出了Matrix-Game 2.0,一个交互式世界模型,它通过几步自回归扩散算法实时生成长视频。其基础模型源自WanX,通过移除文本分支并添加动作模块,该模型仅根据视觉内容和对应的动作来预测下一帧。


Matrix-Game 2.0的框架由三个关键组件组成:

1、一个适用于虚幻引擎和GTA5环境的可扩展数据生产流水线,可有效生成海量(约 1200小时)交互式视频数据;

2、一个动作注入模块,支持帧级鼠标和键盘输入交互;

3、基于随意架构的几步提炼,用于实时流式视频生成。

Matrix-Game 2.0基于Self-Forcing训练策略,通过创新的自回归扩散生成机制克服了传统双向扩散模型的延迟和误差累积问题:

1、因果扩散模型训练:将双向扩散模型蒸馏为因果模型,使用基础模型初始化生成器,并构建小规模数据集,通过近似ODE轨迹进行训练,稳定自回归扩散过程。通过历史帧条件生成当前帧,减少因依赖未来帧而导致的时序延迟。

2、分布匹配蒸馏(DMD):通过最小化与基础模型之间的分布差异,引导学生模型学习生成高质量视频帧,对齐训练与推理阶段的分布,显著缓解误差积累问题。

3、KV缓存机制:引入键值缓存机制(KV-Cache),显著提升长视频生成的效率和一致性。该机制通过维护固定长度的注意力上下文,实现无缝滚动生成,支持无限时长的视频输出,解决了训练与推理场景下上下文不一致的问题。基于此实现长时视频的高效生成而无需重复计算,单GPU上可实现25 FPS实时生成。

Matrix-Game 2.0能够以25 FPS的超快速度跨不同场景生成高质量的分钟级视频。昆仑万维开源其模型权重和代码库,以推进交互式世界建模的研究。

结语:世界模型加速具身智能、游戏影视发展

以谷歌Genie等为代表的世界模型,正推动AI从内容生成工具升级为“世界构建者”,昆仑万维开源的Matrix系列是中国在空间智能领域取得里程碑进展。

随着其最新迭代的Matrix-Game 2.0落地,具身智能体训练与数据生成、虚拟游戏世界高效搭建、影视及元宇宙内容生产等领域有望加速发展,为中国AI产业开辟新范式。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
欧洲最新数据,“令人震惊的中国速度”

欧洲最新数据,“令人震惊的中国速度”

观察者网
2026-01-30 18:17:03
央视直播英超豪门,阿森纳遇上软柿子,曼城或失分,维拉遭重创

央视直播英超豪门,阿森纳遇上软柿子,曼城或失分,维拉遭重创

嗨皮看球
2026-01-30 17:38:18
绝了!蒸一蒸这水果,喉咙里的痰“唰唰”消失,全家都抢着喝

绝了!蒸一蒸这水果,喉咙里的痰“唰唰”消失,全家都抢着喝

江江食研社
2025-12-29 14:30:09
海南一空姐被穷打工仔追求,婚后一个月,她才得知丈夫真实身份

海南一空姐被穷打工仔追求,婚后一个月,她才得知丈夫真实身份

小月文史
2024-11-19 21:11:58
特朗普警告英国首相和中国打交道很危险,英国人回呛:管好自己!

特朗普警告英国首相和中国打交道很危险,英国人回呛:管好自己!

阿龙聊军事
2026-01-30 20:19:13
征服中年女人,无需套路:两颗真心,一生相守

征服中年女人,无需套路:两颗真心,一生相守

青苹果sht
2025-11-04 06:10:40
浙江卫视炸了!7000万网红怒怼评委:你15年没歌凭啥说我?

浙江卫视炸了!7000万网红怒怼评委:你15年没歌凭啥说我?

不写散文诗
2026-01-30 15:17:13
3天爆4个惊天大瓜,知三当三、偷税漏税、吸毒涉毒,郭晶晶也遭殃

3天爆4个惊天大瓜,知三当三、偷税漏税、吸毒涉毒,郭晶晶也遭殃

趣文说娱
2026-01-29 16:34:46
母亲去世继父继承遗产,19岁女儿为求学打官司

母亲去世继父继承遗产,19岁女儿为求学打官司

现代快报
2026-01-30 18:57:21
完成北伐2个目标后,快船迎来魔鬼赛程,刚好对阵西部前6对手

完成北伐2个目标后,快船迎来魔鬼赛程,刚好对阵西部前6对手

摸神drose
2026-01-30 23:14:19
66岁才醒悟:兄弟姐妹互不登门,不是老得走不动,而是栽在这4件

66岁才醒悟:兄弟姐妹互不登门,不是老得走不动,而是栽在这4件

大熊欢乐坊
2026-01-30 06:33:28
四川一男子为控制血糖,每天坚持走路8000步,半年后他的身体咋样

四川一男子为控制血糖,每天坚持走路8000步,半年后他的身体咋样

蜉蝣说
2026-01-30 10:54:58
三观炸裂!翟欣欣出轨聊天记录流出,尺度大到咂舌,判12年都嫌少

三观炸裂!翟欣欣出轨聊天记录流出,尺度大到咂舌,判12年都嫌少

有范又有料
2025-09-29 14:21:11
渗透军政界身居高位,国家抓捕的4大卧底,给我国造成重大损失

渗透军政界身居高位,国家抓捕的4大卧底,给我国造成重大损失

甜柠聊史
2026-01-27 14:12:52
黄金白银暴跌创历史记录!杠杆投资者一夜归零!美联储新主席沃什重磅登场

黄金白银暴跌创历史记录!杠杆投资者一夜归零!美联储新主席沃什重磅登场

华哥的投资笔记
2026-01-31 04:51:25
谈崩了,哈梅内伊很紧张!!!

谈崩了,哈梅内伊很紧张!!!

山河路口
2026-01-29 19:17:53
斯塔默获高规格接待,他在台湾问题上的表述,明显跟其他国家不一样

斯塔默获高规格接待,他在台湾问题上的表述,明显跟其他国家不一样

军机Talk
2026-01-30 10:37:39
请人吃饭,对方说“临时有事不去了”,别说“好下次约”,高情商回应来了

请人吃饭,对方说“临时有事不去了”,别说“好下次约”,高情商回应来了

十点读书
2026-01-29 19:11:17
《生命树》央视首播收视破3!观众评价出奇一致,杨紫胡歌出王炸

《生命树》央视首播收视破3!观众评价出奇一致,杨紫胡歌出王炸

露珠聊影视
2026-01-30 22:53:58
晚节不保!四位老戏骨接连翻车,薄情寡义、贪财好色、装穷样样有

晚节不保!四位老戏骨接连翻车,薄情寡义、贪财好色、装穷样样有

小熊侃史
2026-01-30 12:55:49
2026-01-31 07:00:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11160文章数 116945关注度
往期回顾 全部

科技要闻

意念控制机器人不是科幻 1-2年就落地

头条要闻

特朗普:已向伊朗告知达成协议的最后期限

头条要闻

特朗普:已向伊朗告知达成协议的最后期限

体育要闻

“假赌黑”的子弹,还要再飞一会儿吗?

娱乐要闻

警方通报金晨交通事故,否认网传骗保

财经要闻

水贝惊雷:揭秘杰我睿百亿黄金赌局的背后

汽车要闻

合资品牌首搭800V/5C快充 东风日产NX8将于3、4月上市

态度原创

房产
教育
亲子
公开课
军事航空

房产要闻

藏不住的小城大事,海澄新城执掌自贸港风口,进阶兑现美好生活新篇

教育要闻

教育部:严控冷热搭配专业组,考生如何应对?

亲子要闻

婴儿的性格是天生的吗?网友:还没生出来 大夫就说肚子里不是善茬

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

新西兰拒绝特朗普:不加入"和平委员会"

无障碍浏览 进入关怀版