网易首页 > 网易号 > 正文 申请入驻

AI做了个“GTA5”?国产开源世界模型硬刚谷歌,实时交互、分钟级生成

0
分享至

智东西8月12日报道,今日,昆仑万维开源自研世界模型Matrix系列中Matrix-Game交互世界模型的升级版本——Matrix-Game 2.0

上周,谷歌DeepMind推出交互式世界模型Genie 3,实现了交互式实时长序列生成,引起产业关注。然而Genie 3并没有开源。昆仑万维Matrix-Game 2.0是业内首个在通用场景上,实现实时长序列交互式生成的世界模型开源方案。这意味着具身智能、游戏、影视及元宇宙多个领域的开发者将获得一个高开放可用的数据合成、模型训练及场景搭建的生产力工具。

Matrix-Game 2.0有以下三大特点:

1、实时蒸馏。采用 “少步扩散” 技术,实现25FPS(帧/秒)的流式视频合成,能以超高速在复杂环境中生成分钟级、高保真的视频。

2、精准动作注入。一个 “鼠标 / 键盘到帧” 模块,可将用户输入作为直接交互嵌入其中,从而在生成的视频中实现帧级控制和动态响应。

3、大规模交互式数据管道。一个适用于虚幻引擎(Unreal Engine)和《侠盗猎车手 5》(GTA5)的可扩展生产系统,能生成约1200小时的高质量交互式视频数据,涵盖多样化场景,且具备帧级真实感。

▲基于Matrix-Game 2.0生成的交互式模型

这款模型的视频生成效果如何?有什么样的应用价值?又有什么技术亮点?本文带大家一探究竟。

项目主页:
https://matrix-game-v2.github.io/
HuggingFace地址:
https://huggingface.co/Skywork/Matrix-Game-2.0
GitHub地址:
https://github.com/SkyworkAI/Matrix-Game

一、低延迟、高帧率、长时序,国产交互式世界模型开源

相较于上一版本,Matrix-Game 2.0更加侧重低延迟、高帧率的长序列交互性能,能够以25 FPS的速度,在多种复杂场景中稳定生成连续视频内容,且生成时长可扩展至分钟级,大幅提升了连贯性与实用性。

在推理速度显著提升的同时,模型依然保持了对物理规律与场景语义的精准理解,支持用户通过简单指令,自由探索、操控并实时构建结构清晰、细节丰富、规则合理的虚拟环境。

在性能测试上,如下图所示,Matrix-Game 2.0在 Minecraft场景的GameWorld Score基准测试中取得了好成绩,在图像质量、美学品质、鼠标指针等多个方面的得分均超过了全球首个实时可玩可交互的世界模型Oasis。

例如在一些无约束、不可控的真实场景,Matrix-Game 2.0可根据用户输入的任意控制指令,如键盘的 W/A/S/D 方向键、鼠标用于视角移动,生成对应的交互世界视频,支持角色的前后左右移动以及视角变换等动态行为。



▲Matrix-Game 2.0支持无约束、不可控的真实场景交互

在GTA游戏场景和Minecraft场景中,Matrix-Game 2.0也支持键盘与鼠标操作,并且能够生成真实感更强、符合物理逻辑的可交互视频。


▲Matrix-Game 2.0支持GTA游戏场景交互

二、自回归扩散生成机制,实时生成长视频

交互式视频生成领域的最新进展展现了扩散模型作为世界模型的潜力。然而,现有的交互式世界模型依赖于双向注意力机制和冗长的推理步骤,严重限制了实时性能。因此,它们难以模拟现实世界的动态。

为了解决这个问题,昆仑万维提出了Matrix-Game 2.0,一个交互式世界模型,它通过几步自回归扩散算法实时生成长视频。其基础模型源自WanX,通过移除文本分支并添加动作模块,该模型仅根据视觉内容和对应的动作来预测下一帧。

Matrix-Game 2.0的框架由三个关键组件组成:

1、一个适用于虚幻引擎和GTA5环境的可扩展数据生产流水线,可有效生成海量(约 1200小时)交互式视频数据;

2、一个动作注入模块,支持帧级鼠标和键盘输入交互;

3、基于随意架构的几步提炼,用于实时流式视频生成。

Matrix-Game 2.0基于Self-Forcing训练策略,通过创新的自回归扩散生成机制克服了传统双向扩散模型的延迟和误差累积问题:

1、因果扩散模型训练:将双向扩散模型蒸馏为因果模型,使用基础模型初始化生成器,并构建小规模数据集,通过近似ODE轨迹进行训练,稳定自回归扩散过程。通过历史帧条件生成当前帧,减少因依赖未来帧而导致的时序延迟。

2、分布匹配蒸馏(DMD):通过最小化与基础模型之间的分布差异,引导学生模型学习生成高质量视频帧,对齐训练与推理阶段的分布,显著缓解误差积累问题。

3、KV缓存机制:引入键值缓存机制(KV-Cache),显著提升长视频生成的效率和一致性。该机制通过维护固定长度的注意力上下文,实现无缝滚动生成,支持无限时长的视频输出,解决了训练与推理场景下上下文不一致的问题。基于此实现长时视频的高效生成而无需重复计算,单GPU上可实现25 FPS实时生成。

Matrix-Game 2.0能够以25 FPS的超快速度跨不同场景生成高质量的分钟级视频。昆仑万维开源其模型权重和代码库,以推进交互式世界建模的研究。

结语:世界模型加速具身智能、游戏影视发展

以谷歌Genie等为代表的世界模型,正推动AI从内容生成工具升级为“世界构建者”,昆仑万维开源的Matrix系列是中国在空间智能领域取得里程碑进展。

随着其最新迭代的Matrix-Game 2.0落地,具身智能体训练与数据生成、虚拟游戏世界高效搭建、影视及元宇宙内容生产等领域有望加速发展,为中国AI产业开辟新范式。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
疯狂!狂轰59+10+5,场均31.8分+历史得分王,竟然打不了NBA

疯狂!狂轰59+10+5,场均31.8分+历史得分王,竟然打不了NBA

球童无忌
2026-03-26 11:10:26
热到25.8℃!别急,成都天气又要变

热到25.8℃!别急,成都天气又要变

掌上金牛
2026-03-26 19:19:29
二百多名军官被枪毙、撤职、处分,长津湖战役中失职的志愿军88师

二百多名军官被枪毙、撤职、处分,长津湖战役中失职的志愿军88师

云霄纪史观
2026-03-25 12:16:14
克什米尔,印度与巴基斯坦为何争夺八十年?

克什米尔,印度与巴基斯坦为何争夺八十年?

地图帝
2026-03-25 09:17:39
丧心病狂!河南14岁少年被虐死案:死时穿纸尿裤,胃里空无一物

丧心病狂!河南14岁少年被虐死案:死时穿纸尿裤,胃里空无一物

春日在捕月
2026-03-25 01:00:23
20年后再看《亮剑》:军事上漏洞百出,政治上莫名其妙

20年后再看《亮剑》:军事上漏洞百出,政治上莫名其妙

明月清风阁
2026-03-25 14:50:09
感谢监管,为量化戴上紧箍咒,散户终见曙光

感谢监管,为量化戴上紧箍咒,散户终见曙光

风风顺
2026-03-26 10:28:39
重磅实锤!瓜帅即将告别曼城,下一站彻底跳出英超

重磅实锤!瓜帅即将告别曼城,下一站彻底跳出英超

澜归序
2026-03-26 06:02:38
马英九亲自下场后,蓝营大佬集体回应,台媒体人:罪在马英九

马英九亲自下场后,蓝营大佬集体回应,台媒体人:罪在马英九

DS北风
2026-03-25 18:50:17
神笔警探林宇辉再绘“梅姨”老年画像:她年龄增大,精神也受折磨,面貌应该变化很大

神笔警探林宇辉再绘“梅姨”老年画像:她年龄增大,精神也受折磨,面貌应该变化很大

极目新闻
2026-03-26 11:14:21
跌光2500亿!泡泡玛特,股价崩塌

跌光2500亿!泡泡玛特,股价崩塌

财经锐眼
2026-03-26 18:54:18
张雪峰心源性猝死多严重,那个最快护士就有多“牛逼”(张雪峰的惯用词)

张雪峰心源性猝死多严重,那个最快护士就有多“牛逼”(张雪峰的惯用词)

天山箴言录
2026-03-26 16:45:50
外媒:40%的消费者希望中国品牌汽车进入美国市场

外媒:40%的消费者希望中国品牌汽车进入美国市场

环球网资讯
2026-03-24 13:45:12
震惊!聊天框打出“飞机”,华为是民航客机,苹果是螺旋桨小飞机

震惊!聊天框打出“飞机”,华为是民航客机,苹果是螺旋桨小飞机

火山詩话
2026-03-26 09:43:22
初中和高中一对比,你会发现:初中成绩好,高中掉队的概率真不小

初中和高中一对比,你会发现:初中成绩好,高中掉队的概率真不小

好爸育儿
2026-03-26 15:45:14
破防!马英九专访20分钟紧急叫停,“失智疑云”背后藏着更大棋局

破防!马英九专访20分钟紧急叫停,“失智疑云”背后藏着更大棋局

戗词夺理
2026-03-26 11:13:50
台积电突然断供?直接甩出“稀土”,外媒:这才是真正的杀手锏!

台积电突然断供?直接甩出“稀土”,外媒:这才是真正的杀手锏!

瑛派儿老黄
2026-03-24 18:56:06
0.028%!无罪判决率跌至谷底,为何国际水平是我们的35倍?

0.028%!无罪判决率跌至谷底,为何国际水平是我们的35倍?

深析古今
2026-03-25 01:10:47
以色列打不动了想停火,伊朗说不:47年的账,今天得算清

以色列打不动了想停火,伊朗说不:47年的账,今天得算清

阿伧说事
2026-03-26 03:58:41
追悼会前,张雪峰婚姻状况被扒,现任身份不一般,恐影响遗产分配

追悼会前,张雪峰婚姻状况被扒,现任身份不一般,恐影响遗产分配

喜欢历史的阿繁
2026-03-26 14:40:54
2026-03-26 21:39:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11440文章数 117016关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

美国总统特朗普公开宣布访华行程 外交部回应

头条要闻

美国总统特朗普公开宣布访华行程 外交部回应

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
教育
房产
本地
公开课

家居要闻

傍海而居 静观蝴蝶海

教育要闻

江苏省教育厅公布全省中小学生竞赛活动名单

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版