网易首页 > 网易号 > 正文 申请入驻

AI做了个“GTA5”?国产开源世界模型硬刚谷歌,实时交互、分钟级生成

0
分享至


智东西
作者 李水青
编辑 云鹏

智东西8月12日报道,今日,昆仑万维开源自研世界模型Matrix系列中Matrix-Game交互世界模型的升级版本——Matrix-Game 2.0

上周,谷歌DeepMind推出交互式世界模型Genie 3,实现了交互式实时长序列生成,引起产业关注。然而Genie 3并没有开源。昆仑万维Matrix-Game 2.0是业内首个在通用场景上,实现实时长序列交互式生成的世界模型开源方案。这意味着具身智能、游戏、影视及元宇宙多个领域的开发者将获得一个高开放可用的数据合成、模型训练及场景搭建的生产力工具。

Matrix-Game 2.0有以下三大特点:

1、实时蒸馏。采用 “少步扩散” 技术,实现25FPS(帧/秒)的流式视频合成,能以超高速在复杂环境中生成分钟级、高保真的视频。

2、精准动作注入。一个 “鼠标 / 键盘到帧” 模块,可将用户输入作为直接交互嵌入其中,从而在生成的视频中实现帧级控制和动态响应。

3、大规模交互式数据管道。一个适用于虚幻引擎(Unreal Engine)和《侠盗猎车手 5》(GTA5)的可扩展生产系统,能生成约1200小时的高质量交互式视频数据,涵盖多样化场景,且具备帧级真实感。


▲基于Matrix-Game 2.0生成的交互式模型

这款模型的视频生成效果如何?有什么样的应用价值?又有什么技术亮点?本文带大家一探究竟。

项目主页:
https://matrix-game-v2.github.io/
HuggingFace地址:
https://huggingface.co/Skywork/Matrix-Game-2.0
GitHub地址:
https://github.com/SkyworkAI/Matrix-Game

一、低延迟、高帧率、长时序,国产交互式世界模型开源

相较于上一版本,Matrix-Game 2.0更加侧重低延迟、高帧率的长序列交互性能,能够以25 FPS的速度,在多种复杂场景中稳定生成连续视频内容,且生成时长可扩展至分钟级,大幅提升了连贯性与实用性。

在推理速度显著提升的同时,模型依然保持了对物理规律与场景语义的精准理解,支持用户通过简单指令,自由探索、操控并实时构建结构清晰、细节丰富、规则合理的虚拟环境。

在性能测试上,如下图所示,Matrix-Game 2.0在 Minecraft场景的GameWorld Score基准测试中取得了好成绩,在图像质量、美学品质、鼠标指针等多个方面的得分均超过了全球首个实时可玩可交互的世界模型Oasis。


例如在一些无约束、不可控的真实场景,Matrix-Game 2.0可根据用户输入的任意控制指令,如键盘的 W/A/S/D 方向键、鼠标用于视角移动,生成对应的交互世界视频,支持角色的前后左右移动以及视角变换等动态行为。



▲Matrix-Game 2.0支持无约束、不可控的真实场景交互

在GTA游戏场景和Minecraft场景中,Matrix-Game 2.0也支持键盘与鼠标操作,并且能够生成真实感更强、符合物理逻辑的可交互视频。



▲Matrix-Game 2.0支持GTA游戏场景交互

二、自回归扩散生成机制,实时生成长视频

交互式视频生成领域的最新进展展现了扩散模型作为世界模型的潜力。然而,现有的交互式世界模型依赖于双向注意力机制和冗长的推理步骤,严重限制了实时性能。因此,它们难以模拟现实世界的动态。

为了解决这个问题,昆仑万维提出了Matrix-Game 2.0,一个交互式世界模型,它通过几步自回归扩散算法实时生成长视频。其基础模型源自WanX,通过移除文本分支并添加动作模块,该模型仅根据视觉内容和对应的动作来预测下一帧。


Matrix-Game 2.0的框架由三个关键组件组成:

1、一个适用于虚幻引擎和GTA5环境的可扩展数据生产流水线,可有效生成海量(约 1200小时)交互式视频数据;

2、一个动作注入模块,支持帧级鼠标和键盘输入交互;

3、基于随意架构的几步提炼,用于实时流式视频生成。

Matrix-Game 2.0基于Self-Forcing训练策略,通过创新的自回归扩散生成机制克服了传统双向扩散模型的延迟和误差累积问题:

1、因果扩散模型训练:将双向扩散模型蒸馏为因果模型,使用基础模型初始化生成器,并构建小规模数据集,通过近似ODE轨迹进行训练,稳定自回归扩散过程。通过历史帧条件生成当前帧,减少因依赖未来帧而导致的时序延迟。

2、分布匹配蒸馏(DMD):通过最小化与基础模型之间的分布差异,引导学生模型学习生成高质量视频帧,对齐训练与推理阶段的分布,显著缓解误差积累问题。

3、KV缓存机制:引入键值缓存机制(KV-Cache),显著提升长视频生成的效率和一致性。该机制通过维护固定长度的注意力上下文,实现无缝滚动生成,支持无限时长的视频输出,解决了训练与推理场景下上下文不一致的问题。基于此实现长时视频的高效生成而无需重复计算,单GPU上可实现25 FPS实时生成。

Matrix-Game 2.0能够以25 FPS的超快速度跨不同场景生成高质量的分钟级视频。昆仑万维开源其模型权重和代码库,以推进交互式世界建模的研究。

结语:世界模型加速具身智能、游戏影视发展

以谷歌Genie等为代表的世界模型,正推动AI从内容生成工具升级为“世界构建者”,昆仑万维开源的Matrix系列是中国在空间智能领域取得里程碑进展。

随着其最新迭代的Matrix-Game 2.0落地,具身智能体训练与数据生成、虚拟游戏世界高效搭建、影视及元宇宙内容生产等领域有望加速发展,为中国AI产业开辟新范式。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
周冠宇新赛季归属确定 替补身份加入凯迪拉克车队

周冠宇新赛季归属确定 替补身份加入凯迪拉克车队

体坛周报
2026-01-05 18:03:26
伊朗给全民发钱:每人每月7美元-发钱也无法平息民愤

伊朗给全民发钱:每人每月7美元-发钱也无法平息民愤

桂系007
2026-01-05 04:00:18
特朗普喊话哥伦比亚总统佩特罗:“要当心了”

特朗普喊话哥伦比亚总统佩特罗:“要当心了”

参考消息
2026-01-04 20:04:04
英国国王能“借走”大英博物馆的藏品吗?

英国国王能“借走”大英博物馆的藏品吗?

山间听雨
2026-01-03 14:47:39
15票赞成0票反对!安理会投票结果公布,美俄态度一致,中方表态

15票赞成0票反对!安理会投票结果公布,美俄态度一致,中方表态

博览历史
2025-12-31 20:52:27
年薪50万被妻子嫌弃后续:丈夫身份曝光,工资全上交,挨骂是日常

年薪50万被妻子嫌弃后续:丈夫身份曝光,工资全上交,挨骂是日常

好贤观史记
2026-01-04 18:36:13
美国专家:中国又开始反人类操作,从荒漠中挖出了亚洲最大水库

美国专家:中国又开始反人类操作,从荒漠中挖出了亚洲最大水库

丰谭笔录
2026-01-05 10:56:20
7年前剧情成真!直升机空降,抓走委总统,编剧不是疯了是穿越了

7年前剧情成真!直升机空降,抓走委总统,编剧不是疯了是穿越了

瓜汁橘长Dr
2026-01-05 09:14:59
特朗普威胁委内瑞拉代总统

特朗普威胁委内瑞拉代总统

财联社
2026-01-05 02:12:10
金价,又上涨了!

金价,又上涨了!

鲁中晨报
2026-01-05 19:37:01
1972年陈毅追悼会,江青故意无视宋庆龄,毛主席当场下一死命令,事后宋庆龄感慨:主席真聪明

1972年陈毅追悼会,江青故意无视宋庆龄,毛主席当场下一死命令,事后宋庆龄感慨:主席真聪明

寄史言志
2025-12-17 16:08:14
大连洁净能源集团有限公司原董事长邵阳被“双开”

大连洁净能源集团有限公司原董事长邵阳被“双开”

界面新闻
2026-01-05 16:04:53
西甲最新积分战报:皇马狂轰5球,马竞翻车,塞维利亚惨败

西甲最新积分战报:皇马狂轰5球,马竞翻车,塞维利亚惨败

足球狗说
2026-01-05 06:19:22
1950 年,毛主席毫无预兆地怒而下令,周总理与聂荣臻急忙起身应对,众人纷纷揣测:他为何突然发火?

1950 年,毛主席毫无预兆地怒而下令,周总理与聂荣臻急忙起身应对,众人纷纷揣测:他为何突然发火?

源溯历史
2026-01-03 14:55:11
内斯塔:小法总指责意式防守,他来给所有意大利教练上课好了

内斯塔:小法总指责意式防守,他来给所有意大利教练上课好了

懂球帝
2026-01-05 13:25:36
别墅是中产返贫的最大陷阱!过来人血泪总结:别墅的四大硬伤

别墅是中产返贫的最大陷阱!过来人血泪总结:别墅的四大硬伤

流苏晚晴
2026-01-02 17:56:17
大布让父母亲向妻子道歉,贝嫂含蓄回应:我们没有什么好抱歉的

大布让父母亲向妻子道歉,贝嫂含蓄回应:我们没有什么好抱歉的

小书生吃瓜
2026-01-03 16:58:09
53岁劳春燕近照曝光!紧致腰臀比太绝,知性美下藏致命女人香?

53岁劳春燕近照曝光!紧致腰臀比太绝,知性美下藏致命女人香?

娱乐领航家
2026-01-04 18:00:03
美国强掳马杜罗仅24小时,就释放出3大危险信号,会波及到中国吗

美国强掳马杜罗仅24小时,就释放出3大危险信号,会波及到中国吗

靓仔情感
2026-01-05 18:10:41
执教14个月后离开,多家媒体确认阿莫林已经被曼联解雇

执教14个月后离开,多家媒体确认阿莫林已经被曼联解雇

懂球帝
2026-01-05 18:45:50
2026-01-05 20:16:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11013文章数 116936关注度
往期回顾 全部

科技要闻

4100家科技企业集结赌城,CES揭开AI新战场

头条要闻

美对委动手致欧盟立场分裂 两元首先后发文内容南辕北辙

头条要闻

美对委动手致欧盟立场分裂 两元首先后发文内容南辕北辙

体育要闻

41岁詹皇26+10+6又迎里程碑 湖媒赞GOAT

娱乐要闻

黄宗泽夺双料视帝,泪洒颁奖台忆往昔

财经要闻

丁一凡:中美进入相对稳定的竞争共存期

汽车要闻

海狮06EV冬季续航挑战 "电"这事比亚迪绝对玩明白了

态度原创

亲子
旅游
本地
家居
公开课

亲子要闻

试管婴儿的授精过程

旅游要闻

从现在至元宵节 德州推出7大主题132项文旅活动

本地新闻

云游内蒙|初见呼和浩特,古今交融的北疆都会

家居要闻

白色大理石 奢华现代

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版