网易首页 > 网易号 > 正文 申请入驻

AI做了个“GTA5”?国产开源世界模型硬刚谷歌,实时交互、分钟级生成

0
分享至

智东西8月12日报道,今日,昆仑万维开源自研世界模型Matrix系列中Matrix-Game交互世界模型的升级版本——Matrix-Game 2.0

上周,谷歌DeepMind推出交互式世界模型Genie 3,实现了交互式实时长序列生成,引起产业关注。然而Genie 3并没有开源。昆仑万维Matrix-Game 2.0是业内首个在通用场景上,实现实时长序列交互式生成的世界模型开源方案。这意味着具身智能、游戏、影视及元宇宙多个领域的开发者将获得一个高开放可用的数据合成、模型训练及场景搭建的生产力工具。

Matrix-Game 2.0有以下三大特点:

1、实时蒸馏。采用 “少步扩散” 技术,实现25FPS(帧/秒)的流式视频合成,能以超高速在复杂环境中生成分钟级、高保真的视频。

2、精准动作注入。一个 “鼠标 / 键盘到帧” 模块,可将用户输入作为直接交互嵌入其中,从而在生成的视频中实现帧级控制和动态响应。

3、大规模交互式数据管道。一个适用于虚幻引擎(Unreal Engine)和《侠盗猎车手 5》(GTA5)的可扩展生产系统,能生成约1200小时的高质量交互式视频数据,涵盖多样化场景,且具备帧级真实感。

▲基于Matrix-Game 2.0生成的交互式模型

这款模型的视频生成效果如何?有什么样的应用价值?又有什么技术亮点?本文带大家一探究竟。

项目主页:
https://matrix-game-v2.github.io/
HuggingFace地址:
https://huggingface.co/Skywork/Matrix-Game-2.0
GitHub地址:
https://github.com/SkyworkAI/Matrix-Game

一、低延迟、高帧率、长时序,国产交互式世界模型开源

相较于上一版本,Matrix-Game 2.0更加侧重低延迟、高帧率的长序列交互性能,能够以25 FPS的速度,在多种复杂场景中稳定生成连续视频内容,且生成时长可扩展至分钟级,大幅提升了连贯性与实用性。

在推理速度显著提升的同时,模型依然保持了对物理规律与场景语义的精准理解,支持用户通过简单指令,自由探索、操控并实时构建结构清晰、细节丰富、规则合理的虚拟环境。

在性能测试上,如下图所示,Matrix-Game 2.0在 Minecraft场景的GameWorld Score基准测试中取得了好成绩,在图像质量、美学品质、鼠标指针等多个方面的得分均超过了全球首个实时可玩可交互的世界模型Oasis。

例如在一些无约束、不可控的真实场景,Matrix-Game 2.0可根据用户输入的任意控制指令,如键盘的 W/A/S/D 方向键、鼠标用于视角移动,生成对应的交互世界视频,支持角色的前后左右移动以及视角变换等动态行为。



▲Matrix-Game 2.0支持无约束、不可控的真实场景交互

在GTA游戏场景和Minecraft场景中,Matrix-Game 2.0也支持键盘与鼠标操作,并且能够生成真实感更强、符合物理逻辑的可交互视频。


▲Matrix-Game 2.0支持GTA游戏场景交互

二、自回归扩散生成机制,实时生成长视频

交互式视频生成领域的最新进展展现了扩散模型作为世界模型的潜力。然而,现有的交互式世界模型依赖于双向注意力机制和冗长的推理步骤,严重限制了实时性能。因此,它们难以模拟现实世界的动态。

为了解决这个问题,昆仑万维提出了Matrix-Game 2.0,一个交互式世界模型,它通过几步自回归扩散算法实时生成长视频。其基础模型源自WanX,通过移除文本分支并添加动作模块,该模型仅根据视觉内容和对应的动作来预测下一帧。

Matrix-Game 2.0的框架由三个关键组件组成:

1、一个适用于虚幻引擎和GTA5环境的可扩展数据生产流水线,可有效生成海量(约 1200小时)交互式视频数据;

2、一个动作注入模块,支持帧级鼠标和键盘输入交互;

3、基于随意架构的几步提炼,用于实时流式视频生成。

Matrix-Game 2.0基于Self-Forcing训练策略,通过创新的自回归扩散生成机制克服了传统双向扩散模型的延迟和误差累积问题:

1、因果扩散模型训练:将双向扩散模型蒸馏为因果模型,使用基础模型初始化生成器,并构建小规模数据集,通过近似ODE轨迹进行训练,稳定自回归扩散过程。通过历史帧条件生成当前帧,减少因依赖未来帧而导致的时序延迟。

2、分布匹配蒸馏(DMD):通过最小化与基础模型之间的分布差异,引导学生模型学习生成高质量视频帧,对齐训练与推理阶段的分布,显著缓解误差积累问题。

3、KV缓存机制:引入键值缓存机制(KV-Cache),显著提升长视频生成的效率和一致性。该机制通过维护固定长度的注意力上下文,实现无缝滚动生成,支持无限时长的视频输出,解决了训练与推理场景下上下文不一致的问题。基于此实现长时视频的高效生成而无需重复计算,单GPU上可实现25 FPS实时生成。

Matrix-Game 2.0能够以25 FPS的超快速度跨不同场景生成高质量的分钟级视频。昆仑万维开源其模型权重和代码库,以推进交互式世界建模的研究。

结语:世界模型加速具身智能、游戏影视发展

以谷歌Genie等为代表的世界模型,正推动AI从内容生成工具升级为“世界构建者”,昆仑万维开源的Matrix系列是中国在空间智能领域取得里程碑进展。

随着其最新迭代的Matrix-Game 2.0落地,具身智能体训练与数据生成、虚拟游戏世界高效搭建、影视及元宇宙内容生产等领域有望加速发展,为中国AI产业开辟新范式。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李湘王诗龄同框瘦成闪电!这回终于穿对了,15岁气质吊打一众名媛

李湘王诗龄同框瘦成闪电!这回终于穿对了,15岁气质吊打一众名媛

今古深日报
2026-07-04 11:20:28
四大公认“最难学”大学专业!含金量极高但易挂科,报考前要知道

四大公认“最难学”大学专业!含金量极高但易挂科,报考前要知道

狐狸先森讲升学规划
2026-07-06 02:05:03
欧洲留学生为实现“空调自由”有多拼?成都女生花2000元运费给在英男友寄千元空调,有人网上寻拼单搭子立省100欧

欧洲留学生为实现“空调自由”有多拼?成都女生花2000元运费给在英男友寄千元空调,有人网上寻拼单搭子立省100欧

极目新闻
2026-07-05 13:29:12
王力宏缝了39针,事故责任人被调查

王力宏缝了39针,事故责任人被调查

第一财经资讯
2026-07-05 11:17:55
为何印度总想霸占西藏?一旦西藏丢了,中国人连喝水都要看人脸色

为何印度总想霸占西藏?一旦西藏丢了,中国人连喝水都要看人脸色

鹏飞展翅
2024-07-10 15:35:01
大量上市!夏天敞开吃?高钾低钠,健脾胃消水肿

大量上市!夏天敞开吃?高钾低钠,健脾胃消水肿

鬼菜生活
2026-07-04 13:36:34
关店800家,连亏9个亿,“中国鞋王”日薄西山,创始人已倾家荡产

关店800家,连亏9个亿,“中国鞋王”日薄西山,创始人已倾家荡产

壹只灰鸽子
2026-07-03 13:35:04
破案了!为何姆巴佩面对巴拉圭坏动作“忍气吞声”?真相浮出水面

破案了!为何姆巴佩面对巴拉圭坏动作“忍气吞声”?真相浮出水面

墨印斋
2026-07-05 15:10:28
4换2!联手弗拉格!西部最被低估的交易

4换2!联手弗拉格!西部最被低估的交易

篮球教学论坛
2026-07-05 20:42:09
内蒙古东乌珠穆沁旗硝酸铵运输车事故已致2死4伤

内蒙古东乌珠穆沁旗硝酸铵运输车事故已致2死4伤

极目新闻
2026-07-05 19:07:17
不再是120/80,“新血压标准”已公布,别再自己吓自己!

不再是120/80,“新血压标准”已公布,别再自己吓自己!

芹姐说生活
2026-04-14 23:27:03
年纪大了,性生活时“力不从心”怎么办?多数老夫妻可能都做错了

年纪大了,性生活时“力不从心”怎么办?多数老夫妻可能都做错了

开心美食白科
2026-06-23 02:06:15
戴志诚和袁茵结婚多年后的合影,二人看起来挺有夫妻相的

戴志诚和袁茵结婚多年后的合影,二人看起来挺有夫妻相的

喜文多见01
2026-06-01 07:30:43
想拦都拦不住!冯德莱恩没想到,刚准备贸易战,中国空调爆单了

想拦都拦不住!冯德莱恩没想到,刚准备贸易战,中国空调爆单了

乐趣纪史
2026-07-05 00:40:54
打车去拉萨续:当事出租车已托运回重庆,司机飞机返程,50万大奖

打车去拉萨续:当事出租车已托运回重庆,司机飞机返程,50万大奖

阿莱美食汇
2026-07-05 21:04:01
雅典海报郑钦文c位出道,网友预测会给外卡,与团队聚餐心情不错

雅典海报郑钦文c位出道,网友预测会给外卡,与团队聚餐心情不错

网球之家
2026-07-05 22:15:51
中方亲自上门提醒马科斯,不要装傻充愣,处置菲防长尽快给个交代

中方亲自上门提醒马科斯,不要装傻充愣,处置菲防长尽快给个交代

小莜读史
2026-07-06 04:48:51
我国首架,首飞成功!

我国首架,首飞成功!

环球网资讯
2026-07-04 15:50:17
网友实拍西安赛格商城,人流量暴跌,冷冷清清,实体店太艰难!

网友实拍西安赛格商城,人流量暴跌,冷冷清清,实体店太艰难!

眼光很亮
2026-07-05 13:43:12
把瑜伽裤穿成日常的松弛感美女

把瑜伽裤穿成日常的松弛感美女

只要高兴就好
2026-04-13 14:30:30
2026-07-06 06:00:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
12176文章数 117121关注度
往期回顾 全部

科技要闻

华为:逻辑折叠将大幅提升麒麟CPU核心频率

头条要闻

白宫致电FIFA后美国队球员获“特赦” 特朗普表态

头条要闻

白宫致电FIFA后美国队球员获“特赦” 特朗普表态

体育要闻

姆巴佩点走巴拉圭:巴黎三代左锋传承

娱乐要闻

霉霉婚礼照片泄露 有四人违规

财经要闻

揭秘跨境“对敲”换汇黑产

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

游戏
亲子
数码
教育
家居

《漫威争锋》美国队长性感皮肤遭修改 粉丝们生气了

亲子要闻

工程车爱游泳

数码要闻

Intel Xe3P核显越来越近!Linux曝光新进展

教育要闻

“真希望他不是我亲生的!”父亲直言讨厌儿子,引来众多家长共鸣

家居要闻

传奇筑 日常诗

无障碍浏览 进入关怀版