网易首页 > 网易号 > 正文 申请入驻

以前累到吐血造的3D世界,现在一句话就行了?

0
分享至


昨晚,AI 界又来了一波小连招。

前有 Claude 编程更强的 Opus 4.1,中有谷歌突破性拉满的 Genie 3。奥特曼一看也坐不住了,赶紧上了个 GPT-OSS,是 OpenAI 第一次开源。

然而,Claude 编程咱可能没啥实感,OSS 的开源好像也没啥诚意。毕竟不是满血版 GPT,现在效果好的,能本地部署的大模型有的是,OSS 也没强到哪里去,甚至被嘲还不如国产同参数量的 GLM-4.5-Air。。。


相比起来,谷歌 DeepMind 这个 Genie 3,着实是有些惊艳得吓人了。江江这就带大伙儿看看,Genie 3 是怎么造出一个能玩能动,有 “ 记忆力 ” 的高清 3D 世界的。

作为一个世界模型,它延续了 Genie 1 和 2 的技术和概念,能通过文字提示词,实时生成一个高质量,可用上下左右键交互的物理环境。


话不多说,咱先给大伙儿看看效果。

说实话,下面这个视频,单拿出来说是哪个游戏录屏我都信。视角可以摆动,还能用方向键控制运动,小车速度快不说。甚至会顺着地形颠簸,对物理世界的理解拉满。


再看看水上开船,转向丝滑无比,连灯笼被船头推开的碰撞效果都特别真实。


视觉上能这么清晰顺畅,是因为 Genie 3 的实时帧率达到了每秒 24 帧,分辨率能到 720p,从这些参数上来看,真跟普通视频没啥区别了。

之前搞世界模型、实时生成的玩法咱也见过,不过那体验实在是差得有点多了。经常卡顿不说,场景一致性也做得稀碎,比如眼前本来有个人,转个头就没了( 害怕 )。甚至只是站在那里不动,场景也肉眼可见的在变。。。

来自 Dynamics Lab,试玩链接已放在文末


而 Genie 3,前后一致性好得可怕,保证一分钟前你在墙上刷的蓝色油漆是啥样,一分钟后回头来看还是啥样。


即使用 prompt 随时加东西,也不用担心画面会崩。


DeepMind 还试了试 Genie 3 和他们自己的 SIMA agent 相结合。开局一张图和一条指令,剩下的中间 prompt 全靠 agent 编。

比如给 Genie 3 一个面包房的照片,目标是移动到面包冷却架跟前,agent 就得知道啥是冷却架,还得知道按方向键往前走。


看了这么多例子,Genie 3 对物理的理解和一致性做得这么好,如此迅速流畅,江江一开始还以为它生成的是类似 Unity 那样完整的,遵循物理规律的 3D 场景建模。


然而,实际上它就是一帧一帧拼出来的。在单纯视频生成一致性都很难保证的情况下,Genie 3 是咋做到上蹿下跳还能不崩?这实在很让人好奇。。。

但由于自从 Genie 2 就没有技术报告,咱只能从蛛丝马迹里抠出来点信息,偷窥一下他们是咋施展这个魔法的。

作为 Genie 系列的第三代,Genie 3 和其它模型一样,都是踩着前浪长大的后浪。而说起它的前辈们,其实个个也不普通,都有不少创新闪光点。

比如 Genie 1 最先开创了上上下下左左右右的玩法。根据它的论文来看,为了让生成的内容连续可控,Genie 1 当年就是一个自回归模型,简单来说,每生成下一帧,都要记得回顾一下所有历史。

自回归示意图,来源:自回归视频模型 Magi-1 技术报告


Genie 1 还额外搞了个模块,专门关注空间和时间之间的关系,也就是时空建模。

到了训练阶段,因为大部分互联网视频都没动作标签,根本不知道视频里按了哪个键,会让人跑多远,所以他们选择直接用模型预测下一帧会干啥,逼模型自己学出每个动作的隐含意义,这也就是无监督潜在动作学习。

Genie 1 是生成 2D 场景


可惜,Genie 2 之后就没有技术报告了,从结果上看,它从 2D 进化到了 3D,能保持一致性的时长也达到了最多一分钟。

最后到了 Genie 3 这里,已经能做到长时间、强一致性的实时生成了。从一代的论文来猜,它们背后的一些技术像自回归、时空建模、无监督潜在动作学习等等,很可能是代代相传的。

而从 1 到 3,进步这么大,其实 DeepMind 也只花了一年半。。。未来可期啊。

不过,虽然效果很不错,DeepMind 也很诚实地表示,Genie 3 还是有很多不足的。比如环境里的行动空间还是会受到限制、对提示词要求很高、交互也只能持续几分钟等等。


要是这些问题都能解决,感觉离一键生成 3D 风景游戏啊、在超真实的环境里训练具身智能机器人啊、甚至小扎念念不忘的元宇宙都更近了一步。

总的来说,DeepMind 这波确实搞了个好玩的东西,比起隔壁卷参数、卷性能的大模型可有意思多了。

咱可能感觉不出来一个模型回答问题有没有更精准,但 Genie 3 这个视觉冲击、实时交互玩法可是实实在在的不一样了。

原来搞游戏开发,用各种引擎软件大伙儿累到吐血才能抠出来的游戏场景,现在用世界模型就能迅速做出来同样的效果,这性价比简直拉满。

不过唯一的问题,是 DeepMind 没开放过任何试用版本,希望他们不要在 Demo 里超神,试用里超鬼就好。。。

撰文:莫莫莫甜甜

编辑:江江 & 面线

美编:焕妍

图片、资料来源:

Genie 2、3 官方发布页

https://arxiv.org/pdf/2402.15391

https://arxiv.org/pdf/2505.13211

https://demo.dynamicslab.ai/chaos


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
全剧终了?高市已“举白旗”,不会再乱谈台海问题,马英九没说错

全剧终了?高市已“举白旗”,不会再乱谈台海问题,马英九没说错

混沌录
2025-11-20 00:11:03
波音747货机冲出跑道坠海致2人身亡,香港发表初步调查报告

波音747货机冲出跑道坠海致2人身亡,香港发表初步调查报告

鲁中晨报
2025-11-18 19:03:04
广东宏远VS山西男篮!萨林杰首秀,崔永熙出战,杜锋拒绝爆冷

广东宏远VS山西男篮!萨林杰首秀,崔永熙出战,杜锋拒绝爆冷

体坛瞎白话
2025-11-20 10:30:56
喻恩泰好友反击了!爆料史林子多次偷情出轨,并曝出露骨聊天截图

喻恩泰好友反击了!爆料史林子多次偷情出轨,并曝出露骨聊天截图

萌神木木
2025-11-18 19:36:17
差点被翻!火箭114-104骑士,看数据:他是头号功臣!

差点被翻!火箭114-104骑士,看数据:他是头号功臣!

篮坛篮谈
2025-11-20 09:26:55
深圳模特比赛争议后续:冠军一身赘肉年纪大,主办方发声却翻车

深圳模特比赛争议后续:冠军一身赘肉年纪大,主办方发声却翻车

深析古今
2025-11-19 13:26:48
喻恩泰发声回应!为孩子忍辱多年,情敌前妻看不下去,放猛料助攻

喻恩泰发声回应!为孩子忍辱多年,情敌前妻看不下去,放猛料助攻

阿纂看事
2025-11-19 22:34:25
俄罗斯警告高市早苗

俄罗斯警告高市早苗

极目新闻
2025-11-19 17:31:43
章泽天发文为自己庆祝32岁生日,网友:走出半生归来才32岁,羡慕

章泽天发文为自己庆祝32岁生日,网友:走出半生归来才32岁,羡慕

小咪侃娱圈
2025-11-20 10:51:10
10余名台湾同胞在意大利餐厅点5份披萨遭老板讽刺,当地华人团结反击致闭门歇业,旅行团:一共13个人,还点了多杯饮料

10余名台湾同胞在意大利餐厅点5份披萨遭老板讽刺,当地华人团结反击致闭门歇业,旅行团:一共13个人,还点了多杯饮料

极目新闻
2025-11-19 15:35:21
全运会乒乓球大结局!10块金牌今天全出炉,樊振东王楚钦冲击冠军

全运会乒乓球大结局!10块金牌今天全出炉,樊振东王楚钦冲击冠军

国乒二三事
2025-11-20 06:49:48
斯诺克赛程:决出4强,3场世界冠军较量,赵心童首秀,75双雄出战

斯诺克赛程:决出4强,3场世界冠军较量,赵心童首秀,75双雄出战

刘姚尧的文字城堡
2025-11-20 08:10:15
国会批准、特朗普改口,爱泼斯坦档案会成为美国政坛“核弹”吗?

国会批准、特朗普改口,爱泼斯坦档案会成为美国政坛“核弹”吗?

民言民语
2025-11-20 13:28:47
角逐940万大奖,丁俊晖火箭都0-4出局!赵心童独闯八强附对阵赛程

角逐940万大奖,丁俊晖火箭都0-4出局!赵心童独闯八强附对阵赛程

求球不落谛
2025-11-20 07:05:55
琉球不属日本,50年代琉球老照片:街头到处是中文,琉球女孩漂亮

琉球不属日本,50年代琉球老照片:街头到处是中文,琉球女孩漂亮

法老不说教
2025-11-19 15:02:39
初三学生被霸凌者打断肋骨,母亲不去派出所,隔天校园来六辆商务车

初三学生被霸凌者打断肋骨,母亲不去派出所,隔天校园来六辆商务车

悬案解密档案
2025-10-21 09:24:49
央八开播!年代传奇剧《大生意人》定档,看完阵容我说:这剧要爆

央八开播!年代传奇剧《大生意人》定档,看完阵容我说:这剧要爆

可乐谈情感
2025-11-20 12:11:49
难怪解放军连续出重拳,日方极力隐藏的武器,被中方发现了

难怪解放军连续出重拳,日方极力隐藏的武器,被中方发现了

林子说事
2025-11-19 13:12:28
创业板指翻绿 开盘一度涨近2%

创业板指翻绿 开盘一度涨近2%

财联社
2025-11-20 10:22:06
电池不变续航升级821公里,Model Y含金量还在提高

电池不变续航升级821公里,Model Y含金量还在提高

邱小铖
2025-11-18 17:43:19
2025-11-20 14:35:00
差评XPIN incentive-icons
差评XPIN
用知识和观点Debug the world!
9859文章数 489233关注度
往期回顾 全部

科技要闻

英伟达单季狂揽570亿美元,手握5000亿订单

头条要闻

日媒爆料:高市或于中国重要日子当天参拜靖国神社

头条要闻

日媒爆料:高市或于中国重要日子当天参拜靖国神社

体育要闻

Faker,何以成为Faker

娱乐要闻

胡彦斌易梦玲恋情曝光,相差16岁

财经要闻

霸王茶姬创始人将与“光伏女神”结婚

汽车要闻

一汽丰田发布IT'S TiME 3.0 三款焕新产品同步亮相

态度原创

房产
旅游
亲子
健康
军事航空

房产要闻

29.4亿!海南“地王”片区,要卖超级宅地!

旅游要闻

不止聚人气,更要留价值!虹口“文旅商体展”联动的优质答卷 | 解读虹口“十四五”

亲子要闻

出生仅仅 28 天的宝宝,竟然能听懂“敬礼”指令!

警惕超声报告这六大"坑"

军事要闻

量大管饱 中国军网在海外发布备战视频

无障碍浏览 进入关怀版