网易首页 > 网易号 > 正文 申请入驻

谷歌深夜放出「创世引擎」Genie 3!一句话秒生宇宙,终极模拟器觉醒

0
分享至

新智元报道

编辑:桃子 好困

【新智元导读】老黄曾预言,每个像素都将由AI生成!刚刚,谷歌DeepMind放出的「通用世界模型」Genie 3,一句话即生720p实时模拟世界,1分钟视觉记忆一致性超高。

全球最强「世界AI模拟器」今夜诞生!

刚刚,谷歌DeepMind祭出新一代通用世界模型——Genie 3,能模拟出史无前例的丰富交互环境。

一句话,Genie 3即可生成一个动态世界。

令人惊艳的是,它能以每秒20-24帧速度,实时生成720p画面,还能持续数分钟一致性。

相比于前代,Genie 3在生成时长方面也得到了史诗级的加强——一口气能搞定长达数分钟,且内容连贯的可交互世界。

英伟达Jim Fan高度评价,「这就是游戏引擎2.0时代」!

总有一天,UE5所有复杂功能,都能被一个数据驱动的「注意力权重」吸纳。

未来,只需要将手柄指令作为输入,即可渲染一段时空中的像素画面。

如今,Genie 3的问世,标志着世界模拟AI迈向了全新高度,加速了人类通向AGI/ASI的终极目标。

AI实时交互模拟,真·矩阵世界

一直以来,「世界模型」被业界看作是通往AGI道路上的关键基石。

因为,它能让AI智能体在无限丰富的模拟环境中接受训练。

十多年来,谷歌DeepMind一直在模拟环境领域引领前沿研究,从训练AI智能体玩转即时战略游戏,到为开放式学习和机器人技术开发模拟环境。

正是在这些研究的推动下,他们开发出了「世界模型」。

它能够利用其对世界的理解,来模拟世界的方方面面,从而让AI智能体可以预测环境如何演变,以及自身行为带来的影响。

去年,谷歌DeepMind首次放出世界模型——Genie 1和Genie 2,它们能为AI智能体生成全新的环境。

此外,Veo 2、Veo 3模型相继迭代,也在不断突破视频生成的技术前沿,能够深刻理解物理世界的规律。

每一款模型,都标志着世界模拟在不同能力维度上的进步。

而Genie 3,是谷歌DeepMind首个支持「实时交互」的世界模型。

相较于Genie 2,一致性和真实感均有提升。

谷歌DeepMind研究员Ali Eslami惊叹道,Genie 3绝对是自ChatGPT以来最令人印象深刻的演示。

2016年,他曾研究「神经表示与渲染」隐约看到通往这一目标路径,但没想到这一天来得这么快。

Hassabis同样感慨道,上世纪90年代,当自己设计模拟游戏时,曾梦想有一天实现这一技术。如今,愿望终于达成。

接下来,具体看看Genie 3具备哪些强大能力?

· 模拟物理世界

理解物理世界,是任何一个世界模型必备能力。

Genie 3不仅可以生成水流、光照等自然现象,还能与复杂环境进行交互。

左右滑动查看

· 模拟自然世界

Genie 3还可以生成充满生命力的自然系统,不论是错综复杂的森林、花草等植物,还是各种生物,都能让人仿佛置身于真实生态之中。

左右滑动查看

· 创建动画奇幻世界

不仅如此,Genie 3的想象力也没有边界。

它能创造出奇幻场景,以及富有表现力的动画角色,比如彩虹桥上的卡通狐狸、森林中的萤火虫等等。

左右滑动查看

· 探索地点与历史场景

更令人想不到的是,Genie 3还能玩穿越。

不论是重现古代文明的辉煌,还是探索不同的地方,它都能带你跨越时空,体验景点的独特魅力。

左右滑动查看

不得不说,Genie 3的实时交互能力,令人叹为观止。

那么,谷歌DeepMind是如何具体实现的呢?

一分钟视觉记忆,Genie 3涌现了

要实现Genie 3的实时交互与长时程一致性,技术团队攻克了诸多难题。

在自回归地生成每一帧画面的过程中,模型必须考虑到随时间推移而不断延长的先前轨迹。

举个栗子,当玩家在一分钟后重访某个地点时,模型必须调取一分钟前的相关信息。

为了实现实时交互,这种计算必须在新用户输入抵达时每秒执行多次,以做出即时响应。

此外,要让AI生成的世界富有沉浸感,就必须在很长的时间跨度内保持物理上的一致性。

然而,自回归地生成一个环境,通常比一次性生成整个视频的技术难度更大,因为微小误差会随时间累积。

尽管面临这一挑战,Genie 3生成的环境仍能在数分钟内基本保持一致,其视觉记忆最远可追溯到一分钟前。

左右滑动查看

如下图可见,建筑左侧的树木在交互过程中始终如一,即使时隐时现也保持稳定。

Genie 3的一致性是一种涌现能力。

NeRFs和高斯溅射(Gaussian Splatting)虽然也能实现一致的可导航3D环境,但它们依赖于提供显式的3D表征。

相比之下,Genie 3 生成的世界则远为动态和丰富,因为它们是模型根据世界描述和用户行为逐帧创造出来的。

一句话,一个世界

除了导航输入,Genie 3还支持一种更具表现力的文本交互形式,团队称之为「由提示词驱动的世界事件」。

直白讲,一句话生成世界。

不论是改变天气,还是引入新物体或角色,这种能力大幅提升了沉浸感。

与此同时,它也拓展了反事实(即what if)场景的广度,可供 AI 智能体在经验学习中用于处理各种意外情况。

比如,在北美大草原上,你可以让Genie 3即时生成一辆绿色拖拉机、一位骑马的人;在滑雪场景中,生成一个衣服上印有「Genie 3」的人,或是一个香蕉滑翔伞;在伦敦街景中,还可以空降Dragon。

左右滑动查看

智能体「试炼场」

为了验证Genie 3所创世界,对未来AI智能体训练的兼容性,团队为新版SIMA智能体生成了多个世界。

在每个世界中,都指示该智能体去达成一系列特定目标。

它会通过向Genie 3发送导航指令,来尝试完成任务。假设让它走向和面机和面包架,Genie 3都能指示智能体去完成目标。

左右滑动查看

与所有其他环境一样,Genie 3并不知道智能体的目标,它只是根据智能体的行为来模拟世界的未来走向。

由于Genie 3能够保持一致性的能力,现在可以执行更长的动作序列,以实现更复杂的目标。

左右滑动查看

局限性

尽管Genie 3拓展了世界模型的能力边界,但也存在一定的局限性,具体包含以下5点:

  • 有限的动作空间

虽然由「提示词驱动的世界事件」允许广泛的环境干预,但这些干预不一定由AI智能体自身执行。AI智能体目前能直接执行的动作范围仍然有限。

  • 与其他智能体的交互和模拟

在共享环境中精确模拟多个独立智能体之间的复杂互动,仍是研究领域的一大挑战。

  • 真实世界位置的准确表征

Genie 3 目前还无法以完美的地理精度模拟真实世界的地点。

  • 文本渲染

通常只有在输入的世界描述中提供了文本信息时,模型才能生成清晰易读的文字。

  • 有限的交互时长

模型目前可支持数分钟的连续交互,而非长达数小时的持续互动。

世界模型,分水岭已至

尽管如此,Genie 3是世界模型发展的一个重要里程碑。

它能为教育和培训创造新机遇,帮助学生学习、助力专家积累经验。

它不仅能为机器人和自主系统等 AI 智能体提供广阔的训练空间,还能用于评估智能体的性能并探究其弱点。

在迈向AGI征途中,Genie 3描绘了一个由AI加持,充满交互与创意的世界,一个世界模型全新的未来。

再次狙击Genie 3之后,OpenAI团队Steven Heidel献上彩虹屁,「真是一个见证AGI时刻」。

神仙打架的好戏,正式开演。

参考资料:

https://deepmind.google/discover/blog/genie-3-a-new-frontier-for-world-models/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一周最少8次,54岁女子肛裂住院,丈夫哭诉:怎么劝她就是不听!

一周最少8次,54岁女子肛裂住院,丈夫哭诉:怎么劝她就是不听!

健康之光
2026-04-13 09:01:59
304万亿,我国的货币发行总量已经是世界第一了。

304万亿,我国的货币发行总量已经是世界第一了。

流苏晚晴
2025-11-18 20:20:14
睡一觉5万没了!全国多地爆发新型盗刷,睡前必查手机这4处

睡一觉5万没了!全国多地爆发新型盗刷,睡前必查手机这4处

洞见小能手
2026-04-20 16:03:26
茅台不行了,贵州靠什么?

茅台不行了,贵州靠什么?

BT财经
2026-04-21 22:25:03
收拾完伊朗,下一个轮到中国?以色列发战争威胁,中方送出5个字

收拾完伊朗,下一个轮到中国?以色列发战争威胁,中方送出5个字

千羽解读
2026-04-18 10:12:15
叔本华:性欲是一切欲望的焦点

叔本华:性欲是一切欲望的焦点

听哲学
2026-03-24 21:42:04
宁波K11是不是要凉了?曾经受万众瞩目的商业广场

宁波K11是不是要凉了?曾经受万众瞩目的商业广场

石辰搞笑日常
2026-04-21 12:04:32
泽连斯基怒批特朗普:乌克兰之所以打不赢俄罗斯,全是你帮倒忙

泽连斯基怒批特朗普:乌克兰之所以打不赢俄罗斯,全是你帮倒忙

流年恰似繁花汐
2026-04-21 18:00:40
警察绝对不能插手的5件事,真不能管,否则违法!

警察绝对不能插手的5件事,真不能管,否则违法!

细说职场
2026-04-20 15:52:21
中央5台直播乒乓球时间表:4月21日CCTV5直播国乒!附国乒新消息

中央5台直播乒乓球时间表:4月21日CCTV5直播国乒!附国乒新消息

生活新鲜市
2026-04-21 17:13:40
王立群教授:用权力泡女人,女人在你面前服服帖帖,用金钱泡女人,女人是满脸不服气,甚至讨价还价...

王立群教授:用权力泡女人,女人在你面前服服帖帖,用金钱泡女人,女人是满脸不服气,甚至讨价还价...

深度知局
2026-04-08 07:41:14
其实任何一个女人,都希望得到男人的青睐和认可

其实任何一个女人,都希望得到男人的青睐和认可

加油丁小文
2026-04-21 07:00:12
新一轮四大名著翻拍潮来了,高希希和正午阳光正面竞争《三国》

新一轮四大名著翻拍潮来了,高希希和正午阳光正面竞争《三国》

歪歌社团
2026-04-17 01:45:20
23日冷空气后,还有2波大范围雨水,雨要下到5月4号立夏之后?

23日冷空气后,还有2波大范围雨水,雨要下到5月4号立夏之后?

风云圈天气
2026-04-22 00:25:02
突然调整!南京多所新建学校改建、缓建、停建!

突然调整!南京多所新建学校改建、缓建、停建!

南京择校
2026-04-21 10:57:34
与李晨分手6年后嫁普通人,以为是好牌打烂,其实她才是人生赢家

与李晨分手6年后嫁普通人,以为是好牌打烂,其实她才是人生赢家

悦君兮君不知
2026-04-20 21:07:31
毛主席给救命恩人敬酒,不由得摇了摇头:你不是当年背我的那个人

毛主席给救命恩人敬酒,不由得摇了摇头:你不是当年背我的那个人

大运河时空
2026-04-21 12:20:03
14亿人都不会忘却!揭开核酸大王张核子的真面具:权力变现大公

14亿人都不会忘却!揭开核酸大王张核子的真面具:权力变现大公

大鱼简科
2026-02-07 09:52:29
事实证明,面馆只是表象,离婚多年的文章,终于找到了自己翻身路

事实证明,面馆只是表象,离婚多年的文章,终于找到了自己翻身路

趣味萌宠的日常
2026-04-20 19:49:54
提帮功放假返回泰国,带朋友海边度假,瘦了白了有西拉米美貌加成

提帮功放假返回泰国,带朋友海边度假,瘦了白了有西拉米美貌加成

可乐谈情感
2026-04-19 20:55:49
2026-04-22 04:51:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15030文章数 66797关注度
往期回顾 全部

科技要闻

创造4万亿帝国、访华20次,库克留下了什么

头条要闻

三国取消飞航许可 赖清德无法窜访斯威士兰

头条要闻

三国取消飞航许可 赖清德无法窜访斯威士兰

体育要闻

一到NBA季后赛,四届DPOY就成了主角

娱乐要闻

宋承炫晒宝宝B超照,宣布老婆怀孕

财经要闻

现实是最大的荒诞:千亿平台的冲突始末

汽车要闻

全新坦克700正式上市 售价42.8万-50.8万元

态度原创

数码
房产
健康
旅游
艺术

数码要闻

大疆DJI Mic Mini 2发布:329元起 可更换麦克风磁吸前盖

房产要闻

年薪40-50万!海南地产圈还在猛招人

干细胞抗衰4大误区,90%的人都中招

旅游要闻

京城今春“滨水+”玩法迭代

艺术要闻

任伯年写竹,真带劲

无障碍浏览 进入关怀版