![]()
去年,Google展示了其AI世界模型的升级版本Genie 3,它具备了令人印象深刻的长期记忆能力,能够仅从简单的文本提示就创建交互式世界。当时,Google只向少数受信任的测试者提供了Genie。现在,作为Project Genie,它的可用范围更加广泛,但仅限于订阅Google最昂贵AI服务的用户。
什么是世界模型
世界模型正如其名称所示——这是一种能够即时生成动态环境的AI。不过,它们在技术上并不是3D世界。像Genie 3这样的世界模型会创建一个响应你控制输入的视频,让你能够像探索真正的虚拟世界一样探索这个模拟环境。Genie 3在世界模型领域是一个突破,因为它能够在更长的时间内记住它所创建世界的细节。但在这种情况下,"更长时间"是指几分钟。
Project Genie的功能特性
Project Genie本质上是Genie 3的清理优化版本,它集成了更新的AI模型,如Nano Banana Pro和Gemini 3。Google在Project Genie中提供了许多预构建的世界,但使其真正有趣的是创建新内容的能力。你可以提供参考图像,或者简单地告诉Genie你想要从环境和角色中得到什么。
系统首先生成一张静态图像,然后你可以从中生成世界。这就是Google所说的"世界素描"。如果你不喜欢Nano Banana Pro创建的参考图像,你可以在将其交给Genie之前进行修改。
生成的视频为720p分辨率,渲染速度约为每秒24帧。当你使用WASD按键移动角色时,Genie会以接近实时的方式渲染前方的路径。
如果60秒的AI世界探索还不够,你可以重新运行提示。由于这是生成式AI,每次的结果都会略有不同。Google还允许你使用新角色和视觉风格来"重新混合"其预构建的世界。你探索过程的生成视频也可以下载。
仍处于实验阶段
Google强调Project Genie仍只是一个研究原型,因此存在一些显著的限制。任何使用过Google Veo或OpenAI Sora创建AI视频的人都知道,即使创建一个短片段也需要几秒钟。因此,Genie能够让人感觉到交互性本身就令人印象深刻。然而,会存在一些输入延迟,而且每个世界只能探索60秒。此外,之前为Genie 3演示的可提示事件功能(允许在运行的模拟中插入新元素)尚未可用。
虽然Google一直在宣传Genie准确建模物理现象的能力,但公司指出,测试者可能会看到一些看起来或行为不太正确的世界示例。测试者也可能看到内容限制的变化。The Verge网站能够测试Project Genie,最初它很乐意生成任天堂游戏的仿制版,如超级马里奥和塞尔达传说。但在测试结束时,The Verge报告称,由于"第三方内容提供商的利益",一些这样的提示被屏蔽了。
Project Genie只能通过专用的网络应用程序访问——它不会集成到Gemini应用程序或网站中。目前,你只能通过AI Ultra订阅访问这个工具,每月费用为250美元。生成所有这些AI视频成本昂贵,因此从高级层开始是合理的。Google表示其目标是随着时间的推移开放Project Genie的访问权限。
Q&A
Q1:Project Genie是什么?它能做什么?
A:Project Genie是Google开发的AI世界模型工具,它能从图片或文本提示创建交互式虚拟世界。用户可以使用WASD键控制角色在生成的720p视频世界中探索,系统会实时渲染前方路径,每次探索时长为60秒。
Q2:Project Genie如何收费?普通用户能使用吗?
A:目前Project Genie只对订阅AI Ultra的用户开放,月费为250美元。它只能通过专用网络应用访问,不集成在Gemini应用中。Google表示将逐步开放更多用户的访问权限。
Q3:Project Genie生成的世界质量如何?有什么限制?
A:系统生成720p、24fps的视频世界,但仍是研究原型,存在输入延迟、每次只能探索60秒等限制。可能出现物理行为不正确的情况,且对第三方版权内容有限制,如任天堂游戏相关内容会被屏蔽。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.