网易首页 > 网易号 > 正文 申请入驻

Google发布Genie 3!3D世界模型或成巨头逐鹿新战场?

0
分享至

过去两周,大模型圈又热闹了起来。上周阿里在 Qwen 系列上再度加码,连发多个开源模型;这周紧接着,OpenAI 在沉寂五年后首次开放自家语言模型权重,在北京时间 8 月 6 日推出 GPT‑OSS,直接把开源模型的竞争推向一个新的高潮。

这个时间节点很微妙。阿里和 OpenAI 都在围绕语言模型(LLM)展开竞争,基于开源小模型优化对话、推理、生成文本的能力,用更开放的策略争夺开发者和生态。而 Google 的选择,却是在同日丢出了一颗不同赛道的「深水炸弹」——通用世界模型 Genie 3。

这个概念在去年 OpenAI 发布 Sora 时曾短暂爆红,当时不少人将 Sora 代表的视频生成模型看作通向世界模型的必经之路,加速 AGI 的实现。但热度来得快,退得也快:类 Sora 视频生成模型(包括 Google 自家的 Veo 3)终究只是生成视频,缺乏可导航、可交互的环境逻辑,也没有形成可迭代的生态,最终让「世界模型」话题逐渐沉寂。

而 Genie 3 的出现,显然不只是换个花哨名字。



它从架构上就是为实时交互设计——可以根据文本提示生成一个可持续几分钟的 3D 世界,支持角色移动、物体操控、天气变化等事件,还有持续一致的视觉记忆,让虚拟世界具备「空间连贯性」。同样很重要的一点是,这类世界模型不仅是炫技的内容生成器,更是智能体(AI Agent)训练的天然土壤:

提供可控、低成本、可重复的仿真环境,让智能体在其中学习决策与行动,而不必依赖昂贵且风险高的真实测试场景。

从这几个角度看,雷科技认为Genie 3 的推出可能不仅是一次技术路线的差异化突围,更可能是下一轮 AI 竞赛的前哨战——只是,这次的赛场,换成了 AI 生成世界。

一句话,就能生成几分钟的 3D 世界

要理解 Genie 3 的意义,最直接的方式就是和人们熟悉的两个类别作对比:一类是去年的「现象级」视频生成模型 Sora,一类是近两年在 3D 生成领域不断迭代的 Hunyuan 3D。

Sora 在去年引发热议,原因很简单:它能够生成长达一分钟、细节丰富的短视频,镜头切换流畅,光影、材质都逼近真实电影。但它的本质依然是视频生成——一段生成结果从头到尾是固定的,用户不能走进视频里,也不能影响视频的走向。但类 Sora 模型终究缺乏「可控交互」,你无法让视频中的角色转身看向你,更不能临时加一场雨或搬动一把椅子。

换句话说,Sora 给你的是一部成片,而不是一个可供探索的世界。但 Genie 3 的设计目标恰好相反,更像是 UE5 这类游戏引擎。



片段经过压缩和加速 2x,图/ Google



一句 Prompt 就能生成,图/ Google

Genie 3 生成的是可导航、可交互的虚拟物理环境,支持持续几分钟的 720p 实时渲染,并且环境内的细节会被记录——你离开一个房间再回来,墙上的涂漆还在原位,或者桌上的书依旧保持之前的翻开状态。



片段经过压缩和加速 2x,图/ Google

按照 Google DeepMind 的介绍,Genie 3 环境在几分钟内仍然保持高度一致性,视觉记忆可以回溯到一分钟之前。这种视觉记忆机制也是 Genie 3 的底层亮点之一,让生成世界具备「空间连贯性」,为交互带来沉浸感。

此外,Genie 3 还支持 promptable world events,也就是通过新的提示动态改变世界——可以随时切换晴天和暴雨,增加一只猫,或者将熊换成骑马的人,这些变化会在世界中持续生效。它不仅能「生成」,还能「更新」,这为开放式探索和游戏化交互提供了可能。



片段经过压缩和加速 2x,图/ Google



片段经过压缩和加速 2x,图/ Google

腾讯的 Hunyuan 3D 系列在 3D 资产生成领域的质量和速度都有口碑。7 月最新发布的 Hunyuan3D‑PolyGen 据称布线精度更高,细节更丰富,同时支持三边面和四边面,方便导入游戏引擎或 3D 渲染流程。这类模型生成的优势是细节丰富、贴图精准,非常适合资产制作、动画或工业设计,但生成的只是一个个静态的 3D 对象。



混元 3D 生成的模型,图/腾讯

Genie 3 则走向了另一个方向。它不是生成一个孤立的模型,而是构建一个可持续运行的动态物理环境,这个环境本身可以作为智能体(AI Agent)训练的沙箱:机器人可以在其中测试路径规划,无人车可以模拟避障,游戏 NPC 可以演练对话与任务逻辑。

更关键的是,这种环境是可重复、可控且低成本的,不需要真实场景的物理限制和安全风险。

不过 Google DeepMind 团队也指出了 Genie 3 目前的局限性,比如尽管支持在同一世界下的修改,但实际支持的动作范围受限。还有智能体的交互训练,本身多个智能体之间的复杂交互就是一个尚待突破的技术挑战,Genie 3 目前而言更多是有了这种潜力。

此外,考虑到 Genie 1 发布时还只支持 2D 交互,Genie 2 去年底发布的时候,仅仅支持最高 20 秒的 3D 交互,Genie 3 的出现毫无疑问是一次巨大的进步,也从侧面反映了世界模型的进步速度。

「世界模型」叫好不叫座,Genie 3 会是拐点吗?

「世界模型」这个词在 AI 圈的高光时刻,要追溯到 2024 年初。彼时 OpenAI 推出的视频生成模型 Sora,不仅在技术演示上惊艳四座,还被一些业内人士解读为通向世界模型的「前奏」。原因很直接:它能生成长时视频、具备一定的物理一致性,看起来像是在为未来可交互的虚拟环境做准备。

那段时间,充斥着「世界模型是通用人工智能(AGI)的必经之路」的各种分析和报道,普遍认为未来 AI 会先在虚拟世界学会一切再走向现实,热度甚至一度超过了同期的大语言模型升级消息。然而,这股热潮很快就退去。

这就是 Genie 3 登场的背景:一个技术潜力巨大、但话题度和资源支持都已经降温的领域。它的不同之处在于,不再停留在「视频生成」的阶段,而是真正进入了「可交互 3D 世界」的范畴——几分钟的持续渲染、可控事件触发、视觉记忆保持一致,这些特性直接回应了过去一年里技术难以跨越的门槛。

那么,Genie 3 会不会成为世界模型由「冷」转「热」的拐点?



片段经过压缩和加速 2x,图/ Google

从积极面看,它至少提供了一个现实可感的范例:世界模型不仅是研究论文里的设想,也可以以产品原型的形式存在,并且能服务于具体任务——无论是智能体训练、虚拟仿真,还是未来的沉浸式内容创作。这为行业提供了新的叙事素材,也可能吸引资本重新评估这一方向的商业潜力。

但要开启真正的竞争,还需要几个条件:

一是更多参与者进入,让世界模型不只是 Google 一家的技术尝试;
二是开放或半开放的生态,使外部开发者能够基于模型构建应用,推动迭代;
三是找到明确的落地场景,哪怕是细分市场的高价值应用,也能让技术验证与商业闭环相互促进。

不过目前可以肯定的是,Genie 3 把「世界模型」再一次摆回了技术舆论场的中心。世界模型会快速形成百家争鸣的格局?还是会像 Sora 的影响那样,在短暂热度后再次沉寂?这不仅取决于技术的迭代速度,也取决于整个 AI 行业是否已经准备好接受一个新的主战场。

写在最后

从阿里、OpenAI 在语言模型赛道上的连番出招,到 Google 用 Genie 3 打开另一扇通向未来的门,这几周的 AI 行业竞争像极了一场多线作战的拉锯战。不同于 LLM 的能力比拼与开源策略,Genie 3 把焦点放在了「可交互世界」的构建上,用几分钟持续渲染、可控事件和视觉记忆,为世界模型的可用性迈出了关键一步。

它未必会立刻引爆新的产业热潮,但至少证明了世界模型已经进入了一个新的阶段。对于智能体训练、虚拟仿真乃至沉浸式内容创作,这都意味着全新的可能性。接下来,能否吸引更多参与者、形成开放生态、找到清晰的落地场景,将决定这条赛道是短暂回温,还是真正走向繁荣。

这场世界模型的比赛,才刚刚鸣枪。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
10亿换一命!京东副总裁蔡磊对抗渐冻症4年后,终于赢得一线生机

10亿换一命!京东副总裁蔡磊对抗渐冻症4年后,终于赢得一线生机

王二哥老搞笑
2026-02-01 10:38:03
热水袋是大补,医生提醒:一个热水袋胜过十个老中医!不要嫌老土

热水袋是大补,医生提醒:一个热水袋胜过十个老中医!不要嫌老土

岐黄传人孙大夫
2026-01-29 05:55:03
东方卫视首播!31集谍战巨制,敌特潜入我方,王千源抓刘诗诗

东方卫视首播!31集谍战巨制,敌特潜入我方,王千源抓刘诗诗

乐枫电影
2026-02-01 14:36:35
台军女飞行员郭文静:只要长官敢下令,我会毫不犹豫的击落歼20!

台军女飞行员郭文静:只要长官敢下令,我会毫不犹豫的击落歼20!

顾史
2026-01-21 21:04:39
我54岁鳏夫,她33岁瑶族姑娘,洞房夜那晚我傻愣了

我54岁鳏夫,她33岁瑶族姑娘,洞房夜那晚我傻愣了

小月文史
2024-05-27 18:48:10
这就是杜月笙妻妾真实的样貌,并非演员扮演,货真价实的罕见照片

这就是杜月笙妻妾真实的样貌,并非演员扮演,货真价实的罕见照片

浩渺青史
2025-11-20 01:45:25
乌克兰大停电!英军驱逐俄罗斯货船,法国与欧盟19国有严重分歧

乌克兰大停电!英军驱逐俄罗斯货船,法国与欧盟19国有严重分歧

鹰眼Defence
2026-02-01 17:08:59
物业不让门口放鞋子或者鞋柜,看看“邻居家的新招”,干净整洁还美观!

物业不让门口放鞋子或者鞋柜,看看“邻居家的新招”,干净整洁还美观!

手工制作阿爱
2026-02-01 15:06:24
媒体人传来消息!王钰栋加盟欧洲豪门悬念揭晓 徐彬外租下家曝光

媒体人传来消息!王钰栋加盟欧洲豪门悬念揭晓 徐彬外租下家曝光

侃球熊弟
2026-02-01 00:06:51
徐杰焦泊乔复出!广东vs宁波12人名单 杜锋冲击队史交手9连胜

徐杰焦泊乔复出!广东vs宁波12人名单 杜锋冲击队史交手9连胜

狼叔评论
2026-02-01 18:46:02
56岁教授吃叶酸+维生素B12和B6,3年后复查,身体情况了?

56岁教授吃叶酸+维生素B12和B6,3年后复查,身体情况了?

岐黄传人孙大夫
2026-02-01 13:45:03
朱媛媛最后影像!杀青合影时强撑微笑,辛柏青全程陪护成最后守候

朱媛媛最后影像!杀青合影时强撑微笑,辛柏青全程陪护成最后守候

乐悠悠娱乐
2026-01-30 11:06:13
央视春晚第三次联排!近十年最强阵容,网友:今年春晚总算有救了

央视春晚第三次联排!近十年最强阵容,网友:今年春晚总算有救了

胡一舸南游y
2026-02-01 18:43:56
为什么毛主席总忘不了徐海东的恩情?有一件事比5000大洋更重要

为什么毛主席总忘不了徐海东的恩情?有一件事比5000大洋更重要

文史达观
2026-01-31 16:38:24
曼联英超唯一全勤铁人出人意料!新续命狂人,三要素让玻璃人变强

曼联英超唯一全勤铁人出人意料!新续命狂人,三要素让玻璃人变强

罗米的曼联博客
2026-02-01 09:45:55
经济压力有多大?个人每次挣钱低于1000元免交增值税,评论区扎心

经济压力有多大?个人每次挣钱低于1000元免交增值税,评论区扎心

你食不食油饼
2026-02-01 15:11:26
字母哥去哪里其实取决于两点:要钱还是要总冠军

字母哥去哪里其实取决于两点:要钱还是要总冠军

姜大叔侃球
2026-02-01 18:33:24
云南一中学,突然飞来一颗500吨巨石,稳稳立在院子中央,至今也无法知晓从何而来

云南一中学,突然飞来一颗500吨巨石,稳稳立在院子中央,至今也无法知晓从何而来

犀利强哥
2026-02-01 17:24:59
纪实:女儿多次被虐待浑身淤青,父亲冲进教室,怒砍校霸13刀致死

纪实:女儿多次被虐待浑身淤青,父亲冲进教室,怒砍校霸13刀致死

谈史论天地
2026-01-28 17:20:03
28岁川大博士在意大利失联十余天,姐姐最新发声:弟弟生活节俭四件套用了7年,原计划毕业后到昆明工作,自己正办签证出国寻找

28岁川大博士在意大利失联十余天,姐姐最新发声:弟弟生活节俭四件套用了7年,原计划毕业后到昆明工作,自己正办签证出国寻找

极目新闻
2026-02-01 13:10:29
2026-02-01 19:35:00
雷科技 incentive-icons
雷科技
专注AI硬科技
36001文章数 811808关注度
往期回顾 全部

科技要闻

腾讯元宝宣布:10亿现金红包,今日开抢

头条要闻

老人狱中离世14年后获无罪 孙子专门就读法律专业申诉

头条要闻

老人狱中离世14年后获无罪 孙子专门就读法律专业申诉

体育要闻

锁喉吃红牌+扇耳光 英超15人打群架

娱乐要闻

马年春晚第三次联排,多位明星现身

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

健康
家居
手机
艺术
公开课

耳石症分类型,症状大不同

家居要闻

蓝调空舍 自由与个性

手机要闻

别急着换机,只因下半年各大厂商都有大升级,这次等等党要赢了

艺术要闻

砸11亿!青岛山姆店终于要开了,山东人等太久!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版