网易首页 > 网易号 > 正文 申请入驻

在世界模型分岔口,李飞飞与谷歌新模型给出了不同答案

0
分享至

蓝鲸新闻9月19日讯(记者 武静静)在生成式 AI 的叙事进入深水区后,业界的焦点逐渐从文本和图像生成转向"世界模型"。与传统的内容生成不同,世界模型试图让 AI 对真实的物理环境有更完整的理解与预测能力,它不仅回答"看到的世界长什么样子",还要回答"接下来世界中会发生什么"。

生成式 AI 的下一轮竞争中,"世界模型"正在成为各方押注的核心方向。最近,李飞飞教授团队创立的公司 World Labs 发布了全新产品 Marble,这是一款基于图像到3D生成技术的升级版工具,强调在空间结构和几何一致性上的突破。与此同时,此前,谷歌 DeepMind 发布了其世界模型项目 Genie 3,侧重交互和物理规律的推演。

图:Marble生成的内容的一张截图,右上角为动态视频中的小地图

虽然,Marble与谷歌 DeepMind 发布的 Genie 3 看上去都是世界模型,但是背后的技术路径和认知则截然不同。

Marble与Genie 3,对世界模型不同技术路线的实践

World Labs 成立于 2024 年 4 月,短短几个月就吸引了硅谷顶级投资机构 a16z 和 Radical Ventures 的下注。资本的快速进入,本质上是对"空间智能"这一全新技术方向的认可。

Marble 目前处于测试阶段,它的特点是可以通过一张图片或一句文字,生成一个完整、可自由探索的三维虚拟世界。生成的环境不会随时间消失或出现形变,整体保持高度的一致性和几何连贯性。用户进入后,可以像在游戏里一样用鼠标自由游览。

有创作者用 Marble 搭建了一个可导航的舞台,并在其中规划镜头和场景,就像拍摄电影一样。而 World Labs 方面则强调,Marble 不仅能生成规模更大、风格更丰富的环境,还能提供更清晰的三维几何细节。它更适合构建舞台、房间或广阔的自然景观,而不是单一的物体或角色。

在 Marble 的官网上,已经有人用它创造出奇幻的房屋、海底世界和森林地图,看起来颇有"头号玩家"式的沉浸感。创作者们还能对场景进行缩放、拼接和多代迭代,从而得到更复杂、更持久的世界。无论是动漫风、卡通风,还是照片级的真实画面,它都能支持,这让电影人、游戏开发者和数字艺术家都可能成为它的用户。

资深的AI应用用户Jason 在亲自体验了一个月 Marble AI 后表示,李飞飞教授的团队选择了一条与主流完全不同的路径,去探索、"空间智能"。和 Genie3 这种强调交互、实时生成的视频模型不同,Marble 更关注空间结构本身的合理性与关联性。

他提到,Marble 不是实时生成的,但可以被实时探索。他用 plus 版大约十分钟就能生成一个完整的空间环境,里面可以前进、探索,具备物理空间结构,而不仅仅是视频帧或深度贴图。

不过,由于还是早期版本,Marble 生成的只是一个"世界空间的壳",画面精度有限,局部模糊,也缺乏光影变化或物理现象的交互。他强调,这并不是大家口中常说的"世界模型",因为智能更多体现在生成过程中,而非交互环节。

"它谈不上颠覆,但确实展示了另一种可能性。"Jason 说。他认为,Marble 最大的价值在于从空间维度去探索世界生成,在空间合理性和物理关联上开了一个新口子。

与 Marble 强调空间几何不同,谷歌 DeepMind 推出的 Genie 3 代表了另一种逻辑:它关心的是"空间里正在发生什么"。

Genie 3 可以通过文本提示生成动态环境,并以每秒 24 帧、720p 的分辨率运行数分钟。它的独特之处在于,不依赖动作标签,而是通过视频训练推断潜在的交互逻辑。例如,给它一张游戏截图或一幅火柴人草图,它能自动推断出谁是玩家角色,哪些元素可以跳跃、移动或互动。这让 Genie 3 更像一个"交互物理模拟器",而非几何建模工具。

换句话说,如果 Marble 是"舞台布景师",Genie 3 就是"规则设定者"。前者提供一个逼真的空间容器,后者让容器内的角色与事件真正"活起来"。

一位AI领域资深投资人告诉蓝鲸科技,一个真正完整的虚拟世界,需要两者结合:既要有稳定连贯的空间,也要有动态交互的逻辑。如果说 Marble 提供的是"眼见为实"的真实感,Genie 3 代表的则是"身临其境"的互动感。

Marble 背后有 a16z 这样的科技长期主义者,他们看重的是空间智能可能带来的平台化机会——未来或许可以成为下一代虚拟环境构建工具。Genie 3 的意义则在于强化谷歌在世界模型上的前沿地位,借此推进具身智能和通用 AI 的研究。两家机构背后的发心不同,路径选择也不同,

不过他认为,从商业化角度来看,Marble 的短期路径更清晰,直接面向内容生产行业。而 Genie 3 则更偏科研和前沿探索,距离可规模化应用还有一定距离。

世界模型的产业化路径

与硅谷的探索不同,中国创业公司正在尝试让世界模型快速落地。极佳科技就是其中的代表。极佳科技团队曾在自动驾驶仿真领域积累多年,帮助多家车企构建虚拟测试环境。公司去年开始转向具身智能领域。他们发布了基于世界模型训练的 VLA(视觉-语言-动作模型)—— GigaBrain,其世界模型平台 GigaWorld 也将在近期上线,提供更开放的仿真环境。

极佳科技联合创始人朱政指出,不同领域对"世界模型"的定义差异很大:在 计算机视觉(CV) 领域,研究者更关注视频生成与画面一致性;在 强化学习(RL) 领域,重点是为 agent 提供一个足够逼真的环境,以便进行动作决策;在 具身智能 方向,则强调如何让机器人通过世界模型理解环境、执行任务。

"无论哪种定义,核心价值都在于预测未来。"他解释说,"给定一个动作序列,世界模型需要告诉我们环境会如何变化。这种预测能力可以应用于文生视频、自动驾驶,也可以体现在机器人动作规划中。"

在他的规划中,世界模型的产业化大致经历三个阶段:数据生成阶段:用世界模型扩展训练数据,降低真实采集成本;仿真阶段:为智能体提供闭环仿真环境,提高训练效率;智能进化阶段:最终成为下一代 VLA,具备推理与行动能力,成为通用智能的核心。

相比谷歌等大厂的科研导向,中国创业公司的优势在于"贴近场景"。自动驾驶、工业仿真、VR 内容生产,这些应用都有明确的市场需求。世界模型可以在这些场景中直接发挥价值,从而更快地形成商业闭环。

不过,挑战同样存在,生成和训练世界模型需要极大算力,创业公司难以长期独立承担;此外,目前行业对世界模型没有统一标准,不同技术路线之间缺乏可比性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
别再尬演白月光!顶着大刀双眼皮一脸疲态,这能让男人念念不忘?

别再尬演白月光!顶着大刀双眼皮一脸疲态,这能让男人念念不忘?

揽星河的笔记
2026-04-25 15:08:35
我给保姆两年涨薪五次,她临别提醒:太太,你最好看看天花板上面

我给保姆两年涨薪五次,她临别提醒:太太,你最好看看天花板上面

千秋文化
2026-04-25 20:32:18
里皮助手:亚洲杯中国0-2韩国当晚,我就向那不勒斯推荐了金玟哉

里皮助手:亚洲杯中国0-2韩国当晚,我就向那不勒斯推荐了金玟哉

兰亭墨未干
2026-04-25 16:32:08
北京车展冒出一堆路虎风味国产电车

北京车展冒出一堆路虎风味国产电车

源Auto
2026-04-24 20:19:02
印度下最后通牒,要求中方必须卖尿素,中国:抱歉,没有义务

印度下最后通牒,要求中方必须卖尿素,中国:抱歉,没有义务

涵豆说娱
2026-04-24 12:10:09
停止焦虑最好的办法,不是读书,不是运动,而是……

停止焦虑最好的办法,不是读书,不是运动,而是……

壹心理
2026-04-19 11:03:36
5倍大牛股 宣布将“戴帽”, DeepSeek概念股称可能“戴帽”

5倍大牛股 宣布将“戴帽”, DeepSeek概念股称可能“戴帽”

每日经济新闻
2026-04-25 12:22:54
西汉姆联2-1埃弗顿,威尔逊补时绝杀,绍切克头槌+门线救险

西汉姆联2-1埃弗顿,威尔逊补时绝杀,绍切克头槌+门线救险

懂球帝
2026-04-26 00:53:28
美技术封锁遇挫,中国AI破“铁幕”

美技术封锁遇挫,中国AI破“铁幕”

烽火瞭望者
2026-04-25 12:10:19
西方失算了,本想拖垮俄罗斯,不料中国出手,用黄金帮俄罗斯续命

西方失算了,本想拖垮俄罗斯,不料中国出手,用黄金帮俄罗斯续命

夜寒兮月孤静
2026-04-24 17:13:50
福原爱生三胎后首次露面 日本网友称她与古贺纱里奈站一起像母女

福原爱生三胎后首次露面 日本网友称她与古贺纱里奈站一起像母女

劲爆体坛
2026-04-25 12:44:09
柬埔寨涉电诈议员遭美制裁:利用其政治关系保护诈骗中心及运营者

柬埔寨涉电诈议员遭美制裁:利用其政治关系保护诈骗中心及运营者

红星新闻
2026-04-24 17:36:29
布雷默:我29岁了没多少时间能虚度,我最真实的想法就是想赢

布雷默:我29岁了没多少时间能虚度,我最真实的想法就是想赢

懂球帝
2026-04-26 00:10:03
米特里策被停赛4场后,浙江队4场比赛0进球&1平3负未尝胜绩

米特里策被停赛4场后,浙江队4场比赛0进球&1平3负未尝胜绩

懂球帝
2026-04-25 20:58:52
德普前妻隐居欧洲迎双胞胎!单亲妈妈带3娃新照引热议,有人猜生父是她前任马斯克?

德普前妻隐居欧洲迎双胞胎!单亲妈妈带3娃新照引热议,有人猜生父是她前任马斯克?

英国报姐
2026-04-24 20:39:48
何猷亨与新女友,相互依偎笑得甜蜜,女方一头长发好斯文

何猷亨与新女友,相互依偎笑得甜蜜,女方一头长发好斯文

民宿体验志
2026-04-25 14:48:54
离横扫只差1场,湖人怎么赢的,4件事很正确,一人要拿大合同了

离横扫只差1场,湖人怎么赢的,4件事很正确,一人要拿大合同了

体坛大辣椒
2026-04-25 11:16:37
刚发布就落伍!DeepSeek V4竟坦承不如GPT-5.4

刚发布就落伍!DeepSeek V4竟坦承不如GPT-5.4

电脑报少年派
2026-04-24 14:34:49
鲍尔默6000万美元投资血本无归,痛斥欺诈创始人“我被骗了”

鲍尔默6000万美元投资血本无归,痛斥欺诈创始人“我被骗了”

IT之家
2026-04-25 12:43:15
9岁女童确诊胰腺癌,医生怒问父母:怎能天天给孩子吃这些?

9岁女童确诊胰腺癌,医生怒问父母:怎能天天给孩子吃这些?

健康之光
2026-04-22 17:37:49
2026-04-26 01:07:00
蓝鲸新闻 incentive-icons
蓝鲸新闻
财经信息服务平台
131475文章数 193845关注度
往期回顾 全部

科技要闻

DeepSeek V4发布!黄仁勋预言的"灾难"降临

头条要闻

媒体:美军在中东罕见高密度集结 伊朗开始调整战术

头条要闻

媒体:美军在中东罕见高密度集结 伊朗开始调整战术

体育要闻

那一刻开始,两支球队的命运悄然改变了

娱乐要闻

《我们的爸爸2》第一季完美爸爸翻车了

财经要闻

90%订单消失,中东旺季没了

汽车要闻

2026款乐道L90亮相北京车展 乐道L80正式官宣

态度原创

亲子
教育
时尚
手机
艺术

亲子要闻

发生率仅十万分之一!这种稀有血型跨省紧急调配,只为守护母婴安全

教育要闻

一根风筝线,牵起一个校长的教育梦

这些穿搭适合春天!外套彩色内搭白色、裤子穿基础款,舒适大方

手机要闻

iPhone Ultra机模上手:11mm厚、无长焦,苹果第一折就这?

艺术要闻

最适合作为抖音总部的大楼,它在福建莆田!

无障碍浏览 进入关怀版