![]()
抓住风口
本期要点:如此惊艳的技术,究竟有什么用?
你好,我是王煜全,这里是王煜全要闻评论。
当AI能一键生成虚拟世界时,也在考验我们对价值本身的认识。
上周五,谷歌DeepMind发布了一段视频,演示了其最新模型Genie 3的能力。没有复杂的代码和漫长的渲染,只需输入一句话或一张草图,一个可以实时探索的3D世界就生成了。
![]()
视频里,一个像素风格的角色在城市中跑动跳跃。它踏过积水时水面倒影会随之变形,碰到障碍时扬起的尘土也会自然散开。
不过,要注意的是,Genie 3并没有预置牛顿定律或光影方程,而是通过观察海量画面,自己总结出了图像的变化。
目前,只有每月支付250美元订阅费的用户可以使用该功能。它支持720p分辨率、每秒24帧的画面,单次体验限时60秒。即便如此,仍然引发了资本市场剧烈震荡。Roblox重挫13%、Unity跌超20%。大家的理解也很简单,如果一句话就能生成3D世界,那传统游戏开发公司也就危险了。
此外,也有人认为,Genie 3将有助于构建虚拟仿真环境,可能会极大促进自动驾驶和机器人训练,甚至让特斯拉辛辛苦苦积累的真实数据失去优势。
![]()
但从产业角度来看,这些判断可能过于简单。一方面,当内容生产门槛归零时,工具将贬值,运营和平台将产生溢价。另一方面,Genie 3虽然能生成虚拟场景,却无法模拟真实世界的因果关系。只有将AI与真实物理规则结合起来,才能构建可用的训练环境。
利好还是利空?
首先,当AI大幅降低创作门槛,工具本身的价值会大幅缩水,但也让用户社群和运营能力变得更重要。
原因也很简单,工具没有办法替代平台。
Roblox股价暴跌,但其核心价值并不会因为Genie 3而贬值。因为它并不是3D建模工具,而是整个社交游戏生态,包括成熟的创作者收入分成、用户社交关系和长期维护的社区运营。
如果每个人都能通过一句话生成虚拟场景,竞争焦点也就从“谁会做内容”转向“谁拥有用户”、“谁更懂用户”。谷歌曾尝试涉足云游戏平台Stadia,但由于缺乏运营能力,最终在2023 年关停。可见哪怕拥有顶尖技术,也难以对已经成熟运作的平台产生颠覆性冲击。
Genie 3提供的“零成本生成”能力,对Roblox来说不仅不是威胁,他们反而可能多了一个可被迅速集成的内容生产插件。
简单说,明明是对自己利好的消息,Roblox却被股民误伤了。
此外,背靠Epic Games的顶尖引擎Unreal,虽然是游戏开发工具,服务的是却大制作、高保真的游戏,对确定性和精细度有极高要求。
Genie 3很难直接用于数亿美元预算的3A游戏的开发中,反而是Unreal的补充。Genie 3快速生成大量内容和环境的初稿,再由专业引擎进行精细调整。二者结合,既提升开发效率和创意自由度,还能保持高质量作品所要求的精度。
相比之下,那些缺乏独特生态的平庸引擎和平台,比如定位于中小型3D开发的平台,像Unity,如果要开发出和Unreal同样画质的东西,就要付出更多的努力,因此常被用来开发简单的3D场景,确实在这场变革中会收到影响。
虚拟训练?
另外,Genie 3为代表的AI生成模型,真能像大家期待的那样,用来训练自动驾驶汽车和机器人吗?
从原理上看就有很大问题。
Genie 3只是给出了看起来合理的视觉画面,而不是遵循物理定律的必然结果。这意味着它不仅容易出错,且根本不懂因果关系。
因此,它虽然可以构建虚拟环境,但可能其中很多地方在物理层面就是错的。在这种环境下训练的机器人模型,很可能学到的是错误知识,需要大量人工调试才能实际使用。
但更关键的是,Genie 3没办法提供真实的反馈。仿真环境永远无法完全复现现实世界的复杂细节。如果AI不知道在真实世界里撞墙后会导致什么后果,拿一个杯子该用多大力气,那么它在虚拟世界中练习再久,到现实中也仍然会失败。
![]()
自动驾驶领域同样如此。
目前,英伟达热衷于通过虚拟场景训练AI,以应对极端罕见状况,而特斯拉选择在真实道路上积累数据。表面上看,英伟达的路径似乎更高效——即使从未见过某种极端情况,也可以模拟出来进行训练。而特斯拉需要车辆真的碰到这些情况,才能学会如何应对。
二者的本质区别在于,特斯拉采集的人类驾驶数据,包含了真实交通中的因果博弈与决策后果,这种基于物理现实的反馈,是AI做出可靠判断的基础;而英伟达仅依赖虚拟训练的系统,由于缺乏对真实因果的体验,其决策可能建立在错误的假设上,结果也将不堪设想。
所以,英伟达大概率也仍然会大面积采集真实的路测数据,虚拟仿真只有在因果关系被充分理解和建模后,才能作为训练场。
如今,特斯拉在开发人形机器人Optimus时,也是由人类穿戴上动作捕捉装置来搬箱子、拧螺丝,再让机器人模仿学习。数据的核心不是“多”,而是“真”。
据了解,一些初创公司也在采用类似的“人类教练”模式,雇佣操作员控制机器人执行任务,或是穿着带有传感器的服装为机器人演示操作,从而积累海量高质量训练数据,卖给有需要的机器人公司。
正像Meta的前首席科学家杨立昆所指出的,真正的世界模型应该预测“状态”,而不是生成“像素”。他的团队尝试用物理作为先验约束,以提升模型与真实世界的一致性。而李飞飞团队则致力于融合多模态仿真与真实数据,构建更具可信度的虚拟环境。这些路线才更有可能用于机器人和自动驾驶领域的训练。
而Genie 3这种能快速搭建逼真场景的工具,只能用于不带来真实后果的领域,比如生成教学演示场景、游戏画面的预设计以及影视剧的视觉预演。
这也表明,真正的机会不在于能否生成一个虚拟场景,而在于为其贴上真实的物理标签。因为真实世界比语言复杂得多,没有人类的正确标注和演示,AI自己瞎练,只会南辕北辙。
所以,面对新技术,我们既要理解其原理,也要看清其适用边界与产业影响。盲目追逐酷炫的表象,却忽视谁能用工具持续产生价值,就容易误判和恐慌;没有看懂原理,就断言某个行业将被颠覆,也会掉入泡沫的陷阱。
以上就是今天的内容,更多科技产业的前沿分析与趋势洞察,我在科技特训营中进行了持续分享,如果你也感兴趣,欢迎加入,和我一起,先人一步,领先一路!
此外,也向各位家长推荐前哨AI冬令营。最好的学习是亲手实践,我们将通过高强度的集训,让孩子能亲自上手完成一个真实的AI项目,从理解AI到驾驭AI。目前剩余席位已经不多,快快点击链接了解详情吧。
王煜全要闻评论,我们明天见。
注:本文仅作为技术和产业分析,不构成任何投资建议。
↓长按图片扫码报名,先人一步,领先一路
最后, 鉴于公众 号推送机制的改变,你未来刷 到要闻评论的机会可能没那么多了,建议你加入粉丝群,第一时间 得到我的独家前沿分析,而且我们还会每天在粉丝群里发布独家资料,快快扫码加入吧!
![]()
此外,我们还为您准备了一个思维导图,扫描加群即可领取
“自动驾驶技术分析”
↓点击学习王煜全老师最新大师课,掌握马斯克的赚钱底层逻辑!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.