你发现没?现在的AI虽然能写诗、能画画,甚至能帮你写年终总结,但它其实是个“瞎子”。
你让它写一段关于“杯子掉在地上碎了”的描写,它能写得天花乱坠,甚至带点悲凉的文学气息。但如果你问它:杯子碎了之后,碎片会飞向哪里?由于重力和地面的材质,哪个碎片最远?它可能就得卡壳。因为它只理解文字的排列组合,根本不理解我们这个真实存在的、有物理定律的世界。
![]()
就在上周,那个被咱们科技圈亲切称为“AI教母”的李飞飞,带着她的新公司 World Labs 搞了个大新闻:新一轮融到了10亿美元。
10亿美元是什么概念?换算成人民币得70多亿。更夸张的是,投资名单里全是响当当的大厂:英伟达、AMD、Adobe的老对手Autodesk,还有硅谷最顶尖的投资机构。
这帮人精聚在一起,肯定不是为了听李飞飞讲故事。他们看准的是一个普通人听起来有点玄乎,但极有可能改变我们未来十年生活的新玩意儿——空间智能。
李飞飞觉得,如果AI不能像人一样感知三维空间,不能理解重力、碰撞和遮挡,那它永远只是个“纸上谈兵”的文弱书生。而 World Labs 要做的,就是给AI装上一双能看懂现实世界的“眼睛”。
过去两年,咱们被各种大模型刷屏,大家都在卷谁的逻辑更强,谁的文笔更好。但冷静下来想想,互联网上的文字数据快被AI“吃”光了。如果AI只会在文字里打转,它永远进不了工厂去修机器,也进不了厨房帮你炒菜。
这就是为什么 Autodesk 愿意花2亿美元领投。Autodesk 是干啥的?咱们搞装修、搞建筑、搞影视特效的人离不开的 CAD、Maya 全是他们家的。
在传统的3D建模里,设计师要画出一个真实的杯子,得一点点拉线条、贴材质、调灯光。但 World Labs 推出的那个叫 Marble 的模型,简直是个“造物主”。
以前咱们是“文生图”,后来是“文生视频”。Marble 厉害在哪?它是“文生世界”。你给它一张照片或者一段话,它直接给你生成一个可以下载、可以进入、符合物理规律的3D环境。
这就好比,以前AI是给你画了一张美味披萨的照片,你只能看不能吃;现在AI是直接给你做了一个真实的披萨模型,你甚至能走进那个厨房,看看烤箱的温度,感受面团的质感。
这种跨越,就是从“语义理解”到了“物理理解”。
听到这儿,你可能会说:“这不就是搞建筑和拍电影的人用的吗?跟我有啥关系?”
其实关系还是很大。现在来拆解一下几个离咱们生活最近的场景。
第一,是更真实的“云旅游”和虚拟体验。 现在的VR或者3D导览,大多是提前拍好的全景图,你想往左走一步看看树后的风景,往往是马赛克或者干脆转不动。如果有了空间智能,AI能根据现有的图片,自动补全那些没拍到的地方。以后想看雅典卫城,你不只是看视频,而是真的在里面“走”,每一块石头的纹理都是根据物理逻辑生成的。
第二,是机器人真的能进家门了。 大家发现没,现在的扫地机器人偶尔还是会像个“铁憨憨”一样困在椅子腿中间。这就是因为空间感知不够敏锐。如果扫地机器人具备了李飞飞说的这种空间智能,它就能预判:这个缝隙我能不能钻过去?如果我推一下这个纸箱,它会怎么移动?只有理解了物理世界,机器人才能像真人一样灵活。
第三,竟然还跟心理健康有关。 李飞飞在最近的峰会上提到了一个很有温度的点:临床研究人员对这项技术在精神治疗上的应用很感兴趣。比如,通过AI快速构建一个让患者感到安全、治愈的3D虚拟空间,辅助进行心理干预。这种定制化的环境,比干巴巴的谈话治疗要直观得多。
这里得跟大家普及一个冷知识,也是我这段时间观察各家技术后的一个感悟。
现在市面上有很多宣称能做3D的AI,但大多数是“缝合怪”。它们生成的画面看起来很美,但经不起推敲。比如你走进那个虚拟房间,发现镜子里没有倒影,或者桌子腿悬空了。
World Labs 的 Marble 模型最硬核的地方在于,它生成的环境是“持久”的。什么是持久?就是你今天在这个虚拟房间里挪动了一把椅子,明天再进来,这把椅子还在那个位置,而不是像某些视频生成软件那样,每一帧都在“闪烁”和重构。
这种稳定性,是专业设计、游戏开发甚至是工业仿真的命门。这也是为什么英伟达和AMD这两大芯片巨头都要投钱。因为要计算这种复杂的物理环境,对算力的要求极其恐怖。这两家公司既是投资人,也是未来的收租人——你们软件跑得越欢,我的显卡卖得越好。
聊到这儿,我想分享一点个人观点。
每当这种重量级技术出现,大家第一反应往往是:“坏了,3D建模师要失业了,游戏制作人要回家种地了。”
但我更赞同 Autodesk 首席执行官的那句话:AI 应该扩展人们想象和创造的能力。
以前,一个年轻人想做一部属于自己的动画短片,可能需要学习好几年的复杂软件,光渲染就要烧掉几十万的服务器费用。但如果空间智能技术成熟了,一个有创意、有灵魂的人,可能只需要通过简单的语言描述和结构勾勒,就能搭建出一个庞大的史诗世界。
技术门槛的降低,带来的往往不是行业消失,而是人才的井喷。
当然,我们也要保持一份理性。World Labs 虽然拿了这么多钱,估值也飞到了几十亿美元,但技术落地从来不是一通百通。如何让AI生成的物理世界不“穿模”?如何处理巨大的计算成本?这些都是骨头。
现在的AI圈,正在从“会说话”向“会干活”转变。李飞飞和她的 World Labs 走在了最前面。
这不仅仅是一场资本的狂欢,更是一次人类对数字化边界的探索。如果说以前的互联网是平面的,那未来的互联网一定是立体的、有触感的、符合物理常识的。
最后想问问大家,如果未来你只需要动动嘴,AI就能为你生成一个可以居住、可以玩耍的虚拟小岛,你最想在那儿放点什么?是童年的老房子,还是一个永远不会落山的夕阳?
欢迎在评论区聊聊你的脑洞,大家一起看看,那个“空间智能”的未来到底离我们还有多远。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.