网易首页 > 网易号 > 正文 申请入驻

世界模型:在词语的尽头,重建重力的国度

0
分享至

如果你曾困惑,为什么人工智能能写出精妙的诗句,却会在描绘一颗滚落的苹果时忽略重力。那么你已经在无意中触碰到了当今AI领域最核心的断层:语言模型的辉煌,与世界模型的缺席。

前者栖居于词语编织的符号之网,后者则试图在代码中重建万物运转的隐秘法则。这场从“会说”到“会想”、从“知道”到“懂得”的迁徙,正定义着通用人工智能真正的起跑线。

什么是世界模型,与语言模型有什么不同

世界模型这个概念其实并不算新,它最早源于认知科学和人工智能里对“人类如何想象未来”的好奇。核心灵感源于人类自然形成的世界心智模型。即我们通过感官获取的抽象信息在大脑中被转化为对周围世界的具象理解。

你可以把它理解成大脑里那个能让你闭着眼也能摸黑走到卫生间的小剧场——它不依赖具体的文字描述,而是靠对空间、时间、因果关系的直觉推演。比如你抛出一块石头,即便不看,你的脑海里也能自动补全那道抛物线的轨迹,并预判它大概会落在哪里。这就是世界模型在起作用:它试图学习物理世界或虚拟环境底层的运转规律,从而预测下一刻会发生什么。

而目前大家熟知的语言模型更像是住在图书馆里的博学家。它极度擅长从海量文本中捕捉词汇之间的统计关联,知道“苹果”后面常跟着“吃”或者“手机”,但它并不真正理解苹果从树上掉下来是因为万有引力。语言模型活在符号和语义的空间里,它对世界的认知是通过阅读文字“听”来的,而不是通过推演物理规则“试”出来的。

两者的核心差异就在于对“因果”和“时空连续性”的敏感度。语言模型能写出“杯子摔碎了”这样通顺的句子,却很难精准判断碎片四溅的具体角度和落点;世界模型则相反,它可能不善言辞,但内心却对力与运动、遮挡与存续有着沉默的估算。当下的趋势是将二者缝合,让AI不仅能言善辩,还能在脑海里的那块小剧场中把故事真实地“演”一遍,这样它给出的回答才会既符合语法,又符合常识。

为什么要发展世界模型,应用场景有哪些

当今天的语言模型能写出流畅的论文、画出逼真的图像,人们却发现它依然会犯常识性的错误。这种对物理世界基本法则的浅显,正是推动世界模型走上前台的根本原因。我们需要的不是一个更会说话的机器,而是一个真正“理解”重力、碰撞、光线如何流淌的数字大脑。

而世界模型的核心,就是让AI在内部建立一套关于三维空间如何运转的心智模拟。它不再仅仅统计下一个词出现的概率,而是像人类婴儿一样,开始推测物体被遮挡后的轨迹,预判泼出的水会往哪个方向流。

它的应用场景则隐藏在这些缺失的物理直觉里。例如在具身智能领域,与其让价值百万的机器人反复摔跤去学习走路,不如先让它在一个高保真的虚拟世界里练习成千上万次。那里有真实的摩擦力、有会滚动的石子、有不同软硬的地面。自动驾驶的训练更是如此,真实道路上不可能去刻意制造一场连环追尾来教会算法避险,但世界模型构建的仿真环境里,暴风雪和逆光下的鬼探头可以毫无代价地上演无数遍。


说到底,发展世界模型不是为了造一个更聪明的聊天对象,而是为了给人工智能装上一套关于存在本身的坐标系,让它在理解世界规律的基础上,去预测、去创造、去真正地与我们脚下的现实对话。

世界模型的技术路径有哪些,各自的优缺点又是什么

而关于世界模型的技术路径,目前还没有大一统的标准答案。如果从现有的探索方向来看,业界大致分化出三个典型的派别。

第一派可以称之为 “认知派” ,走的是极致的抽象路线,代表人物是图灵奖得主杨立昆(Yann LeCun)。他觉得像Sora那样逐帧预测画面,本质是一种像素幻觉,太浪费算力。杨立昆主导的JEPA架构,核心思想是不去管画面漂不漂亮,而是让AI在一个压缩过的潜在空间里,纯粹去预测“接下来会发生什么”的抽象状态。这就好比一个经验丰富的老司机,开车时根本不用计算每片树叶的轨迹,他的大脑只是在处理“前方有障碍物需要减速”这一层核心信息。这条路线的优势在于计算效率极高,对因果逻辑的把握也更贴近直觉,非常适合给机器人当后台决策系统。但缺点也很明显,因为它放弃了可视化生成,我们人类完全“看不见”它的思考过程,离能直接落地的商业产品还有相当长的距离。

第二派是 “空间派” ,走的是视觉直观的路线,代表是李飞飞团队的Marble模型。这条路径更接地气,它利用高斯泼溅这类3D渲染技术,像神笔马良一样,直接凭空构建出能够360度探索的精美三维场景。这种做法的优势肉眼可见,它能生成持久、可编辑的3D资产,可以直接打通游戏引擎的工作流,商业化前景非常光明。但它的短板同样很扎眼:模型捕捉到的更多是世界的“皮相”,缺乏对物理规律的内在理解。

第三派则是 “模拟器派” ,试图在前两者之间找到一条折中之道,代表是谷歌的Genie 3和阿里的HappyOyster。它不像认知派那样完全抛弃视觉,也不像空间派那样生成静态资产,而是创造出一个像电子游戏般、能根据用户输入实时演进的交互式视频环境。比如你一声令下让它“下雨”,整个世界就会动态响应。它的优点在于画面和用户是双向奔赴的,支持长时间的连贯探索。但说到底,其内核还是基于视频生成的逻辑,并没真正掌握背后的物理因果,在机器人训练等需要精确物理推演的领域,能力还是不如认知派那么硬核。

所以,尽管大家都在谈“世界模型”,但不同技术路径其实是在搭建不同功能的“地基”,一个重逻辑,一个重表现,一个重交互。哪种地基才能最终撑起AGI这座大厦,眼下还没有定论。

结语

回望这场关于世界模型的探讨,从它试图弥合语言与物理之间那道幽深的裂缝开始,到多元技术路径的各自跋涉,我们看到的不仅是算法架构的分野,更是对“智能”二字截然不同的想象。

语言模型教会了机器如何像人类一样言说,而世界模型正试图教会它如何像人类一样沉默地预演未来——在说出答案之前,先在内心的微型剧场里让水泼出、让球落地、让光影流转。当然,眼下的现实尚显骨感:认知派的抽象逻辑虽强,却难见其形;空间派的视觉华美,却无物理之魂;模拟器派的交互虽灵,却终究隔着一层因果的薄纱。然而正是这种路径的百花齐放,预示着一种深刻的共识正在凝聚:通往更高阶智能的道路,必须向下扎根,扎进对时空、因果和物质连续性的敬畏之中。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
纠缠5年后去父留子 ,终于分了。

纠缠5年后去父留子 ,终于分了。

In风尚
2026-03-31 17:33:34
苹果首款折叠屏iPhone手机壳曝光,MagSafe磁吸功能确认

苹果首款折叠屏iPhone手机壳曝光,MagSafe磁吸功能确认

TechWeb
2026-04-21 09:40:12
国际刑事法院裁定:对菲律宾前总统杜特尔特相关案件拥有管辖权

国际刑事法院裁定:对菲律宾前总统杜特尔特相关案件拥有管辖权

新京报
2026-04-22 17:43:16
世锦赛:奥沙利文五连鞭横扫国强进16强,中国小将遭遇两连败!

世锦赛:奥沙利文五连鞭横扫国强进16强,中国小将遭遇两连败!

世界体坛观察家
2026-04-22 22:17:36
2000吨英国潜艇消失,我国暗中打捞拆解研究,39年后首相却上门讨要

2000吨英国潜艇消失,我国暗中打捞拆解研究,39年后首相却上门讨要

睡前讲故事
2026-03-30 13:48:58
全新雷克萨斯ES实车,是凌志该有的样子吗?

全新雷克萨斯ES实车,是凌志该有的样子吗?

车动态
2026-04-21 17:19:32
张雪峰二婚妻子付幸:几个月婚姻分走数亿,11岁女儿遗产继承复杂

张雪峰二婚妻子付幸:几个月婚姻分走数亿,11岁女儿遗产继承复杂

眼光很亮
2026-03-27 16:04:09
中日机械巨头对比:日本小松年营收270亿美元,徐工集团有多少?

中日机械巨头对比:日本小松年营收270亿美元,徐工集团有多少?

霁寒飘雪
2026-03-05 15:39:34
震惊世界  美国校园枪击惨案  一共 13 人死亡

震惊世界 美国校园枪击惨案 一共 13 人死亡

那些看得见的老照片
2026-04-20 07:00:08
2026入学迎来“新规定”,9月1日开始执行,家长们总算熬出头了

2026入学迎来“新规定”,9月1日开始执行,家长们总算熬出头了

复转这些年
2026-04-20 19:05:36
“保姆纵火案”8年后,再婚得子的林生斌现状曝光,反噬终于来了

“保姆纵火案”8年后,再婚得子的林生斌现状曝光,反噬终于来了

姩姩有娱
2025-10-10 19:01:25
原来她是胡金秋老婆,曾是游泳健将身高1米8,给他生俩双胞胎儿子

原来她是胡金秋老婆,曾是游泳健将身高1米8,给他生俩双胞胎儿子

阿凫爱吐槽
2026-04-23 00:04:44
上海一女子把588万卖房钱全捐了,去寺庙出家,而女儿借钱交学费,几年后,母亲竟还俗让女儿养她。女儿:我凭什么养你!

上海一女子把588万卖房钱全捐了,去寺庙出家,而女儿借钱交学费,几年后,母亲竟还俗让女儿养她。女儿:我凭什么养你!

LULU生活家
2026-04-22 19:01:55
0罚30分!历史第一新秀!弗拉格不要太羡慕

0罚30分!历史第一新秀!弗拉格不要太羡慕

篮球实战宝典
2026-04-22 22:56:36
外媒:伊朗储油罐要满了;美军封锁行动刚开始时,伊朗哈尔克岛储油罐使用率已达51%;如果产量不变则8天填满,降至最低也仅能撑2-3周

外媒:伊朗储油罐要满了;美军封锁行动刚开始时,伊朗哈尔克岛储油罐使用率已达51%;如果产量不变则8天填满,降至最低也仅能撑2-3周

鲁中晨报
2026-04-22 07:20:05
镜报:巴萨提出续租拉什福德请求,曼联出于薪资压力可能同意

镜报:巴萨提出续租拉什福德请求,曼联出于薪资压力可能同意

懂球帝
2026-04-22 22:36:07
根据潘石屹预测的未来房价:150万房子,到2030年还能值多少钱

根据潘石屹预测的未来房价:150万房子,到2030年还能值多少钱

墨羽怪谈
2026-04-14 10:34:44
太扎心了!上海男子年薪百万失业引不满,新婚3个月女子就想离婚

太扎心了!上海男子年薪百万失业引不满,新婚3个月女子就想离婚

火山詩话
2026-04-20 06:12:18
人穷能卑微到什么地步?网友说:一个男人两千块买了我三个晚上!

人穷能卑微到什么地步?网友说:一个男人两千块买了我三个晚上!

黯泉
2026-04-14 12:13:04
库克留下的四颗雷:新CEO接手的苹果有多烫手

库克留下的四颗雷:新CEO接手的苹果有多烫手

报错免疫体
2026-04-22 04:31:44
2026-04-23 03:15:02
泡财经 incentive-icons
泡财经
做投资人看得见的财经资讯。
22737文章数 723关注度
往期回顾 全部

科技要闻

对话梅涛:没有视频底座,具身智能走不远

头条要闻

伊朗:特朗普“又说谎了”

头条要闻

伊朗:特朗普“又说谎了”

体育要闻

网易传媒再度签约法国队和阿根廷队

娱乐要闻

蜜雪冰城泰国代言人 被扒出辱华黑历史

财经要闻

医院专家号"秒空"!警方牵出黑色产业链

汽车要闻

纯电续航301km+激光雷达 宋Pro DM-i飞驰版9.99万起

态度原创

亲子
游戏
本地
教育
房产

亲子要闻

妈妈看不到的时候,孩子能拒绝才真的放心!

曝次世代Xbox主机性能炸裂!是PS6两倍 将颠覆市场

本地新闻

春色满城关不住|白鹃梅浪漫盛放,吴山藏了一片四月雪

教育要闻

3分钟学会一个雅思7分句/段(第340期)

房产要闻

官宣!今年9月起,广州中小学“重点班”将成历史!

无障碍浏览 进入关怀版