网易首页 > 网易号 > 正文 申请入驻

世界模型:机器能否理解现实?

0
分享至


人工智能研究的最新目标,尤其是在追求“通用人工智能”(AGI)的实验室中,是一个被称为“世界模型”(world model)的概念:这是一种AI内部携带的环境表征,就像一个计算型的雪球玻璃球。AI系统可以借助这个简化的内部模型,在真正执行任务之前,先对预测和决策进行评估。

深度学习领域的几位重量级人物——Meta的杨立昆(Yann LeCun)、Google DeepMind的德米斯·哈萨比斯(Demis Hassabis)和加拿大魁北克人工智能研究院Mila的约书亚·本吉奥(Yoshua Bengio)都认为,要构建真正聪明、科学且安全的AI系统,世界模型是不可或缺的

实际上,心理学、机器人学和机器学习等领域几十年来一直以不同方式使用类似的概念。你大脑中现在可能就有一个“世界模型”在运行——正是它让你知道不该走到一列行驶中的火车前面,而不必真的先去试一试。

那么这是否意味着,AI 研究者终于找到了一个所有人都能达成共识其含义的核心概念?引用一位著名物理学家的话:“你是在开玩笑吧。”世界模型听起来简单明了,但一如既往,人们在细节上完全无法达成一致。比如:模型中应该包含什么内容?精度要达到什么水平?它是与生俱来的,还是通过学习获得的,或者两者的结合?我们又该如何确认模型的存在?

了解这一概念的起源会有所帮助。早在1943年,也就是“人工智能”这个术语被提出的12年前,年仅29岁的苏格兰心理学家肯尼斯·克雷克(Kenneth Craik)发表了一本影响深远的小册子,他在里面提出了这样的设想:“如果有机体在脑中携带着一个外部现实的‘小尺度模型(small-scale model)’……它就能够先行尝试各种备选方案,判断出其中哪一个最好……从而做出更全面、更安全、更有能力的反应。”

克雷克关于心智模型或心智模拟的设想,预示了在20世纪50年代重塑心理学并至今仍主导认知科学的“认知革命。更重要的是,它直接把认知与计算联系在一起:克雷克认为,“并行或建模外部事件的能力”,是“神经机制”与“计算机器”共有的“根本特征”。

新兴的人工智能领域也迅速采纳了世界模型的方法。在20世纪60年代末,一套名为SHRDLU的AI系统令人惊艳:它用一个简易的“积木世界”来回答有关桌面物体的常识问题,比如“一个金字塔能支撑一个方块吗?”然而,这类手工构建的模型无法规模化,难以应对更为真实环境的复杂性。到了上世纪80年代末,人工智能与机器人学先驱罗德尼·布鲁克斯(Rodney Brooks)则干脆放弃了世界模型,他那句名言广为流传——“世界本身就是其最佳模型(the world is its own best model)”,而“显式表征……只会碍事”。

让克雷克的设想重焕生机的是机器学习的崛起,尤其是基于人工神经网络的深度学习。深度神经网络不再依赖脆弱的手写规则,而是通过反复试验,在训练过程中逐渐构建出内部的环境近似模型,并用来完成如驾驶虚拟赛车等狭窄定义的任务。

最近几年,随着支持聊天机器人(如 ChatGPT)的“大语言模型(LLM)”展现出许多“意外”能力——比如通过emoji推断电影名称,或玩黑白棋等,这让世界模型成为一个颇具解释力的思路。对杰出的AI专家而言,如杰弗里·辛顿(Geoffrey Hinton)、伊利亚·苏茨克弗(Ilya Sutskever)与克里斯·奥拉(Chris Olah),答案几乎是不言自明的:在某个深埋于LLM庞大“虚拟神经元”丛林的角落里,一定存在着一个“外部现实的小尺度模型”,正如克雷克当年所设想的那样。

但现实(至少目前来看)并没有那么理想。现在的生成式AI更像是在学习“启发式集合”:成百上千条互不关联的经验法则,可以在特定场景下给出近似的应对,但无法整合成一个自洽的整体,有时它们甚至相互矛盾。这就像盲人摸象的故事:一个人摸到象鼻,以为大象像蛇;另一个人摸到腿,以为像树;还有人摸到尾巴,说像绳子。当研究者尝试从大语言模型内部找回世界模型的证据——例如,对黑白棋(Othello)棋盘的一种连贯的计算表征——他们寻找的是整头大象。而他们真正找到的,却是这里一点“蛇”、那里一截“树”,再加上一段“绳子”。

当然,这些启发式规则并非一无是处。大语言模型可以在其数万亿个参数中编码数以“袋”计的此类规则——而俗话说,“数量本身就是一种质量”。正因如此,正如哈佛大学与麻省理工学院的研究者近期所发现的,只通过语言数据就几乎完美地生成从曼哈顿任意两点之间的导航路线,尽管这个模型根本没有学会整个街道网络的连贯世界模型

那如果“一点蛇、一截树、一些绳子”就能完成任务,为何还要执着于整只大象?答案只有一个词:鲁棒性当研究人员随机封闭曼哈顿1%的街道,LLM的导航能力就明显崩溃了。如果它内部拥有的是一个一致且连贯的街道地图,而不是在每个街角以相互矛盾的“最佳猜测”拼接成的一张极其复杂的补丁式网,它完全可以轻松绕开障碍。


即便是简单的世界模型也能带来诸多益处,不难理解为什么所有大型AI实验室都在拼命研发它们,为什么学术界也越来越关注它们。一个鲁棒且可验证的世界模型,或许未必能发现通用人工智能的“黄金城”,但至少有望提供一种在科学上站得住脚的工具,用来消除AI幻觉、支持可靠推理,并提升AI系统的可解释性。

这就是世界模型的“是什么”和“为什么”。至于“怎么做”,依然是个未知数。Google DeepMind和OpenAI认为,只要有足够多的“多模态”训练数据——比如视频、三维模拟和超越文本的其他输入——世界模型会在神经网络中自然“凝聚”出来。与此同时,杨立昆则认为,构建世界模型需要完全不同于生成式AI的全新架构。在构建这个“计算型的雪球玻璃球”的征途中,没有人手握能预测未来的水晶球。但这一次的终极目标,也许的确配得上围绕通用人工智能的那股热度。

作者:John Pavlus

译者:琴心

原文:https://www.quantamagazine.org/world-models-an-old-idea-in-ai-mount-a-comeback-20250902/


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
又内讧了!德云社元老人物离开,发文内涵郭德纲,彻底撕开遮羞布

又内讧了!德云社元老人物离开,发文内涵郭德纲,彻底撕开遮羞布

轩逸阿II
2025-08-30 15:50:47
惊爆!京东国民好车最低仅4.99万元起,中国新能源车硝烟再起

惊爆!京东国民好车最低仅4.99万元起,中国新能源车硝烟再起

不与世俗同
2025-11-09 21:49:00
28.85万,史上续航最强的ModelY上线了!

28.85万,史上续航最强的ModelY上线了!

格隆汇
2025-11-08 10:49:04
马斯克说对了!继芯片后又一东西全球疯抢,中国或成最大受益者

马斯克说对了!继芯片后又一东西全球疯抢,中国或成最大受益者

瞻史
2025-11-09 21:49:20
不回头了?富士康决定转移3000亿产能,外媒:郭台铭把饭碗端走了

不回头了?富士康决定转移3000亿产能,外媒:郭台铭把饭碗端走了

混沌录
2025-10-22 21:54:06
保时捷价格雪崩:曾经的百万豪车价格腰斩,中年男人的梦碎了!

保时捷价格雪崩:曾经的百万豪车价格腰斩,中年男人的梦碎了!

李砍柴
2025-11-09 20:58:04
试播6集被叫停,30年前这部神剧,说透了中国三代人的命运

试播6集被叫停,30年前这部神剧,说透了中国三代人的命运

手工制作阿歼
2025-10-30 11:33:32
十五运会广州限行适应期结束,首次违法不免罚!出行提醒公布

十五运会广州限行适应期结束,首次违法不免罚!出行提醒公布

南方都市报
2025-11-09 12:00:05
北京退休老教授在家养病整整10年,民警破门后,直接愣在原地

北京退休老教授在家养病整整10年,民警破门后,直接愣在原地

罪案洞察者
2025-05-09 09:52:30
中国国防部首次强硬表态:解放军将全力打击“台独”及外部干预!

中国国防部首次强硬表态:解放军将全力打击“台独”及外部干预!

Ck的蜜糖
2025-11-05 00:42:42
还会再买吗?国米夏窗第一“购买对象”再次逼宫,马洛塔想入手么

还会再买吗?国米夏窗第一“购买对象”再次逼宫,马洛塔想入手么

里芃芃体育
2025-11-09 17:05:53
”经济学家吴晓求教授说:“老百姓都没收入了,还在刺激消费!这种做法是错误的!

”经济学家吴晓求教授说:“老百姓都没收入了,还在刺激消费!这种做法是错误的!

张晓磊
2025-11-07 11:34:05
工行、农行、中行、交行行长最新发声

工行、农行、中行、交行行长最新发声

极目新闻
2025-11-09 12:31:15
11月起,建议大家开始使用现金支付,5大原因,说出背后实情

11月起,建议大家开始使用现金支付,5大原因,说出背后实情

趣味萌宠的日常
2025-11-09 01:12:14
每体:拉菲尼亚复出后,拉什福德将回归超级替补角色

每体:拉菲尼亚复出后,拉什福德将回归超级替补角色

懂球帝
2025-11-09 08:37:05
专家终于说实话了!不出10年,老小区将会迎来“5种”最终结局!

专家终于说实话了!不出10年,老小区将会迎来“5种”最终结局!

石辰搞笑日常
2025-11-09 10:16:18
一觉睡醒,全中国人民都知道了,34岁李现,居然又给杨紫庆生了

一觉睡醒,全中国人民都知道了,34岁李现,居然又给杨紫庆生了

阿废冷眼观察所
2025-11-09 03:14:47
外媒预测:2030年中国拥有4艘航母16艘055大驱,和美军实力持平!

外媒预测:2030年中国拥有4艘航母16艘055大驱,和美军实力持平!

墨山看客
2025-11-06 17:44:39
比缅北更恐怖!曾经的旅游胜地,如今黄赌毒俱全,性交易随处可见

比缅北更恐怖!曾经的旅游胜地,如今黄赌毒俱全,性交易随处可见

来科点谱
2025-10-24 09:25:32
詹姆斯至今都被联盟哄抢!名记:骑士和勇士等球队渴望得到他!

詹姆斯至今都被联盟哄抢!名记:骑士和勇士等球队渴望得到他!

氧气是个地铁
2025-11-09 18:30:52
2025-11-09 23:59:00
神经现实
神经现实
大脑,心智,认知
2354文章数 25469关注度
往期回顾 全部

科技要闻

黄仁勋亲赴台积电“讨要更多芯片”

头条要闻

陕西男子打晕妻子误以为已死 将人扔下土崖致其死亡

头条要闻

陕西男子打晕妻子误以为已死 将人扔下土崖致其死亡

体育要闻

他只想默默地拿走最后一亿美元

娱乐要闻

《繁花》事件影响:唐嫣工作被取消

财经要闻

10月CPI同比涨0.2% PPI同比下降2.1%

汽车要闻

钛7月销破2万 霜雾灰与青峦翠配色正式开启交付

态度原创

手机
健康
家居
亲子
本地

手机要闻

曝直板iPhone手机屏下摄像头规划2027年上线,预计采用3D屏下人脸识别

超声探头会加重受伤情况吗?

家居要闻

现代自由 功能美学居所

亲子要闻

小龚大夫上线了

本地新闻

这届干饭人,已经把博物馆吃成了食堂

无障碍浏览 进入关怀版