网易首页 > 网易号 > 正文 申请入驻

从蜥蜴到人类,AI错过了三亿年里哪些认知升级?

0
分享至


我只是个AI,听不懂你在说什么。

如果你真要让大语言模型帮你端茶倒水的话,这可能是它最后的无奈了。确实,它可能可以在特定语言任务中,输出高度拟人化的韵律结构、文学修辞和创意表达。但对于现实任务,它只能重申自己没有实体行为能力,只能提供建议。

这仅仅是因为它没有物理意义上的身体吗?当然不是,更根源的问题在于,它缺少一个自主的目的。即通过感知环境、制定计划并执行动作来实现目标的主动行为能力。而这正是自然智能(Natural Intelligence)的核心特征。

从认知科学与进化生物学的视角看,自然智能在亿万年进化中形成了一套分层、阶梯式的认知架构。它体现在不同物种的生存策略中:面对一只飞过的昆虫,静止不动的蜥蜴的舌头会突然弹出,这是纯粹的目标驱动;松鼠在食物充裕的秋日里忙着囤积坚果,并非因为它当下饥饿,而是它能“模拟”出一个尚不存在的寒冬并为之行动,这便是未来决策;而当黑猩猩发现用短树枝够不到洞里的白蚁时,它会主动寻找更长的树枝、甚至剥去叶子进行改造,这是反思和调整策略的元认知。

因此,若想突破当前AI发展的瓶颈,回溯生命的进化历程是其中一条重要路径。


Tomasello, Michael. "How to make artificial agents more like natural agents." Trends in Cognitive Sciences (2025).


核心差异:应答机 vs. 行动者

要理解AI与自然智能的本质差距,我们只需对比两个看似风马牛不相及的事物:ChatGPT,与你家墙上的恒温器。

以ChatGPT为代表的生成式AI是典型的刺激驱动系统。这类系统本质上是被动的,它们没有内在欲望,不会主动发起对话或提出需求,而是始终处于等待状态。当用户输入提示词时,系统基于其训练数据中的统计规律生成响应。尽管这些响应可能在表面上与人类应答无异,但其本质仍是对输入信号的被动反应。从这个角度看,ChatGPT等生成式AI可以说是聪明的“应答机”。

相比之下,一个普通的恒温器却展现了完全不同的智能范式。作为目标驱动系统,一旦用户设定了目标温度,它就会持续监测环境温度,主动将实时数据与目标值进行比较,并通过控制加热或制冷设备来缩小两者差距。这个简单的装置却体现了智能的一个关键特征,即通过主动行为改变环境状态,以实现预设目标。从这方面来看,恒温器是一个真正的“行动者”。

这种区分的重要性在于,从捕食苍蝇的蜥蜴到规划周末出行的人类,自然界的智能体无一例外都是目标驱动的行动者。蜥蜴的视觉系统实时计算昆虫的飞行轨迹,其大脑在毫秒间做出捕食决策,身体随即执行精准的捕捉动作;人类在规划旅行时,会主动搜集信息、评估选项、制定计划并执行预订操作。它们的智能,体现在一个完整的“感知-决策-行动”的闭环中。

而这种“目标驱动”,恰恰是当前最先进的AI系统所缺失的核心架构。它们拥有强大的信息处理能力(认知)和输出能力(行为),但缺乏自主产生的“目标”和指向环境的“注意”机制,无法将这些能力整合为有意义的整体行动。这种缺陷使得AI虽然能在特定任务上表现卓越,却无法像自然智能体那样主动适应复杂多变的环境。

也就是说,AI未来的突破点,可能不在于构建更强大的语言模型,而在于为AI赋予真正的目标生成能力和自主行动能力,使其从被动的“应答机”转变为主动的“行动者”。


进化的阶梯:

智能架构的三次关键升级

我们之所以难以凭空造出一个“行动者”,或许是因为我们试图一步登天,却忘了智能的演化,是一场历时三亿年、循序渐进的军备竞赛。每一次认知能力的升级,都是为了应对一个更残酷的生存难题。

托马塞洛(Tomasello)认为,为了应对不同的环境压力,生物智能通过三次关键架构升级,逐步形成了人类的多层次认知系统[1-2]。


进化阶梯:目标导向→意图性→元认知智能体。图源:原始论文

在演化早期,面对捕食敏捷迅速的猎物,早期陆地脊椎动物进化出了第一层智能架构:目标导向行为。以蜥蜴的祖先为例,它的世界被简化为一系列赤裸裸的目标。当一只飞虫进入视野,它的整个神经系统会瞬间变成一台高效的捕食机器,只处理两个核心问题:“它在哪?”(出击)以及“够不够得着?”(放弃)。这是一种被焊死在基因里的“感知-行动”闭环,没有犹豫,只有对当下环境最直接的反应,或是换个环境以满足更多的生存需求。这套简单的机制,是所有智能大厦的基石。

随着哺乳动物崛起,生存游戏变得更加复杂,智能架构迎来第二次升级。以松鼠为代表的物种面临资源竞争压力,发展出意图性决策能力。当它在食物充裕的秋日里找到一颗完美的橡子时,它不再像蜥蜴那样立即行动。相反,它会启动内部模拟,它会模拟将橡子埋在A、B、C三个不同地点的未来场景,评估每一个地点的风险——A点离蓝松鸦的窝太近,B点土壤太湿,橡子可能会腐烂,C点其他松鼠经常来。最终,它会选择一个最优解。这标志着智能体开始为未来事件做打算,实现从本能反应到预见性决策的质变。

在类人猿演化阶段,智能架构完成第三次跃迁。黑猩猩等高等灵长类面对复杂社会关系,进化出元认知层[3]。

这一架构赋予了几项关键能力,其一是自我效能评估,即掂量自己。当黑猩猩想用树枝去够白蚁时,它会先审视工具和自身的能力,如果觉得“这根树枝不行,我办不到”,它会主动放弃,转而去寻找更合适的工具,甚至观察同伴如何操作。其二是认知资源分配,即分清主次:当面前同时有水果和坚果时,它能根据过往经验和当下的饥饿程度,优先处理那个“回报更高”的目标[4];其三则是信念修正机制,即知错能改。当它发现某种砸开坚果的方法屡试屡败时,它不会像程序一样无限循环,而是能够主动修正策略,尝试新的角度或力度。这使得智能体能理解物理世界的因果关系和社会情境的意图结构,从而应对高度不确定的环境。

以上提及的三层架构并非孤立或相互替代,而是日渐形成了高度整合的级联系统[5]。元认知层负责制定战略、意图层负责规划战术、目标导向层则驱动最终动作。而当环境剧变时,智能体即可联动各层,由高层重构风险策略,中层调整逃生路线,底层则执行奔跑动作。基于这种动态整合能力的考虑,当前AI的适应性远不及生物智能。


人类终极外挂:

共享的“我们”

然而,即便拥有了黑猩猩这般精密的“三层大脑”,我们的祖先在认知能力上,也只是“最聪明的野兽”而已。人类智能之所以能发生技术爆炸,是因为演化为我们安装了一个终极外挂:共享意图(shared intentionality)。这一能力使人类能够超越个体认知边界,通过协同合作与文化积累实现认知能力的跃升。

共享意图的演化分为两个阶段:联合主体(Joint Agency)阶段和集体能动(Collective Agency)阶段。


联合主体(Joint Agency)与集体能动(Collective Agency)图源:原始论文

其中,联合主体阶段出现于更新世时期。百万年前,当我们的祖先开始围猎猛犸象这样庞大的猎物时,他们不再是各自为战的猎手,而是形成了一个临时的联合体。在这个联合体中,每个成员都清楚:我们拥有一个共同目标(如围捕猛犸象)、我们的注意力共同聚焦在猎物的动向和同伴的位置上(联合注意),我们更承担着一种无言的共同承诺——我的行动决定着你的生死,反之亦然。这种协作需要个体跳出自我视角,理解“我们”的共享心理状态。通过手势、身体定向和发声的初步协调,也为人类语言的诞生奠定了认知基础。

后来,在约15万年前,现代智人则将“我们”的概念推向了极致,发展出了更高级的集体能动阶段。这一阶段的标志是文化共识的形成,人类开始生活在由规范、制度、符号系统构成的抽象集体中。与基于即时情境的联合主体不同,集体能动是抽象且永恒的。它允许素未谋面的陌生人通过共同的法律、共同的信仰、共同的科学体系进行大规模协作。它让我们能够积累跨越代际的知识,并去追求那些任何个体都无法企及的宏伟目标——建造金字塔、编纂百科全书、飞向月球。

最终,这种共享意图能力最终催生了人类独有的规范性思维(normative thinking)——一种关于“应该”的直觉。我们知道,在某种情境下,我们“应该”怎么做,别人“应该”怎么做。它表现为对社会规范的内化与维护、对违背共同承诺行为的敏感以及基于集体价值观的推理判断。正是这种看不见的社会语法,将七十多亿人粘合成一个全球协作网络。并通过文化演化实现快速的技术进步。


《人类思维的自然史》,关于共享意图假设更全面的整理,图片翻译为苏彦捷等人翻译。在本文,联合意图和集体意图被翻译为联合主体和集体能动,以更贴合哲学词义表达。

而这,恰恰是AI最深的盲区。一个大语言模型可以写出完美的法律合同,却无法理解“责任”二字的分量;它可以分析数百万次人类对话,却无法真正领会一次点头或一个眼神背后的默契与承诺。因为没有共享意图,它们便无法形成真正的关于“我们”的视角,也缺乏对共同基础(common ground)的敏感性,更无法理解社会规范背后的义务性约束。

要想突破这一局限性,或许我们需要的,不是让它读完更多的书,而是为它设计一套能够理解“我们”、理解“应该”的心智与规范架构。


对照AI:我们缺失了什么?

当以自然智能的进化架构为蓝图来审视当前的人工智能,我们会发现,尽管大语言模型在数据处理上表现惊艳,但与生物智能的完整认知系统相比,仍存在显著差距。

这种差距首先体现在其被动响应机制上。与一只会因为饥饿而捕食的蜥蜴,或任何一个有内在需求的生命体都不同,今天的AI本质上是一个被动的“刺激-响应”系统。它没有自己的“饿”与“饱”,没有好奇心驱使它去探索世界的边界,更不会为了某个内在目标主动发起行动。你问,它才答。你推,它才动。即便你给它一个明确的目标,它也只是在浩瀚的统计规律中寻找一个最可能的“回声”,而不是真正理解“为何要实现这个目标”并自主行动。

更深层的问题在于认知控制层级的缺失。自然智能通过亿万年进化形成的三级架构,在当前AI设计中尚未得到系统性实现。最致命的短板,就是元认知能力的缺乏。AI不会在回答前先掂量一下“关于这个问题,我到底知道多少?”;它不会动态地评估“这个问题值不值得我投入更多算力?”;更不会在新证据面前反思“我是不是错了?需要更新结论吗?”。当面对复杂问题时,AI只是输出概率最高的响应,而非像黑猩猩那样监控思考过程并另寻他法。

最关键的差距体现在社会认知维度。人类智能的核心优势在于共享意图的能力,即能够形成“我们”的共同体意识,建立共同目标,并基于社会规范思维进行协作。而当前的人工智能,即便是多智能体系统,也仅是多个独立单元的机械组合。它们无法形成真正的联合意图,因为它们缺乏视角采择能力,既不理解他人心理状态,也不懂社会规范的约束力。这解释了为何AI能生成语法完美的对话,却捕捉不到一个承诺的沉重分量,或是一次社交中微妙的期待。多智能体系统也只是机械组合,而非真正的心智协同。

这些架构缺陷最终导致了AI系统表现出的严重脆弱性。当面临训练数据未覆盖的情境时,自然智能体(如人类)能够启动元认知监控,重新评估目标,调整决策策略,并在必要时寻求协作,而AI往往陷入逻辑混乱或产生幻觉输出。其根本原因在于AI缺乏动态可调控的认知架构,无法像生物智能那样,灵活整合所有资源去应对这个不确定的世界。


通往未来:

如何让AI更像自然智能体?

所以,如果要让AI真正具备类人智能的适应性与创造性,就需要从根本上重构设计理念,即从单一数据驱动转向多层级协同的认知架构。

实现突破的首要方向在于构建完整的“感知-行动”闭环。当前的AI,比如大语言模型,本质上是开环系统,接收输入,吐出输出,然后一切归零。它缺乏通过行动影响环境并感知结果的反馈机制。而要想建立感知-行动闭环,就需要主动设定一个目标(如维持室内26度),然后持续感知环境变化,执行动作(开启/关闭空调),并根据行动的反馈来不断修正自身行为。这个“身体”不必是人形,但这个闭环必须存在。

还记得那只懂得延迟满足的松鼠吗?它的大脑里,抑制冲动与规划未来的机制在激烈博弈。AI同样需要这种内在的调控能力。我们需要开发新的架构,让AI拥有“思考自己思考”的能力:它要能自主分配算力,懂得好钢用在刀刃上(注意控制);它要能评估当前策略的优劣,在“撞南墙”时主动触发备用方案(策略监控);它还要能根据新的证据,勇敢地“更新”自己的知识库(自我修正)。

此外,人类智能的卓越之处在于能够形成共同体意识,面向社会协作的AI则需要具备共享意图的算法。当多个AI代理协作时,它们不应再是各自优化KPI的精致利己主义者。相反,它们需要像人类团队一样,能够通过“心智理论”去推测同伴的意图,能在协作中快速建立临时的行为默契,甚至愿意为了集体利益,牺牲一部分个体最优解。只有这样,当AI听到“请帮我准备会议”时,它才会明白这背后意味着协调日程、准备材料、通知与会者等一系列复杂的社会性协同,而不仅仅是处理一段文本。

自然智能通过亿万年的演化,逐步构建了从反射到元认知的完整架构,当前AI研究试图直接训练出“全能”模型,但更合理的方式或许是仿照生物进化所呈现的阶梯式路径[6]。例如,可以先开发如专用工业机器人的稳定目标驱动系统,再逐步增加如客服系统的规划能力,最后发展如能够自我评估诊断能力的医疗AI的元认知功能。这种分层构建方法,虽看似缓慢,却或许能根治AI脆弱性问题。

必须注意,实现以上愿景不仅需要技术创新,也迫切需要跨学科的协作。认知科学家帮助理解自然智能的运作机制,计算机科学家将其转化为可计算的架构,伦理学家则确保智能的发展符合人类价值。只有通过融合探索,我们才能创造出既强大又可信赖的AI伙伴。


结语

真正的智能并非源于庞大的数据或复杂的参数,而是源于一种精妙且分层的控制架构,这种架构使智能体能够主动感知环境、制定目标并采取有效行动。

从蜥蜴精准捕食的本能反应,到松鼠预判风险的储藏策略,再到黑猩猩运用工具的元认知能力,直至人类创造文明的协作智慧,每一个进化阶梯都在揭示智能的本质。这个由自然选择塑造的认知体系,不仅包含了目标驱动、决策规划和自我监控的完整闭环,更在人类身上发展出了独特的共享意图,形成“我们”的共同体意识,并通过文化传承实现知识的积累。

当前的人工智能虽然在某些领域令人惊叹,但仅触及了智能的表层。我们面临的挑战不再是单纯追求更大的模型规模或更快的运算速度,而是要深入理解生命智能的深层架构,将生物进化的智慧转化为工程实践。而这需要遵循一条仿生且渐进的路径,即首先构建稳定可靠的目标驱动系统,继而逐步发展出规划思考和元认知能力,最后实现真正的社会协作智能。

我们需要为AI系统赋予内在的目标生成机制,植入自我监控与调整的元认知模块,开发能够理解共同意图的社交算法。更重要的是,我们要像自然进化那样,采用分层构建、逐级验证的发展路径,确保每一阶段的智能架构都坚实可靠。当我们努力的方向,从教会AI“如何回答”,转向培养其“如何探索、如何选择、如何协作”时,通往通用人工智能的那扇大门,或许才算真正被叩响。

原始论文:

Tomasello, M. (2025). How to make artificial agents more like natural agents. Trends in Cognitive Sciences, 29(9), 783–786. https://doi.org/10.1016/j.tics.2025.07.004


1.Tomasello, M. (2022) The Evolution of Agency: From Lizards to Humans, MIT Press 2.

2.Tomasello, M. (2024) Agency and Cognitive Development, Oxford University Press

3.Call, J. and Tomasello, M. (2024) Primate Cognition (Second edn), Oxford University Press

4.Gershman, S.J. et al. (2015) Computational rationality: a converging paradigm for intelligence in brains, minds, and machines. Science 349, 273–278

5.Tomasello, M. (2024) An agency-based model of executive and metacognitive regulation. Front. Dev. Psychol. 2, 1367381

6.Tenenbaum, J. et al. (2011) How to grow a mind: Statistics, structure, and abstraction. Science 331, 1279–1285









关于追问nextquestion

天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究AI与人类智能相互融合与促进,不断探索科学的边界。欢迎评论区留言,或后台留言“社群”即可加入社群与我们互动。您也可以在后台提问,我们将基于追问知识库为你做出智能回复哦~

关于天桥脑科学研究院

天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。

Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、AI与精神健康前沿实验室;与加州理工学院合作成立了加州理工天桥神经科学研究院。

Chen Institute建成了支持脑科学和AI领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、、大圆镜科普等。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
年轻人不买账,中年人喝不起!茅台跌破1600,终于承认只是瓶酒?

年轻人不买账,中年人喝不起!茅台跌破1600,终于承认只是瓶酒?

金融八卦女
2025-11-05 13:57:48
演员陈龙新身份曝光!原来是上影剧团副团长,事业低调深藏不露

演员陈龙新身份曝光!原来是上影剧团副团长,事业低调深藏不露

枫尘余往逝
2025-11-06 05:27:22
67岁老人哭诉:我和老伴的退休金共11000,现在却连20块都拿不出

67岁老人哭诉:我和老伴的退休金共11000,现在却连20块都拿不出

拾代谈生活
2025-11-07 02:16:33
中国可能已被五场战争包围,最先爆发战争的可能不是台湾

中国可能已被五场战争包围,最先爆发战争的可能不是台湾

boss外传
2025-10-17 15:30:03
“最容易变情人的女人,都是这些特质在作祟,别不信,真准!”

“最容易变情人的女人,都是这些特质在作祟,别不信,真准!”

王二哥老搞笑
2025-11-07 04:56:40
安徽最新通报:冯其云、肖家浩接受审查调查

安徽最新通报:冯其云、肖家浩接受审查调查

鲁中晨报
2025-11-06 16:11:04
越南政坛惊天变动:阮维玉空降河内,裴氏明怀突遭调动!

越南政坛惊天变动:阮维玉空降河内,裴氏明怀突遭调动!

丹徒生
2025-11-06 05:48:09
普京家族第三代崛起,俄罗斯政商江山几乎被一家人掌控

普京家族第三代崛起,俄罗斯政商江山几乎被一家人掌控

桂系007
2025-11-06 23:50:07
美国万万没想到,大陆对台使出最绝一招:邀请日本自卫队到北京

美国万万没想到,大陆对台使出最绝一招:邀请日本自卫队到北京

林子说事
2025-11-07 03:42:43
米切尔轰46+8完爆马克西!埃奇库姆14投7分,球哥0+8逐渐西蒙斯化

米切尔轰46+8完爆马克西!埃奇库姆14投7分,球哥0+8逐渐西蒙斯化

你的篮球频道
2025-11-06 10:36:01
义乌10岁搞钱小孩哥突然爆火全网,我才顿悟一个家庭最大的财富是什么!

义乌10岁搞钱小孩哥突然爆火全网,我才顿悟一个家庭最大的财富是什么!

脆皮先生
2025-11-06 20:29:25
C罗:阿根廷赢得世界杯已习以为常,葡萄牙夺冠将真正震撼世界

C罗:阿根廷赢得世界杯已习以为常,葡萄牙夺冠将真正震撼世界

奥拜尔
2025-11-06 23:32:56
狂轰7-0!17岁张本美和怒吼庆祝!日媒:头号种子压倒性胜利

狂轰7-0!17岁张本美和怒吼庆祝!日媒:头号种子压倒性胜利

好乒乓
2025-11-06 12:55:23
统一信号如此强烈!也许,真会以我们难以想象的方式回归!

统一信号如此强烈!也许,真会以我们难以想象的方式回归!

文史旺旺旺
2025-11-05 21:15:06
【2025.11.6】扒酱料不停:那些你不知道的八卦一二三

【2025.11.6】扒酱料不停:那些你不知道的八卦一二三

娱乐真爆姐
2025-11-06 23:48:27
李湘胖到弯不下脖子,机场罕用便宜货,被人搭话她不理还嘲讽冷哼

李湘胖到弯不下脖子,机场罕用便宜货,被人搭话她不理还嘲讽冷哼

洲洲影视娱评
2025-11-04 13:46:08
短视频是人类最大精神鸦片之一,沉迷其中会摧毁这4大珍贵能力

短视频是人类最大精神鸦片之一,沉迷其中会摧毁这4大珍贵能力

知识圈
2025-10-21 21:32:02
回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

就一点
2025-10-09 12:19:42
千万别吃!水洗几乎没用!广西正有很多人在捡

千万别吃!水洗几乎没用!广西正有很多人在捡

南国今报
2025-11-06 20:40:27
一位北京金融女博士直言:如果手里有二十万,不妨死磕"七大口诀"

一位北京金融女博士直言:如果手里有二十万,不妨死磕"七大口诀"

股经纵横谈
2025-10-22 16:39:51
2025-11-07 06:19:00
追问Nextquestion incentive-icons
追问Nextquestion
科研就是不断探索问题的边界
606文章数 25关注度
往期回顾 全部

科技要闻

小鹏机器人里藏真人?何小鹏发一镜到底视频

头条要闻

美参议员提议:政府不“开门”国会议员就停薪

头条要闻

美参议员提议:政府不“开门”国会议员就停薪

体育要闻

送走两位全明星,公牛成了东部第一

娱乐要闻

“黑料缠身”的白百何 谁给她的勇气?

财经要闻

南银法巴加速发展背后:资金饥渴症待解

汽车要闻

是我眼花了么?怎么大猩猩都来参加新车发布了?

态度原创

家居
艺术
旅游
教育
数码

家居要闻

别样府院 畅享诗意生活

艺术要闻

Omar Ortiz 2025作品,墨西哥当代极简超写实画家

旅游要闻

11月6日最佳情报|济南郎茂山日出美如画,三媳妇山奇峰峻美!

教育要闻

TTS新传论文带读:「新闻」的定义需要重构?看看这篇说了啥!!!

数码要闻

苹果Apple TV全新开场动画幕后:相机结合玻璃Logo实拍

无障碍浏览 进入关怀版