![]()
导语
解释语言的起源是理解人类作为一个物种的关键挑战。长期以来,缺乏化石记录和对动物交流的未知让这一问题显得难以攻克 。过去的研究往往试图寻找某种单一的“银弹”——例如一个特定的基因突变——来解释人类语言的独特性,但现代生物学证据表明这种观点已站不住脚。在这里,作者团队提出了一个实证性的“生物文化框架(Biocultural Framework)”,利用跨学科的协同作用来推动语言演化的研究。该方法是多层面的,将语言的出现视为多种能力(如:vocal learning, structure, sociality)趋同的结果,每种能力都有其独特的演化轨迹。这一框架明确了生物准备(Biological Preparedness)与文化传播(Cultural Transmission)及其相互作用的重要性。文中通过三个案例研究——发声学习、语言结构和社会基础——展示了如何通过整合基因组学、实验心理学、动物行为学和计算模型的最新发现,为未来的研究设定新的议程。
关键词:语言演化 (Language Evolution),生物文化框架 (Biocultural Framework),发声学习 (Vocal Production Learning),文化传播 (Cultural Transmission),基因-文化共演化 (Gene-Culture Coevolution)
任筱芃丨作者
赵思怡丨审校
![]()
论文题目:What enables human language? A biocultural framework 论文链接:https://doi.org/10.1126/science.adq8303 发表时间:2025年11月20日 论文来源:Science
告别“单一奇迹”:语言演化的新范式
在《刺客信条》的设定里,拥有三螺旋 DNA 的“伊述人”具备凡人无法企及的感知与控制力。而在现实的科学探索中,人类长期以来也陷入了类似的迷思——试图寻找某种单一的基因突变或进化的“银弹思维”(Silver Bullet View),仿佛只要按下这个开关,人类就能瞬间获得语言的神力。但这篇发表于 Science 的重磅综述告诉我们:目前的证据显示,没有任何单一基因或一次突变可以在“语言技能上加点”,相反,语言源于多种能力在漫长演化史中的逐步汇聚。
面对这一复杂的科学难题,本篇 Science 综述论文的作者们提出了一种全新的实证主义的生物文化框架。他们的核心洞察在于:语言不是一个整体的单一性状,而是依赖于多种能力趋同的结果——从物理层面借用古老运动回路实现的“发声学习” ,到认知层面将离散符号构建为层级结构的本能偏好 ,再到社会层面人类独有的 Mitteilungsbedürfnis(德语,意为“交流/分享的需要”),以及文化层面通过代际迭代学习不断打磨语言规律的机制。这些能力各自拥有独立的深层演化历史。正如眼睛并非凭空诞生,而是建立在祖先结构之上不断修饰与重组的结果,语言的涌现也是古老生物基础设施的扩展适应(Exaptation)。
这一框架强调了生物学与文化的双重继承系统:生物演化赋予了人类学习语言的“生物准备”,而语言本身的结构则是在代际间的社会互动和文化传播中涌现的。
![]()
图1:基因–文化共演化模型
生物演化提供先天认知-神经基础设施(遗传继承),文化演化通过迭代学习筛选并放大弱偏置(文化继承),二者构成双重继承系统。只要存在文化演化,即使个体只携带微弱先验偏置,也能在群体层面产生与强先天约束相同的结果;若强偏置维持成本高昂,弱偏置必然出现。
这两者通过复杂的基因-文化共演化(Gene-Culture Coevolution)循环相互作用,共同塑造了人类的语言能力。只要有文化演化存在,人类并不需要极强的先天基因偏置(Strong innate biases)。文化传播就像一个放大器,能将微弱的弱先天偏置(Weak innate biases)放大为整齐划一的语言结构。如果维持强偏置在遗传上代价高昂,那么在长期演化中更有可能保留的是弱偏置,而由文化过程承担更大一部分重整语言结构的工作。
发声学习:深层同源与古老基因的重组
语言演化的第一个关键层面是发声学习(Vocal Production Learning, VPL),即根据听觉经验修改声音的能力。有趣的是,这种能力在动物界分布得极不均匀:我们的灵长类近亲——如黑猩猩——这种能力显著受限,但它却在蝙蝠、鲸豚、大象和某些鸟类中独立演化了出来。这一跨物种的趋同背后,可能依托于深度同源(Deep Homology)的神经基础。
深度同源最著名的例子是 FOXP2 基因。最初,它因在患有严重言语障碍的KE家系中发生突变而被发现,一度被媒体奉为“语言基因”。
![]()
图2-A:一个三代家庭,即 KE 家系,其中一半的亲属 (涂黑个体) 受到神经发育异常的影响,主要涉及儿童表达障碍,并伴有表达和接受性语言缺陷。受影响的亲属在 FOXP2 基因中携带一个 DNA 字母 (核苷酸) 的变化。DNA 中的这个小变化改变了氨基酸序列,从而改变了 FOXP2 编码的调节蛋白质的关键部分的形状,使其无法以正常方式发挥作用。DNA 测序的进展导致鉴定出超过 28 个额外的个体 (来自 17 个家庭), 携带不同的致病性 FOXP2 单核苷酸变体,语言发育问题是这些病例中最常见的特征。如图片底部所示,尽管致病性变体有时从受影响的父母那里遗传,但在许多情况下,它们在未受影响的父母的子代中重新出现。
但基因组学揭示,FOXP2 并非人类独有,它在脊椎动物中高度保守,从鸟类到爬行类都有它的身影。它的真正功能是调节神经可塑性,帮助构建负责运动技能学习的回路。 在人类中,它被调用来支持复杂的言语运动;在斑胸草雀(Zebra Finches)中,它在“X区”(Area X,鸟类负责鸣唱学习的基底神经节核团)高表达,支持鸣唱学习。这意味着,语言的生物硬件其实是借用了古老的运动学习回路。
![]()
图2-D:在斑胸草雀鸣唱学习脑区 Area X 降低 FoxP2 表达,干扰歌曲模仿并影响歌曲可变性,可能与多巴胺信号改变有关。
更令人兴奋的是古DNA技术带来的突破。分析尼安德特人和丹尼索瓦人的基因组显示,FOXP2 的某些关键突变并非现代人独有,而是在我们与黑猩猩分离后、但在与古人类分离前就已出现。将这些“人源化”的FOXP2 变体引入小鼠模型中,确实改变了小鼠纹状体的可塑性和发声特征。这证明了语言的生物硬件是通过对古老神经回路的修饰和重组而构建的,而非全新的创造。
![]()
图3-E:将人族谱系上的FOXP2氨基酸替换‘人源化’地导入小鼠后,观察到纹状体多巴胺水平区域变化、可塑性增强;成年雄鼠超声叫声在频率与音节复杂度上出现差异,且刺激-反应关联学习模式改变。
除了基因,作者还提及了一个常被忽视的生物准备:内源性奖励系统(Endogenous Reward)。人类婴儿会自发地咿呀学语(Babbling),这种行为本身就是快乐的,不需要父母给糖吃。这种游戏化的发声在鸣禽、鹦鹉和部分蝙蝠中也能观察到,但在非 VPL 物种中却极罕见。 研究发现,幼鸟在练习鸣唱时,大脑中的奖赏回路会被显著激活,伴随着伴随着阿片类物质(Opioid)的水平升高和多巴胺(Dopamine)系统的参与。因此,VPL 的进化可能既取决于学习过程中神经回路的变化,也取决于潜在的内源性奖励。作者特别强调,FOXP2 等基因只是复杂网络中的一环,单靠某一次基因改变并不足以创造一颗会说话的大脑
语言结构:从混乱到有序的文化涌现
人类语言的另一个核心特征是系统性的结构,如组合性和层级结构。这些复杂的规则从何而来?作者指出,这是文化演化(Cultural Evolution)的产物,而非单纯被编码在基因中。
研究者们将目光投向了两组特殊的“自然实验”:家庭手语者(Homesigners)和尼加拉瓜手语(NSL)的使用者。前者是那些无法接触任何语言输入、在家庭中自发创造手势的听障儿童。研究发现,这些孤独的创造者展现出了惊人的天赋——他们能自发地建立某种语序(例如“葡萄-吃”)。这证明人类大脑确实拥有一种先天的结构偏好或者说生物偏好(Biological bias)。
迭代学习(Iterated Learning)实验也证实了这一点:当信号在模拟的“代际”间传递时,学习者的认知偏差会放大,导致语言结构从整体的、混乱的形式逐渐演变为分割的、组合的系统。这颠覆了传统的认知,表明语言结构并非完全预设在人脑中,而是在适应人类大脑的学习与传播过程中“生长”出来的。
社会基础:分享的冲动与自我驯化
为什么只有人类发展出了如此复杂的语言?第三个关键层面在于社会动机。人类拥有一种独特的、强烈的内在驱动力——Mitteilungsbedürfnis(德语,意为“交流/分享的需要”)。
与人类不同,即使是受过语言训练的类人猿,其交流也主要局限于提出请求,极少为了“分享信息”而交流。这种对社交互动的内在奖励机制,可能是语言演化的关键驱动力。人类的这种分享欲是如此强烈,以至于如果没有现成的语言,我们会凭空创造一个(如尼加拉瓜手语)。
这种亲社会性是如何演化而来的?作者引入了“人类自我驯化假说”(Human Self-Domestication Hypothesis)。该假说认为,人类在演化过程中经历了类似动物驯化的选择压力——我们选择了更低攻击性、更宽容的同伴。
为了证明“驯化”如何改变交流系统,作者对比了野生的白腰文鸟(White-rumped Munia)和它的驯化后代十姊妹(Bengalese Finch)。驯化后的十姊妹压力激素(糖皮质类固醇)水平更低,且大脑中的催产素(Oxytocin)水平更高。更少攻击,对环境更少恐惧,更愿意探索 。最惊人的是,野生的白腰文鸟歌声简单刻板,而驯化后的十姊妹却演化出了具有复杂语法结构(syntactic complexity)和高变异性的歌声 。
这为人类语言演化提供了一个极佳的模型:若人类在长期演化中对低攻击性和高宽容度个体施加偏好,则群体社会性将得到强化,带来更高效的社会学习与文化传播。社会学习的增强反过来支持更复杂文化结构的形成,并逐步生成对更强表达能力的交流系统的选择压力,从而促进语言的涌现。
展望:整合的未来
这篇论文强调,没有任何单一的方法、工具或模型能独自解开语言演化之谜。只有通过生物文化框架,将个体(语言学习)、群体(文化演化)和物种(生物演化)三个时间尺度结合起来,我们才能真正理解语言是如何诞生的。
未来的研究将更加关注生物奖励系统在语言演化中的作用。同时,作者也呼吁停止无休止的“手势起源 vs 语音起源”争论,转而关注多模态交流如何协同演化。这个新框架不仅重塑了我们对过去的理解,也为利用人工智能、动物模型和基因组学探索人类本质提供了全新的路线图。
大模型2.0读书会
o1模型代表大语言模型融合学习与推理的新范式。集智俱乐部联合北京师范大学系统科学学院教授张江、Google DeepMind研究科学家冯熙栋、阿里巴巴强化学习研究员王维埙和中科院信工所张杰共同发起,本次读书会将关注大模型推理范式的演进、基于搜索与蒙特卡洛树的推理优化、基于强化学习的大模型优化、思维链方法与内化机制、自我改进与推理验证。希望通过读书会探索o1具体实现的技术路径,帮助我们更好的理解机器推理和人工智能的本质。读书会已完结,现在报名可加入社群并解锁回放视频权限。
详情请见:
1.
2.
3.
4.
5.
6.
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.