贝叶斯认知模型逆向工程思维20|算法|后验|因果性

分享至

贝叶斯认知模型 逆向工程思维

Bayesian Models of CognitionReverse Engineering the Mind

https://dokumen.pub/bayesian-models-of-cognition-reverse-engineering-the-mind-1nbsped-9780262049412-9780262381048-9780262381055.html

第20章《认知发展的贝叶斯模型》（Bayesian Models of Cognitive Development）聚焦于如何运用贝叶斯和概率建模框架理解儿童如何从有限、嘈杂且不完整的信息中构建结构化、因果性的世界表征。本章核心内容可概括为以下几点：

理性建构主义的统一框架：概率模型整合了符号主义（结构化表征）、联结主义（学习机制）与理性主义（目标导向推理）的优势，为调和“先天 vs. 后天”“非理性 vs. 理性”等传统发展心理学争论提供了新路径，形成了“理性建构主义”（rational constructivism）视角。
因果推理与直觉理论：儿童的认知发展体现为对直觉理论（如物理、生物、心理领域）的逐步修正。贝叶斯因果图模型能刻画儿童如何结合先验信念（如领域内因果更可能）与观测数据进行因果推断，并解释其在跨领域推理中的保守性。
从精确推理到可行算法：采样假说：鉴于精确贝叶斯推理计算不可行，儿童可能采用近似策略，如“采样”（sampling）。其中，“赢则留，输则换”（Win-Stay, Lose-Shift, WSLS）算法既能解释个体反应的变异性与“粘滞性”，又能在群体层面复现后验分布，为连接计算理论与算法实现架起桥梁。
理论学习作为随机搜索：复杂理论的习得（如磁学、数概念）并非线性跃迁，而是通过在抽象理论空间中的随机搜索（如基于文法的 Metropolis-Hastings 采样）逐步逼近。该过程解释了信念发展的缓慢性、个体差异甚至暂时倒退，并体现了“抽象的祝福”（blessing of abstraction）——抽象知识有时可先于或与具体知识同步习得。
核心知识与生成模型的骨架：婴儿并非“白板”，而是拥有进化赋予的“启动库”——即关于物体、施动者、空间、数等核心领域的抽象原则（如实体性、效率性）。这些可被形式化为“骨架式”结构化生成模型（如直觉物理引擎、贝叶斯心理理论），既无需显式编码所有规则，又能自然涌现出核心知识行为。
未来方向与挑战：
- 考察认知资源限制（如工作记忆、注意）如何导致质性发展转变；
- 将高层概率模型与底层感知输入对接，实现真正“自下而上”的学习；
- 承认当前模型仍处早期阶段，但坚持发展这一框架有望最终构建关于儿童学习的统一理论。

总结：本章主张，儿童是高效的贝叶斯学习者，其认知发展可被理解为在先天结构约束下，通过近似推理算法对多层次生成模型进行归纳与修正的过程。概率模型不仅揭示了儿童如何“反向工程”世界，也为理解心智本身的架构提供了强大工具。

20 认知发展的贝叶斯模型

学习者如何从模糊、嘈杂且不完整的信息中构建出因果的、结构化的和完整的表征？这一根本性问题曾被符号主义、联结主义和理性主义视角所审视，每种视角都为该问题提供了不同的、部分性的答案。正如前几章详细讨论的那样，概率模型自然地整合了这些方法的优势，从而创建了一个统一的框架，该框架融合了结构化表征、学习以及对认知系统目标的刻画。

认知科学中的经典方法与发育心理学中关注的领域相似，它们同样源于一种解决表征与学习之间张力的愿望，并在一个有限理性的系统内展开。一方面，纯粹的先天论回应是否定学习，专注于刻画那些已经存在的详细表征。另一方面，经验主义的回应则认为结构化表征并非必要，学习（及其后续推断）仅仅是一个自下而上的学习统计关联的过程。在认知发展领域也展开了其他辩论。一些研究倾向于将儿童描述为“嘈杂”或“非理性”的成人，而另一些研究则试图证明儿童是高效且有效的理性学习者。

随着概率框架的发展，人们对统一发展心理学产生了新的兴趣，这种统一被称为“理性建构主义”（例如，Xu & Kushnir, 2013），这是对皮亚杰主题重新诠释的一种呼应。正如概率模型整合了符号主义、联结主义和理性主义的方法一样，它们在认知发展领域的出现也为调和“天性-教养”和“非理性-理性”的对立提供了一个框架。正如前几章所阐述的，基于理论的概率发展模型提供了一种以表征来刻画核心和直觉信念的方式。这些模型详细说明了这些表征如何根据证据进行学习和修正。它们在理性分析层面运作，描绘了幼儿头脑中正在解决的问题。它们与算法层面分析的联系表明，“有限理性”的学习如何能在个体层面上解决嘈杂行为，同时在群体层面上捕捉到最优行为。此外，概率模型帮助发展心理学的研究人员在精确指定内部表征的结构以及识别驱动其形成的可能过程方面取得了进展。

这个问题可以分解为三个相关的问题。首先，儿童如何从例子中进行概括？其次，儿童如何学习塑造从例子中概括的归纳偏见？第三，儿童如何学习塑造影响从例子中概括的归纳偏见的框架？例如，发展心理学家一直在努力解答诸如儿童如何如此迅速地学会将词语映射到其含义上，或者观察一次单一的因果干预如何支持对未来结果的推断等问题。归纳约束，如整体对象偏见（Markman, 1990）或核心表征（例如，Carey & Spelke, 1996），被提出用以解释早期儿童中这些强大的推断。

尽管这些归纳偏见在发展早期就已显现，因此是支持先天论理论的自然候选者，但概率框架可以提供这些归纳偏见本身如何被习得的解释，指向超假设（或框架理论，这在发展心理学中常被称为；Wellman & Gelman, 1992）。分层贝叶斯模型（HBMs；参见第8章）描述了框架如何生成产生证据的归纳偏见，从而反过来说明证据如何塑造形成框架的偏见，依此类推。虽然这让人联想到无限回归论证（“一路到底的乌龟”），但大多数将概率建模方法应用于发展问题的科学家会认为，更高层次的超假设最终会在感知和概念的核心原语中找到根基，我们将在本章进一步详细讨论这一点。重要的是，我们可以利用概率建模框架来帮助明确，在给定发展中的心智所获得的证据的前提下，必须内置什么，每种层级的表征可能采取何种形式，这些形式对学习会产生什么后果，以及在发展实证研究中发现的标志是否能映射到这些后果上。

在本章中，我们探讨了认知发展中持久存在的问题，这些问题反映了前几章讨论的内容：学习如何在多个抽象层次上成为可能？我们如何协调计算/理性分析层面与儿童可能正在执行的算法？新理论（假设）是如何产生的？哪些表征已经存在以支持学习？为了找到答案，我们聚焦于儿童在因果领域学习的概率模型的最新发展。然后我们讨论早期出现或核心知识的实证证据，以及当前的概率模型如何接近表征性考虑。

20.1 因果推断与直觉理论

儿童的认知发展以对直觉理论的概念性修正为特征。这些直觉理论的核心是因果性原则；理论中的表征彼此相互依赖。对他人心理的推理包含这样一种观念：行为由欲望和信念所驱动。对物理系统的推理包含这样一种观念：物体对其他物体施加力。对生物学的推理则包含这样一些观念：某些变量具有因果作用，导致生物体的生长、生病、繁衍或死亡。因此，明确因果性在发展中心智中是如何被表征和习得的，就变得至关重要。

如第4章所述，因果图模型提供了一种表征语言，其词汇体系与贝叶斯概率方法一致（Pearl, 1988）。它们也是理性建构主义早期用于刻画认知发展的首批表征类型之一，展示了儿童从共变关系中学习的能力远超简单的联结模型（Gopnik, Sobel, Schulz & Glymour, 2001；Gopnik 等, 2004；Schulz, Gopnik & Glymour, 2007；Schulz, Goodman, Tenenbaum & Jenkins, 2008；Schulz & Sommerville, 2006；Sobel, Tenenbaum & Gopnik, 2004；Griffiths 等, 2011b）。自从这些模型被用于儿童因果推理的早期研究以来，我们对它们在何时、何种条件下最能刻画儿童行为有了更多了解。在本节中，我们呈现一个关于学龄前儿童因果推理的案例研究，该研究在一个有界因果推断问题上采用了一个简单的框架理论，并讨论该模型的一些局限性。

如前所述，发展心理学中长期存在的张力在于先天与后天之争。这一争论也体现在儿童的因果推理研究中。一些研究者关注儿童的因果信念是否最好被理解为领域特异性模块中实例化的表征（Scholl & Leslie, 1999），或是核心领域中的先天概念（Carey & Spelke, 1994；Keil, 1989）；而另一些研究者则强调领域一般性学习机制的作用（例如，Gopnik & Schulz, 2004）。那些聚焦于表征本质（较少关注学习机制）的研究表明，儿童的因果推理尊重领域边界（Carey, 1985；Estes, Wellman & Woolley, 1989；Hatano & Inagaki, 1994；Wellman & Estes, 1986；Bloom, 2004；Shultz, 1982）。例如，学龄前儿童否认身心反应的可能性，拒绝接受诸如“尴尬会导致脸红”或“担忧会导致肚子疼”这类观点（Notaro, Gelman & Zimmerman, 2001）。

贝叶斯推断为考察先验知识与数据如何在儿童因果推理中相互作用提供了一个自然的框架。（Schulz, Bonawitz & Griffiths, 2007）向儿童展示了一本故事书，其中某个变量与一个效应共同出现；在“证据条件”下，一个原因反复出现，而其他原因总是新颖的（即证据形式为 A & B → E；A & C → E；A & D → E……；见图20.1）。在“领域内故事”中，所有原因都属于与效应相符的领域（例如，一只鹿在芦苇丛、花园或其他地方奔跑，然后腿上出现瘙痒斑点）。与基线条件相比，儿童能够从数据中学习；他们在“证据条件”下显著更可能推断“A”是原因。在“跨领域故事”中，重复出现的原因（A，即“感到担忧”）与效应（肚子疼）分属不同领域。儿童在基线条件下更不倾向于选择该变量，而更偏好领域内合适的原因（例如，吃三明治作为肚子疼的原因）。在呈现证据之后，儿童确实有所学习，显著比基线更可能认可跨领域的变量“A”为原因，但其反应强度弱于领域内故事，这表明证据和儿童的先验信念在因果学习中都发挥了作用。

这个简化的因果学习任务为概率性因果模型如何刻画儿童的因果推理提供了一个很好的案例研究。在该任务中，儿童被给予一个强制二选一的选项（“是变量A还是变量B导致了该效应？”）。我们可以直接根据观察到的数据 d，通过将A与另一个可能的解释B进行对比，来建模儿童选择A作为正确解释的概率：

包含A作为可能因果变量的解释，与许多具体的因果模型相一致，这些模型将故事书中呈现的变量与可能的效应联系起来。因此，给定数据后，每个特定候选解释的概率是通过对所有与该解释一致的可能因果模型假设进行求和来计算的：

在这里，h 表示关于故事中变量与效应之间特定因果模型的假设，H 代表这些模型的完整假设空间。

在证据书中呈现了八个变量。变量之间可以存在或不存在连接，这代表着该变量与效应之间的因果联系（参见第4章）。因此，对于这个包含八个变量的简化例子（每个变量可以是“开启”或“关闭”状态），完整的假设空间包括 2⁸（即 256）种可能的不同因果图模型（记为 hₙ，其中 n ∈ {1, ..., 256}）；参见图20.1。P(A|h) 表示在给定特定图模型的情况下，候选解释正确的概率。当特定图模型中存在从 A 到效应的因果链接时，该值为 1；当不存在链接时，该值为 0。

第二项 P(h|d) 代表给定数据后假设的后验概率。给定数据后，某个特定因果结构的概率可通过贝叶斯法则展开为：

其中，P(h)是某个特定因果模型的先验概率，P(d∣h)是在给定因果模型 h的条件下观察到数据 d的似然。此处我们将贝叶斯公式简化为一个比例等价关系，因为在本问题的结构中，我们是在两个相互竞争的解释之间进行权衡，因此不需要归一化常数。

贝叶斯规则中先验概率和似然概率的具体数值由观察者所持有的直觉因果理论决定。如前所述，以往研究表明，儿童对世界拥有直觉理论（Gopnik, Meltzoff & Kuhl, 1999；Carey & Spelke, 1994；Keil, 1995；Wellman & Gelman, 1992）。这些理论可被视为指导其因果推理的框架。分层概率框架为这种直觉提供了形式化表达。采用一个简单的框架理论（如图20.1所示），领域内变量以概率 p生成，而跨领域变量则以概率 q生成。只要 p>q（体现“领域内原因比跨领域原因更可能”这一观念），模型的定性预测在一系列参数值下均成立。

关键在于，该框架理论为我们提供了一个模型，用以说明因果模型如何生成，以及它们的先验概率和似然权重如何被赋予。具体而言，任何特定因果模型的先验概率由各因果链接的生成概率加权得出（若为领域内变量，链接存在概率为 p，不存在则为 1−p；若为跨领域变量，则分别为 q和 1−q）。该模型的条件概率分布提供了一种方式，用于指定某个因果链接产生其效应的概率（通过带噪声的“或”（noisy-OR）参数化方式，权重记为 ϵ；参见第4章）。

模型预测与年长学龄前儿童的反应高度吻合，捕捉到了他们在面对领域内原因时，在学习与强先验信念之间的权衡。该概率框架为儿童直觉理论（及其对领域内原因的信念）与多层级证据之间的相互作用提供了形式化解释。

已有证据表明，儿童的因果解释在多个领域中均受到数据的影响（Bonawitz, Fischer & Schulz, 2012；Bass 等, 2019；Bonawitz & Lombrozo, 2012；Goodman 等, 2006；Amsterlaw & Wellman, 2006）。这些研究为如下主张提供了实证支持：即使是年幼的儿童，其行为也常常与最优贝叶斯模型的预测一致。然而，即便学习者的平均反应看起来符合这些理性模型所预测的后验分布，也并不必然意味着学习者在心智的算法层面上实际执行了精确的贝叶斯推理。考虑到精确贝叶斯推理的计算复杂性、大量研究发现儿童和成人在显式假设检验任务中存在困难，以及儿童有时从一个信念缓慢过渡到另一个信念的事实，一个有趣的问题便浮现出来：学习者究竟是如何以一种与贝叶斯推理一致的方式行动的？

20.2 采样假说

对于大多数问题而言，学习者实际上无法考虑所有可能的假设；对所有可能假设进行穷尽式搜索会迅速变得计算上不可行。因此，计算机科学和统计学中对贝叶斯推理的应用通常使用蒙特卡洛方法来近似这些计算，如第6章所述。在这些方法中，假设是从适当的分布中采样得到的，而非被逐一穷尽评估。有趣的是，采用此类采样机制的系统会表现出变异性——它会看似随机地考虑不同的假设。但这种变异性会系统性地与假设的概率分布相关：概率更高的假设被采样的频率会高于概率较低的假设。因此，这种采样方法提供了一种调和理性推理与反应变异性的方式，而反应变异性正是幼儿期的一个典型特征。

“采样假说”（The Sampling Hypothesis）认为，人类学习者可能采用类似的方法——这一观点在第11章中已针对成人提出。

越来越多的实证研究支持儿童的行为看起来像是在进行采样的观点（Bonawitz 等, 2014b）。例如，儿童对因果事件所给出的解释与其后验概率成比例（Denison, Bonawitz, Gopnik & Griffiths, 2013）。这些研究表明，儿童的反应并非仅仅是带有噪声的最大化选择，而且其反应也超越了在这些因果学习任务中对频率的简单统计。这些研究还引发了关于学习者如何采样假设的问题。

学习者采样假设的方式有很多。他们可能在每次观察到新数据时都重新采样；也可能选定一个假设后坚持使用，直到有动因促使其重新评估（例如，当出现当前假设下极不可能的数据时）。而在重新评估时，他们可能对自己当前考虑的假设做出细微调整，也可能完全回到后验分布中重新采样。他们可能采样多个假设，也可能只采样一个。所有这些关于学习者如何在假设空间中“搜索”的想法，在计算机科学和机器学习中都有对应的方法。在此，我们将对比两种策略：独立采样（independent sampling）和一种经典算法的变体——“赢则留，输则换”（win-stay, lose-shift，简称 WSLS）算法。

最简单的想法是独立采样：每当学习者观察到新数据时，她会重新计算更新后的后验分布，并从该分布中采样一个猜测。这种更新方式预测，同一个学习者在不同时间点的连续猜测将是相互独立的。也就是说，知道某位学习者在某一时刻预测了某个特定假设，并不能告诉你她在下一次观察数据后更可能预测哪个假设。

然而，另一种可能性是，学习者倾向于维持一个能成功做出预测的假设，只有当数据不利于原有选择时，才会尝试新的假设。这意味着个体将表现出“粘滞性”（stickiness），即更有可能坚持当前的假设。这预测了反应之间存在依赖性。这种策略的核心思想是：只要当前假设能够成功解释所观察到的数据，就维持该假设；否则就转向一个新的假设——这一思想也由此得名：“赢则留，输则换”（win-stay, lose-shift）。

20.2.1 儿童因果推理中的“赢则留，输则换”（Win-Stay, Lose-Shift）策略

WSLS 算法的一般形式在计算机科学和人类概念学习中有着悠久的历史（Robbins, 1952；Restle, 1962；Levine, 1975）。然而，可以找到特定类别的 WSLS 策略，它们能够近似贝叶斯推理。具体而言，对于“当前考虑的假设应在何时被拒绝”以及“下一个假设应如何生成”，存在不同的策略规则。人们可以数学地推导出某些特定的 WSLS 实例，使其能够近似贝叶斯后验分布。也就是说，尽管个体表现出“粘滞性”，但仍存在某些 WSLS 策略，使得其整体反应比例能够反映从完整后验分布中采样的结果。事实上，Bonawitz 等人（2014a）报告了两种这样的 WSLS 具体实现方式，它们能够近似后验分布。这些算法基于一种随机机制：根据当前假设对每一条新数据的解释程度，以相应概率决定是否从后验分布中抽取一个新假设。

为了比较 WSLS 与独立采样这两种方法，Bonawitz 等人（2014a）开发了一种微型微发生法（mini-microgenetic method），用于研究儿童的因果学习。在以往的儿童学习研究中，研究者通常只在一个时间点——即所有证据积累完毕之后——考察儿童的反应。然而，要有效确定学习者实际用于解决这些问题的算法，更有效的方式是逐次观察其行为如何随着新证据的积累而变化。因此，这些算法在反应依赖性上的不同预测，可被用作评估学习者信念更新过程的手段。

在 Bonawitz 等人（2014a）的研究中，学龄前儿童被介绍给一台机器，实验者演示了三种不同颜色的积木块在放置于机器上时以不同概率激活该机器：红色积木在六次试验中有五次激活机器，绿色积木三次激活，蓝色积木仅一次激活。随后，儿童看到一个颜色已褪去的新积木块，并被要求对其原本颜色（红、绿或蓝）做出初始猜测。之后，该积木被放置到机器上一次，儿童观察到图 20.2 所示的两种可能结果之一。

为了更好地理解 WSLS 算法，我们以图 20.2 中的一个具体实例逐步说明。学习者在尚未观察到关于神秘积木的任何数据之前，首先从先验分布中采样一个假设。在此例中，学习者碰巧选择了“红色”（如同掷了一个加权骰子，得到该结果）。接着，积木被放到机器上，结果机器被激活了。根据实验演示阶段的信息，红色积木激活机器的概率为 5/6，因此当前假设下的似然值即为 5/6。此时，学习者需要“决定”是继续坚持还是切换假设。此时“留”的概率被设为 5/6（如同一枚加权硬币）。在这个例子中，抛掷结果恰好落在更可能的一侧：留下。随后，第二条数据被观察到：机器未被激活。此时仅根据这条新证据计算似然。当前假设（红色积木）未能激活机器的概率为 1/6（来自演示阶段），因此“留”的概率变为 1/6。这次抛掷结果为“切换”。此时，学习者从包含迄今为止所有证据的更新后验分布中重新采样。这一次，采样结果为“绿色”。于是，绿色成为学习者为下一次观察所持有的新假设。

单个学习者的行为可能看起来像是在不同假设之间随机摇摆：从红色开始，坚持一段时间，然后切换到绿色，即使绿色未必是最可能的选择，等等。然而，WSLS 的美妙而令人惊讶之处在于：当汇总足够多参与者的反应时，整体上 WSLS 能够再现后验分布（如图 20.3 所示）。特别重要的是，WSLS 还有助于解决贝叶斯推理的算法层面问题：学习者只需在工作记忆中维持一个假设，并仅在必要时重新计算并从后验中采样，但群体层面的反应仍表现得如同从分布中采样所得。

WSLS 的另一优势在于，它为年幼学习者提供了一种处理概率信息进行推理的可行机制：该算法每次只考虑一个假设，但其行为却如同从整个分布中采样，这使其在计算上比独立采样更具吸引力，因为学习者无需在每次观察后都重新计算并从完整后验分布中采样。从算法层面思考模型，能够揭示儿童如何从一个信念过渡到另一个信念的重要信息，正如 Bonawitz、Denison、Gopnik 和 Griffiths（2014）所示。这些研究是连接计算层面与算法层面的重要初步尝试，因为它们表明，即使学习者并未执行精确的贝叶斯推理，其行为仍可近似贝叶斯后验分布。

然而，此处描述的研究仍留下若干有趣的开放性问题。例如，采样过程中是否存在依赖性？在 WSLS 中，重新采样的假设独立于先前持有的假设，但有可能当前假设被用作重新采样时的“锚点”。有理由相信，至少成人在切换假设之间也表现出依赖性，而儿童在生成后续假设时可能依赖性较弱（Bonawitz 等人，修订中）。这一观点与第 6 章讨论的马尔可夫链蒙特卡洛（MCMC）算法中的“模拟退火”（simulated annealing）概念一致。具体而言，Gopnik 及其同事提出，认知发展可能类似于一个从高温搜索逐渐“冷却”的过程：童年可能是心智以“高温”进行广泛而多变的空间搜索的时期，这支持了“儿童是人类最具创造力的创新者”这一观点；相比之下，成人可能采用“低温”搜索策略，一旦发现足够好的假设便坚持使用，却可能错失那些虽不太可能但或许更优的替代方案（Gopnik, Griffiths & Lucas, 2015；Gopnik 等, 2017）。

第二个开放性问题涉及学习者如何处理那些难以枚举的假设空间。在上述 WSLS 示例中，学习者仅有三种假设可选（即积木为红、蓝或绿）。然而，在大多数学习问题中，假设并非预先可枚举，甚至可能是无限的。接下来，我们将转向对此类问题的一种解决方案，该方案对发展理论具有重要启示。

20.2.2 框架学习作为随机搜索

在前述研究中，儿童能够快速对最可能的因果模型做出推断，其反应以与后验分布成比例的方式进行概率匹配。然而，典型发展过程中所观察到的丰富理论变革往往并不如此迅速、准确或线性。学习需要时间（Carey, 2009）。儿童通常是从一个信念转向另一个仅略优的信念；很少见到从概念上错误的信念突然跃迁到完全连贯正确的信念。相反，在发展过程中，信念往往逐步演进，以形成更准确、更完整的表征（例如，Wellman & Liu, 2004 对心理理论逐步发展的精彩个案研究）。儿童信念的转变同样被描述为一种某种程度上的阶梯式过程，而非突然的“全有或全无”（例如，Siegler, 1996）。甚至在学习过程中还会出现明显的倒退现象（例如，Marcus 等, 1992；Thelen & Fisher, 1982）。既然先前支持的行为已被证明更准确，为何还会出现倒退？

我们该如何理解这种非线性、带有噪声且缓慢的学习进程？一种可能性是，儿童正在进行某种形式的随机搜索（如第6章所述）。如果是这样，我们会预期信念看似随机地从一个状态“跳跃”到另一个状态。相似的证据可能导致儿童得出不同的结论。学习可能在相对较长时间内逐步展开。这类模型可用于解释比前述更复杂领域中的信念修正过程。

受随机搜索方法的启发（详见 Ullman, Goodman & Tenenbaum, 2012），Bonawitz、Ullman、Bridgers、Gopnik 和 Tenenbaum（2019）探讨了学龄前儿童如何在磁学领域解决理论学习中的“鸡生蛋还是蛋生鸡”问题——即同时识别因果规律及其所定义的隐藏类别。该分层模型在逻辑规则与谓词空间（一种概率性上下文无关的 Horn 子句文法）上进行随机搜索，从而构成一个直觉理论的空间。为了找到最优理论，搜索通过一种基于文法的 Metropolis-Hastings 采样方法在该空间中进行（亦见 Goodman 等, 2008b）。对该空间的模拟运行揭示了发展性信念修正的典型特征；例如，模型在不同运行中表现出不同的收敛速度，这与发展中观察到的现象相似：尽管面对相似的证据，不同儿童可能在不同时间点才达到最终的“正确”信念。

在 Piantadosi 等人（2012a）的另一项研究中，类似的建模方法捕捉到了儿童数概念发展的标志性进程：他们逐步构建对“1”、“2”、“3”等数字概念的表征，最终“跃迁”到通过应用新的顺序运算规则推断出计数的基数原则。这些方法关键性地展示了核心或原始的认知操作如何组合形成更复杂的理论，以及在这一庞大空间中的随机搜索过程如何映射出发展轨迹。

至此，我们聚焦于贝叶斯模型：从儿童如何对特定数据进行因果推断，到如何学习具体模型，再到如何从这些模型中习得抽象理论。但在发展中，有时似乎儿童先习得抽象的框架理论，之后才发展出具体模型（Wellman & Gelman, 1992；Simons & Keil, 1995）。抽象框架如何能在更具体的模型之前被推断出来？这一现象——即框架理论（至少有时）似乎在具体模型之前就已存在——曾被作为此类知识是“核心”（core）的初步证据（例如，Spelke, Breinlinger, Macomber & Jacobson, 1992）。然而，另一种解释再次来自分层贝叶斯模型（HBMs）。通过将计算建模应用于发展问题，可以证明在某些情况下，抽象层面的学习与具体层面同时发生，甚至有时先于具体层面（Goodman, Ullman & Tenenbaum, 2011）。Goodman 等人（2011）将此称为“抽象的祝福”（the blessing of abstraction），为这一令人惊讶的发展现象提供了理论解释。

如前所述，模型展示了特定框架理论在何时、如何可能被习得（尽管这种展示并不构成它们确实被习得的证明）。在发展中，人们通常默认某些领域一般性概念（如因果性）必须被内置到系统中。以往关于某些学习确实发生的论述，并未提供关于此类“自举”（bootstrapping）如何实现的机制说明。正如早期出现的框架理论案例所示，由于缺乏对诸如因果性这类更一般性概念如何被习得的解释，许多人便假定这些概念必然是先天的。而在此，HBMs 再次提供了一种新方案：它不仅说明了这类知识如何可能被习得，也明确了在这些模型下究竟需要内置什么（例如感知输入分析器；Goodman 等, 2011）。

一些证据表明，儿童可能以“拼凑式”（piecemeal）方式发展因果理论（Bonawitz 等, 2010），即在某些儿童较不熟悉的领域中，关联信息与干预信息可能不会被自发整合。提供一个关于因果性这类领域一般性原则如何发展的机制说明，也可能有助于回答其他领域一般性理论如何发展这一根本性问题。

20.3 核心知识

过去几章的一个主题是程序归纳（program induction）。在某一时刻，心智的状态可由一个特定的生成程序来刻画，而思维与学习的心理过程可被看作心智执行程序归纳算法，从而产生一个在参数和结构上略有或显著不同的新程序。人们可以设想，整个发展过程始于一个没有任何结构的极简程序，并在不同抽象层级上逐步发现新的例程、函数和变量。这并非新观点。艾伦·图灵（Alan Turing）早在人工智能（AI）和认知科学正式诞生之前就提出，通往成人水平AI的道路应始于一个“儿童机器”，它通过学习获得新程序（Turing, 1950）。图灵与许多其他人一样，将儿童心智的起点描绘成一本“机制相当少、空白页却很多的笔记本”（Turing, 1950, p. 546）。

然而，从进化和计算的角度来看，“空白笔记本”这一观念显得奇怪。试想一下，若要从绝对零起点开始，编写一个算法去寻找一个能生成序列 1011011101111011111… 的简短而有用的程序，任务将极其困难。人们或许可以尝试在通用图灵机上枚举所有可能的程序，并以各种巧妙方式搜索（Levin, 1973），但即使对于一个简单的逆问题，搜索时间也令人望而却步。让每个新生有机体都从同一个空白起点漫游于这个庞大的程序空间，既浪费又不必要。如果进化能为有机体提供一个包含有用函数、变量和例程的“启动库”（start-up library），那将有用得多（Lake, Ullman, Tenenbaum & Gershman, 2017）。这些例程可以是相对硬编码的，使一只㺢㹢狓（okapi）在出生后不久就能站立奔跑；也可以是相对无内容的，例如当检测到快速移动的物体时自动后退的例程，而无需事先拥有对“蜘蛛”这一概念的完整理解。

但人们可以想象——事实上也理应预期——存在比硬编码、无内容例程更为一般、抽象且有用的内置变量、函数和库（Ullman & Tenenbaum, 2020；Baum, 2004）。

从实证角度看，“空白笔记本”的观念也被证明是错误的。过去几十年的认知发展研究揭示，婴儿对世界运作方式具有常识性预期，这些预期要么在早期就已存在，要么是先天的（Spelke & Kinzler, 2007；Spelke, 1990；Woodward, 1998；Csibra, Bíró, Koós & Gergely, 2003；Phillips & Wellman, 2005；Carey & Spelke, 1994）。正如进化“启动库”所预期的那样，这些预期在不同文化中具有保守性，甚至在非人类动物中也能观察到。这些预期和原则并非包罗万象，而是模块化的，聚焦于若干核心领域，特别是数、空间、施动者（agents）、物体和社会关系。这些原则是抽象而一般的，但具有标志性限制，且核心领域内的知识在整个童年期持续习得和发展。

举一个具体例子：即使是年幼的婴儿也相信固体物体不应彼此穿透（Spelke 等, 1992）。这一预期适用于所有被归类为“物体”的实体。如果婴儿第一次见到一辆玩具卡车，他们会预期卡车不会穿过墙壁。婴儿无需为卡车、鸭子、冰球等分别重新训练其神经系统来形成这一预期。这正是我们说该原则“抽象且一般”的含义。然而，它也有标志性限制：婴儿一次无法处理多个以上物体，并非所有实体都被视为物体；婴儿早期对非刚性物体的推理能力很差；如果卡车被感知为一个施动者，某些物理预期就不再适用。

这些原则可通过多种方式实证展现，常用方法是向婴儿呈现不同情境并测量其注视时间——这被用作“惊讶”的代理指标（但参见 Kidd, Piantadosi & Aslin, 2012）。例如，婴儿可能看到情境A：一个滚动的球被墙挡住；以及情境B：球似乎穿墙而过。平均而言，婴儿对B的注视时间更长，表明他们预期球不应穿过墙壁。

我们并不试图在此完整规定这些核心知识原则，而是强调若干此类预期（综述见 Spelke & Kinzler, 2007）。在下文中，我们特别指出：关于这些预期出现的确切时间线（即婴儿最早在何时表现出这些预期）以及如何最佳刻画这些预期的概念本质，目前仍存在不确定性（后文关于形式化的讨论将进一步说明这一点）。

在物理与物体方面，婴儿预期物体具有持续性、内聚性，沿平滑连续路径运动，不发生超距作用，且彼此不穿透。在施动者与有生命体方面，即使前语言期的婴儿也预期施动者会高效地达成目标，并在环境约束下权衡代价与收益（Spelke & Kinzler, 2007；Csibra 等, 2003；Csibra, 2008；Liu, Ullman, Tenenbaum & Spelke, 2017）。婴儿还能区分亲社会与反社会的他人（Hamlin & Wynn, 2011；Hamlin, Wynn & Bloom, 2007；Hamlin, Ullman, Tenenbaum, Goodman & Baker, 2013），尽管这一区分究竟在多早出现仍是开放问题。在空间与位置方面，幼儿和动物能利用延展表面的布局进行再定向，并根据这些表面的距离和方向定位自身及其他物体；但相对于地标和小型物体的导航似乎依赖另一套系统，两者直到较晚年龄才整合（Hermer & Spelke, 1994；Dehaene, Izard, Pica & Spelke, 2006；Spelke & Lee, 2012）。

核心知识原则本身并未直接说明如何在机器中实现它们。例如，一位接受核心知识假说的工程师若想设计一台具备这些原则的“儿童机器”，她该如何将“连续性原则”或“效率原则”构建进去？这是当前计算认知科学与机器学习中的一个悬而未决的问题，不同的实现方式实际上对应着对“核心知识究竟是什么”的不同回答。

至少对于常识物理和心理学而言，一种可能的路径是假设：刻画成人推理的生成模型从一开始就以某种形式存在。更准确地说，由于这些是分层模型，该观点认为层级结构的顶层是先天内置的，或在婴儿期早期就已习得。

用一个粗略的类比：设想一位游戏程序员要设计一款新电脑游戏。她很可能不会从零开始编写——那样既繁重又重复已有的函数和例程库。诚然，一款游戏可能是跳过鳄鱼收集钻石，另一款则是投掷回旋镖攻击杀人蜂，但两者都依赖相同的基础物理引擎和规划器，只是精灵（sprites）和具体动力学不同。在此图景下，婴儿就像一位观看自己未设计的游戏的程序员：她接收游戏画面帧，并试图利用自己的库来推断底层代码是什么（Tsividis, Pouncy, Xu, Tenenbaum & Gershman, 2017）。

更具体地说，在直觉物理方面，生成模型即“直觉物理引擎”（Intuitive Physics Engine, IPE；参见第15章及 Battaglia, Hamrick & Tenenbaum, 2013；Hamrick, Battaglia, Griffiths & Tenenbaum, 2016）。其观点是：一个粗糙游戏引擎的基本骨架是先天内置的——我们假设存在具有属性的物体，以及更新世界状态的动力学。具体的属性、物体层级、力和动力学方程则需后天习得（Ullman, Stuhlmüller, Goodman & Tenenbaum, 2018；Lake 等, 2017）。在此基础上可学习各种程序，包括基于速度或随机扩散更新物体位置的简单程序，以及几乎所有游戏引擎都包含的简单碰撞处理程序。这类程序足以定量解释婴儿对物理刺激的注视模式（Téglás 等, 2011），并在未显式编码的情况下体现持续性、内聚性等核心原则。例如，该程序会预测物体不会消失或突然不连续移动，但这并非因为代码中明确写了这些规则，而是因为在程序模拟物体运动时，物体自然不会那样行为。其他原则则更显式，例如“实体性原则”（Principle of Solidity）可通过碰撞处理程序实现。当然，这些程序是对真实物理的近似和简化，而这种有原则的简化实际上能解释婴儿物体推理中一些令人困惑的发现（Ullman, Spelke, Battaglia & Tenenbaum, 2017）。

在直觉心理学方面，生成模型是规划模型或贝叶斯心理理论（Bayesian Theory of Mind；参见第14章及 Baker, Saxe & Tenenbaum, 2009；Baker, Jara-Ettinger, Saxe & Tenenbaum, 2017）。与物理类似，其观点是：一个规划器的基本骨架是先天内置的——我们假设施动者具有包含收益与代价的效用函数，并能采取行动以增加收益、减少代价。学习过程则是发现不同环境中存在的施动者类型、收益、行动、技能、约束和代价（Lake 等, 2017）。这样一个基本骨架足以解释学龄前儿童的许多发现（Jara-Ettinger, Gweon, Schulz & Tenenbaum, 2016），而一个权衡收益与代价的简单模型也能解释婴儿对施动者推理的若干关键结果（Liu 等, 2017）。事实上，规划器的基本骨架本身就体现了“效率原则”：施动者是具有目标的实体，会在约束条件下高效地实现这些目标。

骨架式的结构化生成模型是体现和实现核心知识的一种路径，但随着人工智能与机器学习领域重新关注认知发展研究的发现，其他方法也正在被开发。其中一个在直觉物理领域尤为有前景的方向，是将人工神经网络或图网络与关于物体的若干最小化概念相结合，让网络自行发现物体之间的动力学与相互作用（近期例子见 Mrowca 等, 2018；Battaglia 等, 2016, 2018；Chang, Ullman, Torralba & Tenenbaum, 2016）。然而，另一种截然不同的计算路径，则试图纯粹从海量经验数据中复现核心知识的原则（在直觉物理和心理学领域的近期例子分别见 Piloto 等, 2018；Rabinowitz 等, 2018）。

这类“白板式”（blank-slate）模型目前尚无法很好地泛化，但要判断这一方向最终是否会成功还为时过早。此类白板方法（通常）并不声称能复现婴儿发展的轨迹，而是试图模拟进化过程。这一论点在机器学习其他领域也很常见：人类往往无需大量训练数据就能表现优异。例如，一个前馈人工神经网络可能需要数千张训练图像才能识别物体，或相当于数百小时的游戏画面才能以合理水平玩一款电子游戏（Mnih 等, 2015），而人类可能只需两三个新动物的例子，或几分钟接触新游戏，就能达到同等表现。据此观点，人类的先验已被进化“训练”好，而机器则需从头训练。但这一观点忽略了进化学习的实际动态机制。

生物体并非通过“接收若干标注好的马匹样本，然后将训练好的神经状态传递给后代”这种方式进化——这相当于拉马克主义式的谬误，比如认为铁匠会把强壮的臂膀遗传给孩子。要重新发现关于施动者、物体及其他核心知识的先验，需要对进化过程进行逆向工程；而进化具有与神经网络训练和验证完全不同的动态机制，它涉及在函数与变量的“超空间”（uber-space）中进行搜索，每一组函数与变量定义了一个子空间，有机体可在其一生发展中探索该子空间（参见 Baum, 2004）。

总之，程序归纳的观点表明：如果一个有机体初始就拥有一个包含函数、例程和变量的库，它将在发展中获得显著优势。初始的内置知识可以包括特定的特征检测器和硬编码例程，也可以包含更灵活、更抽象的概念。过去几十年的认知发展研究强烈表明，婴儿在若干核心领域确实始于这样一个知识库。这些函数和例程可能采取结构化生成模型的形式——这些模型体现了实证发现的核心原则，其结构与后期形成的直觉理论相似，并且也正是构建科学理论的那种直觉的基础。

20.4 未来方向

认知发展可被构架为一个理性过程：学习者通过积累数据和时间，在各种可能性中进行搜索，从而推断并构建关于世界的模型。概率模型所取得的进展及其前景，恰如人类发展本身——随着更多实证研究和时间的积累，我们将获得对这一过程更丰富的模型。在发展性概率模型的研究领域中，仍有许多方向有待探索，我们特别强调两条尤为有前景的路径：一是资源限制在质性发展转变中的作用；二是将概率性发展模型与由感知驱动的自下而上学习相结合。

概率模型在发展研究中一个过去存在、未来仍将面临的挑战，是学习过程“有界性”（boundedness）的动态变化。认知加工能力的变化可导致学习发生量变与质变。例如，如果你的语义记忆容量在发展中增长，你就能在推理过程中存储和提取更多证据——这是一种量变。但它也可能彻底改变你存储和提取证据所使用的过程——这是一种质变。工作记忆与注意能力的变化不仅会影响心智模拟的丰富程度与内容，甚至可能决定是否使用模拟作为预测与推理的手段。我们对事件表征方式的变化，不仅会影响信念修正的速度，还可能改变我们对“哪些观察可被视为证据”的基本假设。围绕“有界性变化所带来的认知效应”这一问题，在认知发展的信息加工取向中有着悠久的历史（Klahr & Wallace, 2022）；而在认知的概率模型中，这一问题也将拥有长远的未来。

概率模型在发展研究中的另一个核心挑战，是需要将此类学习扎根于感知表征之中。分层贝叶斯模型（HBMs）被提出作为调和“先天”与“后天”持续争论的工具，能够统一来自双方的观点。然而，该领域大量研究的推进，往往建立在一个假设之上：即核心且困难的感知过程基本已被解决，研究者直接使用其输出结果。例如，一些直觉物理模型假设存在一个能识别并区分不同物体的感知过程。另一方面，当前一些最先进的感知学习模型虽在感知处理上取得进展，却并未充分关注如何在结构化表征之上学习程序。关键性的突破正等待着那些能够认真对待“层级模型的最底层必须与感知基本输入单元建立联系”的程序学习模型。

20.5 结论

儿童是最原始的学习者，本书中的大多数课程都受到对他们研究的启发。在本章中，我们提供了一些例子，展示了概率模型如何回应发展心理学中的核心问题。我们呈现了若干案例，说明概率模型同样有助于解决因果学习发展中的开放性问题：例如，儿童的先验信念与证据如何相互作用以支持因果推断；近似算法如何解释因果信念变化中的依赖性；甚至抽象层级上的因果搜索如何展开。最后，我们提出，概率模型可从婴儿早期观察到的初始约束中获得启发——这些约束作为“骨架式结构”（skeletal structures），使得更复杂、更抽象的结构能够在发展中快速构建。

概率模型的应用帮助研究者精确刻画早期发展中信念的内容。这些模型揭示了塑造学习过程的早期归纳偏见。它们有助于调和关于“儿童究竟是嘈杂的学习者，还是理性的近似者”的争论。它们为先天与后天之争提供了一个统一框架，表明结构化表征既能驱动推理，也能被推理所习得——即便在发展的早期阶段亦是如此。

人类经验将社会性、情感性和认知性体验交织在一起，形成一幅丰富的织锦。概率模型是一种有前景的工具，有助于我们区分其中相互交织的模式，但我们才刚刚开始抽丝剥茧，理清这些不同的线索。这一研究路径仍处于婴儿期，我们不太可能在儿童构建自身对世界抽象模型所用的相同时间跨度内，就发展出关于儿童学习的普遍而统一的理论。然而，只要我们持续推动概率模型的发展，它们所提供的框架或许终将使这一目标成为可能。

原文链接：https://dokumen.pub/bayesian-models-of-cognition-reverse-engineering-the-mind-1nbsped-9780262049412-9780262381048-9780262381055.html

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.