主动推理隐含最小意识理论|模态|贝叶斯|智能体|模糊性|云计算费用

分享至

On the minimal theory of consciousness implicit in active inference

《主动推理隐含最小意识理论》

https://arxiv.org/pdf/2410.06633

摘要

体验的多面性给意识的研究带来了挑战。传统神经科学方法通常专注于孤立的方面，例如感知意识或意识的整体状态，并围绕相关的经验范式和发现构建理论。因此，意识理论往往难以比较；事实上，这些理论试图解释的现象可能几乎没有重叠之处。在这里，我们采用了一种不同的方法：从主动推理（active inference）开始，这是一种基于贝叶斯推理（Bayesian inference）建模行为的首要原则框架，并逐步构建出一种最小化的意识理论，这种理论从主动推理下推导出的计算模型的共同特征中涌现出来。我们回顾了一系列将主动推理模型应用于意识研究的工作，并认为所有这些模型中都隐含着一组小的理论承诺，这些承诺指向了一种最小化（且可检验的）意识理论。

1. 引言

意识是异质且多面的。初步来看，意识的科学研究可以分为三个相关（但在实践中，很大程度上相互独立）的研究项目：对意识内容、状态和自我的研究（Seth, 2021）。意识的内容是指体验中主体所意识到的品质或元素（例如，红色玫瑰在绿色背景上的图像，或新鲜煮好的咖啡的香气）。通过控制物理刺激属性和整体意识状态（如困倦），同时改变主观感知来研究内容（Baars, 2002）。有意识的生物还具有不同的整体意识状态，这些状态通常通过行为进行评估（例如，通过格拉斯哥昏迷评分量表；Teasdale et al., 2014），并且对于评估意识障碍患者至关重要。这些状态包括植物状态、各种睡眠状态、正常清醒状态，以及可能像谵妄或幻觉状态这样的状态（详见 Bayne et al., 2016）。在人类中，意识通常还伴随着某种形式的最小化和/或叙事性自我意识（Gallagher, 2000），以及身体性、自我性和人格性的体验（Ciaunica et al., 2022; Seth, 2013; Seth & Tsakiris, 2018）。

大多数关于意识的神经科学理论将这些现象的某个子集作为其解释目标，并围绕相关的经验范式和发现构建理论（Seth & Bayne, 2022）。例如，全局工作空间理论（Baars, 2005; Baars et al., 2013）及其当代形式——全局神经工作空间理论（Dehaene et al., 2011; Mashour et al., 2020）是围绕对比分析方法构建的，该方法将意识内容作为因变量，即通过改变参与者是否意识到由刺激引发的某种特定内容（Baars, 2005）。意识状态最初被视为一个背景条件（Dehaene et al., 2006），使得全局神经工作空间理论主要成为一种关于意识内容的理论。此后，该理论也被应用于通过麻醉操纵整体意识状态的实验（详见 Mashour et al., 2020）。然而，意识状态最初被假设为内容的背景条件，而不是约束内容的背景性建构，这一假设在当代版本的理论中可能仍然存在（详见 Bayne et al., 2016; Bayne & Carter, 2018）。同样，高阶理论（Brown et al., 2019; Fleming, 2020; Lau & Rosenthal, 2011）也是主要关于意识内容的理论，目前尚未明确意识内容与意识状态之间的关系。类似地，整合信息理论（Albantakis et al., 2023; Oizumi et al., 2014; Tononi et al., 2016）是另一种领先的意识理论，其明确目标是解决意识的难题（即解释为什么某些物理结构会产生主观体验，而其他结构则不会）。整合信息理论完全从内在角度看待意识，从而淡化了外显行为的作用，而外显行为在塑造我们所意识的内容以及决定意识内容的质性特征方面可能发挥重要作用（O’Regan & Noë, 2001; Seth, 2014）。其他理论，例如主观性自我模型理论（Metzinger, 2004）或投射意识模型（Rudrauf et al., 2017），则专注于解释自我或第一人称视角的存在。除了上述理论外，还有许多其他意识理论，其中许多优先考虑特定的解释目标和方法论。这种状况带来了双重挑战：不仅基于经验证据难以在意识理论之间进行仲裁（Yaron et al., 2022），而且有时也不清楚这些理论是否旨在解释相同的经验数据（Seth & Bayne, 2022）。

在本文中，我们没有从意识的一个或多个特定属性出发，将其作为主要的解释目标，而是从主动推理开始，这是一个将适应性行为建模为（近似）贝叶斯推理的框架，并探讨是否可以构建一种意识理论。该框架的新颖之处并不在于提供独特的预测。事实上，计算神经科学及相关学科中许多替代的但特定领域的规范建模框架与主动推理一致或等价，但往往仅适用于更狭窄的范围（Da Costa, Sajid, et al., 2020; Sajid, Ball, et al., 2021; Sajid, Da Costa, et al., 2021）。相反，主动推理的新颖之处在于其普遍性。通过最小化仅两个目标函数——变分自由能和预期自由能，可以在该框架下建模极其多样的行为（Parr et al., 2022）。事实上，主动推理框架已被应用于认知和神经科学领域的各种现象，包括视觉搜索（Cullen et al., 2020; Mirza et al., 2018; Parr et al., 2021）和语言的理解与生成（Friston, Parr, et al., 2020; Friston, Sajid, et al., 2020）。由于这些现象都通过最小化相同的目标函数而出现——这些目标函数可以分解为一组可解释的（准目的论）术语——主动推理使我们能够揭示不同现象之间的共性和差异，这些共性和差异在不太一般的建模框架中可能被掩盖。因此，我们将论证，正是因为主动推理本身并非一种意识理论，它才能充分涵盖意识的多样化属性（参见 Hohwy & Seth, 2020; Vilas et al., 2021）。论点在于，通过从一个用于建模适应性行为的通用框架开始，意识理论的轮廓将自然而然地逐渐显现，因为各种意识现象开始通过单一的数学公式得到解释。

在从主动推理构建意识理论的实践中，一个自然的第一步（这一步已经正在进行中）是将该框架应用于意识科学领域中具有代表性的现象，以构建模型。开发出这些模型后，可以探索它们的计算属性和行为，并将每个模型中的变量和参数映射到正在建模的具体意识过程的现象学方面。每个模型随后成为理论的一个构建模块，随着更多模型的积累，理论逐渐发展。因此，这一过程的一个关键组成部分在于识别具有解释力和系统性的模型之间的共同计算属性，这些模型涵盖了意识科学中多样化的现象（Atkinson et al., 2000; Seth, 2009）。

本文旨在面向两个目前在很大程度上相互独立的关键受众：从事意识研究的实验神经科学家和认知科学家，以及在主动推理框架内工作的神经模型研究者和理论家。对于实验科学界，我们希望提供一份关于主动推理及其与意识关系的精确但易于理解的指南，特别强调该理论的经验承诺。对于那些目前尚未从事意识研究但在主动推理框架内工作的理论家群体，我们希望突出该框架在意识研究中的适用性，以及需要进一步理论和形式化发展的领域。

在第2节和第3节，我们简要介绍主动推理建模框架，重点阐述变分自由能和预期自由能分解为一组具有目的论意义的术语。我们还介绍了支持主动推理的生成模型架构的一般特征及其可能的神经实现。这两节是最具技术性的，对于已经熟悉主动推理形式主义的读者可以跳过。我们鼓励不熟悉主动推理的读者坚持阅读这些开篇部分。主动推理本质上是一个数学框架，要精确地讨论它，就必须使用相关的形式主义。第4节则对与意识科学相关的建模文献进行了综述，并提出了一个现有模型的新扩展，使主动推理能够与关于整体意识状态的研究相联系。最后，在第5节，我们论证了所有这些模型中都隐含着一组假设和理论承诺，一旦明确表述，这些假设和承诺将构成一种最小化但经验上富有成效的意识理论。为了尽可能清晰地阐明最小化理论与实验之间的关系，我们遵循了最近在意识科学哲学方面的研究工作（Negro, 2024），并从拉卡托斯关于“科学研究纲领”的理论视角（Lakatos, 1968）来讨论该理论及其经验承诺。

最后，我们指出，本文的主要目的是教育性的，而非论战性的。也就是说，我们不会论证其他竞争性意识理论的不足，然后将主动推理作为替代方案。相反，我们的目标是提供一个关于主动推理框架中隐含的（最小化）意识理论的积极描述。我们坚信，最富有成效的前进方式是以尽可能精确的方式阐述该理论的结构及其与经验数据的关系，以促进基于经验的理论比较。

2. 变分自由能与预期自由能

一个能够维持自身身体完整性的生物体，必须能够保持在其存在所允许的狭窄状态范围内（例如，对于哺乳动物而言，维持相对恒定的内部体温）；这意味着生物体将大部分时间处于一组相对受限的特征状态中（Friston, 2013; Tschantz et al., 2020）。在主动推理框架下，这通过将生物体的表型解释为其生态位的生成模型（即其感觉输入是如何产生的模型）来建模，该模型对与频繁占据状态相关的观测赋予高概率，即对该生物体所具有的特征状态赋予高概率（Corcoran & Hohwy, 2018; Ramstead et al., 2020; Ramstead et al., 2018, 2020, 2021）。因此，感知-行动循环被转化为一个优化问题，其中被极化（极大化或极小化）的主要目标函数——变分自由能——代表了生物体观测是如何产生的生成模型的（对数）证据（Da Costa, Parr, et al., 2020）。

关键在于，生成模型包含一个先验信念，即当行动序列最小化预期自由能时，它们更具合理性。这意味着需要考虑两个目标函数。具体而言，（负）变分自由能是对对数模型证据的一个计算上可行的下界，而（负）预期自由能可以被视为对期望对数模型证据的近似（Parr & Friston, 2018a）。最小化变分自由能为生物体提供了一个对模型证据的近似，可以用于推断世界中的隐藏状态并学习环境的各种统计特征。然后可以利用该模型中的信念来选择能够最小化预期自由能的行动，从而使主体保持在其具有特征性的表型状态中，这些状态与其持续生存相一致。这使得我们可以将行为解释为自我证实的过程（Hohwy, 2016, 2020, 2021），即生物体会采取行动来最大化其对世界模型的证据。参与这一自我证实过程的各个量是至关重要的，我们将逐一进行考察。

变分自由能（公式1）是在近似后验分布（q）下，近似后验分布的对数与生成模型（p）的对数之间的期望差异——即观测（o）及其原因（或隐藏状态 s）的联合概率。近似后验分布反映了基于感觉数据推断出的世界隐藏状态。

变分自由能有两个关键的分解方式，每种分解方式都突出了其基本属性的互补视角。方程 1 的第二行利用了概率的乘法法则以及模型证据不依赖于隐状态的事实（使得我们可以在第二项中去掉期望算子），从而将变分自由能分解为两部分：近似后验与真实后验之间的相对熵或 KL 散度，以及惊讶度（或称负模型证据，即对隐状态求平均的观测数据的概率）。KL 散度始终大于或等于零，因此变分自由能始终大于或等于惊讶度（又称为惊讶量或自信息）。因此，变分自由能是惊讶度的上界，并且在近似后验与真实后验完全匹配时，两者相等。

这种分解方式在理解变分自由能的性质方面具有教学意义，但在描述如何最小化变分自由能时并无实用价值。这是因为真实后验的值在计算上是不可行的，因此代理无法直接获取。在方程的第三行，我们将变分自由能分解为复杂度和准确度两个易于计算的部分。复杂度是近似后验与先验之间的 KL 散度（即在接收观测数据之前对隐状态的信念），衡量了先验与近似后验之间的差异，可将其视为信念更新幅度的正则化项。先验与近似后验之间的变化越大，复杂度越高。准确度是观测数据的期望对数似然（即在每个隐状态下当前观测数据的概率）。因此，最小化变分自由能需要在最大化准确度和最小化复杂度之间进行权衡。

这一点至关重要。感官输入通常是嘈杂且模糊的，在噪声数据的情况下，总是可以通过调整近似后验来提高准确度。然而，不断大幅调整后验会显著降低模型对新观测数据的泛化能力。如果不对大规模（贝叶斯）信念更新进行惩罚，一个极端“准确”的模型将会过拟合噪声，并且需要不断修正（Sengupta et al., 2013）。因此，最小化变分自由能确保了代理能够形成对其感知世界的可泛化解释或模型。

作为自组织生物体，代理必须选择那些平均而言最小化变分自由能的动作（Friston, Rigoli, Ognibene, Mathys, Fitzgerald & Pezzulo, 2015; Parr & Friston, 2019）。诸如反射弧等纯反应性行为可以通过变分自由能最小化来表述，即执行能够带来与（稳态或本体感觉）设定点一致的观测结果的动作（Buckley et al., 2017; Tschantz et al., 2022）。然而，更复杂的动作或动作序列（即策略）则需要对未来观测结果进行某种反事实计算（即规划）。这种规划依赖于期望自由能（方程 2），它将策略的可观测后果视为随机变量（因为这些后果尚未被观测到）。期望自由能通过对预期观测值进行加权求和，来近似每种策略下行动的预期结果，因此被称为“期望”自由能。可以将变分自由能视为期望自由能的一个特例，专门适用于当前时刻，即观测数据已知且不依赖于未来的动作。

因此，根据主动推理理论，动作选择与知觉一样，是一个（规划即）推理的过程。关键在于，代理不是推理出能够最大化观测数据概率的隐状态，而是推理出最可能的行动路径（Friston, et al., 2017）。这里的“行动”既可以是显性身体运动（如扫视），也可以是隐性心理活动（如注意力方向）。这种方式颠覆了传统的动作选择建模框架，它不是先搜索能够达到目标状态的最佳动作，而是首先假设代理会达到其偏好的状态，然后推理出最可能实现该状态的行动路径（Millidge et al., 2020）。最可能的行动路径即是使所有可能策略的期望自由能最小化的策略。

方程2的第二行展示了预期自由能分解为其最直观的组成部分：风险、模糊性和新奇性。由于推导过程较为复杂，我们建议感兴趣的读者参考（Da Costa, Parr, et al., 2020）的附录。

第一个术语是风险，它是基于特定策略的预测后验分布与智能体期望观测结果（由参数C 指定）之间的KL散度。较小的值表示策略预期观测结果与智能体认为最具特征或最有价值的观测结果之间的相似度更高。最小化风险这一项促使智能体倾向于目标导向行为。

第二个术语是模糊性，它是观测结果似然的期望（条件）熵，即隐藏状态与观测结果之间映射的不确定性。为了最小化模糊性，智能体会选择那些能够精确映射状态与观测结果的策略，例如在黑暗的房间里打开灯。

第三个也是最后一个术语是新奇性，它是模型参数（在状态、观测结果和策略条件下的后验分布）与边际后验分布之间期望的KL散度。这里以似然分布的参数 A（描述分类似然矩阵的狄利克雷先验的浓度参数）为例，但其他参数也可以有类似的项。新奇性衡量了在每种策略下预期的状态和观测结果对生成模型参数信念的改变程度。由于新奇性是一个负项，为了最小化预期自由能，智能体会被驱使去最大化后验分布与边际后验分布之间的差异，通过寻找那些能够导致模型参数后验信念最大变化的新颖观测结果。这体现了主动推理背后的双重驱动力：目标寻求和信息寻求，这两种驱动力都统一在一个目标函数下。因此，最小化预期自由能要求智能体在这两种驱动力之间进行权衡，即通过选择策略来同时最小化风险（最大化偏好）、最小化模糊性（最大化对状态的信息增益）和寻求新奇观测结果（最大化对参数的信息增益）。

总的来说，具有有限自动行为库的智能体（例如简单生物体或复杂生物体的自动化子系统）可以通过最小化变分自由能来建模，即通过采取与先验信念一致的行动（例如内稳态设定点）。变分自由能可用于建模连续和离散生成模型中的感知推理，以及连续模型中的简单反射式行为。然而，一旦行动选择需要任何反事实计算，就需要转向预期自由能，这通常需要一个离散的生成模型（通常是分类-狄利克雷模型）。

3. 生成模型、信念更新和神经动态

当前主动推理领域的最新研究将大脑描绘为一个由相互作用的生成模型组成的分层“混合模型”（Friston等人，2017；Parr等人，2021，2022；Parr和Friston，2018c）。低水平感觉推理的基础生成模型是一个预测编码网络，用于对连续量（如运动和对比度）进行推理。这些连续的低水平感觉系统通过连接函数（将连续量映射到离散潜在变量）与更高水平的离散生成模型（例如部分可观测马尔可夫决策过程，POMDP）相连接，这些离散生成模型执行分类感觉推理，并选择离散的动作序列（即策略），然后这些策略再次通过连接函数转换为连续的运动指令（Parr和Friston，2018c）。关于连续模型的教程式综述，可参见Bogacz（2017）和Buckley等人（2017）。对于离散模型的详细数学综述，可参见Da Costa、Parr等人（2020），而对于更通俗易懂的教程式综述，可参见Smith等人（2022）。关于连续和离散模型的全面书籍级论述，可参见Parr等人（2022）。

为了说明主动推理下预测编码推导的一般原理，这里我们回顾一下在假设静态生成模型和固定先验的情况下，从变分自由能中推导单层预测编码网络的过程（Bogacz，2017；Friston，2005）。相同的原理也适用于动态模型的推导（Buckley等人，2017），但需要更多的形式化工具（例如运动的广义坐标）。

为了得到一个可处理的变分自由能表达式，我们做了以下三个假设：1）生成模型（即似然和先验）和近似后验分布是高斯分布；2）变分自由能可以用后验分布均值周围的二阶泰勒级数展开很好地近似（拉普拉斯近似）；3）方差是静止的。实际上，这三种说法是同一假设的不同表述方式。在这些假设下，（负）变分自由能的表达式简化为在后验众数处评估的生成模型的对数。

这为我们提供了一组三个常微分方程，描述了三个类似神经元节点的行为，其动态过程对变分自由能进行梯度下降。这为我们提供了一个简单的神经元动态模型，用于近似隐状态的后验分布。这些方程与皮层微回路之间的映射关系是当前研究的热点问题。然而，从广义上来说，隐状态的动态（在“期望节点”中实现）通常与皮层的深层相关，这些深层向同一皮层层级中的浅层的误差节点进行侧向投射，并向下属层级的浅层误差节点进行反馈投射。预测误差的动态（在“误差节点”中实现）通常与皮层的浅层相关，并向同一皮层层级中的深层进行侧向投射以及向该层级中更高级别的深层进行前馈投射（见图1a）。每个层级中的期望节点作为上一层级的观测值，并作为下一层级的先验（关于综述和讨论，参见Bastos等人，2012；Hodson等人，2023；Shipp，2016；Walsh等人，2020）。

同样，像预测编码一样，通过相对于状态对变分自由能进行梯度下降来反转生成模型。忽略常数项，方程8给出了边际自由能梯度的表达式。

使用softmax函数（这是逻辑函数对向量的推广）来模拟平均放电率，是基于在大规模脑动态的平均场模型中所做的假设，即一个群体的平均放电率可以被视为平均膜电位的S形函数（Breakspear，2017；Da Costa等人，2021；Wilson和Cowan，1972）。在脑电图（EEG）研究中的事件相关电位（ERPs）以及在颅内记录研究中的局部场电位都被视为归一化放电率的时间导数（即变化率）。关于可能的神经实现的简要示意图，请参见图2b。关于深入的讨论和综述，可参见Parr和Friston（2018a）。

到目前为止，我们已经推导出了两种简单的算法，分别用于在连续和离散感知推理的情况中最小化变分自由能：每一种算法都可以直接用神经动态来解释。然而，正如上文针对行为选择所概述的，我们尚未（通过定义）接收到（未来的）观测值，因此必须最小化预期自由能（方程13）来选择策略。我们在下面以矩阵形式展示预期自由能，以突出生成模型组件与预期自由能组件之间的联系。

那么，对于单个时间步的策略的后验分布就是预期自由能的softmax函数（方程14），这实际上将预期自由能转化为一个概率分布，从而可以从中采样下一个动作。

在这里， T表示策略的未来时间范围。最小化（预期自由能的路径积分）的策略将具有最高的后验概率。然后，通过在每个时间步从策略的后验分布中采样来选择动作。

4. 意识现象的计算模型

在概述了驱动感知-行动循环的关键量、连续和离散生成模型的结构，以及模型动态与神经动态测量（例如事件相关电位ERPs和放电率）之间的关系之后，我们现在转向讨论之前使用主动推理来模拟意识科学中典型任务的研究。总体而言，这些研究主要关注意识内容和自我意识。为了简洁起见，我们仅关注数值（即模拟）研究，而牺牲了许多与意识神经科学相关的有价值的定性和概念模型（例如Ciaunica等人，2022；Safron，2020；Seth和Tsakiris，2018），以及主动推理所隐含的意识形而上学的解释（Friston，Wiese等人，2020；Ramstead等人，2023）。关于本文未涵盖内容的相关综述，可参见（Nikolova等人，2022；Ramstead等人，2023；Rorot，2021）。

此外，我们注意到，虽然我们回顾的模型主要关注视觉和内感受感觉模态，但这反映了对意识内容和自我意识研究中视觉和内感受的普遍关注，并不反映主动推理框架在其他感觉模态应用上的局限性。实际上，为了说明框架的解释普适性——并突出本节末尾对意识状态的潜在应用——我们将一个现有的关于听觉规律意识处理的模型扩展，以解释这一过程在睡眠和麻醉中的中断。

4.1 意识内容的模型

在前一节中，我们将感知-行动循环描述为一个迭代过程，包括：1）推断出最能最小化变分自由能的近似后验分布（从而为模型证据设定一个上限）；2）以一种最小化预期自由能（从而最大化模型证据）的方式采样世界。这促使我们对意识科学中几个关键现象的视角发生转变。它将注意力引向许多通常被认为主要是被动的感知现象中的主动采样和预期的作用。

从被动感知到主动感知的转变在双稳态感知的模型中尤为突出，这些模型通常将感知切换描述为由噪声和/或适应性驱动的振荡（例如Moreno-Bote等人，2007；Wilson，2007），而不是至少在某种程度上由主体的行为驱动的状态。例如，Parr等人（2019）提出了一个关于特罗勒消逝（Troxler fading）和双眼竞争的双实例模型（见图3a），该模型将意识内容的变化描述为由策略驱动的后验信念精度的变化，这种变化是作为扫视策略（在特罗勒消逝中）和注意策略（在双眼竞争中）的函数而发生的。特罗勒消逝是一种现象，当参与者被要求保持中央注视时，与周边呈现的刺激相关的感觉会在意识中逐渐消失。双眼竞争发生在向每只眼睛呈现不一致的刺激时：参与者不会体验到刺激感觉的叠加，而是体验到单一感觉之间的离散交替，只有短暂的混合期。

在主动推理框架下，这种感知交替是通过将两个看似平常的观察结果纳入任务特定的生成模型中来解释的。第一个观察是，主体对状态转换的精度估计（即矩阵B的精度）在变幻无常的世界中永远不可能完全确定（参见Hohwy等人，2016）。第二个观察是，感觉输入的精度取决于注视点的位置和/或注意力的焦点（通过使矩阵A的精度条件性地依赖于扫视或注意状态来建模）。将这两个简单假设纳入生成模型，通过预期自由能中的模糊性项，导致了认知行为的出现。在缺乏精确感觉输入的情况下，关于视觉空间某个位置的感知内容的不确定性（预测熵）会不断积累，增加了那些会从视觉空间的该部分获取信息的感觉输入的策略（例如扫视或注意策略）的认知价值。在特罗勒消逝的情况下，主体被迫保持中央注视，从而无法获取关于周边的精确感觉信息。随着时间的推移，这会通过基于不精确的状态转换和感觉输入的迭代信念更新，将对应于视觉空间周边位置的状态的后验分布推向均匀分布。假设状态的后验分布与意识内容之间存在对应关系，并将感知与高精度状态的混合相关联（这是一个我们在第5节中会再次回到的关键点），这将导致刺激从意识中逐渐消失。同样，双眼竞争中典型的离散感知切换也会从生成模型中出现，当主体被限制选择那些增强被注意刺激的精度（即矩阵A的映射）的（隐蔽的）注意策略，而以牺牲未被注意的刺激为代价时（参见注意力的偏向竞争模型；Desimone，1998）。主体接收到关于被注意刺激的精确信息，从而对被注意刺激的状态有一个精确的后验分布，同时由于缺乏关于未被注意刺激的精确信息，未被注意刺激的状态后验分布会逐渐消散为均匀分布。至关重要的是，随着不确定性的积累，未被注意的刺激通过预期自由能中的模糊性降低项，逐渐变得更加具有认知吸引力，从而推动最终的注意策略切换。同样，假设主体的状态后验分布与意识感知内容之间存在对应关系，这会导致依赖于注意力的感知切换。

这种对双眼竞争的主动推理模型很好地解释了一些在被动模型中难以容纳的实验发现，被动模型没有为策略选择等主体性过程设定明确的角色。具体来说，当缺乏注意力时竞争速度的减慢（Paffen等人，2006；Zhang等人，2011），以及奖赏对优势持续时间的调节（综述见Safavi和Dayan，2022）都可以被理解为预期自由能最小化的实例。如果感知切换是由注意力策略的切换驱动的，那么在存在干扰任务时竞争速度的减慢（Paffen等人，2006）可以通过感觉输入精度的降低来解释，这增加了主体需要从每只眼睛采样输入以达到对状态的精确后验分布所需的时间。同样，向其中一个刺激添加奖赏将以加性方式最小化预期自由能的风险项，解释了奖赏对竞争的偏向效应（Marx和Einhauser，2015；Wilbertz和Sterzer，2018）。此外，尽管Parr等人（2019）的原始论文中没有呈现，但在附录1和图3b中我们展示了该模型轻松解释了Levelt定律（Brascamp等人，2015；Levelt，1965）——这是一组简洁的命题，总结了刺激属性（例如亮度对比度）与感知优势持续时间之间的规律性关系。重要的是，除了事后解释大量现有的现象外，该模型还提供了关于奖赏驱动违反Levelt定律的经验预测（附录2），这些预测可以在人类心理物理学领域轻松进行检验。关于将这种建模策略扩展到内克尔立方体幻觉（意识科学中常用的另一种双稳态范式），可参见Novicky等人（2023）。

从在既定生成模型中最小化模糊性转向最大化新奇性和参数学习，Parr和Friston（2018b）提出，偏侧忽视（一种以患者忽视视觉空间一侧为特征的神经综合征，通常是右侧大脑受损后忽视左侧）可以通过预期自由能的新奇性成分的缺陷来解释。在临床上，偏侧忽视通常通过扫视取消任务进行评估，要求患者圈出（即取消）呈现在一张纸上的所有刺激。在这里，忽视的患者将对视觉空间的一侧毫无察觉，而忽视一侧的刺激则未被取消。为了模拟这一点，Parr和Friston模拟了一个类似于偏侧忽视临床测试的扫视取消任务。他们的模型使用网格来表示可能的扫视位置。在每次模拟开始时，所有位置都是新奇的（即参数确定性低），这促使主体向每个位置扫视，并在此过程中在每个位置的A矩阵的狄利克雷先验中积累计数（降低了对“已取消”位置的扫视策略的预期自由能的新奇性成分）。通过增加左侧空间的浓度参数来损伤A矩阵映射（即隐藏状态与视觉结果之间的映射），有效地模拟了背侧和腹侧注意力网络之间的断开；消除了基于新奇性的左侧空间扫视策略的任何能力，从而模拟了视觉忽视的经验现象学。

增加浓度参数的动机——即增加似然映射中的信心——是断开连接是一种最大信心的状态，因为没有任何数据可以改变突触效能。该模型的一个关键预测是可以在健康受试者中进行检验的——健康受试者可以通过突触效能更新似然参数——即随着对视觉场景的熟悉程度增加，个体应该引发越来越大的信念更新，表现为更大的事件相关电生理反应。预计编码参数确定性的底层神经系统包括从顶叶腹侧注意力网络（TJP）到背侧注意力网络的前额眼区（FEF）的传入（前馈）连接。上述经验预测随后由Parr、Mirza等人（2019）在健康人群中使用扫视取消任务结合DCM和MEG进行了检验。与模型预测一致，他们发现当场景更具可预测性时，FEF的背侧成分积极解除对（右侧）腹侧TPJ的抑制，从而产生更大的诱发反应。根据规范微回路网络的构建，这种解除抑制在TPJ的深层最为明显，已知TPJ的深层接收来自FEF的下行输入。

到目前为止，我们已经讨论了三个一般性例子——特罗勒消逝、双眼竞争和视觉忽视——在这些例子中，注意力和扫视策略（可以说）在决定意识内容方面发挥了决定性作用。通过选择性采样过程确定内容，该过程在一个视觉场景的一个位置生成高精度输入，而以牺牲其他位置为代价。然而，注意力与意识内容变化之间的关系远非一对一的。从经验来看，有证据表明被注意的项目可以保持无意识（Koch和Tsuchiya，2007），以及某些刺激可以在几乎没有注意力的情况下引发相应的感知体验（Matthews等人，2018）。那么，在主动推理下，意识感知与无意识感知的区别在哪里呢？合理地推测，答案来自于感知综合背后的生成模型的层次结构以及由此产生的信念更新的时间尺度分离。

为了将主动推理与关于意识的神经相关性的广泛文献联系起来，Whyte和Smith（2021）开发了一个两级POMDP视觉意识模型。该模型将意识感知描述为依赖于生成模型中不同层次之间精确后验分布的双向传播。重要的是，模型的第二层具有足够的时间深度以产生目标导向的行为（例如对视觉场景的主观报告），这些行为必然在比刺激呈现更长的时间尺度上演变。利用这个模型，他们模拟了Dehaene等人（2006）的经验性得出的注意力、刺激强度和意识获取之间关系的分类。通过操纵第一层隐藏状态与观测值之间的A矩阵映射的精度，代表刺激强度和注意力之间的相互作用，他们复制了主观报告和神经相关性的非线性缩放。与经验发现一致，报告的刺激可见性的非线性增加与第二层的高放电率和P3b样ERP相关，类似于前额顶叶区域的“点火”反应。扩展Dehaene等人（2006）的分类，Whyte和Smith（2021）引入了期望，预测在注意力存在且刺激远高于阈值时，有效的期望会降低P3b振幅，与中性条件和无效条件相比。这一预测被Schlossmacher等人（2020）独立证实。

最初关于意识的神经相关性的研究（包括形成德哈恩（Dehaene）分类模型框架的工作，该模型由怀特（Whyte）和史密斯（Smith）于2021年建模）支持了前额叶皮层（PFC）活动和晚期事件相关电位（ERPs，例如P3b）与意识感知之间存在强相关性的观点。在多种实验范式中进行的研究报告了类似的结果（Bisenius等，2015；Sergent等，2005）。然而，无报告范式（Tsuchiya等，2015）的出现对这些发现提出了挑战。在这种条件下，前额叶皮层活动减弱或消失（Brascamp等，2015；Frassle等，2014），而曾被认为是意识接入指标的晚期ERPs（如P3b）也不再出现（Cohen等，2020；Pitts等，2014；见图3C）。像这样的发现导致一些研究者拒绝将前额叶皮层的参与视为意识感知的必要条件（Boly等，2017）。

然而，重要的是，证据的天平已经开始向相反方向倾斜。随后来自非人灵长类动物电生理学的证据表明，即使在没有报告的情况下，也可以从前额叶皮层解码出意识的内容（Kapoor等，2020），并且前额叶皮层活动的波动先于知觉转换（Dwarakanath等，2020），这表明了因果作用的存在。为了调和这些发现，怀特等人（2022）修改了他们之前关于意识接入的模型，将报告的工作记忆要求视为通过策略选择实现的一种心理行为。关于在工作记忆中保留哪些信息的可用策略控制了将第一级刺激状态映射到模型第二级（即，对应于从视觉皮层到工作记忆的信息门控）的二级A矩阵的精确度，以及二级B矩阵的精确度（对应于在工作记忆中自愿保持项目）。

怀特及其同事利用这个修改后的模型模拟了一个既有报告条件又有无报告条件的视觉掩蔽任务。这些模拟再现了报告条件下意识的神经相关性，其中“被意识到的”刺激伴随着模型第二级的高放电率和一个类似P3b的ERP。关键的是，怀特等人（2022）能够在没有报告的情况下通过在模型中模拟一系列刺激精确度（即A矩阵精确度），来评估模型中刺激的可见性，从而构建模型第二级的后验概率与相应报告频率之间的映射关系。在无报告条件下模拟相同任务时，当模型不需要提供其自身感知状态的明确报告（因此也不需要在工作记忆中保持项目）时，他们发现模型表现出较低的第二级放电率（即前额叶活动减少），并且没有产生类似P3b的ERP，因为信息传递的精确度降低（见图3C）。然而，重要的是，模型第二级的后验概率仍然远高于接近100%报告性的阈值，再现了关键发现，即在没有报告的情况下，意识接入与前额叶活动减少和没有晚期ERPs相关联。

该模型提出了两个关键预测。第一，前额叶活动和晚期ERPs应该根据报告指令而分离，因为施加报告要求意味着主体必须以目标导向的方式增加感觉皮层和前额叶皮层之间（以及前额叶皮层内部）传递的信息的精确度；从而改变意识接入的神经相关性。事实上，这正是在一项同时进行的EEG-fMRI实验中观察到的（Dellert等，2021；该实验在怀特等人（2022）模型作为预印本发布后发表）。具体来说，当刺激是有意识的，但与任务无关时，视觉区域有强烈的激活，出现较大的N170，但前额叶激活较弱，没有P3b。相比之下，当刺激是有意识的，并且与任务相关时，出现了强烈的前额叶激活和较大的P3b。该模型的第二个预测是，即使在没有报告的情况下，前额叶和视觉皮层之间传递的双向信息的前馈成分也应该包含关于意识内容的精确信息，这一预测随后被罗（Rowe）等人（2024）证实。

4.2 意识自我的模型

我们现在从外感受意识的模型转向对元意识、内感受和情绪的模型，在这些模型中，主体推断并就自身的内部认知和身体状态做出策略决策。由于意识本质上是主观的，与自我相关的加工是意识科学研究的一个关键领域。这一领域也引起了临床医生的兴趣，因为内感受推断和策略决策的扰乱与精神症状和现象学特征密切相关（例如抑郁症中关于自我效能的异常推断（Barrett等，2016；Ramstead，Wiese等，2023），或者反刍中策略选择的中断（Hesp等，2020））。为了概念上的清晰，我们按主题而不是按时间顺序组织讨论。

基于塞思（Seth，2013）最初提出内感受推断中情感内容的基础，以及斯特凡（Stephan等，2016）后来将稳态和应激性稳态失调与疲劳和抑郁联系起来的工作，钦茨（Tschantz等，2022）开展了一系列模拟研究，以检验不同生成模型结构对稳态和应激性稳态过程的解释能力（参见Corcoran等，2020）。通过一个预测编码网络对身体状态变化的反应性自主反应进行建模，并通过将稳态设定点基于推断的外感受状态进行条件化，将其推广到简单形式的预期行动。至关重要的是，内感受预测误差的精确度变化影响了对内感受状态变化的敏感性，导致稳态调节失败。下行本体感受预测误差与上行内感受预测误差之间的平衡决定了主体是调整其关于生理状态的先验信念，还是执行自主行动以使生理状态与设定点对齐。当优先考虑上行感觉预测误差而不是自主调节时——即当前设定点的先验与预期的内感受数据相比足够不精确时——促使主体改变其对设定点本身的信念。这种自主调节的失败可能与自闭症等疾病中的矛盾性感觉功能障碍有关（Gu & FitzGerald，2014），在这些疾病中，对感觉输入的高敏感性与减弱的自主反应和异常的应激性稳态共存。最后，通过使用部分可观测马尔可夫决策过程（POMDP）与预测编码网络进行交互，使模型能够解释目标导向的内感受控制，其中主体通过预期维持零体温（首选的稳态设定点）与预期体温之间的偏差来做出行动决策。

补充这种概念验证建模方法的见解，最近将主动推断模型拟合到实证数据的研究推断出在各种疾病中内感受精确度受到扰乱，包括抑郁症、焦虑症、饮食障碍和物质使用障碍（Smith等，2020）。值得注意的是，在心跳敲击任务中，最佳拟合模型（通过最小化变分自由能反转的简单隐马尔可夫模型）在患者样本中未能在屏气干扰下调整内感受精确度，而健康对照组成功地增加了他们的内感受精确度。这一发现最近在一个预注册的、具有大样本跨诊断的研究（Lavalley等，2024）以及健康对照组（Smith，Kuplicki，Teed等，2020）中得到了复制。

在一项重要的研究中，史密斯等人（Smith et al., 2021）测试了与主动推断相关的神经过程理论的一些基本预测。他们利用一种新颖的胃肠道感知范式，让参与者报告通过吞咽式振动胶囊传递到胃部的不同强度的振动的存在（或不存在），同时通过同步脑电图（EEG）记录神经反应。对最佳拟合模型参数（同样是一个简单的隐马尔可夫模型）的检查发现支持神经过程理论的证据。具体来说，尽管该模型并未拟合反应时间或神经反应，但内感受精确度（A矩阵精确度）的增加与参与者的反应时间以及感觉（顶枕区）电极的诱发反应幅度呈正相关。

转向更具认知背景的研究，艾伦等人（Allen et al., 2022）构建了一个心视感觉整合模型，该模型在呈现唤醒性或非唤醒性视觉刺激时推断其心动周期的阶段（舒张期与收缩期）。基于刺激类型，模型推断其心脏策略，控制心动周期之间的状态转换。心动周期的隐藏状态反过来又控制视觉A矩阵的精确度。这个最小模型再现了几项原本不相关的实证发现。唤醒性刺激导致立即的心脏加速（防御性惊跳反射；Graham & Clifton, 1966），而对A矩阵映射进行合成性损伤，对应于内感受精确度的降低，产生了“心身幻觉”以及增加的错误推断或元认知偏差（例如，Allen et al., 2016；Hauser et al., 2017）。支持模型背后的假设——即主体根据呈现的视觉刺激推断其心脏策略——科克伦等人（Corcoran et al., 2021）发现，随着感觉模糊度的增加，静息心率和（高频）心率变异性均有所下降。

将内感受、感知和情境推断与情绪相关的理论和实证工作形式化，史密斯等人（Smith et al., 2019）表明，主动推断主体能够在“模拟童年”期间获得一系列情绪概念。具体来说，每个主体最初在隐藏情绪状态（“情绪概念”）与内感受观察之间有一个平坦的A矩阵映射，经过数百次试验，这些试验包括观察到的内感受观察（唤醒度、效价和行为）的组合以及外感受观察（情境），主体学会了隐藏情绪状态与内感受观察之间的映射。有趣的是，他们发现，一个贫乏的“模拟童年”（即模型暴露的情绪结果统计偏向于某种特定情绪，如悲伤）会导致模型在后续的情绪推断任务中准确度降低，即使在暴露于其他情绪之后也是如此。在类似但更具实证性的背景下，史密斯等人（Smith, Lane, et al., 2019）使用分层模型模拟情绪工作记忆任务中的推断。主体需要对两个连续的情绪状态进行分类，然后进行比较。有趣的是，他们发现在他们相对简单的模型中，至少有七种不同的潜在神经机制能够产生情绪意识降低的表型。例如，当主体对不典型的身体状态有较高的先验预期（如某些焦虑形式）时，它会可靠地将自身的悲伤和恐慌内部状态误分类为生病和心脏病发作。

在上述描述的两个模型中，效价被当作一种观察结果来处理，而不是自身被推断的对象——鉴于解释目标是情绪推断（而非情感推断），这种简化是合理的。为了补充这种处理方式，赫斯普等人（Hesp et al., 2021）提出了一个情感推断模型，认为效价是（部分地）从策略的先验和后验之间的不匹配中推断出来的。策略的先验仅基于预期自由能（例如公式14），而后验则基于预期自由能以及基于连续观察的后验信念。从先验到后验的变化反映了预测误差，表明新的观察结果与每种策略下的先验预期的一致性程度。这种误差的方向随后被用作更高层次模型中的观察结果，该模型用于推断效价状态。在这里，支持策略先验的低层次观察结果促进了积极效价，而与先验不一致的观察结果则促进了消极效价。这种类型的（奖励）预测误差或“情感电荷”之前曾与多巴胺的相位性释放相关联。

同时，这种情感电荷被用来迭代更新预期自由能的精确度参数，其中效价状态充当先验。在这里，消极效价状态和意外的观察结果都会降低这种精确度，从而减少预期自由能对策略选择的后续影响。这种减少发挥了几个互补的作用。首先，它促进了概率匹配行为，如果对策略或计划的信念缺乏信心，这种行为可能是适应性的。其次，如果指定了学习习惯（通常用E表示），它允许学习习惯发挥更强的影响。最后，它优化了预期自由能对策略选择的相对影响。具体来说，当策略的后验预期模型证据高于先验预期模型证据时，情感电荷（和效价）是积极的，表明主体对其计划的信心增加，从而提高了预期自由能相对于其他项的精确度。相反，当策略的先验预期模型证据高于后验预期模型证据时，效价会降低预期自由能的权重（即，它减少了风险、模糊性和新奇性对策略选择的贡献）。重要的是，由于两级模型允许效价状态作为策略精确度的先验信念，主体能够将预期自由能对策略选择的贡献情境化，从而在反转学习任务中提高表现。换句话说，通过为主体提供对其内部模型的置信度的动态估计，主体能够最优地权衡当前观察结果（变分自由能）和预期未来观察结果（预期自由能）对策略选择的贡献。

赫斯普等人（Hesp et al., 2021）提出的深度参数化推断形式随后被桑德维德-史密斯等人（Sandved-Smith et al., 2021）扩展，用于模拟一种元意识的形式，这种元意识是冥想神经科学中常见的循环现象学的基础，即“专注→分心→意识到分心→重新专注”的循环。该模型的关键贡献在于将注意力、注意力的控制以及对注意力控制的意识以A矩阵精确度的分层控制来表述。

模型中第一级的A矩阵精确度将感觉观察映射到隐藏状态，由第二级的注意力状态控制，第二级包含两种理想化状态：“专注”和“分心”。主体倾向于保持在专注的注意力状态，但由于第二级B矩阵的不精确性，主体偶尔会从专注状态转变为不专注状态。第二级的策略选择（心理行为）允许主体重新调整其注意力状态并重新进入专注状态，一旦主体意识到自己处于不专注状态，这是许多冥想实践的关键方面。

元意识则由第三级构成，它反过来控制第二级意识状态的精确度。第三级的隐藏状态包括两种状态：高元意识状态，对应于高精确度的第二级A矩阵；低元意识状态，对应于低精确度的第二级A矩阵（通过第二级到第三级的A矩阵映射）。作为概念验证，他们模拟了一个简单的听觉奇异任务，并在不同的第三级注意力状态下展示了主体在低元意识条件下比高元意识条件下花费更长时间处于分心的注意力状态。与低感知需求条件下走神增加的发现一致（Lin et al., 2016），在低元意识状态下，主体只有在听到听觉奇异刺激时才注意到从专注到分心的转变。换句话说，奇异刺激引发了更大的预测误差——并导致更强的上升证据——迫使在层级结构中对隐藏状态的近似后验进行大规模信念更新。

重要的是，与上述旨在统一现有发现并生成新预测的模型不同，该模型的解释目标最好被理解为在理论主要以口头定义、与实证数据联系松散的研究领域早期阶段，提供概念上的清晰性。因此，这种类型的建模最好被视为一种计算概念分析，是旨在统一现有结果或提供实证预测的建模的先决条件。

4.3 意识状态模型

主动推断模型尚未应用于操纵意识状态的实验（但可参考霍布森和弗里斯顿的理论综述）。然而，操纵意识状态通常伴随着感觉和运动的脱节，这些脱节至少在表面上适合用主动推断的语言来解释。例如，对长时间尺度模式违规的神经反应在睡眠和麻醉状态下有所不同。为了突出主动推断的解释普适性，本节将介绍史密斯等人（2022）提出的听觉规律感知分层模型的简单扩展，并展示如何通过针对性地操纵精确度来重现以下发现：与清醒状态下检测“全局”（长时尺度）模式违规相关的晚期P3b事件相关电位（ERP）成分在非快速眼动（NREM）和快速眼动（REM）睡眠状态下均缺失，而对“局部”违规的ERP反应则得以保留。我们简要概述模型结构以解释结果，并建议感兴趣的读者参考史密斯等人（2022）以获取模型的逐步描述。

该模型包含两个分层级别（见图4a）：第一级追踪听觉音调的瞬间变化，第二级追踪第一级的音调模式，推断整体试验类型（即所有刺激是否具有相同的“标准”音调，或者是否存在“奇异”音调）。我们允许模型在10次试验过程中在第二级的D向量中累积浓度参数。在第10次试验中，音调要么符合预期的试验类型，要么违反预期。与实证发现一致，“全局”模式违规在模型的第二级引发了类似P3b的大型ERP，而“局部”试验内预期违规在模型的第一级引发了类似失匹配负波（MMN）的ERP。基于非快速眼动和快速眼动睡眠是低肾上腺素能状态的发现，我们利用与主动推断相关的进程理论，对模型进行针对性操纵以模拟去甲肾上腺素缺失，通过降低第二级B矩阵的精确度（应用精确度参数β=0.9的softmax函数）来实现，这在理论和实证上均与肾上腺素能张力有关。与实证发现一致，降低B矩阵精确度消除了模型第二级的P3b样ERP，但保留了第一级的MMN样ERP（见图4b）。由于第一级的动态不依赖于逐时间步的动态，第一级B矩阵损伤对模型任何一级的ERP均无影响。

正如所描述的，这个模型仅仅是解释睡眠状态下晚期ERP缺失的原因，并没有本身解释为什么参与者在睡眠的某些阶段失去意识。然而，如果我们遵循前文提出的论点——意识接入需要一种时间深度，这种深度能够抽象化感觉输入的瞬间变化（弗里斯顿，2018；弗里斯顿等，2012；怀特和史密斯，2021）——那么这里提供的模型也可能为非快速眼动（NREM）睡眠与较少的梦境报告（表明意识的缺失）相关联，以及快速眼动（REM）睡眠以更频繁的、带有离奇且看似不连贯的现象学特征的梦境报告为特征（霍布森，2009）提供一种算法层面的解释。

具体来说，非快速眼动（NREM）睡眠是一种低胆碱能状态，在主动推断框架下，这会导致生成模型的层级之间因A矩阵精确度的降低而出现脱节。这种脱节会有效地使时间深度层级“离线”，极大地减少信念更新，这可能对应于意识的丧失。

相比之下，快速眼动（REM）睡眠是一种高胆碱能状态，这将允许在层级之间进行层级信息传递。关键在于，处于高胆碱能状态的模型，受到感觉皮层内在波动的驱动，并结合低肾上腺素能张力，会表现出隐藏状态之间的随机转换（通过低B矩阵精确度），这可能解释了REM睡眠中梦境的离奇现象学。有趣的是，REM睡眠行为障碍——通常被认为是帕金森病的前驱症状——表现为在睡眠中“表演”这些梦境，这可能反映了在层级之间平衡精确度的失败，尤其是在做梦期间抑制本体感受预测误差精确度的失败。

这个简单的例子很好地说明了主动推断建模的典型策略：从一个足够明确的目标现象出发，构建一个生成模型，并基于实证和理论神经生物学的结合，模拟对模型的针对性操纵，以模拟实验操纵。鉴于睡眠和麻醉丰富的神经生物学背景，这种策略可以像上面所展示的那样，直接应用于对意识状态的实验操纵。当然，这里展示的模型只是跨意识状态神经动态生成模型的一个例子。理想情况下，未来的研究将构建并比较多个竞争模型与实证数据。

5. 主动推断作为一种关于意识的最小理论

我们在本文开头引入主动推断时，期望将其作为构建意识理论的基础，利用主动推断模型的不同方面作为构建模块。在明确了框架以及主动推断模型提供的解释类型之后，我们现在来探讨这一期望。为了尽可能清晰地阐述理论的结构及其与实证数据的关系，我们遵循最近关于意识科学哲学的研究（Negro, 2024），并借鉴拉卡托斯（Lakatos, 1968）关于“科学研究纲领”的理论，这一理论在当代科学哲学家中（Godfrey-Smith, 2003）通常被视为波普尔证伪主义纲领（Popper, 2008）的继承者。

根据拉卡托斯（1968）的观点，研究纲领包含两个组成部分：硬核和保护带。硬核由构成理论基础的一系列基本概念组成，这些概念本身不需要直接可检验。相比之下，保护带由较不核心的概念和假设组成，当与硬核结合时，它们能够产生可检验的预测。如果研究纲领要得以存续，变化只能发生在保护带上。重要的是，所作的改变必须是进步的。也就是说，这些改变必须使理论更加精确，或者扩展其解释范围以增强其预测能力。然而，如果对理论的改变仅仅是为了解释矛盾的结果，而没有产生新的预测或提供其他解释优势，那么该研究纲领就被认为是“退化的”，最终可能需要被放弃。例如，整合信息论（Albantakis et al., 2023; Oizumi et al., 2014; Tononi et al., 2016）的硬核由推导出Phi作为意识衡量标准的假设构成。其外围部分则由使Phi可计算的桥梁假设和近似方法构成。如果Phi不能可靠地与意识状态共变，这将对整合信息论构成严重挑战。然而，重要的是，这并不会对整合信息论造成致命打击，因为导致失败的原因可能是一个或多个推导出Phi可计算近似的假设，而不是理论的硬核本身。研究纲领的健康状况将取决于整合信息论能否通过改变保护带来产生额外的预测。

主动推断框架的核心是将两个目标函数——预期自由能和变分自由能——最小化。因此，这两个目标函数以及对它们进行极值化的要求，必须包含在基于主动推断的任何理论的硬核中。这意味着所有行为，无论是有意识的还是无意识的，都必须在某种最小意义上旨在最小化这些量（参见Hohwy, 2021）。实现这一目标的神经和计算过程，至少目前而言，是理论保护带的一部分。

为了构建意识理论，我们需要的下一个组成部分是目标函数中的量与意识体验之间的联系。在上述所有模型中隐含的最最小的联系是意识内容与推断出的隐藏状态（即关于世界、身体和大脑状态的近似后验分布 q(s)之间的联系。因此，所有意识内容的变化都必须源于世界、身体或大脑状态的推断变化；这包括从没有意识内容到有意识内容的变化（如意识状态模型），以及外感受和内感受内容的变化（如感知、情绪和情感模型），以及源自大脑状态本身的意识内容（如元意识）。这是一种最小的联系，因为它只表明主动推断所特有的选择性采样是意识内容变化的必要条件，而不是充分条件。这种最小的联系排除了意识变化可以在状态后验分布不变的情况下发生的可能性（但不排除状态后验分布变化而意识体验不变的可能性），并且与表现出由主动推断支配行为的无意识生物是一致的。

最后，为了让主动推断成为一种关于意识本身的理论，而不仅仅是关于适应性行为的理论，我们需要一个标准来区分意识状态和无意识状态（Doerig等，2021；Seth和Bayne，2022）。用主动推断的语言来说，我们需要解释是什么使某些后验信念成为有意识的，而另一些则成为无意识的。在这里，我们再次参考基于主动推断推导出的意识内容的计算模型所做的假设。在上述所有被回顾的模型中，与意识内容最对应的后验信念是那些驱动策略选择的信念，特别是那些驱动主观报告策略选择的信念。至少，支持主观报告的计算需要一个离散生成模型。连续生成模型可以驱动类似反射的动作，但支持主观报告（例如，信心投注，或存在与否的判断）的计算类型是明确的反事实的。因此，它们需要一个能够考虑一个或多个离散备选方案的离散生成模型。重要的是，离散生成模型的深层演变速度太慢，无法与感知现象学相匹配（Whyte和Smith，2021）。因此，我们认为意识/无意识的区分与意识获取机制有关，并且发生在离散-连续界面，即由感官瞬间变化驱动的连续后验信念被转化为可以驱动行动选择的离散格式的地方。

因此，要使一个后验信念成为有意识的，它必须发生在足够慢的时间尺度上，以便从即时的感官流动中抽象出来，使其能够为反事实策略选择提供信息，并且足够精确，以可靠地区分不同反事实的世界状态。这与之前关于主动推断的哲学工作是一致的，这些工作认为在层次生成模型中，意识获取的计算作用是迫使主体暂时确定一个关于世界隐藏状态的特定后验信念，以驱动行动选择（Hohwy，2013；Marchi和Hohwy，2022；Whyte，2019）。

精确性要求可以被视为一种计算类比，观察到的意识体验是由分化且常常是互斥的感知对象组成的（Canales-Johnson等，2017；Oizumi等，2014；Seth，2021；Seth，2014；Tononi，1998）。至关重要的是，这也意味着不存在一个硬性阈值，使得后验信念会成为可报告的。相反，意识获取的阈值会随着任务要求和主体需要执行的决策类型而变化。此外，我们希望明确，我们并不是说成为反事实策略选择过程的目标是使后验信念有意识的原因。相反，是这种后验信念在合适的时间尺度上并且以足够的精确性为策略选择过程提供信息的能力（从反事实的角度来看）使其成为有意识的（参见关于意识的倾向性理论，如Carruthers，2003；Prinz，2012）。最适合解释主观报告的决策标准的具体内容是一个正在进行的实证辩论问题，最好被视为理论的保护带的一部分（关于可能的实现方式，请参见Whyte等，2022）。关于现象学与反事实策略选择深度之间的关系的讨论，请参见（Seth，2014）。

重要的是，理论的核心部分所包含的关于意识过程与主动推断之间的最小联系，应当被视为发现和构建一个更全面的意识理论的基础构件，而这个更全面的意识理论目前隐含在主动推断的外围部分。换句话说，尽管主动推断的基本架构中已经有所暗示，但一个完整的理论需要的不仅仅是通过行动和感知来优化内部模型的原则。它必须明确模型本身的特性，才能在科学上具有实用性。

发现的过程涉及纳入、测试和抛弃模型（包括上述所回顾的模型），并对现有模型进行进一步的完善（例如对双眼竞争和层次化听觉处理模型所做的修改；见附录1-2）。对这些模型的检查随后会为一个更丰富的理论提供信息，提示哪些特性在对意识内容、自我和状态的解释中是关键的。

我们在这里倡导的方法首先是一种开放式的理论构建和发现过程，只要它仍然是一个不断进步的研究项目，并且在与其他意识理论的模型证据竞争中保持竞争力（参见Corcoran等，2023），理论构建就会不断扩展和完善。未来的关键发展将包括对更多意识现象进行更细致的建模，包括应用结构相似的模型来统一多样化的意识和无意识现象。这体现在双眼竞争和特罗勒消退的模型（Parr，Corcoran等，2019）中，以及用于容纳无报告范式的注意力驱动感知模型的层次化扩展（Whyte等，2022）。进一步的工作还应该研究将意识内容、自我和状态模型的元素结合起来的模型的表现。此外，针对独特现象学类型（例如，情感和情绪、物体性、元认知；Barrett等，2016；Nikolova等，2022；Pezzulo等，2018；Seth，2014；Seth等，2012；Seth和Friston，2016）的概念模型也需要进一步完善，以实现更大的计算特异性，并能够产生可检验的预测。

理论的保护带由允许对特定意识现象的模型进行书写和模拟的形式化构成，并且包括将模拟结果映射到实证得出的行为和神经数据的假设。这包括生成模型的结构、将生成模型和状态及策略推断的动态映射到神经数据的过程理论，以及将通过模拟得出的量与报告的现象学联系起来的假设（例如，感知的内容是否对应于后验分布的众数，分布的精确性是否对感觉现象学有贡献？）。

当前对这一理论的表述是有意保持极简的，为活跃推断理论家之间在经验或理论上尚未确定的问题上保留了实质性的分歧空间。它也承认，绝大多数的解释性工作将由理论的保护带完成，因此，它在很大程度上对富有成效的修正和完善是开放的（鉴于可能的生成模型结构的多样性以及模拟数据与实证数据之间映射的过程理论的灵活性）。在个体生成模型的层面，几乎总是可以构建一组候选模型，这些模型能够在不同程度上解释相关的实证数据，而在极端情况下，它们甚至可能产生相互矛盾的预测。这是一个特点，而不是一个缺陷，并且与活跃推断作为一种建模框架这一事实相辅相成，它已经与一系列变分（贝叶斯）方法一起发展，用于模型拟合和模型比较（Daunizeau，2011；K. Friston等，2007；Zeidman等，2022）。这些方法使得在竞争的生成模型家族之间进行裁决成为可能，每个模型都体现了关于产生观察到的实证数据的过程的假设。因此，个体生成模型的发展——以及活跃推断作为一种意识理论的发展——是相辅相成的，为理论既能够对实证争论做出贡献，又能够与其实证争论共同进化留下了空间。

例如，正如我们前面提到的，支持意识对感知状态的获取的各种决策标准是一个正在进行的讨论话题，最近的证据指向了一种潜在的元认知机制，该机制涉及对刺激的存在与否进行抽象推断，而这种推断独立于感知空间本身的结构（Dijkstra等，2023）。这一机制与之前提出的一个活跃推断架构（Whyte等，2022）相悖，该架构通过一个明确与主体感知空间结构相联系的策略空间来模拟意识获取。目前的证据还不足以在更一般的情境中区分这两种假设，但如果意识获取确实基于一种与感知状态空间结构无关的元认知决策，那么这将对该特定的活跃推断模型构成重大（可能是不可逾越的）挑战。然而，至关重要的是，这一模型组件是独特的，并不是活跃推断下生成模型结构的一个内在特征，这使得未来有可能构建尊重新发现的模型（并且通过这样做，富有成效地将活跃推断的解释范围扩展到元认知领域）。我们将这种灵活性视为理论的一个解释优势，而不是缺陷，鉴于意识科学的早期阶段以及随着方法和数据质量的提高而不断修订实证发现，这种灵活性是完全合适的。

这些考虑留下了这样的担忧：活跃推断可能过于灵活，无法作为一种意识理论而富有成效（而不仅仅是一个有用的建模框架）。或者，换句话说，理论的核心与保护带之间的联系留下了太多的自由度，无法导向一个自身独特可识别的意识理论。然而，有两个关键的考虑因素可以缓解这一担忧。首先，上述关于对活跃推断意识获取模型的潜在修订的例子涉及修订一个模型中关于主体策略空间的假设，因此并不构成对理论保护带的重大打击。至关重要的是，这并非适用于所有假设。不同模型共享由少数几个语义可解释的数量（即，准确性、复杂性、风险、模糊性、新奇性）组成的客观函数这一事实，限制了可能对特定行为做出贡献的参数数量。例如，在模拟选择性注意力时，刺激的显著性被归因于A矩阵的精确性——这将通过预期自由能的表征（模糊性最小化）成分对行为产生影响。这一假设几乎被所有涉及注意力和视觉搜索的活跃推断模型所共享（Allen等，2019；Holmes等，2021；Mirza等，2018，2018，2019；Parr等，2021；Parr & Friston，2017a，2017b，2018b；Whyte等，2022；Whyte & Smith，2021）。因此，如果发现一个无法用这种方式建模的注意力效应，那么这将对活跃推断意识理论构成非常重大的打击，因为这种修订的影响将波及大多数现有模型。

第二个重要的考虑因素是，事实上，该理论确实产生了定量和定性的预测。尽管这些预测并非直接从理论的核心推导而来，但它们足够接近，如果被证明是错误的，那么将需要修订大多数建模研究中所做的桥梁假设——即使这些研究似乎与意识科学毫无关系。这种修订将使理论危险地接近成为一个退化的研究项目。在主动视觉中存在探索-利用权衡是一个定量预测的例子。我们在附录2中给出了一个在双眼竞争背景下这种预测的明确例子。如果发现与刺激相关的奖励并没有与竞争刺激的表征内容（例如，亮度对比度）在选择注意力策略时进行权衡，那么活跃推断将受到严重挑战，因为预期自由能中风险与模糊性之间的权衡是理论核心的一个基本组成部分。当然，直接测试这一预测将很困难，因为参与者之间在学习速率、悲观先验以及对奖励关联的敏感性等方面存在个体差异，以及其他因素。

此外，注意力在早期视觉处理中所起作用的程度仍然不确定，这意味着在实践中，通常需要在各种实验中进行最佳解释的推断。然而，如果在参与者和实验范式（例如，双眼竞争和特罗勒消退）之间，最佳拟合模型被稳健地证明在选择注意力策略时没有尊重风险与模糊性之间的预期权衡，那么活跃推断意识理论将变得不那么可信。因此，在某种意义上，活跃推断建模框架——以及伴随它的模型拟合和比较工具——是严肃检验活跃推断作为一种意识理论的关键。这是一个有利的位置。模型拟合和比较的工具在任何情况下都不会假设用于推导被拟合模型的理论的真实性。在特定情境中拟合得最好的模型完全有可能是一个违反活跃推断意识理论核心信条的模型。

我们还可以从该理论中推导出第二个定性预测。具体来说，正如我们在前面提到的，作为意识理论的主动推断的一个核心承诺是，如果意识内容有任何变化，那么身体、大脑或世界的推断状态也必须发生变化。这一承诺的推论是，在缺乏感官（A矩阵）精确性的情况下，关于世界状态的后验信念不应偏离其先验轨迹（例如，我们能够在脑海中默默数数的事实表明，我们可以根据关于从一个数字过渡到下一个数字的先验信念，逐刻改变我们的后验信念，但在缺乏精确的感官数据的情况下，我们不会偏离这一数字轨迹），因此，意识内容也不应发生变化。该理论的一个方便的口号因此是“看见即凝视”（其他感觉模态也是如此，例如“听见即聆听”“感觉即触摸”等）。也就是说，有意识地感知意味着运用某种反事实策略选择过程所特有的精确性分配，涵盖外显和内隐行为。完全将零精确性分配给一种感觉模态可能过于理想化，以至于在经验上难以处理；然而，与理论核心相关的另一个预测是，精确性的降低会导致信念更新的延迟，表现为意识内容变化的延迟。如果我们把内源性精确性分配与内隐和外显注意力策略联系起来（Hohwy，2012），而这是主动视觉的主动推断模型中所做出的假设，那么在选择注意力/扫视策略时被分配了高精确性的刺激，将比视网膜匹配但不是扫视目标的刺激更快地进入意识内容。这种预测也是主动推断作为意识理论的独特之处，与其他更具针对性的意识理论（如全局工作空间理论或整合信息理论）形成对比，后者没有明确的动作角色，而在主动推断中，精确性的分配是通过明确选择注意力或扫视策略来实现的。这种经验性预测确实是整合信息理论与被动预测处理理论以及主动推断之间对抗性合作的一部分（INTREPID CONSORTIUM，2021）。

最后，重要的是要注意，该理论的成功与否并不完全取决于这两个接近核心的预测的成功与否。即使这些预测得到验证，主动推断仍有可能作为意识理论失败。实际上，理论失败的方式可能有很多种不太戏剧性的方式——而且我们怀疑这些方式更有可能发生。例如，如果主动推断的关键现象模型过于复杂（即它们过度拟合于特定的实验结果且无法泛化），或者意识和非意识感知的模型看起来无法区分，或者不同意识现象的模型未能显示出一致的共同点和差异，以至于该理论在提供统一或独特解释方面几乎没有帮助，那么这将表明这是一个退化的研究项目。反过来，如果该理论最终取得成功，我们期望最终能够用一组相对较小的模型来复制意识的所有关键行为和神经相关性，这些模型沿着少数几个维度变化，反映报告的现象学和神经相关性之间的差异和相似性。这也暗示了解释的性质和方向。神经和行为变量通过主动推断的解释工具与现象学（反之亦然）相映射。

结论

在这里，我们论证了主动推断正是因为**不是**一种意识理论，才在当前关于意识的理论方法中独树一帜，能够充分展现意识科学研究下现象的丰富性和多样性。至关重要的是，我们主张主动推断不仅仅是一个用于建模意识的框架。这些模型在意识科学背景下的解释所隐含的假设，导致了一系列经验预测，如果这些预测被证明是错误的，那么将需要对在主动推断下构建的大多数模型进行修订。该理论的核心由一个要求构成：在感知中最小化变分自由能，在策略选择中最小化预期自由能，同时推测意识的内容（包括外感受和内感受体验，以及大脑自身状态）——在某种程度上——必须与世界状态的推断相对应，这种对应发生在连续的感官计算与离散的反事实策略选择过程之间的界面上。

意识的科学研究，归根结底是一门经验科学。如果主动推断要为我们提供一个有用的意识理论，那么将来之不易的理论见解转化为经验见解就必须成为优先事项。目前，在将旨在澄清概念的抽象模型转化为能够对经验数据提供定性解释的模型方面，存在着明显的瓶颈。反过来，在将这些旨在定性解释和预测的更复杂的理论模型转化为能够与数据进行定量比较的最小模型方面，也存在瓶颈。大多数的解释性工作仍有待完成。然而，我们在本文中主张，一种理论的轮廓已经开始显现。因此，我们对主动推断作为一种意识理论，最终能够提供一组最小化的模型来解释和统一意识内容、自我和状态的研究充满乐观。

附录1：主动推断下的Levelt定律

为了展示Parr、Corcoran等人（2019）提出的双眼竞争模型与Levelt定律的兼容性，我们重新实现了原始模型。简要来说，该模型有三个隐藏状态因子，分别编码呈现给每只眼睛的刺激的身份（状态为{左，空白}和{右，空白}）以及注意力的焦点（状态为{左，右}）。换句话说，人们可以将注意力集中在与右侧刺激一致的特征上，或者集中在来自右眼的数据上，或者集中在来自左眼的数据上。模型有两个结果模态（A矩阵），每个眼睛的隐藏状态因子各对应一个，它们将进入每只眼睛的刺激的观察条件概率映射到相应的隐藏状态。A矩阵映射的精确性依赖于注意力隐藏状态因子。当注意力缺失时，A矩阵是均匀的（例如，列由[0.5 0.5]组成），而当注意力存在时，映射相对精确（[0.7 0.3]）。这使得隐藏状态在未被注意的观察模态下条件独立。与每只眼睛相关的隐藏状态因子的B矩阵初始化为单位矩阵，然后通过softmax函数，其中精确性参数ω = 0.8，引入足够的不确定性到主体的转移信念中，以确保在缺乏精确输入（即在缺乏注意力的情况下）时，关于隐藏状态的不确定性会随着时间积累，未被注意的刺激会变得越来越具有认知吸引力。注意力隐藏状态因子的B矩阵依赖于主体的注意力策略{左，右}，将注意力转移置于主体的控制之下。两种结果模态的C向量都是均匀的。

为了模拟Levelt命题所描述的实验条件，我们系统地降低了其中一个（Levelt的第二命题）或两个（Levelt的第四命题）A矩阵映射的精确性。Levelt的第二命题指出，降低进入一只眼睛的刺激的“强度”（例如对比度），而保持进入另一只眼睛的刺激强度不变，应该会显著增加与未改变刺激相关联的感知的主导持续时间，并导致与强度降低的刺激相关联的感知的主导持续时间相对较小的减少。与之相符的是，降低其中一个A矩阵的精确性，而保持另一个不变，导致进入更精确眼睛的刺激被采样（即被注意）的时间显著增加，而与较不精确眼睛相关的刺激被采样的时间逐渐减少（图3b上部）。

这种不对称性是由于较不精确的刺激的认知价值相对降低。Levelt的第四命题指出，增加进入两只眼睛的刺激的“强度”将导致两种刺激感知的主导持续时间减少。与Levelt的第四命题一致，降低两个A矩阵的精确性增加了主体在切换之前采样刺激的时间（图3b下部）。A矩阵精确性的对称降低促使主体花费更多时间采样每个刺激以减少其不确定性，从而导致更长的主导持续时间。换句话说，在A矩阵精确性降低的情况下，每个刺激保持其认知价值（即减少模糊性）的时间更长。

附录2：双眼竞争与探索-利用困境

基于最小化预期自由能的主体在探索（即模糊性）和利用（即风险）之间的权衡，我们通过将附录1中描述的Levelt命题的模拟扩展到包含奖励，试图生成一个新的实验预测。具体来说，我们模拟了Levelt第二命题所描述的条件，但在第一组模拟中假设了一个均匀的C向量，而在这里我们将降低精确性的刺激（例如，在实验设置中对比度降低的刺激）与奖励相关联。在模拟的每个时间步中，右眼结果模态的“右”状态相关的观察被赋予了一个值 r = 0.25 ，这在双眼的A矩阵精确性匹配时（即每个刺激的认知价值匹配，但奖励眼的风险更低）导致了对奖励刺激感知的初始主导持续时间的偏倚。重要的是，由于风险和模糊性相互权衡，这种偏倚可以通过降低奖励眼的精确性来补偿，从而降低其认知（模糊性降低）价值（图A.2）。因此，我们预测：1）在刺激强度（对比度）匹配的情况下，竞争将偏向与奖励刺激相关的感知；2）这种偏倚将通过降低奖励刺激的认知价值来补偿。综合来看，这将导致在奖励条件下对Levelt第二命题的预测性违反。

原文链接： https://arxiv.org/pdf/2410.06633

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.