A Drive to SurviveThe Free Energy Principleand the Meaning of Life
生存的驱动力:自由能原理与生命的意义
![]()
![]()
![]()
附录:混凝土毯子有何用处?
在过去一年中,越来越多对自由能原理(FEP)的批评者开始质疑弗里斯顿及其合作者的论文中,如何轻易地在马尔可夫毯(Markov blanket)的标准启发式表述与一种更强的本体论表述之间来回切换(Menary & Gillett, 2020;Bruineberg 等, 2021;Raja 等, 2021)。例如,正如第5.2节所述,Allen 与 Friston(2018)从一个毫无争议的陈述——“系统边界(例如,系统内部状态与外部状态之间的边界)可以被描述为一个马尔可夫毯”——转向将马尔可夫毯描述为一种真实存在的边界,系统必须主动维持这一边界,并且其自身的存在在因果上依赖于该边界。
同样地,Ramstead 等人(2018)在两种观点之间自由切换:一方面将马尔可夫毯视为贝叶斯网络语言中描述某种统计关系的一种方式,另一方面又将其视为世界中真实存在的事物,正是它产生了模型所描述的那种条件独立性:
“马尔可夫毯在内部状态与外部状态之间建立了一种条件独立性,使得内部对‘外部’是开放的,但仅以条件方式开放(即,内部状态只能通过马尔可夫毯这层‘面纱’来‘感知’外部状态……)。有了这些条件独立性,我们现在就拥有了对任何系统内部状态与外部状态之间明确的(统计意义上的)分离。马尔可夫毯可以被看作是细胞的表面、我们感觉上皮的状态,或万维网中围绕某一特定区域精心选择的节点。”(第4页)
他们进一步指出,马尔可夫毯的位置为“生物系统提供了一种完全可推广的本体论基础”(第5页)【原文强调】。然而,这种实在论的解释并非马尔可夫毯原始概念的一部分,也并非直接从自由能原理的数学核心中必然推导而来。
正如 Bruineberg 等人(2021)所指出的:“形而上学的结论需要形而上学的前提,而不能简单地从形式模型中直接读取出来。”因此,乍看之下,将马尔可夫毯(Markov blankets)实体化(reification)似乎是一个典型的错误案例——即把模型的属性误当作目标系统本身的属性。Andrews(2021)认为,这类错误在自由能原理(FEP)文献中可谓司空见惯:例如,“熵”或“能量”等术语原本是从热力学系统中借用过来,用以描述类似的统计性质,却常常被误解为仍然保留着仅在描述具体物理系统中物质与能量受限流动这一有限语境下才成立的含义。
因此,对马尔可夫毯的实在论立场,或许可以被视为又一个“错置具体性谬误”(fallacy of misplaced concreteness,Whitehead, 1925)的实例。这种危险在科学建模中始终存在,因为模型的实用性往往与其表征的忠实性(representational fidelity)并不一致(Morgan & Morrison, 1999;Potochnik, 2017)。不过,即便对马尔可夫毯的实在论确实是一种谬误,这也并不必然彻底否定FEP本身的合法性。例如,Andrews(2021)建议,应摒弃这种多余的主张——即声称FEP描述了所有生命系统的某种客观特征——从而将FEP的数学核心视为一种纯粹的形式模型结构,并将其与关于该模型是否适用于特定目标系统的概念性与经验性问题明确区分开来。
倘若FEP的支持者始终坚持这种更为克制(abstemious)的解释,他们的工作很可能引发更少的困惑与争议。但或许,也因此会为作者们赢得少得多的关注。遗憾的是,正如我们所见,在FEP文献中,这种对纯粹形式主义与在其之上构建的各种哲学理论和模型之间的区分,几乎从未得到应有的尊重。那些声称FEP可能为生命系统提供一个第一性原理(first principle),甚至能够涵盖自创生(autopoiesis)与自主性(autonomy)的主张,显然属于哲学与理论生物学的范畴,而非数学本身。在将FEP作为生命理论进行批判性分析时,我所关注的正是这些附加的哲学主张。
就马尔可夫毯而言,这一生命理论要求我们确实能够将其视为一种真实存在的实体,为生命系统所独有,并具有因果效力,从而维持并区分生命系统与其周围环境。
为了公正地强化(steel-man)这一观点,值得指出的是:尽管主张马尔可夫毯具有本体论地位(ontological MBs)的支持者尚未提供充分论证来支撑其实在论立场,但FEP的批评者也并未证明这种实在论是错误的——他们只是指出,目前尚缺乏对其的正当理由。事实上,正如第五章所讨论的那样,我们模型中出现的马尔可夫毯对一系列初始选择极为敏感——比如选择哪些变量,以及以何种粒度(coarseness of grain)对这些变量进行划分——但这并不意味着世界上实际结构中就不存在某种真正意义上的“真实马尔可夫毯”。同样,这也不排除我们的部分模型(甚至常常错误的模型)有时仍可能准确地识别出它们。建模文献中常有一句陈词滥调:“所有模型都是错的”,但可以合理地假设,所有有用的模型至少在某些方面是正确的。我们的地图中必须有一些特征确实对应于真实疆域中的特征,否则它们根本就不是地图。
因此,如果弗里斯顿及其同事未能提供支持其形而上学结论所需的形而上学前提,我们是否能代他们推导出这些前提呢?
A.1 上帝的伟大因果图
一位因果建模者会对马尔可夫毯(Markov blankets)的实在性作何评论?首先,他们很可能会指出:每一个因果图都包含马尔可夫毯,这仅仅是构建此类图时所预设前提的自然结果。就我们的目的而言,相关的预设有以下两点:
(1)可分解性(Decomposability):系统可以被分解为一组离散的部分以及它们之间的连接;(2)这些部分之间的相互作用满足马尔可夫条件(Markov condition),即每个部分的状态在其父节点给定的条件下,与其非后代节点的状态相互独立。
第二个标准确保了我们的图可以按照马尔可夫毯进行因子分解(factorizability),而当这些图被解释为因果模型时,这一条件就成为因果马尔可夫条件(causal Markov condition)。
因此,马尔可夫毯究竟是仅仅一种“统计工具”,还是系统本身的“必要属性”,这一问题归根结底取决于:这些预设究竟是为了帮助我们近似系统行为而采用的“有用的虚构”(useful falsehoods),还是准确描述了系统各部分的真实结构及其相互作用。
在程序化因果发现(programmatic causal discovery)方法的开发者中,这些构建公理主要是在实用主义基础上得到辩护的,而非被视为关于“因果”概念的分析性真理,或反映某种自然基本法则的原理(Spirtes 等, 2000;Pearl, 2000;Stafford, 2005;Weslake, 2006)。对于这些模型背后所隐含的形而上学意涵的质疑,往往被忽视,甚至遭到公开敌视(Glymour, 2010)。例如,Glymour(1999)在为因果马尔可夫条件的合法性辩护时,并未诉诸他所轻蔑地称为“苏格拉底式分析”的哲学思辨,而是列举了一系列案例:在这些案例中,基于该条件的方法仅凭观测数据就能成功预测干预的结果。正如他所说:“科学发现的核心问题在于找到适合可靠、高效搜索的正确表征,而非科学哲学所执迷的形而上学争论”(第64页)。
尽管如此,虽然因果建模者本人或许并不特别在意,但认为这些构建公理不仅仅是实用工具,而是描述了现实的必要特征——这一立场其实早于自由能原理(FEP)就已存在。
可分解性——即现实由独立的基本构件所构成——在科学与哲学史上一直是一个(令人惊讶地)顽强的核心信条,从留基伯(Leucippus)的原子论到经典逻辑中的个体概念皆是如此。其顽强性令人惊讶,是因为这一古老教条作为对基本现实的描述,正日益受到诸如量子场论等现代发展的挑战。正如霍布森(Hobson, 2013)所指出的,那些看似“基本”的粒子可能并非终极实在。正如比克哈德(Bickhard, 2015)所言:“根据我们目前最好的物理学,根本不存在粒子;当代术语中所谓的‘粒子’,不过是量子场中的量子化激发”(第24页)。
至于马尔可夫条件并非仅仅是建模工具,而是实际因果性必须满足的一种约束——这一观念的历史则没有那么悠久。不过,它仍可追溯至汉斯·赖兴巴赫(Hans Reichenbach, 1956)提出的类似思想,即“共同原因原则(principle of the common cause)”。赖兴巴赫并非将该原则视为可选的启发式方法,而是将其作为支配相关性与因果性之间关系的必要要求,并试图将其地位提升到与热力学第二定律相当的高度。
为了赋予斯皮尔特斯(Spirtes)、格莱默(Glymour)和施内德斯(Scheines)的模型更强的形而上学分量,哈特里·菲尔德(Hartry Field)清晰地表达了如果接受上述两个信条,现实可能呈现为何种样貌。他写道:
“直觉上看来(暂且排除量子非定域性之类的情况),人们应当能够将物理宇宙视为一个因果系统,其中每个时空点对应一个节点,节点的取值表达了该点上所有物理量的总和;而光锥结构则给出了依赖关系。”(2003, 第447页)
我将这种认为因果图准确捕捉了现实结构的立场称为因果图实在论(causal graph realism)。对菲尔德而言,现实的基本节点是微观物理的时空点,或不可再分的点状殊相(point-sized particulars),这一观点在大卫·刘易斯(David Lewis, 1994)那里被更充分地发展为“休谟式随附性(Humean supervenience)”。然而,对因果图持实在论立场并不必然要求承诺微观物理还原论。例如,帕皮诺(Papineau, 1992, 2022)在为不可还原的宏观现象之实在性辩护时,也认为因果图提供了准确的形而上学图景,只不过其所刻画的是一般事态之间的关系——例如人群中吸烟普遍性与早逝普遍性之间的关系——而这些关系无法还原为微观物理动力学(在后者中,因果关系似乎根本不存在)。
因果图实在论者不会因我们的许多因果图是错误的,或因建模过程中不可避免的简化使其必然偏离世界的真实结构而感到困扰。正如斯庞(Spohn, 2001)所论证的,我们原则上仍可设想一幅以“包罗万象的框架”构建的因果图,它包含了所有被正确个体化的单元及其直接关系(从而最终包含所有“真实”的马尔可夫毯)。他认为,这样一幅图将囊括关于因果性的全部内容。对因果图实在论者而言,某个具体简化模型的正确性,仅仅取决于它与这幅包罗万象之图的相似程度。
因果图实在论可以(但不一定)与因果性的统计还原论相结合,主张正确的因果图无非包含了我们各个节点之间的全部统计关系。斯庞(2001)明确发展了这一还原论,他将斯皮尔特斯、格莱默和施内德斯的工作进一步拓展,断言:“贝叶斯网络就是因果依赖的全部。”尽管这一观点本质上是休谟式的,但类似的还原路径也曾由赖兴巴赫(1956)、古德(Good, 1959)、萨普斯(Suppes, 1970)和帕皮诺(1992)等人提出(相关综述见 Salmon, 1980;Weslake, 2006)。在这些观点看来,相关性与因果性之间的鸿沟并非因为它们是截然不同的两类事物,而是因为我们的相关性信息不完整,不足以唯一确定一幅因果图。
然而,这些观点在是否将这种还原视为概念性的(Spohn, 2001;Suppes, 1970)还是形而上学的(Papineau, 1992, 1993;Field, 2003)方面存在分歧。对萨普斯(Suppes)而言,概率性/因果性关系是相对于某个科学模型而言的;而形而上学还原论者则承诺存在一组真实的概率关系,它们构成了某种客观的因果图。按照这种观点,那幅包罗万象的贝叶斯网络(Bayes net)并不仅仅描述我们如何概念化因果性,而是准确描述了现实本身的结构——因果建模的公理既不是关于因果性与概率之间关系的偶然事实,也不是因为我们对因果性的概念化方式而分析性地为真,而仅仅是对因果性本身是什么的如实描述。
我们将这两种立场最强版本的结合称为“概率图实在论(probabilistic graph realism)”。持有这种观点会面临诸多困难。就因果性的概率还原而言,最明显的问题是需要一个关于客观概率(objective probabilities)的坚实说明。同样值得注意的是,尽管珀尔(Pearl, 2000)或格莱默(Glymour, 2010)避免对因果性的形而上学立场表态,但他们明确拒绝将概率还原视为即便是因果探究方法论(更不用说因果关系的本体论)的充分基础。相反,珀尔(2001)主张一种“干预主义(interventionist)”解释(Woodward, 2005),认为要唯一确定因果结构,必须超越单纯的统计关系,纳入有针对性的干预(targeted interventions)对特定变量取值的影响。用更具体的话说,我们通过移动气压计的指针并观察是否因此引发雷暴,来澄清因果关系——这正是此类干预所能实现的因果关系消歧。
其他困难还包括:如何推导出因果图所需的时间不对称性(temporal asymmetry)——这一点在自由能原理(FEP)将马尔可夫毯划分为父节点与子节点时至关重要。这种不对称性不能简单地交由基本物理定律来承担,因为后者在时间上是对称的;而且,是否能从纯粹的统计不对称性内部推导出时间不对称性,或从某种外部来源(如赖兴巴赫借助热力学第二定律的做法)获得,也存在争议(Price, 1993)。
此外,如果我们把斯庞(Spohn)所说的“包罗万象框架”中的基本单元理解为微观物理实体(例如菲尔德 [2003] 和刘易斯 [1994] 所设想的局域时空点),那么我们不仅会失去时间不对称性,还会丧失可分解性(decomposability)和马尔可夫性行为(Markovian behavior)——而量子纠缠与不确定性恰恰颠覆了这些特性(Glymour, 2006;Arntzenius, 1992;Cartwright & Jones, 1991;van Fraassen, 1980, 1982)。
尽管如此,我认为,将弗里斯顿谈论马尔可夫毯时所表现出的实在论方式,解释为他隐含地承诺了一种概率图实在论(probabilistic graph realism)的形而上学立场,要比简单地认为他只是把某种特定建模框架的约束误当作被建模系统的真实特征,更为宽容(charitable),也更为合理(plausible)。
这种隐含的形而上学不仅有助于理解马尔可夫毯的实在论,还能解释更多内容。例如,它也关系到第3.4节中关于生成模型(generative model)地位的讨论,以及那种声称有机体与其环境之间的互动不仅被这一联合分布所描述,而且字面意义上就体现(literally embodies)了这一联合分布的观点。
回想一下,一个统计图代表一个联合分布(即生成模型)加上一个(通常是时间性的)排序。如果说现实的结构就是这样一个统计图,那就等于说现实本身确实具有这个生成模型的属性。因此,当我们说系统“字面上就是生成模型”,并且它们“确实拥有马尔可夫毯作为其组成部分”时,并不是说这些系统是对其他事物的表征,也不是说它们是为某种认识论目的而使用的工具;而是说,系统本身具有与我们为其构建的部分图模型相同的那种属性。
在这种特定的形而上学观点下,科学家的模型与真实系统之间的差距,仅仅在于细节的详略程度,而非种类上的根本差异。
A.2 自然化的数学实在论
然而,即便上述观点为“马尔可夫毯作为对真实因果图的描述”赋予了客观性,这是否就意味着马尔可夫毯本身具有独立的存在呢?马吉德·贝尼(Majid Beni, 2021)认为并非如此。他指出,马尔可夫毯终究仍是一个数学对象。因此,他强调,若将其视为某种自身独立存在的东西,而非对某个真实存在的物理对象的准确描述,那么这种做法要么是一种范畴错误(category error),要么就是承诺了某种数学对象的实在论(realism about mathematical objects)。
布鲁因贝格等人(Bruineberg et al., 2022)也提出了类似的观点,他们主张应在两种立场之间作出区分:一种是将马尔可夫毯视为世界中“字面意义上”的实体,另一种则是将其视为对某种确实具有世间存在(worldly existence)的其他特征所作的“实在论式”描述。
如果像拉姆斯特德等人(Ramstead et al., 2021)那样,主张自由能原理(FEP)提供了一种“形式本体论”(formal ontology),并提出将其作为一种“数学形式体系来回答传统形而上学所提出的问题——例如,‘作为一个存在的事物意味着什么?’‘存在是什么?’等等”——那么这确实意味着某种形式的数学实在论的承诺。
然而,贝尼(2021)以及持类似批评立场的梅纳里与吉莱特(Menary & Gillett, 2020)都将这种实在论理解为柏拉图式的(Platonic)。柏拉图主义或许是数学实在论中最广为人知的立场,但其核心特征在于将数学对象视为超越性的实体,存在于时空之外。这种观点或许契合安德鲁斯(Andrews, 2021)所建议的理解方式——即把FEP视为一个纯粹的形式模型,却仍能说出某些真理。但若弗里斯顿所理解的马尔可夫毯,是要成为特定系统真实拥有的某种属性或事物,并能参与那些维系该系统存在的因果关系,那么柏拉图式的实在论就无法满足这一要求。
当FEP被应用于生命系统时,它似乎要求马尔可夫毯同时是一种物理实体和数学实体。因此,我认为,FEP的这种应用更适合与佩内洛普·麦迪(Penelope Maddy, 1990, 1997)所发展的那种自然化的数学实在论(naturalized mathematical realism)相结合。在麦迪的框架下,存在一些物理对象,它们例示(instantiate)了数学对象的属性——具体而言,对麦迪来说,就是“成为一个数学集合”这一属性。
如果世界的确如一个统计图那样被结构化,并满足马尔可夫条件,那么对于任何系统而言,都会存在一组对象,它们具有这样的属性:使得另一组事物的状态在概率上独立于其余一切。自然化的数学实在论将允许弗里斯顿将这一组对象描述为一个物理对象,而这个物理对象字面意义上具有“马尔可夫毯”这一数学属性。
A.3 绝对单元
我们现在已具备了支撑对马尔可夫毯(Markov blankets)作出原则性承诺的几个核心要素:因果图实在论(causal graph realism)、因果性的概率还原论(probabilistic reduction of causation),以及自然化的数学实在论(naturalized mathematical realism)。假设我们全盘接受这些立场——那么,确实存在一些物理集合,它们使某个特定事物在概率上独立于其余一切。但问题随之而来:这些“马尔可夫毯”究竟在哪里?它们此刻就在我们所在的房间里吗?
这个问题的答案取决于弗里斯顿(假定的)因果图实在论中一个尚未明确的关键细节:如果现实确实可被划分为离散的个体单元,那么这些单元究竟是什么?
我们已经看到,对弗里斯顿而言,马尔可夫毯既是一个数学对象,又是物理世界中真实存在的东西。因此,构成该网络的每一个节点,本身必须是某个具体物理事物的状态,而整个图则由这些具体事物状态变化之间的统计规律性所构成。
这也是为什么弗里斯顿对因果图建模工具的使用,在熟悉珀尔(Pearl)或斯皮尔特斯(Sprites)、格莱默(Glymour)和施内德斯(Schienes)因果发现工作的研究者看来显得有些奇怪:在后者的工作中,因果-统计关系并非建模于殊型对象(token objects)之间,而是建模于一般性事件、属性或事态(general events, properties, or states of affairs)之间(Hausman, 2005)。在那里,图中的每个节点并非一个具体的殊型,而是一个类型(type),可被许多不同的殊型实例化。
相比之下,弗里斯顿将图中的节点视为物理世界中具体部分的殊型状态(token states)。然而,与刘易斯(Lewis)和菲尔德(Field)不同,他并未承诺终极的因果图必须是微观物理层面的。例如,在弗里斯顿(2013)中,相关单元确实是原始汤中粒子的电化学与动力学状态;但在 Hipólito 等人(2021)的研究中,这些单元变成了突触和离子通道的状态;而在关于社会与生态系统的模型中,每个节点甚至可以是个体生物的状态(Kirchhoff et al., 2018)。
正如拉姆斯特德等人(Ramstead et al., 2019)所解释的,其核心思想在于:一个马尔可夫毯系统所呈现的单一节点,本身就是一个具有马尔可夫毯结构的复合体,可进一步分解为感觉(sensory)、主动(active)和内部(internal)成分。我们可以将这种观点称为多尺度概率图实在论(multiscale probabilistic graph realism):即无论我们在哪个尺度上考察一个系统,它都可以被划分为若干相互作用的组成部分,而这些相互作用满足马尔可夫条件。
拉姆斯特德等人认为,我们选择哪个尺度取决于我们的兴趣,但系统可被划分为具有马尔可夫毯的子系统的这一事实,并非主观任意。一旦在某一尺度上包含了所有相关组成部分(即便在某个具体简化模型中实际上无法做到),那么在该尺度上就存在一组真实的马尔可夫毯。正如西姆斯(Sims, 2021)所指出的,这种多尺度的形式体系或许更能捕捉生物与生理上的个体性——在其中,个体有机体(如一个体细胞或共生生物)与其他个体协作,形成更高层级的个体,同时在更低层级的分析中仍保留其自身的个体性。
尽管弗里斯顿(2019a)曾暗示这种结构可能“无限递归”(ad infinitum),即因果图结构可能“一直向下延伸”(p. 7),但他也明确表示,这一承诺并非自由能原理(FEP)的核心组成部分。在该专著稍后部分,他甚至对该问题表达了“形而上学上的不可知论”(metaphysical agnosticism)(p. 124)。
因此,我们完全可以采纳帕皮诺(Papineau, 1992)的路径:拒绝将宏观现象还原为微观相互作用的要求,从而避开量子力学对微观物理因果图运作所投下的“扳手”(spanner),同时依然承认个体单元及其所构成的马尔可夫毯作为涌现的宏观物理现象(emergent macrophysical phenomenon)具有实在性。
A.4 第二种稳定性要求
我们最初对马尔可夫毯(Markov blankets)的疑虑在于:它们似乎可以被任意划定,取决于我们如何构建自己的因果模型。一旦我们转向那幅“包罗万象的因果图”(all-encompassing graph),马尔可夫毯的构成或许不再任意,但它们却变得无处不在。如果我们像弗里斯顿(2013)所预设的那样,将因果性视为一种局部现象(local phenomenon)——即只有相邻的要素才能直接相互作用——并且将因果性还原为这些要素之间的统计关系,那么对于任意我们选定的要素而言,其紧邻环境的状态都会使其在条件上独立于世界中的其他一切。如果每个有机体都被一个真实的马尔可夫毯所包围,这并非源于该有机体自身的努力,而仅仅是某种特定因果性形而上学观点的普遍结果。
然而,弗里斯顿(2013, 2019)似乎并不认为马尔可夫毯的存在如我上述描述的那般平凡。他指出,一支蜡烛的火焰不能拥有马尔可夫毯,因为与细胞膜不同,“任何分子相互作用的模式几乎会因其表面气体分子的流动而瞬间被摧毁”(2013, 第2页)。
换句话说:
“[马尔可夫毯形式体系] 并不容易容纳这样一个事实:构成马尔可夫毯的粒子会随着时间推移而游离、交换甚至更新。典型的例子便是蜡烛火焰的毯态(blanket states),其组成粒子(即气体分子)处于持续不断的流动之中。”(2019, 第50页)
弗里斯顿(2013)声称,这与“构成有机体——或细胞器——马尔可夫毯的物理构型和动力学状态,相对于其所分隔的外部与内部状态而言变化缓慢”形成鲜明对比(第10页)。
因此,他在此似乎要求:系统各部分之间的连接关系必须在这些部分状态变化的过程中保持稳定,使得构成马尔可夫毯的那一组特定要素能够在时间上得以维持。事实上,如果我们对客观概率的理解依赖于某种长期频率(long-run frequencies)或倾向性(propensities),那么单元之间的连接必须比单元自身状态的变化更为稳定,否则就无法建立起它们之间的统计关系,也就根本无法将因果图划分为马尔可夫毯。
因此,自由能原理(FEP)所关注的系统,并非因其“拥有马尔可夫毯”这一属性而被区分出来,而是因为它们拥有同一个特定的马尔可夫毯,其构成要素在某一时段内保持稳定。这有助于解释为何弗里斯顿的批评者(如 Bruineberg 等, 2022)指责他混淆了将马尔可夫毯描述为“物理边界”与“统计划分”之间的区别。在我所归于弗里斯顿的那种假定形而上学中,马尔可夫毯最终既是物理边界,也是统计划分。如果现实本身确实就是一个统计图,且因果相互作用严格局限于局部,那么一个稳定的马尔可夫毯就既是统计上的划分,又是由一组固定的离散要素所实现的——这些要素围绕着所关注的系统,构成一道边界。
因此,我们可以将一个系统成为自由能最小化者的条件理解为包含两种稳定性:
- 其组成部分典型状态的稳定性
——这源于将“生存”分析为“意外性(surprisal)最小化”;
- 这些组成部分之间统计-因果依赖关系的稳定性
——这使我们能够识别出某个特定的马尔可夫毯,并认为它在时间中持续存在。
这些便是主张“马尔可夫毯是真实事物”所需的关键步骤。断言一个真实的马尔可夫毯存在,无非是声称:
一个系统可以被分解为若干独立单元(这一分解必须通过FEP框架之外的某种方式完成,因为FEP本身并未规定如何实现这种分解);
并且,如果我们接受 客观的统计依赖关系足以还原因果关系 ,同时接受 局域性原则 (principle of locality),那么任何一个单元的 直接邻域 就字面意义上具有马尔可夫性质——即在该边界之内与之外的事物之间诱导出条件独立性。
因此,声称马尔可夫毯是“真实事物”,实际上是对因果宇宙之结构作出的一个普遍性主张。通过这样做,FEP既没有在世界上识别出一种新的、有趣的实体,也没有发现一种原则性地将世界划分为‘事物’的方法。后一项任务依赖于一个必然先行的任务:告诉我们终极因果图中的‘绝对单元’(absolute units)究竟是什么。
注释
第一 章
汤普森(Thompson)选择转而修改“自主性”(autonomy)的概念,以将适应性(adaptivity)纳入其中。尽管如此,各方仍一致认为,这种扩展至少不能仅从自创生(autopoiesis)的范例中推导出来。
第二章
有趣的是,尽管上述论述将“推断性”(inferential)与“贝叶斯式”(Bayesian)视为同义词,但赫尔姆霍兹(Helmholtz)所提出的“推断”概念实际上是 联想主义 (associationist)的,而非贝叶斯式的(Westheimer, 2008)。与康德类似,赫尔姆霍兹试图将认知者在构建经验对象过程中不可避免的贡献,与这些构建性或推断性过程所具有的“客观有效性”基础结合起来,从而使得我们能够声称自己获得了关于这些对象的知识。然而,尽管赫尔姆霍兹批评了康德试图确立这些先验“思维法则”的做法——尤其是就欧几里得空间的偶然性提出质疑——他本人却难以提供一个足以赋予我们推断过程以有效性的替代方案(参见 Hatfield, 1984, 1990)。因此,更准确的说法是:贝叶斯知觉理论是对赫尔姆霍兹观点的一种推进,其中贝叶斯规则被假定为提供了这种客观有效的认知法则。对于预测加工(PP)的重构主义解释而言,关键问题在于:在多大程度上遵循此类法则,能够保证我们的信念收敛于对某种独立于心灵的实在的准确表征。
第三章
关于FEP中工具主义与实在论之争的批判性综述,参见 Bruineberg 等(2022)、Andrews(2021)、van Es(2021)以及 van Es 与 Hipólito(2020)。
亦称变分贝叶斯(variational Bayes)或集成学习(ensemble learning)。
如在讨论PP时所述,感觉流变化的原因涉及大脑自身的行动。目前,我们暂不考虑系统对生成其证据的过程进行干预的可能性,以便先掌握变分推断作为一种近似技术的基本原理。
亦称为识别密度(recognition density)或变分密度(variational density)。“密度”(density)仅指生成连续概率分布的函数。
切勿与热力学自由能(thermodynamic free energy)混淆!
符号“⟨ ⟩_q”表示我们对观测 o 的概率关于识别密度 q(H) 取加权平均,这被称为“期望”(expectation)或“期望值”(expected value)。
这是一个新造词(neologism),用于将“不太可能发生”(unlikeliness)这一概念与个人层面的“惊讶”(surprise)区分开来。
至少在苏格兰旅游局(VisitScotland)官员看来是如此。
请允许我假设你在地理方位上略显困惑。
此处对霍维(Hohwy)观点的评论,针对的是他在2013年著作《预测心智》(The Predictive Mind)及同期论文中所持的“赫尔姆霍兹式”立场。需注意的是,在其近期著作中,他似乎已逐渐偏离这一路径,转向一种与当前论述更为兼容的PP理解方式。
尽管在PP文献中,通常将预测误差最小化过程划分为“主动推理”(active inference)与“知觉推理”(perceptual inference),但在FEP中,“主动推理”一词被用来指代一个统一的框架,将知觉与行动共同纳入变分自由能的最小化过程之中。
在第五章中,我将说明如何从联合概率分布中获得对可能影响模式的一些约束。正如我们将看到的,确定影响的方向始终需要额外的假设或信息,而这些并不包含在生成模型本身之中。
遍历性(ergodicity)比在某一时段内统计性质的稳定性要求更强,且两者皆非平凡;不过我们可以暂且搁置这一问题,留待第四章再讨论。
在霍维与基弗(Hohwy and Kiefer)的论证中,误表征实际上包含两种散度(divergences):他们区分了大脑中编码的生成模型与生成过程的真实统计特性。然而,如果我们遵循前一节的论证,那么就只存在一个真实的生成模型,也只有一个相关的散度项,即该真实生成模型与识别模型之间的散度。
第四章
一个分布的熵与方差,虽然相关,但却是不同的概念。然而,如果我们(如第三章所述)将概率分布约束为单峰高斯分布,那么改变该分布熵的唯一方式就是改变其方差。
最近的研究甚至表明,稳态的要求本身也可以被放弃(Friston et al., 2023; Ramstead et al., 2023)。在第九章中,我将论证,放弃这一要求会使自由能原理变得空洞。
这一主张有时会明确地以“广义运动坐标”(generalized coordinates of motion)的形式表述,其中状态空间不仅包括诸如“位置”之类的状态,还包括这些状态的导数,例如速度或加速度。以下所有关于稳态在FEP中作用的论点,在这些“状态”包含稳定变化率、变化率的变化率等情况下同样适用。
正如Ward (2016) 所指出的,在Susan Hurley (2001) 对Power的知觉控制理论与运动知觉理论的综合中,我们已经看到了预测加工的一个更直接的先驱。
虽然Friston等人(2020)主要将此作为衡量自主性或生机性的渐进式标准来提出,用于解释意识的涌现,但它也可能作为一种防御,用以对抗泛生机论(hylozoistic)的后果。
在第九章中,我将讨论更多近期的发展,其中对稳态的承诺也被放宽了。这种对自由能原理的弱化解释或许能赋予弗里斯顿框架所需的灵活性,以便更好地建模生命系统,但这需要付出承认该原理本身对其潜在动力学不施加任何有意义约束的代价。
第五章
图论学者会使用“顶点”(vertices)和“边”(edges),但我将坚持使用更为熟悉的术语:“节点”(nodes)和“连接”(connections)。
为什么此处要将子代的父代划分为“主动状态”,这并非显而易见,因为它们自身可能根本不受内部状态的影响。
盘点
这原本是通过更强的断言——即系统具有遍历性(ergodicity)——来确立的。然而,尽管遍历性蕴含平稳性,它也意味着系统最终会探索所有其可能进入的状态——也就是说,描述特定系统随时间演变的状态的概率分布,会收敛到描述某一类系统在单一时刻状态的分布。这是一个比实际所需更强的断言,且对于生命系统而言并不恰当(参见 Palacios and Colombo, 2021)。
第六章
这种排序本身已引入了超出纯粹存在性二元关系所能提供的内容,因为仅凭统计关系并不总能提供一个明确的祖先-后代排序。
子代的共同父母(co-parents),虽然是马尔可夫毯的一部分,却通常被忽略——大概是因为难以将其归入感觉状态或主动状态的类别。
子代的父母在FEP框架中更难纳入,通常也被忽略。
关键的是,如同马尔可夫毯一样,这些标签仍将取决于预先选择某些状态集作为“内部”状态。在ESIA循环中,内部与外部状态是对称的,没有任何理由阻止我们将它们的标签与行动和感觉状态的标签互换。
将生命系统视为循环、并允许观察者强加一种并非源于循环本身的有机体/环境区分的方法,延续了Humberto Maturana的前激活性(pre-enactivist)自创生理论的发展。尽管自创生理论构成了生物激活性(bioenactivism)概念体系的重要组成部分(尤其涉及自创生本身),但二者不应混淆,并且事实上在生命状态问题上持截然相反的观点。粗略地说,前者保留了阿什比(Ashby)式的观点,认为生命与非生命之间存在连续性;后者则源于Varela后期的现象学、有机论或存在主义转向,赋予有机体“自然目的”(natural purposes)的特殊地位,使其有能力“创造一个意义的世界”。关于这一点的更多内容,见第7.4节。
第七章
如我在第九章所讨论的,这种专注于过程间或过程内的封闭性,有助于防止形成莫西奥和莫雷诺(Mossio and Moreno, 2015)所要求的、充分形式化的自主性概念——该概念要求在涉及变化与不变性的两种因果机制之间实现封闭。
这两个术语的历史超出了本文论证的范围——特别是考虑到马图拉纳和瓦雷拉合著作品在归属上的模糊性。在我看来,他们的工作并未始终遵循比奇(Bich)和阿内洛斯(Arnellos)所建议的术语区分,而且我也不确信“组织性”(organizational)是区分自生产系统与单纯操作性封闭系统的最佳选择。
第八章
正如在关于马尔可夫毯形而上学的部分所讨论的那样,我在此允许将因果关系与统计关系相混淆,其依据是:在某个完整且全面的因果网络中,前者将归约为后者。
正如Proksch (2021) 所指出的,当马尔可夫毯被假定为社会网络的边界时,这种稳定性要求同样难以维持,因为成员流动是大多数社会组织的特征。
第九章
作者们还强调了自由能原理可以被表述为“基于路径”的另一种含义,即通过“广义运动坐标”(如速度或加速度等位置状态的导数)进行形式化。在这种表述下,FEP所寻求的平稳概率分布可能不是描述一个稳定的“状态”,而是描述一个稳定的变化率,或一个变化率的稳定加速度。然而,稳定的变率——或任何更高阶导数的稳定值——作为有机系统的固定不变量,同样是不可信的。前述所有论点均适用于包含此类运动状态的有机体状态空间。
对于一个真实系统,我们还需要引入一个摩擦系数,以描述总能量如何因阻力而耗散,但钟摆的轨迹仍会受到约束,使得在每个点上,角位移越大,速度越低——反之亦然。
第十章
虽然DiFrisco将“实体主义”(substantialism)保留给原子论观点,以区别于形式主义的实体概念,但他的批评同时针对两者在“不变特征”上的承诺。因此,正如他所指出的,从持久性的意义上讲,两者都可被视为实体主义。
虽然这可能是一种较小的扭曲,但它仍是一种理想化,因为在机器运行过程中,通过做功的能量传递从来不是完全高效的,而通过热能损失的能量最终会降解机器自身的结构。
在她关于自组织概念历史的两部分综述《有机体、机器与雷暴》(Organisms, machines, and thunderstorms)中,Evelyn Fox Keller (2008, 2009) 提供了对这些对比性方法发展脉络的精彩概述。
附录
因果马尔可夫条件与共同原因原则在内容上的差异,对于我们的目的而言并不重要;但若想了解更多,参见 Hausman 和 Woodward (1999)。
这不应与整体论图实在论(holistic graph realism)相混淆,在后者中,个体殊相没有任何属性,所有属性都仅依赖于图中实例化的关系而涌现。
这种将因果性统计化的还原论,并不与决定论立场相冲突,正如帕皮诺(Papineau, 1989)在同时为两者辩护时所指出的。决定论仅仅意味着:要使一事物成为另一事物的原因,需要提高其统计相关性的阈值——例如,只有当A的发生将B的概率提升至1时,A才真正导致了B。
然而,一位因果图实在论者不必接受这一点。他们或许会坚持认为,世界上所有的统计事实本身不足以确定真实的因果图,还需要额外的事实——比如反事实、干预的效果或时间不对称性。要捍卫一种概率化的因果还原论,就必须论证这些事实(只要它们涉及因果性),也可以被还原为统计事实。
当然,这要求我们有一个完善的客观概率概念,但这完全是另一个棘手的问题,我们没有时间去深入探讨。
这样的立场并非柏拉图主义,而是毕达哥拉斯主义。
将“稳定性”这一要求赋予如此关键的角色,以决定一个系统是否“存在”,这种做法令人担忧地模糊不清——但作者能追捕的“兔子”毕竟有限。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.