![]()
导语
复杂系统可以通过无数不同的尺度进行描述,其因果运作机制往往具有多尺度结构(例如,计算机可以从硬件电路的微观尺度、机器代码的中观尺度,到操作系统的宏观尺度进行描述)。尽管科学家们研究和建模的系统涵盖了从微观物理到宏观经济学的完整层级,但关于系统宏观尺度能为系统带来什么超越单纯压缩的附加价值,学界仍存在争议。为解决这一长期存在的问题,本文提出了一种新的涌现理论,能够区分哪些尺度对系统的因果运作具有不可约贡献。该理论在马尔可夫链的粗粒度分析中的应用,揭示了一种新兴的涌现复杂性度量标准:系统因果贡献(causal contributions)在其层级结构中的分布范围有多广。
关键词:因果涌现,复杂系统
Erik Hoel丨作者
罗云丨译者
赵思怡丨审校
![]()
论文题目:Quantifying Emergent Complexity 论文地址:https://www.cell.com/patterns/fulltext/S2666-3899(25)00320-4 发表时间:2026年1月9日 发表期刊:Patterns
目录
引言:跨尺度复杂系统的因果挑战
因果涌现理论的演进:从CE1.0到CE2.0
充分性与必要性
确定性与简并性
CE 2.0中宏观尺度因果关系的量化方法
沿微观宏观路径穿越尺度层级
沿路径的因果分配
选择微观宏观路径
涌现复杂性:多尺度因果贡献的量化
限制和启发
与其他涌现理论的比较分析
公理落地
CE 2.0涵盖所有宏观层面的因果关系
与其他相关涌现理论的比较
CE2.0的概念含义
结语
科学家们通常会选择特定尺度来研究系统。一位神经科学家可能追踪突触内的单个钙离子成像,而另一位神经科学家则可能汇总整个脑区的脑活动。系统建模方式的选择差异巨大——然而科学界至今仍缺乏一套完整的理论框架来指导这些选择。这个问题不仅具有现实意义,更是一个长期存在的哲学悖论:微观尺度如何真正重要?如果它在因果关系中无关紧要,那么科学中的绝大多数实体更像是实用的虚构或便利的压缩,而非真正的因果关系。
要解决这个问题,需要认真对待因果分析的细节,在不同尺度上追踪因果影响,并建立一个正式框架来比较各宏观尺度所能提供的信息。通过运用以误差校正和概率性因果测量为核心的数学工具,涌现理论能帮助科学家做出更明智的建模选择,理解某些高层次解释为何成功,并揭示即使在简单系统中也跨越尺度的隐藏结构。其目标是构建一门关于尺度本身的科学——最终将自然界的层级关系置于坚实的定量基础之上。
引言:跨尺度复杂系统的因果挑战
复杂系统跨越多个尺度运作,因而呈现出海量可能的描述方式。[1] 这导致了诸如生物学领域中“不存在因果关系的特权层级”等论断。[2] 然而,所有可能的尺度集合——以维度约简的形式呈现——即便对于小型系统也极为庞大,且其中大多数对系统因果机制的描述效果欠佳(例如,将计算机逻辑门随机粗粒化处理)。
这种多重性的尴尬局面要求建立一个形式化的涌现数学理论。该理论应当解释并量化宏观尺度(基于维度约简的系统高层次描述)如何促成系统的因果运作,以及哪些宏观尺度具有因果相关性。涌现理论甚至可能解释科学本身时空层次结构的形成,超越其仅作为有用压缩的功能。[3]
或许有人会提出异议,认为科学中不存在涌现现象,因为任何给定系统的未来都可能在完全掌握其微观尺度的情况下被预测,而任何给定系统都可能被还原到其微观尺度。然而,预测并不等同于因果关系。[4] 以恒温器与房间系统为例说明。[5,6]尽管理论上房间内所有单个粒子的微观状态都可以用来预测恒温器的读数,但从因果理解的角度来看,这并不能很好地回答“是什么导致恒温器显示20℃?”这个问题。事实上,所有粒子的确切微观状态并非该读数的因果必要条件,因为许多其他配置都可能导致相同读数。与此同时,宏观状态(房间温度)与恒温器读数存在直接因果关系,因为任何给定数值都必须依赖于宏观状态。
另一个例子中,神经元树突接收到的输入信号可用于预测下游动作电位的发生。然而在因果分析中,该输入信号不足以触发(作为效应)某些精确的离子交换,因为这种交换会因布朗运动[7]或量子效应[8]等噪声因素而不可预测地演变。与此同时,输入信号仍可能确定性地足以触发(作为效应)下游神经元的宏观状态“放电”,而无需考虑其底层微观细节。
基于这些直觉,Erik Hoel和Larissa Albantakis, Giulio Tononi于2013年提出了因果涌现理论。该理论采用离散因果模型(包括逻辑门网络、有向无环图和马尔可夫链)以及因果性度量指标——有效信息(EI)。该理论提供了一套工具集,通过搜索此类系统所有可能的维度缩减方案,寻找能使EI最大化的方案(其中EI的评估方法是:通过do(x)算子将系统扰动至所有可能状态,然后计算干预措施的概率分布与其效应概率分布之间的互信息)。将宏观尺度与EI最大增幅等同,量化了系统中因果涌现的程度。
因果涌现揭示了为何系统宏观尺度虽可还原为底层微观尺度,却能形成更强的因果关系:由于宏观尺度具有多重可实现性,其可最小化因果关系中的不确定性,而这种不确定性正是EI等因果性度量所敏感的。从数学角度而言,这类似于通过信息通道编码可最小化通信噪声的原理。[3,10]
因果涌现理论自提出以来已催生大量研究,例如在从原胞自动机[12]到功能磁共振成像(fMRI)数据[13]再到基因调控网络[14,15]的各类数据中测量因果涌现现象,以及开发启发式方法[16],如利用训练过的人工神经网络检测因果涌现[17]。该理论与网络理论中的无标度性和鲁棒性等现象相关联[18,19],并在整合信息理论框架内得到应用[20,21]。此外,学界还提出了量化因果涌现的替代测量方法,例如利用系统动力学可逆性来近似估计涌现指数(EI)[22]。关于该领域的全面综述,可参阅Yuan等人的研究[23]。
然而,因果涌现理论的初始版本(以下简称CE 1.0)因两个悬而未决的问题而未能完善。第一个问题是是依赖于有效信息(EI)及其近似值来检测因果涌现。尽管EI是因果关系相对完善的测量工具,[24}但其计算过程中存在背景假设(例如要求干预措施呈均匀分布,这一点已受到部分学者的质疑)。[25–27] 此外,正如结论部分所示,使用EI实际上会低估因果涌现的程度。
第二个问题是,CE 1.0仅识别出单一因果相关尺度(即EI的最大值),而忽略了所有多尺度结构。然而,许多系统似乎在不同尺度上运作;一个显著的例子是大脑的不同功能尺度,从神经元到皮层微柱,再到整个脑区。[28] 另一个例子是计算机如何在硬件电路的微观尺度、机器代码软件的中观尺度、以及操作系统和应用程序的宏观尺度上被描述[29];事实上,甚至发生的计算也可能因描述尺度的不同而发生变化。[30,31]
为构建一个能解决这些问题的普适性且根基扎实的因果涌现理论,本文提出了一种新型形式化方法:因果涌现2.0(CE 2.0)。CE 2.0的核心理念在于:系统并非受限于单一描述尺度,而应通过所有参与系统因果运作的尺度集合来全面描述。任何单一尺度(即便是微观尺度)都如同对三维物体进行二维截取,因此无法完整捕捉系统的因果关系。CE 2.0通过构建跨尺度因果分配框架,检测各尺度对多尺度整体的因果贡献(若存在)。该理论通过定义一条自上而下的系统尺度路径,沿此路径分配系统运作的因果关系。
CE 2.0理论以公理化的因果关系概念为基础,而非像CE 1.0中的EI(涌现性指数)那样作为独立指标。这种设计使理论能够全面捕捉宏观层面的所有因果关系,并以前所未有的方式揭示和量化系统在多尺度间的因果结构。这种新型的跨尺度系统运作分类法催生了一个创新指标——涌现复杂性:衡量系统因果机制在不同尺度间的分布广度,其中包含多个贡献尺度的系统具有更高的复杂性。
在下文中,文章将系统阐述CE 2.0理论框架:首先定义一个具有公理性质且不受背景假设影响的因果关系概念;继而运用该概念计算模型马尔可夫链粗粒度尺度中的宏观因果程度,从而量化其因果涌现程度;接着详细说明如何通过跨越不同尺度集合的路径分配因果贡献;进一步探讨该方法如何自然形成涌现复杂性的概念。最后,文章将CE 2.0理论与其它相关涌现理论进行直接对比,既彰显其优势,又阐明其概念内涵。
因果涌现理论的演进:从CE 1.0到CE 2.0
充分性与必要性
科学家们通过提炼和提取研究对象的因果知识来深化认知。[32] 在因果关系的科学理解方面取得的突破性进展包括:R·A·费希尔对随机对照试验的系统化构建,[33] 以及朱迪娅·珀尔近期提出的do(x)算子。[11]
许多研究者提出了特定的概率性因果度量方法,用以量化因果关系的强度。这类度量指标的定义方式多样,例如衡量特定原因的影响力、特定因果关系的强度、某一变量对另一变量的因果控制程度等。应用此类因果度量时,需先建立因果模型,再通过反事实假设[34]或干预措施[11]来区分因果知识与单纯观察结果。
近期一项针对不同学者提出的十余种概率因果性测量方法的分析研究[27]表明,在科学文献中存在因果一致性:从心理学到统计学再到哲学[35],这些跨领域独立引入的因果性测量方法,均以两个基本术语为基础。这些术语被称为“因果基元”[27]——更常见的称谓是充分性与必然性。这种一致性适用于从哲学家大卫·刘易斯[34]提出的测量方法,到数学家朱迪娅·珀尔[11]提出的测量方法,再到Erik Hoel研究团队近期对实际因果关系的定义[36]。这些原语被多次独立重新发现,构成了任何因果性测量方法的公理基础,并确保不同测量方法在数学行为上具有显著重叠。最终,每个术语都代表了不确定性的逆向:充分性是指在给定原因的情况下对结果的确定性,而必然性则是指在给定结果的情况下对原因的确定性。
如后文所示,充分性与必然性的因果基元在信息论层面具有更广义的表述,即决定论与简并性。CE 2.0正是基于这些原语及其进一步的广义化而构建的。
首先,为了形式化地定义因果基元,需要一些术语。对于像马尔可夫链、有向无环图或逻辑门集这样的离散系统,评估因果基元(以下简称CP)涉及指定与系统相关的抽象空间Ω,该空间定义了纳入因果分析的事件集合(例如状态、事件、变量等)。然后,对于任何事件(如状态转换),我们可以定义潜在原因C⫅Ω和潜在影响E⫅Ω。
由于理论将在模拟马尔可夫链中具体化,这里Ω仅指系统的状态空间。事件即为状态转移,因为对于马尔可夫链而言,系统总是存在某个先前状态c及其影响e,即下一个状态。这些转移各自具有一定的概率P。
给定一个事件(此处为状态转换),则该原因的充分性即为
suff(e; c) = P(e|c)
随着c更可能引发e的概率增加,该值也随之上升,并在c完全足以导致e时达到1。
原因的必要性是
nec(e; c) = 1 − P(e|C; ¬c)
该公式用于计算事件e在无条件事件c发生时的概率。具体而言,当系统中存在一组原因C,且在该组原因中c本身未发生时,事件e的概率的倒数是多少?当存在多个共同原因时,该概率较低;只有当c是e的绝对必要条件时(即C组中其他成员均无法导致e的发生),该概率才为1(在马尔可夫链中,这意味着下一时间步中不存在其他状态能导致状态e)。
由于研究目标是对比整套量表间的因果关系,术语“充分性”与“必要性”(及其联合描述CP)将特指所有t到t+1过渡的系统平均值。该平均值按各过渡概率P(e∣c)加权,给定条件概率P(C)。
在因果分析中,P(C)并非刻意设定为观测分布。[37] P(C)的选择可理解为确定可行的反事实集合,或等效地,指明系统因果模型中可能的干预措施集合。[10,37] 由于后续数值将在由转移概率矩阵(TPM)及其状态转移(从t到t+1)定义的马尔可夫链中计算,此处P(C)表示在给定系统尺度下,整个状态集合的均匀分布。
从概念上说,这仅仅意味着在评估其他状态的因果关系时,量表中的各个状态被视为同等有效的干预措施或反事实条件。例如,对于具有p=1自循环的COPY门,这意味着在P(C)中我们同等看待0和1这两个状态,因此可以正确地说:状态COPY=1(在t时刻)是状态COPY=1(在t+1时刻)的充分必要条件(需要注意的是,在观测分布下,这样的判断是不可能的)。
确定性与简并性
充分性与必要性各自具有信息论的广义表述:系统的确定性与简并性。[9]
具体而言,确定性是状态转移概率分布中噪声(或随机性)的逆向概念,因此可视为充分性条件在信息论层面的推广。对于个体原因c,其可定义为基于该原因在系统效应集合E上转移概率分布熵的系数(归一化范围为[0,1]):
![]()
其中中心熵项为
![]()
下文所称“确定性”特指系统整体决定系数,该系数为在给定条件P(C)下,个体原因决定性平均值。当TPM(转移概率矩阵)仅含“独热”行时,决定论效应达到最大;若所有行均为均匀分布(即转移过程随机发生),则该系数为零。
“简并性”亦是系统层面的简并系数,其定义为在给定先验分布P(C)的前提下,全效应集合P(E)的概率分布熵的倒数,该先验分布反映了一组干预措施或潜在反事实情况:
![]()
当原因具有多种相似效应时,简并性较高;而当所有原因均具有唯一效应时,简并度为零。在马尔可夫链中,一个完全确定且非简并的系统是指每个状态以概率p=1转移至某个唯一下一状态且无重叠(即置换矩阵)的系统。简并度作为必要性的包容逆,其作用在于:
![]()
其中P(e∣C)是必要性计算P(e∣C,¬c)中心项的包含形式。该计算并非直接移除原因(¬c),而是针对任意给定的e,从P(C)的完整集合中,计算导致该e的所有可能原因的总体必要性。
为避免因逆向关系导致的语言混淆(因低简并度表明更强的因果关系),本研究在计算过程中常将简并度逆向转换为特异性,其数值越大表明因果关系越强。
specificity=1-degeneranc
综上所述:从其由相同基本概率项构成的结构可以看出,决定论本质上是充分条件的归一化熵,而简并性本质上是必要条件的归一化熵(作为其逆向且包含计算的结果)。
因果基元及其泛化形式对因果模型中因果关系的不确定性具有敏感性,当不确定性降低或增加时,其行为表现相似,这使其成为检测宏观因果关系的合适基础。在补充信息中的注释S1中,通过系统内概率分布的模拟,展示了其敏感性与相似性。
CE 2.0中宏观尺度因果关系的量化方法
CE 2.0将宏观因果关系定义为:当系统宏观尺度上的因果基元(CPs)共同增强时,表明该宏观尺度降低了因果关系的不确定性。需注意,并非所有维度缩减都会带来宏观尺度的CP增益——许多案例会导致增益归零甚至下降(即因果缩减现象)。为识别正向增益,CE 2.0采用有序的微观→宏观路径,遍历系统各尺度层级,揭示其多尺度结构。系统中因果涌现的程度,即微观→宏观路径上CP的总增益,代表所有尺度宏观因果关系的总和。随后将因果关系沿路径分配,追踪各尺度的正向因果贡献(即其增强CP的程度)。
沿微观→宏观路径穿越尺度层级
宏观态在CE 2.0中被定义为系统经过维度约简后的结果。对于给定的马尔可夫链S及其关联的表观马尔可夫过程(TPM)——后者代表微观尺度,系统SM被定义为具有自身关联TPM的新系统,其中宏观态替代了一组微观态,且给定宏观态之间的转换是底层微观态的汇总统计量。
为简化说明,本文仅考虑微观态的粗粒化降维方法。这种粗粒化处理会产生如(0,1,2)、(3)等宏观尺度,这表明在某些四态系统中,微观态(0,1,2)已被粗粒化为宏观态,而(3)则保持其微观尺度特性。该方法沿袭了因果涌现理论的既有研究(关于如何基于微观尺度TPM的粗粒化推导宏观尺度TPM的完整方法,可参阅霍尔等人及克莱因等人的研究)。[9,18]
所有粗粒化处理均经过验证,以确保其作为微观尺度精确描述的有效性;具体而言,与Klein等人[18]的研究类似,每个宏观尺度的动态一致性均经过检查,不一致的宏观尺度被剔除(参见补充信息中的注释S2)。需注意的是,CE 2.0也可应用于其他类型的维度约简方法,如粗粒化、黑箱化[10,38]或高阶宏观态[1
微观到宏观路径是指从微观尺度逐步提升至最终宏观尺度的有效(即动态一致)尺度集合,该宏观尺度作为路径的终点。从概念上说,路径本质上是描述系统中哪些粗粒度元素“正在”跨越层级结构向其他粗粒度元素过渡。路径中的每个步骤都是所有可能尺度集合中的一个“切片”,微观到宏观路径从底层(完整维度)向顶层(最终维度缩减)遍历这些切片。
在假设的四态系统中,(0,1),(2),(3)的粗粒度状态会沿着路径演化为低维的(0,1,2),(3)粗粒度状态。在此演化过程中,微观态(0)和(1)首先会被合并为单一宏观态(0,1),随后进一步合并为(0,1,2)。从微观尺度出发,该系统完整的微观→宏观演化路径可能为:(0),(1),(2),(3) → (0,1),(2),(3) → (0,1,2),(3) → (0,1,2,3),最终所有状态均被合并为单一宏观态。从形式上说,这可以表述为:
![]()
其中每个π(i)是原始n个微观状态的某个有效划分(代表一个粗粒度),而π(i+1)则是π(i)下一个粗粒度,最终终止于终点划分π(k)。
以图1所示的8状态马尔可夫链为例,我们绘制了选定的微观→宏观路径。路径上的进展通过颜色传染效应在图1中呈现。从(0),(1),(2),(3),(4),(5),(6),(7)开始,路径上经过粗粒化处理的微观状态会逐步变为相同颜色,直至终点(0),(1,2,3,4,5,6,7)——此时除(0)外,所有微观状态均已完成粗粒化处理。
![]()
图1:微观→宏观路径路径可视化
以一个八状态马尔可夫链为例(其转移概率以灰度表示,TPM详见图2A)。该模型从(0),(1),(2),(3),(4),(5),(6),(7)的完整分区(微观尺度)开始,各状态通过粗粒化处理合并,每个后续分区对应路径中的一个步骤(即系统中的一个尺度),最终终止于(0),(1,2,3,4,5,6,7)。当状态沿选定路径发生颜色变化时(即颜色传染现象),表示微观状态正融入更大的宏观状态。
沿路径的因果分配
通过因果分配方案,可获得沿路径各尺度上因降维导致的CP增益分布。具体而言,对于系统及选定的微观→宏观路径,CE2.0会计算路径中每一步相对于前一尺度的增益 ΔCP 。
具体而言,对于给定的尺度(路径中的每个步骤),CP值是宏观尺度(或路径起始时的微观尺度)的充分性与必要性的总和——随后从该值中减去1以获得[0,1]范围内的边界值。同样地,每个步骤的确定性与特异性CP值也通过相加后减去1进行计算(使该值等同于CE 1.0[9]中的有效性)。
通过8状态马尔可夫链展示了路径上的 ΔCP 计算过程,其起始微观状态TPM如图2A所示。该系统具有直观的宏观状态,表现为微状态(4、5、6、7)之间的等价类,这些微状态均具有相同的转移概率分布。其连接性(状态转移)与图1所示一致,并采用相同的微→宏观路径。
值得注意的是,在该系统中,CP(连续路径)在宏观尺度(4,5,6,7)被粗粒化为具有自环的单一宏观状态(该宏观尺度的TPM如图2B所示,图2C为可视化呈现)前持续保持增益。随后,路径立即转入零增益区域(如图2D所示)。
从确定性与特异性角度分析,微观尺度的确定性参数(CP)初始值为0.66。当宏观尺度进入零增益转变前,CP值增加0.33,最终达到最大值CP=1。这表明在该宏观尺度下,因果关系达到最大确定性且无退化现象,进一步的粗粒化处理不再带来额外增益。因此,该系统的因果涌现程度(CE)为0.33,反映了路径上的总增益。
选择微观→宏观路径
在分析系统因果涌现时,可能存在选择特定路径的先验原因;然而,通过第一性原理方法亦可识别出合适的微观→宏观路径。
具体而言,微观尺度到宏观尺度路径的终点可选择为能实现最大因果涌现(CP)总增益的宏观尺度。若存在多个可能终点并列最高增益时,代表维度降低量最小的宏观尺度即为最优终点,因其表明超过该点后维度降低不再带来CP增益。确定终点后,需分析 ΔCP 的最具信息量的微观→宏观路径,即从微观尺度到终点宏观尺度(一致性定义见补充信息注释S2)中跨越所有一致宏观尺度的最长路径。
作为终点的宏观尺度可通过暴力搜索法确定:首先生成所有可能的宏观尺度,剔除不一致的,计算其CP值,最终选择CP值与维度最高的宏观尺度作为路径终点。
实际上,这种方法对大型系统并不适用,因此需要采用启发式方法。一种方法是沿路径进行粗粒度处理,直到达到收益递减的临界点。具体来说,路径上的每个步骤都会产生增量收益序列。当满足(某个小阈值 ε >0)或 比值在较长路径长度上持续下降时,系统在步骤i*进入“边际效益递减”状态。
换言之,当 ΔCP 变得微不足道(低于 ε)或在路径的相当长段持续逐步缩小时,这标志着收益递减的转折点,也预示着一个不会大幅降低CP的近似终点。但需注意,不能仅因选择过小的 ε 或过长的路径长度就简单停留在局部最大值(参见局限性与启发式方法),以准确评估收益递减。
在定义路径或宏观尺度之前,若要估算系统中因果涌现量的上限,只需在微观尺度上测量CP值即可。该值与1的差距可直接作为因果涌现量的上限,无需跨尺度搜索,便于快速估算。若微观尺度的CP值显著低于1,很可能存在某种维度简化(如粗粒度处理)使其达到或接近最大值;因此,微观尺度CP值与1的差值可近似反映多数系统的因果涌现量(但无法确定增益源自哪个宏观尺度)。对于结构足够复杂的大型系统,可能存在某个宏观尺度使CP值趋近1,特别是在考虑高阶宏观态[18]等完整维度简化方案,或放宽一致性假设时。
![]()
图 2沿微→宏路径的因果基元
(A) 微尺度的TPM,细胞颜色根据其概率(p = 1表示深蓝色)进行着色。
(B) 宏观时间过程的TPM, ΔCP 突然变为零。
(C) 同一宏观系统以马尔可夫链形式可视化呈现,其中粗粒化宏观状态已标注(其自环ρ=1未显示)。
(D) 随着维度降低程度增加,因果基元的变化情况,其中CP的总增益为0.33(以确定性加特异性表示),反映了因果涌现的程度。
涌现复杂性:多尺度因果贡献的量化
传统上,复杂性科学领域的主要动机源于一个定性概念:系统在微观尺度之外存在直观的宏观或介观结构。用于检测宏观或介观结构的具体定量方法主要集中于可压缩性或效率[39],或更近期通过评估信息论上的意外性[40]。然而,这意味着所检测到的介观尺度可能仅是便利的压缩形式,且无因果相关性。
相比之下,通过分析因果贡献的分布情况,CE 2.0能够量化系统运行中真正具有因果相关性的涌现复杂性。具体而言,路径上每个步骤的 ΔCP 代表该尺度对总复杂度(完全决定系统因果运作的总和)的因果贡献,因此可以评估其在路径上的分布情况。CE 2.0因此提供了一个分类体系,用以衡量系统因果运作的复杂程度:如果这些运作主要局限于单一尺度(如微观尺度或被“头重脚轻”的宏观尺度主导),则系统属于简单系统;而若系统存在具有显著因果贡献的中间尺度,则属于复杂系统。
为展示CE 2.0的这一新特性,图3分析了两个因果涌现系统:一个缺乏介观结构,另一个虽具介观结构但其他方面尽可能相似(关于后续分析的算法实现方式,详见补充信息注释S3中的伪代码)。
图3A展示了由无明显介观结构的直观宏观系统组成的TPM,其中(0,1,2,3)和(4,5,6,7)被粗粒化为两个相应的宏观态。实际上,粗粒化为这两个宏观态的微观态各自构成一个等价类(可视化结果见图3B)。
在微观到宏观路径的每个尺度上,因果路径(CP)的增益均被追踪。值得注意的是,对于第一个系统,微观到宏观路径上的CP增益主要集中在路径终点(见图3C)。这表明其呈现“头重脚轻”的结构特征,主要由微观尺度(贡献总CP的0.14)和两个等价类中大型宏观尺度终点(贡献0.18)的因果贡献构成。微观尺度与宏观尺度共同解释了系统CP值的绝大部分(0.41),这量化表明其因果机制主要受这两个尺度支配。
为系统地界定“顶部优先”或“底部优先”系统与具有显著中尺度结构系统的分类差异,本文提出“涌现复杂性(EC)”这一概念。该概念基于路径长度L上因果贡献的熵值。给定每一步(不包括微观尺度)的增益(i=1,2 ,...,L),则
![]()
这确保了{p1 ,...,pL}是L步长上的概率分布。为量化增益的“分散程度”(多尺度特性),需计算熵值。
![]()
若所有相等(即p为均匀分布),则该值等于log2(L);当路径中少量步骤主导总增益时,该值会递减;当单一涌现尺度仅由单一因果贡献构成时,该值趋近于零。为比较显著长度差异的路径,这些数值可通过log2(L)进行归一化处理。
![]()
图3. 不同尺度下的因果贡献分析
(A) 无中尺度结构系统的微观TPM可视化。
(B) 同一系统的可视化呈现。
(C) CE 2.0将该系统的因果贡献判定为“顶部集中型”,即最后一个维度的降维贡献最大。
(D) 具有中尺度结构的类似系统的微观TPM可视化。
(E) 中尺度系统的可视化呈现。
(F) 因果贡献向低阶维度降维方向偏移,表明该系统具有以多尺度因果结构为主的特点,因此展现出更强的涌现性复杂性。
为展示该方法如何检测介观结构,图3D和3E中建模了类似系统,但其变化在于:(0)和(4)在状态转移方面可与其他成员区分开来,它们在宏观状态终点处与(0,1,2,3)和(4,5,6,7)分别进行粗粒化处理。也就是说,对于该系统而言,对CP增益贡献最大的最大维度约简并非通过纯等价类实现。
在这个中尺度系统中(终点处总复杂度为0.13,其中(0,1,2,3)和(4,5,6,7)为宏观状态),当绘制路径上的因果贡献时(图3F),可见更早出现的峰值。由于 ΔCP 的这一早期峰值,中尺度系统的涌现复杂度为2.56比特,而“顶部偏重”系统的涌现复杂度仅为1.67比特。也就是说,中尺度的显现取决于 ΔCP 在比终点更高维度处的峰值。
限制和启发
CE 2.0模型的一个局限性在于,其当前版本通过预设特定的微观→宏观路径来构建尺度层级体系。这种初始设计在实际应用和理论层面都具有合理性,毕竟分析时往往需要单一路径。但要开发能整合所有非等量微观→宏观路径的因果分配方案仍需努力,潜在突破口在于运用莫比乌斯反演[41]或夏普利值[42]等工具,构建覆盖全部分区的因果分配框架。
CE 2.0模型面临的另一个实际限制在于,遍历系统宏观尺度集合会导致组合爆炸。针对CE 1.0[16,17](以及连续系统[43])已有启发式方法,其中最近张等人[22]的研究提出,可采用奇异值分解(SVD)作为精确估算特定宏观尺度下能量输入(EI)增益的方法,无需遍历所有尺度集合,从而避免伴随的组合爆炸。该研究还强调了动力学可逆性对因果涌现的重要性——其动力学可逆性度量与确定性及简并性表现出高度相似性,表明因果原语与可逆性存在共同关联。
因此,在本文的补充信息中,研究者探索了一种基于改进SVD方法的CE 2.0新启发式方法。如S4所述,该方法无需在宏观尺度上进行搜索,即可检测所比较系统在限制条件和启发式方法上的多尺度结构差异,表明CE 2.0分析(如因果涌现和涌现复杂性)可在不产生组合爆炸的情况下进行估算。
与其他涌现理论的比较分析
作为理论框架,CE 2.0具有三大优势:(1) 它以公理化方式建立在因果分析的基础术语之上,且对分析框架内的假设具有鲁棒性;(2) 它能涵盖宏观层面所有可能的因果关系,而CE 1.0则无法做到;(3) 它以创新方式阐明了系统的多尺度因果结构,解决了长期存在的过度决定论与因果排除论之争。本文将对这些优势进行深入探讨与实证分析。
公理落地
如前所述,整合信息论(EI)在CE 1.0中的应用曾因基于最大熵(均匀)分布[24](此处用P(C)表示)[25,26]而受到质疑。核心问题在于CE 1.0需要依赖这一EI假设来检测因果涌现——事实上,因果涌现理论不应依赖于EI计算背后的假设。这将同时影响其实际应用和理论基础。在某些情况下,例如整合信息论中,最大熵分布可进一步解释为对系统采取“内在视角”的函数[21],但这需要接受整合信息论的假设,包括其对意识的分析。
在CE 2.0中,同样建议对P(C)采用均匀分布。这是因为若不允许P(C)在不同尺度间存在差异,则意味着宏观层面的反事实假设和干预措施无法独立于其微观尺度进行计算,这对大多数科学因果模型而言是不合理的(例如,评估电灯开关与灯泡之间因果关系的强度时,需按两者总原子数进行加权等)。
然而,与CE 1.0不同,该P(C)推荐值并非检测因果涌现的必要条件。事实上,宏观层面的CP增益已被证明对P(C)的选择具有鲁棒性——即使在微观和宏观层面均采用观测分布时,增益程度仍保持一致[27]。这一优势在图4中也直观呈现:微观和宏观层面的P(C)均为各自尺度的观测稳态分布,因此宏观层面的P(C)本质上是微观层面P(C)的粗粒度表征(即不同尺度间对干预分布的描述具有等效性)。尽管如此,CE 2.0仍能在这些条件下检测宏观层面的因果关系。
总体而言,CE 2.0在理论层面比CE 1.0更具稳健性,这得益于其基于因果原语的构建——这些原语历来被证明是因果关系本质的基础要素,同时该理论还能在因果分析的多样化背景假设中检测因果涌现现象。
CE 2.0涵盖所有宏观层面的因果关系
CE 2.0可检测CE 1.0框架无法识别的宏观因果关系案例。
这种检测方法的实例展示在一个由两个等价类构成的8态系统中,该系统在微观尺度上表现为“块状模型”(见图4A左图)。系统设定单一宏观尺度,其中两个等价类各自被粗粒化为带有自环的宏观态,其粗粒度表示为(0,1,2,3),(4,5,6,7)。通过CE 1.0方法基于宏观尺度能量增益计算的因果涌现,以及通过CE 2.0方法基于宏观尺度耦合增益计算的因果涌现,均在该系统的调控过程中得到呈现。
从图4A(左)所示的初始TPM开始,研究团队对每个状态si在等价类中的概率进行调整。经过50个步骤后,原本会转移至等价类其他成员的概率将逐步叠加到si的自环概率上,最终达到p=1。图4A(中)展示了这一调整过程的中间状态,而图4A(右)则呈现了最终的TPM。该系统通过离散概率重分配步骤,从初始的“块模型”构型逐步演化为具有p=1自环的8个微状态排列矩阵。
在每个步骤中,CE 1.0的计算结果均基于等效性指数(EI)展示,并与CE 2.0中CP增益的对比结果进行对照,最终以选定的固定宏观尺度作为终点。出人意料的是,CE 1.0的EI检测并未发现因果涌现现象,即便系统最初被划分为两个等价类。而从CE 2.0的新视角来看,图4所示系统在初始阶段就存在显著的宏观尺度因果关系。随着自环概率的增加和微观尺度可区分性的增强,这种宏观尺度因果关系逐渐减弱,当微观尺度贡献微乎其微时彻底消失——直至微观尺度完全确定且无退化状态时,宏观尺度因果关系完全消失。
在某些情况下,CE1.0和CE2.0会重叠(例如,图4中 ΔCP 转为零前的刻度与通过搜索EI最大值所识别的刻度相同)。这是因为CE1.0和CE2.0在数学上存在紧密关联,因为EI具有如下分解形式:
EI = effectiveness ∗ log2 n
具体来说,EI可以分解为确定性减去简并性(即有效性),再乘以一个规模项log2n,这个规模项实际上就是给定尺度的维度(即其状态数量)。[9] 这个规模项的存在使得CE 1.0无法清晰分析多尺度结构,因为它不具备尺度不变性,因此无法追踪因果关系在不同尺度间的演变。相比之下,在CE 2.0中,规模项被移除,从而通过因果分配实现了对多尺度结构的恰当分析。
虽然CE 2.0聚焦于 ΔCP ,但若需为因果建模或解释选择一个具有高维度的因果相关尺度,其方法可用于筛选出满足条件的宏观尺度:即在最小化维度缩减的同时最大化因果预测(CP)的个体宏观尺度。这意味着CE 2.0可用于解答与CE 1.0相同的实证问题,必要时还能识别出具有高维度的单一因果相关宏观尺度。这一过程可通过两种方式实现:一是分析 ΔCP 中的边际效益递减规律(如涌现复杂性理论所述),二是通过重新引入尺寸项来权衡CP增益,灵活复现CE 1.0的分析框架。简言之,CE 1.0可通过应用CE 2.0框架,以限定目标——寻找能平衡高CP与高维度的单一宏观尺度——来推导得出。
![]()
图4. CE 1.0无法捕捉所有宏观因果关系
(A)在“块模型”系统中,通过增加各状态自环概率的初始、中期和末期,其等价类上存在两个宏观状态。通过以1/步长递增的方式从完整转移概率集中抽离概率,直至微观尺度完全由自环概率p=1的状态构成,实现概率重分配。
(B)CE 2.0能检测宏观因果关系,并在概率重分配过程中随着微观尺度因果区分度的提升而合理降低,而EI则无法做到。
与其他相关涌现理论的比较
学界曾提出多种检测因果涌现(或更广义的涌现现象)的替代方案,例如通过整合信息分解[44]或考察动态依赖性[45]。但这些方案都依赖互信息的计算,这对因果涌现研究存在根本性问题——因为因果关系的本质特征在于其不依赖于被测过程的数据分布本身[37]。以COPY门循环为例,互信息的计算完全取决于初始状态的多样性,却未能像因果原语那样准确反映每个门对后续步骤的充分必要性[22,27]。
近期关于涌现现象的研究主要聚焦于识别宏观尺度与微观尺度相一致但其动态仍可独立描述的案例,例如计算机软件。[29] 这类研究探讨了宏观尺度是否具有“因果闭合性”,即能否被视为自身的原因。这与本文提出的基于随机游走的宏观一致性条件密切相关,此前的研究也存在类似探讨。[18] 然而,仅检查一致性、可压缩性、因果闭合性等指标,并不能直接衡量因果涌现现象,因为这些指标无法反映宏观尺度对系统微观层面之外因果运作的贡献——这需要某种特定的因果性度量标准,或在此处,对支撑此类度量的因果原语进行增益。相反,这些指标仅能识别哪些宏观尺度是微观尺度的有效描述,同时保留其动态特性,因此可视为适当的压缩形式。例如,在图4分析的系统中,预设路径末端的最大维度缩减就是一个有效的宏观尺度,完全与其微观尺度一致,但因果贡献却微乎其微。
CE 2.0的概念含义
除微观物理学外,所有科学都隐含着因果涌现的运作机制——其模型、解释和实验都默认宏观实体的存在,并认为这些实体能有效解释系统的因果运作。这种观点与普遍还原论的名义承诺相矛盾,后者似乎暗示所有因果力量都会“消散”至系统底层的微观尺度[46,47]。这种现象源于因果排除论证[48]:对于任何给定的宏观现象,其效应也可被描述为底层微观尺度的成因,从而使得宏观层面的描述变得多余。
CE 1.0理论彻底颠覆了传统排除论点,指出根据信息整合理论(EI),宏观层面具有更强的因果效力。这种类似逻辑构成了整合信息理论中排除公设的基础(该公设或许是所有公设中最具争议性的[49])。但CE 1.0理论却得出一个反直觉结论:即便宏观状态未完全处于精确等价类之间,其底层微观层面仍可能被排除——这一结果令人意外,且其认识论与本体论层面的含义尚不明确。
相比之下,在CE 2.0框架中,因果排除机制的处理更为优雅。从当前对单一路径的分析来看,宏观尺度并不会凌驾于微观尺度的因果关系之上(尽管微观尺度的因果贡献仍可能微乎其微)。相反,它们仅通过因果分配模式贡献额外的因果效力,从而形成更全面的实体论体系——其中各个尺度都是高维对象的损耗性切片,而该高维对象包含了系统因果运作的所有相关信息。
尽管其他涌现理论常主张某些宏观特性或定律在原则上无法还原为微观层面,因此物理学不具备“因果封闭性”(如安德森等人、埃利斯等人及弗里茨曼等人的研究)[50–52],但这一要求在涌现理论中仍存争议[53]。相比之下,即使宏观层面完全可还原为微观层面(如本文所述模型),因果涌现仍可能发生,因为宏观层面无论如何都会降低因果关系的不确定性。也就是说,即便宏观层面本身可还原,其在因果原语层面的增益按定义并不成立。这些超越微观层面的增益来源并不神秘,其基础在于不确定性降低[10,54],而这又源于宏观态的多重可实现性[3]。
自CE 2.0理论提出以来,系统涌现现象正是通过宏观尺度不确定性最小化实现的。由此引出一个更广泛的问题:在科学因果模型及其所代表的系统中,不确定性(无论是噪声形式还是共同原因)是否仅存在于认知层面?要回答这个问题,需要对物理学的科学终极状态等未知领域进行推测[3]。即便是微小的真实不确定性来源(如非决定论),在混沌系统中也可能被放大,甚至可能存在被证明无法判定的物理系统[55]。即便科学因果模型中所有内在的不确定性最终都被证明仅存在于认知层面,这也仅适用于覆盖整个宇宙的封闭因果模型——在如此宏大的宇宙尺度因果模型中,由于模型外部不存在可定义的干预因素,所有因果关系的概念都将彻底消失[11]。因此,虽然微观尺度对因果效应的不确定性为零且不存在共同原因(例如置换矩阵)时,因果涌现现象会消失,但这种条件与科学中大多数因果模型存在显著差异。
结语
CE 2.0提出了一种概念与数学层面均具有创新性的涌现理论,该理论将系统视为多尺度层级结构。即使在大多数情况下,单个尺度(尤其是微观尺度)也只是高维对象的切片——但其中仅极少数尺度具有因果相关性,该理论能够识别这些尺度,从而揭示对系统因果运作至关重要的层级结构。
具体而言,该理论揭示了如何通过信息论对因果原语(充分性和必要性)的概括性增强,来测量宏观尺度上的因果关系。这种增强沿着特定路径发生,该路径贯穿系统可能的维度缩减过程。因果涌现是这种增强的总和,而因果贡献可沿路径进行分配。该理论提出了一种新颖的分类体系:某些系统在因果关系上呈现“头重脚轻”特征(如单一宏观尺度占主导),而其他系统则具有更丰富的中观结构。涌现复杂度计算量化了因果贡献在尺度层级中的分布广度。这些改进标志着理论从原始版本CE 1.0的重大扩展,使其能够捕捉多尺度结构。CE 2.0还能检测CE 1.0无法识别的宏观因果关系,同时仍可灵活复现CE 1.0的分析结果(详见结论部分)。
然而,CE 2.0当前的算法框架虽然基于单一维度缩减路径,但仍存在明显局限。该框架既未明确说明如何在多条路径间分配资源,又在实际应用中面临组合爆炸问题(具体伪代码可参见补充材料中的注释S3)。不过,如何突破这些局限已成为未来研究的重点方向(关于无路径方法的讨论可参考其他涌现理论的对比分析,而CE 2.0分析的启发式方法建议详见注释S4)。
因果解释2.0(CE 2.0)在物理学、生物学、神经科学和经济学等领域具有关键应用价值。特别值得一提的是,基于因果原语在理解复杂系统因果关系中的公理重要性,结合既往研究发现——深度神经网络中涌现概念的形成机制[56],以及人工神经网络学习过程中因果结构的变化规律[57],CE 2.0有望为人工智能可解释性[58]和人工智能安全性[59]这一新兴领域作出贡献,例如通过分析深度神经网络及其概念的多尺度结构来推动相关研究。
参考文献
West, G. (2018). Scale: The Universal Laws of Life, Growth, and Death in Organisms, Cities, and Companies (Penguin).
Noble, D. (2011). A theory of biological relativity: No privileged level of causation. Interface Focus 2, 55–64.
Hoel, E. (2024). The World Behind the World: Consciousness, Free Will, and the Limits of Science (Simon & Schuster).
Grasso, M., Albantakis, L., Lang, J.P., and Tononi, G. (2021). Causal reductionism and causal structures. Nat. Neurosci. 24, 1348–1355.
Hoel, E.P. (2018). Agent above, atom below: How agents causally emerge from their underlying microphysics. In Wandering Towards a Goal: How Can Mindless Mathematical Laws Give Rise to Aims and Intention?, A. Aguirre, B. Foster, and Z. Meral, eds. (Springer), pp. 63–76.
Flack, J.C. (2017). Coarse-graining as a downward causation mechanism. Phil. Trans. R. Soc. A. 375, 20160338.
Braun, H.A. (2021). Stochasticity versus determinacy in neurobiology: From ion channels to the question of the ‘‘free will’’. Front. Syst. Neurosci. 15, 629436.
Jedlicka, P. (2017). Revisiting the quantum brain hypothesis: toward quantum (neuro)biology? Front. Mol. Neurosci. 10, 366.
Hoel, E.P., Albantakis, L., and Tononi, G. (2013). Quantifying causal emergence shows that macro can beat micro. Proc. Natl. Acad. Sci. 110, 19790–19795.
Hoel, E. (2017). When the map is better than the territory. Entropy 19, 188.
Pearl, J. (2009). Causality (Cambridge University Press).
Varley, T.F. (2020). Causal emergence in discrete and continuous dynamical systems. Preprint at arXiv. https://doi.org/10.48550/arXiv.2003.13075.
Yang, M., Wang, Z., Liu, K., Rong, Y., Yuan, B., and Zhang, J. (2024). Finding emergence in data by maximizing effective information. Natl. Sci. Rev. 12, nwae279.
Pigozzi, F., Goldstein, A., and Levin, M. (2025). Associative conditioning in gene regulatory network models increases integrative causal emergence. Commun. Biol. 8, 1027.
Hoel, E., and Levin, M. (2020). Emergence of informative higher scales in biological systems: a computational toolkit for optimal prediction and control. Commun. Integr. Biol. 13, 108–118.
Griebenow, R., Klein, B., and Hoel, E. (2019). Finding the right scale of a network: efficient identification of causal emergence through spectral clustering. Preprint at arXiv. https://doi.org/10.48550/arXiv.1908.07565.
Zhang, J., and Liu, K. (2022). Neural information squeezer for causal emergence. Entropy 25, 26.
Klein, B., and Hoel, E. (2020). The emergence of informative higher scales in complex networks. Complexity 2020, 1–12.
Klein, B., Hoel, E., Swain, A., Griebenow, R., and Levin, M. (2021). Evolution and emergence: higher order information structure in protein interactomes across the tree of life. Integr. Biol. 13, 283–294.
Hoel, E.P., Albantakis, L., Marshall, W., and Tononi, G. (2016). Can the macro beat the micro? integrated information across spatiotemporal scales. Neurosci. Conscious. 2016, niw012.
Marshall, W., Findlay, G., Albantakis, L., and Tononi, G. (2024). From micro to macro units: a mathematical framework for identifying the causal grain of a system from its intrinsic perspective. Preprint at bioRxiv. https://doi. org/10.1101/2024.04.12.589163.
Zhang, J., Tao, R., Leong, K.H., Yang, M., and Yuan, B. (2025). Dynamical reversibility and a new theory of causal emergence based on svd. npj Complexity 2, 3.
Yuan, B., Zhang, J., Lyu, A., Wu, J., Wang, Z., Yang, M., Liu, K., Mou, M., and Cui, P. (2024). Emergence and causality in complex systems: A survey of causal emergence and related quantitative studies. Entropy 26, 108.
Balduzzi, D. (2011). Information, learning and falsification. Preprint at arXiv. https://doi.org/10.48550/arXiv.1110.3592.
Eberhardt, F., and Lee, L.L. (2022). Causal emergence: When distortions in a map obscure the territory. Philosophies 7, 30.
Aaronson, S. (2017). Higher-level causation exists (but I wish it didn’t). https://scottaaronson.blog/?p=3294.
Comolatti, R., and Hoel, E. (2025). Consilience in causation: Causal emergence is found across measures of causation. Entropy 27, 825.
Yuste, R. (2015). From the neuron doctrine to neural networks. Nat. Rev. Neurosci. 16, 487–497.
Rosas, F.E., Geiger, B.C., Luppi, A.I., Seth, A.K., Polani, D., Gastpar, M., and Mediano, P.A. (2024). Software in the natural world: A computational approach to emergence in complex multi-level systems. Preprint at arXiv. https://doi.org/10.48550/arXiv.2402.09090.
Go´ mez-Emilsson, A., and Percy, C. (2022). The ‘‘slicing problem’’ for computational theories of consciousness. Open Philosophy 5, 718–736.
Bongard, J., and Levin, M. (2023). There’s plenty of room right here: Biological systems as evolved, overloaded, multi-scale machines. Biomimetics 8, 110.
Beebee, H., Hitchcock, C., Menzies, P.C., and Menzies, P. (2009). The Oxford Handbook of Causation (Oxford Handbooks Online).
Fisher, L.D. (1999). Advances in clinical trials in the twentieth century. Annu. Rev. Public Health 20, 109–124.
Lewis, D. (1973). Causation. J. Philos. 70, 556–567.
Fitelson, B., and Hitchcock, C. (2011). Probabilistic measures of causal strength. In Causality in the Sciences, P.M.I.F. Russo, ed. (Oxford University Press), pp. 600–627.
Albantakis, L., Marshall, W., Hoel, E., and Tononi, G. (2019). What caused what? a quantitative account of actual causation using dynamical causal networks. Entropy 21, 459.
Pearl, J., and Mackenzie, D. (2018). The Book of Why: The New Science of Cause and Effect (Basic Books).
Marshall, W., Albantakis, L., and Tononi, G. (2018). Black-boxing and cause-effect power. PLoS Comput. Biol. 14, e1006114.
Gershenson, C., and Ferna´ ndez, N. (2012). Complexity and information: Measuring emergence, self-organization, and homeostasis at multiple scales. Complexity 18, 29–44.
Marchese, E., Caldarelli, G., and Squartini, T. (2022). Detecting mesoscale structures by surprise. Commun. Phys. 5, 132.
Jansma, A. (2025). Mereological approach to higher-order structure in complex systems: From macro to micro with mo¨ bius. Phys. Rev. Res. 7, 023016.
Winter, E. (2002). The shapley value. In Handbook of Game Theory with Economic Applications, 3 (Elsevier), pp. 2025–2054.
Chvykov, P., and Hoel, E. (2020). Causal geometry. Entropy 23, 24.
Rosas, F.E., Mediano, P.A.M., Jensen, H.J., Seth, A.K., Barrett, A.B., Carhart-Harris, R.L., and Bor, D. (2020). Reconciling emergences: An information-theoretic approach to identify causal emergence in multivariate data. PLoS Comput. Biol. 16, e1008289.
Barnett, L., and Seth, A.K. (2023). Dynamical independence: Discovering emergent macroscopic processes in complex dynamical systems. Phys. Rev. E 108, 014304.
Bontly, T.D. (2002). The supervenience argument generalizes. Philosophical Studies 109, 75–96.
Block, N. (2003). Do causal powers drain away? Philos. Phenomenol. Res. 67, 133–150.
Kim, J. (2000). Mind in a Physical World: An Essay on the Mind-Body Problem and Mental Causation (MIT Press).
Bayne, T. (2018). On the axiomatic foundations of the integrated information theory of consciousness. Neurosci. Conscious. 2018, niy007.
Anderson, P.W. (1972). More is different: Broken symmetry and the nature of the hierarchical structure of science. Science 177, 393–396.
Ellis, G.F.R. (2020). The causal closure of physics in real world contexts. Found. Phys. 50, 1057–1097.
Fritzman, J.M. (2024). Collapsing strong emergence’s collapse problem. Eur. J. Philos. Sci. 14, 24.
Carroll, S.M., and Parola, A. (2024). What emergence can possibly mean. Preprint at arXiv. https://doi.org/10.48550/arXiv.2410.15468.
Liu, K., Yuan, B., and Zhang, J. (2024). An exact theory of causal emergence for linear stochastic iteration systems. Entropy 26, 618.
Cardona, R., Miranda, E., Peralta-Salas, D., and Presas, F. (2021). Constructing turing complete euler flows in dimension 3. Proc. Natl. Acad. Sci. 118, e2026818118.
Ra¨ z, T. (2023). Methods for identifying emergent concepts in deep neural networks. Patterns 4, 100761.
Marrow, S., Michaud, E.J., and Hoel, E. (2020). Examining the causal structures of deep neural networks using information theory. Entropy 22, 1429.
Templeton, A., Conerly, T., Marcus, J., Lindsey, J., Bricken, T., Chen, B., Pearce, A., Citro, C., Ameisen, E., and Jones, A. e. a. (2024). Scaling monosemanticity: Extracting interpretable features from claude 3 sonnet. Transformer Circuits Thread. URL: https://transformer-circuits.pub/2024/ scaling-monosemanticity.
Lazar, S., and Nelson, A. (2023). AI safety on whose terms? Science 381, 138.
Jansma, A., and Hoel, E. (2025). Pymergence: A python toolkit for causal emergence 2.0. Zenodo. https://doi.org/10.5281/zenodo.17210078.
参考文献可上下滑动查看
因果涌现第七季——从理论到应用
在神经系统中意识的生成、城市交通的拥堵演化、全球产业系统的协同与失稳之中,始终潜藏着一条贯穿微观与宏观的因果脉络:个体行为本身或许简单,却能在尺度跃迁中孕育出高度组织化、难以还原的整体结构。复杂现象并非微观规则的线性叠加,而是源于多尺度动力学作用下逐步形成的因果组织。正是在这一背景下,因果涌现理论被提出,并在因果涌现 2.0、工程化涌现以及多尺度因果抽象等工作中推进,逐渐发展出一套融合动力学分析、信息论度量以及谱方法与人工智能工具的研究框架,从而将研究重心从“复杂性本身”转向“因果结构如何出现、如何被度量并在现实系统中发挥作用”。
为系统梳理因果涌现领域的最新进展,北京师范大学系统科学学院教授、集智俱乐部创始人张江老师领衔发起,组织对该主题感兴趣的研究者与探索者共同研读前沿文献、交流研究思路。读书会将于2026年2月22日起每周日上午(创建读书会暂定时间为10:00-22:00)线上开展,持续约10周,包含主讲分享与讨论交流,并提供会后视频回放,诚邀相关领域研究者及跨学科兴趣者参与。
![]()
详情请见:
1.
2.
3.
4.
5.
6.
7.
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.