《Causality and Complex Systems》｜集智科学研究中心最新成果|因果性|相似性|多变量|因果关系

分享至

导语

2026年出版的前沿学术著作《Causality and Complex Systems》由张江、崔鹏与Hector Zenil联合主编，本书收录了来自全球学者的17篇研究论文，源自期刊《Entropy》专题精选，全面探索了复杂系统中的因果性与因果涌现问题。旨在探索因果机制在复杂系统中的运作方式，尤其关注因果涌现及其在各个领域的应用。专题论文旨在揭示宏观系统中因果关系如何形成、发展，并对理论研究和实践提供指导。

赵思怡丨编辑

书籍名称：Causality and Complex Systems 书籍链接：https://www.mdpi.com/books/reprint/12348-causality-and-complex-systems 出版日期：2026年2月出版社：MDPI

从理论到现实：三大内容板块

复杂系统是由大量相互作用的单元构成的统一整体，其复杂性的一个关键来源在于因果结构之间的精细交织与相互缠绕。此类系统的一个重要特征是因果涌现现象，即在宏观尺度上可能出现比微观尺度更强的因果关系，这一现象在统计力学等领域中尤为典型。

本专题聚焦“因果性与复杂系统”，旨在探讨复杂系统中因果关系之间的相互作用，以及因果结构如何在系统中产生与演化。本专题收录的17篇论文覆盖了从理论框架到实际应用的广泛主题，共同目标是推动我们对动态且相互联通系统中因果性的理解。

本专题的重要贡献包括：提出用于量化因果涌现的全新理论框架，发展创新的因果机器学习算法，以及基于信息论的因果分析方法。同时，还展示了在复杂与非线性系统中进行因果发现的方法学进展。

此外，本专题还呈现了丰富的跨学科应用，涵盖神经科学、生物学、社会学以及环境科学等领域，体现了因果方法在解释现实世界现象中的广泛适用性。

总体而言，本专题不仅深化了对复杂系统中因果性的理论理解，也为数据驱动研究中的实际问题提供了可行的工具与方法。

论文题目：Emergence and Causality in Complex Systems: A Survey of Causal Emergence and Related Quantitative Studies 论文链接：https://doi.org/10.3390/e26020108

摘要：涌现（emergence）与因果性（causality）是理解复杂系统的两个基本概念，它们彼此关联。一方面，涌现指的是这样一种现象：宏观性质不能仅仅归因于个体性质的简单叠加。另一方面，因果性本身也可以表现出涌现特征，即随着抽象层次的提高，可能会出现新的因果规律。因果涌现（Causal Emergence, CE）理论旨在连接这两个概念，甚至利用因果性的度量来量化涌现。

本文对因果涌现的定量理论及其应用的最新进展进行了全面综述，重点关注两个核心挑战：一是如何量化因果涌现，二是如何从数据中识别因果涌现。后者需要结合机器学习与神经网络技术，从而在因果涌现与机器学习之间建立了重要联系。我们重点讨论了两类问题：一类是“结合机器学习的因果涌现”，另一类是“服务于机器学习的因果涌现”，两者都强调了有效信息（Effective Information, EI）作为衡量因果涌现的重要指标的关键作用。本文最后探讨了潜在应用，并对未来发展方向进行了展望。

关键词：因果性、涌现、因果涌现、因果涌现识别、有效信息、机器学习

图1：多尺度复杂系统中存在的各种因果类型。在该图中，实线箭头表示常见的因果关系，这类因果关系通常被广泛接受且争议较少。点线箭头表示由“随附性”（supervenience）驱动的一种因果形式，而虚线箭头则表示涌现性因果关系，这种因果关系可以发生在同一层级内部（intra-level），也可以表现为向下因果（downward causation）。

论文题目：Efficient, Formal, Material, and Final Causes in Biology and Technology. 论文链接：https://doi.org/10.3390/e25091301

摘要：本文探讨了将因果效应划分为四类——有效因（efficient causation）、形式因（formal causation）、质料因（material causation）和目的因（final causation）——如何为理解生物学与技术中的涌现过程提供有益视角。其中，形式因、质料因和目的因都包含向下因果（downward causation）的情形，并且它们各自都可以以共时（synchronic）和历时（diachronic）的形式出现。

综合来看，这些因果类型解释了为什么在涌现层级结构中的所有层级都具有因果能力（这即为诺布尔的“生物相对性原理”），也说明了为何只有在同时考虑各涌现层级之间的向上与向下相互作用时，因果闭合（causal closure）才成立。这一观点反驳了那种认为某个基础物理层面本身就具备完全因果性的主张。

其中一个关键特征是：分子层面的随机性在促成能动性（agency）的涌现中发挥了重要作用，从而为在这些情境中出现目的因提供了可能性。

关键词：亚里士多德、因果性、涌现、因果闭合、向下因果

图2：个体中自下而上与自上而下相互作用的交互关系（Ellis 和 Noble，2023）。由于向上的箭头从最底层的物理层一直延伸到整体个体层，而向下的箭头又贯穿回所有层级，将各层连接起来，因此形成了因果闭合（Ellis，2020a）。与目的因（final causation）相关的“价值”存在于个体层面。此外，还存在一个更高层级（“社会”），但在图中未显示。

论文题目：Flickering Emergences: The Question of Locality in Information-Theoretic Approaches to Emergence 论文链接：https://doi.org/10.3390/e25010054

摘要：涌现（emergence）是指复杂系统展现出某些性质、行为或动力学特征，而这些特征不能简单地还原为其组成要素的性质，这是复杂系统的一个核心特征。近年来，人们致力于利用信息论的数学框架对涌现进行形式化定义，该框架认为，涌现可以通过整体与部分的状态如何共同揭示系统整体未来的信息来理解。

本文表明，信息论方法中一个共同的基础性组成部分会导致涌现性质具有一种内在的不稳定性，我们称之为闪烁涌现（flickering emergence）。一个系统在平均意义上可能表现出有意义的涌现特性（无论是具有信息性的粗粒化表示，还是高阶协同作用），但在某些特定状态配置下，这种涌现特性会瓦解，甚至变得具有误导性。

我们通过存在性证明展示了闪烁涌现在两种不同框架中的出现：一种基于粗粒化方法，另一种基于多变量信息分解方法。同时我们论证，任何基于时间互信息的方法都会表现出这一现象。最后，我们认为，闪烁涌现不应被视为否定某种涌现模型的理由，而应在探讨涌现如何与自然世界的实际模型相联系时加以考虑。

关键词：涌现；因果性；高阶相互作用；部分信息分解；协同作用；网络；神经科学

图3：时间互信息的结构随时间变化。上图：两个“双重冗余格”展示了两种不同状态转移（(0,1) → (0,0) 和 (0,0) → (0,0)）的局部整合信息分解。尽管这两个转移具有相同的终态，但其信息结构完全不同。其中一个转移表现为具有信息性的因果解耦，而另一个则表现为误导性的因果解耦。此外，两者在双重冗余项（{1}{2} → {1}{2}）的符号上相反，并存在其他多种差异。下图：在ΦID框架下对“闪烁涌现”（flickering emergence）现象的可视化。随着系统随时间演化（下方图），系统会在不同状态之间循环；对于每一次状态转移，都可以计算瞬时的因果解耦（上方图）。可以看到，不一致的动态会在不同时间出现，并与一致的涌现过程交替发生。

论文题目：Neural Information Squeezer for Causal Emergence. 论文链接：https://doi.org/10.3390/e25010026

摘要：传统的因果涌现研究表明，在同一马尔可夫动力系统中，如果对微观状态采用合适的粗粒化策略，则可以在宏观层面获得比微观层面更强的因果性。然而，从数据中识别这种涌现的因果性仍然是一个尚未解决的难题，因为合适的粗粒化策略往往难以找到。

本文提出了一种通用的机器学习框架——神经信息压缩器（Neural Information Squeezer），用于自动提取有效的粗粒化策略及宏观层面的动力学结构，并能够直接从时间序列数据中识别因果涌现。通过使用可逆神经网络，我们可以将任意粗粒化策略分解为两个独立过程：信息转换和信息丢弃。借助这种方法，我们不仅可以精确控制信息通道的宽度，还能够从解析上推导出一些重要性质。

此外，我们还展示了该框架如何从数据中提取不同层级上的粗粒化函数及其对应的动力学结构，并在若干示例系统中成功识别出因果涌现。

关键词：因果涌现、粗粒化、可逆神经网络

图4：神经信息压缩器（Neural Information Squeezer）的流程与框架。其中，xt表示时刻t的数据；编码器ψα是一个可逆神经网络（INN），用于生成粗粒化后的数据yt。动力学学习器fβ是一个带参数β的前馈神经网络，通过它可以实现从yt到yt+1的演化。解码器则将预测得到的下一时刻宏观状态yt+1转换为对应的微观状态预测。

论文题目：An Exact Theory of Causal Emergence for Linear Stochastic Iteration Systems. 论文链接：https://doi.org/10.3390/e26080618

摘要：在对复杂系统进行粗粒化之后，其宏观状态的动力学可能表现出比微观状态更显著的因果效应。这一现象被称为因果涌现（causal emergence），并通过有效信息（effective information）这一指标进行量化。然而，该理论面临两个挑战：其一是在连续随机动力系统中缺乏成熟的理论框架，其二是对粗粒化方法的依赖。

在本研究中，我们针对具有连续状态空间和高斯噪声的线性随机迭代系统，提出了一个关于因果涌现的精确理论框架。在此基础上，我们推导了适用于一般动力学的有效信息解析表达式，并在粗粒化所消除的维度平均不确定性存在上界的条件下，识别出能够最大化因果涌现程度的最优线性粗粒化策略。

我们的研究表明，最大因果涌现及其最优粗粒化方法主要由系统参数矩阵的主特征值和特征向量决定，其中最优粗粒化方式并非唯一。为验证上述理论，我们将分析模型应用于三个简化的物理系统，并将结果与数值模拟进行比较，二者始终表现出良好的一致性。

关键词：因果涌现、有效信息、线性随机迭代系统、粗粒化

图5：最优粗粒化策略W的解集可视化。当时，。尽管位于六维空间中，但在对w2进行约束的情况下，我们可以绘制w1的取值范围，即满足

当因果涌现时，wi的解集为三维空间中一个平面（蓝色）与一个球面（红色）的交集，即一个圆。

论文题目：A Synergistic Perspective on Multivariate Computation and Causality in Complex Systems 论文链接：https://doi.org/10.3390/e26100883

摘要：对于一个复杂系统而言，“计算”或执行“计算过程”究竟意味着什么？直观地说，当一个系统的状态是多个输入（可能包括其自身过去状态）的函数时，我们可以认为复杂的“计算”正在发生。在本文中，我们讨论了如何利用统计协同（statistical synergy）的概念来普遍研究复杂系统中的计算过程。所谓统计协同，是指只有在已知所有输入的联合状态时，才能获得的关于输出的信息。

在前人工作的基础上，我们表明，这一方法自然地将多变量信息论与因果推断中的相关主题联系起来，特别是因果碰撞点（causal colliders）这一现象。我们首先展示了伯克森悖论（Berkson’s paradox）如何暗示多维输入与输出之间存在高阶的协同相互作用。随后，我们讨论了因果结构学习如何能够细化并指导对经验数据中协同现象的分析，以及在何种情况下观测到的协同能够真实反映计算过程，何时则可能只是伪相关。

最后，我们提出，这种将协同、因果碰撞点与计算联系起来的概念框架，可以作为构建复杂系统中计算的一般性数学理论的基础。

关键词：伯克森悖论、协同、多变量信息论、高阶相互作用、部分信息分解

图6：双变量部分信息分解（bivariate PID）的直观示意图。

论文题目：Causality Analysis with Information Geometry: A Comparison. 论文链接：https://doi.org/10.3390/e25050806

摘要：因果性的量化对于理解自然界和实验环境中的多种重要现象至关重要，例如脑网络、环境动力学以及各种病理过程。目前，最常用的两种因果性测量方法是格兰杰因果（Granger Causality, GC）和转移熵（Transfer Entropy, TE）。这两种方法都依赖于这样一个思想：通过利用某一过程在较早时间的信息，来提高对另一过程的预测能力。然而，它们各自也存在局限性，例如在处理非线性、非平稳数据或非参数模型时表现不佳。

在本研究中，我们提出了一种基于信息几何的替代方法来量化因果性，以克服上述局限。具体而言，我们基于信息率（information rate）这一衡量时间依赖分布变化速率的指标，发展出一种无模型方法——信息率因果（information rate causality）。该方法通过刻画一个过程的分布因另一个过程而发生的变化来捕捉因果关系的出现。

这种测量方法特别适用于分析通过数值模拟生成的非平稳、非线性数据。相关数据是通过模拟不同类型的离散自回归模型生成的，这些模型包含了时间序列信号中的单向与双向线性和非线性交互作用。研究结果表明，在本文考察的多个示例中，信息率因果相比格兰杰因果和转移熵，能够更有效地捕捉线性与非线性数据之间的耦合关系。

关键词：因果性、信息几何、转移熵、格兰杰因果、信息率因果、信号处理、非线性模型、非平稳性、概率分布

图7：论文中方程（24）和（25）中过程x1(t)与x2(t)的信息流模型。本文在物理时间为25秒、采样频率为200 Hz（共5000个样本）的条件下，对这些方程进行了模拟，并分别考虑了大噪声和小噪声两种情况。两个过程之间的耦合发生在物理时间10秒处。

论文标题：Bernhard Schölkopf and Mauricio Barahona Kernel-Based Independence Tests for Causal Structure Learning on Functional Data 论文链接：https://doi.org/10.3390/e25121597

摘要：沿连续函数维度（如时间或空间）对系统进行测量在许多领域中都十分普遍，从物理与生物科学到经济学和工程学皆是如此。这类测量可以被视为对某一潜在平滑过程在连续域上的采样实现。然而，传统的独立性检验和因果学习方法并不直接适用于此类数据，因为它们没有考虑函数维度上的依赖性。

通过引入专门设计的核函数，我们提出了针对函数型变量的双变量、联合以及条件独立性的统计检验方法。该方法不仅将希尔伯特–施密特独立性准则（Hilbert–Schmidt Independence Criterion, HSIC）及其多变量扩展（d-HSIC）推广到函数数据，还通过基于HSCIC构建条件置换检验（conditional permutation test, CPT）的新统计量，从而实现了条件独立性检验。此外，我们还通过评估拒绝率来估计最优的正则化强度。

在合成函数数据上的实验结果表明，这些检验在显著性水平（size）和检验功效（power）方面均表现良好。最后，我们展示了该方法在多种基于约束和基于回归的因果结构学习问题中的应用，包括合成数据示例以及真实的社会经济数据。

关键词：因果发现、独立性检验、函数数据分析、核方法

图8：Meek规则：用于对在条件独立性检验之后仍保留在图中的边进行定向，并基于已检测到的碰撞结构（colliders）确定边的方向。关于为何这些边不能被反向定向（否则会破坏图的无环性或已发现的条件独立关系）的证明。

论文标题：Neural Causal Information Extractor for Unobserved Causes. 论文链接：https://doi.org/10.3390/e26010046

摘要：因果推断旨在准确刻画给定变量之间的因果关系。然而，在许多实际系统中，变量往往只能被部分观测，一些未观测变量可能携带重要信息，并对目标变量产生因果影响。如何识别这些未观测的原因仍然是一个挑战，而现有研究尚未同时考虑在保留已观测原因的同时提取未观测原因。

在本研究中，我们提出通过一种生成器—判别器框架来构建隐式变量，该框架被称为神经因果信息提取器（Neural Causal Information Extractor, NCIE）。该方法能够补充未观测原因的信息，从而形成一个完整的因果集合，既包括已观测的原因，也包括未观测原因的表示。通过最大化目标变量与“已观测原因 + 隐式变量”联合体之间的互信息，我们生成的隐式变量可以弥补未观测原因本应提供的信息。

在合成数据实验中，我们发现这些隐式变量能够保留未观测原因的信息及其动力学特征。此外，在大量真实世界时间序列预测任务中，引入隐式变量后预测精度得到提升，从而表明这些隐式变量对目标变量具有因果作用。

关键词：因果推断、互信息最大化、未观测原因、复杂系统

图9：通过维恩图（Venn diagram）展示信息内容，以及因果关系的示意：(a) 真值（ground truth）；(b) 现实中部分可观测的情景；(c) 使用NCIE生成的隐式变量Z对因果关系的替代表示，其中Y、X和W分别表示目标变量、已观测的原因和未观测的原因。

论文题目：Comparison of Bootstrap Methods for Estimating Causality in Linear Dynamic Systems: A Review 论文链接：https://doi.org/10.3390/e25071070

摘要：在本研究中，我们对四种不同的自助法（bootstrap）在时间序列数据因果分析显著性评估中的表现进行了全面比较。为此，我们通过线性反馈系统生成多变量模拟数据。研究的方法包括：

无相关相位随机自助法（uncorrelated Phase Randomization Bootstrap, uPRB）：通过在频域中随机化相位生成变量之间无交叉相关的替代数据；
时间移位自助法（Time Shift Bootstrap, TSB）：通过在时域中随机化相位生成替代数据；
平稳自助法（Stationary Bootstrap, SB）：用于弱相关平稳观测值的标准误计算与置信区间构建；
自回归筛选自助法（AR-Sieve Bootstrap, ARSB）：基于自回归（AR）模型的重采样方法，用于近似底层数据生成过程。

结果显示，uPRB方法能够准确识别变量间的相互作用，但在某些变量上无法检测自反馈；TSB方法表现逊于uPRB，并且无法检测某些变量间的反馈；SB方法在因果性结果上较为一致，但随着平均块宽度增加，其检测自反馈的能力下降；ARSB方法表现最佳，能够准确检测所有变量的自反馈和因果关系。

在脉冲响应函数（Impulse Response Function, IRF）分析中，只有ARSB方法能够在所有变量上同时检测自反馈和因果性，并与连通性图高度一致。其他方法的检测表现存在较大差异，有些出现假阳性，有些仅能检测自反馈。

关键词：因果分析、格兰杰因果、自助法、多变量时间序列、脉冲响应函数

图10：仿真模型的连通性示意图。

论文题目：Inferring a Causal Relationship between Environmental Factors and Respiratory Infections Using Convergent Cross-Mapping. 论文链接：https://doi.org/10.3390/e25050807

摘要：人口中呼吸道感染的发生与多种因素相关，其中空气质量、温度和湿度等环境因素受到广泛关注。尤其是在发展中国家，空气污染已引起普遍的不适和关注。尽管呼吸道感染与空气污染之间的相关性已被广泛认识，但二者之间的因果关系仍难以明确建立。

在本研究中，我们通过理论分析，更新了执行扩展收敛交叉映射（Extended Convergent Cross-Mapping, CCM——一种因果推断方法）以推断周期性变量间因果关系的流程。同时，我们在数学模型生成的合成数据上验证了这一新流程的有效性。

对于中国陕西省2010年1月1日至2016年11月15日的真实数据，我们首先通过小波分析研究流感样病例、空气质量指数（AQI）、温度和湿度的周期性，从而确认改进方法的适用性。随后，我们证明了空气质量（以AQI量化）、温度和湿度对每日流感样病例具有影响，尤其是随着AQI增加，呼吸道感染病例呈逐步增加趋势，且存在11天的时间滞后。

关键词：环境因素、呼吸道感染、非线性系统、因果关系

图11：理论结果的数值验证。(a) 一个嵌入环境因子 FFF 的易感-感染-易感（SIS）流行病模型，其中环境因子的动态为周期性。环境因子对疾病发生率的影响存在时间延迟1。(b) 收敛交叉映射（CCM）的性能以及CCM技能随用于重建高维流形的时间序列长度变化的关系。(c) 扩展CCM的性能以及CCM技能随测试时间延迟变化的关系，此处用于重建高维流形的时间序列长度固定。

论文题目：Schizophrenia MEG Network Analysis Based on Kernel Granger Causality. 论文链接：https://doi.org/10.3390/e25071006

摘要：网络分析是研究复杂大脑结构的重要方法。本文采用多变量非齐次多项式核格兰杰因果（MKGC）构建精神分裂症（SCZ）患者脑磁图（MEG）的有向加权网络。通过耦合自回归模拟数据验证，MKGC优于双变量线性和非齐次多项式核格兰杰因果方法。

应用于真实MEG数据，结果显示健康对照组（HCs）的有效连接网络比SCZ更密集。右额叶入连通强度和左枕叶出连通强度的组间差异最显著。额叶、颞叶和枕叶的总连接强度在HCs中均高于SCZs。SCZs的全脑非平衡性高于HCs，但Shannon熵显示健康网络更复杂。

总体而言，MKGC为构建MEG网络和表征网络特性提供了可靠方法。

关键词：核格兰杰因果、有效网络、精神分裂症MEG、非平衡性、复杂性

图12：脑区的入连通强度。(a) 健康对照组（HCs）的入连通网络；(b) 精神分裂症组（SCZs）的入连通网络。节点直径与脑区入连通强度正相关，节点间连线颜色表示脑区间的因果互动。(c) 脑区入连通强度（均值 ± 标准误）；符号 # 和 * 分别表示 Mann–Whitney U 检验下p<0.002和p<0.05的显著性。(d) 入连通强度存在显著差异的脑区，填充颜色表示 Mann–Whitney U 检验得到的 p 值。

论文题目：Detection of Anticipatory Dynamics between a Pair of Zebrafish. 论文链接：https://doi.org/10.3390/e26010013

摘要：预期动力学（Anticipatory Dynamics, AD）的特点是信息接收者的反应可能出现在信息源触发之前，因此需要确定信息流方向（Direction of Information Flow, DIF）来建立因果关系。尽管人们认为预期动力学对动物生存具有重要意义，但自然界中的实例较少。本文利用一对相互作用的斑马鱼时间序列（轨迹）来探索自然系统中AD的存在。

为获取两条轨迹间的DIF，我们设计了特殊实验以指定信息源，同时也使用格兰杰因果（Granger Causality）和转移熵（Transfer Entropy）等常用统计工具检测信息流方向。实验结果显示，大多数鱼对并未表现出预期行为，只有少数鱼对可能存在AD。有趣的是，这些表现出AD的鱼也并非始终显示预期动力学。

研究结果表明，鱼群形成可能并不依赖于AD，同时在AD系统中检测因果关系仍需要新的工具。

关键词：因果性、信息流方向、转移熵、预期动力学、斑马鱼

图13：基于两条鱼轨迹 x 分量时间序列的典型 TLMI（时序局部互信息）： (a) 水箱门打开时，两条鱼几乎总是在同一通道中； (b) 水箱门被阻挡时，两条鱼位于不同通道。可以看到，当门被阻挡且鱼处于不同通道时，互信息非常低，因为它们无法相互观察。

Auto(0)：鱼0的自TLMI；Cross(0,1)：鱼0与鱼1的交叉TLMI。这里 0 和 1 为两条鱼的任意编号。

论文题目：Robust Model-Free Identification of the Causal Networks Underlying Complex Nonlinear Systems. 论文链接：https://doi.org/10.3390/e26121063

摘要：从噪声观测中推断因果网络在各个领域具有重要意义。由于系统建模的复杂性，研究通用且可行的推断算法是网络重建的关键挑战。本文提出一种无假设、无模型（model-free）的新框架，用于从非线性动力学观测中仅揭示网络系统的直接关系。

我们的方法包括多阶多项式条件格兰杰因果（Polynomial Conditional Granger Causality, PCGC）和稀疏PCGC（Sparse PCGC, SPCGC）。PCGC通过多项式函数近似整体系统模型，再进行非线性格兰杰因果分析判断节点间的相互作用；SPCGC则先使用Lasso优化降维，再执行PCGC得到最终网络。在该无模型框架中，条件变量不受系统模型形式限制，有效兼顾了直接和间接影响的推断。

在多种经典动力系统上验证了PCGC和SPCGC的性能。总体而言，该框架对未知模型的数据驱动建模提供了有力指导。

关键词：格兰杰因果、因果推断、数据驱动、无模型、非线性动力学

图14：基于洛伦兹振荡器系统模拟结果的多项式条件格兰杰因果（Polynomial Conditional Granger Causality, PCGC）流程图。(a) 数据集（和）由洛伦兹系统方程生成，噪声强度σ设置为零。这里m = 1且T=2000，即在时间区间t∈[0,20]内以时间步长Δt = 0.0收集数据。是基于多项式基κ的非线性数据矩阵。洛伦兹系统的无约束模型最初在(x, y, z)的五阶多项式完整空间中构建，其对应的非线性数据矩阵为。(b) 对目标变量x而言，导数向量被作为无约束模型和受限模型的输出变量。随后，构建三个受限模型，以判断哪一个驱动变量对目标变量具有因果影响。具体而言，系统的受限模型在(y, z)、(x, z)、(x,y) 的五阶多项式子空间中构建，对应的非线性数据矩阵分别为。绘制了不同情况下x的动态轨迹，并分析了各自的预测误差。

论文题目：Causal Factor Disentanglement for Few-Shot Domain Adaptation in Video Prediction. 论文链接：https://doi.org/10.3390/e25111554

摘要：在机器学习中，当目标分布的训练样本有限时，实现高精度是一个重要挑战。如果可获得大量相关分布的训练样本，则可通过迁移学习提升性能。本文研究如何在源分布与目标分布通过稀疏机制迁移（Sparse Mechanism Shift, SMS）相关时，更有效地进行迁移学习，应用于视频下一帧预测任务。

我们基于TRIS数据集构建了稀疏机制迁移时间干预序列（Sparse Mechanism Shift-Temporal Intervened Sequences, SMS-TRIS）基准，用于评估迁移学习在下一帧预测中的表现。随后，我们利用数据潜在因果机制对模型参数进行解耦，通过因果表示学习的Causal Identifiability from Temporal Intervened Sequences（CITRIS）模型实现这一解耦。实验表明，使用CITRIS增强解耦可以提升性能，但效果依赖于具体数据集和模型骨干，只有在解耦真正增加时才有效。同时，我们发现针对领域自适应的方法无显著帮助，说明SMS-TRIS基准具有较高挑战性。

关键词：因果表示学习、视频预测、迁移学习、少样本学习

图15：(a) 对zt的三个潜在维度和两个真实因果因素进行因果机制解耦示意，并展示了来自 Shapes 数据集的样本帧。上半部分显示了真实因果因素和机制，以及生成观测帧的观测函数h。下半部分显示了模型的潜变量及参数。真实因果因素与模型激活的解耦维度之间的对应关系用加粗彩色边框表示（紫色表示因素1对应zt的维度0和1；粉色表示因素2对应维度2）。(b) 在目标域中，绿色背景表示的机制g1发生变化，导致的转移。如果编码器eθ能将不同因果因素解耦到潜变量zt的不同子集，则仅会引起的变化。通过仅更新，可以在迁移学习中适应这一变化。本文评估了这种对需更新参数的隔离是否可以用于提升少样本域适应性能。

论文题目：Information-Theoretical Analysis of Team Dynamics in Football Matches. 论文链接：https://doi.org/10.3390/e27030224

摘要：球队动态对现代足球比赛结果具有重要影响。本研究结合信息论中的因果涌现（causal emergence）和图论，利用34场J联赛比赛的球员跟踪数据，探讨球队层面动态如何从球员之间的复杂互动中产生。

我们分析了相对场地中心距离、质心（CoM）以及基于速度相似性和距离倒数的聚类系数等宏观特征，以捕捉团队结构、协同和空间关系。相对距离与CoM反映团队整体位置，而聚类系数揭示局部合作与运动相似性。结果显示，使用相对距离和CoM作为宏观特征的平均因果涌现与主客队控球率差异高度相关，而基于速度相似性和距离倒数的聚类系数相关性中等或偏弱，表明其更多反映局部互动。

此外，在进攻阶段，相对距离和CoM的因果涌现高于防守射门前阶段，提示球员整体定位对进攻成功的作用大于防守稳定性。本研究为足球团队协调提供新视角，表明有效团队协作可能通过球员集体定位形成的涌现模式体现，对教练和比赛表现分析具有实际参考价值。

关键词：团队动态、因果涌现、信息论、图论、足球分析、集体行为

图16：足球队动态中宏观特征选择与因果涌现分析的框架。(a) 从微观特征生成宏观特征Vt。

(b) 基于以下宏观特征的示意图：

基于质心（CoM）的宏观特征，由球员位置（微观特征）生成；
从质心到球场中心的距离，由球员到球场中心的距离（微观特征）生成；
速度相似性的聚类系数，由球员速度（微观特征）生成；
逆距离聚类系数，由球员位置（微观特征）生成。

红色和蓝色点表示不同队伍球员的位置，连线表示两对象之间的距离。

编者介绍

张江，北京师范大学系统科学学院教授，也是Swarma Club与Swarma Research的创始人。他的研究主要集中在因果涌现、复杂系统尺度律以及复杂网络上的机器学习方法，致力于将理论研究与实际系统分析结合。

崔鹏，清华大学长聘副教授，2010年在清华大学获得博士学位。他的研究方向包括因果推断与稳定学习、网络表示学习以及社会动力学建模。Peng Cui在机器学习、数据挖掘和多媒体领域发表了超过100篇高水平论文，并获得过五项最佳论文奖，同时入选KDD 2014和2016最佳论文专刊。他曾担任多个顶级期刊副主编，也是ACM和CCF杰出会员及IEEE高级会员，活跃于学术组织和会议。

Hector Zenil拥有法国巴黎第一大学逻辑与认识论博士学位，以及里尔大学计算机科学博士学位。他曾在牛津大学、伦敦艾伦·图灵研究所和剑桥大学等科研机构任职，提出了“算法信息动力学”领域，推动复杂系统理论的发展。2024年，他获得了国际系统与控制科学院颁发的Charles François奖。他是《Complex Systems》、《Complexity》、《PLoS Complex Systems》期刊及Springer Nature复杂系统书籍系列的执行编辑，为复杂系统研究提供了全球学术平台。

编辑团队在此向所有贡献者致谢，他们的研究极大地丰富了对复杂系统中因果机制的理解。同时，也感谢编辑团队、匿名审稿人和MDPI的支持，使本专题能以高质量呈现给全球学术读者。本专题体现了国际学术合作的成果，旨在加深对复杂系统中因果性理解，并激励未来的研究与创新探索。 ——张江、崔鹏、Hector Zenil，特邀编辑

因果涌现第七季——从理论到应用

在神经系统中意识的生成、城市交通的拥堵演化、全球产业系统的协同与失稳之中，始终潜藏着一条贯穿微观与宏观的因果脉络：个体行为本身或许简单，却能在尺度跃迁中孕育出高度组织化、难以还原的整体结构。复杂现象并非微观规则的线性叠加，而是源于多尺度动力学作用下逐步形成的因果组织。正是在这一背景下，因果涌现理论被提出，并在因果涌现 2.0、工程化涌现以及多尺度因果抽象等工作中推进，逐渐发展出一套融合动力学分析、信息论度量以及谱方法与人工智能工具的研究框架，从而将研究重心从“复杂性本身”转向“因果结构如何出现、如何被度量并在现实系统中发挥作用”。

为系统梳理因果涌现领域的最新进展，北京师范大学系统科学学院教授、集智俱乐部创始人张江老师领衔发起，组织对该主题感兴趣的研究者与探索者共同研读前沿文献、交流研究思路。读书会将于2026年2月22日起每周日上午（创建读书会暂定时间为10:00-22:00）线上开展，持续约10周，包含主讲分享与讨论交流，并提供会后视频回放，诚邀相关领域研究者及跨学科兴趣者参与。

详情请见：

因果涌现读书会第二季

跨尺度、跨层次的涌现是复杂系统研究的关键问题，生命起源和意识起源这两座仰之弥高的大山是其代表。而因果涌现理论、机器学习重整化技术、自指动力学等近年来新兴的理论与工具，有望破解复杂系统的涌现规律。同时，新兴的因果表示学习、量子因果等领域也将为因果涌现研究注入新鲜血液。

由北京师范大学教授、集智俱乐部创始人张江和加州大学圣地亚哥分校助理教授尤亦庄等人发起的，将组织对本话题感兴趣的朋友，深入研读相关文献，激发科研灵感。本读书会自2022年5月22日开始，每周日晚19:00举办，预计持续7-8周。欢迎感兴趣的朋友报名参与。

本季读书会详情与报名方式请参考：

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.