网易首页 > 网易号 > 正文 申请入驻

因果发现作为辩证聚合:定量论证框架

0
分享至

Causal Discovery as Dialectical Aggregation: A Quantitative Argumentation Framework

因果发现作为辩证聚合:定量论证框架

https://arxiv.org/pdf/2604.23633



摘要

基于约束的因果发现在有限样本条件下是脆弱的,因为错误的条件独立性(CI)判定可能会级联引发重大的结构错误。我们提出了面向因果发现的定量论证(Quantitative Argumentation for Causal Discovery, QACD),这是一个语义驱动的框架,它将CI结果表示为分级的、可废止的论证,而非不可逆的约束。QACD将统计检验结果映射为论证强度,并通过连通性介导的见证传播聚合冲突证据,从而在候选邻接关系上产生不动点的可接受性标注。在标准基准贝叶斯网络上的实验表明,QACD在若干噪声或不一致CI条件下提高了结构连贯性与干预可靠性,同时在与经典的基于约束方法、混合方法以及先前基于论证的基线相比时仍保持竞争力。

1 引言

因果发现是从观测数据中推断因果结构的任务,是人工智能中的一个核心问题,因为它使推理系统能够超越统计关联,走向干预与反事实推理(Neuberg 2003; Yang et al. 2025)。其目标是从来自未知联合分布的独立同分布(i.i.d.)样本中重建底层的有向无环图(DAG),或更实际地重建其马尔可夫等价类——通常表示为完成部分有向无环图(CPDAG)。此类因果模型支撑着从基因调控网络分析(Sachs et al. 2005)到经济与社会政策评估(Athey and Imbens 2017)的各类应用。

文献中主要存在两种范式。基于评分的方法搜索使惩罚似然评分最大化的图(Chickering 2002; Zheng et al. 2018),而基于约束的方法则通过检验条件独立性(CI)关系来推断结构(Spirtes, Glymour, and Scheines 2000; Colombo, Maathuis, and others 2014)。在后一类方法中,彼得-克拉克(PC)算法因其效率与渐近保证而保持典范地位:在标准假设下,当CI查询由预言机(oracle)回答时,PC是健全且一致的。然而在实践中,从统计检验获得的CI证据本质上是不确定的。有限样本、测量误差以及检验假设与数据之间的不匹配,通常会同时产生虚假独立与虚假依赖。然而,基于约束的流程仍以单调方式处理已接受的CI陈述:一旦一条边被移除或分离集被固定,后续证据便无法推翻该承诺。在有限样本下,这种单调推理是脆弱的,因为早期的CI错误会累积成全局不一致的承诺(Ling et al. 2024),并在后续的方向确定步骤中级联(Ding et al. 2024; Uhler et al. 2013)。

我们认为,这种脆弱性源于一个根本性的概念错配:不确定的统计推断被当作硬性逻辑约束来处理,而非可废止的证据(Uhler et al. 2013)。因此,因果发现应被重新构建为可废止推理问题,而非纯粹的约束满足问题。

这激发了一种论证理论视角,其中CI结果被表示为分级的证据片段,其冲突必须通过辩证方式解决(Dung 1995; Pollock 1987; Wang and Shen 2025)。然而,论证在因果发现中的现有应用大多集中于后期阶段(如边定向),或侧重于定性而非定量证据(Russo, Rapberger, and Toni 2024)。因此,在很大程度上仍未被探索的是:如何通过显式的论证语义,将分级的统计证据直接整合到骨架发现阶段。

为填补这一空白,我们提出了面向因果发现的定量论证(QACD),该方法通过辩证聚合不确定的CI证据来评估候选邻接关系。其主要贡献如下: • 对基于CI的因果发现的定量论证形式化。CI结果被解释为分级的、可废止的论证,而非不可逆的约束,从而支持在不一致统计证据下的推理。 • 连通性介导的传播衰减。我们引入了一种依赖结构的冲突机制,全局图上下文通过该机制调节局部CI主张的强度。 • 用于骨架修正的不动点辩证语义。边的可接受性通过有限视界或收敛更新进行修订,产生一个反映聚合证据冲突而非贪婪删除的稳定骨架。

本文的其余部分组织如下。第2节回顾因果图与定量论证背景。第3节介绍QACD及其辩证语义。第4节对该方法进行经验评估,随后是相关工作与结论。

2 预备知识

本节回顾了全文使用的因果图(causal-graphical)和论证理论(argumentation-theoretic)概念,并固定了符号表示。

2.1 因果图



虽然马尔可夫假设允许我们从图中读取独立性,但为了从观测到的独立性中推断图结构,我们还需要其逆命题。


虽然我们将忠实性(faithfulness)作为一个背景理想化假设,但我们的框架是明确设计用于在有限样本情形下运行的,在这种情况下,由于统计误差,CI(条件独立性)测试结果可能会违反忠实性。


定向规则 (Meek)。 给定一个无向骨架和一组分离集,标准的基于约束的因果发现过程应用一组健全的图定向规则,称为 Meek 规则 (Meek 1995),以定向所有强制边并获得代表相应 MEC 的唯一 CPDAG。这些规则是确定性的、纯图形的,并且不引入额外的统计假设。

条件独立性检验和 p 值。 在整篇论文中,CI 关系是使用标准统计检验进行评估的,每个检验返回一个 p 值。我们将 p 值解释为不是硬性决策标准,而是作为 CI 主张的证据强度的分级指标:较大的 p 值对应于对条件独立性更强的统计支持 (Jabbari et al. 2017)。

2.2 定量论证框架

为了更清晰地将我们的方法置于形式论证的范畴内,我们简要回顾本文中使用的仅攻击(attack-only)定量设置。我们只需要一组最小的概念:论证(arguments)、攻击(attacks)、权重(weights)和分级可接受性(gradual acceptability)。



本文提出的框架为因果发现实例化了这种仅攻击(attack-only)和分级(gradual)的设置。第3节将 CI 陈述视为邻接假设的分级攻击者,并定义了针对候选边的状态依赖可接受性更新。特别是,QACD 中的有效攻击强度可能通过基于见证的传播(witness-based propagation)依赖于当前的图状态。

3 方法论

我们现在介绍 QACD,该方法通过辩证地聚合不确定的条件独立性(CI)证据来学习因果骨架。如图 1 所示,第一阶段(Phase I)构建一个宽松的候选图并收集 CI 证据,而第二阶段(Phase II)在阈值化和定向之前,在直接攻击和见证传播攻击下迭代修正边的可接受性。算法 1 实现了 QACD 语义。



3.1 问题设定与符号



3.2 第一阶段:候选图生成

第一阶段构建一个宽松的候选骨架,以避免过早删除。


3.3 第二阶段:通过定量论证进行辩证聚合

在构建了候选骨架之后,我们现在通过实例化一个状态依赖的 QAF 来解决边之间的冲突。在这个框架中,论证集是固定的,但有效的攻击关系取决于图不断演变的接受度状态。因此,证据的影响本质上是上下文敏感的:相同的 CI 陈述可能会根据周围结构产生不同的效果。

第二阶段使用一种分级语义,其中边假设在加权 CI 攻击和上下文依赖的基于见证的传播衰减下进行修正。

图 2 说明了邻接假设、基于 CI 的反驳(rebuttals)以及见证诱导的传播衰减之间的这种相互作用。










参数 λ 控制可废止证据在结构中传播的激进程度。重要的是,这种聚合不代表投票或概率,而是对证成(justification)的累积性削弱。这种形式产生了一种有界的、顺序无关的衰减语义。当多个适用的直接或间接传播因子影响同一个边假设时,它们以乘法方式结合,从而削弱其可接受性。

聚合原理。 公式 (6) 通过代表性 CI 论证对边假设实施了有界的、成比例的衰减。这种形式将可接受性保持在 [ 0 , 1 ] 范围内,并与公式 (4) 中的迭代更新自然结合。

在论证理论中,反驳(rebuttal)直接攻击一个主张,而 undercut(底切)则挑战此类攻击的适用性,而不主张相反的结论(Amgoud, Maudet, and Parsons 2000)。因此,在因果发现设置中,强 CI 证据可能 undercut 的不是边假设本身,而是维持冲突连通模式的结构关系。




基于见证的传播衰减的设计原理。 将见证限制为长度为 2 的连接是一种有原则且基于计算考量的设计选择。此类路径是因果图中最小的非平凡连通单元,并且与基于约束的方法所利用的局部推理模式相一致,在这些方法中,CI 错误可能会通过短邻域级联。当强独立性证据与其条件集之外的强支持长度为 2 的连通模式冲突时,这种不一致通常可以通过削弱其中一个桥接关系来解决,从而在不一致的 CI 证据下恢复局部连贯性。更长的路径可以被视为长度为 2 的单元的组合,因此通过迭代传播间接捕获;将传播扩展到更长的路径是可能的,但在计算上更昂贵。

虽然受到上下文敏感的底切式(undercut-style)推理的启发,但见证连通性在这里被用作一种状态依赖的结构修正因子,它将 CI 导出的攻击压力传播到相邻的桥接边。在当前的公式中,见证连通性作为一种状态依赖的传播信号:当强见证模式保持可接受时,CI 导出的对 攻击的部分影响被重新分配到相邻的桥接边。








3.4 图恢复


这一步将分级可接受性语义转化为明确的邻接决策,将高度支持的边与经辩证推理被拒绝的边区分开来。随后,我们利用第一阶段 CI 测试中获得的分离集,通过识别无屏蔽对撞节点来对边进行定向。得到的部分定向图在完整的 Meek 定向规则集(Meek 1995)下闭合,从而生成估计的 CPDAG 。这一恢复过程与标准的基于约束流程类似,确保了与经典方法的可比性。

4 实验

从论证的角度来看,实验评估了在有限样本不确定性下,CI(条件独立性)证据的辩证聚合是否提高了结构连贯性。具体而言,我们考察将 CI 结果视为可废止论证是否能够缓解骨架发现中的错误传播,并导向更具因果有效性的图。

我们在一系列基准贝叶斯网络上评估 QACD,以评估(i)骨架恢复准确率与(ii)下游因果有效性。我们将该方法与代表性的基于约束、混合以及基于论证的基线进行比较。

4.1 实验设置

我们在标准基准网络上评估 QACD,并在统一的实验协议下将其与代表性的因果发现方法进行比较。

数据集。 我们使用八个按规模分类的标准贝叶斯网络。相关统计数据总结于表 1 中。


基线方法。 我们将 QACD 与来自三个家族的代表性方法进行比较:基于约束的(PC-stable (Spirtes and Glymour 1991) 和 MPC (Colombo, Maathuis, and others 2014))、混合的(MMHC (Tsamardinos, Brown, and Aliferis 2006))以及基于论证的(ABAPC (Russo, Rapberger, and Toni 2024))。由于运行时间限制,ABAPC 仅在小规模网络上进行评估。对于 WATER 数据集,由于数据中存在确定性关系,MMHC 被省略。


4.2 跨基准测试的结构准确性与因果有效性

表 2 和表 3 总结了小型、中型和大型网络的结果。总体而言,QACD 始终生成具有强因果有效性(低 NSHD/NSID)的结构,同时在不同复杂度的数据集上保持了具有竞争力的骨架准确性。




在几个数据集(例如 ASIA 和 CHILD)上,QACD 表现出召回率与结构连贯性之间反复出现的权衡。虽然像 MPC 或 MMHC 这样激进的基线方法有时能实现略高的骨架 分数,但 QACD 产生了更低的 NSHD 和更紧的 NSID 界限,表明其具有更优越的干预可靠性。

在具有确定性关系的数据集(例如 WATER)上,QACD 保持稳定并改善了 SID 的下界估计,同时在 SID 的上界估计上保持可比性,即使贪婪方法对统计退化变得敏感时也是如此。由于论证强度是被衰减而不是全局优化的,该方法避免了由退化的充分统计量引起的不稳定性。

在低复杂度网络(例如 EARTHQUAKE)上,PC、MMHC 和 QACD 都恢复了真实结构(ground-truth structure),证实了当 CI 证据已经一致时,辩证聚合保持了鲁棒性。在 WIN95PTS 上,QACD 保持竞争力但并未占据主导地位,反映了在 CI 证据高度可靠的情形下,保守过滤所带来的预期权衡。

总体而言,结果表明当 CI 证据噪声大或不一致时,QACD 最有益。通过连通性介导的传播修正边的可接受性,辩证聚合提高了全局结构连贯性并减少了干预误差,同时在各种规模数据集的骨架恢复方面保持竞争力。

4.3 消融实验:辩证聚合的效果





4.5 讨论

前述结果揭示了一种一致的模式,而非一种普遍的绝对优势主张。结果表明,当CI(条件独立性)证据存在噪声或相互不一致时,QACD最有益。在INSURANCE、SURVEY和HAILFINDER等数据集上,辩证聚合在保持具有竞争力的骨架 分数的同时,改善了NSHD和NSID。这与将CI结果视为可废止论证的观点一致:微弱或冲突的CI主张通过连通性介导的修正被衰减,从而减少了局部CI错误向全局结构错误的传播。随着样本量增加且CI决策变得更加稳定,辩证冲突解决的优势相应减弱。

在ASIA和CHILD等数据集上,QACD表现出骨架召回率与因果有效性之间反复出现的权衡。虽然像MPC或MMHC这样激进的基线方法有时能实现略高的,但QACD通常产生更低的NSHD和更紧的NSID界限,表明其结构连贯性和干预可靠性得到改善。这反映了其保守的修正策略:与其做出不可逆的早期承诺,QACD迭代地抑制支持较弱的邻接关系。

在具有确定性关系的数据集(如WATER)上,即使贪婪或基于似然的方法对(统计)退化变得敏感,QACD仍保持稳定并改善了某些面向干预的指标;相反,当CI证据已经高度一致或信息量充足时(如EARTHQUAKE或WIN95PTS),辩证聚合提供的额外收益更为有限。

总体而言,实验支持了将有限样本因果发现视为在冲突的统计论证上进行推理这一观点的实用性。在所评估的噪声或不一致CI情形下,辩证聚合通常在保持骨架恢复竞争力的同时,改善了全局连贯性并减少了干预误差。

5 相关工作

本工作涉及因果发现与计算论证,尤其是处理结构学习中不确定性与冲突的方法。

5.1 来自观测数据的因果发现

以 PC 算法(Spirtes, Glymour, and Scheines 2000)和快速因果推断(Spirtes, Meek, and Richardson 1995)为代表的基于约束的方法,通过检验条件独立性(CI)关系并将已接受的独立性转化为图编辑操作来推断因果结构。在马尔可夫和忠实性假设下,这些方法是渐近一致的,但在有限样本情形下,它们对 CI 误差敏感:单个虚假的独立性或依赖性可能触发错误的边删除,并级联传播至后续的定向步骤(Uhler et al. 2013)。诸如 PC-stable 等变体降低了顺序依赖性(Colombo, Maathuis, and others 2014),多重检验校正也能提升统计鲁棒性,但大多数基于约束的流程仍依赖于硬性 CI 决策,这些决策一旦纳入图中便不可逆。相比之下,QACD 通过迭代可接受性语义将 CI 结果聚合为分级可废止证据,从而推迟了不可逆的承诺。

基于评分的方法,如贪婪等价搜索(Greedy Equivalence Search)及其扩展(Chickering 2002; Ramsey et al. 2017),将因果发现公式化为使用惩罚似然准则在图结构空间进行搜索。最近的连续优化方法,包括 NOTEARS 及其后续变体(Zheng et al. 2018; Ng, Huang, and Zhang 2024),进一步将结构学习转化为带无环约束的可微优化问题。这些方法为纯基于约束的发现提供了重要替代方案,但它们并未将 CI 结果之间的冲突明确建模为论证性交互。QACD 占据了一个互补的定位:它保留了 CI 测试的局部效率,同时引入了定量论证层,以便在骨架发现阶段解决证据冲突。

5.2 人工智能中的论证

抽象与定量论证。 自从 Dung 提出论证框架(AFs)的开创性形式化(Dung 1995)以来,论证已成为不一致条件下非单调推理的基础范式(Li, Liao, and Chen 2025; Liao and van der Torre 2024)。定量论证框架(QAFs)通过为论证分配内在强度并定义基于分级可接受性的语义,扩展了这一设置(Chi and Liao 2022; Rago et al. 2016)。与在双极框架中对论证进行建模的(Amgoud and Ben-Naim 2018)不同,QACD 将条件独立性检验视为可废止证据。这一区别使 QACD 能够更好地处理噪声或不确定数据,为因果发现提供了更鲁棒的框架。

用于因果探究的论证。 论证在因果推理中的应用是一个不断增长但相对专门化的领域。早期工作主要集中在解释上,采用论证结构来向用户证明或传达因果主张(Cyras et al. 2021)。最近的研究探索了用于因果发现与冲突处理的基于论证的机制(Russo, Rapberger, and Toni 2024; Li et al. 2026)。相关的概率方法将论证的不确定性与分级可接受性联系起来(Hunter and Thimm 2017)。

与我们的工作最密切相关的是 ABAPC(Russo, Rapberger, and Toni 2024),它主要在定向层面(如竞争性 v-结构)利用论证机制来增强 PC 算法。相比之下,QACD 将定量论证直接整合到骨架发现中。通过将 CI 陈述视为邻接假设的分级攻击者,并通过基于见证的结构上下文传播其影响,QACD 能够在定向阶段之前实现边假设的非单调修正。

6 结论

我们提出了 QACD,这是一种用于因果发现的定量论证框架(QAF),它将条件独立性(CI)结果视为可废止证据,并在结构上下文中对其进行聚合。QACD 并非将有限样本下的 CI 决策固化为不可逆的约束,而是通过直接的 CI 攻击和基于见证的传播衰减来修正边的可接受性。这为在骨架发现阶段解决冲突的统计证据提供了一种迭代的、语义驱动的机制。

实证上,在 CI 证据存在噪声或不一致的多种情形下,QACD 生成了更连贯的结构并提高了干预有效性,同时在骨架恢复方面保持了竞争力。这些结果支持了这样一种观点:有限样本因果发现可以被富有成效地构建为对分级的且可能冲突的统计论证进行推理的过程。

仍有几个方向尚待探索。首先,虽然本文聚焦于因果充分性设置,但该框架可以通过在祖先图中引入针对双向边的论证,扩展到存在潜在混杂因素的情形。其次,对于超大规模图,可以使用近似消息传递或感知稀疏性的实现来加速迭代更新。第三,尽管我们预计在标准马尔可夫和忠实性假设下,配合一致的 CI 测试,有限样本冲突会减少,但 QACD 的完整预言机级(oracle-level)一致性分析仍是未来的工作。最后,干预数据可以作为一类新的干预论证被纳入,从而支持基于混合观测与实验证据的论证驱动发现。

原文链接:https://arxiv.org/pdf/2604.23633

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
炸锅!李湘暴瘦50斤判若两人,真实瘦身原因太惊人

炸锅!李湘暴瘦50斤判若两人,真实瘦身原因太惊人

乡野小珥
2026-05-09 01:41:16
闪电式大清仓,李嘉诚又上演了一场教科书级的资本运作

闪电式大清仓,李嘉诚又上演了一场教科书级的资本运作

识局Insight
2026-05-08 19:25:55
吴尚垠:我儿输掉第1分很可惜 中国球员也是人有波动亚运奔金牌去

吴尚垠:我儿输掉第1分很可惜 中国球员也是人有波动亚运奔金牌去

劲爆体坛
2026-05-09 07:50:06
网友说出了美加墨世界杯转播权不得不买的理由

网友说出了美加墨世界杯转播权不得不买的理由

大张的自留地
2026-05-08 14:23:03
香港34岁男子骗诱15岁混血少女,虐杀后多次奸尸,事后还与妻子外出晚饭!被判终身监禁

香港34岁男子骗诱15岁混血少女,虐杀后多次奸尸,事后还与妻子外出晚饭!被判终身监禁

大风新闻
2026-05-08 18:35:02
3-0复仇韩国!中国队成功晋级伦敦世乒赛男团四强

3-0复仇韩国!中国队成功晋级伦敦世乒赛男团四强

体坛周报
2026-05-08 21:47:15
大范围开打?中美金融战

大范围开打?中美金融战

杨风
2026-05-08 22:45:41
你好,NBA!新王登基!詹姆斯的时代已经过去

你好,NBA!新王登基!詹姆斯的时代已经过去

体育新角度
2026-05-08 22:20:18
30条中日航线,4月取消全部航班

30条中日航线,4月取消全部航班

都市快报橙柿互动
2026-05-08 13:42:34
伊朗的宗教极端意识形态,决定了他们真有可能把核弹扔出去

伊朗的宗教极端意识形态,决定了他们真有可能把核弹扔出去

壹家言
2026-05-08 08:54:30
世乒赛一夜之间,欧洲2队全出局!亚洲3队进四强,国乒战韩国变阵

世乒赛一夜之间,欧洲2队全出局!亚洲3队进四强,国乒战韩国变阵

侃球熊弟
2026-05-08 08:38:36
浏阳烟花厂爆炸37人死亡,湖南省委书记召开调度会,现场全体默哀;芒果TV宣布《亲爱的·客栈2026》《乘风2026》《你好,星期六》推迟播出

浏阳烟花厂爆炸37人死亡,湖南省委书记召开调度会,现场全体默哀;芒果TV宣布《亲爱的·客栈2026》《乘风2026》《你好,星期六》推迟播出

大风新闻
2026-05-08 14:15:10
乌克兰击沉里海舰队导弹舰!摧毁全俄最大的两座炼油厂

乌克兰击沉里海舰队导弹舰!摧毁全俄最大的两座炼油厂

项鹏飞
2026-05-08 19:30:06
26年奇迹!罗马尼亚女队5人站球台上狂欢 工作人员花10分钟才修好

26年奇迹!罗马尼亚女队5人站球台上狂欢 工作人员花10分钟才修好

风过乡
2026-05-09 06:35:53
罕见不展示重型装备,严防乌克兰“突然袭击”,俄罗斯今天举行胜利日阅兵

罕见不展示重型装备,严防乌克兰“突然袭击”,俄罗斯今天举行胜利日阅兵

环球网资讯
2026-05-09 06:55:19
刚刚,一个卖扫地机的,把整个汽车圈整不会了

刚刚,一个卖扫地机的,把整个汽车圈整不会了

道哥说车
2026-05-08 10:10:00
气象专家回应“史上最热夏天”传言:2026年夏季或“相对偏热、高温天气多、体感阶段性较差”,南方和新疆更明显,但并非“灾难级夏天”

气象专家回应“史上最热夏天”传言:2026年夏季或“相对偏热、高温天气多、体感阶段性较差”,南方和新疆更明显,但并非“灾难级夏天”

极目新闻
2026-05-09 09:22:36
双方各执一词,和谈进程停滞,美伊在霍尔木兹海峡交火

双方各执一词,和谈进程停滞,美伊在霍尔木兹海峡交火

环球网资讯
2026-05-09 06:55:25
中国境内唯一一支外国军队,赶了50年赶不走,至今仍驻扎在北京

中国境内唯一一支外国军队,赶了50年赶不走,至今仍驻扎在北京

可乐爱微笑
2026-05-07 02:35:38
在香港募款336万被嘲“太寒酸” ,李亚鹏回应:刚好够救河南平顶山400多个孩子,这是老天安排

在香港募款336万被嘲“太寒酸” ,李亚鹏回应:刚好够救河南平顶山400多个孩子,这是老天安排

大风新闻
2026-05-09 08:35:19
2026-05-09 09:39:00
CreateAMind incentive-icons
CreateAMind
CreateAMind.agi.top
1394文章数 19关注度
往期回顾 全部

科技要闻

美国政府强力下场 苹果英特尔达成代工协议

头条要闻

媒体:沙特被美国激怒 海湾国家或将深化与中国关系

头条要闻

媒体:沙特被美国激怒 海湾国家或将深化与中国关系

体育要闻

他把首胜让给队友,然后用一年时间还清账单

娱乐要闻

古天乐被曝隐婚生子,新娘竟是她

财经要闻

白宫:特朗普计划5月14日至15日访问中国

汽车要闻

MG 4X实车亮相 将于5月11日开启盲订

态度原创

本地
游戏
房产
公开课
军事航空

本地新闻

用苏绣的方式,打开江西婺源

索尼承认第一方大作很拉胯!投入巨大却没赚到钱

房产要闻

豪掷6.8亿拿地!何猷君大手笔投资三亚!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美伊突然再次交火 伊朗外长:战争准备程度是1000%

无障碍浏览 进入关怀版