生成式 AI 驱动的贝叶斯校准全局敏感性分析
Bayesian-calibrated global sensitivity analysis for mathematical models using generative AI
https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1013312
研究背景与核心问题
- 传统GSA的独立性假设困境:经典的全局敏感性分析(GSA,如Sobol方差分解法)普遍假设模型输入参数相互独立。但在实际科学建模(尤其是健康与生物领域)中,经贝叶斯校准的模型参数往往存在强相关性与高维依赖结构。
- 违背假设的后果:当参数相关时,传统蒙特卡洛估计量会产生偏差,导致敏感性排序失真,进而误导模型简化、参数筛选或干预策略设计。
- 理论可行但计算困难:Rosenblatt变换与Shapley效应在理论上可处理相关性,但均依赖从高维复杂联合分布中进行精确的条件采样,实现门槛极高。
- 代理方法的假设束缚:Copula等现成方法虽便于条件采样,但强加了对称性、线性依赖等限制,且在高维场景下易受“维度灾难”影响,难以刻画真实数据的复杂依赖模式。
本文提出一种基于生成式AI的贝叶斯校准全局敏感性分析新范式,核心思想是将GSA重构为直接在贝叶斯后验分布上执行的“校准后任务”:
- 数据驱动的依赖学习:利用生成模型直接从贝叶斯后验样本中学习参数的联合分布与条件分布,彻底摒弃对参数独立性或预设依赖结构的限制。
- 双路径技术实现
- 采用**自回归架构(Autoregressive Models)**实现Rosenblatt变换,将相关分布映射为独立均匀分布,兼容传统Sobol指数计算。
- 采用**扩散模型(Diffusion Models)**高效估计Shapley效应,通过条件生成自然处理任意参数子集的边际贡献。
- 计算解耦潜力:将模型输出作为目标联合分布的附加特征同步建模,有望将敏感性分析与昂贵的前向模型仿真解耦,显著降低计算开销。
- 真实性与可解释性:所得敏感性指数反映的是“经贝叶斯校准、与观测数据一致”的参数影响力,而非抽象未校准模型的纯数学结构敏感性。
- 高维非线性适应性:无需预设分布族(如高斯假设),可自适应捕捉复杂、非高斯、强耦合的参数依赖关系。
- 灵活可扩展:框架兼容各类贝叶斯校准的确定性模型,计算复杂度随数据规模与模型维度平滑增长,具备工程落地潜力。
- 严格理论衔接:经验估计量兼具“后验权重导数”的精确操作定义与“总体敏感性一致无偏估计”的统计性质。
- 在两个典型健康科学模型上完成实证验证:
- 新冠疫情传播模型
- 癌症免疫治疗动力学模型
- 实验表明:该方法在参数强相关设定下仍能精准识别关键驱动参数,且在计算效率、方法灵活性与结果稳健性上显著优于传统Copula或近似采样方案。
- 打通了贝叶斯不确定性量化、生成式建模与系统敏感性分析的理论链路,为数据驱动型复杂系统建模提供了可解释性新工具。
- 生成式范式具备天然扩展性,未来可向随机微分方程模型、基于智能体(Agent-based)模型的分布级敏感性分析延伸,助力现代生物医学、气候建模与工程系统的高保真决策支持。
如需进一步提炼为PPT汇报要点、绘制技术路线图,或补充具体数学公式/算法流程的对应关系,可随时告知。
![]()
摘要
我们提出了一种生成式建模框架,用于在具有强相关性且可能高维的参数复杂系统中进行全局敏感性分析(GSA)。传统的基于方差的 GSA 方法依赖于输入参数独立的假设,而这在贝叶斯校准的模型中很少成立。尽管近期基于 Rosenblatt 变换和 Shapley 效应的扩展方法在理论上解决了这一局限,但其实现需要从相关联合分布中进行精确的条件采样,这一任务仍具挑战性。现有解决方案对输入依赖性施加了限制性假设,从而限制了其在复杂数据驱动问题中的适用性。我们的方法通过将敏感性分析重构为贝叶斯后验分布上的校准后任务来应对这些挑战:参数相关性通过生成式模型从数据中学习,从而消除了对依赖关系的限制性假设,并确保敏感性估计与数据相关。我们采用自回归架构来实现 Rosenblatt 变换,并利用扩散模型来估计 Shapley 效应。这些方法无需预设分布假设,且能随数据量和模型复杂度高效扩展。我们在两个代表性应用中验证了该方法的有效性:新冠病毒传播模型和癌症免疫治疗模型。结果表明,我们的方法能在参数存在相关性的情况下有效捕捉参数敏感性,并在可扩展性和灵活性方面较现有方法取得显著提升。
作者总结
在本研究中,我们引入了一种使用生成式 AI 对生物模型进行全局敏感性分析的新方法。我们的方法与贝叶斯推断完全兼容,而贝叶斯推断被广泛用于生物系统的参数校准。与传统敏感性分析假设参数独立或施加简化依赖结构不同,我们的方法直接在贝叶斯校准的后验分布上进行敏感性分析,其中参数相关性是从观测数据中学习得到的。因此,所得的敏感性分析反映的是真实的、与数据相关的参数敏感性,而非抽象模型的纯结构敏感性。所提出的框架具有灵活性、可扩展性,并广泛适用于各类通过贝叶斯方法校准的确定性模型。此外,该方法的生成式特性为未来扩展至随机模型或基于代理模型的分布敏感性分析铺平了道路,增强了其在现代生物应用中的潜力。
引言
数学建模、贝叶斯推断和敏感性分析是跨不同科学领域开展复杂数据驱动型研究项目的重要工具。健康科学等学科中的现实问题经常使用数学模型进行分析,因为它们能够抽象复杂的系统行为,并通过参数化方程对其进行描述。这些模型使研究人员能够模拟和预测系统如何响应变化的条件,从而为其底层动力学提供有价值的见解。这些预测可靠性的核心在于模型参数的准确估计,这一任务可通过贝叶斯推断有效解决 [1]。这种统计方法利用观测数据更新关于参数值的先验信念,生成一个同时捕捉参数不确定性和相互依赖性的后验分布。基于参数估计,我们随后可以进行敏感性分析,以识别哪些参数对模型结果的影响最大。
在敏感性分析的广泛范畴内存在多种方法。例如,局部敏感性分析侧重于评估施加于单个模型参数的小扰动所产生的影响,而全局敏感性分析(GSA)则考察在指定范围内同时改变多个参数所产生的影响。本文聚焦于一种 GSA 方法,即基于方差的 Sobol 方法 [2]。该方法通过估计可归因于每个单独输入参数变化及其相互作用的输出方差比例,来量化参数敏感性。由此产生的一阶(个体)和高阶(交互)指数提供了对参数影响力的全面度量。由于其稳健性和可解释性,Sobol 方法已在各个领域得到广泛应用,如下列研究所示 [3–5]。
尽管用途广泛,但在现实世界的数学模型上估计 Sobol 敏感性指数面临着重大挑战,这主要是由于在给定观测数据条件下,模型参数的贝叶斯后验分布中嵌入了错综复杂的相关性。传统的 Sobol 方法通常假设输入参数是独立的,而现实世界系统往往表现出源于模型结构与数据交互的复杂高维依赖性。这些依赖性限制了该方法的适用性,因为当独立性假设被违背时,相应的蒙特卡洛估计量会产生偏差,可能导致关于参数敏感性的误导性结论。为解决这一问题,已提出多种方法。例如,Rosenblatt 变换可用于将任何复杂的联合分布映射为单位超立方体上的独立均匀变量,从而能够使用传统的 Sobol 方法 [6]。尽管该方法在理论上对任意复杂的分布都成立,但其实际实现需要近似一系列条件密度函数,这绝非易事。另一种替代方法采用合作博弈论中的 Shapley 效应来量化相关性下的输入敏感性 [7]。Shapley 效应通过平均每个输入在所有可能参数子集上的边际贡献,自然地容纳了依赖性。然而,估计 Shapley 效应同样依赖于从联合分布的任意子集中进行条件采样,面临着类似的计算挑战。从这些例子可以清楚地看出,从模型输入的条件分布中进行准确采样是执行 GSA 的核心。现有的基于 Copula 的方法因其实际应用的简便性而受到关注 [8]。通过将边缘分布与依赖结构分离,只要 Copula 函数能准确表示相关结构,Copula 就允许进行非常高效的条件采样。在实践中,高斯 Copula 被广泛使用,但施加了限制性假设(如对称和线性依赖),这可能无法对输入之间的复杂依赖关系进行建模。此外,由于维数灾难,它们在高维设置中可能会失去准确性 [9]。
生成式人工智能的最新进展为在全局敏感性分析中从复杂的条件参数分布中进行准确采样提供了一个有前景的解决方案。诸如自回归模型(顺序建模变量依赖性)和基于扩散的方法(学习联合分布并生成灵活的条件样本)等方法,在捕捉高维、非高斯分布方面展现出了卓越的能力 [10]。受生成式模型灵活性和可扩展性的启发,我们提出将 GSA 重新构建为一项直接在贝叶斯后验分布上执行的校准后任务,其中参数相关性自然产生于模型结构与观测数据之间的交互。通过使用生成式模型从后验样本中学习联合和条件参数分布,所提出的框架消除了限制性的独立性或依赖性假设。此外,通过将模型输出与输入一起作为目标联合分布的附加特征纳入,该方法有可能将敏感性分析与重复的正向模型评估解耦,从而在模型评估成本高昂时减轻计算负担。因此,所得的敏感性指数反映的是真实的、经贝叶斯校准的参数敏感性,而非抽象的、未经校准模型的纯结构敏感性。
在本文中,我们探讨如何利用生成式模型对经贝叶斯校准的数学模型进行 GSA。“材料”部分提供了数学建模框架、贝叶斯数据校准和 Sobol 敏感性分析的背景。“方法”部分介绍了所提出的用于 GSA 的生成式建模方法。“案例研究结果”部分通过数值实验验证了该方法,包括合成基准测试和健康科学中的现实世界应用。
。。。。。。。。。。
原文链接:https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1013312
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.