度量图上的贝叶斯逆问题 Bayesian Inverse Problems on Metric Graphs
https://export.arxiv.org/pdf/2507.18951v1
![]()
摘要
本文研究度量图(metric graphs)上贝叶斯反问题的建模、适定性(well-posedness)与数值求解,其中图的边代表连接顶点的一维导线。我们聚焦于从带有噪声的解观测数据中恢复定义在度量图上的(分数阶)椭圆方程的扩散系数这一反问题。适定性依赖于正向模型的稳定性以及先验的适当选择。我们利用近期关于度量图上微分方程的正则性理论,建立了椭圆与分数阶椭圆正向模型的稳定性;对于先验,我们采用现代定义在度量图上的高斯 Whittle–Matérn 过程模型,其样本路径具有足够光滑性。数值实验结果表明,该方法能够实现高精度重构并有效量化不确定性。
关键词:度量图;(分数阶)椭圆反问题;贝叶斯方法;高斯 Whittle–Matérn 过程;适定性
1 引言
度量图上的微分方程被广泛用于建模各类现象,从道路交通网络中的车流 [5] 到介观系统、光子晶体和纳米技术中细长结构内的波动传播 [26]。这些及其他应用推动了对度量图上微分方程反问题的研究。本文聚焦于从带噪声的解观测中恢复(分数阶)椭圆偏微分方程(PDE)的扩散系数这一反问题。特别地,所要重构的未知扩散系数是定义在度量图各边上的函数。
我们将采用贝叶斯反问题方法 [24, 36, 10, 32],即对未知参数赋予先验分布,并基于观测数据进行条件化以获得其后验分布。在贝叶斯框架中,后验不仅提供未知参数的点估计,还能量化重构中的不确定性。此外,贝叶斯建模可带来某种形式的适定性:即当数据、先验或正向模型发生微小扰动时,后验分布也仅发生微小变化 [36, 28]。然而,贝叶斯反演的适定性同时依赖于正向模型的稳定性与先验的适当选择。当待重构参数为函数(本文的情形)时,确保适定性尤为微妙。
在欧氏区域中,函数空间中贝叶斯反演的适定性已得到广泛研究,参见例如 [36, 14, 28] 及其中参考文献。文献 [13, 17] 建立了椭圆与分数阶椭圆反问题的建模与适定性理论,这些模型已成为贝叶斯反演与不确定性量化理论和方法的标准测试平台。近期,[22, 21, 25] 研究了流形与点云上微分方程的贝叶斯反演与优化。类似地,[16, 18, 19] 将半监督学习表述为图上的贝叶斯反问题,其中顶点代表已标记和未标记的特征,边编码特征间的相似性;在此设定下,目标是对所有特征赋标签,这涉及为定义在顶点上的函数指定先验 [35],并基于已标记数据求后验。
据我们所知,本文是首篇研究度量图上贝叶斯反演建模与适定性的论文。我们的目标是从定义在边上的函数中恢复微分方程的未知参数。将欧氏空间、流形以及图上的理论推广至度量图情形远非直接可行:分段一维几何结构与顶点耦合条件引入了新的正则性与稳定性挑战。另一方面,由于度量图局部为一维,某些经典欧氏估计可被改进。我们基于 [3] 中近期发展的度量图微分方程正则性理论,分析了椭圆与分数阶椭圆反问题正向模型的稳定性。为确保适定性,我们采用 [9] 中引入并分析的、定义在度量图上的高斯 Whittle–Matérn 先验模型,其样本路径具有足够光滑性。
本文其余部分组织如下:第 2 节介绍度量图的背景知识;第 3 节介绍度量图上贝叶斯反演的建模;第 4 节包含我们的主要技术贡献——通过发展紧度量图上正向模型的新稳定性理论,我们建立了后验分布在 Hellinger 距离下对数据的连续依赖性;第 5 节报告了在字母形状度量图上椭圆与分数阶椭圆反问题的数值实验,结果表明该方法既能实现高精度重构,又能成功量化不确定性。相关代码已公开发布于:https://github.com/WenwenLi2002/Bayesian-Inverse-Problems-on-Metric-Graphs。最后,第 6 节总结全文并指出未来研究的开放方向。
2 背景
本节介绍度量图的必要背景知识,以及我们将在其中建立并分析度量图上贝叶斯反演问题的函数空间。
2.1 度量图与函数空间
设 Γ 为一个具有顶点集 V = {vᵢ} 和边集 E = {eⱼ} 的图。我们关注的应用场景中,边并非代表顶点之间的抽象关系,而是代表连接它们的物理一维导线。为建模此情形,我们为每条边 e ∈ E 分配一个正长度 ℓₑ > 0,然后任意地为每条边定向,并通过坐标 tₑ 将其等同于区间 [0, ℓₑ]。配备此结构的图 Γ 称为“度量图”,其度量自然由最短路径距离给出 [1]。度量图 Γ 上的一个一般点 x 可表示为 x = (e, tₑ),其中 e ∈ E 且 tₑ ∈ [0, ℓₑ]。因此,度量图上的点不仅包括顶点(此时 tₑ ∈ {0, ℓₑ}),也包括边上的中间点(此时 tₑ ∈ (0, ℓₑ))。在本文中,我们研究由有限个顶点和边组成的紧致度量图,且每条边均为有限长度。可以证明,配备其自然度量的度量图构成一个紧致度量空间 [1]。
定义在度量图 Γ 上的函数 f 可以表示为集合 {fₑ}ₑ∈E,其中 fₑ 是定义在边 e ≅ [0, ℓₑ] 上的函数。我们记作
![]()
度量图 Γ 上的函数空间可以通过各边上的函数空间来定义。例如,我们令 ²() 表示定义在边 ≅ [0, ℓₑ] 上的勒贝格平方可积函数空间,并定义:
![]()
在许多应用中,我们关注的是在每条边上具有更高正则性的整体函数。此外,可在顶点处施加适当的匹配条件——例如连续性条件或基尔霍夫型(Kirchhoff-type)条件——以确保各边上的函数被恰当地连接起来,从而在 Γ 上形成具有良好整体性质的函数。表 2.1 汇总了本文将使用的若干定义在 Γ 上的函数空间,包括定义在每条边上的空间和定义在整个图上的空间,以及它们相应的范数和对偶空间。这些函数空间共同为研究度量图上的微分方程提供了严格的数学框架。
![]()
此处,对于两个希尔伯特空间 ₁ ⊂ ₀,我们用 (₀, ₁)ₛ 表示通过 K 方法在 ₀ 与 ₁ 之间进行的实插值,其中 s ∈ (0,1) ——参见 [9, 附录 A]。此外,当 r ∈ ℕ 时,H̃ʳ(Γ) = ⨁ₑ∈E Hʳ(e) 是一个解耦的索博列夫空间,定义为各边上相应索博列夫空间的直和;而 H̃ʳ_C(Γ) 表示 H̃ʳ_C(Γ) = H̃ʳ(Γ) ∩ C(Γ),其中 r ∈ ℕ。特别需要注意的是,空间 H̃¹(Γ) 定义为每条边上 H¹(e) 空间的解耦直和,而空间 H¹(Γ) 则要求在整个度量图 Γ 上具有全局连续性。这一区别在研究 Γ 上的微分方程时至关重要,因为在顶点处施加连续性条件会影响解的解析性质。
2.2 量子图
当一个度量图配备了一个微分算子及适当的“顶点条件”时,它被称为“量子图”。我们首先在紧致度量图 Γ 上引入一个一般的二阶椭圆微分算子 ℒ。考虑一个在 Γ 上定义的足够光滑的函数 p。在局部上,对每条边 e ∈ E,算子 ℒ 作用于 p 的方式为:
![]()
![]()
![]()
3 反问题的建模
设 Γ 为(此处及全文中)一个紧致度量图。对于给定的 ≥ 1,考虑如下(分数阶)椭圆微分方程:
![]()
![]()
我们的目标是利用贝叶斯反问题方法 [24, 36, 14, 10, 32],从数据 y ∈ ℝᵐ 中恢复未知参数 u ∈ H³/²(Γ)。为此,我们将为 u 指定一个先验分布,并将其与由 (3.5) 确定的似然函数相结合,从而得到给定 y 条件下 u 的后验分布。在贝叶斯框架中,后验分布用于获取 u 的点估计值并量化重构中的不确定性 [32]。然而,在我们的度量图设定下,谨慎选择先验分布对于严格证明后验分布是一个定义良好的概率测度至关重要——该后验分布可表示为相对于先验的测度变换。我们将在第 3.1 小节介绍并说明我们对先验的选择。接下来,我们将在第 3.2 小节定义似然函数。最后,我们将在第 3.3 小节正式推导后验分布。在第 4 节中,我们将严格证明后验分布关于数据扰动是良定义且稳定的。
3.1 先验分布
我们将先验分布取为度量图上(广义)Whittle–Matérn 高斯过程的分布律 [9, 3]。具体而言,设先验为 ₀ = Law(),其中 是如下分数阶随机偏微分方程的解:
![]()
3.2 似然函数
基于上述数据生成过程,我们现在定义似然函数并引入相应的势函数。由于数据 取值于 ℝᵐ,且噪声 被建模为均值为零、协方差矩阵为 Σ ∈ ℝᵐ×ᵐ 的高斯随机向量,我们定义势函数如下:
![]()
3.3 后验分布
通过贝叶斯公式,将第 3.1 小节中引入的高斯 Whittle–Matérn 先验分布 ₀ 与第 3.2 小节中引入的似然函数相结合,我们可以形式化地推导出给定数据 时参数 的后验分布 ʸ,其表达式为:
![]()
后验分布 ʸ 可表示为相对于先验测度的测度变换,如式 (3.8) 所示;这一事实将在下一节中严格建立,其中我们还将证明后验分布在 Hellinger 距离下对数据的连续依赖性。
4 适定性理论
本节建立第 3 节所引入的贝叶斯反问题的适定性。主要结果是定理 4.5,该定理确立了后验分布的存在唯一性,以及其对数据扰动的稳定性。定理 4.5 的证明依赖于对正向映射稳定性(定理 4.1)和正向模型稳定性(定理 4.3)的细致分析。
4.1 主要结果
本文的主要技术贡献如下述定理所示,该定理给出了椭圆( = 1)与分数阶椭圆( > 1)反问题正向映射的稳定性结果。我们回顾: 控制第 3.1 小节中引入的先验分布 ₀ 样本的正则性(参见命题 3.4),而 表示微分方程 (3.1) 的右端项。定理 4.1 的证明推迟至第 4.2 小节。
![]()
![]()
![]()
![]()
![]()
4.2 正向映射的稳定性
本小节包含定理 4.1 的证明。在第 4.2.1 小节中,我们研究 = 1 的情形,此时正向映射对应一个椭圆问题。接着,在第 4.2.2 小节中,我们建立 > 1 情形下的结果,此时正向映射对应一个分数阶椭圆问题。分数阶椭圆问题的证明利用了椭圆问题的结果。
4.2.1 椭圆问题
当 = 1 时,定理 4.1 的证明结构与文献 [13] 中类似,该文献证明了欧氏空间中椭圆问题正向映射的稳定性。然而,要将该分析推广到我们的度量图设定下,需要进行一些技术上的调整。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
5 数值实验
在本节中,我们展示了紧致度量图上椭圆与分数阶椭圆贝叶斯反问题的数值解法。第 5.1 小节详细说明了算法实现,而第 5.2 和 5.3 小节分别呈现了椭圆与分数阶椭圆问题的数值结果。我们比较了最大后验(MAP)估计器与后验均值估计器的精度(参见例如 [32] 中的定义)。此外,我们通过图上各点的后验边际标准差来探索不确定性的量化。
5.1 实现方法
我们在一个自然嵌入于 ℝ² 的字母形状度量图上进行研究(参见例如 图1),并采用第 3 节中介绍的贝叶斯框架。对于由方程 3.1 导出的正向映射,我们设 κ = 1,且 f(x) = z₁²(x) − z₂²(x),其中 (z₁(x), z₂(x)) 表示点 x ∈ Γ ⊂ ℝ² 的笛卡尔坐标。我们同时考察标准椭圆情形(β = 1,见第 5.2 小节)和分数阶椭圆情形(β = 3/2,见第 5.3 小节)。参数 u 的先验是一个 Whittle–Matérn 高斯场,如公式 3.6 所规定,光滑性参数 α = 1,该选择的有效性由备注 3.5 保证。我们进一步取 κ₀ = √0.2 · 2/3 且 a = 0.2,这在 MetricGraph R 包 [8] 的设定下对应相关长度为 3。
我们将字母形状度量图划分为精细网格,并使用文献 [2] 中引入并在 rSPDE [7] 和 MetricGraph [8] R 包中实现的有限元方法对正向模型和先验进行离散逼近。由于我们选取 α = 1,随机场 u 可通过文献 [6] 中的方法精确模拟;然而,由于我们对正向问题进行了离散化,我们也采用文献 [3] 中提出、并在文献 [4] 中进一步改进的 u 的有限元近似方法。为平衡精度与计算效率,我们在椭圆问题中采用网格尺寸 h = 0.05,在分数阶情形中采用 h = 0.2,从而降低分数阶情形下的计算成本。对于后一种情况,我们采用文献 [2] 中基于算子的方法。
椭圆与分数阶椭圆问题所用的网格点数分别为 1,998 和 507。在每种情况下,我们从先验分布中抽取一个(离散化的)真实参数 u₀,并通过对数值计算得到的真实解 p₀ 在所有网格点处求值,再添加一个空间变化的观测噪声项,获得逐点观测数据。具体而言,在每个网格点处,我们设定
![]()
![]()
其中,nrel = 0.05 控制相对噪声水平,而 n_abs = 0.10 确保即使当 p₀[i] 较小时,仍存在不可忽略的噪声基底。这种混合噪声模型在大尺度和小尺度上均能产生有意义的不确定性,并有助于避免在 p₀ 取值范围较广时使用单一固定噪声水平所导致的似然函数病态问题。
对于后验采样,我们采用预条件 Crank–Nicolson (pCN) MCMC 方法 [11],该方法在提议分布中保持高斯先验结构,并仅将接受率中的后验与先验之比作为唯一变量,从而避免显式计算协方差矩阵的逆。pCN 方法具有与离散化无关的收敛速率(一致谱间隙),这一点已在文献 [20] 中得到证明;另见文献 [16] 对非度量图上 pCN 方法的研究。此处,我们进一步引入一种简单的自适应步长 τ 更新策略,以平衡接受率与探索能力,并应用温度退火技术以加速马尔可夫链的收敛;关于蒙特卡洛方法退火策略的介绍,请参见文献 [31, 第7章]。该过程在下面的算法 5.1 中予以概述。
![]()
5.2 字母形状度量图上的椭圆问题
![]()
![]()
![]()
5.3 字母形状度量图上的分数阶椭圆问题
在分数阶椭圆情形中,我们设定正则性参数 = 3/2,并采用与第 5.2 小节相同的计算流程。图 3 显示,MAP 估计器与后验均值估计器均与真实参数高度吻合,其均方根误差(RMSE)低于 0.08。图 4 展示了基于 MCMC 样本计算得到的后验边际标准差;与椭圆情形类似,高边际标准差的区域与重构误差较大的区域一致。
![]()
![]()
6 结论
本文研究了度量图上贝叶斯反问题的建模、适定性与数值求解,重点聚焦于椭圆与分数阶椭圆反问题。我们利用近期发展的度量图上高斯过程模型来构建先验,并基于度量图上偏微分方程的最新正则性理论,建立了正向模型的稳定性。数值实验表明,该方法能够实现高精度重构,并有效量化不确定性。
本工作引出若干未来研究方向,包括:(1) 研究度量图上其他类型偏微分方程的贝叶斯反演,这很可能需要发展新的正则性理论与稳定性估计;(2) 构建度量图上的新型先验模型 [5],例如用于几何反问题的水平集(level-set)方法 [23];(3) 研究正向模型与先验的数值离散化对后验的影响 [33, 34],这将推动度量图上偏微分方程新求解器的设计与分析。
原文链接:https://export.arxiv.org/pdf/2507.18951v1
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.