Bayesian Learning in Structural Dynamics: A Comprehensive Review and Emerging Trends
结构动力学中的贝叶斯学习:全面综述与新趋势
https://arxiv.org/pdf/2505.22223
摘要:
贝叶斯学习已成为结构动力学领域中一个引人注目且至关重要的研究方向,它提供了一种概率视角,用以理解和优化对复杂动力系统的分析。本篇前沿综述细致梳理了过去三十年间贝叶斯学习在结构动力学中的演进历程,阐明其核心原理、突破性方法及多样化的应用,这些内容已对该领域产生了深远影响。文章首先深入探讨贝叶斯理论的基础,厘清基本概念,并介绍推导后验分布的主要方法,重点详述三类方法:拉普拉斯近似、随机采样和变分推理。随后,本文探讨了结构动力学中两类贝叶斯学习的策略与实现方式:物理模型学习与数据驱动的统计模型学习。物理模型学习强调在通用贝叶斯框架内直接推理物理模型参数,用于系统识别与预测,并进一步扩展为三类方法:稀疏贝叶斯学习、分层贝叶斯学习和近似贝叶斯学习。另一方面,统计模型学习则将贝叶斯学习方法融入概率机器学习领域的数据驱动统计建模中,涵盖四大类别:贝叶斯非参数聚类、高斯过程、贝叶斯动态线性模型和贝叶斯神经网络。无论是物理模型还是数据驱动统计模型的推理,均广泛应用于模态分析、模型更新、损伤检测、可靠性更新、响应预测和模型选择等领域,凸显其在深化动力系统理解与支持决策过程中的关键作用。本文通过提出诸如代理模型和并行计算等技术路径,探讨如何提升贝叶斯推理效率,从而应对现有挑战。此外,文章还探索了估计后验分布的高级方法,讨论了非高斯与非平稳建模误差问题,并展望了在机器学习发展趋势背景下在线贝叶斯学习的前沿方向。与以往研究不同,本研究全面审视了传统与前沿的贝叶斯方法,不仅强调了贝叶斯方法所具有的变革性影响,更如一座灯塔,引导研究人员迈向新的进展与机遇,同时协助其针对结构动力学中的各类挑战,明智地选择并优化适用的方法。
关键词:贝叶斯推理;机器学习;结构动力学;系统识别;结构健康监测;不确定性量化;可靠性更新。
1 引言
作为社会的基石,工程结构肩负着为子孙后代服务的重大责任。然而,其耐久性可能因恶劣的环境条件、严苛的荷载作用以及维护不足而受到严重损害。因此,结构动力学作为一门关键学科应运而生,旨在保障这些重要结构的安全性与可靠性。这不仅包括通过动态响应测量精准识别结构系统中的关键参数并监测其运行状态[1, 2],也涵盖评估土木、机械及航空航天工程领域中的整体动力行为。多年来,众多研究人员致力于验证正向与反向结构动力学分析在现实问题中的适用性,取得了显著进展,这些成果已在诸多先前研究中得到全面综述[3-9]。尽管取得了这些进步与成就,结构动力学分析的发展尚未成熟,其中最紧迫的问题之一在于其结果缺乏充分的鲁棒性保障[2, 10],尤其在反问题或系统识别领域,因为传统方法通常仅限于确定性最优值,而忽视了参数的不确定性。因此,近年来人们愈发关注开发更具鲁棒性的算法,并构建系统性框架以应对结构动力学分析中的不确定性问题[2, 11-13]。
通常,动力学问题中涉及多种不确定性,例如源于信息不完整、物理现象建模不完善所导致的误差,以及测量噪声等[14]。抛开不确定性来源的多样性不谈,模型世界内各领域中的不确定性可划分为两类,即偶然不确定性(aleatoric uncertainty)与认知不确定性(epistemic uncertainty)(图1)[15]:
⚫ 偶然不确定性:此类不确定性源于数据固有的随机性或噪声[16],即使收集更多数据以优化模型也无法消除,包括同方差部分与异方差部分[17]。前者对于不同输入保持恒定,而后者则依赖于输入——某些输入可能比其他输入产生更嘈杂的输出。偶然不确定性体现了输入、输出及其相互依赖关系内在的随机特性。在结构动力学背景下,其来源包括材料属性与外部荷载的变异性、激励与动态响应的测量噪声、环境与运行条件的变异性(EOVs)、制造过程中的变异性、不恰当的数据预处理方法等。此外,偶然不确定性也可能由多个来源累积并传播至模型中。
⚫ 认知不确定性:此类不确定性源于对何种模型最适合描述给定数据缺乏认知[16],理论上,若收集足够数据以优化模型,则可消除此类不确定性。在工程问题中,认知不确定性的来源相似,可进一步划分为模型参数不确定性与模型结构不确定性[15]。例如,采用线性假设来建模非线性结构系统的动态响应,本质上会引入认知不确定性,这是由于对系统行为的认知尚不完整所致。
为应对结构动力学中普遍存在的不确定性,一种直观且常用的方法是应用统计推理,以考虑每个变量的概率分布。统计推理主要有两大途径,即“频率学派”方法与贝叶斯方法[19]。在“频率学派”统计中,概率被定义为长期极限相对频率[20];而在贝叶斯统计中,概率则被视为在信息不完整条件下对某一命题合理性的度量,该命题本身的真或假状态未知[21]。从贝叶斯视角出发,事件的概率可根据观测到的证据进行更新[22]。具体而言,贝叶斯理论解释的是在已观测到另一事件的前提下某一事件发生的概率,这与“频率学派”统计不同,后者无法根据观测结果反向估计概率。此外,在贝叶斯框架下,数据和模型参数均被赋予概率,从而构建了一个通过模型参数的概率分布系统性处理认知不确定性的框架。然而,尽管贝叶斯统计在处理不确定性方面具有优势,但在20世纪末之前并未被广泛接受,原因是当时普遍存在一种观念,即概率仅适用于偶然不确定性,而不适用于认知不确定性。自1950年代起,Cox[23, 24]与Jaynes[25, 26]致力于为贝叶斯方法建立严谨的逻辑基础,使其逐渐流行,成为统计推理与不确定性量化的数学方法,并随后在多个领域得到应用与研究。
另一方面,结构动力学分析主要有两种方法,即基于物理模型的方法与基于数据驱动统计模型的方法[1]。传统上,结构动力学分析依赖于被研究结构系统的物理或定律驱动模型(如有限元模型),如图2所示。后续分析任务则结合模型的详细物理描述与实际结构的实测数据完成[1]。贝叶斯推理于1990年代由Beck和Katafygiotis[27, 28]引入该框架。该方法提供了一种处理不确定性的方式,尤其适用于许多工程问题具有不可重复性的特点——这限制了从“频率学派”视角进行统计推理的能力。该方法的另一优势在于,模型参数的真实值通常未知,且估计结果往往不唯一,因此将概率解释为基于不完整信息的多值逻辑合理推理更为合理[29]。自这一开创性见解——将贝叶斯推理应用于结构动力学中的物理模型——提出以来,该领域在多年间取得了大量进展,服务于多种目的,包括传播不确定性以实现鲁棒的响应与可靠性预测[30, 31]、更新有限元模型参数[32, 33]、从一组竞争性模型类别中选择最优模型类别[14, 34],以及开展不确定性量化以获得更可靠的结构损伤诊断结果[35]。然而,由于对物理机制认知不完整,以及在描述如连接件和粘结等复杂系统组件时存在困难,构建精确的物理模型有时颇具挑战。这一局限促使了结构动力学中基于数据驱动统计模型方法的兴起[1],该方法直接利用实测数据构建数据驱动统计模型,以表征各类任务中的输入-输出映射关系。先进传感网络与机器学习(ML)技术的出现进一步推动了这些统计模型方法的发展。与此同时,在这些方法中也愈发强调贝叶斯推理的重要性,因为当不确定性未被正确认识或处理时,机器学习模型往往会产生过度自信但不准确的预测[2]。贝叶斯推理通过提供更稳健的不确定性估计框架,有效弥补了这些缺陷。
尽管贝叶斯方法在结构动力学中的应用日益广泛并取得了诸多成果,据作者所知,目前尚无一篇全面综述能够对这些贝叶斯方法进行系统分类,并明确其具体应用场景,特别是从物理模型与数据驱动统计模型的贝叶斯推理视角出发的综述。现有的综述文献主要聚焦于结构动力学中的特定技术或应用场景[32, 33, 36-39]。为填补这一空白,本文对物理模型与数据驱动统计模型的传统及前沿贝叶斯方法进行了系统性综述,并涵盖其在结构动力学各类任务中的应用。具体而言,我们详细介绍了贝叶斯定理,并探讨了估计后验分布的三种主流方法。此外,我们将结构动力学中的贝叶斯方法划分为两大类:针对物理模型的贝叶斯推理与针对数据驱动统计模型的贝叶斯推理。随后,我们深入探讨了这些方法在结构动力学若干核心任务中的应用,包括系统识别(SI)、模型更新、损伤识别和可靠性更新。针对每一项任务所设计的具体贝叶斯方法也进行了细致讨论,重点聚焦于先验分布的选择、似然函数的构建以及后验分布的估计。图3a展示了本综述所涵盖的结构动力学贝叶斯方法示意图,图3b则提供了本文结构的路线图。
本综述其余部分组织如下:第2节介绍贝叶斯推理框架的理论基础,以及估计后验分布的三种主流方法。在此基础上,第3节深入探讨用于物理模型的传统与前沿贝叶斯推理方法及其在结构动力学中的应用。第4节考察了当前在结构动力学中广泛应用的四种统计模型贝叶斯推理方法及其相关应用。第5节讨论了尚需未来努力解决的一些研究挑战,以及值得进一步探索的潜在方向。第6节通过强调贝叶斯方法在结构动力学中的优势、潜力与未解难题,对全文进行总结。
2 贝叶斯推理基础
2.1 贝叶斯定理
贝叶斯定理由托马斯·贝叶斯命名,是一种根据新证据重新校准概率分布的强大工具。它拥有悠久的历史,并在多个学科中具有广泛的应用,是现代统计学与概率论的基本支柱之一。若我们用 A 和 B 表示两个事件,则贝叶斯定理可推导如下:
贝叶斯定理提供了一种从系统测量数据中推导不确定系统模型的方法。基于概率逻辑,贝叶斯视角认为概率代表对某一陈述的置信程度。
在工程应用领域,贝叶斯定理通过融合新的观测数据,在深化我们对系统行为理解方面发挥着关键作用。这一过程通过参数识别实现,即为描述特定物理现象或系统的系列数学模型赋予未知参数的取值,并为参数识别选择合适的数学模型类别。在结构动力学中的物理模型学习或数据驱动统计模型学习领域,贝叶斯推理可表示为[27]:
利用贝叶斯定理,该方法建立了一个用于数据处理的基本框架,有助于得出与建模假设及概率原理一致的关于参数的结论。在一系列场景中[40],贝叶斯方法相较于非贝叶斯技术展现出显著优势,例如在为关键参数开发估计量存在挑战、需要对识别过程中的重大不确定性进行量化,以及处理识别结果与底层假设密切相关的情形下,需对影响进行量化或选择更优假设。通过将贝叶斯推理融入结构动力学分析,工程师和研究人员能够增强决策过程,容纳不确定性,并基于观测数据提高结构评估的准确性。
2.2 后验推理策略
在贝叶斯学习中,后验分布对于根据观测数据更新我们对模型参数值的信念起着核心作用。该分布综合了先验信念和数据中所包含的信息,反映了对这些参数不确定性的更新。然而,由于证据 p(D∣M)的不可解析性,直接计算后验分布可能具有挑战性。为应对这一难题,已发展出多种复杂的方法,以有效近似后验分布。这些方法对于使贝叶斯推理在广泛的应用中切实可行至关重要。主要方法包括拉普拉斯近似、随机近似和变分推理。这些方法代表了在贝叶斯学习中用于解决后验分布推断难题的最基础策略。通过近似后验分布,研究人员能够充分利用贝叶斯推理在不确定性量化和复杂问题决策中的强大能力。
2.2.1 拉普拉斯近似
拉普拉斯近似是贝叶斯统计中一种经典方法,用于用高斯分布近似后验分布,尤其适用于后验分布结构复杂、难以直接计算的情形。拉普拉斯近似的基本思想是,用多元高斯分布来近似后验分布在峰值(众数)附近的形状。这包括确定后验分布的众数,通常称为最大后验(MAP)估计,然后围绕该众数对对数后验进行二阶泰勒展开。由此得到的高斯近似简化了分布的形式,便于计算操作。
这种近似方法相比拉普拉斯近似能够处理更一般的情形,因为所生成的样本可以保证来自真实的后验分布[43],但其难点在于确保马尔可夫链的平稳性。此外,MCMC 方法在实际贝叶斯推理中常常效率低下。例如,当不确定变量在给定数据条件下高度相关,或后验概率密度函数(PDF)非常尖锐时,MH 算法可能效率不高[44]。
为解决精度问题和计算挑战,已提出许多其他随机模拟方法,通过减少模型运行次数、加速收敛来提升效率。由于本综述篇幅限制,此处仅简要概述几种典型方法:
过渡式马尔可夫链蒙特卡洛(Transitional MCMC, TMCMC)算法[45]旨在应对从复杂目标概率密度函数(PDF)采样的挑战,其策略是依次从一系列中间PDF采样,这些中间PDF逐步逼近目标PDF且更易于采样。与前述方法相比,TMCMC具有若干优势:该方法能渐近地生成服从后验PDF分布的样本,适用于广泛情形,包括多峰分布、尖锐概率密度函数以及在参数空间低维流形上具有平坦区域的概率密度函数。此外,该过程的副产品还能在不增加额外计算负担的情况下估计证据,这对于贝叶斯模型类别选择至关重要[45]。
哈密顿蒙特卡洛(Hamiltonian Monte Carlo, HMC)[46],也称为混合蒙特卡洛,是一种更先进的MCMC算法,专为更高效地处理高维问题而设计。它利用目标分布的梯度信息来引导建议步骤,从而实现更快的混合和更高效的采样,尤其适用于高维空间。与MH算法中类似随机游走的建议方式不同,HMC模拟一个具有动量的物理系统,并利用哈密顿动力学生成更贴近目标分布形状的建议样本。
更近的研究中,另一种被称为BUS(基于结构可靠性方法的贝叶斯更新,Bayesian Updating with Structural reliability methods)[47, 48]的方法被提出,用于有效更新机械及其他计算模型。该方法为通过子集模拟[49]实现高效求解提供了可能性,作为MCMC的替代方案。BUS框架将拒绝采样策略与结构可靠性方法相结合。其主要优势在于简单性,以及能够充分利用现有的结构可靠性技术及其相关软件进行贝叶斯更新。
2.2.3 变分推理
贝叶斯统计领域常涉及概率模型,其中隐变量的后验分布因高维积分或复杂依赖关系而难以甚至无法直接计算。传统的基于采样的方法(如MCMC)虽然准确,但在处理大规模数据集和高维模型时计算成本高昂且速度缓慢。为应对这些挑战,变分推理(Variational Inference, VI)作为一种更具可扩展性、确定性的替代方法应运而生[50, 51]。VI是一种确定性近似方法,通过最小化近似变分分布与真实后验之间的库尔贝克-莱伯勒(KL)散度,用一个变分分布来近似真实后验分布[43]。具体而言,假设变分分布记为 qϕ(ϖ),其包含一组自由参数 ϕ,则变分分布与真实后验之间的KL散度为:
因此,变分推理(VI)有效地将推断后验分布的目标转化为一个优化任务,其本质是在预测精度与模型复杂度之间寻找一个权衡[52]。
均场变分推理(Mean-field VI, MFVI)[43] 是变分推理中最基础且应用最广泛的形式之一。其核心思想是假设变分分布在各组隐变量之间可分解,从而使近似更具可处理性。每个隐变量或变量组被视为相互独立。基于均场假设的完全分解变分分布形式为:
该形式允许对每个因子的最优分布进行解析推导[43],其形式为:
随机变分推理(Stochastic Variational Inference, SVI)是另一种广泛用于后验估计的方法[51]。“随机”这一特性来源于其采用随机优化方法(如随机梯度下降 SGD)来最大化 ELBO。在许多实际应用中,数据集过大,无法完全加载到内存中,或难以在整个数据集上精确计算梯度。因此,SVI 通过对小批量(即数据的小型随机子集)进行操作,来估计具有噪声但高效的梯度,从而能够扩展到大规模数据集。SVI 可应用于多种概率模型,包括复杂的层次贝叶斯模型,在这些模型中精确推理通常是不可行的。一些对 SVI 的重要扩展包括自然梯度[51]、反向传播贝叶斯(Bayes by Backprop)[54] 和局部重参数化技巧[55]。传统上,这些方法也使用分解的变分分布,这使得 ELBO 的推导变得直接,但由于忽略了变分参数之间后验相关性,其近似能力受到限制。
变分推理提供了一个可适应多种模型的框架,包括非共轭模型(即后验分布没有闭式解的模型)。通过利用参数化分布和神经网络等不同模型,变分推理在选择近似后验分布方面具有灵活性,使其适用于广泛的问题。与其它近似方法相比,变分推理以其灵活性、可扩展性和计算效率脱颖而出,但仍存在进一步提升其近似能力的需求,同时不牺牲计算效率。
3 面向物理模型的贝叶斯推理及其在结构动力学中的应用
3.1 面向物理模型的贝叶斯推理方法
3.1.1 主流贝叶斯系统识别范式
贝叶斯推理方法在结构动力学中的引入可追溯至大约三十多年前[56]。自1998年以来,贝叶斯方法在结构动力学中的应用取得了显著发展,其标志性成果是Beck和Katafygiotis提出的开创性工作,他们建立了一个系统的贝叶斯推理框架[27, 28]。该框架自此成为本领域贝叶斯学习范式的基石,被众多研究团队和工程实践者广泛采纳与应用。
3.1.2 分层贝叶斯学习
分层贝叶斯学习通过引入多层级的概率结构,扩展了经典的贝叶斯框架。该方法在建模异质性数据、校准具有多个目标的复杂系统以及在统计模型中引入稀疏性方面尤为有益[57, 58]。分层贝叶斯学习引入了一层额外的超参数,这些超参数可以被整合到先验分布或随机模型(当与给定数据一起评估时也称为似然函数)中,从而形成两种不同的模型[59]。这两类模型主要区别在于其随机变量之间的结构依赖关系,如图5所示,其中箭头表示参数间的条件依赖关系,而没有入向箭头的节点则表示需要设定一个超先验分布。
该公式表明,由这些超参数表征的不确定性被整合进模型参数的后验分布中,从而深入揭示了整体不确定性,包括来自单个数据集的试验间变异性与识别不确定性。尽管 HSM 在建模不确定性方面具有显著优势,但如公式(14)所示,由于涉及大量参数,从该后验分布中采样仍面临挑战。
3.1.3 Sparse Bayesian learning
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.