Bayesian Parameter Shift Rule in Variational Quantum Eigensolvers
变分量子本征求解器中的贝叶斯参数偏移规则
https://arxiv.org/pdf/2502.02625
摘要
参数移位规则(PSR)是变分量子本征求解器(VQE)中高效梯度估计的关键技术。在本文中,我们提出了其贝叶斯变体,即利用具有适当核函数的高斯过程来估计VQE目标函数的梯度。我们的贝叶斯PSR能够根据任意位置的观测数据灵活地进行梯度估计,并提供不确定性信息,在特定情况下可退化为广义PSR。在随机梯度下降(SGD)中,贝叶斯PSR的灵活性允许重用先前步骤中的观测数据,从而加速优化过程。此外,得益于后验不确定性的可获取性,结合我们提出的梯度置信区域(GradCoRe)概念,我们能够在每次SGD步骤中最小化观测成本。我们的数值实验表明,结合贝叶斯PSR与GradCoRe的VQE优化方法显著加快了SGD的收敛速度,并优于当前最先进的方法,包括序列最小优化方法。
引言
变分量子本征求解器(VQE)(Peruzzo 等,2014;McClean 等,2016)是一种混合量子-经典算法,用于近似求解给定物理系统哈密顿量的基态。VQE的量子部分利用参数化量子电路生成试探量子态,并测量哈密顿量的期望值(即能量),而经典部分则基于量子设备提供的含噪声观测数据进行能量最小化。只要参数化量子电路能够准确逼近基态,最小化后的能量就能给出哈密顿量基态能量的一个紧致上界。
量子设备中的观测噪声来源于多个方面。其中一种噪声是测量采样噪声(shot noise),它源于量子测量的统计特性——测量结果遵循量子态所规定的概率分布,而有限次采样会引入波动。由于这种噪声是随机且独立的,可以通过增加测量采样次数来降低,其方差与采样次数成反比。另一种噪声来源于量子硬件的不完美性,近年来通过硬件设计(Bluvstein 等,2023)、误差缓解技术(Cai 等,2023)、量子纠错(Roffe,2019;Acharya 等,2024)以及机器学习方法(Liao 等,2024;Nicoli 等,2025)已逐步得到抑制。在本文中,我们不考虑硬件噪声,这在开发优化方法的相关研究中是常见的做法(Nakanishi 等,2020;Nicoli 等,2023b)。
随机梯度下降(SGD)、序列最小优化(SMO)和贝叶斯优化(BO)此前已被用于最小化VQE的目标函数。在一些温和假设下(Nakanishi 等,2020),该目标函数具有特殊的数学性质。基于这些性质,SGD方法可以利用所谓的参数移位规则(PSRs)(Mitarai 等,2018)来估计梯度;而专门设计的SMO方法(Platt,1998),即Nakanishi-Fuji-Todo(NFT)方法(Nakanishi 等,2020),能够在每次迭代中仅通过少量观测实现一维子空间优化。Iannelli 与 Jansen(2021)将贝叶斯优化应用于VQE,将其视为带噪声的全局优化问题进行求解。
尽管高斯过程(GPs)(Rasmussen & Williams,2006)在VQE中常被用作贝叶斯优化的代理函数(Frazier,2018),但它们也被用于改进基于SGD和基于SMO的方法。Nicoli 等(2023a)提出了“VQE核”——一种反映VQE物理特性的信息驱动核函数,并将SMO与BO结合,采用“置信区域内期望最大改进”(EMICoRe)采集函数,从而在每次SMO迭代中识别出在量子计算机上最值得测量的最优位置。Tamiya 与 Yamasaki(2022)结合SGD与BO,提出随机梯度线搜索贝叶斯优化(SGLBO),利用BO在每次SGD迭代中确定最优步长。Anders 等(2024)提出了“置信区域子空间”(SubsCoRe)方法,该方法基于每次SMO迭代中的后验不确定性估计,最小化观测成本。
在本文中,我们采用一种不同的方式来利用高斯过程,提出了一种贝叶斯参数移位规则(Bayesian PSR),其中使用带有VQE核的高斯过程来估计VQE目标函数的梯度。当观测在指定位置进行时,贝叶斯PSR退化为PSR的一种正则化变体。然而,我们的方法相较于现有PSR方法(Mitarai 等,2018;Wierichs 等,2022)具有显著优势:更高的灵活性以及对不确定性信息的直接获取能力。更具体地说,贝叶斯PSR可以利用任意位置的观测数据,从而允许在SGD的后续迭代中重用之前步骤的观测结果。重用历史观测数据并结合新观测,可提升梯度估计的准确性,从而加速优化过程。此外,不确定性信息可用于在每次SGD迭代中自适应地调整观测成本——与Anders 等(2024)的思路类似——在保持所需精度水平的同时,显著降低获取新观测的成本。我们通过引入一种新的“梯度置信区域”(GradCoRe)概念来实现这一自适应观测成本策略:即梯度估计的不确定性低于某一预设阈值的区域(见图1)。我们的实验评估表明,所提出的贝叶斯PSR改进了梯度估计器,而结合GradCoRe的SGD方法在性能上优于包括NFT及其变体在内的所有现有最先进方法。
本文的主要贡献总结如下:
我们提出了贝叶斯PSR,这是现有PSR的一种灵活变体,能够提供不确定性信息;
我们从理论上建立了贝叶斯PSR与现有PSR之间的关系,揭示了一阶PSR中移位参数的最优性;
我们引入了梯度置信区域(GradCoRe)的概念,并提出了一种用于SGD优化的自适应观测成本策略;
我们通过数值实验验证了理论,并实证展示了所提出的贝叶斯PSR与GradCoRe的有效性。
相关工作:寻找变分量子电路的最优参数集是一个具有挑战性的问题,这促使人们开发了多种方法来改进VQE中的优化过程。VQE中的基于梯度的方法通常依赖于参数移位规则(PSRs)(Mitarai 等,2018;Wierichs 等,2022),这些规则能够对量子电路输出相对于其参数的梯度进行合理准确的估计。Nakanishi 等(2020)提出了一种序列最小优化(SMO)(Platt,1998)算法,称为NFT,该算法在SMO的每一步中通过进行少量观测,对一个参数进行解析最小化。Nicoli 等(2023a)将NFT与高斯过程(GP)和贝叶斯优化(BO)相结合,设计了一种受物理启发的GP回归核函数,并提出了基于“置信区域”(CoRe)概念的EMICoRe采集函数。该方法通过利用前几步观测的信息,来确定下一步应进行观测的最优位置,从而改进了NFT。Anders 等(2024)同样利用了CoRe的概念,提出了SubsCoRe方法,该方法不再优化观测位置,而是确定实现CoRe所定义的所需精度所需的最少测量采样次数。该算法最终收敛到与NFT相同的能量,但量子计算成本更低,即在量子计算机上的总测量采样次数更少。Tamiya 与 Yamasaki(2022)将SGD与BO相结合,以应对标准SGD方法过高的成本,并利用BO通过寻找最优步长来加速收敛。相关地,近期研究(Jiang 等,2024)开始将高斯过程与误差缓解技术相结合,进一步凸显了贝叶斯方法在含噪声中等规模量子(NISQ)设备(Preskill,2018)上的潜力。
本文其余部分结构如下:第2节简要介绍高斯过程(GPs)和VQEs的相关背景知识;第3节提出我们的贝叶斯PSR,并建立其与现有PSR之间的理论联系;第4节基于贝叶斯PSR和GradCoRe提出我们新颖的基于SGD的算法;第5节描述实验设置并展示数值实验结果;最后,第6节总结研究发现并展望未来研究方向。
2. 背景
此处我们简要介绍高斯过程(GP)回归及其导数,以及具有已知性质的变分量子本征求解器(VQE)。
2.1. 高斯过程回归与导数高斯过程
3. 贝叶斯参数偏移规则
我们提出了贝叶斯参数偏移规则(Bayesian PSR),它通过高斯过程(GP)后验(公式8)以及VQE核(公式15)及其导数(公式6和公式7)来估计VQE目标(公式9)的梯度。贝叶斯PSR的优势包括以下几点:
梯度估计器具有解析形式。
可以使用任何一组点的观测值进行估计。
对于异方差噪声观测(从贝叶斯的角度来看),只要适当设置核参数的先验,γ和σ0^2,估计就是最优的。
可以在进行观测之前解析计算后验不确定性。 在第4节中,我们提出了利用贝叶斯PSR优势的新型随机梯度下降(SGD)求解器用于VQE。 正如自然预期的那样,我们的贝叶斯PSR是现有PSR的推广,并且在无噪声和等距观测的情况下简化为一般PSR(公式12)。设1D ∈ RD为所有条目都等于一的向量。
4 带有贝叶斯PSR的随机梯度下降(SGD)
4.1. 梯度置信域(GradCoRe)
5. 实验
5.1. 实验设置
我们在与Nicoli等(2023a)相同的研究设置下,展示了所提出的贝叶斯PSR和GradCoRe方法的性能。在所有实验中,我们准备了50个不同的随机初始点,所有优化方法均从这些初始点开始优化。我们的Python实现使用Qiskit(Abraham等,2019)对量子硬件进行经典模拟。用于复现实验结果的代码作为补充材料提供。
哈密顿量与量子电路:我们研究具有开放边界条件的量子海森堡哈密顿量,
5.2. 贝叶斯PSR和GradCoRe对SGD的改进
5.3. 与最新方法的比较
图4比较了GradCoRe与基线方法,包括SGLBO、Bayes-NFT、EMICoRe和SubsCoRe。我们的GradCoRe,如在图3中显著改进了SGD,确立了自己为新的最先进方法,展现出更快的收敛速度,并实现了更低的整体能量。
6. 结论
变分量子本征求解器(VQEs)的物理特性使我们能够使用专门的优化方法,即带有参数偏移规则(PSRs)的随机梯度下降(SGD)和一种专门的序列最小优化(SMO),称为NFT(Nakanishi等人,2020年)。最近的研究表明,这些特性可以通过物理信息丰富的VQE核适当捕捉,通过贝叶斯机器学习技术成功改进了NFT。例如,先前SMO迭代中的观测值被用来确定最优测量点(Nicoli等人,2023a年),并且基于不确定性预测最小化观测成本(Anders等人,2024年)。在本文中,我们已经展示了类似的方法也可以改进基于SGD的方法。具体来说,我们提出了贝叶斯PSR,其中梯度是通过导数高斯过程(GPs)估计的。贝叶斯PSR将现有的PSRs推广,允许从任意一组位置的观测中灵活估计。此外,它提供了不确定性信息,这使得通过新颖的梯度置信域(GradCoRe)概念适应观测成本成为可能。我们的理论分析揭示了贝叶斯PSR和现有PSRs之间的关系,而我们的数值调查实证展示了我们方法的效用。我们预见,贝叶斯方法将促进更有效的VQEs算法的发展,更广泛地说,是量子计算。在未来的工作中,我们旨在探索现有方法和策略的最佳组合,以选择最适合特定任务的方法,即特定的哈密顿量。
https://arxiv.org/pdf/2502.02625
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.