面向贝叶斯推理的单次量子机器学习端到端优化
End-to-end Optimization of Single-Shot Quantum Machine Learning for Bayesian Inference
https://arxiv.org/pdf/2512.20492
![]()
我们提出了一种量子机器学习的端到端优化策略,该策略直接针对有限测量资源下的性能表现,其中学习目标直接定义在任务性能层面。该方法应用于贝叶斯量子计量任务,因为该任务提供了一个具有已知基本极限和随系统尺寸变化的自然测试平台。这种具有采样意识的混合算法在使用32个量子比特的情况下,实现了单次测量风险在贝叶斯极限(-20 dB)内的1 dB范围内。我们将贝叶斯框架从参数估计扩展到全局函数推断,任务是推断从任意先验分布中抽取的传感器输入的目标函数,并证明了直接函数推断相比于间接重建在计算和感知方面具有明显优势。我们将相应的贝叶斯风险与容量度量联系起来,并认为可分辨表达容量为单次测量中可访问的函数空间提供了一个自然的度量。由此产生的特征任务分析识别出具有噪声鲁棒性的特征组合,这些组合能够在资源受限或实时设备端设置中产生更紧凑的估计器,提高精度并降低优化成本。
I. 引言
在量子硬件上进行训练和推理本质上受到有限相干时间、有限测量资源、受限的物理编码以及硬件行为与理想化数值模型之间不可避免的不匹配的限制。在本工作中,我们特别关注由有限采样引起的限制,这构成了近期量子机器学习的主要且不可避免的瓶颈。量子机器学习(QML)中常见的方法是在理想化、有效无限次测量的假设下优化目标损失函数,然后仅在施加有限次测量时评估性能。这种分离有两个关键缺点。首先,正如现在已广泛认识到的那样[1],它掩盖了实现的真正硬件成本:在无限采样极限下最优的模型可能需要过大的测量预算来实现该性能,严重限制了它们的实际可用性。其次,更微妙的是,优化问题本身的结构在有限测量资源下可能会发生定性的变化,因此在理想化极限下找到的解在采样受限时可能无法达到或不是最优的。尽管最近的研究表明,有限次测量噪声在某些情况下可以作为一种随机正则化器,辅助基于梯度的优化[2],但这种观点仍将采样噪声视为偶然的而非基础性的。在这里,我们采用了一种端到端的方法,其中估计器、训练动态和推理过程被明确地针对固定且有限的采样预算进行优化。通过直接在量子设备上进行优化,并将硬件视为一个噪声输入-输出映射,我们开发了一个量子机器学习框架,其性能与现实实验约束内在匹配,而不是从理想化极限外推而来。
我们的方法建立在最近物理神经网络(PNN)理论的发展[3, 4]之上,并将其适应于在严格测量约束下对基于量子比特的设备进行优化。在PNN视角中,设备被视为一个黑箱,其可分辨的输出函数可以直接通过采样来表征。这种观点也直接解决了模型与硬件之间的不匹配问题:最优估计器由实际设备和测量条件定义,而不是由理想化的数值替代品定义。
在QML应用中,评估量子基底相对于经典基底所赋予的优势的一个核心挑战在于缺乏一个系统框架来确定量子力学所允许的基本极限。同样重要的是一个方法论,用于在等价资源约束下系统地比较其性能与经典基底的性能。我们发现,将基于QML的框架应用于贝叶斯量子计量(BQM)为应对这一挑战提供了一个严谨的基础,因为(1)存在一个成本函数,其随系统尺寸变化的行为和性能可以推导和计算,(2)原则上可以与在经典极限下运行的等价传感器类别进行比较分析。我们在这里提出了一个应用这种一般策略的方法。
从量子计量的角度来看,基于PNN的方法提供了一种数据驱动的方法,自然地适应于给定物理传感器的控制和测量资源。可访问资源态的限制、可用哈密顿相互作用以及读出保真度常常形成瓶颈,需要复杂的技巧来接近海森堡极限[5–7],这是通过线性量子测量可达到的最终极限,如最近的研究所示,这些研究利用了集体态协议而不进行单粒子检测[8]、基于压缩超辐射的读出方案[9]以及通过量子纠缠增强的计量[10]。PNN框架通过直接在设备的物理约束内进行优化,使用传感器在采样信号时生成的数据,提供了一种补充途径。这种方法的有效性已在变分量子计量[11, 12]中得到证明,这些方法不仅可用于制备计量上有用的纠缠资源态,还可用于产生能够有效地将纠缠态的参数依赖性集中到易于测量的简单可观测量中的解码器。最近的一项实验在一个囚禁离子平台上提供了原理验证,证明这种方法可以非常有效[13]。
![]()
在不同物理基底之间进行合理比较需要一个量化指标,用于衡量在固定资源下可分辨的函数空间。在参考文献[3]中引入的可分辨表达容量(REC)提供了这样的度量。对于单次测量预算,它在目标函数为线性且先验为高斯分布时简化为单参数计量中使用的贝叶斯均方误差[11, 13]。因此,REC为这种更广泛的BQI设置提供了一个自然的度量扩展。对于具有投影测量的基于量子比特的系统,REC有一个紧密的解析界限[3]。对REC的谱分析识别出特征任务,这些是可以以最高信噪比近似的函数[3]。这些提供了最小的有效特征潜在空间,并且与在指数级大的全特征空间中工作相比,可以显著减轻优化负担。
在单次测量估计的传感器参数的测量驱动优化预计是一个具有挑战性的问题。在无限次测量的渐近极限下,输出特征收敛到它们的量子期望值,采样噪声消失,基于梯度的变分QML方法已被证明由于梯度消失而扩展性差[14],这使得基于梯度的训练由于实际可进行的有限次实验而实际上无效。尽管电路的表达性理论上随着深度的增加而增加[15–18],但足够深的参数化量子电路的优化景观表现出指数级消失的梯度,导致众所周知的荒芜高原现象[14]。这些结果推动了对采用无梯度混合优化方法的研究。
一类适合于近期量子设备(NISQ)的QML算法是量子储层计算(QRC)[19–24],它避免了变分方法的优化挑战。当与有限次测量约束下的中程特征提取相结合时,QRC可以解决有限相干时间所施加的限制,如NISQRC算法所证明的那样[4]。
在QRC中,一个未经训练的量子系统作为一个高维非线性特征生成器。其固定的动态将输入数据转换为一组丰富的可观测量。在这个非线性特征空间中优化一个线性估计器,使用标记过的训练数据。因为只有经典权重被训练,一个凸优化可以通过标准线性代数例程(如奇异值分解)高效求解,训练需要的量子评估次数少得多,避免了阻碍变分方法的梯度消失问题。最近使用原子基储层(108个量子比特)[25]和高斯玻色采样器(分别为8176[26]和400[27]模式)的实验演示突出了这种方法的可扩展性潜力。然而,这些研究也报告了在减少采样时精度迅速下降[23, 28, 29]。超越这些研究,同时保留受储层启发的估计器的简单性,我们展示了在有限次测量条件下优化内部参数可以显著提高精度,并将测量要求降低到所考虑的BQI任务的单次测量水平。我们推测,对于所考虑的电路类别,最优的BQI传感器在设备端优化下保持鲁棒性。
为此,我们提出了一种针对单次测量BQI的采样感知端到端混合优化算法,其中状态制备、编码、测量和经典后处理被联合优化。这种统一处理与通过费舍尔信息界限分析性能[30–32]、主要关注探针态设计[33–35]或优化最终测量[36–40]的方法形成对比。这些观点通常只涉及传感管道的单个元素,而我们的框架直接针对整体推理任务以及最终决定单次测量制度下性能的估计器。应用于单参数计量任务时,所提出的方法在32个量子比特的情况下达到了-19.1 dB的风险,接近在相同资源下最优贝叶斯传感器实现的-20 dB极限[41]。与该最优传感器不同,我们的电路深度在整个优化过程中保持固定。
II. 理论 & 结果
A. 贝叶斯量子计量学回顾
在这里,我们回顾了贝叶斯量子计量(BQM)在单参数估计[11, 13]中的概念基础,介绍了适用于任意给定实验设置的成本函数,并回顾了关于量子理论所施加的最优传感器配置和计量学界限的已知结果。这为将框架扩展到任意先验下的全局函数估计奠定了基础。因为成本函数必须与具体的计量任务相关联,我们专注于拉姆齐干涉测量,其中最优性由实现最大单次测量信噪比(SNR)来定义。
![]()
尽管上述BMSE的下界在所有可能的探针态、估计器和POVM上进行了优化,但过去[41, 45, 46]已经研究了结合迭代数值算法来找到这些界限的建设。然而,直到最近才显示出可以使用由实验可访问的门组成的浅层电路来接近这些界限,无论是在单参数[11, 13]还是多参数[12]设置中。
B. PNN方法在全局函数传感中的应用
在本节中,我们介绍了量子计算传感框架的六个组成部分。每个元素都被详细指定,因为传感管道的端到端优化需要对每个阶段进行精确定义。这些组件共同构成了在量子计量设置中启用端到端贝叶斯量子推断(BQI)的架构。该公式下面解决了一个S次测量预算和高维输入 的一般情况。
![]()
![]()
![]()
![]()
估计器构建与训练:给定测量得到的特征 X(u),我们使用如下形式的线性估计器来近似目标函数:
![]()
![]()
![]()
![]()
![]()
![]()
![]()
单参数计量与容量
在方程(3)中定义的成本函数作为我们数据驱动传感框架中的中心性能指标,量化了优化后的传感管道对目标函数的近似程度。除了作为优化目标的角色外,我们在这一部分讨论了这个成本函数如何作为表征给定传感器在使用最优估计器方程(1)时能够分辨的函数空间的度量。成本函数方程(2)与文献[3]中引入的容量 线性相关。
![]()
![]()
![]()
![]()
![]()
因此,单次测量的线性容量可以被视为一系列信息度量的生成泛函:费舍尔信息作为一阶贡献,随后是一系列更高阶的Bhattacharyya型项。
这些发现与最近的研究[47, 50]一致,表明费舍尔信息仅在局部范围内提供可靠的精度界限,即参数被限制在已知参考值周围的狭窄邻域内。当参数分布在一个广泛的范围内时,仅靠费舍尔信息(FI)已不足以表征估计的基本限制。在这种全局场景中,更高阶的Bhattacharyya信息项变得至关重要,它们提供了更精细和准确的系统估计能力的量化,因为它们考虑了测量结果的非线性响应以及当参数在广泛范围内变化时估计的内在非局部特性。对所有可能的正算符值测量(POVM)进行优化,将这些经典量提升为它们的量子对应物,从而产生了量子费舍尔信息和量子Bhattacharyya或Barankin型界限[51]。
因此,方程(5)中的容量包含了所有相关的信息论贡献,无论是局部的还是非局部的,使其成为所有制度下传感的自然度量标准。其优化不仅在局部极限中恢复了已知界限,还可能指导在全局场景和贝叶斯量子推断(BQI)风格任务中改进测量策略的设计,在这些任务中,高阶效应变得至关重要。
C. 基于储层的优化
优化完整的传感堆栈,包括准备一个度量学上有用的状态、选择POVM以及用于计算估计器的经典后处理,提出了巨大的计算挑战。参数空间是高维的,目标函数在现实条件下表现出随机波动,特别是当测量次数 S 相对于可能结果的数量 K 较小时。在这种情况下,基于梯度的优化方法往往变得不可靠或效率低下。
在这种制度下,精心设计的优化策略是必不可少的,因为传感组件的联合训练否则会陷入景观的次优区域。为了克服这一困难,我们开发了一种适合于监督机器学习问题(包括我们的传感任务)的复杂非凸结构特征的定制优化方案。
![]()
![]()
![]()
![]()
![]()
D. 特征任务分析
![]()
为了缓解这一点,可以识别并消除冗余或噪声主导的特征,类似于主成分分析(PCA)的精神,它只选择特征空间中最有信息量的方向。在我们的上下文中,这些特征的最优线性组合被称为特征任务,这个概念最早在文献[3]中引入,并已被证明可以最小化具有大型训练数据集的监督机器学习任务中的泛化误差[61]。
定义特征任务的关键方程是一个广义特征值问题
![]()
![]()
![]()
其中权重 是在简化的特征集上训练的。最后,尽管特征任务的定义到目前为止假设可以访问理想化的无限次测量特征 x 和无限大的训练集,但它们仍然可以在有限次测量和有限大小的训练数据集下有效近似,并保持实际应用价值[3]。
E. 结果
![]()
受到变分量子算法在囚禁离子平台上成功应用的启发,我们假设探针、纠缠器和解码器电路的形式为:
![]()
![]()
![]()
![]()
![]()
非平凡先验下信号的函数逼近——我们接下来演示我们的框架在估计从非平凡先验分布中抽取的单参数 u 的设置中。
![]()
![]()
![]()
![]()
![]()
![]()
我们进一步使用各种电路变体研究算法的性能,如图5所示,结合了定制的输入状态和有效的POVM。我们的结果与文献中先前报告的结果完全一致,从而验证了现有基准,并验证了我们的框架在再现最新性能方面的有效性。
![]()
![]()
特征任务的使用
到目前为止,我们的传感管道优化依赖于从传感器获得的完整原始特征集,以成功逼近目标函数。然而,如第IID节所讨论的,一个有希望的替代方案是考虑特征的线性组合——称为特征任务——这些组合表现出足够高的信噪比。因此,电路变体中纠缠和解码部分的内部参数优化,以及估计器,必须重新审视,因为原则上得到的最优配置通常依赖于训练的特征任务数量。这种修改源于用于根据信噪比 选择特征任务的截断标准。在所有特征任务都被保留的特殊情况下,优化简化为原始设置,因为特征转换和估计器都是线性的。
![]()
![]()
![]()
III. 讨论与结论
我们开发了一个数据驱动的量子传感学习框架,其中状态制备、编码、测量和经典估计针对全局推理任务进行联合优化。将量子传感表述为监督学习术语,允许直接逼近随机输入的任意非线性函数,扩展了量子计量学的范围,超越了局部费舍尔信息界限,并将性能与更广泛的功能容量概念联系起来。
技术上,我们引入了一种高效的优化程序,该程序将基于储层的估计器与后储层损失最小化相结合,即使在采样噪声最强的单次测量制度下也能收敛到接近最优的解决方案。特征任务分析进一步识别出抗噪声的特征组合,这些组合产生紧凑的估计器,同时抑制不稳定或低信噪比模式。
我们的结果表明,联合优化整个传感管道比参数估计先于功能评估的两阶段策略获得显著增益。该框架再现了已知基准,适应一般先验和非线性目标,并为现实传感场景提供了统一的方法。这些发现表明量子计量学向集成的、数据驱动的传感器和推理算法设计的转变。
这项工作的几个方向随之而来。在多参数和多次测量设置中,功能容量与量子信息界限之间的更深层次理论联系将拓宽概念基础。在实际方面,将优化框架适应于噪声中等规模设备,结合硬件感知方法,并在实验平台(如囚禁锢离子和超导电路)上进行基准测试是自然的下一步。将当前的线性估计器架构扩展到非线性或自适应读出可能为量子增强传感和学习解锁更多机会。
原文链接:https://arxiv.org/pdf/2512.20492
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.