Unifying Non-Markovian Characterization with an Efficient and Self-Consistent Framework
统一非马尔可夫表征的高效自洽框架
https://journals.aps.org/prx/pdf/10.1103/PhysRevX.15.021047
![]()
量子设备上的噪声远比人们通常所认为的更为复杂。与常见的退相干模型相去甚远,几乎所有量子设备都同时受到连续谱环境和时间不稳定性的影响。这些因素在电路层面上引发了量子与经典的噪声相关性。相关的时空效应本身就已足够难以理解,更不用说加以抑制了。目前,尚缺乏既可扩展又完备的方法,用以应对导致量子信息扰乱与丢失的这些现象。
本文在此问题上迈出了深入的一步:我们建立了一个理论框架,可统一地纳入并分类所有非马尔可夫现象。该框架具有普适性,不依赖任何参数取值,且完全以实验可观测的电路层级量来表述。我们进一步提出了一种基于张量网络学习的高效重构方法,该方法易于模块化,并可根据系统预期的物理特性进行简化。随后,我们通过大量数值模拟及在IBM量子设备上的实际实现,验证了该方法,并估算了完整的时空关联集合。
最后,我们将该框架应用于评估若干控制技术抑制上述噪声效应的有效性——包括噪声感知的电路编译(noise-aware circuit compilation)和优化的动态解耦(optimized dynamical decoupling)。结果表明,在任意SU(4)操作的钻石范数(diamond norm)与平均门保真度(average gate fidelity)方面,以及在动态解耦性能方面,相比现成(off-the-shelf)方案,均可实现显著提升。
I. 引言
随着量子设备逐步逼近容错阈值 [1–6],对误差校正及量子算法性能影响最为关键的动力学——即关联性与相干性噪声 [7–11]——的驾驭变得愈发必要。并非所有错误都等价;与其一视同仁,不如明智地采用硬件感知(hardware-aware)的方法以实现洁净的量子计算 [12–16]。其中一项必要环节是构建一套稳健的流程,将来自含噪量子设备的病理性动力学映射为可解释且对既定目标有用的信息。
鉴于高保真量子器件研发路径的多样性,亟需建立不依赖于硬件具体细节的稳健性操作表征策略。换言之,一个操作模型应以独立于底层物理的方式捕获核心逻辑信息。此类表征技术将在实用化量子纠错方案的发展中发挥核心作用——而这些方案所面对的噪声,其时间尺度可跨越若干数量级。此外,操作性表征还可用于报告器件品质 [17]、辅助诊断制造缺陷 [18]、指导最优控制技术设计 [19–22],并可前馈用于噪声感知的量子误差缓解策略与纠错协议 [13, 23, 24]。同样重要的是,这些模型必须具备足够的表达能力,即能够准确刻画真实量子设备上观测到的实际动力学。目前,在可被精确建模的行为与实际设备中显现的有害行为之间,仍存在显著差距。其中尤为复杂的效应,便是具有时间或时空关联性的噪声——即所谓的“非马尔可夫性”(non-Markovianity)。
例如,超导量子比特凭借微波频率控制,往往可实现高保真度门操作与稳定的功率谱。然而,这些量子比特仍会与多种环境特征发生显著相互作用,包括高能级、双能级系统(TLS)缺陷、ZZ耦合串扰及电场涨落等 [25–28]。相比之下,离子阱系统几乎完全与环境隔离,但其主要噪声源则来自于光学寻址的不稳定性所带来的控制误差 [29, 30]。而自旋量子比特则同时受1/f电荷噪声及邻近核自旋可能引起的超精细耦合影响 [31–33]。类似地,冷原子 [34]、玻色子系统 [35],乃至马约拉纳量子比特 [36],亦均涉及与复杂环境的相互作用。
在考虑非常规误差通道时,“非马尔可夫性”一词已在量子表征、验证与确认(QCVV)文献中被广泛(甚或泛滥)使用,泛指一切不符合马尔可夫模型的行为——包括时变马尔可夫过程——只要其在表征实践中无法被标准马尔可夫模型拟合。尽管大多数情况下该用法在语义上是正确的,这种信息的粗粒度归并却可能带来问题:针对不同物理机制所开发的工具与形式体系可能被混淆,而术语的混用则制造了一种错觉,即各种技术可随意组合搭配,而实际上可能并不适用。当从主方程视角探讨非马尔可夫性概念时 [37, 38],这一问题尤为突出。
这引出了一个根本问题:不同类型的非马尔可夫性误差是否可被分辨、(易于)探测,并在实践中加以控制?其下游影响各不相同。例如,由系统–环境相互作用引起的记忆效应,原则上可通过精心设计的实时控制予以消除 [39]、输入解码器 [40],或推动围绕特定硬件定制纠错码的设计 [41, 42]。相比之下,长期器件不稳定性对单次误差压制方法的关联性较低,而更多地影响基于长时间累积观测量数据的误差缓解技术 [43]。当然,从器件制造角度出发,所有这些信息均具有重要价值。
过程张量层析(Process Tensor Tomography, PTT)作为一种刻画一大类非马尔可夫动力学的方法已然兴起,并已被应用于多种场景以理解含噪量子器件 [18, 44–50]。过程张量是对量子随机过程的操作性描述;其重构可提供关于由不可控动力学引起的多时关联性的全部相关信息 [51, 52]。然而,现有形式的PTT假设门操作是理想的,仅刻画系统与其浴之间的关联性相互作用,而忽略了门依赖性噪声(如相干误差)的影响。对此问题的一种改进方案是将门操作本身也纳入模型与过程张量联合建模 [50]。但更关键的是,该技术既无法捕捉控制电子学内部的非马尔可夫关联,也无法处理主动泄漏(active leakage)效应。此外,其实验开销目前仍过高,致使诊断结果难以被可扩展地前馈用于噪声抑制。
本文旨在将上述种种非马尔可夫性概念整合进一个统一、自洽的理论框架,并提供一种兼具高效性与模块化的动力学表征方案。本文成果不仅适用于量子噪声研究,亦可推广至任意开放量子系统。例如,参与非马尔可夫相互作用的量子传感器亦可受益于此种学习方法。在概念层面,本工作亦拓展了“量子随机过程”的定义,使其可涵盖在探测量子动力学过程中(未知的)随机效应。此类效应可包括控制层面上的参数关联,或过程–控制相互作用(process–control interplay),即探测操作本身改变浴动力学的情形。
因此,我们系统性地拓展了非马尔可夫量子随机过程的概念,以涵盖更现实的场景:实验者所拥有的仪器集合中,至少部分仪器本身即构成一个未知的环境。我们的结果验证了上述主张:我们对多种模拟的非马尔可夫噪声模型实现了高保真、大规模的表征;随后,在IBM量子设备上,成功绘制出完全由噪声自身涌现的时空关联结构。我们方法的模块化特性亦得到展示:噪声模型的不同组分可根据硬件特异性(如预期物理机制或原生门集合)灵活重组。最后,我们通过两比特门分解与优化动态解耦序列,收集了大量证据,表明此类精细表征能显著提升对超导量子器件的控制性能。我们期望,这一详尽而全面的非马尔可夫噪声框架,不仅有助于优化各类量子计算平台上的误差抑制策略,亦将为未来理论与实验研究提供指引,以深入探索量子系统与其复杂、关联环境之间微妙的相互作用。
II. 背景与结果概要
在本工作中,我们呈现了一系列成果,其意义可惠及量子计算领域广泛的从业者群体。在概念层面,我们提出了一种关于受控量子系统(如量子计算机)中非马尔可夫过程的新颖而全面的理论。该理论被称为“自洽的”(self-consistent),因其同时纳入背景噪声与控制噪声,并提供可检验的假设。基于此框架,我们推导出具体方法,用以确定所有相关的时空噪声效应,并可将其分解为具有实验意义的组分。我们进一步借助张量网络使该框架具备高效性——这一进展不仅推进了非马尔可夫噪声表征在可扩展性方面的前沿,亦惠及所有自洽的马尔可夫噪声估计工作。我们以大量数值与实验结果佐证上述主张,并展示了如何利用其实现对含噪量子器件的显著增强控制。因此,本工作涵盖了理论、数值模拟及实验相关情境下开放量子系统研究的广泛成果。
然而,不太可能有哪一位读者会期望通篇逐字研读本文。因此,我们首先撰写本节,旨在提供对全文工作的鸟瞰式概览及其恰当的上下文定位。具体而言,我们将:梳理全文结构;介绍过程张量(process tensor)与多时过程(multitime processes)的相关背景;概述我们在概念与方法论上的创新;简述实现细节;最后提供一份阅读指南,以帮助量子信息领域不同背景的研究者快速定位其最关心的部分。
本文结构如下,旨在便于不同背景与兴趣的读者按需分段阅读:
主体部分的第一部分(第III节)呈现应用性成果,以展示本框架的表达能力与有效性,及其对硬件要求与实验设计的适应性;
第二部分(第IV节)则阐释本框架的技术方法与概念细节。
在第III节中,我们展示了在多种合成与实验场景下,对有害非马尔可夫噪声进行高精度、高效率表征的可能性——其规模与非马尔可夫性的表达广度均超越以往工作。
在III A小节中,我们针对一系列合成噪声模型验证了这种自洽表征能力,包括:与核自旋的交换相互作用;相干噪声与1/f门噪声;以及控制操作对环境动力学的“泄漏”(spillage)效应。这证明了我们能够刻画大量在现有文献中尚无对应操作性描述的噪声模型。事实上,我们主张这些结果已近乎完整地描绘了非马尔可夫噪声的全貌。
随后,在III B小节中,我们在IBM量子设备上开展了一系列实验演示,成功捕获并量化了具有时空关联的动力学效应。
最后,在III C小节中,我们将这些工具转用于实际问题:具体而言,我们考虑电路设计中的两个关键问题——(i) 从高层幺正操作到原生门集合的最优、噪声感知分解;(ii) 在未知噪声存在下优化动态解耦序列。我们的目标在于证明:非马尔可夫过程表征既可轻量高效,又能保持全面性,且不丢失对器件基准测试与最优控制至关重要的关键信息。
上述应用成果得益于第IV节详述的技术进展,其中我们深入介绍了分析方法与框架设计。这些细节面向希望理解实现机制、复现或拓展本工作成果的读者。其中核心概念部分为IV A小节:一组定义性内容,旨在阐明本工作的哲学基础,并建立关联动力学的分类体系。我们期望此分类不仅有助于厘清并细分“非马尔可夫性”在实践中的具体含义,亦可为后续估计技术提供有益结构(需注意:这并非意图构建某种终极层级体系,而是一种面向实用的分类方案)。本分类源于直觉判断与对量子噪声文献的细致梳理,其价值亦由后续技术成果所印证。
在IV C与IV D小节中,我们构建了一种高效、模块化且自洽的表征流程,用于估计任意关联量子动力学:首先在完全一般性下推导该流程,再借助张量网络进行压缩;在不牺牲上述一般性与可解释性的前提下,使整体模型规模变得可接受。
若跳过背景介绍与第二部分的技术成就,直接进入第一部分,无疑将造成极大困惑。因此,我们首先以较高层次概述相关背景:包括用于自洽刻画量子噪声的门集层析(Gate Set Tomography, GST)框架及用于刻画非马尔可夫量子噪声的过程张量层析(Process Tensor Tomography, PTT)框架——分别如图1(a)与1(b)所示。需注意:GST虽具自洽性,但假设噪声为马尔可夫且时不变;PTT虽可处理非马尔可夫噪声,却不具备自洽性。本文通过发展一种自洽的PTT流程(如图1(c)所示),填补了这一空白。此外,本节还概要总结了支撑自洽非马尔可夫层析得以实际实施的技术工具与关键进展。由此,我们方能深入第一部分,充分展示本工具的高效性能;第二部分则为有兴趣的读者提供对本工作概念与技术细节的深度解析。
![]()
本文整体结构更全面的示意图见图2。
![]()
A. 多时过程背景
本工作的核心贡献建立在量子随机过程的数学形式化之上,该形式化框架基于“过程张量”(process tensors)[51],在文献中有时也被称为“量子梳”(quantum combs)[53]或“过程矩阵”(process matrices)[54]等其他名称。首先,我们概述这些对象及其在PTT框架内的估计方法 [45]。
- 过程张量
量子信道描述的是输入态与输出态之间的双时关联。通常情况下,一个量子实验可能在时刻对系统施加一系列控制操作。此类过程被表示为一个从系统上的一系列可控操作到最终密度矩阵的多重线性映射。此处,该映射被称为“过程张量”[51,54],它代表了过程中所有不可控的动力学,如图1(b)和1(c)中的蓝色梳状结构所示。
过程张量在形式上将量子信道推广至多时过程。具体而言,我们关注多时量子关联,以推广由量子信道所体现的双时关联。更精确地说,我们考虑这样一个场景:一个k步过程由一系列控制操作驱动,每个操作在数学上由完全正定(CP)映射表示:;在此之后,我们得到一个依赖于这些干预选择的最终态。这些受控动力学的形式如下:
![]()
![]()
![]()
![]()
2. 过程张量断层成像(Process tensor tomography)
过程张量框架的构建是为了通过实验上可操作量的访问来获取多时间量子关联。最近,我们的部分作者引入了 PTT(过程张量断层成像),以便在真实设备上对多时间关联进行估计 [44–46]。本质上,一系列控制操作构成了作用在多时间过程上的线性可观测量。因此,一组完备的可观测量(quorum of observables)唯一确定了过程张量。PTT 是一种方法论,它既规定了所需进行的一系列实验,也规定了估计实验室中观察到的动力学所对应的过程张量所需的步骤。
![]()
![]()
这将经典随机过程的联合概率分布推广到了量子情形 [56]。事实上,从方程 (6) 可以看出,一系列控制操作构成了对多时间过程的一种“测量”。每个时间步的操作可以是确定性的——例如幺正操作——也可以是随机性的,例如测量并前馈(measurement and feedforward),或者更一般的量子仪器。需要注意的是,多时间过程同样遭受着与量子态和多粒子经典分布相同的“维度诅咒”,其复杂程度可能与量子态一样高 [57]。在这里,随着时间步数的增加,需要考虑的历史数量呈指数增长。
![]()
![]()
或者,如果概率仅对某些操作子空间(例如,幺正操作张成的向量空间)是已知的,那么过程张量将在该子空间上被唯一确定。
在现实中,测量得到的结果 是“真实”概率的有噪声估计值,并且通常不存在一个完全匹配数据的物理过程张量。出于这个原因——这很常见——我们将过程的估计视为一个优化问题,即拟合一个模型以适配数据。具体而言,通过最小化对数似然函数来找到唯一的 。
![]()
![]()
自洽层析成像
![]()
如上所述并如图1(b)所示,PTT(过程层析)属于自不一致协议的类别。在这种情况下,假设门序列和最终测量都是已知的。它们的完美形式用于探测系统与其环境相互作用的时间信息。此外,假设“已知”门没有时间相关性。下面,我们构建一个自洽PTT,即一个假设对门序列或测量没有先验知识的模型。此外,我们开放了对控制序列中可能的时间相关性的研究,解决了非马尔可夫文献中的一个重大空白。
B. 概念性贡献
我们在图2中展示了我们工作的核心成果及其各自对应的章节。特别是,图2(a)捕捉了本文的主要概念性里程碑,即从概念和表达两个层面剖析量子噪声的构成。在实际实验中,噪声来源于背景过程以及控制系统本身的不完美性。图2(a)在概念上将这两种贡献分离开来,详细内容见第IVA节。这包括“溢出误差”(spillage error)的概念,即控制操作影响了背景环境。因此,溢出误差同时属于这两类。虽然噪声的概念性分离颇具吸引力,但单从表面看并无实用价值。
为了取得实际进展,我们需要在表达层面上明确区分这两种量子噪声源,而这绝非易事。为克服这一困难,我们在第IVB节推导出了一套完全自洽的程序,用于表征所有出现的时空关联:(i) 由不可控的系统-环境相互作用引起;(ii) 由控制本身内部的记忆效应引起;以及 (iii) 由控制与环境之间直接的不良相互作用引起。每个结果还包含了这些方面的时间不稳定性。这构成了对非马尔可夫量子系统表征的一个概念性进步。具体而言,图2(b)描绘了不同方面的时相关联噪声如何由类似过程张量的对象表示,以及它们如何相互关联。
这一构建的核心是“广义门集”的概念,它由一个固定的、用于表示不变背景动力学的过程张量和一个用于表示每个独特门序列的测试器(tester)组成。过程张量捕捉了所有“固定”的记忆,因为其存在于每一次实验中。例如,如果一个量子比特与其环境中的某个缺陷发生耦合,那么这是一种始终存在的相互作用。我们称之为“过程非马尔可夫性”。而测试器——原则上,每个门序列对应一个——则被证明足以表达“控制非马尔可夫性”和“溢出”两种现象。前者指每个门的误差在时间上是相关的。例如,一个激光驱动系统时,若其功率谱存在准静态波动,则会在整个电路中诱导相同的相干误差,而该相干误差是从某个分布中抽取的。后者指门的应用会改变始终存在的环境本身——例如,在上述“过程非马尔可夫性”的例子中,若驱动频率也恰好与缺陷共振。这些对象在数学上足够丰富,可以表示所有非马尔可夫噪声。此外,我们还展示了如何通过一系列物理实验来估计它们。
然而,实现完全通用性的代价是需要消耗大量资源。我们通过引入稀疏关联假设,并将每个含噪对象表示为张量网络来解决这个问题。因此,在假设非马尔可夫记忆不会随时间呈指数级复杂化,或噪声不会任意地纠缠空间上分离的量子比特的前提下,该表征方法变得高效。我们在第IIIA节重新审视了这些定性不同的噪声源的估计问题。
我们的理论涵盖了以往对量子噪声的理解;也就是说,在适当极限下,它退化为两种最先进的方法。当假设背景噪声为马尔可夫噪声时,我们恢复了GST(门集层析)。当放弃自洽性时,我们重新获得PTT(过程张量层析)。我们利用这些特性,在下一节关于合成数据的内容中,将我们的理论与GST和PTT进行对比测试。为实现无缝衔接,我们利用了张量网络方法的另一个优势,即我们可以根据需要开启或关闭模型的各种特性。此外,该表征仅需RB(随机基准)类型的实验,因此实验设计与当前标准实验室设置一致,类似于文献[62]。
C. 技术方法
尽管我们的工作在第IV D节中包含了一种用于估计多时间过程的完全通用程序,但该程序在实际操作中成本过高,因此必须进行简化。将量子态压缩为更高效表示形式的典型方法是采用张量网络,如图2(c)所示。张量网络背后的理念是,存在于一系列希尔伯特空间及其对偶空间张量积上的量子态,可以通过众所周知的分解方法在这些空间上进行拆解。然后,如果这些分解包含稀疏特征,就可以将它们置零,从而构建出更高效的表示形式。最著名的例子是矩阵乘积态(MPS),它可以精确表示任何纯量子态[63]。如果该态在其几何结构上具有指数衰减的关联,则MPS仅需多项式数量的参数即可表示它[64]。
张量网络之所以重要,原因多样[65],其根源可追溯至著名的密度矩阵重整化群技术,该技术用于定位局域带隙哈密顿量的基态[66]。它们突显了纠缠在纯态量子计算中的必要作用[63,67,68]。它们还在推动经典计算机对量子算法的模拟和仿真方面发挥着关键作用,进一步突破了实现量子优越性可能面临的障碍[9,69,70]。最近,张量网络也被实现为一种有用工具,用于扩展经典阴影(classical shadows)可操作的系综范围[71,72]。在此,我们重点关注张量网络在稀疏表征中的应用,这一目标最近已在量子过程层析[73]和哈密顿量学习[74]中得以实现。
我们处理张量网络的方法主要基于Torlai等人在文献[73]中的成果。该文献中的工作开发了一种高效执行量子过程层析的方法,重构出量子信道在其Choi形式下的矩阵乘积算符(MPO)表示。量子信道Λ的Choi矩阵由Λ作用于一个未归一化纠缠态的一半而唯一确定——对于N个量子比特,其中,另一半则保持恒等映射I:
![]()
![]()
![]()
此处,求和分别在 D 上进行,代表数据集,以及 C₀ 和 Cd 上进行,它们是特意选择的泡利算符集合,用于正则化过程张量的因果条件和仪器的迹保持性。该方法的详细内容将在第IV C节和第IV D节中重新阐述。
D. 阅读指南
本节迄今为止已大量聚焦于我们工作(诚然,相当冗长且有时晦涩难懂)的背景、结构和高层次细节。因此,我们在此提供一份快速阅读指南,以帮助量子信息领域的不同读者群体阅读本文。
(i) 对于仅对我们的模型能力感兴趣者,请参阅第III A至III C节。在假设对我们的设定和目标有高层次理解的前提下,这些章节验证了我们的方法在数值和实验设置下的性能与表达能力,并提供了对其潜在应用的洞察。
(ii) 对于希望在自己的环境中实施我们技术者,请额外参阅第IV D节及代码库[75]。
(iii) 对于希望复现或基于我们的技术进行构建者,请参阅第IV C节和第IV B节。关于性能基准测试,请参见附录B。
(iv) 最后,对于对非马尔可夫性理论中的概念性进展以及我们关于量子随机过程的哲学思想感兴趣者,请参阅第IV A节和附录A。
III. 数值与实验结果
在本节中,我们展示了在合成数据与实验环境下对非马尔可夫动力学进行估计的结果,并进一步探讨了这些估计在控制任务中的应用。我们首先以自洽方式验证了我们的模型对前述各类非马尔可夫性的处理能力。具体涵盖以下场景:(1)在具有非马尔可夫背景过程的前提下存在门依赖的马尔可夫误差;(2)在非马尔可夫背景下的非马尔可夫控制;以及(3)在非马尔可夫背景下的非马尔可夫溢出效应(spillage)。
随后,我们对IBM Quantum设备开展了多种多时间点与多量子比特的表征实验。结果不仅表明含噪实验数据可以被我们的模型合理解释,还进一步量化了其中存在的时空关联结构。
最后,我们展示了基于该表征框架所能实现的控制性能提升:具体而言,我们说明了如何利用该框架完成两项任务——(a)最优实现任意双量子比特幺正操作;以及(b)优化动力学解耦(dynamical decoupling)脉冲序列。
A. 合成数据演示
首先,我们考察若干“奇异”噪声模型——这些模型要么在现有文献中尚无任何技术可进行操作性表征,要么违背了GST与PTT以往所采用的模型假设。具体而言,这意味着它们包含多种形式的控制噪声。在每种情形下,我们模拟了一个双量子比特、五步长的过程:其中每个量子比特通过一个随机海森堡型相互作用与一个共用的环境缺陷耦合:![]()
其中 J i ⋅ t evolve = O ( 1 )
。海森堡相互作用为非马尔可夫模型提供了良好的检验场景,因其能实现真实的量子信息交换,从而允许(除其他效应外)将时间上的纠缠分布至多个时刻[76]。
我们在数值实验中分两个阶段进行:训练阶段与验证阶段。每次表征均使用6000个随机Clifford门构成的电路,每条电路后接一个随机泡利基下的投影测量,且每条电路重复运行1024次采样(shots)。需注意,此电路数量多于最低需求,因为我们优先追求精度而非效率;关于数据规模的基准测试,请参见附录B。
在训练阶段,我们通过随机梯度下降优化式(10)中的目标函数,将张量网络模型拟合至由随机Clifford电路获得的频率数据集上。在每次优化器迭代中,6000条电路被随机划分为每组1000条的批次,并通过自动微分(autodifferentiation)计算梯度。
此外,我们另设一套包含100条电路的验证集,这些电路使用完全随机的幺正门构建。模型并未针对验证数据进行拟合,而是直接用于预测这些电路的输出结果。我们将模型对验证数据的预测值与观测频率之间的相对差异(与训练数据形成对比)记录下来,作为模型泛化能力的一项度量——换言之,这是一种启发式的重构保真度判据,用于衡量过程张量能否捕获表征电路之外的动力学行为。
通常而言,由于我们采用的是线性模型,且测量集合在信息意义上是完备的,我们并未观察到过拟合现象;验证集的性能趋势与训练集的似然变化高度一致,仅受两组数据中每电路采样次数差异的影响。正如我们后续探讨所示,这种泛化能力不仅是模型有效性的验证指标,还可进一步用于优化对含噪动力学的控制策略。
![]()
![]()
![]()
I. 非马尔可夫浴中的相干门误差
![]()
![]()
![]()
![]()
这一数值设置是在最简单场景下对自洽非马尔可夫表征的“第一性原理”演示,该场景中PTT和GST均会失效。这在所需实验数量上实现了显著缩减——从张量网络模型所需的 个电路减少到稠密模型所需的 个电路,二者之间的差距随时间步数 k 呈指数级扩大。在接下来的内容中,我们将展示该模型如何处理更复杂的噪声模型、更大的量子比特寄存器以及规模大得多的多时间过程。
控制和过程的非马尔可夫性
![]()
在不针对底层物理进行任何定制的情况下,我们用一个通用的过程张量网络表示过程,用一个通用的测试器张量网络表示控制,每个网络的键维。图4中展示了这一结果。图4(b)和4(c)再次指示了每个模型拟合的结果,而图4(d)和4(e)则展示了在验证数据上收敛模型的重建保真度。在这里,特别是我们将完全自洽估计与之前的结果进行比较:具有控制建模为时间局部的自洽非马尔可夫估计。这是为了消除仅仅通过考虑一些相干误差就能复制改进的可能性。在这种情况下,改进完全来自于找到仪器中时间相关性的最佳模型估计,我们看到重建保真度提高了两个数量级。因此,这证明了估计压缩模型的能力,这些模型代表了系统中物理上现实的量子相关噪声以及实验控制仪器。
![]()
- 溢出效应(Spillage)
我们所考察的第三种奇异噪声模型是溢出效应(spillage),即控制操作的作用范围“泄漏”至环境系统中。这通常以两种方式发生:其一,控制脉冲的波形在频域中产生与环境某些部分意外共振的杂散频率分量,从而诱发随机跃迁;其二,在光学寻址系统中,激光束的有限空间范围可能与其余环境区域发生重叠。无论哪种情形,其效应是相同的:执行控制操作这一行为本身会改变环境的状态。若我们天真地假定控制操作仅作用于系统本身,则可能导致令人费解的非线性控制结果。虽然可通过将环境纳入扩大的系统(即“系统扩张”)来解释此现象,但这将留下巨大的规范自由度(gauge freedom),通常难以令人满意——实质上,这只是通过扩大模型去拟合数据,并不能反映真实物理机制。
然而,我们此前已借助超过程(superprocesses)论证:这类受驱动的动力学效应,完全可在同时使用过程张量与测试器(tester)的框架下被完整刻画;剩下的问题仅是如何对其进行估计。此外,我们已指出:尽管这些超过程在概念上富有启发性,但在实际估计中并非严格必需。
为进行原理性验证,我们所采用的模型再次设定为:一个通过交换相互作用耦合的非马尔可夫环境。在系统每次施加 √X 门之后,我们额外施加一个受控-RX门(controlled-RX gate),作用于系统与环境之间,其控制旋转角度为 θ = π/16。这种门依赖的误差无法从各门操作中分离出来,因而不能被吸收到过程张量中——换言之,它与标准PTT模型不相容。我们在图5(a)中对此进行了图示说明。该模型相比其他模型物理动机较弱,更多是作为对所述溢出效应的一种压力测试;但本质上,它旨在模拟控制操作对持续存在的环境产生主动泄漏并生成纠缠的情形。
![]()
为同时刻画非马尔可夫关联与超过程变换,我们需采用键维数(bond dimension)χ = 2 的过程张量,以及键维数 χ = 4 的测试器:前者用于封装单量子比特环境,后者用于封装双量子比特门操作。尽管我们并未预先指定这些值,而是从马尔可夫模型出发逐步扩展,直至交叉验证结果充分吻合且无过拟合为止。
图5展示了标准PTT与自洽PTT的结果对比。尽管该噪声模型颇具病理性(pathological),我们在实践中仍能完全捕捉其效应并实现完全收敛。这弥补了第IV A节中所讨论的各类噪声之间的表征鸿沟。因此,我们认为,我们已展示了一种实质上普适的量子层析协议——它既可应用于真实实验场景,也可推广至多量子比特情形。
![]()
![]()
这量化了从对动力学某一时刻的了解中所能获得的关于另一时刻的信息量;或者,也可以与混淆关联模型和非关联模型的概率相关联[85,86]。该分析的结果如图6(e)所示,它清晰地揭示了一个主要问题量子比特(q1)正经历显著的时空非局域性误差。与此同时,例如量子比特(q2)的动力学则更接近于马尔可夫模型。
![]()
据我们所知,目前文献中尚无其他方法能够严谨且全面地表征时空关联。在此,我们展示了一种高效且高度通用的技术,可用于捕捉所有自然发生的动力学模型。此外,我们已证明该技术在IBM量子设备的实际测试平台上有效运行。所得诊断结果直接揭示了关联误差的位置与本质,这些信息对于器件制造和基准测试至关重要,并可被输入至张量网络解码器,以针对特定噪声模型最大化逻辑错误率[87]。此外,正如我们接下来将探讨的,其表征结果还可直接用于控制应用,以减轻此类误差的影响。
C. 控制应用
正如我们在表征协议基础上进一步提升了其效率与鲁棒性一样,我们也可将关注点转向那些易于集成进电路编译软件的控制工具。我们首先将张量网络表征方法引入该任务中,从而使方法可推广至任意时间步数,并能兼顾控制硬件中存在的各类误差。为此,我们提出了两种具体协议:(1)噪声感知的双量子比特幺正操作分解;(2)定制化的动力学解耦(dynamical decoupling)序列设计。
通过对多种IBM量子设备开展广泛表征,我们可绘制出在哪些场景下通过抑制非马尔可夫噪声可获得最大收益。此处的关键在于:我们已构建了一个将控制操作映射至输出结果的模型,因而可在经典层面分析表征结果,以实现最优控制目标。
需指出的是:目前我们尚未将这些方法集成至实时前馈(live feedforward)控制协议中(例如结合在线学习的闭环控制)。因此,我们的结果可视为对“表征与控制深度融合”未来可行性的前瞻性预测。每一次表征均具备经验证的高保真预测能力(重构保真度误差达10⁻⁴量级),从而为该预测提供了可靠依据。将表征结果直接用于最优控制是当前正在进行的工作;但我们相信,现有结果已能可靠预示优化门的实际性能——因为重构保真度远高于原生门与优化门之间的性能差异。此类分析可为量子设备控制中是否存在结构性改进空间提供有依据的判断。
- 逻辑上改进任意双量子比特门
在探索非马尔可夫最优控制技术的过程中,一个关键要求是泛化能力。我们无法为每个量子算法的每一步都进行表征以实现最优运行;相反,我们必须聚焦于对量子电路的基本构建模块进行表征,从而将所需的表征量固定下来。例如,由任意SU(4)门构成的“砖块式”(brickwork-type)电路,通常会将每个SU(4)门分解为其硬件原生门——通常是CNOT门和单量子比特旋转门。这些分解通常基于门的理想参数来选择。在此,我们将展示如何借助对噪声的部分认知,使编译策略能够通过调整门参数来补偿或抵消关联误差。这些策略仅使用我们迄今所估计的张量网络。
因此,考虑用CNOT门和局部旋转门来构造任意双量子比特门的问题。该门分解方案如图7(a)所示。我们可以将此门分解识别为一个三步、双量子比特的过程张量。其中,CNOT门是过程中的固定部分,而该过程接受单量子比特门作为其输入。到目前为止,我们已看到这完全在我们的表征能力范围之内。令 表示由给定电路所代表的、跨越三步的双量子比特过程张量。每个门被分解为虚拟Z旋转和 脉冲,并利用其中的张量网络方法估算出相应的过程张量。这为我们提供了针对任意局部幺正操作值的有效含噪双量子比特门的估计:
![]()
![]()
![]()
![]()
![]()
![]()
重要的是,这是对门性能的诚实衡量,包括相干误差,并与量子纠错阈值中执行的实际错误率相关 [8,89]。一般来说,门的钻石误差可能比其平均门不保真度大一个数量级。我们计算了每个IBM演示中100个随机生成的酉门在朴素和优化参数选择下的这一度量。结果如图7(c)所示。在两个案例中,ibm_hanoi 和 ibmq_jakarta ,误差减少仅是边际的,表明这些量子比特对的噪声特征主要由随机、马尔可夫效应主导。然而,在大多数情况下,能够确定性地抑制相关和相干噪声,导致门分布的均值和方差都有显著改善。这突显了当前量子设备中噪声的病理学:它可以是相关的、相干的和复杂的——与错误校正的典型期望相反。我们的结果强调了需要纳入专门的噪声分析,以便从嘈杂的量子设备中获得最佳性能。
由于我们的模型可以计算门序列的期望分布,我们还可以通过对RB模型的平均门保真度改进进行评估。也就是说,我们可以优化每个酉门并将其组合成序列以模拟RB实验的效果。一些代表性曲线如图7(d)-7(f)所示。对于钻石误差中预期的改进 r,相应的RB保真度改进是 。然而,这些平均情况的增益仍然是显著的,并且可以在这些门的错误预算的几个百分点上进行改进。
![]()
![]()
![]()
优化动态解耦序列
我们的另一种直接控制应用是在维护空闲量子比特方面。对于任何没有完全连接性的设备,执行的量子算法总是会有一些量子比特闲置一段时间,在此期间它们可能与周围环境相互作用。解决这个问题的一种众所周知的方法是应用动态解耦(DD)序列 [91],通过控制脉冲来普遍抵消某个哈密顿量的噪声到某个阶数。虽然已经很好地表征了最优序列在普遍抵消误差到所需阶数方面的特性 [92,93],但普遍性的权衡通常是性能。已经证明,优化的DD序列可以优于现成的序列,考虑到特定的退相干模式和不完美的脉冲 [94,95]。在这里,我们提出了一种方法,通过该方法可以高效地表征设备上的噪声感知DD序列。该方法自然地与硬件无关,并允许优化过程完全离线进行,而不是通过实时反馈进行。此外,由于表征是自洽的,它不仅考虑了任何系统-浴耦合,还考虑了控制序列中的任何不完美或动态校正门的引入 [96]。
当我们在模拟的多轴噪声上测试这一点时,我们发现我们的方法几乎可以完美地抵消复杂哈密顿量的影响,并显著优于著名的XY8序列 [97]。我们还对8、32、64和128个门脉冲序列在一系列IBM量子设备上进行了测试。尽管我们总是发现从非马尔可夫环境中得到了最佳解耦,但在空闲(不采取任何措施)序列和应用XY4重复之间的改进之间几乎没有变化。相对于不采取任何措施的改进表明可能抵消了非马尔可夫相关性。相对于XY4的改进表明设备具有某种程度的复杂(多轴)非马尔可夫噪声,因为XY4序列完美地抵消了相关的Z误差。
![]()
![]()
![]()
看起来这种方法过于特定于已经表征的空闲窗口。通常,量子比特在电路中经历的空闲时间是高度可变的。但是,如果在较早的时间实施测量(例如,以图8(a)中的形式进行数据收集),那么最终状态在任何时间直到包括都是已知的。因此,当电路的空闲时间短于此时间时,我们仍然可以优化相关窗口并追踪其余部分,如图8(b)所示。从这一点出发,我们有一个既模块化又可扩展或可重追踪到任意次数的协议。这减少了表征的负担,意味着只需要一轮就可以能够识别任何时间窗口的DD序列。
![]()
![]()
这些结果需要进一步的结构化调查,以在不同场景中找到最优的DD序列,并与标准协议进行比较,以确定是否需要事先表征。看到实际量子算法或具有不同噪声特性的硬件平台上的性能也很有趣。在模拟实例中,序列之间的明显差异表明了为多轴噪声定制DD序列的潜力。在IBM系统中,这似乎并不总是如此。在某些情况下(如ibm_auckland和ibmq_mumbai),错误减少了20%到60%。在其他情况下,我们无法通过定制的DD序列显著提高这些实例的相干性。我们的分析揭示了设备何时以及可能从优化控制中受益。
然而,我们已经建立了一种廉价且直接的方法,可以将定制的DD序列应用于任何给定的嘈杂设置,因此对于给定的设置,脉冲数量是最优的。然而,假设不同时间尺度(即短时间和长时间)的相关性持续存在。那么MPO估计可能不足以确定这些记忆结构;结果最优DD序列将抵消短时间相关性而不是长时间相关性。有两种直接的方法可以考虑解决这个问题。首先,可以表征短时间动态并找到最优DD序列。然后,可以在过程中固定该序列,以便所有快速错误被抵消。接下来,表征固定序列周围的长时间过程张量。在为此DD优化后,将找到内部和外部DD序列的连接,分别抵消短时间和长时间相互作用。或者,可以使用更复杂的张量网络——如树张量网络或多尺度纠缠正规化Ansatz [99]——这些设计用于捕获不同相关性尺度 [100],估计这些,然后优化DD序列。
IV. 技术方法
尽管第II节已对本文采用的技术方法进行了高层次概述,本节将进一步详述我们模型的细节与实现方式。特别是,本节所讨论的结果对于构建第III节中各类表征演示所用的模型至关重要。我们首先在第IV A节阐明所提出的量子噪声解剖结构;继而在第IV B节推导自洽的过程张量层析(self-consistent PTT),为前述概念奠定坚实的数学基础;最后,在第IV C节与第IV D节中,我们构建上述模型的张量网络表示,并发展出在该紧凑形式下估计这些模型所需的必要方法。
A. 关联量子噪声的分类与建模
本工作提出了一种操作性视角(operational viewpoint),其设计目标在于具备充分的表达力,以捕捉并控制文献中尚未处理的动力学效应。此外,我们力求使该方法具备模块化特性,以便研究者能根据预期的物理机制便捷地进行调整。在切入具体表征方法论之前,本节首先讨论我们对可合理视为“噪声”的量子动力学效应的划分方式。当然,这种分类具有主观性——我们无意强加某种规范;相反,我们的目标是根据实验者能控制与不能控制之物这一哲学立场,为各项选择提供有实质意义的动机。
需强调的是:若从具有理想化控制的量子随机过程视角出发,该问题并无歧义——非马尔可夫性即指其动力学无法分解为一系列动力学映射的直积。然而,在量子计算语境下,门误差无法被理想化,过程甚至可能在其表征过程中发生改变。于是,时间关联性不仅可被控制操作所探知,甚至可能正是由控制操作本身所引发。因此,一个自洽的模型必须明确区分控制误差与过程误差,而这一点在实践中往往被忽视。
我们的讨论围绕“过程”、“控制”以及二者之间“相互作用”的三分法展开——所有噪声均可宽泛地归入这三类之中。相应地,我们的框架以过程张量(process tensors)、超过程(superprocesses)与测试器(testers)为语言,对这三类效应分别建模,如图9所示。
![]()
- 过程与控制的界定
定义量子随机过程历来存在一个根本性难题,其根源在于不同时刻可观测量之间的非对易性[52]。这一问题的解决依赖于一个关键洞见:必须将底层动力学过程与实验者所施加的控制在形式上明确区分开,以妥善处理不同时刻可观测量的非对易性。
因此,我们将所有受驱动的动力学分解为两个对象:过程张量(process tensors)及其对偶对象——测试器(testers),分别对应图9中的“过程”与“控制”。测试器是多时间仪器(multitime instruments):它们对系统进行探测,并允许在控制操作内部携带记忆[52]。
有人或许会主张,过程张量与测试器之间仅存在认识论(epistemic)层面的差异,而非本体论(ontological)意义上的区别。在此语境下,测试器可被视为实验者自身所掌控的过程;这种观点预设了我们对作为控制操作所实施过程具备某种特定程度的认知。然而,一旦我们放松这些假设,二者之间的界限便变得模糊。
直观而言:过程指的是在每一次实验中都会发生的那部分动力学;而控制则使得实验者能够按其意愿,将一个实验与另一个区分开来。换言之,某些要素处于实验者的直接控制之下,某些处于间接控制之下,而另一些则完全不可控。
我们以过程与控制的这种形式化分离为基石,旨在对非马尔可夫开放量子系统进行完全一般性的分类、建模与估计。本讨论以量子比特寄存器为背景展开,但同样适用于任意 d 维系统。
![]()
过程误差正是我们迄今为止在本文中讨论的随机噪声。它是无论实验者采取什么行动都会发生的随机噪声。这些效应完全编码在过程张量 的理想化模型中。我们接下来可能拥有的最传统的量子设备误差概念是仪器本身引起的误差。
定义2(控制误差)。控制误差是设计用于操控系统的一个操作或操作序列,其对系统的操控偏离了预期效果。动态应该是(a)可控的——实验者应该能够打开和关闭该效应——以及(b)不总是开启的——否则,该效应不应在所有实验中存在;否则,它是过程的一部分。后一个条件可以等效地读作门依赖噪声。
控制误差是系统的动态效应,其起源来自控制设备。因此,即使控制本身不能完美,这些效应也可以通过实验者随时开启或关闭。最后,我们考虑另一个意外但不同的不完美控制操作的后果。
定义3(超过程误差)。超过程误差是一个控制操作(可能由实验者开启或关闭),它(a)作用于扩展的希尔伯特空间,不仅操控系统,还操控环境的一部分,以及(b)以一种修改环境负责任何未来过程误差的部分的方式进行。
参见图9,它描绘了一个超过程误差。当我们引入溢出误差时,这种术语将变得清晰。超过程误差与过程和控制误差重叠,因为物理起源是控制设备,效应可能由实验者开启或关闭。但由于它们也操控了系统相互作用的更广泛环境,这些可以修改 S 和 E 之间的持续相互作用,从而改变过程的性质。在当前的过程张量框架下,这些无法描述。
非正式定义
我们现在进一步细分这些类别,并为每种情况提供一些物理动机。请注意,这些类别具有重叠特征,我们提供的区分是为了突出我们认为特别值得强调的属性。我们在此非正式地引入这些概念,并在附录A中扩展定义以及提供一些具体示例。
完全马尔可夫——在量子表征社区中被广泛接受为完整表征的定义。
![]()
主动和被动交叉——交叉是几乎所有当前硬件平台上相关噪声的主要来源。交叉启动了不同量子比特之间或由于控制不同系统而在单独量子比特上的不希望的相互作用。在此背景下,单独的量子比特必须被视为正在研究的系统的一部分。此定义与参考文献 [103] 中的定义一致,增加了我们区分主动和被动交叉的二分法。通过主动,我们指的是由于对不同量子比特应用控制而在一个量子比特上产生的错误。这可能是权重误差,例如在附近的驱动音调上进行斯塔克偏移 [104],或更高的权重误差,例如在Mølmer-Sørensen门中重叠。通过被动,我们指的是量子比特之间的未期望相互作用由量子比特之间的非局部项控制的始终开启的哈密顿量控制。
过程非马尔可夫性——非马尔可夫性的定义在量子随机文献 [85] 中已确立。由于系统-环境相互作用的结果,如果其过程张量不能分解为动态映射的张量积,则过程是非马尔可夫的。这可能源于经典场生成的相关性或与附近相干量子系统的相互作用。我们在此处添加“过程”描述,以进一步表明被动性:与实验者应用的门无关的交互发生。控制非马尔可夫性——上述非马尔可夫性类别不足以捕捉所有时间相关的动态。主要问题在于,控制操作被假定为完全理解和完全有意。然而,受控的量子比特集合本身可能能够介导时间相关性。我们区分这一点与过程非马尔可夫性,因为这些相关性可能不会在每个单独实验中显现;它们依赖于应用的门序列。在这项工作中,我们使用量子测试器框架(图9中的黄色组合)来表征控制非马尔可夫性。测试器,即过程张量,可以是过程的时间非局部输入。因此,如果一系列门由测试器描述,其Choi状态不表征,则动态中存在控制非马尔可夫性。
![]()
准静态噪声和漂移之间主要区别在于,模型可以捕获准静态噪声,并将在未来运行中通过相同电路的多次运行进行验证,因为未来运行也将边缘化时间依赖性。而如果实验漂移,则 被边缘化以产生非马尔可夫模型,但该模型可能对任何特定 无效。如果电路被光栅化 [105,106](每个电路在重复射击前运行一次),那么漂移模型将被转换为准静态模型,PTT将适当地表征任何漂移为非马尔可夫性。然而,在软件中几乎无法抑制其影响。我们在附录A中扩展了每个要点。还值得强调的是,在时间相关效应表现为时间相关的情况下,结果记忆将始终看起来是经典的,因为情况是马尔可夫过程的凸组合。也就是说,结果过程张量将是可分离的。任何对时间纠缠的检测,因此,排除边缘化时间依赖效应。
非线性溢出——我们迄今为止考虑了量子过程中噪声的两种主要机制:(可能相关的)背景动态和(可能相关的)控制操作。我们最后引入第三种可能的机制,我们正式称之为超过程误差,俗称为非线性溢出误差。我们通常仅将其称为溢出以简化。然而,其非线性特性使其与通常的量子噪声变化不同。这也是其非线性使得溢出非常难以表征和控制。
这种机制描述了干预不仅操控系统,还意外地操控与其交互的环境的情况。例如,实验者实施的控制操作驱动了一系列频率,包括一些与环境跃迁跃共振的频率。由于我们无法可靠地访问环境,我们不能简单地将动态膨胀以包含在模型中。相反,我们继续采用我们的开放系统哲学,建模这些效应如何修改我们系统的动态。因为我们正在引入一个概念上不同的框架来描述这些类型的动态,所以我们在任务上投入了更多的注意力。具体来说,我们在讨论中定义溢出效应如下。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
B. 自洽过程张量层析的推导
现在我们已经正式分类了各种噪声过程,我们希望开发方法来实际表征这些噪声过程。这提出了将控制噪声与过程噪声和溢出分离的挑战。为此,我们现在推导出一种方法,将实验设计和这些一般过程和控制动态的重建结合起来。这旨在遵循GST的精神,并由参考文献 [58] 中的推导数指导:门集不是理所当然的,而是我们旨在自洽地估计底层动态。有了这种形式化,我们再次转向张量网络,以帮助我们在实验环境中进行实际压缩和估计。
GST的张量与近期量子设备高度相关:SPAM误差显著,门不完美。因此,单独考虑这些噪声机制以描绘设备性能的完整图景非常重要。但GST有其缺点。最显著的是,它采用完全马尔可夫模型。概率通过矩阵乘法从模型中获得,这仅在所有动态(包括过程和控制)完全时间局部时才是准确的表示。此外,门本身以及周围的过程被组合成一个对象,没有区分两者。我们已经看到过程张量能够编码时间相关性,并且可以在实践中估计 [18,4444-46]。我们现在希望进一步发展我们的形式化方法,结合GST的理念——假设模型而不是我们控制操作的参数——但也表征非马尔可夫过程,正如我们迄今为止所做的。结果是对过程张量的稳健估计,以及用于探测该过程的可能噪声干预。
![]()
过程和仪器都可以使用超过程转换进行转换。这是当然的,一个非常通用的陈述。任何控制仪器动态的变化都会引入一个超过程机制。
![]()
![]()
![]()
![]()
![]()
![]()
时间局部基和时间局部过程
![]()
![]()
![]()
C. 作为局域纯化密度算符的过程张量
在许多物理上相关的过程中,非马尔可夫记忆——或承载该记忆所需的有效环境维度——不应增长过大。事实上,过程张量的MPO(矩阵乘积算符)表示的键维数已被证明是非马尔可夫性的一种度量[51]。然而,目前对过程张量MPO的研究大多以数值实验形式展开。将其推广至实验场景的主要难点在于:如何以鲁棒且物理合理的方式实际估计该对象。
本节聚焦于这一问题:给定一组实验数据,我们如何实现稀疏版本的过程张量层析(PTT),并估计出该过程的张量网络表示?与那些近似的有限马尔可夫阶模型不同[45,115],我们观察到张量网络在许多情况下能精确表示一个过程——尽管其代价是更高的经典计算开销,且在估计中缺乏收敛性保证。尽管如此,我们提出了一种强大的估计流程,并验证其在刻画多量子比特、多时间非马尔可夫过程方面的有效性。
我们的方法具有模块化特性:
- 为过程构建一个张量网络Ansatz(试探性结构);
- 采用对数似然函数作为目标函数;
- 利用自动微分(autodifferentiation)计算各张量的梯度;
- 最后执行一种随机梯度下降的变体,以找到最大似然模型。
其灵活性在于:过程的张量网络模型完全通用,可由用户自定义。
本节及下一节将详细阐述我们如何将多量子比特、多时间过程及仪器建模为正定张量网络,并进而对其进行估计。若读者主要关注结果与控制应用,可直接跳至第III A节及之后内容。
- 表示方法
过程张量天然适合用局域纯化密度算符(Locally Purified Density Operators, LPDO)来表示——这也是文献[73]所采用的核心对象。除初始态(可能为混合态)及末态对环境自由度的偏迹(partial trace)之外,整个动力学过程本身是幺正的。因此,仅过程的起点与终点需要算符表示。
我们在此基础上拓展文献[51]中给出的理论构造。由于过程张量的Choi态本身是一个密度算符,其具有矩阵乘积算符(MPO)表示,可写作:
![]()
撰写这些分解的目的是展示非马尔可夫环境是过程张量的自然局部纯化。如果我们将过程写成链路积形式[52],这种关系更容易从图形上看出:
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
这种相当繁琐的指标记号代表了我们过程的一个三维张量网络表示,其要点总结如下列表及图12所示。
![]()
![]()
这种 Ansatz 的效率依赖于过程遵循面积定律增长。也就是说,整个网络的最大键合维度应被一个常数所限制。顺便说一句,尽管我们在这里有三个键合维度,使其成为一个几何上的三维网络,但由于过程张量自然编码的环状结构,这应被解释为分层的二维张量网络。然而,我们必须小心。二维张量网络可能有效地编码一个状态——因此需要更少的量子资源,但它们不能被有效地收缩[64]——因此网络区域的经典计算呈指数增长。出于这个原因,我们将我们的方法限制在要么只有几个时间步和许多量子比特,要么许多量子比特和几个时间步。为了纠正这一点,可以将上述方法与马尔可夫阶 Ansatz 结合起来,使其在 时空中有效。
- 自洽性
在第IV B节中,我们推导出一种形式体系,可同时刻画控制非马尔可夫性、过程非马尔可夫性以及二者之间的相互作用。对于完全通用的过程,该问题的复杂度随时间步数 k k、量子比特数目以及门集中的门数量呈指数增长。在文献[45]中,常规PTT即便在完全通用情形下,也仅能处理单量子比特、三时间步的情形,便已因实际限制而难以为继。尽管完整PTT尚具一定可行性,但实现通用的自洽性(general self-consistency)则完全不现实。因此,我们认为必须采用张量网络方法,才能实际执行该表征任务。
这种方法不仅显著压缩了表示规模,还可根据系统预期的物理特性实现模块化设计。我们在上一节方法的基础上进一步发展,构建了一种自洽的估计方法,能够同时估计任意量子随机过程及其用于探测该过程的含噪仪器。在第III A节与第III B节中,我们通过多种合成数据与真实数据验证了该表征方法,展示了其如何准确捕捉广泛类型的含噪量子动力学。
![]()
![]()
![]()
也就是说,它是上述两种表示的一个 单一张量网络缩并 (single tensor network contraction)。至此,我们已具备估计这些对象的条件。
D. 高效且自洽的过程张量层析的实现
我们现在介绍一种针对任意非马尔可夫量子随机过程的张量网络估计流程。此处我们对门操作的形式做了一些特定选择,但这些选择并不影响该流程本身的普遍适用性。具体而言,为便于演示与表述简洁,除过程张量与最终测量操作之外,我们暂仅考虑学习幺正操作;然而,若具备相应的(可能是时间非局域的)信息完备(IC)基底,该流程可直接推广至任意操作。
![]()
![]()
![]()
我们的目标函数 f f(用于量化模型拟合优度)为对数似然函数:
![]()
![]()
I. 正则化
我们的张量网络Ansatz被定义为正的,但没有约束来确保它是因果的(因此是物理的)。在参考文献[45]中,我们通过在每一步将过程张量投影到因果量子态的线性空间中,严格地将因果性编码到我们的过程张量中。这种投影梯度下降配备了性能保证,即最大似然估计算法的最终输出将保证位于由因果条件定义的正半定矩阵锥与线性空间的交点上。随着我们转向更大的问题,由于投影的指数缩放,这种方法变得不可行。我们将过程的正性编码到我们的LPDO参数化中,但我们提出了一种更启发式的方法,通过在目标函数中对其进行正则化来保持因果性。
![]()
![]()
![]()
![]()
![]()
![]()
- 模型拟合
我们现在可以着手构建问题:将我们的张量网络模型拟合至某组实验数据,以表征多时间、多量子比特的量子随机过程。所选用的目标函数由三部分求和构成:(平均)对数似然、前述因果性正则项,以及迹保持(TP)正则项:
![]()
![]()
- 避免过早收敛
采用完全正定(completely positive)参数化来表示张量网络形式的过程张量,其一个后果是:目标函数变为非线性,从而使得优化问题不再凸——这是机器学习领域普遍存在的难题,通常通过随机优化方法(如随机梯度下降或Adam算法)加以应对。将输入目标函数的数据划分为随机批次,也是一种有效摆脱局部极小值影响的强有力策略。此外,一个常见的辅助技巧是:从多个随机生成的初始参数(seed)出发启动优化过程,以避免陷入相同的局部极小,理想情况下可逼近全局最优解。
尽管我们采用了上述策略,但在大量试错后仍发现:张量网络学习问题的收敛速度可能严重受限——往往需要极多轮迭代或频繁的“冷重启”(cold restarts)才能收敛。这种情况总体上并不理想;尤其当表征目标是为设备校准提供前馈输入时,问题更为突出。更棘手的是,一般而言我们无法判断:收敛失败究竟源于模型所选键维数(bond dimensions)不足,还是仅仅因为尝试的初始种子数量不够。
不妨换一种思路:现实中,待表征过程往往邻近某种可预期的模型。所谓“邻近”,即指其接近于:
![]()
其中,|Φ⁺⟩ 是通过在额外轴向上补零而调整为适当张量形状的贝尔态(Bell state),而 R̃ 是一个具有相同形状的张量,其元素从复高斯分布 (0, 0.1) 中随机选取。
在所有模拟和真实演示中,我们发现这一初始点不仅有用,而且是在合理时间内获得解的关键所在。此外,我们发现在所有情况下,从该初始点出发均能实现收敛。然而,期望人们总是知道应围绕哪个过程进行微扰,在现实中并不完全合理。但我们预计,只有当实验者希望调校设备以应用特定协议(例如误差抑制或纠错协议)时,后处理时间才会成为一个重要因素——在这种情况下,实验者总会明确其目标信道(即设备旨在产生一组纯净、恒等的动力学)。然而,如果表征的目的在于学习一个完全未知的量子随机过程(例如,来自处于未知环境中的量子传感器),那么后处理时间便不再是一个关键因素,最终的解可通过机器学习中的多种方法找到。
另一个与收敛问题相关的超参数是每次实验的采样次数(number of shots per experiment)。这同样需要一些精细调节:若每次实验采样过少,数据景观可能极度嘈杂,导致模型无法拟合到足够好的结果;若采样过多,则模型容易相对于其数据发生过拟合。此处的调节无需过于精细,在实践中我们常发现,较宽范围的采样值都能得到优秀的模型拟合效果。尽管如此,我们仍对不同规模的问题进行了启发式研究,以期找到一个良好的实用指南。附录B提供了一系列模拟基准测试,用于确定在广泛类型的过程上,估计所需的时间与精度。
- 基准门集
一般而言,出于计算便利性与表述简洁性的考虑,我们并不会同时启用模型在此所描述的全部特性。尽管完整考虑所有可能效应并非不可行,但我们发现,围绕预期物理机制设计一个更精简的模型更为实用——这也正是我们方法所具备的模块化特性极为有用的原因所在。例如,若我们不预期控制仪器中存在关联性,便只需将键维数设为 1,此时多时间仪器将完全退化为时间局域形式。
此外,我们还可针对特定硬件平台对模型进行简化设计。例如,在 IBM Quantum 设备(及众多其他硬件平台)中,单量子比特幺正门可分解为物理 X 脉冲序列与虚拟 Z 旋转的组合,从而使得任意单量子比特幺正操作可表示为三个参数的函数 u ( θ , φ , λ )
:
![]()
![]()
根据当前技术的可行性,我们在此主要考虑受限过程张量(restricted process tensors)的估计。所谓“受限”,是指我们仅考察由一系列幺正操作后接一个最终终止性测量所构成的序列。这意味着每个测试器 仅为一个两结果探测器(two-outcome probe)。因此,该流程的设计目的并非唯一地学习过程张量的全部内在属性,而是捕捉动力学的外在可观测行为。不过我们强调,该形式体系完全兼容多时间统计量的估计,具体可依据文献[46]中的方法实现。
V. 讨论
本工作中,我们从两个层面应对关联噪声的挑战:其一,将各类非马尔可夫过程的概念统一于一个连贯的理论框架之中;其二,发展出高效的方法,即使在对抗性(adversarial)场景下也能表征此类噪声。我们通过大量数值模拟及在IBM量子设备上的真实噪声实验验证了所提方法的有效性——结果凸显了稀疏模型在无信息损失的前提下,精准捕捉时空关联效应的能力。
我们的贡献体现在以下四个方面:(i) 深化了对量子噪声本质的概念性理解;(ii) 推进了噪声表征的技术前沿;(iii) 实现了对奇异关联噪声的实用化分析;(iv) 提出了面向量子设备最优控制的新方法。
我们的方法使系统性电路编译成为可能——可根据设备特有的“噪声指纹”(noise fingerprint)量身定制编译策略。传统最优控制讨论通常聚焦于极细粒度的脉冲整形(pulse shaping)层面[119,120]。然而此路径存在一个实际困难:每当信号发送至设备时,必然存在失真——脉冲采样并非理想的阶跃函数,且其物理实现因量子比特而异。因此,尽管理论方案可依据硬件物理特性定制控制,数据采集与前馈调节终究不可或缺。
此外,专门设计的脉冲整形通常仅能抵消作用迅速的关联误差,却无法处理例如门序列中的上下文依赖性(context dependence)等问题[121,122]。相较之下,我们的方法直接接受原始脉冲,并在其既有形式下尽可能深入地学习其行为特性。所得结果与现有控制系统软件高度兼容,并专为在算法执行中阻断误差传播而设计。此类稳健的表征还能帮助用户判断:在何种环节仍存在通过主动控制进一步提升性能的空间。若在所关注的时间尺度上存在非马尔可夫性,则总可通过审慎选择幺正操作,持续拓展处理器的性能边界。
非马尔可夫噪声的普遍存在性已在当前量子计算硬件中清晰显现[25–27, 29–36, 60, 61, 122]。然而,其更深远的影响——尤其是病理性噪声对未来设备与实验的潜在威胁——尚未得到充分重视。特别值得警惕的是,关联噪声所具有的对抗性(adversarial nature)可能严重阻碍容错量子计算的发展进程[10,11,24,123]。在硬件既昂贵又稀缺的背景下,能够精细控制并补偿此类动力学的软件工具,将有助于“以更少资源实现更多功能”。对真实设备噪声的深入剖析所带来的益处是多方面的:在误差抑制方面,我们已看到,可通过确定性控制策略优化电路编译与动力学解耦序列的性能;而在误差缓解(error mitigation)领域[43,124],真实的噪声模型亦可规避过于悲观的理论分析[125]。此外,此类表征还可自然地融入张量网络解码器[40,87],以提升解码性能,甚至助力设计面向特定硬件的纠错码[15,16,41,42]。无论在概念层面还是实践层面,我们的方法均推动了这一重要问题的前沿进展,我们预期其将在广泛的量子计算软件生态中获得广泛应用。
本文所呈现的结果实现了表征方法的准可扩展性(pseudoscalability):将采样开销降至多项式复杂度,并支持任意时间步长。然而,若要真正实现对数十乃至数千量子比特的大规模基准测试,仍需进一步突破——此处所用的二维张量网络将变得难以处理,必须引入时空马尔可夫阶(spacetime Markov order)概念,以在因果上解耦不同区域[45,115]。亦可探索其他几何构型:对于具有多项式衰减关联的系统,树状结构或许能更高效地捕获核心物理[100]。这建立起细粒度与粗粒度过程记忆、以及量子纠错协议之间的联系——其中,噪声尺度可在脉冲级、门级与逻辑级上各不相同。在理论上构建关联噪声的层级化概念,将有助于深入理解其对量子处理器的实际影响。
本论文延续了“以操作性方式理解非马尔可夫量子噪声”这一研究纲领。该纲领的核心目标是构建用以表征与控制复杂噪声的实用工具。本文为此提供了一项有力的新工具,可供量子工程师纳入其技术工具箱:它融合了GST(目前广泛使用的量子基准测试工具)的理想特性,并弥补了现有基准测试工具在处理非马尔可夫噪声方面的空白。尤为重要的是,我们所开发的工具天然适配各类近似方法以实现可扩展性——例如量子马尔可夫阶方法[45,115]、标准张量网络压缩技术,或Pauli-twirled Clifford电路[126,127],从而支持大规模部署。另一未来方向是将其与快速贝叶斯层析[105,128]方法结合,实现噪声的自主实时表征。对非马尔可夫噪声的紧致描述,将有力促进对复杂噪声模型具备鲁棒性的量子纠错方案的发展。
我们展望在本模型内开展更精细的参数估计研究,其灵感来自GST[61]。我们已指出:当键维数 χ = 1 时对应马尔可夫模型,可视为GST的一种可扩展实现。在张量网络压缩数据方面的相关进展已有报道,但在系统维度上的显式拓展尚待完成[129]。对近期量子设备实现稳健而全面表征的关键要素包括:用于增强探测灵敏度的相干参数放大、不可观测量规范(gauge)的优化,以及非马尔可夫噪声源的识别[102]。此外,当前的表征模型仍是临时构建的(ad hoc),依赖用户手动选择(如键维数设定)。未来可受益于集成自动化模型选择流程,例如采用遗传算法[130]。
参数的精密估计不仅关乎量子计算机中的噪声探测,更可推广至任意开放量子系统。因此我们强调:本文成果的应用远不止于噪声研究本身。这些发现亦可能引起计量学界的关注,尤其是在非马尔可夫环境下的量子传感领域。过程张量层析(PTT)本质上是一种通过结构化控制来探知环境的学习方式——它将最优估计问题转化为基于量子梳(quantum combs)的自适应计量学问题,尤其适用于实际有限采样场景[131...
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.