Single-shot quantum machine learning
单次量子机器学习
https://refubium.fu-berlin.de/bitstream/handle/fub188/47851/PhysRevA.111.042420.pdf;jsessionid=776062AB188475D7F0CBB3DA1EB3A425?sequence=1
![]()
量子机器学习旨在通过使用量子计算机来改进学习方法。如果要实现其潜力,需要克服许多障碍。一个特别紧迫的问题出现在预测阶段,因为量子学习模型的输出本质上是随机的。这造成了通常相当大的开销,因为需要聚合多次执行量子学习模型的结果才能获得实际预测。在这项工作中,我们分析了量子学习模型何时能够规避这个问题并以近乎确定性的方式产生预测——为单次量子机器学习铺平道路。我们对量子分类器中的单次性给出了严格的定义,并表明量子学习模型接近确定性的程度受到模型中使用的嵌入量子态的可区分性的约束。打开嵌入的黑匣子,我们表明如果嵌入是通过量子电路实现的,那么单次性成为可能需要一定的深度。我们最后表明,量子学习模型不能以通用方式实现单次性,并且同时可训练。
I. 引言
机器学习是一个迅速发展的领域,其快速进步经常推翻关于经典计算机能学和不能学什么的假设。这一持续的成功故事激发了人们对量子机器学习的兴趣,这是与量子计算的交叉领域,后者最近也取得了巨大的技术进步。研究量子计算机是否可以用来构建某种超越经典同行的学习模型,已经成为量子机器学习的主要研究方向之一。
虽然这些模型的内在量子特性至少在理论上有潜力突破经典可能性的界限[1-4],但它也带来了固有的缺点。之前在这方面的研究主要集中在训练阶段,其中如贫瘠高原[5]等问题使量子学习模型的优化变得复杂。然而,在推理阶段也会出现一些问题,即当量子学习模型需要产生预测时。一个名副其实的量子学习模型需要对量子系统进行某种操作。然而,为了提取经典标签,需要进行测量。量子力学的本质决定了这种测量的结果本质上是概率性的。为了让模型解决学习问题,例如正确分类图像,输出需要是确定性的。在实践中,量子学习模型需要运行很多次以规避测量的概率性结果并提取预测,例如以适当选择的可观测量的期望值形式。即使在容错量子计算机上运行模型,这个问题,即所谓的测量问题的一个实例,仍然存在。
量子力学的非确定性意味着量子学习模型通常伴随着经典学习模型中不存在的开销。这在很大程度上限制了它们的吸引力,特别是因为这不仅增加了产生预测所需的时间,还增加了成本。考虑到完整的量子机器学习流程,能够减少给定量子模型的测量开销将降低各个阶段的成本。在非重复设置中,这也可能很有用,例如当产生量子态并需要一次性分类时,例如在从光的散射态检测物体时。
在这项工作中,我们研究是否可以规避这一特定限制,特别是在什么条件下可以从量子学习模型的单次运行中提取预测(见图1)。我们建立了这种单次模型的严格定义,并使用量子假设检验工具来理解它们的最终限制。如果量子分类器是使用量子电路构建的,我们确定只有当电路具有一定深度时,单次性才有可能。我们处理了无噪声和有噪声的情况。我们通过确定表现出单次性质的学习模型通常是过度表达的,因此难以训练,来补充我们的结果。
![]()
为了理解量子学习模型的全部潜力,已经投入了研究其潜力和限制的努力。量子学习模型,特别是量子分类器,可以通过多假设检验的视角进行分析,这在参考文献[6-12]中已经得到了利用。参考文献[11]指出,表达能力和泛化性能之间存在权衡。通过训练减少可观测量的方差来减少量子学习模型的测量开销已经尝试过[13]。量子电路的连续性属性也在参考文献[14]中进行了研究。
本文的结构如下:我们首先介绍量子分类器(第二节)和量子多假设检验(第三节)。我们接着在第四节引入单次量子学习模型的概念。在随后的第五节中,我们使用描述的概念和工具提出界限,确立浅层模型不能具有单次性质。最后,在第六节中,我们展示了实现通用单次性质的量子学习模型难以学习。我们在第七节中总结本文。
II. 量子分类器
![]()
![]()
当使用可观测量的期望值来确定标签时,这也在隐含地发生,因为通常需要多次运行量子实验来忠实地近似期望值。
III. 量子多假设检验
![]()
![]()
在贝叶斯和极小极大设置中,最优测量可以通过半定规划(SDP)[16]来计算。假设检验的有用性源于我们对多假设检验误差有良好的下界。在二元假设检验的情况下,,我们甚至有一个封闭形式的解。赫尔斯特罗姆-霍列沃定理[17]将二元假设检验的最小误差与量子态的迹距离联系起来。
![]()
![]()
![]()
证明见附录A。在极小极大设置中的相应结果是直接的,因为当考虑较少替代方案的假设检验时,最坏情况下的误差只会改善,因此
![]()
结合上述结果和Holevo-Helstrom定理,我们得到了多假设检验问题误差的下界,该下界以量子态的成对距离表示。我们注意到这些下界不一定是最紧的。但它们允许我们稍后将单次量子学习模型的限制与基于量子态迹距离的可解释量联系起来。
量子分类器的多假设检验简化
![]()
![]()
如果我们将上述内容与方程(2)进行比较,我们可以看到量子分类器等同于每个类别的平均状态的量子多假设检验问题。因此,我们可以得出结论,量子分类器的误差至少是最优可实现误差。
![]()
不同类别的嵌入状态必须能够很好地区分开来以实现合理的准确性——这也可以通过其他损失函数来衡量——这一事实已经在之前的工作中观察到[6,8,11]。
IV. 单次量子机器学习
我们必须多次运行量子分类器的事实,如第二节所解释的,导致了所谓的测量问题,这意味着与经典方法相比,由于量子力学的概率性质,存在额外的开销。本工作的目的是通过强制分类器对分配的标签非常确定,以至于只需运行一次就足够了,即我们称之为“单次”分类器,来正式化何时可以规避这个问题。
A. 单次分类器
![]()
![]()
![]()
![]()
![]()
其中概率是取自分类器固有的随机性。
![]()
![]()
![]()
B.Geometric picture
然而,即使是连续参数化的分类器也可以在数据域的子集上认识论上是单次的,如果我们看到的点很可能来自该域,我们仍然可以有相当好的贝叶斯单次性能。正是这种思想通过以下引理形式化,这只是一个简单的联合界限的应用。
![]()
![]()
![]()
C. 与样本复杂度的关系
我们可以将概率分类器的单次性概念与我们在处理量子机器学习模型中的测量问题时通常遇到的样本复杂度概念联系起来(另见参考文献[12])。这可以通过考虑使用相同的“弱”分类器进行m次重复,然后进行多数投票的过程可以被视为一个单一模型,该模型应具有单次性,这相当于低失败概率。数学上,我们有以下关于提升弱分类器成功概率的引理,即具有单次性但失败概率高的分类器。
![]()
![]()
我们本可以使用来自切尔诺夫-霍夫丁定理的更紧密估计,该定理涉及独立同分布的伯努利随机变量之和,但这些改进对于我们的论证并非必要。如果我们选择 β 为 ![]()
的最大值和次最大值之间的一半差距,我们可以保证多数投票的成功结果。形式上,我们可以将差距定义为:
![]()
![]()
V. 单次量子机器学习的最终极限
在定义了单次性属性之后,自然会问是否可以为给定的嵌入实现它,反之,实现允许单次分类的嵌入需要什么资源。本节致力于通过将单次分类任务简化为多假设检验任务,来探索单次量子分类器的最终极限。在建立上述简化之后,我们打开嵌入的黑匣子,并建立量子电路需要建立单次性属性的门复杂度的下界。
A. 简化为假设检验
在第三节中,我们已经看到量子分类器的误差概率可以通过简化为多假设检验来下界。我们可以采用类似的论点来界定单次误差概率 δ 的最佳值。微妙的区别在于我们不再关心根据真实标签来很好地分类数据,因为它们没有出现在单次性定义中。相反,我们希望分类器根据分类器本身分配的标签工作,即方程(1)中的。在这种视角变化之后,论点可以类似地进行:
![]()
![]()
![]()
我们注意到,理论上,我们可以通过在每个标签中包含多个状态来进一步改进上述认识论单次误差概率的下界,这将导致简化为复合多假设检验问题。这些问题研究较少,可用的分析工具也较少。然而,对于数值研究,这与半定规划结合是实现更紧密界限的适当方法。
我们现在使用第三节中介绍的工具,将单次量子分类的最终极限与更直观的量联系起来。我们将第三节的二元情况简化与方程(4)中的Holevo-Helstrom定理应用于第五节A中的贝叶斯误差概率下界。这给出了以下误差概率的下界,以不同类别的平均状态的迹距离表示:
![]()
![]()
从这一点来看,我们可以得出结论:不可知单次性(agnostic single shotness)对分类器预测的不同类别嵌入状态之间的距离提出了很高的要求,因为我们可以将上述不等式反过来得到:
![]()
从这个界限来看,任何随 x 连续变化的嵌入 都无法在整个 x 的值域上实现不可知单次性。这再次强调了不可知单次性的定义需要限制 x 的定义域 X,正如我们在第IV A节中从不可知到贝叶斯的提升中所使用的那样。
在建立了不可知和贝叶斯设置中单次错误概率与嵌入状态的迹距离之间的联系之后,我们打开了嵌入的黑箱,并考虑它是由变分量子电路实现的。在这种情况下,施加一定的单次错误概率需要电路具有一定的深度和/或宽度,如下所示。
B. 无噪声量子电路
![]()
![]()
第V B节向我们展示了参数化电路将接近的数据点嵌入到也接近的量子态中。直观上,我们可以推断出,对于两个接近但属于不同标签的数据点,量子分类器将面临困难。我们在以下定理中对此进行了形式化:
定理3. 单次性错误概率的下界(贝叶斯)。设是一个量子分类器,其任务是对我们已知其概率分布的 r 组经典数据进行分类。单次性错误概率被两个数据类之间最差的平均距离所限制,
![]()
![]()
![]()
在此需要强调的是,即使上述定理的条件允许某种单次性错误概率,这并不一定意味着(通常也不期望)电路实际上达到了这种单次性错误概率。
C. 有噪声的电路
现实的电路远非完美。在NISQ(Noisy Intermediate-Scale Quantum)时代,它们受到限制其性能的普遍噪声的影响。为了研究噪声对量子分类器单次性的影响,我们研究了一个错误模型,其中具有存活概率 p 的局部去极化噪声![]()
在对每个量子比特进行分类器计算的每一步之后应用,其中 ω 是在每一步计算之后应用的最大混合态。为了在数学上跟踪这一点,我们将使用符号来表示在 t 步计算之后由有噪声的嵌入电路产生的量子态。在我们的嵌入电路模型中,我们到目前为止已经计算了层数 L,其中每一层由我们假设需要一步计算和固定酉变换以及变分量子门组成,我们假设需要 ℓ 步计算,从而在我们的参数化电路中总共需要步计算。
受局部去极化噪声影响的量子电路最终将产生一个非常接近最大混合态 ω 的量子态。这一结果是通过计算 t 步计算后电路状态之间的相对熵的衰减而建立的,并得出以下估计[19]:
![]()
然而,这个估计没有考虑到电路的连续性,因此对于接近的参数,它实际上可能过于乐观。由于有噪声的信道不能增加状态之间的迹距离,我们立即可以看到,如果考虑有噪声的电路,第V B节的结果仍然有效,尽管它也会过于乐观,因为它没有考虑系统中的噪声。一个简单的结合这两个估计的方法就是简单地取两者中的最小值,这给出了:
![]()
与仅噪声估计相反,上述界限并不随着衰减至零,这意味着它只能在有限的参数区域内改善方程(66)的估计。 然而,它确实总是能改善由方程(57)给出的简单连续性估计。图3展示了三种不同界限的比较。 现在,我们可以以类似于第V B节的方式重新连接到单次分类的设置。推导可以类似地进行;只是常数 L 被替换为:
![]()
结合我们为有噪声情况推导出的所有三个界限,为我们提供了量子分类器预测的每个多数类嵌入平均状态之间可实现距离的上界,因此,允许我们分析有噪声量子分类器进行单次分类的可能性。
![]()
VI. 通用准确的单次模型难以学习
在建立了单次量子机器学习的理论基础之后,我们了解到单次性是训练模型的一个属性,这不一定是给定的。它依赖于量子学习模型将经典数据嵌入量子态的具体方式,并且只有当相同预测标签的量子态聚集在一起时——换句话说,它们与不同预测标签的量子态不太接近时,才会显现出来。
从这种直觉中,我们可以看到,理论上应该可以构建一个嵌入,使得对于数据集的所有可能标记都能实现单次分类。在机器学习语言中,这意味着模型足够表达能力强,可以粉碎数据。这是通过将所有足够分离的输入嵌入到希尔伯特空间的相互正交方向来实现的。人们期望,例如,我们可以通过使用大量编码门与深层随机酉门交替来构建这样的嵌入。然而,很明显,这样的嵌入将导致任何从训练数据中推断出的POVM的泛化性能不佳。以前未见过的的数据点将被嵌入到希尔伯特空间中嵌入训练数据的正交补空间中。在那里,我们无法推断出一个好的分类,最好的策略将是随机猜测。
这个“思想实验”突出了(量子)学习模型的一个固有问题,即表达能力、可训练性和泛化性能之间存在微妙的权衡,这是量子机器学习中正在进行的研究的主题[11,20-22]。在本节中,我们将展示这种权衡也影响学习模型的单次属性。
![]()
这并不限制我们论点的普遍性,因为非常接近的数据点将代表相同的输入。一个例子是图像:可以被认为是合理不同的图像也必须具有合理不同的像素值。直观上,我们期望一个通用准确的单次模型应该将所有至少被 ξ 分隔的点映射到希尔伯特空间中的(大约)正交方向。
为了研究这类特定模型,我们依赖于参考文献[6]的结果。在那里,作者研究了本质上相似的问题,即从以下形式的示例中学习一个POVM效应:
![]()
![]()
![]()
为了在D维希尔伯特空间中以精度 ϵ 学习一个POVM效应所需的样本数量。我们在这里提出的论点并不依赖于近似的概念和精度,而是依赖于维度的依赖性。然而,以算子范数对POVM效应的 ϵ-近似立即保证了通过矩阵Hölder不等式,实现的二元分类器的精度在加性误差内接近目标。
我们剩下要分析的是我们要考虑的希尔伯特空间的维度。为此,我们回到我们的假设,即在某种范数下相距 ξ 的输入应该被映射到希尔伯特空间的不同角落。这意味着我们有D大约是我们选择的范数中需要覆盖输入空间X的球的数量。如果空间具有某种特征长度L和维度d,我们预计需要:
![]()
维度,这在输入大小方面是低效的,正如我们从思想实验中所预期的那样。这也与参考文献[11]的结论一致,该结论表明,表达能力过强的模型泛化性能较差。
VII. 结论
如果量子机器学习要变得有用,必须克服许多障碍。其中之一就是直接源于量子力学概率性质的测量问题。量子学习模型的预测本质上是随机的,因此,必须聚合多次执行量子学习模型的结果才能获得实际的预测。
在这项工作中,我们提出了单次量子机器学习的概念。我们建立了一个严格的量子分类器定义,即在何种情况下可以通过几乎确定性地提供标签来绕过测量问题。利用量子分类器和量子多假设检验之间的密切联系,我们确立了量子分类器的单次性基本上受到嵌入量子态可区分性的约束。考虑到嵌入通常由量子电路实现,我们还展示了实现单次分类器需要这些电路的一定深度。
最后,我们还确立了一个学习模型不能以通用方式实现单次性,即对所有可能的输入标记。在这种情况下,它会变得过于表达性强,这样的模型将没有有意义的泛化方式。
这项工作只能被视为我们克服测量问题的开始。它邀请未来在许多方向上进行研究。首先,我们只考虑了这项工作中的分类任务。对回归的推广肯定也是可能的,并且可以用量子计量学简化而不是多假设检验来表达类似的基本界限[23]。
除了扩展单次量子机器学习的定义和基本处理之外,一个紧迫的问题是理解我们如何构建单次模型?我们如何在训练过程中强制执行这种属性以获得准确性和单次性?在这个方向上可能的灵感是考虑与嵌入量子态的可区分性直接相关的训练方式[8]。我们是否也可以找到学习模型或嵌入电路的明确构造,以强制执行一定程度的单次性?
https://refubium.fu-berlin.de/bitstream/handle/fub188/47851/PhysRevA.111.042420.pdf;jsessionid=776062AB188475D7F0CBB3DA1EB3A425?sequence=1
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.