|作者:商红慧1,† 杨金龙1,2,††
(1 中国科学技术大学 精准智能化学全国重点实验室)
(2 中国科学技术大学 合肥国家实验室)
本文选自《物理》2026年第5期
摘要精确求解多电子薛定谔方程是现代科学的核心挑战之一,其内在的指数级复杂性长期以来阻碍了对复杂分子与材料体系的深入认识。近年来,以神经网络量子态为代表的人工智能方法为这一难题开辟了另一条可行路径。基于生成式Transformer架构的神经网络量子态方法——乾坤网络(QiankunNet),通过将神经网络的表达能力与量子力学基本原理结合,在多个维度取得了进展。该方法不仅在基态能量计算精度上达到较高水平,更实现了系统性框架的拓展。实现了原子间力计算、周期性固体材料模拟、大规模并行计算优化,以及与量子嵌入理论和张量网络等方法的结合。文章系统阐述神经网络量子态方法的发展历程,详细介绍乾坤网络的理论基础与技术发展,深入分析其在分子体系、固体材料和强关联系统中的应用成果,并展望该领域在跨学科研究中的潜在价值与未来发展方向。
关键词神经网络量子态,生成式模型,Transformer架构,量子化学,材料科学
01引 言
精确求解分子和材料体系多电子薛定谔方程是量子力学和量子化学领域的核心挑战之一[1,2]。传统从头算方法(如全组态相互作用,full CI)虽在理论上最精确,但计算量随体系规模呈指数级增长,限制了其在实际复杂系统中的应用[3,4]。并且,即使是密度矩阵重正化群(DMRG)等先进算法也主要适用于一维或准一维体系。因此,发展兼具精度与可扩展性的波函数表示和优化方法,始终是电子结构理论的重要方向。
近年来,深度学习在高维复杂数据建模方面取得显著进展[5—7],也推动了神经网络量子态的发展。2017年,Carleo和Troyer等人首次尝试用人工神经网络表示量子多体波函数,成功求解了复杂的自旋体系基态[6]。随后在2020年,Hermann等人[8]和Pfau等人[9]分别构建了面向电子结构问题的深度神经网络波函数,在小分子体系达到接近全组态精度的计算效果。与此同时,Transformer架构凭借自注意力机制在序列建模上的优势[7,10],不仅引领了自然语言处理的发展,对科学计算领域也有重要借鉴意义[11]。Transformer通过自注意力机制有效捕捉序列数据中的长程依赖关系,为描述电子组态之间的长程关联提供了新的可能。在这一背景下,我们提出了基于Transformer的神经网络量子态方法——乾坤网络(QiankunNet)[12]。QiankunNet的核心思想是将电子的组态视为可自回归生成的序列,并在网络结构中显式引入费米子反对称性等物理约束,确保输出的波函数严格满足量子力学要求。这种结合深度学习与物理先验知识的策略,使QiankunNet能够在不牺牲准确性的前提下,提高对复杂量子体系的计算效率。以QiankunNet为代表的系列工作已从分子基态能量计算扩展到高性能并行、周期性固体、量子嵌入、原子间力和张量网络预训练等方向(图1)[12—18]。下文将围绕其基本原理、技术发展,以及在分子、固体等不同体系中的应用作简要综述。
![]()
图1 乾坤网络(QiankunNet)系列方法的发展路线图
02QiankunNet:利用Transformer网络架构解决量子多体问题
解决量子多体问题的困难在于量子态所处的希尔伯特空间具有指数级维度。为应对这一挑战,我们从经典机器学习领域汲取灵感,因为那里同样存在许多需要在指数级状态空间中寻找解的问题。以自然语言处理为例,一个句子由多个词组 成,每个词从一个词汇表中选择。若设最大句子长度为512,词汇量为30522,则可能的句子构成了规模为30522512的状态空间,这远超过大多数可数值求解的量子多体系统的全状态空间。然而,有效的句子通常遵循少量(隐含的)语法规则,而基于Transformer架构的现代语言模型(如ChatGPT)已能学习这些规则并取得成果。在自然语言处理中,语言模型通常被设计为生成式模型,能处理可变长度的输入并生成可变长度的输出。这些模型具有自回归特性——即给定已观察到的一系列词(token),模型会预测下一个词的概率分布。
QiankunNet的出发点,是把电子组态看作一个序列建模问题。与语言模型在巨大词表中逐词生成句子类似,多电子波函数也可以写成一系列条件概率的乘积,因此可以借助自回归生成模型在指数巨大的希尔伯特空间中高效表示重要组态。不过,量子多体问题与自然语言处理的目标并不相同。语言模型关注生成语义合理的文本,而量子计算需要同时给出众多组态及其精确概率分布,并通过变分原理使能量期望最小。因此,QiankunNet的核心不是“生成一个最佳样本”,而是学习一个满足物理约束的概率分布,以稳定表征体系基态。
在模型设计上,QiankunNet[12]采用生成式Transformer表示波函数振幅,并用较轻量的相位网络描述相位信息,如图2所示。更关键的是,网络结构中显式编码了费米子反对称性和自旋守恒等约束,从而把神经网络的表达能力与量子力学的一致性结合起来。这一设计既提高了训练效率,也保证了所得波函数满足基本物理要求。
![]()
图2 乾坤网络(QiankunNet)的架构图 (a)用于电子波函数拟设的GPT风格解码器Transformer架构,其中Transformer用于计算振幅,多层感知器用于计算相位;(b)预处理:分子系统的哈密顿量通过费米子到量子比特的编码将哈密顿量映射为自旋算符;(c)神经网络量子态(NNQS)计算的流程示意图
QiankunNet的另外一项核心设计是其采样策略。在量子化学计算探索中,如何高效地获取量子态的样本一直是我们关注的焦点。这些样本就像是量子系统的快照,能够帮助我们理解复杂量子系统的行为和特性。传统蒙特卡罗方法主要依靠马尔可夫链蒙特卡罗(MCMC)方法来生成这些样本,该方法可以想象成一个随机漫步者在量子态空间中的旅行。这个漫步者只关心当前所处的位置和下一步可能去哪里,而不会记住自己之前的路径。通过这种方式,漫步者最终会访问量子态空间中的各个区域,其访问频率恰好反映了量子态的概率分布。在MCMC家族中,最著名的可能是Metropolis—Hastings算法。这个算法的核心思想很直观:漫步者随机提议一个新位置,然后通过一个简单的规则决定是否接受这个提议。随着时间推移,漫步者的活动轨迹会越来越接近我们想要的量子态分布。然而,这种传统方法面临几个挑战。首先,它本质上是一个串行过程,每一步都依赖于前一步的结果。这就像是一个人在迷宫中摸索前进,无法同时探索多条路径,限制了计算效率。其次,要获得高质量的样本,通常需要漫步相当长的时间,并丢弃起始阶段的样本。这就像是一个旅行者需要先熟悉环境才能开始有效探索,这个过程消耗了大量计算资源。研究表明,即使使用先进的计算设备,采样数量也通常被限制在百万量级以内。更值得注意的是,相邻样本之间往往存在较强的相关性,这降低了样本的独立性和有效信息量。针对这些挑战,研究者开发了自回归采样方法,其核心思想是:量子态的总体概率可以分解为一系列条件概率的乘积。这就像是解决一个复杂拼图,我们可以一块一块地拼接,每放置一块都考虑之前已放置的部分。这种方法允许我们以顺序方式构建量子态,每次只考虑一个分量,简化了计算复杂度。更重要的是,它不需要预热阶段,也不会产生样本间的相关性问题,生成的样本直接符合目标分布,质量更高。在自回归采样的基础上,QiankunNet进一步发展出了蒙特卡罗树搜索自适应自回归方法[12],它结合了自回归采样和树搜索思想的策略,提升了采样效率。这种方法的特点在于能够在单次计算中同时自适应地生成多个样本(样本个数可以动态调整),而不是传统方法那样一次只能生成一个样本。整个过程形成一种树状结构,就像是在探索一棵决策树,每一层代表量子系统中的一个轨道,而每个分支代表该位置可能的状态。特别值得一提的是,这种方法非常善于利用物理系统中的固有约束。例如,在量子化学计算中,电子总数是守恒的。蒙特卡罗树搜索自回归方法可以巧妙地利用这一约束,通过“剪枝”技术排除不符合物理规律的分支,减少了计算量。在实际应用中,蒙特卡罗树搜索自回归方法展现出显著的性能优势。以水分子系统为例,我们的测试表明随着所需样本数量增加,传统MCMC方法的计算时间呈现明显的增长趋势,而蒙特卡罗树搜索方法的计算时间几乎保持恒定。值得注意的是,在使用相同数量的样本(比如十万个)时,蒙特卡罗树搜索方法能够在短短1500步计算内达到化学精度,而传统方法即使经过大量迭代也无法达到同样精度。这种效率上的巨大提升,使得以前难以处理的复杂量子系统计算变得可行。总的来说,QiankunNet使用的蒙特卡罗树搜索自回归方法通过巧妙结合自回归生成模型的优势和物理约束条件,解决了传统方法在量子化学计算中面临的效率和精度挑战。我们的方法为量子化学和材料科学研究开辟了新的可能性,有望加速人们对复杂量子系统的理解和应用。
在所测基准集上,QiankunNet对于H2到Li2O分子(STO-3G基组)的关联能量达到了全组态相互作用(FCI)基准的99.9%以上。QiankunNet在计算双原子分子碳(C2)和氮(N2)的势能面时,即使在传统耦合簇单双激发(CCSD)方法因强量子关联而失效的区域,仍能达到接近全组态相互作用的精度。这一结果表明,QiankunNet的Transformer架构和自注意力机制能够有效捕捉复杂体系中的电子相关性。在芬顿反应机理研究中,QiankunNet描述了过渡金属体系的过渡态势能面,为催化反应机理的分析和催化剂设计提供了理论基础。QiankunNet所代表的神经网络量子态(NNQS)结合变分蒙特卡罗(VMC)方法与强化学习(RL)在概念上存在内在联系。两者本质上都在解决参数化概率分布的优化问题:NNQS-VMC通过最小化能量期望值来寻找基态波函数,而RL则通过最大化累积奖励来学习最优策略。这种数学结构的相似性为方法间的相互借鉴提供了理论基础。我们采用的自回归采样实际上已经体现了向RL方法借鉴的思路,这与RL中的序列决策建模高度相似。然而,将群体相对策略优化(GRPO)等现代RL方法应用于量子多体问题也需要解决特定挑战。量子系统的能量势能面包含大量近简并态,这要求我们在设计相对优势函数时需要更精细的能量分辨率。此外,量子纠缠的非局域特性意味着组态空间的相似性度量与经典RL任务有本质区别,需要开发专门的距离度量和邻域定义。通过结合GRPO的相对优化思想与量子系统的物理特性,QiankunNet有望在保持高精度的同时实现更稳定、更高效的训练过程。
03QiankunNet-HPC:高性能并行量子态计算框架的突破
随着分子体系规模的增大,神经网络量子态方法面临计算挑战,传统的串行计算方法难以满足要求。这些问题限制了神经网络量子态方法在实际应用中的规模和范围,亟需开发高效的并行计算框架来克服这些挑战。在2023年国际超级计算大会(SC′23)上,我们提出了QiankunNet-HPC[13]这一高性能计算 (HPC) 实现框架,专门针对大规模并行计算设计,为解决上述问题提供了系统性解决方案。我们的框架首先提出了分布式计算架构,针对神经网络量子态的特殊需求进行了深度优化。在设计理念上,采用数据中心思想的并行策略来提升计算效率。QiankunNet-HPC提出了一种两级并行架构(图3):第一级将不重复样本分配给多个计算进程,确保每个进程处理相对均衡的唯一样本数量;第二级在各进程内部利用多线程技术并行加速采样、能量计算和梯度优化。这种并行策略在变分蒙特卡罗迭代中分为6个关键阶段:并行样本生成、全局样本信息同步、分布式局部能量计算、能量数据归约整合、分布式梯度计算以及全局参数更新。从数据通信角度分析,整个并行计算过程中只有少数几个步骤涉及有限的数据传输,且通信量相对较小。这种设计使唯一样本在整个计算流程中始终保持在其归属进程内,最大限度地减少数据移动,体现了数据中心的设计理念。尽管参数更新阶段的通信 量会随模型规模扩展而增长,但实践表明小型模型已足以在量子化学基态计算中取得良好性能,不会成为系统性能的瓶颈。这种并行架构充分利用了现代高性能计算集群的特性,为处理大规模量子系统提供了可行路径。
![]()
图3 QiankunNet方法的数据中心并行化策略示意图。在第一级并行化中,每个进程负责一定数量的唯一样本及其在计算过程中的权重。在第二级并行化中,对于每个批次,采样、局域能量和反向传播模块进一步使用多线程进行并行化加速[13]
在量子化学计算中,局部能量计算是神经网络量子态方法的核心挑战之一。由于分子系统的泡利字符串数量随量子比特数呈四次方增长,这一计算步骤通常占据总计算时间的绝大部分,并随着系统规模扩大而变得愈发耗时。QiankunNet-HPC提出了5项优化技术以改善这一瓶颈。首先,设计了高度压缩的数据结构存储哈密顿量,通过仅保存唯一泡利矩阵并重组相关信息,减少内存占用。实验结果表明,这种压缩数据结构对于从LiH到C3H6分子系统均能实现超过40%的内存减少,为处理更大规模系统提供了可能。其次,采用计算融合设计,将非零哈密顿项评估与局部能量计算合并为一步,避免存储大量中间状态及设备间的数据传输。这种融合设计与样本感知评估机制结合,仅计算属于已采样唯一样本集合的耦合态系数,减少了不必要的计算,为C2分子系统带来了约24倍的性能提升。第三,开发了高效的样本存储与查找机制,将样本编码为整数进行紧凑存储,并利用二分查找加速匹配过程。这一优化进一步将性能提升到基线方法的103倍,证明了数据结构设计对计算效率的巨大影响。最后,实现了GPU并行计算架构,使每个GPU负责一批唯一样本的完整计算,并通过多线程进一步细分任务。通过将所有优化技术整合并在GPU上实现,QiankunNet-HPC相比基线CPU版本实现了约3768倍的加速,为C2等多种分子系统提供了高效计算能力。这些优化技术不仅降低了内存需求,充分利用了GPU的并行计算能力,实现了局部能量计算的高效可扩展性,对于扩大分子模拟规模而言这是必要的。在扩展性能方面,QiankunNet高性能框架取得了进展,将QiankunNet方法扩展到了120个自旋轨道活性空间的规模(苯,6-31G)。在性能扩展性测试中,我们的框架在64 GPU上展现出良好的扩展性。
04QiankunNet-Solid:固态材料的神经网络量子态方法
将神经网络量子态方法扩展到周期性体系面临多重挑战,这些挑战本质上源于固体材料与分子体系在结构和性质上的根本差异。首先,周期性体系理论上包含无限多粒子,传统的基于有限粒子数的神经网络量子态方法难以直接应用。其次,固体材料遵循布洛赫定理,波函数需要满足特定的平移对称性和相位关系,这要求神经网络结构能够严格保持这些对称性。此外,在固体中,长程库仑相互作用的处理也比分子体系更为复杂,需要考虑无限晶格中的长程相互作用。这些因素使得将神经网络量子态方法扩展到固体材料计算并不容易。
![]()
图4 (a)采用QiankunNet-Solid以及数种其他方法计算得到硅的能带结构。晶胞选取为包含两个硅原子的原胞,每个晶格动量采用1×1×1的k点采样,针对每个晶格动量计算4个电子亲和能(EA)和4个电离势(IP),得到费米能附近的8条准粒子能带;(b)采用QiankunNet-Solid以及数种其他方法计算的硅晶体态密度。对每个晶格动量计算费米能上下各4个激发能级。两项计算均使用gth-szv基组[14]
2024年7月,QiankunNet-Solid方法[14]克服了这些挑战,我们将神经网络量子态框架扩展到周期性体系,通过将布洛赫定理与生成式 Transformer架构相结合,实现了对固态材料的高精度从头算计算。在理论基础方面,QiankunNet-Solid的核心在于其二次量子化表示方案。我们基于布洛赫分子轨道展开波函数,这种表示方式使得周期性自然地嵌入到布洛赫分子轨道中。随后,采用Jordan—Wigner变换将电子系统映射到自旋系统。为了验证QiankunNet-Solid方法的有效性,我们对一系列一维、二维和三维周期性体系进行了基态能量计算。研究结果表明,这个方法不仅可以准确计算基态能量,还能基于收敛的波函数推导多种材料物性。固体材料的特性之一是能带结构,准确描述能带结构对于理解材料的电子性质是必要的。QiankunNet-Solid通过运动方程方法,计算了硅固体的准粒子能带结构和电子态密度,图4展示了硅晶体的能带结构和态密度计算结果。如图所示,QiankunNet-Solid计算的硅能带结构与基于FCI波函数的运动方程方法所得结果高度一致,态密度曲线也与参考方法符合得很好。因此,QiankunNet-Solid标志着神经网络量子态方法迈出了从有限分子走向无限晶体的一步,为以后研究复杂固体材料(如强关联固体、缺陷体系等)奠定了基础。
05QiankunNet-DMET:量子嵌入神经网络方法
即使有了QiankunNet-Solid,直接模拟由上千原子组成的大型固体材料仍比较困难,因为计算量可能超出目前最强大超算的能力。量子嵌入理论(quantum embedding)为此提供了一种有效途径:通过将体系分解为相互作用的局域区域,从而降低计算成本。这种方法的核心思想是,将体系中最重要的“活性区域”使用高精度量子方法处理,而将其余部分使用低精度方法处理,同时通过自洽方式考虑两部分之间的相互作用。这种分而治之的策略在理论上能够保持高计算精度的同时降低计算成本,为大型量子体系的高精度模拟提供了可能。QiankunNet-DMET方法[15]首次将神经网络量子态与密度矩阵嵌入理论(DMET)相结合,创造了一种全新的量子嵌入方法(图5)。具体来说,QiankunNet-DMET将整体系统拆分为多个较小的子系统(即“杂质—环境”子系统),每个杂质包含我们关心的一组原子或轨道,而环境代表其余无限晶格部分的近似影响。DMET会为每个杂质构建一个包含杂质轨道和一些“浴轨道”的嵌入哈密顿量。然后,使用QiankunNet作为求解器,高精度地求解这个嵌入哈密顿量的基态波函数。由于QiankunNet本身能够表示强关联量子态,因此适合担当DMET中高精度求解器的角色。通过在每个杂质问题中引入神经网络量子态,达到了局部高精度计算与整体低成本处理的结合,实现了全局与局部的协同求解。
![]()
图5 QiankunNet-DMET方法的示意图 (a)复杂固态材料被划分为杂质区域及其对应的环境区域,DMET嵌入构建了一个包含杂质轨道和洗浴轨道的嵌入哈密顿量,随后使用QiankunNet求解杂质问题的多体波函数;(b)轨道与量子比特之间的映射关系;(c)QiankunNet采用自回归语言模型将量子比特作为输入标记,并输出序列中下一个标记的条件概率p(xi|x
我们将QiankunNet-DMET应用于多个周期性系统,从简单到复杂,覆盖了如一维氢链、金刚石晶体、过渡金属氧化物和二硒化钛等材料。通过对一维氢链的系统研究,计算了H-H距离从0.6 Å到2.0 Å的势能面,验证了方法在强关联体系中的准确性,结果与DMET-FCI计算高度吻合。在金刚石晶体的研究中,模拟了这一典型共价晶体的电子结构,获得的结果与实验数据和高精度量子化学计算结果高度一致。在更实际的材料如过渡金属氧化物中(这类材料常有强电子关联和复杂的能带特性),QiankunNet-DMET同样表现良好:它预测了这些材料的磁矩等性质,与实验观测和高精度计算吻合良好。这说明将神经网络量子态嵌入到材料计算中是可行且高效的,为未来计算强关联材料(如高温超导体等)的基本性质提供了一种全新工具。在1T-TiSe2体系的研究中,我们描述了其中的电荷密度波态,为理解该材料的相变机制提供了新的视角。在计算效率方面,通过迁移学习策略,QiankunNet-DMET实现了显著的性能提升。DMET迭代过程中的哈密顿量具有相似结构,这使得神经网络参数可以有效复用。通过保存和复用前一次迭代的参数,并采用较低的学习率和更严格的收敛准则,我们实现了快速而准确的收敛。这种迁移学习策略不仅适用于DMET迭代内部,还可以扩展到具有相似轨道结构的不同片段或系统之间,提高了方法的整体计算效率。
研究表明,QiankunNet与DMET方法的结合为大规模强关联材料的精确模拟提供了解决方案。与直接应用神经网络量子态方法相比,QiankunNet-DMET在大型体系计算中实现了超过90%的计算资源节约,同时保持与全系统高精度计算相当的精度水平。这一效率提升使得含数百甚至数千原子的大型材料体系的高精度量子模拟成为现实,为材料设计和性能优化提供了理论支撑。QiankunNet-DMET方法的核心优势在于充分发挥了神经网络量子态处理强关联问题的能力,同时通过嵌入策略有效规避了传统方法面临的计算复杂度瓶颈,为大规模固体体系的精确模拟开辟了可行路径。随着计算硬件性能的持续提升和算法优化的深入推进,这个方法有望扩展至更多前沿材料体系的研究,包括多元过渡金属强关联合金的电子结构解析、低维异质结构界面的量子现象探索,以及复杂功能材料的设计与优化等应用领域。
06QiankunNet-Force:基于神经网络量子态的原子间力计算
在量子化学和材料科学中,仅计算基态能量往往不够,要理解反应机理或材料行为,还需要知道不同构型下的势能面(potential energy surface, PES)以及相应的原子间作用力。传统从头算方法在处理某些反应路径或构型变化时,会出现能量和力计算的不连续或不准确现象。这通常与体系在过渡态附近出现强关联电子有关——单参考的近似方法(如普通的密度泛函或Hartree—Fock近似)难以刻画两个构型之间骤变的电子结构。这时需要更高级的方法才能得到光滑且可靠的势能面。2024年10月发表的QiankunNet-Force方法[16]首次将变分量子蒙特卡罗与Transformer深度神经网络相结合,为分子体系的原子间力计算提供了全新解决方案(图6)。这个方法能够直接应用Hellmann—Feynman定理计算原子间力,且无需引入修正的Pulay项。Hellmann—Feynman定理适用于对所有相关变量都具有平稳性(即能量的偏导数等于零)的波函数。由于神经网络量子态(NNQS)方法得到的波函数对变分参数具有平稳性,我们不需要计算简约密度矩阵的一阶导数。同时,在正交分子轨道基组的二次量子化表示下,可以直接对哈密顿量系数进行微分,而无需求解耦合微扰Hartree—Fock方程。此方法降低了原子间力计算的成本,同时保持了高计算精度,为分子动力学模拟提供了更高效、更精确的力场计算方案。
![]()
图6 QiankunNet-Force:利用QiankunNet得到基态波函数,并用其计算得到一阶和二阶的电子约化密度矩阵,之后使用Hellmann—Feynman定理计算原子核受力[16]
对于简单的双原子分子(如H2、LiH和N2),计算得到的原子间力与全组态相互作用(FCI)方法的结果高度一致。随后我们测试了由10个H原子组成的一维等间距H链体系,这一体系会随着HH距离的变化,表现出不同程度的电子关联,从而被视为连接模型哈密顿量和实际体系的桥梁。基于QiankunNet计算的不同H-H距离的能量和原子核受力,数值结果与FCI符合得很好。同时我们注意到在能量最低点时H原子受力也不为0,这是因为两个相邻的H原子倾向于形成更稳定的H2分子,体现了一维的Peierls不稳定性。
我们还考察了乙烯分子扭转这一经典问题。乙烯(C2H4)的C=C双键在扭转90°时会从π键结构过渡到双自由基结构,这一过程中,传统单参考波函数方法(如限制性Hartree—Fock或多数简单密度泛函方法)在90°附近出现著名的“尖峰”问题:势能曲线在垂直构型处出现不连续拐点,导致计算得到的作用力出现跳变,这是不真实的物理现象。而使用QiankunNet-Force计算时,得到的势能曲线平滑连续,90°过渡态的能量与实验测定的扭转能垒高度吻合。这一方面得益于QiankunNet能够同时处理双键断裂形成双自由基时的强关联电子,另一方面也说明此模型在计算原子力时具有更好的一致性和稳定性。通过QiankunNet-Force,乙烯扭转过程中的力没有出现任何非物理的突变,避免了传统方法遇到的“尖点”困扰。这一结果表明,QiankunNet不仅可以用于简单分子的基态能量计算,在复杂化学反应路径的建模中也能取得效果。
07QiankunNet-DMRG:基于张量网络预训练的神经网络量子态方法
密度矩阵重正化群(DMRG)方法是处理一维和准一维强关联体系的工具,通过张量网络结构有效压缩波函数信息,实现了对这类体系的高效精确计算。然而,DMRG方法在处理高维体系和长程关联时面临困难,需要借助其他方法的优势来克服这些限制。将DMRG与神经网络量子态方法结合,有望同时发挥两种方法的优势,为强关联体系计算提供更全面的解决方案。在最新的工作中,我们提出了一种结合方案[17],将密度矩阵重正化群与QiankunNet相结合,提升了神经网络量子态在大型活性空间计算中的性能。这种方法通过将张量网络态转化为组态相互作用类型的波函数,实现了DMRG与神经网络的有效融合,在保持高精度的同时提升了计算效率(图7)。在方法学层面,QiankunNet-DMRG的核心主要体现在预训练策略的设计上,开发了两种组态转换方法:基于扫描的直接转换(Conv.)方法和基于纠缠的遗传算法(EDGA)方法。其中,直接转换方法展现出更高的效率,能够快速准确地提取重要组态。
![]()
图7 QiankunNet-DMRG工作流程示意图。首先利用DMRG波函数的组态—系数对训练网络,然后使用预训练参数作为初始点进行自主组态生成和能量优化。此方法以物理有意义的量子态表示替代传统随机初始化[17]
预训练完成后,继续让QiankunNet进入自主优化阶段,使其自主生成新的重要组态并优化对应系数,从而逐步逼近体系的真实基态波函数。通过QiankunNet-DMRG方法,我们将达到化学精度所需的迭代优化次数减少了两个数量级,显著提升了计算效率。例如,在一个含10个价电子、24个自旋轨道的大型活性空间(水分子的cc-pVDZ基组)上,我们计算了15种几何构型下的基态能 量,与FCI精确值的偏差都低于化学精度1.6 mHa,平均误差仅约0.87 mHa。这一准确度已明显优于当时现有的其他神经网络方法和量子化学近似方法。与早期的受限玻尔兹曼机(RBM)波函数相比,此精度提高了近5倍;相比另一种机器学习组态相互作用(MLCI)方法,精度提高一个量级以上。特别是在强关联区域,这个方法优于传统的耦合簇(CC)方法,展现出优势。此外,我们还验证了网络的迁移学习能力:对于性质相似的一系列分子,QiankunNet-DMRG预训练所得的模型可以在分子构型稍有变化时仍保持良好的预测精度。例如,对于N2分子,不同键长的基态能量计算通常互相独立且难以收敛,但如果用较短键长下预训练好的网络作为起点,可以快速收敛并精确预测较长键长(即强关联区域)下的能量。这说明QiankunNet-DMRG不仅加速了单个体系的计算,在相似体系间也具备一定的泛化推广能力。
QiankunNet-DMRG方法架起了现代张量网络方法与深度神经网络之间的桥梁。它充分利用了张量网络提供精确初猜和神经网络高效优化的优点,为强关联量子化学计算带来了新思路。可以预见,随着这一思路的拓展,未来我们或许能看到更多传统量子算法与机器学习技术相结合的方法,不断攻克更复杂的电子结构难题。
08QiankunNet-PES:高效的势能面构建方法
分子势能面(PES)是化学和分子物理中最基础的概念之一,它描述了分子体系几何构型与对应能量之间的函数关系,是原子坐标空间中能量景观的“地图”。准确的PES模型对于理解化学反应路径、分子动力学行为、光谱性质和热力学稳定性都是必要的。然而,传统上构建高精度PES往往需要在大量不同几何构型上进行繁琐而昂贵的量子化学计算。针对这一挑战,最近我们提出了一种快速可扩展的神经网络量子态(NNQS)方法,专门用于高效构建分子势能面(图8)。面对NNQS方法在实际应用中的计算需求高、收敛速度慢等问题,我们又引入了多项优化技术。首先开发了跨样本Key-Value缓存共享技术来提升采样效率,通过让具有共同祖先的样本共享相同的KV缓存索引列表,避免了传统复制式缓存带来的内存开销,在C2分子上实现了3.23—10.41倍的加速,平均加速比达到3.34倍。针对占总运行时间40%的局部能量计算,采用量子位操作将每个自旋轨道的量子态表示从8字节压缩到1位,并结合BloomHash优化策略进行高效二分搜索,在154个自旋轨道的系统中实现了高达27倍的加速。同时引入FP32+BF16混合精度训练策略,在采样模块获得1.5倍加速,在梯度计算模块获得1.5—2.2倍加速,同时保持了与FP32训练相当的精度。为加速分子势能面模型训练,我们提出了并行训练算法,首先选择Nm个分子构建基础模型,然后用该模型预测Nt个新分子的势能面。具体实施中,每个进程处理Nm/Np个分子,通过分子权重子网络学习每个分子的权重,以指导网络优先学习关键分子系统的性质。在H2O2势能面训练集上的并行测试表明,这个算法实现了98%的强扩展效率和97%的弱扩展效率。
![]()
图8 基于生成式Transformer架构的神经网络量子态分子势能面并行训练流程图。训练数据集包含多个分子的特定属性(哈密顿量/量子比特数/电子数),通过振幅网络和相位子网络处理自回归采样生成的样本,最终输出分子势能面[18]
QiankunNet-PES训练得到的势能面模型展现出良好的泛化能力。例如,在仅使用0.4—0.8 Å键长范围内的训练数据学习氢分子(H2)势能面的情况下,模型不仅在训练集范围内快速收敛,而且对训练集外的较长键长(0.9—1.5 Å)也能给出准确的能量预测,提升了这些测试构型的收敛速度和最终精度。对于氮气分子(N2),在训练6000轮迭代后,模型对键长2.1 Å这个强关联区域的能量预测达到了化学精度(误差小于1 kcal/mol),而传统耦合簇单双激发(CCSD)方法在此区域难以达到这一准确度。
09总结和展望
QiankunNet系列方法在人工智能与量子化学交叉领域取得了一系列进展,建立了一套完整的理论方法体系。这些方法通过深度学习与量子力学原理的融合,解决了传统量子化学计算方法面临的多项挑战,特别是在处理强关联体系、大规模计算和多尺度问题方面取得了进展。这种方法的核心优势在于其物理引导的深度学习设计理念,将物理守恒定律和对称性作为硬约束引入神经网络架构,确保计算结果严格满足量子力学基本要求。这种设计不仅提高了计算精度,还加速了网络训练过程,提高了计算效率。此外,QiankunNet系列方法开发的高性能并行计算框架和量子嵌入技术,解决了计算规模的限制,将高精度量子化学计算扩展到前所未有的系统规模。从小分子到大型生物分子,从孤立体系到周期性材料,该系列方法展现出广泛的适用性。
QiankunNet作为量子多体系统的神经网络表征,与人工智能中的世界模型概念存在联系。特别值得注意的是,它将物理约束直接编码到网络架构中的做法,为世界模型设计提供了启示——通过将领域知识嵌入模型,可以确保输出始终符合物理规律。展望未来,如果将QiankunNet扩展到时间依赖体系/时间演化问题,就接近一个量子世界模型,能够预测系统的时间演化,而量子叠加态的处理方式则可能启发新的不确定性建模方法。
QiankunNet系列方法的成果不仅限于量子化学领域,还为其他科学领域的复杂问题提供了借鉴。在药物研发领域,该方法有望为涉及金属离子配位和共价键形成的药物—靶点相互作用提供更精确的电子结构描述,QiankunNet-Force方法能够为药物分子柔性对接和构象采样提供工具。在材料设计领域,QiankunNet-Solid方法能够高精度预测新型功能材料的电子结构,特别是对于强关联材料如高温超导体、拓扑绝缘体和多铁性材料;QiankunNet-DMET方法能够模拟能源材料中的离子迁移路径和能垒;QiankunNet-Force方法能够模拟材料形成过程中的原子迁移和结构演变。此外,这一系列方法开发的迁移学习策略为不同尺度信息的有效衔接提供了技术支持,有望 建立从电子尺度到原子尺度的信息传递框架。
未来的发展可集中在以下方向:其一,面向更大规模体系,通过优化网络架构、改进采样策略和增强分布式计算能力,将高精度计算扩展到含数千原子的复杂体系;其二,发展更适合量子多体问题的生成模型与对称性保持网络,探索QiankunNet与世界模型思想的深度融合;其三,将方法拓展到激发态、动力学和响应性质计算,为光电材料设计、催化化学和合成化学提供理论支持。总体而言,QiankunNet系列方法展示了生成式人工智能与量子多体理论深度结合的广阔前景。
参考文献
[1] Helgaker T,Jorgensen P,Olsen J. Molecular Electronic-Structure Theory. Wiley,2000
[2] Szabo A,Ostlund N S. Modern Quantum Chemistry:Introduction
to Advanced Electronic Structure Theory. Dover Publications,1996
[3] White S R. Phys. Rev. Lett.,1992,69(19):2863
[4] Olivares-Amaya R,Hu W,Nakatani N et al. J. Chem. Phys.,2015,142(3):034102
[5] LeCun Y,Bengio Y,Hinton G. Nature,2015,521(7553):436
[6] Carleo G,Troyer M. Science,2017,355(6325):602
[7] Vaswani A,Shazeer N,Parmar N et al. Adv. Neural Inf. Process.Syst.,2017,30:5998
[8] Hermann J,Schätzle Z,Noé F. Nat. Chem.,2020,12:891
[9] Pfau D,Spencer J S,Matthews A G G et al. Phys. Rev. Res.,2020,2(3):033429
[10] Devlin J,Chang M W,Lee K et al. Proceedings of NAACLHLT,2019:4171
[11] Karniadakis G E,Kevrekidis I G,Lu L et al. Nat. Rev. Phys.,2021,3:422
[12] Shang H,Guo C,Wu Y et al. Nat. Commun.,2025,16:8464
[13] Wu Y,Guo C,Fan Y et al. NNQS-Transformer: An Efficient and Scalable Neural Network Quantum States Approach for ab initio Quantum Chemistry. In: Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis,SC′23,New York,2023
[14] Fu L,Wu Y,Shang H et al. J. Chem. Theor. Comput.,2024,20(14):6218
[15] Ma H,Shang H,Yang J. npj Comput. Mater.,2024,10(1):220
[16] Lai J,Kan B,Wu Y et al. J. Chem. Theor. Comput.,2024,20(21):9478
[17] Kan B,Tian Y,Wu Y et al. J. Chem. Theor. Comput,2025,21(7):3426
[18] Wu Y,Cao W,Zhao J et al. IEEE Trans. Parallel Distrib. Syst.,2025,36(7):1431
(参考文献可上下滑动查看)
人工智能与量子多体计算专题
1
2
3
4
欢迎订阅2026年《物理》杂志
《物理》是由中国科学院物理研究所和中国物理学会主办的权威物理类中文科普期刊,注重学科性与科普性相结合,秉承“轻松阅读,享受物理”的办刊理念,集学科大家之力,追踪物理学成果,服务物理学领域,促进学科交叉,让科学变得通俗易懂。已成为我国众多物理专业的大学生、研究生、物理学家案头常读的刊物之一。
(期刊订阅)
订阅方式:编辑部直接订阅优惠价240元/年,全国包邮。
方式1微信订阅
在“物理所财务处”微信公众号缴费,操作如下:公号下方“业务办理”-“订刊费”-收费部门“《物理》编辑部”,之后填写相应信息。如有问题,可添加编辑微信咨询:18627635857。
(注:仅针对需要对公开电子发票的读者,且务必提供正确的单位名称和单位税号)
方式2银行汇款
开户行:中国农业银行北京科院南路支行
户 名:中国科学院物理研究所
帐 号:11250101040005699
(注:请注明“《物理》编辑部”,汇款成功后请及时联系编辑部登记邮寄地址)
编辑部联系方式:
咨询电话:010-82649277;82649029
Email:physics@iphy.ac.cn
(赠阅活 动 )
为答谢广大读者长期以来的关爱和支持,《物理》编辑部特推出优惠订阅活动:凡直接向编辑部连续订阅2年《物理》杂志,将获赠《岁月有情- <物理> 50周年纪念本》。内有自1972年至2022年《物理》发表的50篇精选文章信息,扫描对应的二维码,可重温经典之作,感悟物理科学的真谛,领略学科大家的风采。希望读者们爱上《物理》!
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.