六维相空间重构的两阶段卷积神经网络|磁场|粒子|束流|电子束|电子枪|发射度

分享至

六维相空间重构的两阶段卷积神经网络

Two-stage Convolutional Neural Network for six-dimensional phase space reconstruction

https://arxiv.org/pdf/2603.02733

在粒子加速器中，全面掌握六维（6D）束流相空间信息至关重要，但利用传统束流诊断手段难以实现。我们开发了一种两阶段卷积神经网络（CNN），仅需在具有色散的位置、通过不同相空间旋转角度获取的十六幅横向 x−y 屏图像，即可重建六维相空间。该模型使用基于 ASTRA 程序模拟的 KEK 加速器测试设施（ATF）注入器数据进行训练。在 KEK-ATF 注入器的弯折轨道（chicane orbit）处，通过调节射频电子枪的射频相位和螺线管磁场，采集了真实空间图像。基于这些数据，我们重建了阴极表面的六维相空间分布，并将其可视化为涵盖所有坐标两两组合的 15 幅二维图像。电子束在阴极处的时间宽度与空间展宽所得数值与 KEK-ATF 的实测结果一致。与现有的六维束流成像测量技术（如层析成像法）相比，该方法显著缩短了测量时间并降低了所需计算资源，从而提供了一种更具实用性的六维相空间测量方案。

1 引言

束流质量通常由其横向和纵向发射度来量化，在加速器中起着关键作用。在线性对撞机中，需要在相互作用点实现超低横向发射度，以形成极其扁平的纳米级束流，从而达到设计亮度[1]。同步辐射光源得益于发射度被推至衍射极限以下，这提高了空间相干性并显著增强了光子束的光谱亮度[2]。对于自由电子激光（FEL），较大的发射度会导致束流发散角增大以及在波荡器中的有效能散增加，从而降低FEL增益[3]。在医疗加速器设施中，例如用于质子治疗肿瘤的回旋加速器，良好控制的束流形状对于传输和聚焦70−250 MeV质子束至关重要[4]。

为满足现代加速器设施（如上述所列）日益严苛的运行条件，需要具备评估和针对运行时束流条件调整光学参数的能力。因此，沿束流线重建束流相空间对于诊断束流质量具有极高价值。一般而言，仅依赖发射度是不够的，因为它无法捕捉完整六维相空间分布中的复杂特征，如多峰结构、自由度之间的关联等。获取六维相空间分布能够更全面地评估束流性能，并有助于深入理解导致束流质量退化的机制。然而，加速器内传统的重建方法往往困难且耗时，需要进行破坏性测量、计算密集型的反投影，且通常仅能获取有限数量的相空间维度信息。

为推断横向相空间，已开发出多种传统束流诊断技术。这些技术包括胡椒瓶式或多狭缝发射度监测器[5, 6]、纳米加工线扫描器[7]以及激光线扫描器[8]等。在标准实现中，此类诊断可重建投影的二维横向相空间 ( x , x ′ ) 和 ( y , y ′ ) ，且在良好控制条件下，还可推断耦合的四维横向束流矩阵。然而，它们主要探测横向动力学，无法直接获取完整的六维相空间分布。因此，横向与纵向自由度之间的关联以及其他高维结构无法被唯一地捕捉。

在层析成像技术[9–17]中，相空间分布是在改变束流光学参数后进行推断的。在此情况下，投影在不同旋转角度下获取，底层分布可通过反投影方法重建。然而，该方法需要对应大量投影角度的精确磁铁设置，使得在缺乏专用层析成像装置的机器上难以实施。这些方法可实现高达四维相空间的分析。

尽管传统技术或层析重建在相空间评估中是有用的工具，但由于高维情况下复杂度显著增加，关于完整六维相空间重建的研究仅有少数几项。2018年在散裂中子源（SNS）束流测试设施（BTF）进行了一项实验测量[18]。该实验采用专用装置，包含六个可移动狭缝，用于收集六维相空间中部分区域内粒子的信息。该测量极其耗时，需要32小时的稳定束流。研究结果表明，六维相空间中横向与纵向自由度之间存在由库仑力驱动的关联。

近年来，机器学习在图像分类、语音识别、数据挖掘等多个领域的重要性日益提升[19–23]。一些研究已采用这些神经网络算法进行相空间重建[24–27]。其中，一项非常近期的研究[24]展示了使用生成式相空间重建（GPSR）技术实现六维相空间的完整重建，该技术采用后向可微分模拟并优化神经网络参数以生成六维分布。在该框架中，后向可微分性使得初始猜测的六维束流分布能够被迭代优化，以使其与实验测量结果一致。该方法采用基于六维束流发射度负对数的损失函数，该值与分布的熵成正比。遵循最大熵层析成像（MENT）原理[28]，当重建分布的熵最大化时，其似然性也达到最大。该方法给出了符合预期的结果，并能够重建六维相空间中许多复杂的平面。但该研究最大的局限性在于其完全依赖于后向可微分的粒子追踪，而标准模拟软件包中并不具备此功能，使用者必须修改现有软件。此外，该方法需要利用可用的实验图像来计算多种最大化熵的解，并需要A100 NVIDIA GPU的高强度计算才能获得六维分布。

我们的研究旨在为典型注入器束流线开发一种基于卷积神经网络（CNN）[29–32]的AI模型，以解决从测量的二维实空间束流图像生成完整六维相空间这一逆问题。通过连续的卷积运算，CNN作为输入束流图像的特征提取器，捕捉束流尺寸、整体形状以及强度在图像中分布方式等信息。该方法在实用意义上具有层析成像特性，因为它使用有限的机器扫描集合，此处通过调节射频枪相位和螺线管磁场来实现，以提供多个具有信息的视角。然而，它不需要像传统反投影层析成像那样密集的0°–360°角度覆盖或大量光学参数设置。此外，与GPSR类方法不同，CNN方法可使用现成的前向模拟代码进行训练以生成所需数据集。尽管训练需要相当大的数据集（约幅图像），但可在中等配置的GPU上完成。一旦模型训练完成，重建过程可在不到一分钟内完成。如此短的重建时间使得该模型对加速器设施极具吸引力，可在实验束流时间内作为在线束流诊断工具使用。为克服机器学习模型训练集有限的常见问题，我们采用傅里叶级数函数，以覆盖大多数可能的束流分布。通过在训练中提供多种多样的束流形状，我们提升了模型在训练集之外进行外推的能力。此外，如有需要，可输入高阶傅里叶级数分布以进一步提升质量。我们证明，在训练中包含多种束流形状的情况下，该模型能够学习束流的复杂性以重建六维相空间。

在本文中，我们提出了一种新开发的基于CNN的AI模型，并在合成束流和KEK-ATF实验数据上评估其性能。第2节描述了层析成像所需的相空间旋转原理，第3节详细介绍了CNN模型，包括网络架构和训练过程。第4节展示了该模型在合成束流分布上的性能。第5节展示了该技术在KEK-ATF注入器束流线上的实验验证。最后，第6节和第7节总结了本研究，并讨论了其对加速器领域的发展前景。

2 束流重建的相空间旋转与测量原理

传输中束流的完整六维相空间重建，可通过观测其相空间旋转所引发的变化来实现。通常，重建工作主要集中于横向维度，这是由于测量纵向维度的变化相对困难，且复杂非线性效应的存在可能使计算变得繁琐甚至无法进行。本文证明，只要能在具有可观测色散的区域测量束流的横向（x−y）分布，仅利用常规束流线光学元件与射频相位调制进行少量相空间旋转，即可为本研究所采用的基于CNN的算法提供实现完整相空间重建所需的相空间旋转。由射频相位差异所引发的变化在色散区域是可观测的，在本文的实验设置中，该区域选定为弯折段（chicane）的中心位置。弯折段二极磁铁使束流在x方向发生偏转，从而产生一种非对称效应：束流能散在x方向上表现为束流展宽，而边缘聚焦效应则会在y方向上引起粒子轨迹的变化[33]。我们利用这些效应，来分别观测通过扫描螺线管磁场与射频相位所引入的横向和纵向维度的变化。测量通过将荧光屏插入弯折段区域来进行，从而获取关于束流形状与强度的数据。为获得验证本技术所需的相空间旋转，我们采用了螺线管磁场的变化以及相对于激光脉冲时序的射频相位偏移，分别对横向和纵向维度进行旋转。下文将对这些旋转进行简要说明。

2.1 横向相空间旋转

螺线管磁场会在横向方向产生旋转，同时伴随着聚焦作用以及对空间电荷效应的部分补偿。由于螺线管同时在两个横向方向上进行聚焦，因此单一磁场足以在 x − x ′ 和 y − y ′平面内引起变化。由螺线管磁场变化引起的横向相空间变化如图 1 和图 2 所示。仅由螺线管产生的聚焦在 x 和 y 维度上是对称的，但在测量点处，由于 y 方向的边缘聚焦效应以及 x 方向因偏转引起的束流展宽，引入了不对称性。图 1 和图 2 反映了在弯折段（chicane）测量区域内观测到的相空间旋转。

2.2 纵向相空间旋转

纵向（t − pz）相空间平面的旋转是通过改变阴极处的射频相位偏移来实现的。因此，处于不同射频相位的束团会在射频波的不同位置被加速，从而影响整体的束流能散。图3展示了由射频相位变化引起的 t − pz 平面旋转的示例。

3 用于六维相空间重建的CNN算法

我们采用一种新的CNN算法，利用第2节所述的原理来重建阴极处束流的六维相空间。CNN是一种专为处理和分析视觉数据而设计的深度学习模型[29, 34]。CNN保留了图像的空间结构，使其能够高效地捕捉局部模式和视觉特征。CNN的核心组件是卷积层，它在输入图像上应用小型滤波器（也称为卷积核）。这些滤波器在图像上滑动并执行数学运算，以检测边缘、角点、纹理和形状等特征。随着数据通过更深层的网络，网络会学习更复杂和抽象的表示，使其能够识别物体、人脸或场景。该算法还包含池化层，用于减小图像的空间尺寸，这有助于降低计算成本并提高对输入中微小平移或畸变的鲁棒性。最后，全连接层解释提取的特征并产生分类或预测结果。我们的算法使用CNN处理束流图像，但它不是提取特征，而是生成多幅图像。通过束流测量获得的实空间图像，我们重建六维相空间中任意两个变量的二维图像。

我们使用常规的前向ASTRA[35]模拟来训练网络，无需后向可微分性或代码修改。该模型在推理时也不求解最大熵优化问题；一旦训练完成，它可在相对适中且负担得起的GPU上，在远少于一分钟的时间内将测量到的弯折段x−y图像映射到阴极六维相空间。该卷积架构提取弯折段测量点处的图像特征，并学习它们与光阴极处上游六维相空间坐标之间的非线性关系，为高维束流重建提供了一条更具实用性的途径。

先前关于相空间层析成像的研究[9–17]涉及将低维投影反投影到相空间分布。然而，在此类技术中，重建高度依赖于能够覆盖0°至360°角度范围以描述相空间分布的投影数量。此外，这些基于傅里叶切片定理[36]和MENT原理的方法使用一维投影，这也减少了相空间的高维信息。相比之下，我们的CNN模型使用完整的二维束流图像作为投影，保留了更丰富的相空间特征，且不需要覆盖完整的角度范围。

正如引言中所述，近期的GPSR研究[24]表明，基于机器学习的生成模型原则上可以从二维束流图像重建完整的六维相空间，而无需对投影角度施加严格约束。然而，该方法存在两个实际缺点。首先，它依赖于完全后向可微分的粒子追踪，而标准加速器模拟软件包中并不具备此功能，需要对现有代码进行大量修改。其次，该优化计算密集：在六维分布上最大化基于MENT的目标函数需要在专用的A100 NVIDIA GPU上长时间运行，而这种硬件价格昂贵且不易获取。

我们基于CNN的方法克服了这些局限性。下文将详细描述该算法的细节、其训练过程、模拟测试数据的重建以及KEK-ATF实验数据的重建。

3.1 模型架构

我们的网络包含三个主要部分：编码器、Transformer（变换器）和解码器，采用如图4所示的两个阶段进行训练。对于给定的射频相位和螺线管磁场，编码器[37]接收弯折段测量点处x−y图像的单通道64×64直方图，并使其通过三个带有池化操作的卷积层[34]，逐步将图像压缩为具有128个通道的4×4特征图。该特征图可被视为一个小型网格，其中每个单元格包含128个学习得到的数值，用于概括图像中的局部模式，如束流尺寸、位置和形状。整体而言，该特征图是对原始64×64图像的紧凑表示。随后，该特征图被展平并通过两个全连接层，这些层混合这些特征并将它们压缩为一个150维的图像隐向量，用于概括束流图像。

并行地，用于生成弯折段图像的射频相位和螺线管磁场（即控制旋钮）被视为一个二维输入向量，并通过四个全连接层，生成一个150维的旋钮隐向量。该旋钮隐向量与图像隐向量拼接，并通过两个全连接层进行处理，中间使用ReLU[38]非线性激活函数，生成一个单一的150维“投影嵌入”。该嵌入是射频-螺线管设置与弯折段处测量的x−y图像的联合表示。

对于数据集中的每个样本，我们拥有：(i) 阴极处的分布，它定义了六维相空间的15个二维投影；(ii) 16组不同的射频-螺线管参数对；以及 (iii) 弯折段处对应的16幅实空间束流图像。使用上述编码器-旋钮融合方法，16幅弯折段图像中的每一幅都被映射为一个150维的投影嵌入。随后，这16个嵌入被输入到Transformer中，该Transformer应用了三个具有六个头的自注意力层。每个注意力头学习如何在所有16个视角之间对信息进行加权和组合，最终的Transformer输出被合并为一个维度为1280的单一“束流表示”向量。

在第一阶段，我们每次使用单个弯折段x−y图像以及固定的射频和螺线管磁场来训练模型。编码器将每幅图像和射频-螺线管设置组合成一个特征向量，解码器则利用Transformer[39]从中预测15个阴极相空间直方图。此阶段的目标是教会网络基本的逆映射：当束流线配置固定时，阴极分布的变化如何在弯折段图像中显现。为了与第二阶段保持一致，我们通过复制相同的单视角特征（附带位置编码）向Transformer输入一个长度为16的序列，但输入仍然仅代表一个测量视角。这种单视角预训练为第二阶段学习组合所有16个视角的信息之前提供了稳定的初始化。

在第二阶段，我们切换到完整的多视角设置。对于每个样本，Transformer接收全部16幅弯折段x−y图像及其对应的射频相位和螺线管磁场值，并被训练以重建一个一致的阴极六维相空间分布（15个输出直方图）。其核心思想是：相同的阴极分布在射频-螺线管设置改变时会产生不同的弯折段图像。通过学习这16个视角如何与同一个底层束流相关联，网络可以组合它们的互补约束，减少单图像反演的模糊性，从而实现更可靠的阴极分布恢复。

在Transformer之后，解码器[37]将1280维的束流表示映射回物理空间。它首先将该向量扩展为一个粗糙的特征图，然后应用三个上采样卷积层来重建64×64图像。最终层产生15个输出通道，每个通道对应阴极处六维相空间分布的15个二维投影之一。这15个预测的直方图使用结合泊松损失、平均绝对误差和余弦相似度的复合损失函数与相应的模拟真实直方图进行比较。

为了稳定性，Transformer模块在第一阶段被冻结，以便编码器和解码器首先学习一致的映射，而无需额外的非线性在每一步都发生变化。仅凭单幅x−y图像，仅靠编码器-解码器无法合理地重建完整的六维相空间；在第一阶段，Transformer通过其注意力层重新处理相同的编码图像，增加缺失的复杂度，并生成更丰富的特征表示，使得六维近似变得可学习。在第二阶段，我们随后解冻Transformer，并将其与编码器和解码器一起训练，因为在此阶段它必须学习如何将真正不同的x−y图像（来自不同的射频-螺线管设置）组合成单一一致的六维解。

3.2 损失函数

3.3 训练过程

为了优化模型，我们在一定数量的训练周期（epochs）内检查最低的验证损失。模型将来自整个数据集的样本分成称为小批量（mini-batches）[44] 的小组，在一个更新步骤中处理它们，并使用 Adam 优化器 [45]，该优化器在训练期间提供学习率 [46]。小批量大小和学习率的选择至关重要，因为它极大地影响模型的整体性能，即模型是否能从训练样本中正确学习以及能否在训练集之外的数据集上表现良好。

图 8 展示了第二阶段（Stage 2）每个训练轮次（epoch）损失函数的变化过程，其中蓝色、橙色、绿色和红色分别代表批量大小（batch size）为 8、16、24 和 32。在此阶段，与第一阶段相比，数据集数量较少，因此我们检查了较低批量大小下的性能。对于像 8 或 16 这样较小的批量，存在梯度噪声且收敛缓慢，而在较大的批量（如 24 和 32）上波动减小。最终选择了 32 的批量大小。第 5 轮之后出现的突增将在后文讨论第二阶段学习率的段落中解释。需要注意的是，我们是在优化了第一阶段的批量大小和学习率之后，才进行第二阶段的优化。一旦确定了批量大小，我们就开始调整学习率。在第一阶段，学习过程由编码器和解码器模块完成，而如前所述，Transformer 保持冻结状态。

3.4 交叉验证性能

交叉验证[47, 48]是一种用于准确评估和预测机器学习模型性能并稳定模型泛化能力的技术。它涉及将有限的可用数据反复划分为"训练集"和"测试集"并重复使用。这可以防止过拟合，并有助于创建不受数据偏差影响的可靠模型。在此，我们采用五折交叉验证，即将数据分为五部分，在每次运行中，使用其中四折进行训练，剩余一折用于验证；最终性能则取五次运行的平均值。在进行交叉验证之前，我们首先运行了一次单独的训练，以确定每个阶段的最优批量大小和学习率。随后，我们使用各自的数据集（其规模不同）分别对第一阶段和第二阶段进行交叉验证，同时保持各阶段特定的最优超参数固定不变。

图 11 展示了第一阶段（Stage-1）训练中 5 折交叉验证的损失函数演变过程。实线表示训练损失，虚线表示验证损失，每一折的训练-验证对采用相同的颜色绘制：蓝色、橙色、绿色、红色和紫色分别代表第 1 折、第 2 折、第 3 折、第 4 折和第 5 折。各折之间观察到一些差异，这源于每一折的数据子集不同，从而导致模型性能有所变化。图 12 以同样的方式总结了第二阶段的 5 折性能。在此，第 2 折和第 3 折显示出的训练损失和验证损失差异较其他折更大，而第 5 折显示的差异最小。然而，这些差异均保持在较小的损失值范围内。为了从我们的两阶段模型中获得一致的结果，我们对所有折的性能进行了平均。

4 基于合成分布的性能评估

为评估我们构建的CNN模型的性能，我们采用两种方法进行了测试。一种方法使用模拟数据，另一种方法则采用来自KEK-ATF的实验数据。

在基于模拟的测试中，我们将源自阴极处模拟束流分布、并通过不同射频-螺线管设置获得的16幅实空间分布输入CNN。随后，我们将重建得到的阴极处分布与提供给模拟的原始分布进行比较。

在实验数据测试中，虽然阴极上的完整相空间分布是未知的，但可以根据照射光阴极的激光的形状和时间分布，推断出所产生的束流的 x − y 分布和随时间变化的分布。将这些推断出的分布与重建的相空间分布进行了比较。此外，由于动量空间分布是由阴极的热分布决定的，因此对其有效性进行了评估。

4.1 基于模拟测试集的验证

需要注意的是，训练仅使用傅里叶图像进行，且“彗星”分布被排除在训练数据之外。因此，模型对这些形状没有先验知识，成功的重建表明其能够外推到训练所提供的分布之外。

5 实验验证

在模型经过充分的合成束流分布训练后，我们接下来将其应用于实际加速器，以展示其在真实束流数据上的性能。作为一个合适的测试案例，我们选择了位于筑波（Tsukuba）校区的 KEK-ATF 注入器。与该算法的需求一致，ATF 注入器在弯折段（chicane）内包含一个荧光屏，从而允许通过改变射频（RF）和螺线管参数来观察束流展宽的变化，进而观察纵向相空间分布所 induced 的变化。凭借相对简单的装置，我们能够在实验上证明 CNN 技术的可行性和有效性。

5.1 KEK-ATF 注入器

与本研究相关的ATF束流线部分如图17的示意图所示。其始于一台配备3.6单元常温腔的2856 MHz S波段射频电子枪，该电子枪通过紫外激光照射光阴极产生电子束。射频电子枪的峰值加速梯度约为65 MV/m，在其出口处产生能量约为6 MeV的电子束团。激光脉冲波长为266 nm，重复频率为3.125 Hz [52]。电子束离开射频枪后，立即通过一个螺线管、一段漂移空间，最后进入由四个二极磁铁组成的弯折段（chicane）区域，每个二极磁铁在水平面内使束流偏转22.7°，从而在x方向产生约80 mm的净轨道偏移。

在KEK-ATF设施的弯折段区域，通过改变射频电子枪相位和螺线管磁场，测量了三组各16幅的x−y束流图像。在KEK-ATF，激光光斑尺寸通过一个由两个凸透镜组成的望远镜式光束扩束系统进行调节，其中输入激光光斑尺寸会根据系统焦距的变化而扩大或缩小。焦距的改变通过移动下游的凸透镜（称为变焦透镜）来实现，同时保持上游透镜固定。在我们的实验过程中，我们通过调整变焦透镜位置至三个设置：−1000 μm、−1300 μm和−1150 μm，来改变光学系统，从而在阴极表面产生三种不同的激光光斑尺寸。随后，使用CCD相机测量激光光斑尺寸，并使用位于弯折段中心的荧光屏监测器测量所得图像。

射频相位的调制会改变束流发射过程中阴极表面的电场。受肖特基效应（即电场增强时会降低有效阴极功函数）影响，改变射频相位会导致发射电流（束团电荷量）发生变化。因此，在不同射频相位值下采集的束流图像所测得的束流电流会有所不同。

5.2 实验结果

6 六维相空间重建总结

我们展示了一种利用两阶段CNN模型进行完整六维相空间重建的新颖方法。该方法仅需屏幕上十六幅实空间束流图像，这些图像可以很容易地从加速器设施中获得。在我们的案例中，在KEK-ATF进行测量这些束流图像的实验仅耗时五分钟。因此，未来将模型与束流监测器连接起来，将使其能够自动采集图像并实时重建六维相空间。通常，该模型旨在分两步解决束流动力学问题：第一步，在给定束流线配置（螺线管和射频相位保持恒定）的情况下，学习上游六维束流的变化及其对测量点处投影二维束流的影响；第二步，理解恒定的六维束流在不同射频-螺线管配置下如何演化为不同的二维投影图像。

采用这种两步策略为模型求解六维相空间分布提供了必要的复杂性。我们已经看到，简单地使用单一阶段并增加神经网络层数或神经元数量是不够的，因为每个阶段的机制是不同的。尽管第二阶段用于组合实空间图像以获取相空间，但如果在没有第一阶段的情况下使用它，CNN通常会通过组合所有图像产生一个平均估计。因此，第一阶段的训练使模型克服了这种跳过束流分布中重要细节的倾向。因此，需要这两个阶段才能使CNN具备处理复杂束流结构的能力。

CNN的使用帮助我们作为特征图从束流图像中提取信息，如束流形状、尺寸、位置等。当我们将图像隐变量与射频和螺线管设置的隐变量相结合时，我们给予后者两倍的权重。这反映了射频-螺线管主要负责在横向和纵向方向上旋转相空间这一事实。因此，在其他加速器设施中，如果调节参数不同，例如四极磁铁或横向偏转腔，它们可以遵循相同的规则来强化这些负责旋转相空间的组件的效应。在本工作中，我们是在由傅里叶级数形状构建的合成阴极分布上进行训练的，但在其他设施中，相同的框架可以改为在沿束流线其他位置的模拟图像上进行训练。

然而，上述样本中的其他变量显示出更好的一致性，其值分别为 0.88–1.10。鉴于目前处于开发的早期阶段，该模型在重建束流形状方面总体上表现出一致的性能。本研究的一个重要方面是我们不需要可微分模拟，因此该方法可以直接与标准加速器代码一起使用。本研究的所有训练均在单块 NVIDIA RTX A400 GPU 上进行，该 GPU 易于获取且价格适中。

作为一种数据驱动的方法，该模型存在一些局限性，也有几种提高其能力和准确性的途径。CNN 仅能在训练数据中所代表的束流条件、机器设置和傅里叶级数阶数范围内可靠地执行，因此其预测在这些范围之外可能会下降。此外，尽管训练和验证损失参数表明不存在过拟合，但该模型仍然容易受到待重建相空间参数覆盖不完整的影响，并且可能会陷入一组“偏好”值。此外，此处展示的超参数扫描仅限于狭窄的范围，通过更广泛的扫描可能会实现进一步的改进。然而，该模型展示了其在训练之外的测试束流形状上进行外推的能力。因此，如果我们在傅里叶模式中纳入更高阶的频率并在超参数上增加更多变化，可以预期未来的重建性能会有所提高。

7 结论

原文链接：https://arxiv.org/pdf/2603.02733

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.