人工智能(AI)系统,特别是人工神经网络,已被证明是揭示大量数据中模式的非常有前景的工具,这些模式在其他情况下很难被发现。在过去的十年中,AI工具已被应用于各个领域和场景。
在众多可能的应用中,AI系统可以用于发现描述物理关系和符号表达(如数学公式)的关系。
为了揭示这些公式,物理学家目前需要对原始数据进行深入分析,因此,自动化这个过程将会带来很大的好处。
清华大学、北京大学及中国其他研究机构的研究人员开发了一种AI框架,能够从原始数据中自动推导出符号化的物理表示。这个新模型叫做PhyE2E,已在《自然机器智能》期刊上发表的论文中介绍。
“我们的目标是将人工智能推向超越单纯的曲线拟合,朝着人类可理解的发现方向发展:返回紧凑的、单位一致的方程,供科学家们阅读、测试和进一步研究,”论文的共同资深作者周元告诉Phys.org。
“我们首先专注于空间物理学,在这里,长时间以来经过精心整理的观测记录让我们能够检查学习到的方程是否真正符合自然。这种方法本身是通用的,我们预计它将扩展到其他科学领域。”
一个符号化表示物理数据的模型
PhyE2E是周元及其同事们推出的新人工智能框架,经过物理数据和数学方程的训练。在训练过程中,该模型通过微调广泛建立的物理方程,学习了合理的物理相关公式是什么样子的,然后通过合成各种单位一致的变体来生成其他公式。
“PhyE2E使用变换器将数据直接转换为符号表达式及其单位,”周元说。
“它应用了一种分而治之的步骤,检查轻量级‘预言机’网络的二阶导数,将一个复杂的问题分解为更简单的子公式,并进行简要的MCTS/GP优化,以整理常数和结构。结果是一个紧凑、可解释且维度一致的方程。”
作为他们最近研究的一部分,研究人员在大型语言模型(LLM)生成的合成数据集和NASA收集的真实天体物理数据上测试了他们的框架。
最终,他们能够推导出与五个真实空间物理场景相关的物理关系公式。值得注意的是,他们推导出的公式与人类物理学家得出的公式相符,甚至在某些方面更好地反映了数据。
例如,在分析NASA于1993年发布的数据时,该模型得出了一个改进的公式,能够从数学上解释太阳周期。此外,它能够有效地描述太阳辐射、温度和磁场之间的关系。
一个有前景的科学发现工具
本质上,这个研究团队开发的新AI模型学习将复杂的物理问题分解为更简单的部分。它借鉴现有的、成熟的方程式,然后生成有效地描述不同变量之间关系的新公式。
周说:“虽然写出一个长的表达式来插值数据其实很简单,而且很容易倾向于使用非常短的表达式,但这两者都不一定具有物理意义——许多候选公式甚至违反了维度(单位)一致性。”
“我们利用大型语言模型的最新进展,学习已知的、单位一致的方程的先验信息,然后对其进行微调,使系统能够提出紧凑且物理上合理的表达式,从而带来真正的洞察。我们将此视为抽象和扩展科学经验以实现自动发现的第一步。”
PhyE2E很快可能会被用于分析其他实验和天体物理数据,这可能会产生更好地描述特定物理现象或相互作用的公式。未来,它也可以进行调整并应用于其他学科,可能会为多个领域的科学发现带来贡献。
“我们现在正在将框架扩展到计算微积分的运算符(例如,用于偏微分方程的导数和积分),增强对噪声实验数据的抗干扰能力,”周补充道。
“更广泛来说,我们研究的核心目标是推动神经符号方法的发展,让深度神经网络的预测更具可解释性。同时,我们希望将可解释性作为设计原则的整合,能够提升人工智能系统发现更准确、可靠的科学法则的能力。”
本文由我们的作者 英格丽德·法德利 撰写,萨迪·哈利 编辑,罗伯特·伊根 进行事实核查和审阅——这篇文章是经过认真人工编辑的成果。我们依靠像您这样的读者来支持独立科学新闻的发展。如果您觉得这篇报道重要,请考虑支持我们(特别是每月捐赠)。
更多信息: Jie Ying 等,空间物理的神经符号模型, 自然机器智能(2025)。 DOI: 10.1038/s42256-025-01126-3。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.