网易首页 > 网易号 > 正文 申请入驻

MIT惊人神作:AI独立提出哈密顿物理!0先验知识,一天破译人类百年理论

0
分享至

新智元报道

编辑:Aeneas KingHZ

【新智元导读】MIT物理学大牛Max Tegmark团队,再出重磅力作。他们发现:AI能够在没有任何先验知识的情况下,完全独立地提出哈密顿物理量,或拉格朗日方程式。仅仅通过尝试解释数据,AI就自己收敛到了这些物理原则,发现了宇宙间的奥秘!

充满想象力的MIT大牛团队,又有新作了!

大佬Max Tegmark、Ziming Liu等人在一项新研究中发现,AI能够在没有任何先验知识的情况下,能够完全独立地提出哈密顿物理量。

论文地址:https://arxiv.org/pdf/2504.02822v1

不过要注意,这里的AI是LNN,而非LLM。

他们提出一种新的架构MASS(Multiple AI Scalar Scientists),允许单个神经网络学习跨多个物理系统的理论。

MASS在来自各种物理系统(摆或振荡器)的观测数据上进行了训练,且事先并未被告知底层的物理定律。

结果,神奇的事来了。

MASS开发的理论,往往与已知的经典力学哈密顿或拉格朗日表述高度相似,具体取决于其分析的系统的复杂性。

也就是说,AI仅仅通过尝试解释数据,就收敛到了这些已经成熟的物理原理!

果然Max Tegmark出品,必属精品。

惊人脑洞:AI科学家大PK,结果如何?

这项研究,源于研究者们的一个脑洞:如果两个AI科学家是在相同的训练数据上训练的,他们会不同意彼此的观点吗?

有趣的是,他们发现,这些AI科学家在学习经典物理学之后,起初可能会存在分歧,但当数据变得多样化之后,他们就会不约而同地收敛到拉格朗日/哈密顿这些已知的理论。

如果简单概括这项研究的几大发现,可以归结如下。

1.一个AI科学家能够学习对同一物理现象的多种不同解释;

2.当面对更复杂的系统时,表现出色的AI科学家会对其原有理论进行修正,以适应新的观测;

3.AI科学家学到的理论具有高度相似性,这些理论通常与哈密顿或拉格朗日描 述形式非常接近;

4.在初期所学的理论更接近哈密顿动力学,但随着系统复杂性的提升,最终学习结果更趋近于拉格朗日描述,这表明在丰富的理论空间中,拉格朗日动力学仍是唯一正确的描述体系。

在论文开篇,他们抛出了这张有趣的图——AI科学家的演化。

即使在如单摆这样简单的物理系统中,不同的AI科学家在从数据中学习时,也会得出不同的结果。无法解释当前数据的理论会被判定为错误。存活下来的AI科学家,则将面对更复杂的系统,例如双摆,并据此不断修正自己的理论以适应新的数据。最终,剩下的AI科学家将学到什么?

纵观人类历史,科学的进步是由好奇心推动的。

从阿基米德的浮力原理,到伽利略对运动的系统研究,到牛顿的经典力学公式,再到爱因斯坦的相对论,这些科学家通过观察提出假设,从而成为经典的科学原理。

而在今天,我们正见证着全新的范式:ML和数据驱动方法,开始在粒子物理、天文学、材料科学和量子化学等领域取代传统的统计工具。

下一步,机器学习方法很可能就将转变为完全成熟的「AI科学家」,以最少的人为干预来提出假设、设计实验、解释结果。

牛顿和莱布尼茨,会对同一现象(微积分)提出互补但又不同的表述。那么在架构、初始方案和训练范式上各不相同的AI,会收敛于不同的理论公式或视角吗?

当AI科学家涉足更大更复杂的数据集,它们学到的理论会怎样以意想不到的方式演变?

这次,研究者在实验中,研究了不同条件下训练的多个AI科学家,是会在科学理论上趋于一致,还是产生分歧。

AI不依赖物理先验,发现潜在物理规律

在论文中,团队提出了一种新方法,在几乎不依赖物理先验的前提下,通过学习一个标量函数,并利用「作用量守恒原理」,来发现潜在的物理规律。

这一思路与哈密顿神经网络(HNN)和拉格朗日神经网络(LNN)相似。

受经典力学中哈密顿描述方式的启发,HNN将物理系统运动方程的学习任务分解为两个步骤:首先学习一个标量函数(即哈密顿量H),然后通过哈密顿正则方程计算运动状态:

LNN则通过改为学习拉格朗日量来规避这一问题,并通过欧拉-拉格朗日方程来求导:

本文关注的核心问题就是:如果模型拥有学习多种理论的自由,它最终会学到什么?

MASS登场!

为此,团队提出了MASS的模型。这是一种通用框架,同样以「作用量守恒原理」为出发点,也从数据中学习一个自由形式的标量函数。

但与LNN和HNN不同,MASS并不会预设运动方程,而是具备自行学习运动方程的能力。

MASS背后的核心思想,就是在一个神经网络中嵌入跨多个物理系统学习与统一信息的能力

它的目标是内化一个共享框架,从而捕捉所有数据集中所体现的基本模式。

具体来说,它通过学习一个标量函数(类似于拉格朗日量或哈密顿量),利用其导数来编码各个系统的特定动力学特征。

MASS 的工作流程如下:

1.数据输入:MASS 接收来自不同物理系统的观测数据,例如轨迹、状态或能量值

2.假说生成:为每个系统分别设立的神经网络将学习一个标量函数,描述该系统的特定动力学

3.理论推导:MASS在所有系统间共享的最终一层会对学习到的标量函数在系统坐标(如位置、动量和/或速度)上的导数进行计算,推导出控制方程

4.精化与泛化:模型的输出会与真实训练数据比对以计算误差,然后通过累加、优化,获得与多物理系统观测结果一致的统一理论

实验

单个AI科学家

在The Grand Design一书中,霍金表达过他对物理的理解:只要预测结果和实验一致,多种理论框架,可以同样有效地描述物理现象。

比如,对于无阻尼弹簧-质量系统,牛顿运动定律可以解释这个系统。

但通过能量函数与守恒定律,哈密顿力学体系获得了全新的理论视角。

相比之下,即便对于简谐振荡器这类相对简单的物理系统,机器学习模型也展现出极强的数据拟合灵活性。

这引出了一个深刻问题:如果训练单个「AI科学家」来研究简谐振荡系统,学习到的理论表征将呈现何种形态?

与经典的牛顿力学或哈密顿力学相比,又会有何异同?

对此,在无阻尼弹簧-质量系统的模拟数据上,研究团队对MASS进行了训练。

图3展示了训练结果。

可以看出,MASS可以很容易地模拟出振子的运动轨迹,它所给出的预测具有良好的一致性和准确性

图3:MASS在简单谐振子上的训练结果

那在对最后一层添加L1和L2正则化的情况下,模型是如何学习并简化理论的?

这要在训练过程中,跟踪模型中的显著权重数量,即在最终输出层中贡献了前99%总范数的权重数量。

可以观察到,随着训练步数的增加,这个数量也在减少,但最终会在42这个相对较大的数值上趋于稳定。

这说明有将近42个权重项具有显著数值,这显然远不能称为一个简单的理论。

毕竟只要4个参数,都能拟合出鼻子会动的大象!

图4描述了在相空间中,MASS学习到的标量函数S与经典哈密顿函数H的对比。

研究发现,单个MASS智能体,能够成功重构出势能与动能之和的表达式。

图4:(a)学习得到的标量函数S与(b)哈密顿量x²+y²的等值线对比图

具体来说,MASS通常能够学习到与传统物理先验相似却存在差异的函数形式。

在图5中,研究者将每个激活的平均范数E(a_i)与对应的权重w_i进行了比较。

总体来看,非零权重通常对应着非零的激活范数对最终预测贡献最大的激活项,和按权重范数排的前五项完全一样。

这就说明它们是MASS所学习理论中最关键的组成部分,对最终预测起到了重要作用。

图5的热力图显示出,显著项形成了三个明显的聚类。

这就说明:模型形成了某种结构化的表示方式,将不同类型的变量组合成特定模式进行预测。

总之,本节结论可以概括如下。

1. 单个AI科学家可以非常有效地学习一个简单的系统(见图3),而且它会随着训练深入自动筛选出重要理论部分。

2. 学习到的理论结构类似于我们熟悉的物理表达式(见图4)。

3. 当模型容量增大时,单个AI科学家往往会学习到多个看似不同的理论(见图5(a))。

4. 不过,这些不同的理论之间往往是强相关的(见图5(b)),实质上反映的是同一种规律。

那么,当AI科学家面对更复杂的物理系统时,哪些重要项会保留,哪些会消失?

AI科学家:更复杂的系统

简谐振子系统可能对于一个机器学习模型来说太简单了——它只需要拟合-x就够了。

接下来,研究者探索了当AI科学家起初只观察单一系统,后来逐步接触到更复杂的物理系统时,会发生什么变化。

本节关注的四个具体系统:简谐振子、单摆系统、开普勒问题/引力势能系统、相对论简谐振子。

当面对多个系统时,AI科学家如何稀疏化其理论(即筛选出关键项)?

又如何多样化地学习,适用于不同物理规律表达结构的?

图6展示了MASS模型在面对逐步增加复杂度的物理系统时的训练表现。

训练过程的具体安排如下:

- 在第0步开始,模型首先接触的是简谐振子系统;

- 到了第10,000步,加入了单摆系统;

- 第20,000步时,再加入引力势能系统(开普勒问题);

- 第30,000步时,引入最后一个系统——相对论简谐振子。

这个训练策略模拟了「AI科学家」逐步暴露在越来越复杂的自然规律面前的过程,进而观察它如何在学习过程中调整和发展自己的理论结构。

可以发现如下结论。

1. 随着系统数量的增加,模型学习到的显著项数量反而减少了。

2. 随着系统数量的增加,模型学习到的理论变得更加多样化。

这说明:能同时解释多个系统的项要比解释单一或部分系统的项少得多

第二个发现则体现在图7中相关性热图的右下角:随着训练系统的增多,越来越多彼此不相关的项开始出现

有趣的是,他们还发现:当MASS被要求同时解释多个系统时,它最终倾向于使用几乎相同的一组项来统一建模

这表明在多系统学习中,模型倾向于寻找通用理论表达

多个科学家:理论融合共生

当不同科学家回答同样的问题时,似乎得出不同的理论,但其实只是同一硬币的两面(比如牛顿和莱布尼茨)。

当多个科学家去学习同样的知识呢?

可以看出,不同智能体间的权重参数与激活值,存在显著差异。

如下图所示,根据初始化条件的不同,显著项的选择会发生剧烈变化。

然而即便如此,不同智能体筛选出的显著项却保持高度一致。

图8展示了各激活项的相对强度分布,可见清晰的带状分布特征——这些条纹标定了可用于构建系统描述理论的可能项。

然而,激活强度与权重的大幅波动表明:虽然所有MASS学习的理论都落在图8的暗纹区域内,但每位「AI科学家」完全可能学会不同的理论形式。

那么,这些AI科学家是否在学习完全不同的内容?

下文将证明,事实并非如此。

研究者针对MASS模型输出层的激活矩阵,进行主成分分析(PCA),可以发现:在大多数随机初始化情况下,仅第一主成分就能解释90%以上的方差。

将主成分降维后的B×1激活值,分布如图14所示——统计分布特性实际上与均匀分布等效。

这一发现,在相对论性弹簧质量系统(图15b)和单摆系统(图15a)的多智能体实验中得到进一步验证。

通过计算降维后B×1激活向量的相关系数(见图9),可以发现:不同智能体间存在强相关性。

基于上述实验结果,可以得出明确结论:当针对同一物理系统训练时,不同智能体确实能够学到相同的底层理论。

这样,文章最初的核心问题就被证实了:两位AI科学家确实能够达成共识!

探索未知:Is拉格朗日all you need?

现在将分析拓展至完全普适的情形:让多个MASS智能体在多个物理系统上进行训练。

如果将现有框架拓展至尚未发现的系统时,会发生什么?

为此,研究者引入了合成系统。

如表I所示,通过定义每个系统的动能T与势能V进行系统改造,特别构建了两个附加合成系统。

核心实验结果如图10所示。

其中正确MASS智能体的数量定义为:在全部已见物理系统上,最大MSE损失低于5×10⁻³的初始化种子数;而显著项的数量定义为:输出层172个项中,累计贡献95%总范数所需的最少项数。

随着训练系统数量的增加,始终保持正确的MASS智能体数量呈下降趋势(图10蓝色虚线)。

研究者在所有正确的MASS科学家上进行这种受限优化拟合,结果列于表II中。

与先前的观察结果一致,MASS几乎可以直接被转换为拉格朗日理论,其R^2值普遍高于0.9。

这种与拉格朗日理论之间的强相关性引出了一个更深层次的问题:我们是否还能找到第三种经典力学的描述方式?

至少,在MASS所探索的T=172个表达项的丰富理论空间中,答案似乎是否定的——拉格朗日描述就足够了

AI学会拓展到高维系统

尽管前文主要研究一维问题,但自然界中绝大多数物理系统都具有更高维度。

本节中,研究者以经典的双摆混沌系统为例展开研究——该系统的两个自由度分别为两个摆杆的摆动角度。实验结果表明,MASS能有效拓展至高维场景。

研究团队成功复现了双摆系统的解析轨迹(图12)。

实验实现了对摆动角度的精确预测,与拉格朗日神经网络的结果相当。

值得注意的是,尽管没有在架构中直接引入拉格朗日方程和欧拉-拉格朗日方程来强制能量守恒,MASS仍能自主习得该特性!

这就跟团队的预期相一致了,他们发现:MASS学到的理论形式,与拉格朗日量高度相似。

作者介绍

Xinghong Fu

麻省理工学院数学和CS专业的本科生,在Max Tegmark实验室做过本科研究员,工作为将机器学习应用到物理学领域。

刘子鸣(Ziming Liu)

刘子鸣,从事AI与科学交叉领域研究。

2021年2月,他进入麻省理工学院,攻读物理学博士学位,预计今年5月毕业。

2020年9月-2021年2月,他在业界从事机器学习理论研究。

2016年9月-2020年6,他就读于北京大学物理学专业。

Max Tegmark

Max Tegmark,MIT的明星物理学教授。

他在获得皇家理工学院的物理学理学士学位后,于1990年离开了瑞典。之后,他就读于加利福尼亚大学伯克利分校,并于1992年获得硕士学位,1994年获得博士学位。

博士毕业后,他先后在马克斯-普朗克物理研究所、普林斯顿高等研究院、宾夕法尼亚大学任职。2004年至今,他一直在麻省理工学院物理系。

他专注于宇宙学和量子信息,但他当前研究的主要焦点是智能物理学。

参考资料:

https://arxiv.org/pdf/2504.02822v1

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
同时惹怒中俄韩后,高市早苗想见金正恩,朝方:千年宿敌日寇!

同时惹怒中俄韩后,高市早苗想见金正恩,朝方:千年宿敌日寇!

阿龙聊军事
2025-11-15 18:27:59
辞去中国乒协主席!刘国梁当选国际乒联副主席 得票率91%断崖领先

辞去中国乒协主席!刘国梁当选国际乒联副主席 得票率91%断崖领先

风过乡
2025-11-16 08:19:22
关注 | 三大航司:日本机票免费退改!

关注 | 三大航司:日本机票免费退改!

天津广播
2025-11-15 15:29:10
知名歌手演出过程中突然“点支烟”!卫健委:已对当事人进行处罚

知名歌手演出过程中突然“点支烟”!卫健委:已对当事人进行处罚

极目新闻
2025-11-16 10:27:34
又一科技巨头暴雷!5000人近10亿被套,人去楼空,老板已跑路?

又一科技巨头暴雷!5000人近10亿被套,人去楼空,老板已跑路?

八斗小先生
2025-11-14 17:43:11
第三轮第五批中央生态环境保护督察全面启动

第三轮第五批中央生态环境保护督察全面启动

生态环境部
2025-11-15 15:05:05
陈梦不敌王曼昱后,李武军专访,问大梦:打完比赛后有何打算?

陈梦不敌王曼昱后,李武军专访,问大梦:打完比赛后有何打算?

海阔山遥YAO
2025-11-16 06:43:05
传小米公关总经理王化将转岗

传小米公关总经理王化将转岗

DoNews
2025-11-16 12:26:42
山西狗咬人事件,邻居家的监控帮申某家大忙了!对方轮番上去打砸

山西狗咬人事件,邻居家的监控帮申某家大忙了!对方轮番上去打砸

火山诗话
2025-11-16 08:12:14
交管12123重大更新!违章当天直达通知,4次免罚正确打开方式速藏

交管12123重大更新!违章当天直达通知,4次免罚正确打开方式速藏

阿芒娱乐说
2025-11-16 10:51:47
餐厅老板回忆巴厘岛车祸伤亡者:他们前一天还在我的餐厅有说有笑,我去医院看望幸存者,“我们都哭了”

餐厅老板回忆巴厘岛车祸伤亡者:他们前一天还在我的餐厅有说有笑,我去医院看望幸存者,“我们都哭了”

红星新闻
2025-11-15 22:51:19
日本敢不敢先打

日本敢不敢先打

求实处
2025-11-16 00:27:27
新甲午战争?这次中国要摧毁日本的军国意志,要击沉日本岛,要雪百年之耻!

新甲午战争?这次中国要摧毁日本的军国意志,要击沉日本岛,要雪百年之耻!

李光满说
2025-11-13 20:24:13
招商局集团有限公司原副总经理李百安接受审查调查

招商局集团有限公司原副总经理李百安接受审查调查

界面新闻
2025-11-16 11:02:38
狗主上门被反杀后续:索赔百万、对警方放狠话,邻居曝光郭家不堪

狗主上门被反杀后续:索赔百万、对警方放狠话,邻居曝光郭家不堪

吭哧有力
2025-11-15 18:42:28
中方多个用词罕见!高市的“存亡危机”不在台海

中方多个用词罕见!高市的“存亡危机”不在台海

齐鲁壹点
2025-11-16 08:01:56
大反转!高市早苗怎么都没想到:踩她最狠的不是中国,而是特朗普

大反转!高市早苗怎么都没想到:踩她最狠的不是中国,而是特朗普

冷眼看世界728
2025-11-15 14:57:18
宫鲁鸣不用她是有原因的,看看颁奖典礼上这一幕,太让四川寒心了

宫鲁鸣不用她是有原因的,看看颁奖典礼上这一幕,太让四川寒心了

萌兰聊个球
2025-11-16 09:35:46
约基奇27+12+10率4人20+掘金擒森林狼7连胜,穆雷23+11华子26+8+6

约基奇27+12+10率4人20+掘金擒森林狼7连胜,穆雷23+11华子26+8+6

湖人崛起
2025-11-16 12:09:08
狗主人真实身份遭曝光:她带人砸窗破门确实有底气,还真管不了她

狗主人真实身份遭曝光:她带人砸窗破门确实有底气,还真管不了她

汉史趣闻
2025-11-16 08:12:31
2025-11-16 14:24:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13881文章数 66249关注度
往期回顾 全部

科技要闻

谁在炒作全固态电池?

头条要闻

毛宁援引《中日联合声明》 发英日双语海报提醒日方

头条要闻

毛宁援引《中日联合声明》 发英日双语海报提醒日方

体育要闻

樊振东和他的尖子班 勇闯地表最强乒乓球赛

娱乐要闻

宋佳二封,易烊千玺拿奖张艺谋乐开花

财经要闻

涉三宗罪 释永信被批准逮捕

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

房产
家居
数码
公开课
军事航空

房产要闻

首开狂卖6.68亿!海口这个顶级教育红盘,引爆海口楼市!

家居要闻

现代简逸 寻找生活的光

数码要闻

英特尔Arrow Lake Refresh处理器曝光:频率提升100MHz

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

解密福建舰电磁弹射背后的硬核支撑

无障碍浏览 进入关怀版