网易首页 > 网易号 > 正文 申请入驻

UC伯克利实现预训练机器学习势函数的跨泛函迁移学习

0
分享至



作者 | 论文团队

编辑 | ScienceAI

原子级模拟为材料性质的预测与虚拟筛选提供了重要手段,其核心在于准确描述体系的势能面(PES)。相比于传统 PES 的计算所依赖的方法——从头算量子化学方法(如密度泛函理论 DFT)与经验力场而言,机器学习原子间势函数可以更好权衡精度与效率,通过从 DFT 数据中学习原子间相互作用,对 PES 进行准确构建。

近年来,随着数据和模型规模的扩大,基于数百万 DFT 计算训练的基座势能(foundation potentials, FPs)进一步展现出跨化学空间的泛化潜力,已被广泛用于声子谱预测、相图构建、催化筛选与分子动力学模拟等下游任务,为多尺度材料建模奠定了新的基础。

然而,绝大多数 FPs 依然是在大量低精度 GGA/GGA+U 的 DFT 泛函数据上训练的,随着我们对于下游任务提出更高的模拟精度的需求,经低精度数据预训练的模型亟待通过对于高精度数据(如 r2SCAN、HSE06 泛函)的迁移学习,构造为精度更高的模型。

为应对这一跨泛函迁移挑战,来自加州大学伯克利分校(UCB)的黄旭,邓博文,钟佩辰及 Gerbrand Ceder 教授等,在名为 CHGNet 的基座势能框架内分析了这一跨泛函由低精度数据到高精度数据迁移学习问题的挑战及解决方案。

该研究以「Cross-functional transferability in foundation machine learning interatomic potentials」为题,于 2025 年 10 月 21 日刊登于《npj Computational Materials》。



论文链接:https://www.nature.com/articles/s41524-025-01796-y

基座势能在当前训练数据的局限及跨泛函迁移的挑战

目前用于晶体材料的基座势能(FPs)训练的数据集主要是 GGA 和 GGA+U 水平的 DFT 泛函数据组成。

首先,GGA/GGA + U 泛函在不同化学键环境下的迁移能力较低,整体计算精度较低。其次,为减少 GGA 中的自相互作用误差而施加的 Hubbard U 校正,本质上是半经验性的且具有非普适性。「最优」U 值并没有明确的定义,线性响应法等方法表明,这样的最优 U 值通常依赖于具体体系。

然而,GGA/GGA + U 的 FP 数据集在生成时,对每种元素都使用相同的 U 值,而不考虑局部环境或形式价态。再次,我们通常采用一种粗粒度的方案将 GGA 与 GGA + U 混合以构建 FPs 训练集。这样的混合方式可能引发问题,例如在这些训练数据之间移动时,原子间势能可能会出现数百 meV 的突跃,这是不利于平滑势能面构建的。

在多精度 DFT 数据集之间实现显式或隐式的跨泛函可迁移性的主要策略有三种:迁移学习(transfer learning)、多精度学习(multi-fidelity learning)以及混合多精度训练(mixed multi-fidelity training)。

这三种方法有各自的优势及挑战,其中,迁移学习指的是先在大规模的低精度数据集上对一个大型神经网络进行预训练,然后将该网络的预训练权重用于初始化在更小规模的高精度数据集上的机器学习任务。这种方法在计算和数据利用上都非常高效。然而,如果不同精度数据集之间的相关性不够强,迁移学习的效果就会变差,甚至可能导致性能下降,这种现象被称为「负迁移」(negative transfer)。

MP-r2SCAN 数据集

研究团队构建了一个来自 Materials Project 数据库的 r2SCAN 弛豫轨迹解析而成的 r2SCAN 数据集(MP-r2SCAN),用于高精度训练任务,包含 34,927 个材料 ID 和 238,247 个结构。与 MPtrj 数据集(包含 145,923 个材料 ID 和 1,580,395 个结构)相比,MP-r2SCAN 的数据规模显著更小。

如下图图 b 所示,r2SCAN 与 GGA/GGA + U 的总能量分布在不同的数值范围上。从 GGA/GGA + U 到 r2SCAN 的能量偏移量在 0–70 eV/atom 的量级,这远大于势函数能量精度(约 30 meV/atom),这表明这些 r2SCAN 能量标签若没有合适的参考或归一化处理,是无法直接有效迁移使用的。



使用不同原子参考能量的迁移学习及基准测试





对于在具有基于 GGA/GGA + U 总能量拟合的 AtomRef 的势函数 FP 上进行的跨泛函迁移学习,可以重新拟合该 FP 的 AtomRef(用基于 r2SCAN 能量拟合得到的 AtomRef 替换原有的基于 GGA/GGA + U 的 AtomRef),从而将 FP 迁移前后图神经网络学习的能量预测部分对齐到相近的数值尺度,并提升预训练与微调数据集之间的相关性,克服迁移学习中「负迁移」的挑战。实际上,Pearson 相关系数 ρ 从未修正的 GGA/GGA + U 与 r2SCAN 数据集之间的 0.0917,提高到了在分别减去各自 AtomRef 后的 r2SCAN 能量与 GGA/GGA + U 能量之间的 0.9250。此外,此种方法也减少了微调开始阶段梯度过大导致的训练不稳定性。由下图可以观察到,不重新拟合 AtomRef 的方法的初始梯度幅值至少比重新拟合 AtomRef 的方法大一个数量级,且重新拟合 AtomRef 后,模型的训练过程更加稳定且可靠。



在基准测试方面,该研究将重新拟合原子参考能量进行迁移学习的方法和其他几个迁移学习方法以及从头用 r2SCAN 数据训练(无迁移学习)的方法进行了对比,得到在能量、原子间作用力、应力、磁矩、热力学稳定性(形成能、分解能)、密度预测方面都更准确可靠的 FPs。如下图所示,方法 4(即重新拟合原子参考能量的迁移学习)在密度预测(与实验密度数据对比)方法显著优于其他方法。此外,实验值与预测值之比的分布显示,基于 GGA 预训练的 CHGNet 模型更倾向于低估密度,而方法 4 所得到的分布相比其他方法更紧密地集中在理想值(比值 = 1)附近。上述结果表明,从 GGA 向 r2SCAN 的迁移学习方法是有效的,并且使用 r2SCAN 数据、通过方法 4 训练得到的模型在实际体积与密度预测中具有更高的精度潜力。



除了从 GGA/GGA+U 到 r2SCAN 泛函数据迁移学习,团队也研究了从 GGA/GGA+U 到卤化物范德华数据集和 HSE06 数据集的迁移学习(见论文中的补充信息),证明了这种迁移方法的普适有效性。

扩展定律

为评估重新拟合原子参考能量的迁移学习方法的数据效率提升,研究团队进行了扩展定律研究(下图)。线性拟合结果表明,无论是从头用 r2SCAN 数据训练(无迁移学习)还是迁移学习(蓝色),都表现出线性扩展规律的行为。仅使用 1K 个高精度数据点进行迁移学习,就能超越在超过 10K 个高精度数据点上从头训练的模型性能,这意味着通过 GGA 预训练步骤获得了超过十倍的数据效率提升。有趣的是,研究团队观察到,即使在包含 24 万个结构的完整 MP-r2SCAN 数据集上,迁移学习相较于从头训练的优势仍未饱和,表现出出色的数据效率。



总结与展望

研究团队通过在 MP-r2SCAN 数据集上对不同 TL 方法进行得到在能量、原子间作用力、应力、磁矩、热力学稳定性(形成能、分解能)、密度预测方面的基准测试,证明了 FPs 迁移学习中重新拟合原子参考能量的重要性及此方法的有效性。并且,通过比较具有和不具有低精度数据集预训练的扩展定律,研究表明了得当的迁移学习方法可以实现显著的数据效率提升。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
斯诺克赛程:19局10胜决出冠军,小特拒绝决赛3连败,新王或登基

斯诺克赛程:19局10胜决出冠军,小特拒绝决赛3连败,新王或登基

刘姚尧的文字城堡
2025-11-16 08:01:12
自从吹牛上税后,“双11”的战报偃旗息鼓了

自从吹牛上税后,“双11”的战报偃旗息鼓了

细雨中的呼喊
2025-11-14 16:34:41
别再为孙颖莎“被骂”打抱不平了!张继科:她本就不只靠天赋赢的

别再为孙颖莎“被骂”打抱不平了!张继科:她本就不只靠天赋赢的

讯崽侃天下
2025-10-26 21:25:22
安德玛为何宁愿多花9500万,也要终止与库里12年的合作?

安德玛为何宁愿多花9500万,也要终止与库里12年的合作?

体育产业独立评论
2025-11-14 22:24:08
中方直接掀了桌,27国不许用华为,“5G之战爆发”,先拿德国开刀

中方直接掀了桌,27国不许用华为,“5G之战爆发”,先拿德国开刀

趣文说娱
2025-11-15 14:11:13
陈英已任重庆市委组织部副部长(主持日常工作)

陈英已任重庆市委组织部副部长(主持日常工作)

澎湃新闻
2025-11-16 19:18:28
“生死都在台湾?”郭台铭:若两岸开战,将提供物资用以对抗大陆

“生死都在台湾?”郭台铭:若两岸开战,将提供物资用以对抗大陆

boss外传
2025-07-30 11:00:03
琉球群岛,距离中国110公里!若独立或将是日本不可承受之重

琉球群岛,距离中国110公里!若独立或将是日本不可承受之重

阿光的技巧课堂
2025-11-16 19:28:27
樊振东:才意识到自己连续四次进全运会决赛,每一次都是非常美好的回忆

樊振东:才意识到自己连续四次进全运会决赛,每一次都是非常美好的回忆

上观新闻
2025-11-16 16:48:05
手握20个世界冠军,“忘拉窗帘”身败名裂,生图脸垮沧桑近况如何

手握20个世界冠军,“忘拉窗帘”身败名裂,生图脸垮沧桑近况如何

胡一舸南游y
2025-11-11 19:14:10
这是我见过的最震撼的变脸,堪称医学奇迹

这是我见过的最震撼的变脸,堪称医学奇迹

听风听你
2025-11-14 22:26:32
文化工作者要有文化:《澎湖海战》用“东宁”指代明郑,是否妥当

文化工作者要有文化:《澎湖海战》用“东宁”指代明郑,是否妥当

黄娜老师
2025-11-16 11:24:31
川南曾存在过一条黄泉路,如今已被禁止进入,当地村民:有来无回

川南曾存在过一条黄泉路,如今已被禁止进入,当地村民:有来无回

古怪奇谈录
2025-08-22 10:01:46
290亿!小米再次爆火

290亿!小米再次爆火

蒋东文
2025-11-14 18:44:32
悄悄5连胜,从摆烂到争总冠军!西部黑马崛起,这笔交易真的双赢

悄悄5连胜,从摆烂到争总冠军!西部黑马崛起,这笔交易真的双赢

篮球扫地僧
2025-11-16 13:03:48
突然爆雷!人去屋空,电话停机…不少人慌了:刚付了钱,平台跑路?

突然爆雷!人去屋空,电话停机…不少人慌了:刚付了钱,平台跑路?

黄河新闻网吕梁频道
2025-11-16 10:10:28
被谢贤养了12年,用青春换来2000万的Coco,已经走上了另一条道路

被谢贤养了12年,用青春换来2000万的Coco,已经走上了另一条道路

贵州小娟
2025-11-16 13:54:54
神秘培训机构内男女学员赤裸上身集体狂舞,隐私成洗脑工具

神秘培训机构内男女学员赤裸上身集体狂舞,隐私成洗脑工具

诗意世界
2025-11-14 21:15:23
一旦开启武统,大陆和台湾谁先垮?柯文哲:大陆恐怕撑不过两周。

一旦开启武统,大陆和台湾谁先垮?柯文哲:大陆恐怕撑不过两周。

明月文史
2025-10-10 12:23:09
一场比一场差!火箭老熟人之前的45分之战只是偶尔吃顿饺子吗?

一场比一场差!火箭老熟人之前的45分之战只是偶尔吃顿饺子吗?

稻谷与小麦
2025-11-17 00:25:20
2025-11-17 00:36:49
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1151文章数 218关注度
往期回顾 全部

科技要闻

雷军,怒了!刚刚连发多条微博

头条要闻

央视:若高市早苗死不悔改 日本将万劫不复

头条要闻

央视:若高市早苗死不悔改 日本将万劫不复

体育要闻

最佳新秀候选!2028美国男篮有他一个位置

娱乐要闻

CEO爆料肖战《藏海传》狂赚几十亿!

财经要闻

房源暗中调价 央企举报广州国资房企

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

健康
教育
本地
房产
公开课

血液科专家揭秘白血病七大误区

教育要闻

妈妈晒高二儿子吃宵夜,女网友眼睛看直了:这颜值,小姑娘遭殃了

本地新闻

沈阳都市圈“冷资源”点燃“热联动” “组团”北上“圈粉”哈尔滨

房产要闻

首开狂卖6.68亿!海口这个顶级教育红盘,引爆海口楼市!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版