网易首页 > 网易号 > 正文 申请入驻

UC伯克利实现预训练机器学习势函数的跨泛函迁移学习

0
分享至



作者 | 论文团队

编辑 | ScienceAI

原子级模拟为材料性质的预测与虚拟筛选提供了重要手段,其核心在于准确描述体系的势能面(PES)。相比于传统 PES 的计算所依赖的方法——从头算量子化学方法(如密度泛函理论 DFT)与经验力场而言,机器学习原子间势函数可以更好权衡精度与效率,通过从 DFT 数据中学习原子间相互作用,对 PES 进行准确构建。

近年来,随着数据和模型规模的扩大,基于数百万 DFT 计算训练的基座势能(foundation potentials, FPs)进一步展现出跨化学空间的泛化潜力,已被广泛用于声子谱预测、相图构建、催化筛选与分子动力学模拟等下游任务,为多尺度材料建模奠定了新的基础。

然而,绝大多数 FPs 依然是在大量低精度 GGA/GGA+U 的 DFT 泛函数据上训练的,随着我们对于下游任务提出更高的模拟精度的需求,经低精度数据预训练的模型亟待通过对于高精度数据(如 r2SCAN、HSE06 泛函)的迁移学习,构造为精度更高的模型。

为应对这一跨泛函迁移挑战,来自加州大学伯克利分校(UCB)的黄旭,邓博文,钟佩辰及 Gerbrand Ceder 教授等,在名为 CHGNet 的基座势能框架内分析了这一跨泛函由低精度数据到高精度数据迁移学习问题的挑战及解决方案。

该研究以「Cross-functional transferability in foundation machine learning interatomic potentials」为题,于 2025 年 10 月 21 日刊登于《npj Computational Materials》。



论文链接:https://www.nature.com/articles/s41524-025-01796-y

基座势能在当前训练数据的局限及跨泛函迁移的挑战

目前用于晶体材料的基座势能(FPs)训练的数据集主要是 GGA 和 GGA+U 水平的 DFT 泛函数据组成。

首先,GGA/GGA + U 泛函在不同化学键环境下的迁移能力较低,整体计算精度较低。其次,为减少 GGA 中的自相互作用误差而施加的 Hubbard U 校正,本质上是半经验性的且具有非普适性。「最优」U 值并没有明确的定义,线性响应法等方法表明,这样的最优 U 值通常依赖于具体体系。

然而,GGA/GGA + U 的 FP 数据集在生成时,对每种元素都使用相同的 U 值,而不考虑局部环境或形式价态。再次,我们通常采用一种粗粒度的方案将 GGA 与 GGA + U 混合以构建 FPs 训练集。这样的混合方式可能引发问题,例如在这些训练数据之间移动时,原子间势能可能会出现数百 meV 的突跃,这是不利于平滑势能面构建的。

在多精度 DFT 数据集之间实现显式或隐式的跨泛函可迁移性的主要策略有三种:迁移学习(transfer learning)、多精度学习(multi-fidelity learning)以及混合多精度训练(mixed multi-fidelity training)。

这三种方法有各自的优势及挑战,其中,迁移学习指的是先在大规模的低精度数据集上对一个大型神经网络进行预训练,然后将该网络的预训练权重用于初始化在更小规模的高精度数据集上的机器学习任务。这种方法在计算和数据利用上都非常高效。然而,如果不同精度数据集之间的相关性不够强,迁移学习的效果就会变差,甚至可能导致性能下降,这种现象被称为「负迁移」(negative transfer)。

MP-r2SCAN 数据集

研究团队构建了一个来自 Materials Project 数据库的 r2SCAN 弛豫轨迹解析而成的 r2SCAN 数据集(MP-r2SCAN),用于高精度训练任务,包含 34,927 个材料 ID 和 238,247 个结构。与 MPtrj 数据集(包含 145,923 个材料 ID 和 1,580,395 个结构)相比,MP-r2SCAN 的数据规模显著更小。

如下图图 b 所示,r2SCAN 与 GGA/GGA + U 的总能量分布在不同的数值范围上。从 GGA/GGA + U 到 r2SCAN 的能量偏移量在 0–70 eV/atom 的量级,这远大于势函数能量精度(约 30 meV/atom),这表明这些 r2SCAN 能量标签若没有合适的参考或归一化处理,是无法直接有效迁移使用的。



使用不同原子参考能量的迁移学习及基准测试





对于在具有基于 GGA/GGA + U 总能量拟合的 AtomRef 的势函数 FP 上进行的跨泛函迁移学习,可以重新拟合该 FP 的 AtomRef(用基于 r2SCAN 能量拟合得到的 AtomRef 替换原有的基于 GGA/GGA + U 的 AtomRef),从而将 FP 迁移前后图神经网络学习的能量预测部分对齐到相近的数值尺度,并提升预训练与微调数据集之间的相关性,克服迁移学习中「负迁移」的挑战。实际上,Pearson 相关系数 ρ 从未修正的 GGA/GGA + U 与 r2SCAN 数据集之间的 0.0917,提高到了在分别减去各自 AtomRef 后的 r2SCAN 能量与 GGA/GGA + U 能量之间的 0.9250。此外,此种方法也减少了微调开始阶段梯度过大导致的训练不稳定性。由下图可以观察到,不重新拟合 AtomRef 的方法的初始梯度幅值至少比重新拟合 AtomRef 的方法大一个数量级,且重新拟合 AtomRef 后,模型的训练过程更加稳定且可靠。



在基准测试方面,该研究将重新拟合原子参考能量进行迁移学习的方法和其他几个迁移学习方法以及从头用 r2SCAN 数据训练(无迁移学习)的方法进行了对比,得到在能量、原子间作用力、应力、磁矩、热力学稳定性(形成能、分解能)、密度预测方面都更准确可靠的 FPs。如下图所示,方法 4(即重新拟合原子参考能量的迁移学习)在密度预测(与实验密度数据对比)方法显著优于其他方法。此外,实验值与预测值之比的分布显示,基于 GGA 预训练的 CHGNet 模型更倾向于低估密度,而方法 4 所得到的分布相比其他方法更紧密地集中在理想值(比值 = 1)附近。上述结果表明,从 GGA 向 r2SCAN 的迁移学习方法是有效的,并且使用 r2SCAN 数据、通过方法 4 训练得到的模型在实际体积与密度预测中具有更高的精度潜力。



除了从 GGA/GGA+U 到 r2SCAN 泛函数据迁移学习,团队也研究了从 GGA/GGA+U 到卤化物范德华数据集和 HSE06 数据集的迁移学习(见论文中的补充信息),证明了这种迁移方法的普适有效性。

扩展定律

为评估重新拟合原子参考能量的迁移学习方法的数据效率提升,研究团队进行了扩展定律研究(下图)。线性拟合结果表明,无论是从头用 r2SCAN 数据训练(无迁移学习)还是迁移学习(蓝色),都表现出线性扩展规律的行为。仅使用 1K 个高精度数据点进行迁移学习,就能超越在超过 10K 个高精度数据点上从头训练的模型性能,这意味着通过 GGA 预训练步骤获得了超过十倍的数据效率提升。有趣的是,研究团队观察到,即使在包含 24 万个结构的完整 MP-r2SCAN 数据集上,迁移学习相较于从头训练的优势仍未饱和,表现出出色的数据效率。



总结与展望

研究团队通过在 MP-r2SCAN 数据集上对不同 TL 方法进行得到在能量、原子间作用力、应力、磁矩、热力学稳定性(形成能、分解能)、密度预测方面的基准测试,证明了 FPs 迁移学习中重新拟合原子参考能量的重要性及此方法的有效性。并且,通过比较具有和不具有低精度数据集预训练的扩展定律,研究表明了得当的迁移学习方法可以实现显著的数据效率提升。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
教育部扔下重磅炸弹:2026年开始,全国一律不准再买校外商业试卷

教育部扔下重磅炸弹:2026年开始,全国一律不准再买校外商业试卷

趣文说娱
2026-01-05 17:49:32
重磅!曼联锁定“世界最佳主帅”,高薪+四年合约诚意拉满

重磅!曼联锁定“世界最佳主帅”,高薪+四年合约诚意拉满

夜白侃球
2026-01-06 20:15:50
东风17不藏了,竹林起竖实弹画面首曝,台海点穴利器已就位

东风17不藏了,竹林起竖实弹画面首曝,台海点穴利器已就位

小涛叨叨
2026-01-04 19:15:26
长城汽车正式取消“大小周”,全面落实双休制度,员工:刚开始听到消息,以为是谣言不敢信

长城汽车正式取消“大小周”,全面落实双休制度,员工:刚开始听到消息,以为是谣言不敢信

大风新闻
2026-01-06 16:58:03
芬兰公司宣布量产全球首款全固态电池,5分钟可充满,能量密度400Wh/kg

芬兰公司宣布量产全球首款全固态电池,5分钟可充满,能量密度400Wh/kg

金融界
2026-01-06 14:03:20
流落柬埔寨街头女子,毒品检测呈阳性

流落柬埔寨街头女子,毒品检测呈阳性

中国新闻周刊
2026-01-06 11:36:20
巴拿马总统:已正式通知中国,退出一带一路计划,中方送出4个字

巴拿马总统:已正式通知中国,退出一带一路计划,中方送出4个字

瞳哥视界
2026-01-05 21:48:45
新华社消息|外交部:没有哪个国家可以充当国际警察,没有哪个国家可以自诩为国际法官

新华社消息|外交部:没有哪个国家可以充当国际警察,没有哪个国家可以自诩为国际法官

新华社
2026-01-06 17:32:44
高市新年首次喊中国对话,不到24小时,中方用对日反制作出回应

高市新年首次喊中国对话,不到24小时,中方用对日反制作出回应

时时有聊
2026-01-06 20:52:09
流落柬埔寨女网红毒品检测呈阳性,视频主页称“靠自己没用的”,家人赴柬,大使馆提醒

流落柬埔寨女网红毒品检测呈阳性,视频主页称“靠自己没用的”,家人赴柬,大使馆提醒

潇湘晨报
2026-01-06 17:20:18
活该!原配失明时,万科老王正“爷孙恋”呢

活该!原配失明时,万科老王正“爷孙恋”呢

凹凹滴
2026-01-06 14:09:03
美媒:马杜罗对美国赋予的权利表示震惊,从没想到自己还能申请保释

美媒:马杜罗对美国赋予的权利表示震惊,从没想到自己还能申请保释

回旋镖
2026-01-06 08:21:11
YU7新车未出店,后备箱就打不开,车主要退车!小米回应

YU7新车未出店,后备箱就打不开,车主要退车!小米回应

都市快报橙柿互动
2026-01-06 18:17:35
网传华侨城前董事长段先念,被抓了

网传华侨城前董事长段先念,被抓了

风向观察
2026-01-06 17:45:39
快观察 | 李在明访华,除了“超时长”元首外交,还释放了哪些信号?

快观察 | 李在明访华,除了“超时长”元首外交,还释放了哪些信号?

上观新闻
2026-01-06 20:01:07
影石掀了无人机的桌子

影石掀了无人机的桌子

市值榜
2026-01-05 08:59:19
美军大批军机飞欧洲!调动模式与去年“空袭伊朗”惊人相似,抓一艘逃亡17天油轮?

美军大批军机飞欧洲!调动模式与去年“空袭伊朗”惊人相似,抓一艘逃亡17天油轮?

红星新闻
2026-01-06 19:14:23
中国人体器官捐献管理中心:2025 温暖收官 —— 2026 向爱出发!

中国人体器官捐献管理中心:2025 温暖收官 —— 2026 向爱出发!

上海市红十字会
2026-01-06 15:28:37
司法机关请回答:新华社功勋记者汤计,究竟有无“受贿房产”?

司法机关请回答:新华社功勋记者汤计,究竟有无“受贿房产”?

塔子山评说
2026-01-06 10:26:30
艾滋病新增130万!很多人中招很冤枉!在外“5不碰”一定要记死

艾滋病新增130万!很多人中招很冤枉!在外“5不碰”一定要记死

今朝牛马
2025-12-31 19:31:04
2026-01-07 02:03:01
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1199文章数 223关注度
往期回顾 全部

科技要闻

速看!黄仁勋万字实录:甩出"物理AI"王牌

头条要闻

委内瑞拉:马杜罗享有绝对豁免权 美构成非法武装侵略

头条要闻

委内瑞拉:马杜罗享有绝对豁免权 美构成非法武装侵略

体育要闻

从NBA最菜首发控卫,到NBA最强乔治

娱乐要闻

2026年央视春晚彩排照曝光!

财经要闻

50万亿存款"洪流"将至 四大去向引关注

汽车要闻

摩登出街潮品 实拍奇瑞QQ冰淇淋女王版

态度原创

房产
本地
健康
时尚
公开课

房产要闻

爆发!三亚开年超千亩城更计划曝光,香港城砸下100亿!

本地新闻

云游内蒙|初见呼和浩特,古今交融的北疆都会

这些新疗法,让化疗不再那么痛苦

冬天,“大衣”是中年女人的穿搭刚需,这样搭配时髦提气质

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版