网易首页 > 网易号 > 正文 申请入驻

MEGNet普适性图神经网络,精确预测分子和晶体性质

0
分享至

通过迁移学习的方法得到比直接训练更低的MAE和两倍的收敛速度。

近年来机器学习算法在包括自然语言处理,图像识别等诸多领域大放异彩。得益于如Materials Project1, QM92,3等材料数据库的不断完善和发展,机器学习正在被越来越多的应用在材料学领域的研究中。然而,由于研究目标的单一性,多数工作仍然局限于解决特定的晶体结构以及特定的材料性质预测问题。一种泛化的,普适性的机器学习模型仍然是材料学领域研究的重点目标。此研究是基于

基于DeepMind建立的图神经网络框架。

在材料学领域,对分子或晶体结构的特征描述需要满足平移,转动,镜面不变性,以及对整体结构特异信息的表征。常见的结构特征描述由于其局域性,缺乏对整体结构信息的表达,因而不具有普适性。图网络模型(graph-network)是一种基于图论的结构化模型,从理论上完美解决了这一问题。在图论中,图(graph)由若干给定的顶点(node)及连接顶点的边(edge)构成。运用到分子(或晶体)结构中,原子(atom)可以由顶点(node)描述,连接原子之间的化学键(bond)可以由边(edge)描述,从而可以把一个个分子或晶体结构看作一个个独立的“图”。基于此类模型的结构描述方法,科研工作者可以开发出针对任何材料结构或任何物理化学性质的普适性模型。尽管具有理论可行性,此类模型由于模型复杂度,材料数据量的限制,仍很少被应用在材料学领域中4,5。近日,UC San Diego 的 Shyue Ping Ong 课题组基于DeepMind建立的图神经网络框架6,开发了一套分子和晶体通用性质预测模型(MEGNet),在各项性质预测测试中达到了领先水平7。

图1. MEGNet 概述。每个分子/晶体结构由化学键信息,原子信息,和状态信息描述。每个结构描述输入模型后,依次更新,直到总的结构输出性质与DFT计算值接近。

图1中描述了该模型的工作模式: 每个结构可用三个向量表征,分别包含原子信息,化学键信息,和状态函数信息。在每一次模型训练迭代中,依次更新化学键向量,原子向量,和状态函数向量,得到新的结构表征向量,直到通过该表征输出的性质与DFT计算结果趋于一致。作者首先用QM9分子数据集中超过130k数据作为训练集训练模型,并用得到的模型预测分子中的13项物理化学性质,在其中的11项中达到同类模型中的最优结果(表1)。更为先进的是,之前的工作对由状态参数关联的状态函数,如内能(U0, U),焓(H),和吉布斯自由能(G),采用的是分别训练模型进行预测的方法。

然而本工作中,作者采用加入状态参数作为输入的方法,可由单一模型同时预测U0, U, H和G,并保持与分别模型训练类似的准确度,大大提高了训练效率[YZ1]。在针对晶体结构的应用中,作者用Materials Project数据库中超过69k数据作为训练集,针对生成能,能带带隙,体积模量和剪切模量进行了回归(Regression)分析,并用带隙值作为金属和非金属的判据进行分类(classification)分析。回归分析中的平均绝对误差(MAE)低于同类型模型SchNet4和CGCNN5(表2),金属和非金属分类分析中综合准确率达86.9%,ROC中AUC达到0.926,与此前最优模型CGCNN类似。

表1. 不同模型在QM9上预测13项性质的平均绝对误差(MAE)对比

表2. MEGNet和其他基于图像模型

在Materials Project数据集的预测准确度对比

在对模型的深入分析中,作者发现,从最优模型中提取出的元素映射(embedding)与化学常识吻合。例如,将元素映射投影二维空间可发现,Eu和Yb与其他镧系元素距离较远,而与碱土金属更接近,这与化学经验相符。这样的分析一方面佐证了模型可以学习到可靠的化学信息,另一方面可将学习到的化学信息用于迁移学习,以大大降低训练新模型训练所需数据量。例如,在此例中,作者通过用~69k生成热的数据训练的模型提取的元素映射,用于预测带隙和弹性性质的模型训练,后者的数据量只有生成热的一半甚至十分之一。通过迁移学习的方法作者得到比直接训练更低的MAE和提高两倍的收敛速度。这为小数据量的性质的高效准确模型训练提供了可行的方案。

在模型的使用方面,用户可登陆http://megnet.crystals.ai,根据提示输入晶体结构编码或cif文件即可得到模型预测的性质。另外,文章所涉及的Python代码均已开源(https://github.com/materialsvirtuallab/megnet.git)。下面示例如何使用已有模型和训练新的模型。

1示例一: 使用分子模型

2示例二:使用晶体模型预测剪切模量

3示例三:训练新模型

参考文献

(1) Jain, A.; Ong, S. P.; Hautier, G.; Chen, W.; Richards, W. D.; Dacek, S.; Cholia, S.; Gunter, D.; Skinner, D.; Ceder, G.; et al. Commentary: The Materials Project: A Materials Genome Approach to Accelerating Materials Innovation.APL Mater. 2013, 1 (1), 011002. https://doi.org/10.1063/1.4812323.

(2) Ruddigkeit, L.; van Deursen, R.; Blum, L. C.; Reymond, J.-L. Enumeration of 166 Billion Organic Small Molecules in the Chemical Universe Database GDB-17.J. Chem. Inf. Model.2012, 52 (11), 2864–2875. https://doi.org/10.1021/ci300415d.

(3) Ramakrishnan, R.; Dral, P. O.; Rupp, M.; von Lilienfeld, O. A. Quantum Chemistry Structures and Properties of 134 Kilo Molecules.Sci. Data2014, 1, 140022. https://doi.org/10.1038/sdata.2014.22.

(4) Schütt, K. T.; Sauceda, H. E.; Kindermans, P.-J.; Tkatchenko, A.; Müller, K.-R. SchNet – A Deep Learning Architecture for Molecules and Materials.J. Chem. Phys. 2018, 148 (24), 241722. https://doi.org/10.1063/1.5019779.

(5) Xie, T.; Grossman, J. C. Crystal Graph Convolutional Neural Networks for an Accurate and Interpretable Prediction of Material Properties.Phys. Rev. Lett.2018, 120 (14), 145301. https://doi.org/10.1103/PhysRevLett.120.145301.

(6) Battaglia, P. W.; Hamrick, J. B.; Bapst, V.; Sanchez-Gonzalez, A.; Zambaldi, V.; Malinowski, M.; Tacchetti, A.; Raposo, D.; Santoro, A.; Faulkner, R.; et al. Relational Inductive Biases, Deep Learning, and Graph Networks.ArXiv180601261 Cs Stat 2018.

(7) Chen, C.; Ye, W.; Zuo, Y.; Zheng, C.; Ong, S. P. Graph Networks as a Universal Machine Learning Framework for Molecules and Crystals.Chem. Mater. 2019. https://doi.org/10.1021/acs.chemmater.9b01294.

责任编辑:柯立_NN5224

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
血管清道夫榜单公布:洋葱第3,第1名家家都有,中老年人宜多吃

血管清道夫榜单公布:洋葱第3,第1名家家都有,中老年人宜多吃

餐饮新纪元
2026-03-27 07:11:03
不婚不育会被亲戚惦记财产吗?网友:我死之前花完,谁也别惦记

不婚不育会被亲戚惦记财产吗?网友:我死之前花完,谁也别惦记

带你感受人间冷暖
2026-03-14 00:10:08
中国共产党中央军事委员会副主席张升民简历

中国共产党中央军事委员会副主席张升民简历

上观新闻
2025-10-23 18:17:07
反转,反转,再反转!A股都快被转晕了

反转,反转,再反转!A股都快被转晕了

睿知睿见
2026-03-28 07:52:34
以色列退出比利-简-金杯:去不太受欢迎的国家风险太大

以色列退出比利-简-金杯:去不太受欢迎的国家风险太大

懂球帝
2026-03-27 20:09:24
丧夫仅5个月,49岁翁帆突传“喜讯”高调露面,状态好到出人意料

丧夫仅5个月,49岁翁帆突传“喜讯”高调露面,状态好到出人意料

冷紫葉
2026-03-24 19:12:36
国产顶级神剧,只可惜,央视播完就禁了

国产顶级神剧,只可惜,央视播完就禁了

独立鱼
2026-03-23 21:22:17
真拦不住了!以国防部大楼被击中,英媒:美以拦截弹将在月末耗尽

真拦不住了!以国防部大楼被击中,英媒:美以拦截弹将在月末耗尽

咣当地球
2026-03-28 15:07:27
【微特稿】伊朗:美国边打边声称要谈判“不可容忍”

【微特稿】伊朗:美国边打边声称要谈判“不可容忍”

新华社
2026-03-28 12:46:16
1996年, 施瓦辛格在家中无事,和35岁200斤女佣发生不当关系

1996年, 施瓦辛格在家中无事,和35岁200斤女佣发生不当关系

南权先生
2026-01-20 15:49:53
高三男孩喀纳斯湖失踪,母亲守岸7天后直言放弃,意外竟在此时发生

高三男孩喀纳斯湖失踪,母亲守岸7天后直言放弃,意外竟在此时发生

古怪奇谈录
2025-10-16 10:53:42
周杰伦一首新歌,把全国文旅圈都带活了

周杰伦一首新歌,把全国文旅圈都带活了

阿废冷眼观察所
2026-03-27 17:48:08
上海一所小学惊险一幕:41岁爸爸突然倒地,市民联手120上演教科书式急救

上海一所小学惊险一幕:41岁爸爸突然倒地,市民联手120上演教科书式急救

文汇报
2026-03-28 15:51:13
孩子生病后买彩票中500万妈妈发声:孩子生病后家庭开支剧增,想着万一中奖能贴补点家用

孩子生病后买彩票中500万妈妈发声:孩子生病后家庭开支剧增,想着万一中奖能贴补点家用

观威海
2026-03-27 09:27:12
张雪峰去世还不到72小时,恶心的一幕发生了,前女友含泪说出心声

张雪峰去世还不到72小时,恶心的一幕发生了,前女友含泪说出心声

阿纂看事
2026-03-27 18:15:43
一个很玄学的现象:你想要孩子命好,一定要学会避谶、避旧、避人

一个很玄学的现象:你想要孩子命好,一定要学会避谶、避旧、避人

棉花糖妈妈
2026-03-26 21:47:47
楼市小阳春?不要做梦了!你当下及时出手的房子,会变成你的勋章

楼市小阳春?不要做梦了!你当下及时出手的房子,会变成你的勋章

细雨中的呼喊
2026-03-28 00:13:38
勇士险胜!波神28+8首发第一,格林6+10桑托斯爆发,库里也很平静

勇士险胜!波神28+8首发第一,格林6+10桑托斯爆发,库里也很平静

鱼崖大话篮球
2026-03-28 12:39:05
张雪峰追悼会:遗像被鲜花包裹,员工穿黑衣,女儿和奶奶让人心疼

张雪峰追悼会:遗像被鲜花包裹,员工穿黑衣,女儿和奶奶让人心疼

观察鉴娱
2026-03-28 09:49:35
重磅!湖南中小学实施春秋假制度

重磅!湖南中小学实施春秋假制度

潇湘晨报
2026-03-27 18:16:20
2026-03-28 18:36:49
知社学术圈 incentive-icons
知社学术圈
海归学者发起的学术交流平台
3611文章数 107129关注度
往期回顾 全部

科技要闻

遭中国学界"拉黑"后,这家AI顶会低头道歉

头条要闻

美媒:和欧盟"外长"发生激烈交锋 鲁比奥"显然很恼火"

头条要闻

美媒:和欧盟"外长"发生激烈交锋 鲁比奥"显然很恼火"

体育要闻

“我是全家最差劲的运动员”

娱乐要闻

王一博改名上热搜!个人时代正式开启!

财经要闻

用AI来“增效”,大厂打错了算盘

汽车要闻

置换补贴价4.28万起 第五代宏光MINIEV正式上市

态度原创

手机
艺术
本地
旅游
公开课

手机要闻

果粉狂喜!苹果放大招:iPhone 17e白菜价,M4 iPad Air性能暴长30%

艺术要闻

这位富二代写的草书,据说康生临摹500多遍

本地新闻

在潍坊待了三天,没遇到一个“潍坊人”

旅游要闻

视点|2026首届梨花艺术节植树节启幕

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版