网易首页 > 网易号 > 正文 申请入驻

AI再颠覆材料学!微软MatterGen直接生成新材料,稳定性超SOTA模型2.9倍

0
分享至


新智元报道

编辑:编辑部

【新智元导读】继谷歌DeepMind AI工具成功预测出220万种晶体结构后,微软团队最新扩散模型MatterGen,能设计生成新颖、稳定的材料,刷新SOTA。

材料科学领域的一个重大挑战,如今被大模型攻克了。

先前,谷歌DeepMind的全新AI工具GNoME,成功预测出220万种晶体结构,在学术界掀起海啸级地震。

今天,微软团队推出下一代生成式AI工具——MatterGen,大大提升了设计所需特性材料的速度。


当前,材料科学的核心挑战是,发现所需特性的材料,比如高锂离子电导率的电池材料。

一般来说,要做到这一点,首先需要找到新材料,然后根据应用进行筛选。

这就好比要创建一只猫的图像,首先要生成100万张不同的图像,然后再搜索有猫的图像。

而有了MatterGen模型,就可以「直接生成」所需特性的新型材料,这与DALL·E处理图像生成的方式非常相似。


论文地址:https://arxiv.org/pdf/2312.03687.pdf

简单来说,MatterGen是扩散模型的一种,专门设计用于生成新颖、稳定的材料。

另外,MatterGen还有适配器模块,可根据化学、对称性等各种约束条件进行微调,以生成材料。

值得一提的是,与SOTA模型(CDVAE)相比,MatterGen生成的新颖独特结构的稳定性高出2.9倍。它还生成接近能量局部最小值17.5倍的结构。


看得出,AI在材料设计和筛选方面表现出巨大潜力,必将给材料学带来颠覆性的变革。

晶体材料生成的扩散过程

在MatterGen中,研究人员介绍了一种为晶体材料量身定制的新型扩散过程,如下图a。

扩散模型通过学习分数网络(score network)来逆转固定的破坏过程来生成样本。

图像的破坏过程通常添加高斯噪声,但晶体材料具有独特的周期结构和对称性,需要定制的扩散过程。

晶体材料可由其重复单元(即单元格)定义,单元格编码原子类型A(即化学元素)、坐标X和周期晶格L。

作者为每个成分定义了一个适合其自身几何形状的破坏过程,并具有物理上的极限噪声分布。


再具体来讲,坐标扩散采用包裹正态分布,来遵守周期边界,并在噪声极限接近均匀分布。

其中,晶格扩散采用对称形式,接近于平均值为训练数据中原子平均密度的立方晶格分布。原子扩散是在分类空间中定义的,其中单个原子被损坏成掩蔽状态。

根据破坏后的结构,便可以学习一个分数网络,它可以分别为原子类型、坐标和晶格输出等变分数,从而无需从数据中学习对称性。

对此,研究人员将该网络称为「基础模型」。

为了生成具有所需属性约束的材料,研究人员还引入了适配器模块,这些模块可用于在带有属性标签的附加数据集上对「基础模型」进行微调,如下图b所示。


由于计算成本较高,如果标注的数据集与未标注的结构数据集相比规模较小,微调仍能很好地发挥作用。

适配器模块是注入到基本模型的每一层中的可调节的组件,以根据给定的属性标签改变其输出。

由此产生的微调模型与无分类器引导结合使用,引导生成的结果符合目标属性约束。

作者将这种方法应用于多种类型的属性,生成了一套微调模型,可以生成具有目标化学成分、对称性或标量属性(如磁密度)的材料,下图c。


生成稳定、多样化材料

那么,MatterGen究竟如何才能生成稳定的材料?

在作者看来,MatterGen的基本模型生成稳定、多样化材料的能力,是解决任何逆向材料设计任务的先决条件。

研究人员将逆向材料设计的生成模型设计为一个两步过程:

首先预训练一个通用的基本模型,以便在元素周期表上生成稳定的、多样的晶体,然后针对不同的下游任务对基本模型进行微调。


为了训练基础模型,研究者从Materials Project(MP)和Alexandria数据集中重新计算了607,684个稳定结构(多达20个原子),并将其称为Alex-MP-20。

研究者认为,如果通过DFT松弛后每个原子的能量低于参考数据集的0.1 eV/原子阈值,包括从MP、Alexandria和ICSD数据集重新计算的1,081,850个独特结构,则该结构是稳定的。

下图a显示了,MatterGen生成的几个随机样品,具有典型的无机材料配位环境。


为了评估稳定性,研究人员对1024个生成结构进行DFT计算。

图b显示了,78%的结构生成低于0.1 eV/原子阈值(13%低于0.0 eV/原子阈值) ,而75%的结构生成低于0.1 eV/原子阈值(3%低于0.0 eV/原子阈值)。此外,图c显示95%的生成结构具有RMSD w.r.t。


研究进一步发现,MatterGen可以生成大量独特和新颖的材料。

如图d所示,当生成1000个结构时,独特结构的百分比是100% ,而当生成100万个结构时,独特结构的百分比仅下降到86% ,而新颖性保持稳定在68%左右。


此外,研究人员还将MatterGen与先前的材料生成模型进行比较,并显示出性能方面的显著改进。

这里,主要关注两个关键指标:

(1) 生成样本中 S.U.N. 材料的百分比,衡量生成有希望候选材料的总体成功率;

(2) 生成样本与其DFT松弛结构之间的平均RMSD,衡量与等效平衡的距离。

实验结果显示,在图e-f中,与之前最先进的CDVAE相比,MatterGen-MP显示S.U.N.结构的百分比提高了1.8倍,平均RMSD降低了3.1倍。

在比较MatterGen和微调的MatterGen-MP时,研究者还发现由于扩大了训练数据集,S.U.N.结构的比例进一步提高了1.6倍,RMSD降低了5.5倍。


综上所述,作者已经证明,与以前的生成模型相比,MatterGen能够以更高的速率生成S.U.N.物质,同时生成的结构在数量级上更接近其局部能量最小值。

目标化学材料生成

在目标化学体系(如Li-Co-O)中找到最稳定的材料结构,对于确定评估稳定性所需的真正凸包(Convex hull)至关重要,实际上也是材料设计的主要挑战之一。

在下图a-b中,可以看到MatterGen在每种系统类型,和每种化学复杂度下生成的S.U.N.结构百分比都是最高的。

如图c所示,在「部分探索」系统和「充分探索系统」中,MatterGen在组合凸包上找到的独特结构数量也是最高的,前者在训练过程中提供了凸包附近的已知结构,后者在训练过程中没有提供凸包附近的已知结构。

在三元和四元系统中,替换法提供了一种相似或更有效的方法来生成「船体」上的结构,而MatterGen则在二元系统中取得了更好的性能,如图d所示。


此外,当筛选方法因数据库中的材料枯竭而趋于饱和时,MatterGen可以不断生成满足高体积模量等目标特性的新型材料。


与筛选基线相比,MatterGen发现了更多新颖的稳定高体积模量材料,并且不会因计算资源的增加而停滞不前。MatterGen可以找到250多种体积模量>400 GPa的材料,而在参考数据集中只找到2种此类材料。

另外,MatterGen还可以生成给定目标空间组的结构。


MatterGen在性能受限的情况下生成稳定的新材料

最后,研究人员还解决了寻找低供应链风险磁铁的多属性材料设计问题。MatterGen提出的结构既具有高磁密度,又具有低供应链风险的化学成分。

网友看后表示,室温超导体又要回来了。

正如微软团队所说,MatterGen是AI在材料设计领域向前迈出的重要一步。

参考资料:

https://www.microsoft.com/en-us/research/blog/mattergen-property-guided-materials-design/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特斯拉卖不动了?1月在华销量下滑46%!Model Y跌惨了

特斯拉卖不动了?1月在华销量下滑46%!Model Y跌惨了

网上车市
2024-03-01 09:17:19
博格巴之憾:旷世天才咎由自取,爵爷穆帅囧叔都无法拯救

博格巴之憾:旷世天才咎由自取,爵爷穆帅囧叔都无法拯救

直播吧
2024-03-02 15:18:10
小S公公感冒后突发心梗猝逝,S妈证实死讯:我们都伤心中,不多说

小S公公感冒后突发心梗猝逝,S妈证实死讯:我们都伤心中,不多说

开开森森
2024-03-02 11:40:14
曝滕哈格赛季结束后下课!新老板从未支持信任他,曼联新帅或3选1

曝滕哈格赛季结束后下课!新老板从未支持信任他,曼联新帅或3选1

我爱英超
2024-03-02 16:50:46
北向资金单周加仓235亿!“盯上”算力概念股

北向资金单周加仓235亿!“盯上”算力概念股

财联社
2024-03-02 20:31:20
李雪主:金家看中,男友被除,击败多名竞争者,靠一招征服金正恩

李雪主:金家看中,男友被除,击败多名竞争者,靠一招征服金正恩

阿胡
2024-02-22 11:37:05
孙子长得像公公,婆婆怀疑儿媳两年,做完亲子鉴定当场懵了

孙子长得像公公,婆婆怀疑儿媳两年,做完亲子鉴定当场懵了

莉雅细细谈
2024-02-29 18:10:03
一个只有初中文凭的中国农民,如何制造了国之重器?

一个只有初中文凭的中国农民,如何制造了国之重器?

李砍柴
2024-03-01 18:14:17
国家自然科学基金委员会严正声明

国家自然科学基金委员会严正声明

双一流高校
2024-03-02 18:26:59
绝不开第一枪!面对大陆海警围金门,台军声称:不靠近我军就不管

绝不开第一枪!面对大陆海警围金门,台军声称:不靠近我军就不管

老桑军事
2024-03-02 21:08:05
只有广东人才懂的恶意,父母给女儿取名为“姣”,让人心底发寒

只有广东人才懂的恶意,父母给女儿取名为“姣”,让人心底发寒

布谷妈妈
2024-03-01 20:18:59
浪漫的先知:28岁的徐志摩是如何看穿“苏俄”一切都是演戏的

浪漫的先知:28岁的徐志摩是如何看穿“苏俄”一切都是演戏的

无根树花正孤
2024-02-29 22:03:01
【沙特赛】阵容扩充!丁俊晖、希金斯加入战局!金球规则明确,打出167可获50万美元!

【沙特赛】阵容扩充!丁俊晖、希金斯加入战局!金球规则明确,打出167可获50万美元!

台球不闹腾
2024-03-03 02:26:24
终于有人把“世界各国签证难度”整理清楚了,了解一下吧!

终于有人把“世界各国签证难度”整理清楚了,了解一下吧!

低调的体育王者
2024-03-02 18:28:30
不暗戳戳了,田俊直接说和许敏不和,儿子不认父母

不暗戳戳了,田俊直接说和许敏不和,儿子不认父母

九方鱼论
2024-03-02 23:29:19
熊孩子被按在滚烫的火锅中致死,凶手却道:他爸妈不教育我来

熊孩子被按在滚烫的火锅中致死,凶手却道:他爸妈不教育我来

神秘历史故事
2024-02-27 15:25:54
志愿军歼灭美军最多的一战,横尸遍野,李奇微终生“不愿提及”

志愿军歼灭美军最多的一战,横尸遍野,李奇微终生“不愿提及”

春去花还在
2024-02-29 16:01:15
于嘉撇嘴不屑曾凡博扣篮,孙铭徽亮10分,看似人情,实则害了他

于嘉撇嘴不屑曾凡博扣篮,孙铭徽亮10分,看似人情,实则害了他

刺头体育
2024-03-03 03:48:28
马斯克:俄乌冲突必须结束

马斯克:俄乌冲突必须结束

参考消息
2024-03-02 21:08:09
3月多地偏冷确定,寒潮后还有更多倒春寒?分析:看西伯利亚脸色

3月多地偏冷确定,寒潮后还有更多倒春寒?分析:看西伯利亚脸色

中国气象爱好者
2024-03-02 20:08:11
2024-03-03 05:16:49
新智元
新智元
AI产业主平台领航智能+时代
10739文章数 65305关注度
往期回顾 全部

科技要闻

马斯克终于对OpenAI出手了

头条要闻

广东惠州百余平房子显示成交单价1623元/平 中介回应

头条要闻

广东惠州百余平房子显示成交单价1623元/平 中介回应

体育要闻

今日热火对阵爵士 希罗&乐福&理查德森将缺战

娱乐要闻

周星驰为《女足》选角,网友反应平淡

财经要闻

新势力2月销量环比齐跌:多家车企没到万辆

汽车要闻

理想粉和理想黑同时试驾MEGA 赞爆与批判把车淹了

态度原创

本地
家居
数码
手机
公开课

本地新闻

春色满城关不住|借着春天的名义,一起上春山

家居要闻

优雅浪漫,把生活过成喜欢的样子

数码要闻

英特尔酷睿 i7-15700K / i9-15900K 规格曝光

手机要闻

一加手机再次上位?小米15系列:或不会首发骁龙8 Gen4处理器

公开课

何为人生第一等事?

无障碍浏览 进入关怀版