网易首页 > 网易号 > 正文 申请入驻

AI再颠覆材料学!微软MatterGen直接生成新材料,稳定性超SOTA模型2.9倍

0
分享至

新智元报道

编辑:编辑部

【新智元导读】继谷歌DeepMind AI工具成功预测出220万种晶体结构后,微软团队最新扩散模型MatterGen,能设计生成新颖、稳定的材料,刷新SOTA。

材料科学领域的一个重大挑战,如今被大模型攻克了。

先前,谷歌DeepMind的全新AI工具GNoME,成功预测出220万种晶体结构,在学术界掀起海啸级地震。

今天,微软团队推出下一代生成式AI工具——MatterGen,大大提升了设计所需特性材料的速度。

当前,材料科学的核心挑战是,发现所需特性的材料,比如高锂离子电导率的电池材料。

一般来说,要做到这一点,首先需要找到新材料,然后根据应用进行筛选。

这就好比要创建一只猫的图像,首先要生成100万张不同的图像,然后再搜索有猫的图像。

而有了MatterGen模型,就可以「直接生成」所需特性的新型材料,这与DALL·E处理图像生成的方式非常相似。

论文地址:https://arxiv.org/pdf/2312.03687.pdf

简单来说,MatterGen是扩散模型的一种,专门设计用于生成新颖、稳定的材料。

另外,MatterGen还有适配器模块,可根据化学、对称性等各种约束条件进行微调,以生成材料。

值得一提的是,与SOTA模型(CDVAE)相比,MatterGen生成的新颖独特结构的稳定性高出2.9倍。它还生成接近能量局部最小值17.5倍的结构。

看得出,AI在材料设计和筛选方面表现出巨大潜力,必将给材料学带来颠覆性的变革。

晶体材料生成的扩散过程

在MatterGen中,研究人员介绍了一种为晶体材料量身定制的新型扩散过程,如下图a。

扩散模型通过学习分数网络(score network)来逆转固定的破坏过程来生成样本。

图像的破坏过程通常添加高斯噪声,但晶体材料具有独特的周期结构和对称性,需要定制的扩散过程。

晶体材料可由其重复单元(即单元格)定义,单元格编码原子类型A(即化学元素)、坐标X和周期晶格L。

作者为每个成分定义了一个适合其自身几何形状的破坏过程,并具有物理上的极限噪声分布。

再具体来讲,坐标扩散采用包裹正态分布,来遵守周期边界,并在噪声极限接近均匀分布。

其中,晶格扩散采用对称形式,接近于平均值为训练数据中原子平均密度的立方晶格分布。原子扩散是在分类空间中定义的,其中单个原子被损坏成掩蔽状态。

根据破坏后的结构,便可以学习一个分数网络,它可以分别为原子类型、坐标和晶格输出等变分数,从而无需从数据中学习对称性。

对此,研究人员将该网络称为「基础模型」。

为了生成具有所需属性约束的材料,研究人员还引入了适配器模块,这些模块可用于在带有属性标签的附加数据集上对「基础模型」进行微调,如下图b所示。

由于计算成本较高,如果标注的数据集与未标注的结构数据集相比规模较小,微调仍能很好地发挥作用。

适配器模块是注入到基本模型的每一层中的可调节的组件,以根据给定的属性标签改变其输出。

由此产生的微调模型与无分类器引导结合使用,引导生成的结果符合目标属性约束。

作者将这种方法应用于多种类型的属性,生成了一套微调模型,可以生成具有目标化学成分、对称性或标量属性(如磁密度)的材料,下图c。

生成稳定、多样化材料

那么,MatterGen究竟如何才能生成稳定的材料?

在作者看来,MatterGen的基本模型生成稳定、多样化材料的能力,是解决任何逆向材料设计任务的先决条件。

研究人员将逆向材料设计的生成模型设计为一个两步过程:

首先预训练一个通用的基本模型,以便在元素周期表上生成稳定的、多样的晶体,然后针对不同的下游任务对基本模型进行微调。

为了训练基础模型,研究者从Materials Project(MP)和Alexandria数据集中重新计算了607,684个稳定结构(多达20个原子),并将其称为Alex-MP-20。

研究者认为,如果通过DFT松弛后每个原子的能量低于参考数据集的0.1 eV/原子阈值,包括从MP、Alexandria和ICSD数据集重新计算的1,081,850个独特结构,则该结构是稳定的。

下图a显示了,MatterGen生成的几个随机样品,具有典型的无机材料配位环境。

为了评估稳定性,研究人员对1024个生成结构进行DFT计算。

图b显示了,78%的结构生成低于0.1 eV/原子阈值(13%低于0.0 eV/原子阈值) ,而75%的结构生成低于0.1 eV/原子阈值(3%低于0.0 eV/原子阈值)。此外,图c显示95%的生成结构具有RMSD w.r.t。

研究进一步发现,MatterGen可以生成大量独特和新颖的材料。

如图d所示,当生成1000个结构时,独特结构的百分比是100% ,而当生成100万个结构时,独特结构的百分比仅下降到86% ,而新颖性保持稳定在68%左右。

此外,研究人员还将MatterGen与先前的材料生成模型进行比较,并显示出性能方面的显著改进。

这里,主要关注两个关键指标:

(1) 生成样本中 S.U.N. 材料的百分比,衡量生成有希望候选材料的总体成功率;

(2) 生成样本与其DFT松弛结构之间的平均RMSD,衡量与等效平衡的距离。

实验结果显示,在图e-f中,与之前最先进的CDVAE相比,MatterGen-MP显示S.U.N.结构的百分比提高了1.8倍,平均RMSD降低了3.1倍。

在比较MatterGen和微调的MatterGen-MP时,研究者还发现由于扩大了训练数据集,S.U.N.结构的比例进一步提高了1.6倍,RMSD降低了5.5倍。

综上所述,作者已经证明,与以前的生成模型相比,MatterGen能够以更高的速率生成S.U.N.物质,同时生成的结构在数量级上更接近其局部能量最小值。

目标化学材料生成

在目标化学体系(如Li-Co-O)中找到最稳定的材料结构,对于确定评估稳定性所需的真正凸包(Convex hull)至关重要,实际上也是材料设计的主要挑战之一。

在下图a-b中,可以看到MatterGen在每种系统类型,和每种化学复杂度下生成的S.U.N.结构百分比都是最高的。

如图c所示,在「部分探索」系统和「充分探索系统」中,MatterGen在组合凸包上找到的独特结构数量也是最高的,前者在训练过程中提供了凸包附近的已知结构,后者在训练过程中没有提供凸包附近的已知结构。

在三元和四元系统中,替换法提供了一种相似或更有效的方法来生成「船体」上的结构,而MatterGen则在二元系统中取得了更好的性能,如图d所示。

此外,当筛选方法因数据库中的材料枯竭而趋于饱和时,MatterGen可以不断生成满足高体积模量等目标特性的新型材料。

与筛选基线相比,MatterGen发现了更多新颖的稳定高体积模量材料,并且不会因计算资源的增加而停滞不前。MatterGen可以找到250多种体积模量>400 GPa的材料,而在参考数据集中只找到2种此类材料。

另外,MatterGen还可以生成给定目标空间组的结构。

MatterGen在性能受限的情况下生成稳定的新材料

最后,研究人员还解决了寻找低供应链风险磁铁的多属性材料设计问题。MatterGen提出的结构既具有高磁密度,又具有低供应链风险的化学成分。

网友看后表示,室温超导体又要回来了。

正如微软团队所说,MatterGen是AI在材料设计领域向前迈出的重要一步。

参考资料:

https://www.microsoft.com/en-us/research/blog/mattergen-property-guided-materials-design/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陈赫张子萱到香港王祖蓝家做客,亲自下厨做红烧肉 倒大瓶黄酒吓

陈赫张子萱到香港王祖蓝家做客,亲自下厨做红烧肉 倒大瓶黄酒吓

乐天闲聊
2026-03-21 20:21:03
彻底撕破脸!胖东来鸡蛋检测报告被曝光,王海测评发视频称要起诉

彻底撕破脸!胖东来鸡蛋检测报告被曝光,王海测评发视频称要起诉

寒士之言本尊
2026-03-21 18:25:20
费玉清哥哥现状:75岁须发黑浓密,单身享受晚年,姐弟仨相亲相爱

费玉清哥哥现状:75岁须发黑浓密,单身享受晚年,姐弟仨相亲相爱

查尔菲的笔记
2026-03-20 16:09:17
油价暴涨不用慌!官方“定调”:中国接得住,底气全在这儿

油价暴涨不用慌!官方“定调”:中国接得住,底气全在这儿

跳跳历史
2026-03-21 16:10:53
1978年,邱清泉之子邱国渭,以蚂蚁搬家方式将全家送往美国

1978年,邱清泉之子邱国渭,以蚂蚁搬家方式将全家送往美国

老谢谈史
2026-03-20 10:24:19
英媒爆料:法航母南海追潜艇遇40艘中国军舰懵了

英媒爆料:法航母南海追潜艇遇40艘中国军舰懵了

原来仙女不讲理
2026-03-20 16:41:35
伊朗战争最黑暗的终局正在袭来

伊朗战争最黑暗的终局正在袭来

荷兰豆爱健康
2026-03-21 08:27:54
笑麻了!以为两人相伴了一辈子,其实厌烦了几十年!

笑麻了!以为两人相伴了一辈子,其实厌烦了几十年!

墙头草
2026-02-09 16:37:03
重磅!沙特巨头以超410亿元,收购嘉定的字节跳动旗下公司!引发全球关注!

重磅!沙特巨头以超410亿元,收购嘉定的字节跳动旗下公司!引发全球关注!

尚虹桥
2026-03-21 19:35:31
我今年55了,想用血泪教训告诉你:不要跟任何人,包括你的父母、子女、枕边人,分享这三件事

我今年55了,想用血泪教训告诉你:不要跟任何人,包括你的父母、子女、枕边人,分享这三件事

东林夕亭
2026-03-19 09:04:30
600亿身价的“章泽天”风格大变,穿衬衫+牛仔裤,一看就是有钱人

600亿身价的“章泽天”风格大变,穿衬衫+牛仔裤,一看就是有钱人

蓓小西
2026-03-21 08:54:02
外媒:美国一男子五天内在纽约费尽心思抢劫六家银行,最终仅得手605美元

外媒:美国一男子五天内在纽约费尽心思抢劫六家银行,最终仅得手605美元

环球网资讯
2026-03-21 15:58:49
火箭对热火,伤病报告:主队3老将缺战,DFS复出,客队2人不打

火箭对热火,伤病报告:主队3老将缺战,DFS复出,客队2人不打

熊哥爱篮球
2026-03-21 21:22:18
冠军荣耀,浙江省体育局为广厦颁发CBA冠军奖金2000万人民币

冠军荣耀,浙江省体育局为广厦颁发CBA冠军奖金2000万人民币

懂球帝
2026-03-21 21:14:25
天大的讽刺!直到释永信被公诉后,才知道她有多让人敬佩

天大的讽刺!直到释永信被公诉后,才知道她有多让人敬佩

冒泡泡的鱼儿
2026-03-22 03:09:47
切尔西近4场英超输了3场,与此前18场的输球场次持平

切尔西近4场英超输了3场,与此前18场的输球场次持平

懂球帝
2026-03-22 04:09:27
重大信号!特朗普,要停战了!

重大信号!特朗普,要停战了!

大嘴说天下
2026-03-21 19:20:56
美军大举增兵

美军大举增兵

陆弃
2026-03-21 08:45:30
仲裁摆烂!巴拿马不想赔20亿违约金,公开撒谎,反咬长和一口

仲裁摆烂!巴拿马不想赔20亿违约金,公开撒谎,反咬长和一口

凡知
2026-03-21 19:48:28
不知大家发现没!超奇怪的用车现象:电车跑1000公里电费仅100元

不知大家发现没!超奇怪的用车现象:电车跑1000公里电费仅100元

阿芒娱乐说
2026-03-20 04:13:07
2026-03-22 05:16:53
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14777文章数 66705关注度
往期回顾 全部

科技要闻

宇树招股书拆解,人形机器人出货量第一!

头条要闻

伊朗发射3800公里射程的导弹 最令美军战栗的细节披露

头条要闻

伊朗发射3800公里射程的导弹 最令美军战栗的细节披露

体育要闻

谁在决定字母哥未来?

娱乐要闻

田栩宁终于凉了?出轨风波影响恶劣

财经要闻

通胀警报拉响,加息潮要来了?

汽车要闻

小鹏汽车2025年Q4盈利净赚3.8亿 全年营收767亿

态度原创

手机
亲子
健康
游戏
旅游

手机要闻

终端市场集体喊“涨” 手机面板持续走“跌”

亲子要闻

什么牌子驼奶粉好?2026中国驼奶品牌评测,原生营养无可挑剔

转头就晕的耳石症,能开车上班吗?

魔兽世界:时光服P3阶段将至,新手该练什么职业,这个很重要!

旅游要闻

【花Young贵阳】春日限定!十里河滩海棠花盛开引客来

无障碍浏览 进入关怀版