机器学习技术和理论计算方法的融合,正让多相催化剂的理性设计走向一个新的阶段。北京大学蒋鸿课题组在《科学通报》“人工智能驱动的材料科学研究专题”发表题为“理论多相催化计算中的机器学习方法: 现状与挑战”的综述文章,系统总结了机器学习方法在理论多相催化计算中的现状与挑战,以及它带来的机遇与变革。
研究背景
![]()
为提高催化效率、降低多相催化反应的能耗,催化剂的理性设计已成为当前多相催化研究的热点。以密度泛函理论 (DFT) 为代表的理论计算方法能够根据相对简单的模型得出催化反应的热力学和动力学信息,在催化剂设计中发挥着重要作用。然而,由于时间尺度和空间尺度的问题,这样的计算方法难以推广到足够复杂的多相催化反应体系。为了解决类似的问题,理论多相催化领域迫切需要一种计算量相对小但仍保持较高精度的研究策略,这可以通过机器学习方法解决。
针对特定催化问题的统计学习模型
![]()
在现代机器学习方法出现之前,多相催化研究已尝试通过物理描述符建立不同量之间的关系。如Sabatier原理提出理想催化剂应具有适中的吸附能力,在实际应用中常以火山形曲线表示。该原理背后实际上是线性标度关系,以此启发了后续的多元线性回归方法。随着研究深入,如何考虑不同描述符的非线性关联成为问题所在。欧阳润海等人提出的SISSO方法通过自动构建复合描述符并结合LASSO回归,能够提取出复杂环境下的非线性关联,在近些年得到了广泛应用。此外,多相催化领域还关注于如何将这类统计学习模型与实验数据结合形成主动学习回路,以此助力于自动化实验探索。
针对复杂多相催化体系的机器学习势方法
![]()
机器学习势是一类通过机器学习模型拟合第一性原理势能面,构造兼具第一性原理精度和经典经验性力场计算效率的机器学习势能面求解器的方法。其中,神经网络势方法通过神经网络表示体系中各原子能量贡献对局域化学环境的依赖性,在概念和方法上具有最广的多样性,如刘智攀课题组开发的LASP软件、蒋彬课题组开发的EANN势、张林峰等开发的深度势能(DP)模型等,它们已在针对多相催化领域各类问题的理论模拟中得到了广泛的应用。近年来,通用机器学习势逐渐得到了关注,它们能构建跨多种元素类型和不同结构特征的表示,并在海量数据集上训练获得优秀性能,有望在界面结构和化学键解离等关键问题上有更好表现,并在多相催化理论模拟中具有广阔的发展和应用前景。
生成式人工智能
![]()
生成式人工智能的快速发展为物质科学研究带来了新机遇,以ChatGPT为代表的大语言模型(LLMs)在多相催化等化学领域的应用前景广阔。经过针对性训练的化学专用LLMs,如ChemDFM,已在分子识别、设计及反应预测等任务中展现优越性能。生成式人工智能亦在催化体系模拟中崭露头角,如GAN模型可基于DFT数据生成高效催化剂表面,但在多样性与效率上存在不足。而扩散模型则凭借其强大的数据生成能力,在快速预测材料结构、化学反应过渡态及催化剂表面结构方面表现突出,这类方法在未来大有可为。
展望
![]()
近十年来 AI for Science 的大背景下,理论多相催化计算领域内的新机器学习策略层出不穷 : SISSO 拟合、通用机器学习势、扩散生成式模型等方法为理论多相催化提供了更多可能性。然而,新的挑战也随之而来,包括但不限于模型物理可解释性与描述符可解释性的距离、针对表面催化等多元素复杂体系机器学习势函数的训练和应用仍然存在挑战,以及生成式模型在理论多相催化的应用有待进一步探索等。展望未来,随着 AI 技术的不断进步,我们可以相信 AI 驱动的催化剂理性设计时代终会到来。
文章信息
![]()
刘照清, 邓哲, 蒋鸿. 理论多相催化计算中的机器学习方法: 现状与挑战. 科学通报, 2025, 70: 4081–4097
doi: 10.1360/TB-2024-1207
![]()
转载、投稿请留言
| 关注科学通报 | 了解科学前沿
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.