![]()
编辑丨&
在生活、研究之中,我们触手可及的每一个物品,无论是可见或是不可见,组成它的化合物,在最初都只是分子猜测。在数目庞大的备选库中,找到合适的组合满足需求,这种费时费力的劳动在 AI 的帮助下已经渐渐成为了历史。
流匹配方法近年来在无条件分子生成领域取得了领先(SOTA),超越了基于分数的扩散模型,但它还无法满足在属性引导方面的需要。
来自佛罗里达大学(University of Florida)与纽约大学(New York University)等的团队开发出一种新方法 PropMolFlow,它结合了五种不同的性质嵌入方法,能够以约 10 倍速度生成分子候选物,且不影响结果的准确性和化学效度。
相关研究内容以「PropMolFlow: property-guided molecule generation with geometry-complete flow matching」为题,于 2026 年 1 月 22 日发布在《Nature Computational Science》。
论文链接:https://www.nature.com/articles/s43588-025-00946-y
重写生成路径
PropMolFlow 构建在 FlowMol 架构之上,通过对 NN 参数化的条件速度场积分生成样本。在这一框架中,模型不再学习逐步去噪,而是直接学习一个时间连续的速度场,描述分子从初始噪声分布演化到目标分布的全过程。
这其中大致可分为三点:
- SE(3) 等变的速度场建模模型在原子坐标与特征空间中构建严格满足旋转、平移等变性的向量场,确保生成过程中几何一致性不被破坏。
- 性质条件作为状态变量嵌入流场与“后验引导”不同,性质向量被直接作为条件输入参与速度场预测,意味着性质在每一个时间点都影响分子演化方向
- 确定性推理路径流匹配允许使用常微分方程(ODE)求解,生成过程不再是随机采样,而是稳定、可控的连续演化。
在所有结构指标上,PropMolFlow 始终优于基线模型。由于流动匹配路径更短且具有确定性路径且传输最优,PropMolFlow 只需 100 步就能完成所需任务。
QM9 数据集测试
研究团队认识到,如果生成的分子在化学上无意义或未达到目标特性——即满足特定需求的所需特性——速度是无用的,因此他们通过与其他模型比较来测试 PropMolFlow 的准确性。
他们将重点放在对 PropMolFlow 生成的,具有靶向性质、分子结构效度和推断速度分子的能力上。团队主要通过使用密度泛函理论验证生成分子,这是一种基于物理的量子化学方法,能够从基本原理计算分子性质——独立于任何机器学习模型。
表 1:PropMolFlow 在属性比对方面的性能。
![]()
PropMolFlow 在与 SOTA 模型竞争中取得了良好的表现。据相关报道,PropMolFlow 生成的分子具有正确的键模式和合适的几何形状,超过90%。同时,PropMolFlow能够实现科学家所追求的分子性质,在多种分子性质上表现优于现有最佳方法,且计算速度更快。
此外,论文中还提到,当目标性质偏离训练分布时,扩散模型往往出现构型塌缩,而 PropMolFlow 的结构统计分布仍与真实分子高度一致。
利用性质引导的分子生成
凭借在几分钟内生成数千个化学有效、针对性质的候选物的能力,研究人员可以更快地进行迭代。PropMolFlow 展现的速度与精度结合更能突显产物的强性质比对性,其外推能力也可借由主动学习或强化学习框架来进一步提升。
不过,目前 PropMolFlow 还无法保证它的产物具有足够的稳定性。团队表示,包括上述问题在内的挑战,已经在尝试引入新技术解决。在当前分子生成模型逐渐走向真实设计场景的背景下,这种结构—性质—效率同时成立的系统,具备继续向前扩展的价值。
https://phys.org/news/2026-01-scientists-molecules-discovery.html
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.