网易首页 > 网易号 > 正文 申请入驻

无需训练即可定制分子生成 多模态引导框架TFG-Flow登上ICLR 2025

0
分享至

编辑丨ScienceAI

在药物研发和材料科学领域,设计具有特定性质的分子是一项关键但耗时的任务。传统方法依赖大量实验试错,而生成式 AI 模型的出现为这一领域带来曙光。

然而,现有方法面临两大瓶颈:一是多数生成模型仅能处理连续型数据(如图像像素),难以应对分子设计中离散的原子类型与连续坐标共存的多模态数据;二是针对特定性质的定向生成通常需要额外训练模型,成本高昂。

近日,来自北京大学、卡耐基梅隆大学、斯坦福大学等机构的研究团队提出 TFG-Flow 框架,在无需额外训练的条件下,成功实现了多模态数据的定向分子生成。该方法在量子属性匹配、结构相似性优化、药物分子设计等任务中展现出显著优势,相关论文已被 ICLR 2025 接收。

突破多模态引导的核心挑战

分子可被视为由离散的原子类型(如碳、氧、氮)和连续的3D坐标构成的多模态数据。现有生成模型在引导这类数据时面临两大难题:

1.维度灾难:离散变量的组合空间随原子数量呈指数增长,传统方法计算代价高昂

2.几何不变性:由连续变量刻画的分子的 3D 结构需满足旋转、平移不变性,普通梯度引导会破坏这一特性

TFG-Flow 通过创新性的双路径设计攻克了这些难题(图 1):

  • 离散变量:采用蒙特卡洛重要性采样,将计算复杂度从指数级降至对数级
  • 连续变量:引入旋转等变图神经网络(EGNN),确保坐标变换不影响分子性质

图 1:TFG-Flow 通过离散采样与连续梯度引导的双路径实现多模态生成

实验表现:全方位超越基线模型

研究团队在 QM9、GEOM-Drug 等分子数据集上进行了系统验证:

量子属性精准匹配

以极化率(α)、偶极矩(μ)等 6 种量子属性为目标,TFG-Flow 的平均绝对误差(MAE)相比当前最优的无训练(training-free)引导方法降低 20.3%。如表 1 所示,其性能甚至逼近需要专门训练的条件生成模型。

表 1:TFG-Flow 在量子属性任务中显著优于传统方法

结构相似性优化

当以特定分子子结构为引导目标时,TFG-Flow 将生成分子与目标结构的Tanimoto 相似度提升了 76.8%(QM9 数据集)和 22.4%(GEOM-Drug 数据集),展现出精准的结构控制能力。

药物分子设计实战

在 CrossDocked2020 数据集上,TFG-Flow 生成的分子与蛋白质靶点的结合能(Vina Score)达到-7.65,优于主流方法 Pocket2Mol(-7.23)和 TargetDiff(-7.32),且分子合成可行性(SA Score)保持合理水平。

技术亮点:高效且通用

TFG-Flow 的核心优势体现在两大技术创新:

理论保障下的高效采样

针对离散变量,研究团队提出基于重要性采样的近似方法(图 2)。理论分析表明,提出的估计方法具有相合性等优良性质,且相比传统方法能够指数级降低计算量。实验观察发现这一方法仅需 16 次采样即可高精度估计转移概率。

图 2:采样次数 K=16 时已能达到稳定性能

即插即用的预训练模型兼容

不同于需要从头训练的传统方法,TFG-Flow 可直接调用预训练分子模型(如UniMol)作为目标预测器。实验表明,使用 UniMol 时 TFG-Flow 的 MAE 进一步降低,与专业训练模型 EEGSDE 的差距显著缩小。得益于当前各类基座模型(foundation model)性能的增强,研究团队认为 TFG-Flow 在未来将有更强的潜力。

开启分子设计新范式

这项工作的价值不仅在于技术突破,更在于其方法论创新:

  • 降低成本:无需针对每个新目标重新训练模型,计算资源消耗大大降低
  • 拓展应用:框架可迁移至蛋白质设计、材料发现等需处理多模态数据的科学领域
  • 促进协作:开源代码允许化学家直接引入领域知识定义目标函数

研究团队表示,未来将探索更大规模的基础模型与 TFG-Flow 的结合,进一步释放 AI 在科学发现中的潜力。正如审稿人评价:「这项工作为生成模型在科学计算中的应用树立了新标杆。」

附:本文作者

林昊苇是北京大学人工智能研究院二年级博士生,导师为梁一韬教授和马剑竹教授,研究方向为生成模型及其在 AI4Science科 学发现中的应用。担任 ICML、NeurIPS、ICLR、CVPR、ACL(ARR)等顶会审稿人,在 ICML、NeurIPS、ICML、Nature Communications、TPAMI 等顶会顶刊发表 14 篇论文。

黎善达是卡耐基梅隆大学机器学习系三年级的博士生,导师为 Yiming Yang 教授和 Ameet Talwalkar 教授。他通过理论与实证研究理解机器学习模型的规律与局限,为更有效地运用机器学习方法提供洞察。同时,他研究深度学习方法在数学推理、代码生成、微分方程求解、自然科学等领域的应用。

论文地址:https://arxiv.org/abs/2501.14216

代码开源:https://github.com/linhaowei1/TFG-Flow

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
21-15,24-22!陈雨菲KO手下败将,2026年首进决赛,打破冠军荒?

21-15,24-22!陈雨菲KO手下败将,2026年首进决赛,打破冠军荒?

刘姚尧的文字城堡
2026-01-24 14:43:42
俄美乌首次三方会谈结束

俄美乌首次三方会谈结束

新京报
2026-01-24 23:28:06
回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

就一点
2025-10-09 12:19:42
CBA最新积分榜:广东双杀山西,北京6分憾负,北控爆冷,吉林第9

CBA最新积分榜:广东双杀山西,北京6分憾负,北控爆冷,吉林第9

薇说体育
2026-01-24 22:53:30
广东107-97山西赛季二连杀,赛后3好1坏消息传来,王少杰天神下凡

广东107-97山西赛季二连杀,赛后3好1坏消息传来,王少杰天神下凡

飞克体育
2026-01-24 22:44:12
李忠军当选南京市市长

李忠军当选南京市市长

观察者网
2026-01-24 20:33:33
你身边有把一手好牌打的稀烂的人吗?网友:都是上辈子欠人家的

你身边有把一手好牌打的稀烂的人吗?网友:都是上辈子欠人家的

带你感受人间冷暖
2026-01-21 00:15:05
72岁老戏骨濮存昕官宣外孙女出道,尖嘴猴腮,长相遭吐槽:太丑了

72岁老戏骨濮存昕官宣外孙女出道,尖嘴猴腮,长相遭吐槽:太丑了

深析古今
2025-12-08 12:29:36
新加坡首次打破50年惯例,将要为中国统一扫清一大障碍

新加坡首次打破50年惯例,将要为中国统一扫清一大障碍

云上乌托邦
2026-01-23 15:07:21
广东107-97​迎3连胜!萨姆纳22分9板7助,不断爆冲突,徐杰重伤

广东107-97​迎3连胜!萨姆纳22分9板7助,不断爆冲突,徐杰重伤

老吴说体育
2026-01-24 22:13:18
不到20分钟连丢2球,U23国足0-2落后日本队

不到20分钟连丢2球,U23国足0-2落后日本队

都市快报橙柿互动
2026-01-24 23:38:32
iPhone Air三个月暴跌近3000元

iPhone Air三个月暴跌近3000元

21世纪经济报道
2026-01-24 16:02:09
后背发凉!一月入3万36岁女高管,失业8个月加离婚,如今送外卖了

后背发凉!一月入3万36岁女高管,失业8个月加离婚,如今送外卖了

火山詩话
2026-01-02 19:14:41
斯诺登现状曝光!放弃20万美元年薪,流亡俄10年,如今已生二胎

斯诺登现状曝光!放弃20万美元年薪,流亡俄10年,如今已生二胎

谈史论天地
2026-01-23 18:25:03
纪实:上海女子网购成瘾,负债百万父亲无法忍受,酒后将其捅死

纪实:上海女子网购成瘾,负债百万父亲无法忍受,酒后将其捅死

谈史论天地
2026-01-24 12:20:03
小杨阿姨带玥儿箖箖回京,张兰提前准备零食早餐,家人团聚好温馨

小杨阿姨带玥儿箖箖回京,张兰提前准备零食早餐,家人团聚好温馨

郭蛹包工头
2026-01-24 22:36:57
美国!更大内乱开始了!

美国!更大内乱开始了!

大嘴说天下
2026-01-24 20:41:23
baby关喆滑雪被证实!男方已婚三胎被骂不配,黄晓明坦言不会复婚

baby关喆滑雪被证实!男方已婚三胎被骂不配,黄晓明坦言不会复婚

八星人
2026-01-22 10:14:09
A股:周六下午传来4个核弹级利好!下周很可能会迎史诗级别大行情?

A股:周六下午传来4个核弹级利好!下周很可能会迎史诗级别大行情?

股市皆大事
2026-01-24 13:31:46
2026-01-25 00:03:00
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1216文章数 223关注度
往期回顾 全部

科技要闻

黄仁勋现身上海菜市场

头条要闻

张又侠、刘振立被查 解放军报发布社论

头条要闻

张又侠、刘振立被查 解放军报发布社论

体育要闻

当家球星打替补,他们在故意摆烂?

娱乐要闻

回归还是顶流 凤凰传奇将现身马年春晚

财经要闻

“百年老字号”张小泉遭60亿债务压顶

汽车要闻

有增程和纯电版可选 日产NX8或于3-4月间上市

态度原创

家居
时尚
本地
健康
游戏

家居要闻

在家度假 160平南洋混搭宅

冬天最佳“显瘦”公式:上短+下长

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

耳石脱落为何让人天旋地转+恶心?

LOL世界冠军转型刀塔,大主播迎直播第二春,人气比玩LOL还高!

无障碍浏览 进入关怀版