网易首页 > 网易号 > 正文 申请入驻

AI技术重塑药物亲和力预测,6.3万条数据集闪亮登场!

0
分享至



现实里,分子是不断运动的,它们的相遇与结合像是一部动态电影,而这也就为药物研发带来了艰巨的挑战:现有方法对这种复杂运动视而不见,模型在“标准基准”上看似成绩斐然,却往往在真实药物场景下失灵。

亲和力预测模型大多依赖公开数据集 PDBbind,其中约 2 万个复合物结构成了 AI 的训练教材。但这类训练存在明显「信息泄漏」:模型可能学会的是数据集的特征,而非真实的物理规律。

为此,来自法国奥尔良大学(Université d’Orléans)的研究团队引入了分子动力学模拟(MD)。这种方法能在原子层面追踪蛋白与配体的运动,获得数十纳秒甚至更长时间的轨迹。

他们的研究以「Spatio-temporal learning from molecular dynamics simulations for protein-ligand binding affinity prediction」为题,于 2025 年 8 月 19 日发布在《Bioinformatics》。



论文链接:https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btaf429/8238154

两条轨迹齐头并进

准确预测蛋白质-配体复合物的结合亲和力是药物设计的一个主要目标。但从目前发布的模型来看,它们对性能的预评估都相当乐观,应用于新的或者更复杂的测试集的时候,难免会因为泛化性较低导致限制使用。

所以,研究团队就提出了两种融合 MD 与深度学习的策略。

第一条是数据增强路线:从分子动力学轨迹中抽取帧,扩充训练数据。研究者构建了一个全新的数据集——MDbind,涵盖6300 个蛋白-配体复合物,每个跑 10 次 10 ns 模拟,总计 63,000 段轨迹。从这些轨迹里抽帧,就能把原本不足 2 万的样本扩展到数百万。

该方案的目标之一是使 DL 模型能够区分高亲和力和低亲和力配体之间的差异,并捕获它们相互作用的变化,而大多数在静态单一 3D 蛋白质-配体复合物上训练的模型常常无法捕捉到这些。



图 1:分子动力学模拟。

第二条是时空学习路线:让模型直接学习整段轨迹。研究团队设计了Timenucy(基于长期递归神经网络 LRCN)Videonucy(基于卷积长短期记忆网络 ConvLSTM),这类架构能同时捕捉空间结构和时间演化,分析模拟的所有帧以进行结合亲和力的预测。

这两者将会在整个模拟中进行训练,从使用3D输入数据过渡到使用4D输入数据。两者都处理每个原子的信息,包括它们的特征和位置,针对模拟的每一帧。



图 2:Timenucy (A) 和 Videonucy (B) 的工作流程。

用数据说话

在经典基准PDBbind v2016 core 集合上,加入 MD 增广的Densenucy 模型取得了R≈0.83,RMSE≈1.28的表现。这一成绩不仅超越了无增广的版本,也明显优于历史上的其他模型。

更令人兴奋的是在更接近真实药物研发的外部测试集上——尤其是包含“陡峭活性崖”的FEP 数据集。在这类场景中,同一靶点的分子往往因为微小结构差异,亲和力就会骤升或骤降,考验模型的泛化能力。

p38 激酶簇上,传统模型 KDEEP 的表现是 R=0.36、RMSE=1.57;而 Densenucy+MD 增广提升到R=0.66、RMSE=0.62。在多个其他簇中,带 MD 增广的模型普遍表现更稳健。

表 1:模型在 PDBbind v.2016 核心集和 MDbind 测试集上的性能。



研究团队表示,由于在 PDBbind 上训练并在 PDBbind v.2016 核心集上评估的模型性能存在偏差,他们决定使用外部测试集 FEP 数据集进一步对模型进行基准测试。Timenucy / Videonucy这类时空模型在 MDbind 上也能学习到差异,虽然目前性能尚未超过最优静态模型,但已经证明了这条路线的可行性。

小结

如果说传统的 AI 药物模型只是在静态照片上做“图像识别”,那么这项研究展示了另一种可能:让模型真正看懂分子的活动轨迹。63,000 段模拟不仅刷新了训练规模,也让模型更接近真实的物理过程。

这就像是在培养一个人造的拉普拉斯妖——读懂每一个分子,接着它就可以预测未来。

听着很魔幻,但科学就是如此,将理论转变为现实。正如研究团队所强调的,这只是第一步。未来,随着更高效的时空模型与更丰富的轨迹数据出现,AI 将能在更大范围内把握分子间的复杂互动,帮助科研人员在药物研发这条路上少走弯路。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上海,八旬独居老人独居无靠,居委会联系送养儿子,儿子:凭什么

上海,八旬独居老人独居无靠,居委会联系送养儿子,儿子:凭什么

街声巷闻
2025-11-17 14:36:54
惊天大瓜!原来川普和希拉里不止是政敌,同时还是情敌。

惊天大瓜!原来川普和希拉里不止是政敌,同时还是情敌。

电动猫
2025-11-18 00:18:26
聚焦“十五五”规划建议|保持制造业合理比重

聚焦“十五五”规划建议|保持制造业合理比重

新华社
2025-11-17 15:54:02
王欣瑜耗时2小时47分钟2-1艰难战胜王曦雨,晋级全运会四强

王欣瑜耗时2小时47分钟2-1艰难战胜王曦雨,晋级全运会四强

懂球帝
2025-11-18 17:17:31
张家界荒野求生赛宣布14名选手全部进入决赛:气温骤降,不再按原计划淘汰4人

张家界荒野求生赛宣布14名选手全部进入决赛:气温骤降,不再按原计划淘汰4人

极目新闻
2025-11-18 15:19:03
捷克“炮弹计划”或终止!斯洛伐克法院关键裁决,援乌战斗机合法

捷克“炮弹计划”或终止!斯洛伐克法院关键裁决,援乌战斗机合法

鹰眼Defence
2025-11-18 17:53:12
捅完琉球窝!中国再掀北海道老底,日本80年前埋的雷,炸了

捅完琉球窝!中国再掀北海道老底,日本80年前埋的雷,炸了

南宫一二
2025-11-17 07:17:39
全运乒乓男团四强巅峰对决:马龙樊振东领衔,四大豪门谁主沉浮?

全运乒乓男团四强巅峰对决:马龙樊振东领衔,四大豪门谁主沉浮?

带你逛体坛
2025-11-18 18:34:10
罗伯逊:距离世界杯只差90分钟,我相信我们能战胜丹麦

罗伯逊:距离世界杯只差90分钟,我相信我们能战胜丹麦

懂球帝
2025-11-18 14:25:08
日韩股市,开盘暴跌!

日韩股市,开盘暴跌!

证券时报
2025-11-18 09:47:04
湖人最不需要担心的人!里夫斯:GOAT詹皇回归将有4打3优势

湖人最不需要担心的人!里夫斯:GOAT詹皇回归将有4打3优势

体育妞世界
2025-11-18 14:08:30
乡镇编制膨胀:从12人到100人,时代变了乡镇变了,初心还在吗?

乡镇编制膨胀:从12人到100人,时代变了乡镇变了,初心还在吗?

君好伴读
2025-10-27 10:33:08
付某梅(女),已被大连警方抓获归案!

付某梅(女),已被大连警方抓获归案!

半岛晨报
2025-11-18 12:40:05
因文件问题无法靠港,3000头奶牛被困土耳其海上58天,船只恶臭弥漫、尸体堆积

因文件问题无法靠港,3000头奶牛被困土耳其海上58天,船只恶臭弥漫、尸体堆积

起喜电影
2025-11-18 15:29:35
赢麻了!现在全网最想哭的人估计是冷美人,30多天拿到30000多元

赢麻了!现在全网最想哭的人估计是冷美人,30多天拿到30000多元

火山诗话
2025-11-18 18:36:08
华为Mate 80系列备货比例曝光 标准版和Pro Max成主力

华为Mate 80系列备货比例曝光 标准版和Pro Max成主力

手机中国
2025-11-18 16:50:44
钟丽缇168cm的大块头,一般男人征服不了她吧?

钟丽缇168cm的大块头,一般男人征服不了她吧?

小椰的奶奶
2025-11-18 13:14:26
毛主席视察天津时想见李银桥,得知他已经入狱,伟人只说了2个字

毛主席视察天津时想见李银桥,得知他已经入狱,伟人只说了2个字

南书房
2025-09-28 23:01:03
日本天下第一香木,传为隋炀帝所赐,仅有三位人物切下小块使用

日本天下第一香木,传为隋炀帝所赐,仅有三位人物切下小块使用

收藏大视界
2025-11-09 20:38:12
只待2天!全红婵火速从北京飞回广州,去医院看望梁小静,姐妹情深

只待2天!全红婵火速从北京飞回广州,去医院看望梁小静,姐妹情深

乡野小珥
2025-11-18 07:31:38
2025-11-18 19:39:00
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1155文章数 218关注度
往期回顾 全部

科技要闻

小米:汽车及AI等业务首次单季度经营盈利

头条要闻

孟加拉国前总理哈西娜被判死刑 中方回应

头条要闻

孟加拉国前总理哈西娜被判死刑 中方回应

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

宋佳夺影后动了谁的奶酪

财经要闻

中美机器人爆发了一场论战

汽车要闻

搭载1.5T增程动力 吉利银河V900官图发布

态度原创

家居
健康
数码
时尚
公开课

家居要闻

彰显奢华 意式经典风格

警惕超声报告这六大"坑"

数码要闻

天马全球首发真610Hz无极电竞屏,还有108英寸4K巨幕Micro LED

从百元到大牌,《新闻女王2》的职场穿搭,每种预算都能找到参考

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版