网易首页 > 网易号 > 正文 申请入驻

提速1000万倍!清华团队登上Science:用AI加速药物发现筛选

0
分享至

人类体内约有 20000 个与疾病相关的蛋白质编码基因,但目前只有约 10% 被现有药物成功靶向。

在传统实验中,科学家们用“分子对接”来虚拟筛选药物,这不仅耗时耗钱,也难以覆盖如此庞大的靶点数量。长久以来,科学家们都在苦苦探索一种更高效、更鲁棒的方法。

就在今天,清华大学联合研究团队给出了一个新的“解法”,创新地提出了“AI 对比深度学习”框架——DrugCLIP。

据介绍,该框架可实现超高速且高精度的虚拟筛选,其速度最高可比传统分子对接方法快 10 万倍,并在多项 in silico 基准测试中持续优于多种基线方法。相关研究成果已发表在权威科学期刊Science上。



论文链接:

https://www.science.org/doi/10.1126/science.ads9530

该论文的 5 位共同一作均来自清华大学,分别:Yinjun Jia、Bowen Gao、Jiaxin Tan、Jiqing Zheng、Xin Hong。通讯作者为:清华大学万国数据教授&智能产业研究院(AIR)副院长兰艳艳、清华大学生命科学学院助理教授张伟、清华大学生命科学学院副教授闫创业、清华大学化学系教授刘磊。

DrugCLIP是什么?


DrugCLIP 的核心创新点是将虚拟筛选重新定义为一种密集检索(dense retrieval)任务。

具体来说,模型分别将蛋白结合口袋和小分子编码成向量,并映射到同一个表示空间中,只需比较两者的相似程度,就能判断小分子是否可能与蛋白结合。

通过对比学习,模型拉近正样本蛋白–配体对的表示,拉远无关分子,从而在海量分子中快速筛出最有可能结合的候选者,使虚拟筛选从高成本计算转向高效检索。



图|DrugCLIP 框架

1.训练流程

在预训练阶段,研究团队提出了 ProFSA 框架,从已有的蛋白结构中生成大规模合成数据。他们基于蛋白质数据库 PDB 构建了约 550 万对训练样本。

该框架将蛋白内部的短肽片段视作“伪配体”,其周围区域视作“伪结合口袋”。由于蛋白内部相互作用与蛋白–小分子结合在物理机制上高度相似,这种方式可以在没有真实配体的情况下,让模型提前学习结合规律。

随后,研究团队对预训练模型进行了微调,即使用真实解析的蛋白–小分子复合物进行联合优化。考虑到虚拟筛选中往往无法获得分子的真实结合构象,他们采用 RDKit 生成随机构象进行数据增强,使模型更贴近真实应用场景。

最终,在实际筛选时,DrugCLIP 只需计算向量相似度即可完成排序,大幅提升了筛选效率,为超大规模药物研发提供了现实可行的技术路径。

2.GenPack 策略

在通过计算机模拟(in silico)和湿实验(wet-lab)验证 DrugCLIP 模型的有效性之后,研究团队将其进一步应用于计算预测得到的蛋白质结构。但 DrugCLIP 对蛋白侧链的误差并不敏感,为了进一步释放预测结构的潜力,研究团队提出 GenPack(Generation-Packing) 策略。

GenPack 通过在固定蛋白骨架条件下生成候选分子,反向“引导”蛋白口袋进入更有利于结合的状态,并在随后进行结构精修。

借助这一策略,DrugCLIP 在 AlphaFold2 预测结构和 apo 结构上的活性分子富集能力均显著提升,整体性能优于此前常用的基于物理模型的方法。


基于DrugCLIP的全基因组虚拟筛选


研究团队使用 DrugCLIP 模型对来自 ZINC 和 Enamine REAL 数据库的 5 亿多种类药小分子进行了大规模虚拟筛选。

整个过程共完成了超过 10 万亿次蛋白–配体打分计算,但仅在一台配备 8 张 A100 GPU 的计算节点上、约 24 小时内完成,显示出该方法在效率上的显著优势。

最终,他们构建了 GenomeScreenDB 数据库,覆盖近 1 万个人类靶点、2 万多个结合口袋,共收录 200 多万个潜在命中小分子。相关分子结构、对接构象及评分信息均已对外开放,开创了后 AlphaFold 时代药物研发新范式。



图|全基因组虚拟筛选结果的 t-SNE 可视化及示例。


实验结果


实验表明,DrugCLIP 速度最高可比传统分子对接方法快 1000 万倍。

在对包含约 264 万个分子的 LIT-PCBA 数据集进行筛选时,传统分子对接软件 Glide-SP 需耗时约3 天,而 DrugCLIP 在顺序计算模式下仅需 38 秒;在使用 GPU 并行计算时,完成相同计算量所需时间更仅为 0.023 秒。



图|在 LIT-PCBA 数据集上的筛选速度对比。

在湿实验中,DrugCLIP 针对去甲肾上腺素转运体取得了15% 的命中率,并成功解析了两种筛选得到的抑制剂与靶蛋白的复合物结构。对于甲状腺激素受体相互作用因子 12(TRIP12)这一缺乏全配体结构和小分子结合物的靶点,DrugCLIP 仅依赖 AlphaFold2 预测结构便实现了17.5% 的命中率。



图|湿实验的实验结果。

随着 AlphaFold3、RoseTTAFold All-Atom 等新一代结构预测模型,以及结构–亲和力联合预测方法的不断成熟,虚拟筛选正从“快速搜索”迈向“精准决策”。

研究团队表示,在未来的研究中,将 DrugCLIP 等超高速虚拟筛选框架与新一代结构建模及亲和力预测技术相融合,有望在整个人类基因组范围内实现更深入、更系统的药物发现研究,有助于构建更精确的“可成药基因组”图谱,为提高药物研发的效率奠定坚实基础。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
CBA12轮过后,目前已具体冠军水平教练只有5人

CBA12轮过后,目前已具体冠军水平教练只有5人

大眼瞄世界
2026-01-11 00:09:30
民众党陷入内讧,柯文哲搞特殊化,遭两大将炮轰,黄国昌处境尴尬

民众党陷入内讧,柯文哲搞特殊化,遭两大将炮轰,黄国昌处境尴尬

真正能保护你的
2026-01-11 00:10:39
深圳龙岗华南城要“倒闭”?记者实探

深圳龙岗华南城要“倒闭”?记者实探

童童聊娱乐啊
2026-01-10 14:23:17
嫌他借宿太久,华裔妻子当着法官丈夫的面开枪打死侄子,最近法院给出一个宽松的结局

嫌他借宿太久,华裔妻子当着法官丈夫的面开枪打死侄子,最近法院给出一个宽松的结局

英国那些事儿
2026-01-09 23:38:42
深夜利空,8个龙头年报业绩暴雷,5股陷入亏损,千万别踩雷

深夜利空,8个龙头年报业绩暴雷,5股陷入亏损,千万别踩雷

风风顺
2026-01-10 00:57:49
一定要大量读书:读书,就是在借命

一定要大量读书:读书,就是在借命

欣辰读书
2026-01-09 23:12:53
土葬大调整!2026年3月施行,耕地上老坟拆不拆?补贴明细来了!

土葬大调整!2026年3月施行,耕地上老坟拆不拆?补贴明细来了!

老特有话说
2026-01-10 17:37:12
国务院国资委:国资国企绩效与薪酬、晋升、退出“硬挂钩”已成常态

国务院国资委:国资国企绩效与薪酬、晋升、退出“硬挂钩”已成常态

证券时报
2026-01-09 20:31:05
领导突然问你“要不要考虑去别的岗位”,千万不要说“我考虑下”,高情商这么回,反客为主!

领导突然问你“要不要考虑去别的岗位”,千万不要说“我考虑下”,高情商这么回,反客为主!

二胡的岁月如歌
2026-01-03 18:02:12
泽连斯基引发的链式反应:叙利亚、哈马斯、黎巴嫩真主党、委内瑞拉、伊朗

泽连斯基引发的链式反应:叙利亚、哈马斯、黎巴嫩真主党、委内瑞拉、伊朗

高博新视野
2026-01-08 20:22:29
特朗普“热脸贴冷屁股”:催石油巨头投千亿美元,被呛委内瑞拉不值得投资

特朗普“热脸贴冷屁股”:催石油巨头投千亿美元,被呛委内瑞拉不值得投资

上观新闻
2026-01-10 19:35:17
洗澡可能影响寿命!医生再次提醒:68岁以后,牢记洗澡“4不要”

洗澡可能影响寿命!医生再次提醒:68岁以后,牢记洗澡“4不要”

刘哥谈体育
2026-01-08 05:54:41
默茨从派兵到求饶,被俄罗斯一句话吓坏,欧洲无人?

默茨从派兵到求饶,被俄罗斯一句话吓坏,欧洲无人?

倔强旳牵强
2026-01-10 22:11:06
真相很残忍:为何有些子女到了五六十岁后,都慢慢变得不孝了

真相很残忍:为何有些子女到了五六十岁后,都慢慢变得不孝了

黑猫故事所
2026-01-10 22:48:29
美国改口晚了!欧洲考虑倒向中国,丹麦下放开火权,要让北约陪葬

美国改口晚了!欧洲考虑倒向中国,丹麦下放开火权,要让北约陪葬

潋滟晴方DAY
2026-01-10 23:32:14
美国多家石油公司对投资委内瑞拉表态谨慎,埃克森美孚:目前“不可投资”

美国多家石油公司对投资委内瑞拉表态谨慎,埃克森美孚:目前“不可投资”

澎湃新闻
2026-01-10 13:34:06
44岁秦岚同居实锤!情侣拖鞋+见家长,偏不领证太清醒

44岁秦岚同居实锤!情侣拖鞋+见家长,偏不领证太清醒

陈意小可爱
2026-01-09 08:29:47
A股:人民日报定调!释放强烈信号,股民准备好,下周要冲4200?

A股:人民日报定调!释放强烈信号,股民准备好,下周要冲4200?

云鹏叙事
2026-01-10 00:00:06
香港大埔五级火|黄伟纶:原址重建住宅不切实际,拟改建为社区设施

香港大埔五级火|黄伟纶:原址重建住宅不切实际,拟改建为社区设施

星岛记事
2026-01-10 11:32:27
CBA最新消息!北京首钢酝酿换帅,布朗确定离开辽宁男篮

CBA最新消息!北京首钢酝酿换帅,布朗确定离开辽宁男篮

体坛瞎白话
2026-01-10 07:39:42
2026-01-11 00:56:49
学术头条
学术头条
致力于学术传播和科学普及,重点关注AI4Science、大模型等前沿科学进展。
1429文章数 5081关注度
往期回顾 全部

科技要闻

必看 | 2026开年最顶格的AI对话

头条要闻

男子带父母去四川"纯玩" 不料消费7万连上厕所都收费

头条要闻

男子带父母去四川"纯玩" 不料消费7万连上厕所都收费

体育要闻

怒摔水瓶!杜兰特30+12 难阻火箭遭双杀

娱乐要闻

吴速玲曝儿子Joe是恋爱脑

财经要闻

这不算诈骗吗?水滴保诱导扣款惹众怒

汽车要闻

宝马25年全球销量246.3万台 中国仍是第一大市场

态度原创

数码
艺术
亲子
健康
公开课

数码要闻

音频硬件开始“长脑子”?直击CES 2026六大音频新品

艺术要闻

601米,150亿美元!沙特目前第一高楼是它!

亲子要闻

方媛晒三个女儿:大宝趴地上画画。二宝读英文书,三胎睡婴儿车里

这些新疗法,让化疗不再那么痛苦

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版