网易首页 > 网易号 > 正文 申请入驻

清华最新研究登上《Science》:AI让药物筛选提速百万倍,今年冲刺临床前

0
分享至



出品|搜狐科技

作者|周锦童 常博硕

编辑| 杨 锦

很多人,都在生命中的某个时刻,被“癌症”这个词击中过。

悉达多·穆克吉在《万疾之王》中曾这样描述癌症:它不仅是某种疾病,更是生命在基因层面的背叛。

对于人类来说,重大疾病的出现往往并不伴随任何戏剧性的场面,有的只是一次次复查、一次次调整方案,以及一个反反复复的问题——还有没有别的办法?

在医学语境中,癌症被描述为失控的细胞增殖,而在患者的世界里,它更像一场漫长的、看不清方向的追逐战。药物研发,正是这场追逐战中最关键、也最残酷的一环。

人类基因组中,大约有两万多个蛋白质编码基因,它们构成了疾病发生、发展的靶点地图。然而直到今天,真正有药物能够精确作用的靶点,只覆盖了全部可成药靶点的约十分之一。

而这也意味着在绝大多数疾病,尤其是癌症这类复杂疾病面前,找到合适的药物依然像是大海捞针。

近日,清华大学智能产业研究院(AIR)联合清华大学生命学院、清华大学化学系最新研究成果登上《Science》杂志。

具体来说,他们研发出来一个AI驱动的药物虚拟筛选平台DrugCLIP,能够让AI在24小时内完成10万亿次蛋白–分子配对计算,极大地提升了人类对癌症的筛选效率。

“这项技术,可以说是对那些多年没有药可用的靶点,给了它一种打中的机会。”论文共同第一作者、清华大学智能产业研究院计算机专业博士生高博文对搜狐科技表示。


高博文


星海中的导航

在药物研发领域,新药研发周期动辄十年以上,成本高达数十亿美元,而失败往往发生在最昂贵、也最接近患者的阶段。

“新药研发成本高昂,最主要的原因有两个。”高博文解释道,“一是早期发现阶段失败率极高,有一种大海捞针的感觉,二是整个研发周期极长,每一步都可能前功尽弃。”

在高博文看来,AI至少可以先做一件事,那就是把盲目试错变成有方向的探索。

“我们的研究更像是一个在星海中进行的导航。”高博文这样形容他们正在做的事情,“它不再是一个盲目试错,而是通过人工智能技术,通过智能的检索和对比学习,在海量的化学空间与靶点空间中,快速定位出最有希望的匹配对。”

在对话中,他并不回避现实的局限性,但反复强调一个词——概率。

在癌症等难治疾病中,概率和速度的提升就可能意味着时间的缩短、成本的下降,以及更多“第一类创新药(first-in-class)”被尝试的可能。

在传统药物研发中,靶点筛选往往是一件极其缓慢、甚至带有运气成分的事情。

研究人员先选定一个靶点,再从有限的分子库中逐一尝试,看是否存在可能结合的候选分子。这个过程高度依赖经验,小规模、串行推进,一次往往只能验证一个方向。“传统方法可能一段时间只能做一个靶点,筛一波药,再去做下一个靶点。”他说。

而DrugCLIP试图做的,是把这套逻辑重新定义一遍。“我们希望把虚拟筛选变成一个全基因组、超大规模并行检索的新范式。”高博文解释道,“这样研究人员可以在非常短的时间内,对所有潜在靶点进行系统性的扫描。”

不止癌症,高博文表示DrugClip其实可以适用于各种不同的疾病,甚至是ADHD(注意缺陷多动障碍)。“实际上我们现在有一个正在推进的分子,是用来治疗ADHD的。”

“前一段时间罗永浩也表示自己患有ADHD ,这个疾病其实比较常见,市场也很大。这个药物分子就是由DrugClip筛选出来的,我们现在正在对它进行一些优化,希望能尽快推到临床前的阶段。”

他还提到,团队非常希望这套方法能在更多如渐冻症,胰腺癌、胶质母细胞瘤这些缺乏有效治疗手段的疾病中发挥作用。


打开蛋白质靶点“黑盒”

在高博文看来,DrugCLIP不仅首次完成了覆盖人类基因组规模的药物虚拟筛选,也重新定义了整个虚拟筛选的方式。

DrugCLIP通过对比学习重构了虚拟筛选的流程,将传统的结合能预测问题转化为蛋白质口袋与小分子的向量化检索任务。

对比传统方法,DrugClip的筛选速度实现了百万倍提升,同时在预测准确率上也有显著突破。

“我们之所以实现了百万倍的速度提升是因为双塔模型架构的预编码设计,候选分子库可以事先编码为向量并存入数据库,针对新靶点仅需单独编码蛋白质口袋,随后通过快速的向量匹配即可完成筛选,省去了传统方法中逐个分子进行复杂网络推理的过程。”高博文解释道。

值得一提的是,DrugCLIP的命名受到了自然语言-图像多模态模型CLIP的启发,高博文把它迁移到了药物发现的场景。

正如CLIP利用海量互联网图文对进行对比学习来实现图文匹配,DrugCLIP则是利用各种蛋白质-分子复合物数据,通过对比学习来训练模型,从而实现了蛋白质口袋与小分子的匹配。

可以说DrugCLIP在算法架构和数据层面都有创新,也解决了药物发现中长期存在的一个根本性瓶颈:如何为大量功能未知、且无任何已知结合药物的“黑盒”蛋白质靶点,快速寻找潜在的药物起点。

高博文是2022年9月加入清华大学智能产业研究院的,次年1月开始了这个项目的研究。

诚然,在研究过程中,他们遇到了很多困难,最典型的技术挑战就是如何训练出一个好泛化性的模型。

“真实的蛋白,小分子复合物是非常稀缺的,我们筛选过滤后有质量的真实数据只有5万个,相比于大语言模型来说,数据量小太多了,所以我们就设计了ProFSA 策略,从大量纯蛋白质数据中挖掘很多伪配体口袋进行预训练,再用真实复合物数据训练进行微调,很好地缓解了数据析出问题,提升了模型整体泛化能力。”

目前DrugCLIP模型正在跟天津超算中心进行合作,获得了速度上的进一步突破,可以实现千亿级分子库在分钟级内完成筛选,同时模型本身也有很好的硬件兼容性,未来也可以适配国产芯片。

高博文称如果快的话,由DrugCLIP模型筛选得到的药物分子今年可以推到临床前的阶段。

不过,也有网友质疑,如果AI预测结果出现严重副作用,责任主体是算法提供方、使用方还是双方共同承担呢?

对此,高博文表示无需担心。“我们的算法提供的还是药物早期苗头化合物的筛选,筛选的分子就像是AI模型的产物,后面会经过改造以及毒性代谢的监控和测试,还要经过动物实验、多期临床实验。如果药物分子真的可以面世,那一定是经过监管部门严格验证的。”


未来必须把药“搞”出来

可以说,这项研究是跨学科协作的典范。

“我们和生命科学学院、化学系都有合作,他们会向我们反馈一些感兴趣的靶点,然后我们进行筛选,再把筛选到的分子给他们,让他们进行生物学实验验证,像文章另一位一作贾寅君,他原本就是生命科学学院的,博士期间来智能产业研究院实习,于是我们就开始了合作。”高博文如是说。


清华大学智能产业研究院兰艳艳教授团队

而之所以进行这方面的研究,也是因为高博文期望能用人工智能的方法去解决对人类有价值的问题,未来他称会先把当前这个项目的产业化创业一步一步做起来。

在高博文看来,药物这个圈子是非常看重成果的,不像其他的靠AI“吹吹牛”别人就能买账,必须把药“搞”出来别人才会相信这套算法,所以还是要通过系统平台的能力把药物推到比较靠后的阶段。

“我们现在和Enamine, 药明康德, 阿斯利康等化合物供应商,CRO公司以及药企都形成了合作,之后会先形成一个平台化的服务,同时也希望能够跟其他药企进行私有化的部署。”高博文如是说。

谈及目前我国在AI辅助药物发现的近况时,高博文表示:“应该是不会有什么差距的,我们跟MIT,斯坦福这些学校研究的内容都是类似的,但国内外在整个领域还处于探索阶段。”

对话最后,高博文还分享了他对未来几年AI在药物发现领域技术发展的看法。

在他看来,首要的突破是要解决高质量数据稀缺的瓶颈,通过合成数据等手段来扩大数据规模;其次还需要建立更加可靠的模型验证方法,这样才能确保AI预测在实际场景中真正有效。

在此基础上,还要通过不断扩大模型规模来提升性能,并推动专用模型与大语言模型的结合,实现全流程自动化药物发现。最后,还要通过实验室自动化来实现干湿实验的闭环,从而打通药物发现的全路径,达到提速降本的目标。




运营编辑 |曹倩审核|孟莎莎




特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
四届DPOY终证含金量!戈贝尔连续锁死约基奇,掘金悔不当初!

四届DPOY终证含金量!戈贝尔连续锁死约基奇,掘金悔不当初!

田先生篮球
2026-04-24 13:17:56
不是克洛普也不是齐达内!伯纳乌王牌强硬表态,皇马新帅锁定狂人

不是克洛普也不是齐达内!伯纳乌王牌强硬表态,皇马新帅锁定狂人

奶盖熊本熊
2026-04-25 05:23:15
结束了!整整47连败啊!世界第一烂队诞生

结束了!整整47连败啊!世界第一烂队诞生

篮球实战宝典
2026-04-24 22:32:18
国家出手!“京圈富少”被判入狱,和童瑶关系被扒,真实身份曝光

国家出手!“京圈富少”被判入狱,和童瑶关系被扒,真实身份曝光

林轻吟
2026-03-25 07:23:12
詹姆斯29分13板打服詹黑湖人再胜火箭,3:0之后悬念结束

詹姆斯29分13板打服詹黑湖人再胜火箭,3:0之后悬念结束

李广专业体育评论
2026-04-25 11:09:20
德国百年巨头倒下时,浙江修鞋匠花4500万买下,如今年入70亿

德国百年巨头倒下时,浙江修鞋匠花4500万买下,如今年入70亿

毒sir财经
2026-04-19 22:12:53
重磅!4444 亿!谷歌、亚马逊投资 Anthropic

重磅!4444 亿!谷歌、亚马逊投资 Anthropic

云头条
2026-04-25 10:13:16
蒂格:詹姆斯是历史第一人!路威:41岁的詹姆斯还能进步!

蒂格:詹姆斯是历史第一人!路威:41岁的詹姆斯还能进步!

历史第一人梅西
2026-04-24 10:59:21
马筱梅:还有很多事情没有说,怕会伤害很多人,网友:似曾相识

马筱梅:还有很多事情没有说,怕会伤害很多人,网友:似曾相识

街上的行人很刺眼
2026-04-14 14:04:10
国务院免去二人职务!此前任上被查

国务院免去二人职务!此前任上被查

上观新闻
2026-04-24 15:51:06
很难听,但这是实话!詹宁斯:杜兰特没有任何球队领导力!

很难听,但这是实话!詹宁斯:杜兰特没有任何球队领导力!

爱体育
2026-04-24 23:10:29
揭秘武汉江岸区江湖大佬李平贵,横行江岸20年,敛财数十亿!

揭秘武汉江岸区江湖大佬李平贵,横行江岸20年,敛财数十亿!

好笑娱乐君每一天
2026-04-25 01:02:44
铜梁龙老板对刘建业提了一个要求!直言他要是做不到,就直接下课

铜梁龙老板对刘建业提了一个要求!直言他要是做不到,就直接下课

张丽说足球
2026-04-25 12:56:02
被72岁的姜黎黎惊艳到,碎花长裙+温婉盘发,知性优雅又高级

被72岁的姜黎黎惊艳到,碎花长裙+温婉盘发,知性优雅又高级

小陈聊搭配
2026-04-24 20:24:40
后悔已来不及了,美商务部长:中方改变主意,美方想卖却卖不出去

后悔已来不及了,美商务部长:中方改变主意,美方想卖却卖不出去

混沌录
2026-04-24 15:46:15
演员翁虹回应女儿被称最美星二代:这是她的幸运,也是她的福气

演员翁虹回应女儿被称最美星二代:这是她的幸运,也是她的福气

草莓信箱
2026-04-25 13:10:09
月薪1.6万招放羊工老板:电话快被打爆了,更适合四五十岁的夫妻搭档,一个人来的都拒绝了

月薪1.6万招放羊工老板:电话快被打爆了,更适合四五十岁的夫妻搭档,一个人来的都拒绝了

环球网资讯
2026-04-24 14:55:55
女子深夜打车回家,发现司机绕路她准备报警,司机:你仔细看后面

女子深夜打车回家,发现司机绕路她准备报警,司机:你仔细看后面

千秋文化
2026-02-12 20:06:26
牌局终了:王石,潘石屹和许加印

牌局终了:王石,潘石屹和许加印

蓝钻故事
2026-04-22 01:33:24
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
2026-04-25 14:07:00
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方账号
4789文章数 9186关注度
往期回顾 全部

科技要闻

DeepSeek V4发布!黄仁勋预言的"灾难"降临

头条要闻

美能源出口创新高 二战以来首次接近成为原油净出口国

头条要闻

美能源出口创新高 二战以来首次接近成为原油净出口国

体育要闻

火箭0-3触发百分百出局定律:本季加时赛9战8败

娱乐要闻

邓超最大的幸运,就是遇见孙俪

财经要闻

90%订单消失,中东旺季没了

汽车要闻

2026款乐道L90亮相北京车展 乐道L80正式官宣

态度原创

房产
手机
家居
健康
军事航空

房产要闻

新一轮教育大爆发来了!海口,开始疯狂建学校!

手机要闻

vivo X300 FE真机现身,蔡司加持,售价大亮

家居要闻

自然肌理 温润美学

干细胞如何让烧烫伤皮肤"再生"?

军事要闻

美防长:战事不会“没完没了”

无障碍浏览 进入关怀版