设置星标★关注,从此你的世界多点科学~
大家 · 科技前沿
MASTERS
药物研发,作为全球医疗保健体系的核心环节,承载着无数患者对健康与生命的渴望。然而,传统药物研发路径犹如一场漫长而艰辛的马拉松,不仅耗时费力,而且成功率极低。新药从概念提出到最终上市,往往需要经历10~15年的漫长周期,并伴随着高达数十亿美元的巨额投入。即便如此,临床试验阶段的失败率仍然居高不下,接近90%的候选药物在这一阶段折戟沉沙。
与此同时,全球范围内对新药的需求正在不断增长。据世界卫生组织(WHO)发布的《国际疾病分类第11版》(ICD-11),目前人类已知的疾病总数已超过55000种。但令人忧心的是,其中只有约10000至 15000种疾病拥有明确的药物治疗方案,仍有数万种疾病,尤其是罕见病和复杂疾病,至今尚无有效药物可用。这不仅意味着大量患者仍在病痛中挣扎,也对现有的药物研发体系提出了更高的要求。
然而,随着人工智能(AI)技术的迅猛发展,制药行业正迎来一场前所未有的技术革命。AI以其强大的数据处理能力、智能化的预测与决策,以及高效的自动化流程,正在逐步改变传统药物研发模式,开启了一个全新的智能研发时代。AI的加入,不仅有望大幅缩短药物开发周期、降低成本,还有望提升候选药物的成功率,推动更多“无药可医”的疾病走向可治之路。
朱宸葭
上海科技大学2024级生物学硕士研究生
钱其洋
上海科技大学2024级生物学硕士研究生
白芳
上海科技大学免疫化学研究所、生命科学与技术学院研究员、博士生导师
药物研发与基于计算机的虚拟药物设计技术
药物研发与基于计算机的虚拟药物设计技术
你是否好奇,一颗小小的药丸是如何精准“命中”我们体内的病灶的?这背后,其实是科学家在两个庞大且复杂的“空间”中进行高难度“匹配游戏”(如图1所示)——一个是我们身体内部的生物空间,另一个是潜在具有类药性质的化合物分子空间。
![]()
图1 药物发现是穿越类药分子“宇宙”以精准匹配疾病靶标生物空间发现匹配分子的过程
首先,来看生物空间。
我们人体由超过37万亿个细胞组成,而每个细胞里都装着一份完整的基因“说明书”——大约2万个蛋白编码基因,这些基因控制着蛋白质的生成,而蛋白质则构成了各种“生命机器”,比如受体、酶、转运体等。这些蛋白质构成了药物的“靶点”,目前科学家认为潜在的药物靶点可能超过3000~5000种,而在不同疾病状态下,它们的功能和表达方式都可能发生巨大变化。因此,生物空间不仅数量庞大,而且结构复杂,动态多变。
再来看化合物分子空间,也就是我们可以设计、合成的所有可能药物分子的集合。
根据科学家估算,在药物常见的分子量范围(小于500道尔顿)内,理论上可以存在的“药物样”小分子多达1060种——这是一个后面带着60个零的天文数字!而目前全球已知的化合物数据库(比如PubChem、ChEMBL等)中,记录的化合物大约为1亿种(108),只占了其中极小的一部分。
这就意味着,在数以亿计的生物靶点变化中,科学家需要从一个近乎无限的化合物“宇宙”中找到一种能精确作用且安全有效的分子,就像从银河系中寻找一颗特定形状的沙粒。而传统药物研发(如图2),往往靠大量实验室筛选与试错,不仅效率低下,而且耗资巨大。
![]()
图2 美国药物发现与研发过程概述
在药物发现实验室里,科学家像是在化合物海洋中打捞钥匙。他们要找到能与特定疾病靶点(比如致病蛋白质)完美匹配并且对靶点准确调控的分子“钥匙”,这项工作的难度不亚于大海捞针——据统计,往往需要10万个化合物分子才能筛选出100个候选。更困难的是,这把分子钥匙不仅要能打开“疾病之锁”,还不能胡乱开启其他健康细胞的“门锁”,否则就会产生副作用。
经过初步筛选的幸运分子将进入“改造学校”。化学家需要改造分子结构使它既能在靶点的分子层面、细胞层面和动物层面的多级实验中证实其疗效,又确保其能被人体高效吸收代谢。这个过程往往需要合成检测超过5000个类似物,才能得到一个令人满意的分子。
但这只是万里长征第一步。通过临床前测试的分子才能获得参加“毕业考”——I—III期的三个阶段的临床试验的资格。在这个淘汰率惊人的考验中,超90%的候选者将被淘汰:Ⅰ期测试在健康志愿者体内摸索安全剂量,Ⅱ期在小规模患者中验证疗效,Ⅲ期则要在数千名患者中接受双盲试验的严苛检验。成功率仅1/10的残酷现实中,每一个被“退学”的候选者都意味着数亿美元的研发资金化为泡影。
“分子沙盘”破解现代药学密码
你有没有想过,科学家正通过游戏般的虚拟世界寻找攻克疾病的钥匙?在这场没有硝烟的分子战争中,被称为“计算机辅助药物设计”(CADD)的超级装备已成为现代药物科学家的秘密武器。
CADD技术利用计算机建立了分子世界的虚拟沙盘,沙盘中的每个原子都藏着破解疾病密码的关键线索。通过数学和物理模型将药物与靶点的作用抽象出来,建立分子变量与药效等应变量之间的对应关系,以帮助筛选分子。当需要阻击导致疾病的“坏蛋白质/基因”时,CADD会在数字世界模拟数百万种药物分子与靶点的结合效果,就像用超高精度显微镜观察“锁和钥匙”的咬合过程。
这样的沙盘推演可直接筛掉九成不合格候选者,使实验室阶段研发提速数倍。此外,CADD还能像3D建模师般“精修”分子结构:计算机通过量子力学计算并预测药物入体后的代谢路线,指导化学家改变分子结构以减少副作用,或者靶向作用部位增强药效。
不过,早期的CADD系统需要科学家提前设定“必要知识点”才能运转。举个形象的例子:就像完成拼图时只能使用规定形状的碎片,传统CADD依赖事先设定的结构规则,如必须包含某些特定的化合物基团(称为官能团),这种方式可能会错过一些有望治疗难治疾病的新奇分子结构。另外,现代药物研发产生了海量数据,基于物理模型的传统计算模拟方法的计算负荷已接近极限。
这种技术瓶颈背后,正蕴藏着科技突破的机遇。就像生命科学领域的发展史一样,每当旧工具遭遇边际效应,总会有革命性新技术破茧而出。
AI助力新药研发:现代药学的“超级大脑”
随着科技发展,科学家迎来了一位超级助手——人工智能辅助药物设计(AIDD)。
拥有超强学习能力的AI技术,除了在日常生活中为人们提供便利,也正在药物研发领域掀起一场革命。AI不仅能像科学家一样思考,还能处理海量的生物医学数据,找到人眼无法发现的隐藏规律。
AIDD能在短时间内阅读百万份医学文献,记住数万个蛋白质结构图,还能找出它们之间细微的联系,“隐式”建立变量与应变量之间的关系,从而无需科学家从海量数据或者超复杂体系中抽象变量和建立数学物理模型。它就像一位永不疲倦的“分子解码师”,在庞大的生物医学数据海洋中寻找开启疾病之门的钥匙。
与传统的CADD相比,AIDD的特别之处在于它的自我进化能力。通过深度学习技术,AIDD可以从海量数据中自动发现规律,并且随着新数据的加入不断优化自己的算法,最终可以发现传统方法难以察觉的线索。例如,AIDD可以通过分析成千上万的基因数据和蛋白质结构,找到新的药物靶点,或者设计出更精准的候选药物分子。当然AI在药物研发流程中的应用场景众多,如图3列举所示。
![]()
图3 AI在药物研发中的应用场景举例
AIDD在药物研发中的应用举例
药物研发中的“靶向狙击手”
在药物研发这场与疾病的漫长博弈中,科学家首先要找到关键的战场坐标——这就是“药物靶点”。研究人员需要精准定位导致疾病的基因或蛋白质目标。传统方法依赖海量实验和资料库检索,效率低且容易遗漏关键信息。而AI赋予了这个过程革命性的突破。
AI能同时处理基因组和转录组等多组学数据、蛋白质三维结构、临床试验档案等复杂数据,识别出数据中的潜藏模式,并且可通过推理,建立疾病、靶点与潜在药物关系网络,辅助快速定位关键靶点,并可能快速实现老药新用。
目前,决策树、随机森林、支持向量机、Transformer等众多机器学习和深度学习模型均已广泛应用到了组学数据建模和靶点识别中。这种智能化的靶点定位技术,正在为帕金森病、糖尿病等复杂疾病打开新的治疗突破口。在这张看不见的分子战场地图上,AI正以每秒万亿次的计算速度标定着人类健康的新坐标,为个性化精准医疗打开全新维度。
蛋白质结构预测的革命性突破
蛋白质不仅是生命的基本组成部分,还是药物开发的关键,药物研发中的疾病靶点多为功能紊乱蛋白质。正因如此科学家才会一直着迷于蛋白质的研究。而如今,一个名为AlphaFold的AI程序正在彻底改变我们理解蛋白质的方式。
AlphaFold是由DeepMind公司开发的一款人工智能程序,它的核心能力是精确预测蛋白质的三维结构。为什么这如此重要?因为蛋白质的结构决定了它的功能,而药物开发通常依赖于药物分子与蛋白质的特定区域结合。如果我们能准确地知道蛋白质的结构,就能更高效地设计药物。
在过去,解析蛋白质结构是一项极其耗时且复杂的任务。科学家通常依赖X射线晶体学等传统实验方法,这些方法不仅需要大量的时间和资源,还对实验条件有着极高的要求。然而,AlphaFold的出现彻底改变了这一局面。它能够通过计算机模拟,在几小时内预测出蛋白质的结构,大大加速研究进程。
可以说,AlphaFold不仅是AI技术的一次壮举,更是生命科学领域的一次革命。它为药物研发、疾病治疗以及我们对生命的理解提供了全新的视角和强大的工具。通过精准预测蛋白质的三维结构,AlphaFold极大地缩短了从基因序列到功能解析的时间。
在第14届蛋白质结构预测关键评估大赛(CASP14)中AlphaFold的中位数主链均方根偏差(RMSD,一种量化预测结构与实验结构之间的偏差的评价指标,越小越好)为0.96 Å,而其他最佳方法的中位数主链RMSD为2.8 Å。这表明AlphaFold的预测结果与实验结构之间的主链偏差非常小,接近实验解析结构的精度水平。它让我们能够更深入地洞察生物分子的相互作用机制,从而设计出更有效的药物,精准靶向疾病根源。
同时,基于AlphaFold对人类蛋白质组及20种其他物种蛋白质结构的预测,DeepMind与欧洲分子生物学实验室(EMBL)合作构建了蛋白质结构数据库——AlphaFold 数据库。这一开放资源初始版本已收录超过360000个预测结构,并计划扩展至涵盖UniRef90数据集中超过1亿个代表性序列的结构,自上线以来,其访问量迅速增长,已成为结构生物学、药物设计和疾病研究等领域的宝贵数据资源。
这不仅加速了生命科学领域的突破性发现,更为系统解析蛋白质功能网络、破解复杂疾病机制和合成生物学设计奠定了数据基础,真正开启了生命科学的新时代。
分子世界的设计师和“智能拼图师”
当科学家锁定疾病靶点后,就像拿到了犯罪分子的指纹,接下来需要打造专属的“分子手铐”——这正是新药研发的关键环节。在传统的实验室里,药物化学家需要如同大海捞针般筛选成千上万的化合物,整个过程耗时又费力。
AI技术让这个过程变得高效。智能系统可以同时扫描数百万种分子结构,通过分析它们的三维空间结构和化学特性,快速锁定最可能完美匹配靶点的候选分子。这种强大的能力源于深度学习的突破——系统通过研究数据库中的药物分子,进而预测哪些分子能像钥匙开锁般精准对接靶点。
同时,在学习了靶点或相关配体的三维空间结构和化学特性后,利用AI技术还能进行“分子创作”,可以针对该靶点实现分子从头设计生成。像设计师一样,基于AI的分子设计技术实现在计算机中绘制出全新的药物分子结构,并预测这些分子与靶点的结合效果,从而大大提高药物分子设计的速度和精准度。这主要是依赖现在的人工智能生成式技术发展的分子生成新方法。
这类方法是指通过计算模型和算法,可在一定约束下,根据药物靶点结构或者要求的药效情况来设计和生成符合要求的新的分子结构。与传统的基于计算的化合物筛选方法相比,分子生成的主要优势在于其创新性和高效性。传统方法通常依赖从已有的化合物库中筛选出符合目标需求的分子,虽然有效,但其局限性在于只能探索已有结构,无法设计出全新的分子。而分子生成方法通过深度学习和优化算法,可以从头设计全新的分子结构,拓展化合物库的多样性,极大地提高创新性和研发效率。
但是目前这种新生成的分子“落地”也存在一定的挑战,作为全新结构,这类分子的合成路径往往需要更多的探索和努力。
现有挑战
尽管AI在药物研发中展现出了极大的潜力,但这项技术的普及和应用仍然面临着一系列挑战。在未来,AI如何在药物研发中继续发挥作用,解决当前面临的问题,是我们需要进一步思考和探讨的。以下是目前AI在药物研发中所面临的主要挑战,以及未来的发展方向。
现代药物研发需要处理大量的高质量数据:基因序列就像生命密码本,蛋白质结构类似立体拼图,还有各类临床试验的观察报告。目前这些数据来自不同实验室、不同仪器,格式五花八门,有的像精心整理的手账,有的却像字迹潦草的草稿纸。更麻烦的是,有些关键数据可能根本未被记录,就像缺失几页的侦探小说。
此外,在数据规模变大的同时,算力也得同步跟上。且药物研发过程非常复杂,为了达到更好的效果,每一个步骤都应该有一个定制化的算法。
未来发展
未来可以通过进一步整合基因组、蛋白质组、临床表型等多维度数据,构建更全面的疾病模型,进行个性化医疗。
想象一下,智能手表不仅能计步,还能通过你的心率曲线预测流感——这正是AI驱动的个性化医疗正在描绘的未来图景。每个患者的基因身份证正在成为定制药物的黄金密钥,AI则化身解码大师,将基因密码翻译成精准治疗方案。每位患者的基因和自身情况都不相同,传统疗法就是在碰运气。如今,AI能快速扫描成千上万种药物,有望通过基因比对推荐最适合病人的方案。
借助数字孪生与器官芯片,通过体外微生理系统模拟人体器官反应,缩小体内外差距。对于慢性病患者,AI变身为全天候健康管家。它会整合你的运动手环数据、生理指标、饮食记录和睡眠质量,以此搭建个人健康模型。当模型发现血糖异常趋势时,会发出提醒,并自动生成运动和食谱的建议,甚至与医疗机构合作,根据数据修改药物方案。
未来医疗的最大突破或许在于预防。AI正在学习从人体各项指标的微妙波动中捕捉疾病萌芽,并尝试提前化解危机。当这项技术成熟时,吃药可能会变成手机系统升级:“叮!检测到心血管有老化倾向,请点击安装预防型药物程序。”
AI为药物研发带来新时代
人工智能正以惊人的速度改变药物研发的各个方面。从靶点发现、分子设计到临床试验优化,AI的应用不仅大大提高了研发效率,降低了成本,还为药物的精准设计和个性化治疗提供了强有力的支持。虽然AI在药物研发过程中仍面临着数据质量、算法问题等挑战,但随着技术的不断进步和各界的努力,这些问题有望得到解决。
我们有理由相信,药物研发的新时代已经到来,这将为我们带来更加健康、个性化的医疗体验。
-本文刊载于《世界科学》杂志2026年第2期“大家·科技前沿”栏目;文章根据笔者在上海市科学技术普及志愿者协会主办的“海上科普讲坛”上的报告撰写而成-
![]()
《世界科学》杂志版在售中 欢迎订阅
月刊定价
15元/期
全年订阅价
180元
点击左侧图片或以下方订阅方式选购
方式一:
扫描二维码,“杂志铺”订阅有折扣~
方式二:
全国各地邮局订阅 邮发代号:4-263
方式三:
机构订阅,请拨打
021-53300839;
021-53300838
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.