生成式人工智能在药物研发中的应用、挑战与监管策略|算法|科学

分享至

摘要

生成式人工智能（Gen AI）正在重塑药物研发的各个环节，包括靶点发现、分子设计、临床研究优化及注册文档生成。Gen AI通过深度学习模型分析多源数据，优化药物靶点识别，加速候选分子的设计与筛选，优化临床试验设计和患者招募。尽管Gen AI在提高研发效率和成功率方面展现出巨大潜力，但其应用仍面临可解释性不足、数据隐私保护与合规性、模型偏见、专业人才和跨界知识缺口、全球法规标准和指导原则滞后、成功案例难以复制等挑战。为应对这些问题，药品监管机构探索先行先试推动开展监管科学实践，坚持社会共治协同发力攻克技术难题，抓住发展机遇引领医药产业高质量发展，推动AI技术的法规支持和合规管理。通过政策引导与产业协同，Gen AI有望进一步推动药物研发的创新和生物医药产业的高质量发展。

正文

生成式人工智能（generative artificial intelligence，Gen AI）是一种能够基于已有数据生成新内容的人工技术。在药物研发注册中，Gen AI可通过机器学习或深度学习模型，基于大量药物研发相关数据，生成创新性输出，包括但不限于药物分子设计、临床试验设计、药效评估、毒性预测、药物注册文档的编写与结构化数据生成等[1]。近几年，Gen AI技术飞速发展，在制药领域通过不断赋能研发、生产、销售行业全链条各环节，使制药行业逐渐从“试错密集型”跨越至“计算驱动型”。波士顿咨询集团（Boston Consulting Group）2022年发布的报告显示[2]，2010—2021年，20家将AI赋能作为核心研发策略的药物研发公司，其研发管线共有约160个小分子项目，其中约15个已进入临床试验阶段[2]。Grand View Research报告显示[3]，2023年全球人工智能药物研发市场规模估计为15亿美元，预计2024—2030年的复合年增长率将达到29.7%。

面对AI的快速发展，医药企业和药品监管机构快速、积极做出响应。医药企业通过构建AI模型，不断完善训练集数据、调优模型算法、持续提升算力，通过构建“数据-算力-算法”三角，试图缓解传统药物研发面临的高成本与长周期痛点，推动医药行业向智能决策范式跨越。2024年6月，国家药品监督管理局发布《药品监管人工智能典型应用场景清单》[4]，支持“人工智能+”行动在药品监管领域的实践探索，统筹推进人工智能场景创新；2025年4月，工业和信息化部等六部委发布《医药工业数智化转型实施方案（2025—2030年）》[5]，推动新一代信息技术与医药产业链深度融合，加快推动医药工业数智化转型，促进医药工业高质量发展。

然而，AI在医药领域的广泛应用为药品监管带来一系列挑战，这些挑战将削弱传统医药研发范式下监管框架的适用性。这种新技术、新方法带来的挑战也凸显出技术快速演进与制度响应滞后之间的矛盾。本研究总结Gen AI在药物研发关键环节中的具体应用、挑战及监管策略，以期为促进生物医药创新的安全、合规与高质量发展提供参考。

Gen AI在药物研发关键环节的应用

1.1 理解疾病与识别靶点

正确识别靶点是新药研发的第一步。传统靶点识别的方法主要依赖于零散的生物学发现，效率低、遗漏率高。Gen AI能够整合多模态生物医学数据，寻找文献与多组学数据的关联，并在稀少的证据中识别、预测潜在靶点或生物标志物[6]。研究表明，研究人员利用AI平台，通过分析病毒入侵宿主细胞的机制，识别出抗风湿药物巴瑞替尼能够通过抑制AP2相关蛋白介导的内吞作用阻止病毒进入细胞，同时具有抗炎作用[7]。随后，临床试验验证了巴瑞替尼与瑞德西韦联合使用的疗效。美国食品药品管理局（FDA）于2020年11月授予该联合疗法紧急使用授权（EUA）[8]。

借助Gen AI模型不仅能够对现有药物重新定位，还能发现全新靶点。例如，PandaOmics生物信息平台[9，10]能够融合多组学网络与文献挖掘，成功识别出TRAF2-NCK交互激酶作为抗特发性肺纤维化靶点（TNIK）[11，12]，而此前该靶点由于机制不明确而长期未被关注。

1.2 分子设计与性质预测

确认靶点后，下一个关键环节是设计出与靶点相互作用并具有良好成药性的候选分子。传统药物设计通常需要筛选大量化合物，周期长、成本高。Gen AI的深度生成模型，特别是变分自编码器（VAE）、生成对抗网络（GAN）和图神经网络（GNN）等模型[13]，可通过学习大量已知化合物的数据，识别化学空间的潜在规律，动态优化分子结构，生成能够同时满足药理活性和药代动力学要求的分子[14-16]，极大提高先导化合物的发现效率[17]。例如，Insilico Medicine公司利用其生成式化学平台Chemistry42，在18个月内设计、合成并成功筛选出多款高活性的TNIK小分子抑制剂，其中化合物INS018-055更是进入到临床试验阶段[11]。

在分子设计过程中，AI驱动的合成路线设计模型可以帮助研发人员高效、智能地规划合成路线，如Chemical. AI公司开发的Chem AIRS平台[18]，可以实现正向合成设计、逆向合成分析、合成路线可行性评估、合成工艺优化、杂质预测等功能。此外，化合物非临床性质（ADMET）预测也是AI模型的另一重要应用场景，包括ADMET Predictor®[19]、ADMETlab3.0[20]、SwissADME[21]在内的AI模型可以基于海量已知化合物的数据，快速预测新分子的溶解度、稳定性、跨膜吸收、代谢途径和潜在毒性等关键性质，为分子优化设计提供支持。这些AI模型使得在动物实验前就能筛除掉毒性高、代谢性能差、安全窗口窄的化合物，大幅降低后续开发风险，节约研发经费[22]。

1.3 临床研究优化与预测

新药进入临床开发阶段后，也会面临诸多挑战，如方案设计复杂、患者招募困难、数据管理繁琐以及失败率高等。Gen AI模型能够学习历史试验数据和真实世界数据，辅助生成更高效、成功率更高的临床试验方案，推动“先模拟后试验”模式落地[23-25]，同时在受试者入组、简化临床试验实施流程等方面也能发挥巨大作用。

在临床试验模拟方面，Gen AI可构建真实患者的“数字孪生”模型，由计算机生成虚拟受试者群体并模拟不同临床方案的实施效果[26，27]。这些“数字孪生”能够根据个人特征虚拟再现疾病进程和治疗反应，使研究者在试验前测试多种方案组合，优化试验设计并提前发现潜在问题。例如，AI生成的“数字孪生”可辅助选择更合理的入排标准、选择更敏感的终点指标，从而提高试验对个体差异的检测力[28]。Gen AI还能帮助探索不同剂量和给药方案的疗效，在虚拟环境中识别最佳剂量区间和终点设定，减少真实患者暴露于低效或无效方案的风险[29]。Sanofi公司在哮喘临床试验中借助“数字孪生”预测早期剂量与终点关系，其模拟结果与后续Ib/II期数据高度一致[30]。

在某些情形下，Gen AI还能用于构建虚拟对照组，Gen AI模型通过学习大量既往患者真实世界证据来模拟对照组结局，在不影响统计把握度的前提下减少安慰剂受试者，降低伦理负担[27]。无论是“数字孪生”生成的虚拟患者，还是基于模型的合成对照，均可为临床试验提供更为灵活且符合伦理的替代方案，尤其是在患者难以招募或伦理问题突出时。然而，目前其生成的数据仍需与高质量的真实临床数据相结合，以提高证据的可信度和结果的可靠性。

除了模拟和优化试验方案之外，Gen AI模型还能用于撰写规范的临床试验方案草案、知情同意书和病历报告等文件的初稿，减轻研究者的文书撰写负担[31，32]。对于患者招募，AI可根据电子病历和患者基因型快速筛选符合条件的人群，提高入组效率并确保多样性[33]。AI模型还能实时监控试验进展，分析期中数据以提示潜在问题，支持适应性试验的决策。这些应用正与药物临床试验的去中心化、数字化趋势相结合，使临床研究更灵活高效。

Gen AI带来的挑战及应对策略

2.1 模型可解释性不足

Gen AI模型的计算和统计方法通常极其复杂，即便经验丰富的审评员或研发人员，都难以理解AI模型是如何开发并得出结论的。AI模型固有的“黑箱”特性给药物注册和审评审批带来了巨大挑战，审评员通常难以判断模拟结果的风险，也无法仅根据模拟结果提出审评意见或结论。

因此，模型的可解释性及其方式的研究对Gen AI在药物研发中心应用至关重要。在研发层面，可以对AI模型进行简化或近似，提取出模型的关键特征贡献，或通过可视化的人机交互界面，研发者引导或约束模型生成，使模型的生成过程及结果更容易理解。同时，还可将AI的输出关联已知的生物医学知识，提高模型的可解释性。在监管层面，FDA于2025年1月发布了《使用人工智能支持药品和生物制品监管决策的考量》指南草案[34]，重点强调了模型可解释性的重要性。指南草案建议模型开发者在使用前，应评估其在特定应用场景下的模型风险，并按照“基于风险的可信度评估框架”对模型的可信度进行评估，必要时应提供模型详细信息，包括模型结构、训练数据、验证方法和置信区间等，以支持监管做出决策。

2.2 数据隐私保护与合规性

训练性能较强的AI模型需要大规模、多源头的生物医学数据，数据的富集过程可能会产生合规性和安全性方面的挑战。在数据隐私保护方面，患者的病历、基因组信息属于高度敏感信息。包括欧盟《通用数据保护条例》（GDPR）[35]在内的多国法规均对医疗数据的采集和使用制定了严格标准，我国《人类遗传资源管理条例实施细则》也严格限制了境外机构获取遗传数据[36]。

在实操层面，如AI模型训练时使用到可识别个人身份的数据时，须依法取得患者知情同意，并采取匿名化等措施保护隐私。在模型的选择上，可采用联邦学习（federated learning，FL）等分散式机器训练技术。FL能够在多个数据持有方（如医院、研究机构）不共享原始数据的前提下，共同训练AI模型，最终通过模型参数而非原始数据的共享实现隐私保护[37]。该方法虽然能在一定程度上解决数据隐私的问题，但不同数据持有方的数据标准不一致也会对AI模型的泛化能力产生不利影响[38]。

另外，模型训练数据及其生成结果的传输和存储也应予以充分保护，防止因数据被窃取或篡改带来的知识产权和公共安全风险。因此，监管机构也有理由要求在注册申报资料中说明模型训练数据集的来源合法性、质量控制措施，以及在数据安全和患者隐私保护方面采取的措施。

2.3 模型偏见

训练数据失衡或算法约束不足会使AI模型继承并进一步放大历史偏见[39]。某些临床试验缺乏对照组信息，模型可能高估疗效曲线，做出偏乐观的临床结局预测，误导研发决策。如原始临床试验按照入排标准排除了某些高危受试者，AI模型将继续排斥该群体，并做出试验药物对该类患者无效的错误预测，造成偏见循环[40]。

在数据层面，可通过增加更多样本、调整样本比例，特别是让少数群体或罕见情况的数据占比增加来改善数据的代表性[41]；在模型层面，可引入一些公平性约束条件，或者采用多任务学习和对抗学习的方式，以确保模型能够在不同群体中都有良好的预测效果[42]；在评估层面，需要用更细致的指标来评估模型在不同群体中的表现，并且在模型投入使用后，持续监控其性能变化，防止模型随着时间的推移出现偏差[43]，这些方法均为常见的纠正和优化模型方法[44]。

2.4 专业人才和跨界知识缺口

药监机构的审评员主要以药学、医学背景为主，面对AI模型和复杂算法缺乏经验，审评员难以对AI模型生成的结果及其可靠性做出独立的审评意见。另外，传统医药企业也面临人才缺乏的困境，医药企业现有团队通常是由IT工程师及药学、医学团队组成，各方由于知识背景不同，往往存在沟通障碍。这种知识隔阂会导致模型开发效率下降，甚至与实际需求脱节，在模型的应用等方面也存在一定挑战。

2.5 全球法规标准和指导原则滞后

AI技术发展速度远超药品监管法规的更新速度，目前全球尚无正式发布的相关指导原则。不管是AI模型验证、评估相关资料在药品电子通用技术文档（eCTD）结构下的具体位置，还是AI模型的验证标准或数据接受要求都没有明确规范，医药企业在开发和注册过程中缺乏明确的参考框架。另外，AI相关议题的国际监管协调尚未建立，不同国家或地区采用各自的AI监管路径，如标准不一致，可能出现采用同一AI模型辅助研发的新药在一国获批而另一国被拒的情况，阻碍全球药物可及。

2.6 成功案例难以复制

尽管采用Gen AI模型赋能药物研发已产生了数个标志性案例，但将这些成功经验推广至新的应用场景面临巨大挑战。模型训练语料的差异，训练数据分布与真实部署环境的差异，未公开的关键超参和训练细节，以及时序、机构和人群数据漂移等都会导致模型复现性和泛化能力显著下降[45]。已有的失败教训也突显了加强数据标准、模型透明度和外部验证的重要性。

启示

3.1 探索先行先试

在新兴技术迅速发展的背景下，药品监管机构应结合我国药品监管实践，制定科学、前瞻的监管策略。可探索“先行先试”的监管策略，建立相关制度。例如，可探索将经沟通交流确认的、采用Gen AI模型在特定场景下加快研发生产环节的项目给予适当的政策倾斜；另外，也可在确保安全可控的前提下，探索建立数据安全岛试点，及时对数据安全性和模型性能进行测评，对已经成熟的应用场景及其AI模型在一定范围内加大试点应用力度，并逐步规范推广。通过包容审慎的监管尝试，有效激发医药企业创新研发的热情，促进生物医药产业高质量发展；同时“先行先试”也有助于我国药品监管机构提前发现并解决AI应用中潜在的问题，通过持续动态评估AI模型的可解释性、算法稳定性和安全有效性，及时调整监管思路，在风险可控下鼓励创新发展。

3.2 坚持社会共治

国际经验表明，多方参与是解决新兴技术监管难题的有效途径。我国药品监管机构也倡导产学研医等多方参与构建Gen AI治理体系，合力应对监管挑战。在产业界，医药企业和AI供应商应持续加强合规管理，确保模型持续符合相关法规要求，同时不断加强技术革新，优化算法；在科研界，提倡科研机构深度参与模型评估验证，不断提高AI工具的可靠性和可解释性；在医疗领域，鼓励患者代表和公众代表参与讨论，提出对于隐私保护、知情同意和公平可及等方面的诉求；在监管层面，可探索构建跨领域协作机制并组建外聘专家库，广泛吸纳AI等领域专家。通过社会共治，凝聚各方共识，增强监管决策的透明度和公信力，促进监管规则的科学合理制定与落实。

3.3 引导新技术革命

Gen AI正在逐步成为我国生物医药产业高质量发展的关键引擎。监管部门应发挥引导作用，强化与产业的协同发展。目前国家层面已将AI赋能产业发展纳入重点支持范畴，药品监管部门可进一步制定AI赋能药物研发生产等典型应用场景清单，发挥示范引导作用。医药企业应提前布局Gen AI技术研发与应用，积极与AI技术公司深度合作，开发自主可控的核心算法和大模型，夯实关键技术底座；同时建立内部AI研发规范，将数据合规、安全审核和效果评估融入研发流程，确保新技术研发与监管要求同步。企业还应加大人才引进和团队培养，吸纳既懂制药又懂算法的人才，以提升创新能力。

通过政企协同发力，以政策引导扶持优化创新生态，以企业技术攻关和合规自律“双轮驱动”，在确保安全可控的前提下加速实现Gen AI对新药研发的变革性赋能，实现科技创新与监管保障的良性互动。

结语

Gen AI为新药发现带来了创新动力，从靶点挖掘到分子设计再到临床优化，各环节的实践证明了AI的巨大潜力。然而，新兴技术的应用伴随着风险和挑战。对于监管机构，如何既鼓励AI赋能新药研发，又确保药物安全、有效、质量可控，是复杂的监管课题。全球主要监管机构在数据治理、模型解释、算法偏差等方面均尚未完全准备就绪，但各国监管机构和国际组织已经开始行动，通过人才培养、指南制定和国际合作等举措逐步填补空白。可以预见，未来药品监管将更加灵活、主动。对于业界，需与监管机构保持密切沟通，在研发过程中预先考虑合规要求并积累证据。监管与产业形成良性互动，才能释放Gen AI在生物医药领域的潜能，不断提升药物研发效率和创新水平。

参考文献

详见《中国医药导刊》 2026年第28卷第1期（总第267期）

识别微信二维码，添加生物制品圈小编，符合条件者即可加入

生物制品微信群！

请注明：姓名+研究方向！

本公众号所有转载文章系出于传递更多信息之目的，且明确注明来源和作者，不希望被转载的媒体或个人可与我们联系(cbplib@163.com)，我们将立即进行删除处理。所有文章仅代表作者观不本站。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.