编者按:随着模型引导的药物研发(MIDD)日益成为监管决策的核心支撑,审评报告的标准化与模型评估的科学性成为提升效率与质量的关键。在近期举行的2025年第11届定量药理学与新药评价会议(ISQP)上,前美国食品药品监督管理局(FDA)临床定量药理审评部部长、瑞宁康生物医药创始人/CEO王亚宁博士在主题报告中,系统阐述了FDA定量药理审评中标准模板的演进历程、当前并行的两种审评模式,并深入探讨了针对复杂模型(如定量系统药理学模型)与人工智能(AI)模型的可信度评估框架及其实际应用。
01
定量药理审评的标准模式演进
当前,FDA在定量药理审评中并行使用两种不同的审评报告模板。第一种是目前广泛应用于非癌症领域的整合审评模板。这种模式将临床、统计、临床药理、非临床等多个部门的审评内容整合在一个综合报告中,但化学、生产和控制(CMC)部分通常仍作为独立报告。在这种整合报告框架下,定量药理相关内容(如群体药代动力学和暴露-效应分析)需由审评员自行从申请人提交的海量报告中提取关键信息,并分散整合到报告的不同章节中,主要包括评估药物疗效并对剂量优化进行解释的章节、临床药代动力学章节以及个体化用药相关章节。审评员通过高度标准化的提问框架,集中审查几个核心问题:临床药理学数据是否支持药物有效性?总体人群的剂量是否合理?是否识别出有意义的协变量?是否进行了模拟以及模拟是否对产品说明书产生了影响?FDA最终是否认可这些分析?目前,FDA定量药理部门正在借鉴癌症领域模板的标准化格式,推动非癌症领域审评报告的进一步规范化,但这一过程仍需审评员主动收集和整理信息。
另一种则是癌症领域长期使用并持续更新的“审评辅助工具”(Assessment Aid)模板。这是一个更早的集成式审评模板,其特点是审评报告结构清晰,通常包含独立的临床药理学审评章节。该模板同样将临床、统计、临床药理、非临床等多部门内容整合成综合报告,化学、生产和控制(CMC)部分也保持独立,但会在新药临床试验申请(IND)阶段主动提供给申请人,要求申请人按照FDA预设的格式填写相关内容,包括数据总结和自身观点。在最终审评报告中,FDA的意见会以高亮或阴影标注,而申请人的陈述则保持普通文本,并附有声明澄清仅FDA标注部分代表官方意见。这种模式将大量的数据整理与初步总结工作转移给了申请人,使FDA审评员能更专注于科学判断,极大缓解了因肿瘤药物申请数量庞大带来的审评压力,显著提高了审评效率。
02
定量药理审评的核心问题与案例分析
无论是哪种模板,定量药理审评都聚焦于几个根本性问题。首先是通过群体药代动力学(PopPK)和暴露-效应(E-R)分析,评估剂量选择的合理性及其对说明书的影响。审评员会审查PopPK分析是否找到了有意义的协变量,相关的模拟是否支持剂量推荐,并最终判断这些分析是否足以影响说明书中的药代动力学章节。报告会以标准化表格呈现关键参数、模型诊断图和结论,这些内容均源自申请人提交的完整报告,由审评员提炼而成。
一个关键案例是药物帕罗培特立帕肽(Palopegteriparatide,一种甲状旁腺激素类似物)。该药物在2023年因故未能获批,其中涉及定量系统药理学(QSP)模型应用的争议。申请人使用QSP模型试图证明其注射笔存在的剂量输出变异(即实际给药剂量与目标剂量之间存在重叠与波动)不会影响药物的安全性与有效性。然而,FDA审评团队并未接受这一论证。原因之一在于,申请人最初在提交材料中将该QSP模型定位为“支持性工具”,明确表示不用于关键决策或支持说明书。当后续试图用此模型反驳一个关乎批准与否的关键缺陷(即剂量传递不精确)时,FDA援引申请人自身的定位,认为其不足以支撑如此关键的决策。此外,审评报告也指出该模型本身的局限性,例如其建立所基于的药代动力学/药效学(PK/PD)数据来自固定剂量研究,与拟议的最高剂量水平存在差异,且未包含对目标适应症的虚拟人群(Virtual Population)分析,因此其可靠性不足。
03
复杂模型与AI模型的可信度评估框架
针对QSP、人工智能/机器学习(AI/ML)等日益复杂的模型,FDA正在采纳一套标准化的可信度评估框架。该框架源于FDA定量药理团队于2020年发表在CPT: Pharmacometrics & Systems Pharmacology 上的一篇论文,后被正式纳入FDA药品评价与研究中心(CDER)于2025年发布的AI赋能药物研发指南中。
该框架的核心是通过一个二维评估矩阵来决定模型风险等级。第一个维度是“模型在决策中的影响权重”,即模型结果是用于设计实验(支持性),还是直接替代实验或作为关键决策依据(决定性)。第二个维度是“基于模型决策的后果严重性”,即若模型出错,导致的临床或监管风险高低。根据这两个维度的评估结果,将模型风险划分为从低到高的不同等级,并据此决定验证该模型所需证据的严格程度。
在帕罗培特立帕肽的审评中,这一框架得到了具体应用。FDA的审评报告正是从“模型影响力”(申请人自评为“支持性”工具)和“决策后果”两个维度进行了评估。审评报告进一步指出,该模型基于固定剂量数据构建,未能覆盖滴定治疗中的最坏场景(如连续低剂量后切换至高剂量),且缺乏虚拟人群分析,从而未采纳其论证。此举表明,源于2020年论文的风险评估矩阵,已直接应用于QSP模型的审评,并为后续AI等更复杂模型的评估奠定了基础。
04
人工智能模型的审评框架与发展溯源
FDA对AI模型的审评框架延续了QSP等复杂模型的评估逻辑。2025年发布的AI指南草案明确提出七步信度评估流程:定义问题与使用情境、评估模型风险、制定验证计划、执行验证、文档化结果并判定适用性。其核心工具“风险矩阵”直接引用自2020年CPT论文,通过模型影响力与决策后果的交叉定位确定验证强度。
AI在FDA药物审评中的探索与应用,有着清晰的内部发展脉络。据王亚宁博士介绍,其探索始于内部的学习与准备。早在2017年左右,以王亚宁博士为首的FDA定量药理团队核心成员,包括刘琦博士、朱浩博士和刘超博士,便自发组成机器学习学习小组,利用业余时间系统学习斯坦福大学等机构的AI与机器学习课程,并深入探讨其在医药领域的应用潜力。这段早期的知识储备与实践探索,为如今FDA审评体系接纳和评估AI模型奠定了人才与知识基础。目前,FDA器械与放射健康中心(CDRH)已批准上千个AI驱动的医疗器械。而在药品审评中,涉及的AI模型多由定量药理部门牵头评估,以确保其与传统MIDD方法在科学逻辑上保持一致,并负责对外阐述相关的监管思路。
05
总结与展望
总结而言,FDA的定量药理审评正处于标准化与效率提升的进程中,两种审评模板并存,其中癌症领域的集成模板代表了将工作前移、提升审评效率的重要方向。随着模型引导的药物研发的深入,对于PopPK、E-R等传统模型的分析已形成标准化的审评问答模式。
而对于QSP、AI/ML等复杂模型,一个基于风险的可信度评估框架正在被确立和应用,该框架明确要求界定模型用途、评估其影响权重和错误后果,以确定其可信度水平。随着AI技术在药物研发中的应用日益增多,这套源于定量药理团队早期研究的评估框架,预计将成为未来审评中评估各类复杂模型的核心工具,确保创新技术能被科学、稳健地用于支持监管决策,最终服务于患者的用药安全与有效。
添加药学瞭望管理员
进入学术交流群
《药学瞭望》征稿邀请
01.投稿内容
征稿内容不限于:研究进展、团队科研成果、临床用药经验分享、典型病例解读、疾病诊治经验、人文故事等
02.联系人
投稿 | 学术报道 | 合作
投稿联系人:刘老师 15201320201(微信同号)
投稿邮箱:contact@siri.ntesmail.com
(来源:药学瞭望)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.