编者按:模型化方法已成为早期新药临床试验的主要数据分析方法,甚至是剂量选择的标准化方法。因此,建模与模拟在药物研发决策中必可少。但是,国内合格的定量药理学家屈指可数,年青的同行们在建模过程中,面临诸多挑战。在2025年第11届定量药理学与新药评价会议(ISQP)上,上海中医药大学郑青山教授在主题报告中,阐述了模型评价的系统化方法及实践难题,通过典型案例,揭示了模型评价中的深层次问题。《药学瞭望》就报告的相关内容,与他深度对话。
《药学瞭望》:您的选题宗旨是什么,事先有何考虑?
郑青山教授:业内知道,FDA新指南认为,PK-PD模型化分析是早期试验的主要设计方法和数据分析方法,也是剂量优选的标准化方法,否则结果可能不被接受。而且,不再提及基于概率的方法,改用剂量-效应关系,或者血药暴露-效应关系(E-R)分析。因为血药浓度比剂量要敏感得多,PK-PD的模型化分析,在小样本量下就可评价有效性和安全性,加上多个试验可合并或滚动分析,以及桥接和外推等手段,使得定量药理学成为极为强大的工具。
相对来说,定量药理学是个小众学科,当普及性不够时,作为一个先行者,就会鼓动更多的同行去学习和使用。到了现阶段,从业人员很多,出现了新问题。例如,有的同行,可能是缺少经验,简单化或乱做一气,没有发挥模型化方法应有的作用,甚至建模数据是选择性的,而不是FDA要求的“全部数据”。有的申办方也有问题,在研究时间和预算上,提出一些不切实际的要求,让人应付差事,甚至用R代码跑一个单因素E-R回归图,然后下结论:没有暴露-效应关系,用探索性结果替代研究结论。国外对此评价十分负面,一般行业内流传,定量药理学是生物统计学的“12倍时间量”。作为定量药理学发展的亲历者,不知道为什么,总有一种责任感,我最近的报告都是在讲存在问题,总不能误入歧途吧,那样的话,对学科发展不利,对国家新药研发也是有害的。
《药学瞭望》:为什么报告一开始就给定量药理学做了一个理念定位:“模型引导,做多求少(Model-Guided More for Less)”,有何依据?
郑青山教授:定量药理学是发展中的年轻学科,国际指南尚在起草阶段,对于行业以外的人,难以用一两句话,阐明其科学内涵,主要是说不清。但有一点是肯定的,定量药理学手段多样,灵敏,能够利用多源数据建模,一旦成功,通过计算机模拟,能够洞悉数据背后的规律,可以回答诸多疑问,而不是开展额外试验。例如,通过血药浓度与心电图QT间期(QTc)的建模分析,在很小的样本量下,甚至作为首次人体试验的加载研究,就可以判断结果,而不必开展昂贵的完全QTc延长试验(TQT)。
王亚宁博士曾是FDA定量药理学部的部长,我记得他曾说过,在整个FDA监管体系中,审评员遇到证据缺失的第一反应是,增加试验!只有定量药理学部门,其理念是多建模,少做试验。这就是模型引导新药研发模式,又称为MIDD,在FDA广受申办方欢迎的原因。这种理念,如何用一句话来表达,我想了很久,觉得“模型引导,做多求少”是合适的。不要忽视一句口号的作用,有一个统计学家叫Box,说了一句 “模型总是错的,但有些是有用的”,各人理解不同,产生许多误解。
《药学瞭望》:您在报告提到模型评价的5个维度,或者称为5种方法,又特别强调第1个和第5个特别重要,为什么?
郑青山教授:在模型评价上,的确需要综合的和系统的评估,有关5个维度,这里再重复一遍:一是统计学支撑,要求采用最简模型,防止过拟合;二是拟合优度,应能够解释主要变异,且残差无系统性结构异常,如伞形;三是模型稳健性,要通过Bootstrap法验证数据轻微变化或扰动时,不引起参数大幅变动;四是预测可靠性,通过可视化预测检验,评估三个预测区间的分离度和实测线位置;五是专业合理性,要求参数和结果具有可解释性,结果符合逻辑或机制,与外部数据保持一致性。
现在的问题主要出在第1和第5种方法。第1种是统计学问题,许多年青同行对统计学概念认识不深,在建模之前,对于关键变量进行暴露-效应(E-R)数据检视时,看到P>0.05,则认为,模型不成立,不能建模,无法建模,无E-R关系,如此等等,从而放弃建模,显然是不对的。数据检视是个单因素分析,P>0.05只是提示,暴露变化导致的效应变化没有统计学意义,或者说,不能解释效应变化。但是,不代表多因素建模后的结论,即便没有E-R关系的模型,同样提供重要信息。
我在报告中的第1个实例,就是一个没有E-R关系的模型(右图),结果发现,用药组0暴露者,与其他不同水平的暴露者,甚至高暴露者,疗效一致,提示无效。而右图中纳入了安慰剂人群,反而提示有试验质量问题,这是多么重要的信息!因此,模型化分析,不但能够判断药物的有效性、安全性,还能判断试验质量。一些有争议的上市药物,有一个共同特点,就是没有PK-PD建模与模拟。
![]()
左:暴露变化呈现一个水平效应,即无E-R 关系;右:暴露变化呈现两个水平效应,E-R 关系存疑,需要进一步支撑。
另外,对于某个协变量模型的参数,其相对标准误(RSE%)大于50%,表示此协变量的变化所引起的效应变化,没有呈现统计学意义,但是不一定没有专业意义,FDA认为可以通过模拟来确认。我国早期的定量药理学分三大块:药动学,药效学,再通过统计学将两者关联,而且定量药理学家就是统计学专家。所以,定量药理学工作者掌握统计学知识非常重要的。
《药学瞭望》:的确如此,那么请谈谈第5个评价方法的重要性吧。
郑青山教授:实际上,第5个方法是专业上的可解释性。先说说试验统计学的原理,在试验设计阶段,统计学人员通过随机化方式,将各种混杂因素均衡地分配到各剂量组中,当组间出现药效差异时,就是源自用药的不同(或称处理),所以随机是统计的基石。而定量药理学则不同,属于事后分析,通过建模过程扣除混杂因素,然后去发现暴露水平变化是否会引起效应随之变化,称为E-R关系。对于较弱的E-R关系,我们总是很小心,希望在临床终点以外,增加机制指标的模型,或者从动物实验,或者从文献数据获得证据,形成证据链。具有证据链的结论,就是稳健的,也是可解释的。
我报告中的第2个例子也是如此,从临床数据本身看,PK-PD模型无可挑剔,模型很好地描述了数据,而且具有明确的E-R关系,很显然,药物是有效的。但是,与同靶点药文献数据所建的模型相比,安慰剂疗效太好,用药组的净疗效太低。注意,不同试验的净疗效具有良好的可比性。由于模型结果不能被外部数据所解释,促使申办方检测了留置的安慰剂患者血样,最终发现,部分安慰剂与试验药搞混了。这种事件在早期试验,已发生多起,好在没有造成误判。可见,模型结果的可解释性,或者说建立证据链,是多少重要!
《药学瞭望》:就第2个例子的模型来说,这是一个正确模型,还是错误模型?
郑青山教授:还是回到Box那句话,“模型总是错的,但有些是有用的”。我读了他的传记,发现他的真实意图是,鼓励建模,小心误用。但是,用“对和错”去评价模型,容易让人产生误解。我上面介绍是的2个例子,都不能用对错去判断。比如,第2个例子,模型建得很好,如果直接用作决策的话,则产生误导:药效很弱,停止开发。但是,外部数据,又让这个模型提供了线索,否则将不会发现错在何处。因此,我的结论是:模型无关对错,重在提供证据。
专家简介
郑青山
上海中医药大学
博士,教授,博士生导师,上海中医药大学药物临床研究中心主任
中国药理学会定量药理学专业委员会主任委员
第3届和第5届国际定量药理学和新药评价会议的大会主席
第一届中日韩定量药理学会议(A3 Symposium)主席;9种重要期刊编委,包括中国药理学报 (英文)、中国新药杂志、DIA Global Forum、药学学报、中国药理学通报、中国临床药理学杂志、中国循证医学杂志、中国临床药理学与治疗学杂志、药物不良反应杂志
参与起草国际指南“计算机化系统在新药研究中的应用”。
??? 主要从事定量药理学和临床药理学研究,即基于模型化与模拟化手段,定量评价中药临床药效学、药动学和复方配伍的相互作用动力学。已发表论文200余篇,SCI论文50余篇,单篇最高引用超过490次;省部级科技进步二等奖2项。与孙瑞元教授所主编的大型定量药理学计算软件(DAS),用户发表应用论文引用此软件已达16400多次。主持过国家和省部级课题多项。
添加药学瞭望管理员
进入学术交流群
《药学瞭望》征稿邀请
01.投稿内容
征稿内容不限于:研究进展、团队科研成果、临床用药经验分享、典型病例解读、疾病诊治经验、人文故事等
02.联系人
投稿 | 学术报道 | 合作
投稿联系人:刘老师 15201320201(微信同号)
投稿邮箱:contact@siri.ntesmail.com
(来源:药学瞭望)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.