妊娠期用药极为普遍,>90%孕妇至少使用一种处方药或非处方药,但<10%的已上市药物拥有足够的妊娠期安全性数据,导致胎儿面临潜在的发育毒性风险。发育毒性指在受孕前、宫内或出生后暴露于毒物导致的发育异常,表现为围产期死亡、畸形、生长迟缓、功能障碍等。传统监管要求(如ICH S5(R3))依赖全面的动物试验,覆盖从交配前到出生后各阶段,但这些试验耗时、耗资。
![]()
大数据时代与减少动物试验的需求推动了人工智能(AI)替代方案的快速发展。目前,基于机器学习(ML)和深度学习(DL)的QSAR模型已广泛用于预测化学物的发育毒性。新兴策略通过整合多模态数据与系统毒理学知识,提升预测的可解释性、透明度和可靠性,以符合ICH等监管框架。
![]()
数据来源和整合
AI建模需要多模态数据整合,包括:1)体内动物实验;2)体外实验(如全胚胎培养WEC);3)多组学数据(转录组、蛋白组、表观基因组、代谢组、影像组学);4)生物标志物(基因、蛋白、代谢物等);5)胎盘转运数据(药物跨胎盘传递能力)。数据来源包括以下路径。
![]()
体内动物数据是核心基准,主要因伦理限制,孕期临床试验极少,监管机构(如FDA、EMA)要求以动物数据为主评估发育风险。此外,一些数据库如ToxRefDB与ECHA,收录符合OPPTS870.3700或OECD414标准的动物实验数据,提供NOAEL值(未观察到不良效应剂量)。还有些新型模型,如斑马鱼具备高通量、透明、发育快,基因与人类高度同源的特点。OSU/PNNLSRP数据库提供500种化学物、12类斑马鱼表型数据(从致死到特定畸形)。
体外实验可以考虑全胚胎培养(WEC),培养早期胚胎评估致畸性,但体外实验忽略了母体因素(如肝脏代谢、ADME过程),且数据规模有限。
还有些数据库可以提供多组学与生物标志物数据。如Drug Matrix & Open TG-GATEs含有大鼠短期/重复给药后的毒理基因组学与病理数据。LINCS则整合了数万种扰动剂的转录组/蛋白组数据,构建超千亿生物效应关联网络。CTD包括人工curated文献数据,关联化学物-基因-表型-疾病,支持跨组学整合。Exposome-Explorer提供环境暴露(饮食、污染物)的人体生物标志物数据。Marker DB涵盖化学、蛋白、DNA等类型的诊断/预测/暴露标志物。Marker支持药物开发的药效、安全、监测等治疗标志物。
发育毒性自然还要关注药物的胎盘转运数据。胎盘是母体与胎儿间的核心屏障,可阻挡药物/毒物(外源物)。其转运能力受两类转运蛋白调控:1)SLC转运体:介导摄取或双向转运(如滋养层细胞摄取)。2)ABC转运体:外排泵,将外源物泵出细胞。
胎盘转运这块,AI建模需要:1)转运体相互作用数据(与ABC/SLC的结合能力);2)ADME参数:蛋白结合率、溶解度、脂溶性等;3)胎盘穿透实证数据:脐血-母血药物浓度比(CM比值),直接反映胎盘屏障通透性。除了“湿实验”数据,一些数据库也可以提供支持,如Drug Bank收录药物作用机制及与转运体互作信息。VARIDT包括转运体表达/功能的调控因素(如微生物组、表观遗传、翻译后修饰)。
将不同来源的数据整合后,就可以开始建模工作。
AI方法分类
利用机器学习(ML)、深度学习(DL)等AI技术,可以在“分子-细胞-个体”多个生物层级上建立发育毒性预测模型。ML和DL各有优缺点,传统ML适合小样本高解释需求,DL适合大数据高预测需求。根据学习范式又可分为监督学习、无监督学习、半监督学习三类。监督学习是目前的主流,用于毒性分类/剂量估算,无监督/半监督学习用于机制探索和样本聚类。
基于ML与DL的QSAR模型可能大家所见所闻挺多,QSAR模型由药物化学家提出,通过化学结构特征(辅以log Kow等物化参数)预测生物活性。从传统统计方法发展为ML/DL驱动的模型,可以显著提升预测精度、泛化能力和新药发现效率。比如内分泌干扰物与雌激素受体(ER)、雄激素受体(AR)的激动/拮抗作用,已经可以用ToxCast/Tox21体外HTS数据训练分类模型对化合物进行分类,而具备雌雄激素活性的化合物本身就具备极高的生殖毒性风险。又如最新QSAR模型预测体外染色体畸变,准确率80.6%。此外,QSAR模型可以预测化合物CI(清除指数)或CM比值,评估药物/毒物穿越胎盘屏障风险。另外,对斑马鱼胚胎/幼体AC50(半数活性浓度),ML/DL分类准确率接近83%。当然,QSAR模型也有些局限性,如高质量训练数据稀缺、化学与生物多样性覆盖不足,而且发育毒性机制复杂,涉及多靶点/多通路交互。
可解释的建模揭示发育毒性潜在机制
监管机构要求计算毒理模型给出可解释预测,即阐明毒性机制。整合多模态数据与系统毒理学知识,已推动可解释模型的发展,使人工智能能够揭示化学物诱发发育毒性的复杂生物学机制。简单讲,不仅能预测结果,还要给出解释。目前这类模型包括AOP框架、基于成像的模型等。
![]()
AOP框架
美国环境保护署(EPA)提出的AOP框架通过整合机制信息促进化学物质危害评估。AOP最核心的内容在于规范化和模块化了从分子、细胞、组织、器官及至最终个体与群体水平的一系列毒性发生事件,并强调以逻辑推理性来确定这些毒性发生事件的前后关系。因为在AOP概念提出之前,毒理学研究的关注点是相对孤立的,缺乏统一性。AOP-Wiki是OECD协调的国际AOP开发工作的主要数据库,目前包含485个AOPs。
除了遵循AOP框架的实验性机制研究外,一些与发育毒性相关的虚拟AOP已通过统计和人工智能方法开发出来。例如:Cendoya等人分析了具有发育毒性终点和靶点信息的化合物数据集,确定了65个蛋白质靶点作为与发育毒性相关的潜在分子起始事件(MIEs)。Gou等人开发了Score AOP系统,该系统将体外高通量筛选生物测定作为MIEs,并结合剂量依赖性转录组学分析作为关键事件(KEs),用于预测由心血管系统功能障碍引起的发育缺陷和死亡。
在一项评估女性生殖障碍的研究中,化学物质的毒性潜力是基于三个独立深度学习模型的预测结果来评估的。这些模型旨在确定化学物质是否:1)触发过氧化物酶体增殖物激活受体γ(PPARγ)激活这一MIE;2)降低芳香化酶活性这一关键事件1(KE1);3)破坏雌二醇合成这一关键事件2(KE2)。如果某一化学物质在所有三个机制终点的预测结果均为阳性,则表明其存在导致不良生殖结局的路径,从而被预测为具有生殖毒性。尽管这项研究并不聚焦于发育毒性,但其所用策略提供了宝贵的框架,可适用于发育毒性AOP建模。
近年来,一些研究将AOP整合到深度学习框架中,以提高模型的准确性和可解释性。例如,有研究开发了一种深度神经网络(DNN)模型,利用虚拟AOP框架模拟ER激动剂的毒性路径。在构建DNN架构时,Ciallella等人将57项HTS生物测定分为五个网络层,分别对应ER通路中的关键生物学过程:作为MIE的受体结合,以及作为KE的受体二聚化、DNA结合、转录激活和细胞增殖,最终导致体内啮齿类动物子宫增重活性(uterotrophic activity)这一有害结局(AO)。这种方法能够准确预测新化合物的啮齿类动物子宫增重生物活性。
基于图像的建模
胚胎、胎儿或幼体的形态发育异常是评估化学物质发育毒性的关键指标。斑马鱼胚胎/幼体在不同发育阶段的图像是发育形态学分析的主要数据来源。卷积神经网络(CNNs)作为图像建模的主要深度学习技术,已被用于构建预测模型,以识别组织和器官的各种异常形态,助力检测药物或毒物的潜在致畸作用。
例如,Dong等人提出了一种基于深度学习的形态计量分析流程,能够识别斑马鱼幼体的8种异常表型和8种形态计量参数。对特定化学物质引起的表型变化的进一步研究表明,结构和作用机制相似的化学物质会诱导相似的表型变化。
生物标志物识别与基于生物网络的建模
当前的发育毒性研究已产生了大量生物标志物数据。能将分子水平效应与表型终点或系统水平影响关联起来的有效生物标志物,对于化学物质毒性的早期检测至关重要,同时也能提供关键的机制方面的信息。
基于ML的方法可用于分析高维数据,以揭示异质数据源(如基因和疾病)之间的细微关系,从而提高生物标志物筛选的精准性。例如,Gerbi等人探究了母体血铅水平与儿童牙本质铅水平之间的相关性,并将其用于机器学习建模。该模型以儿童牙本质中每周测量的铅水平作为生物标志物,能高精度预测母体血铅浓度,有效反映孕期母体的铅暴露情况。
生物网络是生物系统内复杂相互作用的图形化表示,其中节点代表基因、蛋白质、代谢物等生物实体,边则表示它们之间的相互关系(上图D)。这一框架有助于研究化学物质暴露在从基因、蛋白质到细胞、器官及整个生物体等不同生物层面的相关生物相互作用。AI技术的最新进展使研究人员能够利用网络中的多维信息开展各类发育毒性建模工作,从而增强预测的可解释性。例如,EDC-Predictor工具通过基于网络和机器学习的方法生成计算靶标图谱,随后用于训练机器学习模型,以将化合物归类为内分泌干扰物(EDCs)或非内分泌干扰物。Yu等人进一步利用EDC-Predictor识别出与可能受EDCs干扰的生物学通路相关的关键靶标,以及与EDCs活性相关的毒效基团。
总结
有明确证据表明,随着多模态数据可获得性的持续增长,AI正对药物诱导的发育毒性评估产生深远影响。其应用范围广泛,从不同生物层面的毒性潜力基础预测,到毒性生物标志物识别、生物网络分析等,最终旨在揭示未知的毒性机制。
尽管AI在该领域的应用已取得显著进展,但仍存在一些差距和挑战。AI驱动的发育毒性建模高度依赖于标注完善、机器可读的数据集,以及整合这些数据进行有效建模的新策略。尽管存在针对多种数据模态的公共数据库,但数据缺失和数据错误为模型开发带来了挑战。数据填补策略(如QSAR模型)有助于缓解数据缺口。然而,这些方法也可能引入不确定性,因此需要仔细验证以确保发育毒性建模的可靠性。另外,许多AI模型的“黑箱”特性使其应用复杂化,尤其是在监管场景中。目前正在探索多种策略以提高模型的透明度和可解释性,例如整合结构警示,以及通过融合生物学、化学、毒理学和药理学知识开发机制性深度神经网络(DNN)架构。
最后,AI在设计和开发更安全药物方面前景广阔,但建立强有力的监管参与至关重要,这有助于对这些新兴技术进行标准化和监督。
本文引自:Trends in Pharmacological Sciences, June 2025, Vol. 46, No. 6,doi: 10.1016/j.tips.2025.04.005
药理毒理开发1-6群已满,7群还有名额,进群的加微信,备注姓名+企业名称+专长领域。比如王**+A企业+注册或毒理。名额有限,已经在1-6群的朋友就不要跨群了。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.