网易首页 > 网易号 > 正文 申请入驻

Adv Sci 封面论文丨伯晓晨/何松团队综述机器学习赋能药物毒性预测的前沿进展

0
分享至

药物研发过程中,毒性问题是难以逾越的障碍之一。数据显示,约30%的候选药物因毒性风险被迫终止,导致巨大研发成本浪费,也给患者安全带来隐患。传统毒性评估方法主要依赖动物实验,但由于成本高、耗时长,且动物与人类的生理差异可能导致结果不准确,这一方法存在诸多局限。人工智能 (Artificial Intelligence,AI) ,特别是机器学习 (Machine Learning,ML) 技术,为毒性预测提供了全新的解决方案。

近日,军事医学研究院伯晓晨/何松团队在国际期刊Advanced Science发表了一篇题为Machine Learning-enabled Drug-induced Toxicity Prediction的综述论文,系统总结、评价了ML技术在药物毒性预测领域的最新进展,展示了如何通过多模态数据整合与创新算法设计,重新定义药物毒性评估方法,并入选封面文章(Inside Front Cover)。这项研究是继毒理学综合数据库TOXRIC(Nucleic Acids Res 2023),变分图自编码器在药物毒性预测中的应用(Nature Machine Intelligence 2024)和基于主动学习的突变毒性预测(Commun Biol 2024)之后,也是在由伯晓晨研究员等发起的中国毒理学会人工智能毒理学专业委员会组建成立之际,团队在人工智能赋能药物毒性解析方面的又一新的成果。

ML模型能够从多种数据源中提取特征,将其转化为可用于毒性预测的数值信息。研究团队提出了一个综合框架,将毒性数据、化合物数据与多组学数据 (基因组、蛋白质组、代谢组、单细胞测序等) 整合,构建ML管道。从原始数据的预处理到模型拟合、超参数优化,再到标准化指标评估,每一步都经过严格设计,以确保预测结果的准确性和可解释性。相较于传统的毒性测试方法,这种数据驱动的ML策略极大减少了对体内实验的依赖,使毒性预测更高效、经济,并能在临床试验前识别潜在风险,加速药物开发。

研究团队深入分析了不同类型毒性的ML建模策略,将药物毒性分为四大类十个具体类别:急性与临床毒性、致癌性、器官特异性毒性(肝毒性、心脏毒性、肾毒性、呼吸毒性、神经毒性),以及细胞和分子毒性(血液毒性、线粒体毒性)。不同毒性类型的生物学机制各异,因此需采用不同的ML模型加以应对。例如,在急性毒性预测中,传统的随机森林(Random Forest, RF)模型表现优异,而在心脏毒性预测中,图卷积网络(Graph Convolutional Networks, GCN)因能有效处理复杂蛋白质交互网络数据,在评估药物对心脏电活动的影响时展现出更强的适用性。值得注意的是,ML不仅是一个强大的预测工具,还能通过可解释性算法揭示毒性机制。研究团队分析了SHAP(Shapley Additive Explanations)、LIME(Local Interpretable Model-agnostic Explanations)等技术,量化分子特征对毒性预测结果的贡献,从而帮助科学家识别导致毒性发生的关键因素,为药物研发提供更深入的机制洞察。

ML的成功离不开高质量数据库的支持。近年来,多个毒性数据库的构建为研究人员提供了宝贵的数据资源。 研究团队总结了55个数据库和12个分析工具,并根据功能将数据库分为四大类: 毒性数据库、化合物数据库、组学数据库和基准数据库。其中,Tox21和ToxCast数据库涵盖了数万种化学物质的毒性数据,为ML模型的训练提供了丰富的数据支持;PubChem和ChEMBL等数据库则专注于化学分子结构和生物活性信息,对药物建模至关重要。在工具方面,研究团队开发的TOXRIC数据库(Nucleic Acids Res 2023)已得到广泛认可,其包含多种毒性类别的数据,并提供直观的可视化分析功能。此外,ProTox-II、ToxIBTL、ADMETlab等在线工具降低了ML毒性预测的技术门槛,使非AI背景的科研人员也能便捷地开展毒性分析。

尽管机器学习 (ML) 在毒性预测中展现出巨大潜力,但仍面临四大核心挑战:毒性数据稀缺、数据质量不高、不同毒性类型所需模型的差异性以及可解释性不足。为了解决这些问题,研究团队提出了一系列前瞻性解决方案:

首先,毒性数据的稀缺是当前的主要瓶颈,尤其是在神经毒性、线粒体毒性等领域,影响模型训练效果。整合多组学数据、数据增强 (如SMILES变换、图数据增强) 、预训练模型、主动学习优化数据采样、元学习提升小样本适应能力,以及联邦学习 (Federated Learning,FL) 实现跨机构数据共享等方法可提高数据量,增强模型的泛化能力和预测准确性。

其次,高质量数据的稀缺和整合多源数据集的挑战限制了 ML 的应用。采用数据清理、质量控制、全球数据格式的标准化、FL、多模态ML、迁移学习 (Transfer Learning,TL) 、零样本学习 (Zero-shot Learning,ZSL) 和集合方法等关键策略,可以有效提升数据质量和整合多源数据的能力,进一步提高预测的准确性和可靠性。

第三,不同毒性类型的机制各异,例如急性毒性与器官特异性毒性,需针对不同类型定制特定的ML模型。深度学习 (Deep learning,DL) 技术,如图神经网络 (Graph Neural Networks,GNN) 和Transformer,可捕获更复杂的非线性关系,同时建立标准化基准数据库 (如TOXRIC、TDC、MoleculeNet) 能够进一步提升模型可比性。

最后,ML模型的“黑箱”特性使其决策过程难以完全理解,影响其在临床和监管层面的应用。可解释性算法的引入,如SHAP和LIME等,以及知识图谱等新兴技术,能有效提升ML模型的透明度,使其更易被临床和监管机构接受。

从预测药物毒性到揭示其机制,ML正重塑药物研发的未来。尽管仍有挑战,但这项技术的前景广阔。随着数据、算法和工具的不断优化,ML有望助力更安全、更高效的药物开发,推动精准医学和个性化治疗的发展。天津大学博士生白长森、武连莲为本文共同第一作者,军事医学研究院伯晓晨研究员、何松副研究员、曹洋副研究员为共同通讯作者,李睿江博士也为本研究做出了重要贡献。

原文链接:http://doi.org/10.1002/advs.202413405

伯晓晨研究员/何松副研究员课题组一直致力于利用生物医学大数据与人工智能的多种计算模型研究癌症等复杂疾病的致病机理和药物治疗方案,在Nature、Nature Biotechnology、Nature Microbiology、Molecular Cell、Nature Machine Intelligence、Nucleic Acids Research、Genome Biology和Advanced Science等杂志发表多篇论文。

课题组长期招收硕士、博士研究生及博士后,欢迎感兴趣的同学加入或来函咨询。

简历投递( 有意者请将个人简历等材料发至):

https://jinshuju.net/f/ZqXwZt扫描二维码投递简历

制版人:十一

BioArt

Med

Plants

人才招聘

会议资讯

BioART战略合作伙伴

(*排名不分先后)

BioART友情合作伙伴

(*排名不分先后)

转载须知

【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
湖南开放部分高速公路应急车道,有网友称“不敢走”,交警详解:这些情况下请放心行驶

湖南开放部分高速公路应急车道,有网友称“不敢走”,交警详解:这些情况下请放心行驶

潇湘晨报
2026-02-24 22:25:41
江西交警:大广高速发生一起货车与小轿车碰撞事故,小轿车上1人死亡

江西交警:大广高速发生一起货车与小轿车碰撞事故,小轿车上1人死亡

界面新闻
2026-02-25 14:27:30
皇马再次向中国道歉!或将损失22.8亿人民币,西媒怒批:双标

皇马再次向中国道歉!或将损失22.8亿人民币,西媒怒批:双标

桃叶渡春
2026-02-24 21:38:22
默茨访华的目的很明确,德国不想遵守中国的规则,只想赚中国的钱

默茨访华的目的很明确,德国不想遵守中国的规则,只想赚中国的钱

古事寻踪记
2026-02-25 07:08:23
34岁东北姑娘拿下81岁全球首富,长的很漂亮,一年抱俩娃身价上亿

34岁东北姑娘拿下81岁全球首富,长的很漂亮,一年抱俩娃身价上亿

云舟史策
2025-09-13 07:37:04
剑指九霄!武侠片《镖人》票房破9亿!

剑指九霄!武侠片《镖人》票房破9亿!

陈意小可爱
2026-02-25 18:32:58
湖北一市生态环境局党组书记调整

湖北一市生态环境局党组书记调整

小陆搞笑日常
2026-02-25 18:08:07
喝酒后出现3个现象,说明你已不适合喝酒,再喝就是“玩命”

喝酒后出现3个现象,说明你已不适合喝酒,再喝就是“玩命”

奇妙的本草
2026-02-25 11:58:54
78岁连路都走不稳还开演唱会,全网骂声一片,她却扬言回馈粉丝

78岁连路都走不稳还开演唱会,全网骂声一片,她却扬言回馈粉丝

洲洲影视娱评
2026-01-28 12:23:18
为什么钱越来越不经用了?网友:是通缩,黄金价格越高越说明通缩

为什么钱越来越不经用了?网友:是通缩,黄金价格越高越说明通缩

带你感受人间冷暖
2026-01-12 00:10:11
美军双航母就位,突传伊朗从中方购超音速反舰导弹,这仗怎么打?

美军双航母就位,突传伊朗从中方购超音速反舰导弹,这仗怎么打?

钦点历史
2026-02-25 17:05:02
韦雪广西被偶遇,像杨幂但差远了,馒化严重,吃螺蛳粉不敢张大嘴

韦雪广西被偶遇,像杨幂但差远了,馒化严重,吃螺蛳粉不敢张大嘴

非常先生看娱乐
2026-02-25 16:59:15
美媒:中国首艘09V型核动力攻击潜艇现身渤海,搭载全新X型尾舵

美媒:中国首艘09V型核动力攻击潜艇现身渤海,搭载全新X型尾舵

百科密码
2026-02-23 16:23:49
50元纸币价值飙升至30万?快瞧瞧你家有没有这样的“宝贝”!

50元纸币价值飙升至30万?快瞧瞧你家有没有这样的“宝贝”!

小陈收藏社
2026-02-25 12:58:03
2015年,二胎政策推出,翟振武教授:中国每年将新增2000万新生儿

2015年,二胎政策推出,翟振武教授:中国每年将新增2000万新生儿

南权先生
2026-02-24 15:55:07
WTT爆大冷!世界亚军1:3被淘汰,国乒独苗逆转,张本美和单打大胜

WTT爆大冷!世界亚军1:3被淘汰,国乒独苗逆转,张本美和单打大胜

不似少年游
2026-02-25 14:36:27
一集弃!央视新剧首播差评一片,梅婷肿眼装嫩状态拉胯,真没眼看

一集弃!央视新剧首播差评一片,梅婷肿眼装嫩状态拉胯,真没眼看

银河史记
2026-02-25 18:45:54
高市早苗急了,死磕日本央行不许加息!日本经济虚假繁荣被戳破?

高市早苗急了,死磕日本央行不许加息!日本经济虚假繁荣被戳破?

王爷说图表
2026-02-25 10:39:35
杨瀚森缺席开拓者遭森林狼三杀 华子34分戈贝尔复出10+19

杨瀚森缺席开拓者遭森林狼三杀 华子34分戈贝尔复出10+19

醉卧浮生
2026-02-25 13:44:20
人生很灵的玄学:没做成的事、没留住的人,其实都是老天在护你

人生很灵的玄学:没做成的事、没留住的人,其实都是老天在护你

千秋历史
2026-02-22 19:37:18
2026-02-25 19:32:49
BioArtMED
BioArtMED
BioArt旗下科普媒体
4456文章数 2466关注度
往期回顾 全部

科技要闻

“机器人只跳舞,没什么用”

头条要闻

美官员称6个月内三国政府或被亲美政权取代 中方回应

头条要闻

美官员称6个月内三国政府或被亲美政权取代 中方回应

体育要闻

曝雄鹿计划今夏追小卡 字母哥渴望与其并肩作战

娱乐要闻

撒贝宁到沈阳跑亲戚 老婆李白模特身材

财经要闻

上海楼市放大招,地产预期别太大

汽车要闻

750km超长续航 2026款小鹏X9纯电版将于3月2日上市

态度原创

游戏
本地
家居
亲子
数码

外网神人自制健身环接入众多游戏!走路都得大出汗

本地新闻

津南好·四时总相宜

家居要闻

艺居办公 温度与效率

亲子要闻

小菲晒娃,小宝宝好漂亮,睡得很香!筱梅状态好,恭喜他们一家人

数码要闻

今年春节假期家电、数码、智能产品销售超510万台 较去年增长21.7%

无障碍浏览 进入关怀版