网易首页 > 网易号 > 正文 申请入驻

Adv Sci 封面论文丨伯晓晨/何松团队综述机器学习赋能药物毒性预测的前沿进展

0
分享至

药物研发过程中,毒性问题是难以逾越的障碍之一。数据显示,约30%的候选药物因毒性风险被迫终止,导致巨大研发成本浪费,也给患者安全带来隐患。传统毒性评估方法主要依赖动物实验,但由于成本高、耗时长,且动物与人类的生理差异可能导致结果不准确,这一方法存在诸多局限。人工智能 (Artificial Intelligence,AI) ,特别是机器学习 (Machine Learning,ML) 技术,为毒性预测提供了全新的解决方案。

近日,军事医学研究院伯晓晨/何松团队在国际期刊Advanced Science发表了一篇题为Machine Learning-enabled Drug-induced Toxicity Prediction的综述论文,系统总结、评价了ML技术在药物毒性预测领域的最新进展,展示了如何通过多模态数据整合与创新算法设计,重新定义药物毒性评估方法,并入选封面文章(Inside Front Cover)。这项研究是继毒理学综合数据库TOXRIC(Nucleic Acids Res 2023),变分图自编码器在药物毒性预测中的应用(Nature Machine Intelligence 2024)和基于主动学习的突变毒性预测(Commun Biol 2024)之后,也是在由伯晓晨研究员等发起的中国毒理学会人工智能毒理学专业委员会组建成立之际,团队在人工智能赋能药物毒性解析方面的又一新的成果。

ML模型能够从多种数据源中提取特征,将其转化为可用于毒性预测的数值信息。研究团队提出了一个综合框架,将毒性数据、化合物数据与多组学数据 (基因组、蛋白质组、代谢组、单细胞测序等) 整合,构建ML管道。从原始数据的预处理到模型拟合、超参数优化,再到标准化指标评估,每一步都经过严格设计,以确保预测结果的准确性和可解释性。相较于传统的毒性测试方法,这种数据驱动的ML策略极大减少了对体内实验的依赖,使毒性预测更高效、经济,并能在临床试验前识别潜在风险,加速药物开发。

研究团队深入分析了不同类型毒性的ML建模策略,将药物毒性分为四大类十个具体类别:急性与临床毒性、致癌性、器官特异性毒性(肝毒性、心脏毒性、肾毒性、呼吸毒性、神经毒性),以及细胞和分子毒性(血液毒性、线粒体毒性)。不同毒性类型的生物学机制各异,因此需采用不同的ML模型加以应对。例如,在急性毒性预测中,传统的随机森林(Random Forest, RF)模型表现优异,而在心脏毒性预测中,图卷积网络(Graph Convolutional Networks, GCN)因能有效处理复杂蛋白质交互网络数据,在评估药物对心脏电活动的影响时展现出更强的适用性。值得注意的是,ML不仅是一个强大的预测工具,还能通过可解释性算法揭示毒性机制。研究团队分析了SHAP(Shapley Additive Explanations)、LIME(Local Interpretable Model-agnostic Explanations)等技术,量化分子特征对毒性预测结果的贡献,从而帮助科学家识别导致毒性发生的关键因素,为药物研发提供更深入的机制洞察。

ML的成功离不开高质量数据库的支持。近年来,多个毒性数据库的构建为研究人员提供了宝贵的数据资源。 研究团队总结了55个数据库和12个分析工具,并根据功能将数据库分为四大类: 毒性数据库、化合物数据库、组学数据库和基准数据库。其中,Tox21和ToxCast数据库涵盖了数万种化学物质的毒性数据,为ML模型的训练提供了丰富的数据支持;PubChem和ChEMBL等数据库则专注于化学分子结构和生物活性信息,对药物建模至关重要。在工具方面,研究团队开发的TOXRIC数据库(Nucleic Acids Res 2023)已得到广泛认可,其包含多种毒性类别的数据,并提供直观的可视化分析功能。此外,ProTox-II、ToxIBTL、ADMETlab等在线工具降低了ML毒性预测的技术门槛,使非AI背景的科研人员也能便捷地开展毒性分析。

尽管机器学习 (ML) 在毒性预测中展现出巨大潜力,但仍面临四大核心挑战:毒性数据稀缺、数据质量不高、不同毒性类型所需模型的差异性以及可解释性不足。为了解决这些问题,研究团队提出了一系列前瞻性解决方案:

首先,毒性数据的稀缺是当前的主要瓶颈,尤其是在神经毒性、线粒体毒性等领域,影响模型训练效果。整合多组学数据、数据增强 (如SMILES变换、图数据增强) 、预训练模型、主动学习优化数据采样、元学习提升小样本适应能力,以及联邦学习 (Federated Learning,FL) 实现跨机构数据共享等方法可提高数据量,增强模型的泛化能力和预测准确性。

其次,高质量数据的稀缺和整合多源数据集的挑战限制了 ML 的应用。采用数据清理、质量控制、全球数据格式的标准化、FL、多模态ML、迁移学习 (Transfer Learning,TL) 、零样本学习 (Zero-shot Learning,ZSL) 和集合方法等关键策略,可以有效提升数据质量和整合多源数据的能力,进一步提高预测的准确性和可靠性。

第三,不同毒性类型的机制各异,例如急性毒性与器官特异性毒性,需针对不同类型定制特定的ML模型。深度学习 (Deep learning,DL) 技术,如图神经网络 (Graph Neural Networks,GNN) 和Transformer,可捕获更复杂的非线性关系,同时建立标准化基准数据库 (如TOXRIC、TDC、MoleculeNet) 能够进一步提升模型可比性。

最后,ML模型的“黑箱”特性使其决策过程难以完全理解,影响其在临床和监管层面的应用。可解释性算法的引入,如SHAP和LIME等,以及知识图谱等新兴技术,能有效提升ML模型的透明度,使其更易被临床和监管机构接受。

从预测药物毒性到揭示其机制,ML正重塑药物研发的未来。尽管仍有挑战,但这项技术的前景广阔。随着数据、算法和工具的不断优化,ML有望助力更安全、更高效的药物开发,推动精准医学和个性化治疗的发展。天津大学博士生白长森、武连莲为本文共同第一作者,军事医学研究院伯晓晨研究员、何松副研究员、曹洋副研究员为共同通讯作者,李睿江博士也为本研究做出了重要贡献。

原文链接:http://doi.org/10.1002/advs.202413405

伯晓晨研究员/何松副研究员课题组一直致力于利用生物医学大数据与人工智能的多种计算模型研究癌症等复杂疾病的致病机理和药物治疗方案,在Nature、Nature Biotechnology、Nature Microbiology、Molecular Cell、Nature Machine Intelligence、Nucleic Acids Research、Genome Biology和Advanced Science等杂志发表多篇论文。

课题组长期招收硕士、博士研究生及博士后,欢迎感兴趣的同学加入或来函咨询。

简历投递( 有意者请将个人简历等材料发至):

https://jinshuju.net/f/ZqXwZt扫描二维码投递简历

制版人:十一

BioArt

Med

Plants

人才招聘

会议资讯

BioART战略合作伙伴

(*排名不分先后)

BioART友情合作伙伴

(*排名不分先后)

转载须知

【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
故宫每年用60吨猪血镇邪?最新回应来了

故宫每年用60吨猪血镇邪?最新回应来了

蓬勃新闻
2026-04-19 13:07:14
2026年电费新规出炉,7月1日执行,6大调整,每家每户都要了解

2026年电费新规出炉,7月1日执行,6大调整,每家每户都要了解

小谈食刻美食
2026-04-19 08:31:32
女生主动起来有多黏人?网友:这些女的太开放了

女生主动起来有多黏人?网友:这些女的太开放了

带你感受人间冷暖
2026-01-27 00:20:06
民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

李橑在北漂
2026-04-02 10:22:26
谁懂啊!别克新款世纪CENTURY,把中式山水美学焊在MPV上

谁懂啊!别克新款世纪CENTURY,把中式山水美学焊在MPV上

沙雕小琳琳
2026-04-20 07:57:54
曼城2-1阿森纳,赛后评分:不是哈兰德第一,曼城10号第一

曼城2-1阿森纳,赛后评分:不是哈兰德第一,曼城10号第一

侧身凌空斩
2026-04-20 01:26:44
广东最新消息!徐杰深夜发声,新大外参加婚礼,焦泊乔遭弃用

广东最新消息!徐杰深夜发声,新大外参加婚礼,焦泊乔遭弃用

多特体育说
2026-04-19 22:56:40
黄岩岛已露出大片陆地,如填海将变成我国超级大岛,可移民20万人

黄岩岛已露出大片陆地,如填海将变成我国超级大岛,可移民20万人

共工之锚
2026-04-19 22:07:48
遭公开控诉双面人后,王阳被曝大瓜,才发现蒋欣当年决策有多高明

遭公开控诉双面人后,王阳被曝大瓜,才发现蒋欣当年决策有多高明

阿裤趣闻君
2026-04-17 23:11:38
73场造13球 荷兰新带刀后卫已成曼城今夏重点引援目标 3豪门来抢

73场造13球 荷兰新带刀后卫已成曼城今夏重点引援目标 3豪门来抢

零度眼看球
2026-04-20 07:30:58
陈忠和:69岁不显老,与女儿来往不多,他为大龄儿子的婚事操心

陈忠和:69岁不显老,与女儿来往不多,他为大龄儿子的婚事操心

细品名人
2026-04-18 07:21:48
斯嘉丽·约翰逊:千禧年好莱坞的"合法羞辱"

斯嘉丽·约翰逊:千禧年好莱坞的"合法羞辱"

影视情报室
2026-04-19 03:11:14
笑麻!女子吐槽花1年装修的新中式都说像法庭,我却笑死在评论区

笑麻!女子吐槽花1年装修的新中式都说像法庭,我却笑死在评论区

另子维爱读史
2026-04-17 17:36:52
徐明联手本拉登家族,400亿硬刚中石油,帝国崩塌

徐明联手本拉登家族,400亿硬刚中石油,帝国崩塌

圆梦的小老头
2026-04-17 23:52:41
黄国昌与郑丽文谈妥,新北大局已定;连胜文出手,挺蓝最美发言人

黄国昌与郑丽文谈妥,新北大局已定;连胜文出手,挺蓝最美发言人

娱乐圈的笔娱君
2026-04-19 15:59:07
远嫁中国8年回伊朗娘家,突然发现自己已经成为了当地富婆!

远嫁中国8年回伊朗娘家,突然发现自己已经成为了当地富婆!

老特有话说
2026-04-17 17:10:53
红果 “拔管” 引爆短剧圈:90%公司将出局,迟到的行业大洗牌?

红果 “拔管” 引爆短剧圈:90%公司将出局,迟到的行业大洗牌?

老特有话说
2026-03-09 15:16:53
哈里斯:美国人不想打伊朗,特朗普意图“转移焦点”

哈里斯:美国人不想打伊朗,特朗普意图“转移焦点”

界面新闻
2026-04-19 14:59:22
斯诺克世锦赛10强赛:5人晋级,中国2人出局

斯诺克世锦赛10强赛:5人晋级,中国2人出局

铿锵格斗
2026-04-20 06:00:53
黑粉攻击何润东风波升级!博主怒撕:蹭热度该适可而止,又老又丑

黑粉攻击何润东风波升级!博主怒撕:蹭热度该适可而止,又老又丑

小徐讲八卦
2026-04-19 15:19:03
2026-04-20 08:27:00
BioArtMED
BioArtMED
BioArt旗下科普媒体
4744文章数 2468关注度
往期回顾 全部

科技要闻

50分26秒破人类纪录!300台机器人狂飙半马

头条要闻

特朗普:美伊20日将举行谈判 再不接受协议就轰炸伊朗

头条要闻

特朗普:美伊20日将举行谈判 再不接受协议就轰炸伊朗

体育要闻

湖人1比0火箭:老詹比乌度卡像教练

娱乐要闻

何润东涨粉百万!内娱隔空掀桌第一人

财经要闻

华谊兄弟,8年亏光85亿

汽车要闻

29分钟大定破万 极氪8X为什么这么多人买?

态度原创

旅游
艺术
时尚
健康
军事航空

旅游要闻

赏花季来临 一起去全国各地感受春日美好→

艺术要闻

蒲华写水仙,清健妩媚

装修“精神角落”,就是这么上瘾

干细胞抗衰4大误区,90%的人都中招

军事要闻

特朗普:美舰向伊朗货船开火炸出个洞

无障碍浏览 进入关怀版