网易首页 > 网易号 > 正文 申请入驻

迪安诊断携手邵逸夫医院,发表“机器学习算法预测抗结核药物耐药性”研究成果

0
分享至

(来源:迪安诊断)

转自:迪安诊断

该研究成果表明,基于15个重要单核苷酸多态性位点(SNPs)时,梯度提升分类器(GBC)模型在准确预测抗结核药物的耐药性方面表现最佳(对利福平、异烟肼、吡嗪酰胺和乙胺丁醇四种一线药物耐药性预测的准确率分别是97.28%、96.06%、94.19%和92.81%)。位于结核分枝杆菌基因组761155(rpoB_p.Ser450)和2155168(katG_p.Ser315)位置的SNPs对药物耐药性的预测贡献值排名靠前,这些位点发生突变时结核分枝杆菌倾向于对利福平和异烟肼发生耐药。

此外,在印度和以色列的独立结核分枝杆菌数据集中,最佳模型GBC对利福平和异烟肼的耐药性预测也具有很好的鲁棒性。该研究将机器学习方法整合到抗结核药物耐药性预测和耐药性相关SNPs的鉴定研究中,探索了重要SNPs对模型决策的贡献程度,使机器学习算法的过程更加透明、可解释。研究成果的发表,为迪安诊断基于AI在病原感染临床药物耐药性预测领域的应用,提供了扎实的理论依据、技术支撑和临床转化的探索方向。

研究背景

结核分枝杆菌(MTB)感染人类引起的结核病,至今仍是全球健康的重大威胁。据统计,2021年全球新增结核病病例达1060万,140万人死于与结核病相关的疾病[1],其中利福平耐药(RR)或耐多药(MDR)结核病更是让治疗雪上加霜,初治患者中耐多药/利福平耐药率为3.6%、复治患者中耐药率为18%[1]。作为全球第二大耐多药结核病报告国,中国的防控压力尤为突出[2]。

传统检测耐药性的方法依赖于缓慢的结核分枝杆菌培养,动辄需要数周。即使是Xpert等分子诊断技术,也只能针对有限的基因位点,难以覆盖更多抗生素的耐药性[3]。全基因组测序(WGS)虽能捕获结核分枝杆菌的基因突变,但目前对乙胺丁醇、吡嗪酰胺等药物的耐药性预测准确率较低,对二线药物的预测效果更是参差不齐[4,5]。

在WGS数据上应用机器学习,为揭示结核分枝杆菌耐药性的基因组机制提供了巨大的潜力。本研究团队将WGS基因数据与18种抗结核药物的药敏试验结果结合,构建了一套高效的机器学习预测框架。不同于传统方法仅依赖已知突变位点和特定的抗结核药物,这套框架能通过机器学习算法,在全基因组水平上全面地挖掘SNPs与耐药性的关联,更重要的是,研究不仅追求精准预测,更注重预测过程的透明可解释。该研究使用的源代码和数据集已在GitHub公开(https://github.com/microbial123/MTB-AMR),为全球研究者提供了共享资源。

研究方法


图1. 研究流程图

该研究使用了5739株结核分枝杆菌的WGS数据集和18种抗结核药物的药敏试验结果,通过构建所有SNPs、交集SNPs和随机抽取的SNPs的训练数据集和测试数据集,基于12种不同的机器学习算法,开发了一个抗结核药物耐药性预测和耐药相关SNPs鉴定的框架。然后,该研究比较了各种机器学习模型的性能,使用SHAP框架揭示了最佳算法中做出最终耐药预测决策的原因和方式。最后,该研究还分别在来自印度和以色列的独立数据集中应用这些模型,对利福平和异烟肼的耐药性进行验证。

研究结果

研究团队搭建了一个基于12种机器算法预测结核分枝杆菌分离株对18种抗结核药耐药表型的机器学习框架,现有结果表明,没有任何一个模型能在所有情况下都始终表现良好。团队通过精度、召回率、F1分数、auROC、auPR等多项指标,系统地评估了12种机器学习模型的耐药性预测能力(图2A)。

结果显示,梯度提升分类器(GBC)表现最优,尤其在预测利福平(RIF)耐药性时,准确率高达97.28%。对异烟肼、吡嗪酰胺和乙胺丁醇三种一线药物耐药性预测的准确率,分别是96.06%、94.19%和92.81%。装袋式分类器(BC)、自适应增强分类器(ABC)紧随其后,与GBC共同跻身前三名。

相比之下,其他方法,如gNB,LogR和SVM,具有较低或相当的准确率,范围从gNB的74.48%、LogR的96.44%到SVM的97.07%。值得关注的是,经过 “交集数据集”验证,模型的F1-score显著高于随机数据集,且6折交叉验证的稳定性优于5折交叉验证,证明其结果可靠、稳健。

SHAP解码耐药突变位点,

模型决策不再“黑箱”

光准还不够,机器学习模型的“可解释性”是落地临床的关键。研究团队通过SHAP值分析,揭开了GBC模型的“决策逻辑”。在利福平耐药性预测过程中,前三个关键的耐药突变位点分别是761155(rpoB_p.Ser450)、2155168(katG_p.Ser315)、761110(rpoB_p.Asp435),这些位点的突变会增加耐药风险(图2B);异烟肼(INH)耐药的关键突变则集中在2155168(katG_p.Ser315)等位点,与临床已知耐药机制高度吻合。

SHAP汇总图和SHAP力图,显示了重要SNPs对18种不同抗结核药物预测结果的影响。这些发现让机器学习模型从“只给结果”升级为“讲清原因”,为临床精准定位耐药基因、制定个体化治疗方案提供了理论依据。


图2. 评估机器学习算法在6折交叉验证中预测结核分枝杆菌对利福平耐药性的性能以及模型的可解释性

通过对MTB耐药相关SNPs的注释,研究团队验证了许多先前报道过的基因,包括gyrA、rpoB、embB和katG,详情见表1和图S19。值得注意的是,在表1列举的15个SNPs中,有14个在世界卫生组织(WHO)发布的《结核分枝杆菌复合群突变目录及其与耐药性的关联》(第2版)中被提及,其中12个SNPs与对至少一种抗生素的耐药性特别相关,被归类为“与耐药性相关”(Ass-w-R)或“与耐药性可能相关”(Ass-w-R-int)。


表1. MTB中潜在耐药性相关的SNPs列表


图S19. MTB对不同抗生素耐药的潜在基因

研究中的最佳模型GBC对利福平和异烟肼的耐药性预测效果,在独立数据集中得到验证

在来自印度(NCBI项目编号: PRJNA741102)和以色列(NCBI 项目编号: PRJNA957554)的独立数据集中,结核分枝杆菌对RIF、INH、EMB和PZA的耐药率和谱系分布如图S20。印度数据集中谱系1占比最多(50%),然而,在以色列数据集中谱系4最多,占分离株的41.88%(图S20B)。

在这两个独立验证数据集中,机器学习模型准确预测了RIF和INH的耐药表型,模型的性能如图3所示。GBC算法正确预测了超过90%的MTB分离株对RIF和INH的耐药性,但是模型在EMB和PZA中的耐药性预测效果不一,平均准确率分别为83.73%(印度,EMB)、67.42%(印度,PZA)、99.05%(以色列,EMB)和91.14%(以色列,PZA)。


图S20. 两个独立数据集中MTB分离株对四种一线药物的耐药表型占比


图3. 机器学习模型在独立数据集中耐药表型预测中的应用

该研究成果不仅丰富了结核分枝杆菌耐药性遗传学机制的理论体系,更为耐药结核病的精准用药提供了坚实的数据支撑。AI赋能结核病诊疗的时代已然开启。在这场对耐药菌的“精准阻击”中,迪安诊断将持续探索该技术在临床场景的规模化应用,为全球结核病防控事业注入新动能。

参考文献

[1] WHO. Global tuberculosis report 2022. World Health Organization; 2022. https://www.who.int/publications/i/item/9789240061729.

[2] WHO. Global tuberculosis report 2020. World Health Organization; 2020. https://www.who.int/publications/i/item/9789240013131.

[3] Sohn H, Aero AD, Menzies D, Behr M, Schwartzman K, Alvarez GG, Dan A, McIntosh F, Pai M, Denkinger CM. Xpert mtb/rif testing in a low tuberculosis incidence, high-resource setting: limitations in accuracy and clinical impact. Clin Infect Dis. 2014;58:970–6.

[4] Sun W, Gui X, Wu Z, Zhang Y, Yan L. Prediction of drug resistance profile of multidrug-resistant mycobacterium tuberculosis (mdr-mtb) isolates from newly diagnosed case by whole genome sequencing (wgs): A study from a high tuberculosis burden country. BMC Infect Dis. 2022;22:499.

[5] Kamolwat P, Nonghanphithak D, Chaiprasert A, Smithtikarn S, Pungrassami P, Faksri K. Diagnostic performance of whole-genome sequencing for identifying drug-resistant Tb in Thailand. Int J Tuberc Lung Dis. 2021;25:754–60.

通讯员:毛莹

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上海男篮4连胜,排名暂时升至第2 弗格36分梦回巅峰 主力保存体能

上海男篮4连胜,排名暂时升至第2 弗格36分梦回巅峰 主力保存体能

替补席看球
2026-01-23 21:28:34
德隆带娇妻度假,42岁从拳坛退役,不工作也不缺钱花,二婚娶超模

德隆带娇妻度假,42岁从拳坛退役,不工作也不缺钱花,二婚娶超模

大西体育
2026-01-23 15:59:43
唯一在世的中共一代领导人,曾任中央政治局常委,如今109岁

唯一在世的中共一代领导人,曾任中央政治局常委,如今109岁

星辰故事屋
2026-01-23 12:14:47
英特尔股价跌超16%

英特尔股价跌超16%

证券时报
2026-01-24 01:44:04
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
牢A含金量在升级!斩杀线拯救了很多中国中产,有人放弃移民计划

牢A含金量在升级!斩杀线拯救了很多中国中产,有人放弃移民计划

火山诗话
2026-01-23 07:08:08
洗米华大女儿硕士毕业,一家人拍毕业照,洗米嫂戴钻戒出镜

洗米华大女儿硕士毕业,一家人拍毕业照,洗米嫂戴钻戒出镜

素素娱乐
2026-01-23 11:07:53
嫣然天使儿童医院房东确为医美机构思妍丽创始人张毅

嫣然天使儿童医院房东确为医美机构思妍丽创始人张毅

界面新闻
2026-01-23 19:58:07
【重磅】大场机场搬迁!上海宝山区大场“十五五”规划纲要正式获批通过

【重磅】大场机场搬迁!上海宝山区大场“十五五”规划纲要正式获批通过

我爱栟茶论坛
2026-01-23 21:48:18
拒挂国旗、订单全给日韩,被停止合作封锁航线的长荣,今咎由自取

拒挂国旗、订单全给日韩,被停止合作封锁航线的长荣,今咎由自取

近史谈
2026-01-21 20:33:15
南开中学被警告!

南开中学被警告!

天津族
2026-01-24 00:41:17
三弃将爆发,球队仅留老弱病残,主场8打5仍败

三弃将爆发,球队仅留老弱病残,主场8打5仍败

五姑娘台球
2026-01-24 06:09:16
知道不好骗了,索性开始硬抢了!

知道不好骗了,索性开始硬抢了!

胖胖说他不胖
2026-01-22 16:47:14
韩媒:若韩国U23输给越南将是“大灾难”,球队需保住最后尊严

韩媒:若韩国U23输给越南将是“大灾难”,球队需保住最后尊严

懂球帝
2026-01-23 11:24:38
排水量10吨,带6个垂发!国产“微型小航母”亮相,我军急需装备

排水量10吨,带6个垂发!国产“微型小航母”亮相,我军急需装备

科普100克克
2026-01-23 17:53:49
牛鬼神蛇现原形!聂卫平去世仅一天,私生活被扒,王刚郎平被牵连

牛鬼神蛇现原形!聂卫平去世仅一天,私生活被扒,王刚郎平被牵连

春露秋霜
2026-01-16 06:27:20
不演了!贝嫂长子发文决裂,婆媳大战,剥夺姓氏,小贝7个字回应

不演了!贝嫂长子发文决裂,婆媳大战,剥夺姓氏,小贝7个字回应

艺能八卦局
2026-01-24 03:49:07
终于有人说实话了!如不出意外,今年春节会迎来6个“反常现象”

终于有人说实话了!如不出意外,今年春节会迎来6个“反常现象”

不写散文诗
2026-01-23 14:26:45
赛力斯拿下车企第一,华为赢麻了!

赛力斯拿下车企第一,华为赢麻了!

互联网品牌官
2026-01-21 18:36:41
保护自己最好的方法:所有舒服的关系,都源于对彼此没有期待

保护自己最好的方法:所有舒服的关系,都源于对彼此没有期待

杏花烟雨江南的碧园
2026-01-18 13:06:24
2026-01-24 06:44:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2057562文章数 5294关注度
往期回顾 全部

科技要闻

TikTok守住了算法"灵魂" 更握紧了"钱袋子"

头条要闻

疑在达沃斯受挫 79岁的特朗普转发超80条帖子发泄怒气

头条要闻

疑在达沃斯受挫 79岁的特朗普转发超80条帖子发泄怒气

体育要闻

杜兰特鏖战44分钟累瘫 轰36+7却致命失误

娱乐要闻

演员孙涛澄清闫学晶言论 落泪维护妻子

财经要闻

2026年,消费没有新故事?

汽车要闻

主打家庭大六座 奕境首款SUV将北京车展亮相

态度原创

亲子
本地
家居
艺术
公开课

亲子要闻

养娃四大套路 轻松教出好孩子

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

家居要闻

在家度假 160平南洋混搭宅

艺术要闻

高大上?错,刚够吃:揭秘历代画家混饭史

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版