网易首页 > 网易号 > 正文 申请入驻

兼顾准确率与可解释性,DeepSEA实现抗生素耐药蛋白注释范式转变

0
分享至



传统监测抗菌耐药(AMR)常靠序列比对:有相似参考就能识别,没有就白瞎了。这种「参考驱动」的策略一方面可靠,另一方面也很脆弱——数据库里没有代表性的参考序列,就很容易把真正的耐药蛋白漏掉(假阴性)——尤其是当耐药蛋白多样性超出已知的参考范畴。

为此,巴西圣保罗大学(University of São Paulo)等的研究者训练了一个卷积神经网络(CNN)以区分抗微生物耐药性蛋白和非耐药性蛋白,将其命名为 DeepSEA。它的出发点很简单:让模型学会直接从原始氨基酸序列里识别耐药「信号」,不要一直靠找近亲。

经过研究后的 CNN 能够对九种蛋白质类别进行分类,并且能够将它们与非耐药蛋白区分开来,召回率(真阳性/相关元素)超过 0.95。

相关研究内容以「DeepSEA: an alignment-free explainable approach to annotate antimicrobial resistance proteins」为题,于 2025 年 9 月 1 日发布在《BMC Bioinformatics



论文链接:https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-025-06256-4

把「训练样本」和「非耐药样本」都摆干净

研究以 NCRD95(从 CARD、SARG、ARDB 等整合并用同源搜索扩展的数据库)做为抗性蛋白的主训练源,并限制相似度为 95% 的版本来平衡代表性与重复性

非耐药类(NonR)则从SwissProt的经人工审校子集里筛出约 191,535 个细菌蛋白,并用 CD-HIT 限制相似度,最终从中随机抽取与训练集无明显比对的约 4600 条样例作为 NonR,以避免类内不均衡导致模型学偏。

整个数据预处理对比对阈值、类别累积曲线与子类剔除都做了细致控制,目的是把「训练集的偏见」降到最低。



图 1:保留测试集上的分类报告。

DeepSEA 在多类耐药注释任务上表现非常亮眼,基于深度学习的方式在总体召回(recall)在文章中报告均显著高于传统基于比对的方法(recall > 0.95),也就是说它能把更多真实的耐药蛋白「拽出来」而不是漏过去。

RGI与 AMRFinderPlus 在检测对糖肽类(glycopeptides)耐药蛋白时分别把 88% 和 79% 的这类蛋白误判为「非耐药」,而 DeepSEA 在同类任务中仅错判 8 个 β-内酰胺耐药蛋白为非耐药,这直接说明了 DeepSEA 在减少假阴性方面的优势。与复杂、预训练巨模型 ESM2 的比较显示,两者性能相当,但 DeepSEA 的架构更轻、可解释性更好。



图 2:CNN 类集群。

在对外部数据库 NDARO 的拓展验证中,DeepSEA 也表现稳健:NDARO 中的 5959 条耐药蛋白中 98% 被 DeepSEA 正确分类;对于那些不对齐(no-hit)的 233 条蛋白,DeepSEA 只错判了 42 条。研究者据此判断:只要训练集中包含该耐药「类」的示例,模型就能较好地泛化到序列相似度低的样本上。

把 CNN 的「黑盒」掰开看内部火花

为了便于理解模型的内部表征,研究还把全局平均池化层的向量做 t-SNE 降维,并在 holdout 集中呈现出按功能类别聚簇的清晰图景,这既是模型「学到类间差异」的证据,也为生物学家提供了探索新子类的线索。

DeepSEA 的直接用法很明确:在元基因组或未注释基因组的注释流程中,遇到「无比对」的蛋白序列时,传统工具常判 「非耐药」,但 DeepSEA 可以补上一把火,把那些结构/功能上虽与参考不同但却能导致耐药性的蛋白识别出来。



图 3:CNN 模型可解释性。

研究者建议将 DeepSEA 用作「再注释」(reannotation)工具,或者作为注释流水线里对比对方法的补充,从而降低漏报率。代码与工具已开源放在 GitHub,方便整合到现有管道。

当然,DeepSEA 也有其局限性:如果训练集中根本没有某个耐药子类的代表,模型仍难以识别;非耐药类(NonR)内部信息极其杂乱,会导致对该类的精确率下降;模型可解释性虽然做了较多工作,但并不能替代结构生物学或功能实验的最终判定。

结论

扼要地说,DeepSEA 提供了一个不依赖严格序列比对、既能高召回又便于解释的 AMR 蛋白注释方案。它在减少假阴性上尤其有效,对低相似度样本也能较好泛化;同时,它也将可解释性做成了工程化的输出,方便生物学家把「AI 的判断」映射回已知的功能域或活性位点。

它不是想取代比对工具,而是把注释生态从「只看相似度」扩展为「相似度+表征学习+可解释性」的混合范式。若把 DeepSEA 同现有注释链条并用,短期内能显著提高耐药蛋白的检出率;长期来看,把它和结构/功能实验联动,能把「预测的可信度」再往上推一档。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
在长沙,开始担心失业了。

在长沙,开始担心失业了。

文雅笔墨
2025-11-19 15:58:46
美股三大指数再次转涨

美股三大指数再次转涨

财联社
2025-11-20 02:16:04
被央视怒批、摇头晃脑、德不配位,难怪阅兵从不邀请“流量”明星

被央视怒批、摇头晃脑、德不配位,难怪阅兵从不邀请“流量”明星

书雁飞史oh
2025-09-12 16:09:35
不装了!婚变传闻仅10天,31岁章泽天高调官宣喜讯,终于等到这天

不装了!婚变传闻仅10天,31岁章泽天高调官宣喜讯,终于等到这天

说历史的老牢
2025-11-19 14:26:15
演员张艺洋已执行死刑!中国娱乐圈首例,倪大红、李雪健被牵连

演员张艺洋已执行死刑!中国娱乐圈首例,倪大红、李雪健被牵连

阿纂看事
2025-07-25 17:12:19
美预言家朱迪再爆猛料:美日中命运已定,此岛将首遭灾

美预言家朱迪再爆猛料:美日中命运已定,此岛将首遭灾

心灵短笛
2025-11-14 09:28:10
湖南检察机关对王汉青(正厅级)、唐克俭(副厅级)提起公诉

湖南检察机关对王汉青(正厅级)、唐克俭(副厅级)提起公诉

鲁中晨报
2025-11-17 18:45:04
欧豪一家三口这画面,谁看了不迷糊啊!

欧豪一家三口这画面,谁看了不迷糊啊!

老吴教育课堂
2025-11-19 12:00:49
要被逮捕了?郑丽文刚到新北,第二个柯文哲出现,民进党赶尽杀绝

要被逮捕了?郑丽文刚到新北,第二个柯文哲出现,民进党赶尽杀绝

沧海旅行家
2025-11-19 16:55:29
山东人的体质!1米95张展硕的家庭:父亲1米85,母亲1米75

山东人的体质!1米95张展硕的家庭:父亲1米85,母亲1米75

史行途
2025-11-19 18:22:55
心理学上有个词叫:土拨鼠之日效应(千万不要在家待太久,否则你会变傻)

心理学上有个词叫:土拨鼠之日效应(千万不要在家待太久,否则你会变傻)

德鲁克博雅管理
2025-11-13 17:10:14
如果中国与欧美全面脱钩会怎样?基于数据的深度分析,结果让人触目惊心!

如果中国与欧美全面脱钩会怎样?基于数据的深度分析,结果让人触目惊心!

V记录号
2025-11-19 09:07:34
一明星创立的火锅店下月将关广州门店!详解明星餐饮退潮背后

一明星创立的火锅店下月将关广州门店!详解明星餐饮退潮背后

南方都市报
2025-11-19 18:14:07
遇到十指全是簸箕的人,千万远离!老道长:这种命格普通人受不了

遇到十指全是簸箕的人,千万远离!老道长:这种命格普通人受不了

普陀动物世界
2025-11-17 13:39:08
国际油价,突然直线跳水!

国际油价,突然直线跳水!

证券时报
2025-11-19 22:03:03
吉林省张家林涉嫌严重违纪违法,主动投案!

吉林省张家林涉嫌严重违纪违法,主动投案!

橹讯
2025-11-19 21:18:55
中国证监会,重磅发声!

中国证监会,重磅发声!

中国基金报
2025-11-19 23:28:30
“爱泼斯坦案”已完全失控,形势对特朗普极为不利

“爱泼斯坦案”已完全失控,形势对特朗普极为不利

健身狂人
2025-11-20 01:12:46
累计三任书记落马 · 山东潍坊

累计三任书记落马 · 山东潍坊

正维万象
2025-11-18 22:12:03
女房东收租晕倒,我送她去医院,垫付6.2万,出院后房东:钱我不还你

女房东收租晕倒,我送她去医院,垫付6.2万,出院后房东:钱我不还你

雅俗共赏1
2025-11-19 18:26:30
2025-11-20 06:32:49
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1156文章数 219关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

日方要求解释为何未告知磋商后会有媒体拍摄 中方回应

头条要闻

日方要求解释为何未告知磋商后会有媒体拍摄 中方回应

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

史林子出轨对方前妻放锤!

财经要闻

重磅!中金公司拟收购东兴与信达证券

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

手机
健康
数码
时尚
公开课

手机要闻

OPPO Find X9系列海外卖爆!销量接近上代2倍

警惕超声报告这六大"坑"

数码要闻

猫头鹰黑化版散热器风扇来袭

辛芷蕾的炸裂10分钟,让人大受震撼

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版