网易首页 > 网易号 > 正文 申请入驻

兼顾准确率与可解释性,DeepSEA实现抗生素耐药蛋白注释范式转变

0
分享至



传统监测抗菌耐药(AMR)常靠序列比对:有相似参考就能识别,没有就白瞎了。这种「参考驱动」的策略一方面可靠,另一方面也很脆弱——数据库里没有代表性的参考序列,就很容易把真正的耐药蛋白漏掉(假阴性)——尤其是当耐药蛋白多样性超出已知的参考范畴。

为此,巴西圣保罗大学(University of São Paulo)等的研究者训练了一个卷积神经网络(CNN)以区分抗微生物耐药性蛋白和非耐药性蛋白,将其命名为 DeepSEA。它的出发点很简单:让模型学会直接从原始氨基酸序列里识别耐药「信号」,不要一直靠找近亲。

经过研究后的 CNN 能够对九种蛋白质类别进行分类,并且能够将它们与非耐药蛋白区分开来,召回率(真阳性/相关元素)超过 0.95。

相关研究内容以「DeepSEA: an alignment-free explainable approach to annotate antimicrobial resistance proteins」为题,于 2025 年 9 月 1 日发布在《BMC Bioinformatics



论文链接:https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-025-06256-4

把「训练样本」和「非耐药样本」都摆干净

研究以 NCRD95(从 CARD、SARG、ARDB 等整合并用同源搜索扩展的数据库)做为抗性蛋白的主训练源,并限制相似度为 95% 的版本来平衡代表性与重复性

非耐药类(NonR)则从SwissProt的经人工审校子集里筛出约 191,535 个细菌蛋白,并用 CD-HIT 限制相似度,最终从中随机抽取与训练集无明显比对的约 4600 条样例作为 NonR,以避免类内不均衡导致模型学偏。

整个数据预处理对比对阈值、类别累积曲线与子类剔除都做了细致控制,目的是把「训练集的偏见」降到最低。



图 1:保留测试集上的分类报告。

DeepSEA 在多类耐药注释任务上表现非常亮眼,基于深度学习的方式在总体召回(recall)在文章中报告均显著高于传统基于比对的方法(recall > 0.95),也就是说它能把更多真实的耐药蛋白「拽出来」而不是漏过去。

RGI与 AMRFinderPlus 在检测对糖肽类(glycopeptides)耐药蛋白时分别把 88% 和 79% 的这类蛋白误判为「非耐药」,而 DeepSEA 在同类任务中仅错判 8 个 β-内酰胺耐药蛋白为非耐药,这直接说明了 DeepSEA 在减少假阴性方面的优势。与复杂、预训练巨模型 ESM2 的比较显示,两者性能相当,但 DeepSEA 的架构更轻、可解释性更好。



图 2:CNN 类集群。

在对外部数据库 NDARO 的拓展验证中,DeepSEA 也表现稳健:NDARO 中的 5959 条耐药蛋白中 98% 被 DeepSEA 正确分类;对于那些不对齐(no-hit)的 233 条蛋白,DeepSEA 只错判了 42 条。研究者据此判断:只要训练集中包含该耐药「类」的示例,模型就能较好地泛化到序列相似度低的样本上。

把 CNN 的「黑盒」掰开看内部火花

为了便于理解模型的内部表征,研究还把全局平均池化层的向量做 t-SNE 降维,并在 holdout 集中呈现出按功能类别聚簇的清晰图景,这既是模型「学到类间差异」的证据,也为生物学家提供了探索新子类的线索。

DeepSEA 的直接用法很明确:在元基因组或未注释基因组的注释流程中,遇到「无比对」的蛋白序列时,传统工具常判 「非耐药」,但 DeepSEA 可以补上一把火,把那些结构/功能上虽与参考不同但却能导致耐药性的蛋白识别出来。



图 3:CNN 模型可解释性。

研究者建议将 DeepSEA 用作「再注释」(reannotation)工具,或者作为注释流水线里对比对方法的补充,从而降低漏报率。代码与工具已开源放在 GitHub,方便整合到现有管道。

当然,DeepSEA 也有其局限性:如果训练集中根本没有某个耐药子类的代表,模型仍难以识别;非耐药类(NonR)内部信息极其杂乱,会导致对该类的精确率下降;模型可解释性虽然做了较多工作,但并不能替代结构生物学或功能实验的最终判定。

结论

扼要地说,DeepSEA 提供了一个不依赖严格序列比对、既能高召回又便于解释的 AMR 蛋白注释方案。它在减少假阴性上尤其有效,对低相似度样本也能较好泛化;同时,它也将可解释性做成了工程化的输出,方便生物学家把「AI 的判断」映射回已知的功能域或活性位点。

它不是想取代比对工具,而是把注释生态从「只看相似度」扩展为「相似度+表征学习+可解释性」的混合范式。若把 DeepSEA 同现有注释链条并用,短期内能显著提高耐药蛋白的检出率;长期来看,把它和结构/功能实验联动,能把「预测的可信度」再往上推一档。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
早年的宋佳和现在比起来变化好大啊,差点没认出来,很清纯

早年的宋佳和现在比起来变化好大啊,差点没认出来,很清纯

动物奇奇怪怪
2025-09-13 12:40:10
立陶宛总理施压中方恢复关系?提出一前提条件,要中方必须先满足

立陶宛总理施压中方恢复关系?提出一前提条件,要中方必须先满足

头条爆料007
2025-09-13 08:30:24
假如诺和诺德真把天津工厂连根拔起,得有多少张饭碗瞬间碎一地?

假如诺和诺德真把天津工厂连根拔起,得有多少张饭碗瞬间碎一地?

花心电影
2025-09-13 09:46:14
女童被蜜蜂蜇伤,其母亲驾车30分钟前往路程较远的大医院,最终女童不幸身亡,医生提醒

女童被蜜蜂蜇伤,其母亲驾车30分钟前往路程较远的大医院,最终女童不幸身亡,医生提醒

扬子晚报
2025-09-13 21:49:16
西贝曾申请“速冻复热辣椒炒肉菜肴及其制备方法”发明专利,因不具备创造性被驳回

西贝曾申请“速冻复热辣椒炒肉菜肴及其制备方法”发明专利,因不具备创造性被驳回

潇湘晨报
2025-09-13 17:24:23
又是抑郁症!意大利建筑师Fla去世,定居珠海改民房,交中国女友

又是抑郁症!意大利建筑师Fla去世,定居珠海改民房,交中国女友

裕丰娱间说
2025-09-13 11:08:27
全网厌恶的“海底捞讨蛋糕”事件:病态家长,能带出多没教养的娃

全网厌恶的“海底捞讨蛋糕”事件:病态家长,能带出多没教养的娃

嫹笔牂牂
2025-09-13 07:40:32
事态严重了,日本连开3枪,蔡英文已离岛,解放军通牒发往东京

事态严重了,日本连开3枪,蔡英文已离岛,解放军通牒发往东京

梁讯
2025-09-13 22:58:34
1小时爆卖230亿!李书福杭州湾库里南,一夜间血洗BBA

1小时爆卖230亿!李书福杭州湾库里南,一夜间血洗BBA

象视汽车
2025-09-14 07:00:13
1-2到0-0!曼城创14年耻辱纪录,再战曼联盼雪耻,英超165亿盛宴

1-2到0-0!曼城创14年耻辱纪录,再战曼联盼雪耻,英超165亿盛宴

侃球熊弟
2025-09-13 23:43:43
网传免签之后,杭州涌入了大量毛妹,价格只有本地的一半……

网传免签之后,杭州涌入了大量毛妹,价格只有本地的一半……

翻开历史和现实
2025-09-12 11:06:35
美国最新数据:1946至1964出生的人,占全国一半以上财富,赶上好时代比努力更容易赚钱

美国最新数据:1946至1964出生的人,占全国一半以上财富,赶上好时代比努力更容易赚钱

小萝卜丝
2025-09-13 16:25:31
英超变天!切尔西遭绝平2-2跌出前4,黑马3连胜,热刺追平阿森纳

英超变天!切尔西遭绝平2-2跌出前4,黑马3连胜,热刺追平阿森纳

我爱英超
2025-09-14 06:30:22
被央视怒批、摇头晃脑、德不配位,难怪阅兵从不邀请“流量”明星

被央视怒批、摇头晃脑、德不配位,难怪阅兵从不邀请“流量”明星

书雁飞史oh
2025-09-12 16:09:35
记者探访成都西贝:“罗永浩菜单”已上线 食客表示以为不用排队,结果还是等了

记者探访成都西贝:“罗永浩菜单”已上线 食客表示以为不用排队,结果还是等了

封面新闻
2025-09-13 17:41:20
清北扎堆,行业离崩盘不远了…

清北扎堆,行业离崩盘不远了…

快刀财经
2025-09-13 22:13:12
中央巡视组进驻后,徐昊、管亚光被查

中央巡视组进驻后,徐昊、管亚光被查

鲁中晨报
2025-09-13 22:06:03
俄乌新闻极速鲜:巴基斯坦再次援乌18万发炮弹

俄乌新闻极速鲜:巴基斯坦再次援乌18万发炮弹

史政先锋
2025-09-13 22:20:07
许家印和恒大歌舞团两个私生子的瓜!

许家印和恒大歌舞团两个私生子的瓜!

七叔东山再起
2025-09-13 21:00:31
A股:人民日报点名,证监会重拳出击!周末4大消息,下周怎么走?

A股:人民日报点名,证监会重拳出击!周末4大消息,下周怎么走?

风风顺
2025-09-14 07:24:19
2025-09-14 09:44:49
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1085文章数 218关注度
往期回顾 全部

科技要闻

L3级车型要来了!辅助驾驶迎重大利好

头条要闻

牛弹琴:特朗普很不耐烦 发了"一封致北约和世界的信"

头条要闻

牛弹琴:特朗普很不耐烦 发了"一封致北约和世界的信"

体育要闻

27年的等待结束?挪威最快下个月进世界杯

娱乐要闻

杨幂回复祝福区别对待祝绪丹引热议

财经要闻

西贝贾国龙,“错”得离谱

汽车要闻

混动狂潮 835马力V12 阿斯顿·马丁的最后浪漫

态度原创

房产
亲子
健康
家居
军事航空

房产要闻

「世界冠军×人居升阶」白鹅潭CLD封面,实力馥见人生新高度!

亲子要闻

我家的皮夹克没有漏风

内分泌科专家破解身高八大谣言

家居要闻

原木风格 温馨舒适氛围

军事要闻

多国将承认巴勒斯坦国 支持"两国方案"

无障碍浏览 进入关怀版