![]()
近日, 西北大学孙士生教授团队在Nature Machine Intelligence发表题为SpecGPas a transformer based model for predicting energy adaptable structural spectra of glycopeptides的研究论文。该工作面向如何精准预测完整N糖肽的结构图谱这一关键技术难题,自主研发了基于Transformer架构的深度学习模型SpecGP,实现了多种HCD碰撞能量下糖肽碎裂图谱的高精度预测,为糖蛋白质组学高通量解析与糖链结构精准鉴定提供了全新智能计算工具。
![]()
糖类是四大生物大分子之一,广泛存在于所有生物细胞的表面。因其蕴含着极其丰富的生命信息,糖类又被称为继核酸和蛋白质之后的 “ 第三条生命链 ” 。 在糖蛋白质组学研究中,科学家 通常借助串联 质谱技术来识别完整糖肽 上的糖链 结构信息 ,从而理解糖基化修饰在生命过程中扮演 的重要 角色。近年来,深度学习为 跨物种糖肽 图 谱库 建设 和质谱数据 分析软件迭代 带来了新希望,但 准确 预测 带有糖链精细 结构信息的 完整糖肽质谱图 谱 仍然非常困难。 一方面是完整糖肽不仅含有具有 线性 序列的多肽 , 还含有带有 更 复杂 分支结构的 糖链。 除了多肽 和 糖链在串联质谱 分析中 需要 不同 的 碎裂 能量 , 不同 的 糖链 结构 在 不同 碰撞能量 下也会呈现不同的 碎片离子 类别 和强度。因此,如何在同一个模型中同时描述糖肽的结构特征、识别诊断性的碎片信息,以及模拟不同能量下的谱图变化,是目前研究中亟需解决的一个关键 技术 难题 。
针对 上述 技术挑战 ,西北大学孙士生团队 构建了 碰撞能量自适应的糖肽结构图谱预测模 型 SpecGP 。 该模型基于 Transformer 架构,将完整糖肽表示为包含氨基酸和单糖节点的结构图,并通过图结构编码方式描述糖链分支等非线性信息。在碎片离子预测方面, SpecGP 引入可学习的单糖片段表示,用于建模 B/Y 离子及部分高阶碎裂诊断离子;同时将归一化碰撞能量作为模型输入,使其能够根据不同能量条件预测相应的碎片强度分布。研究结果显示, SpecGP 在多能量数据中能够 全面 反映 出 糖肽随碰撞能量变化产生的碎裂趋势,并在谱图相似度和保留时间预测 准确性 和 稳定性 方便均 表现 出色 。
![]()
SpecGP 通过 突破完整糖肽结构图谱预测的技术壁垒, 一方面有助于跨物种糖肽图谱预测及 自 适应不同 采集模式下 的 质谱 数据 ;另一方面借助学习到的糖肽碎裂规律反哺糖肽鉴定软件,实现完整糖肽同分异构体的更高精度识别 , 为糖肽结构鉴定、异构体区分和结果重打分提供了新的计算辅助策略。对于具有相同组成但结构不同的候选糖肽,模型可以生成对应的预测谱图,并通过与实验谱图的匹配程度辅助判断更可能的结构形式。研究中还引入了自监督加权训练策略,以降低训练数据中潜在错误标注对模型学习的影响。结合预测谱图和保留时间信息, SpecGP 也可用于糖肽鉴定结果的重打分,在多个样本数据集中显示出提升鉴定数量和置信度的潜力。 SpecGP 所体现的能量自适应谱图预测思路,为大规模糖肽谱图库构建、多能量采集策略优化以及糖蛋白质组学数据 高精度 解析提供了新的参考。未来,相关方法也有望与 DIA 分析、自动化结构注释和多组学研究进一步结合,推动糖基化修饰研究向更高通量、更系统化的方向发展。
![]()
西北大学 博士生王贤勇和硕士生宋蕊 为论文共同第一作者,硕士生 冯壮壮 为 共同 作者 ,孙士生教授为独立通讯作者。
论文链接:https://doi.org/10.1038/s42256-026-01246-4
开源代码:https://github.com/Sun-GlycoLab/SpecGP
制版人: 十一
学术合作组织
(*排名不分先后)
![]()
战略合作伙伴
(*排名不分先后)
![]()
![]()
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
![]()
点击主页推荐活动
关注更多最新活动!
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.