单细胞多组学( scMulti -omics)技术能够在同一细胞水平同时测量多种分子层面的信息 ,彻底改变了我们对细胞 状态、 功能 及其 相互作用的理解。然而,由于不同组学层面在 数据 规模、分辨率和生物学变异性 上存在显著 的差异, 使得跨 组学 整合面临挑战 。 传统计算方法往往难以在有效消除批次效应的同时保留关键的生物学异质性,进而可能削弱对重要分子关联与调控机制的解析能力。因此,如何实现兼顾跨技术可比性与生物学可解释性的多组学整合,仍是单细胞数据分析中的核心问题之一。
近日, 吉林大学人工智能学院李向涛教授 课题组在Genome Medicine杂志在线发表了题为Aligned cross-modal integration and regulatory heterogeneity characterization of single-cellmultiomicdata with deep contrastive learning的研究工作。该研究提出了一种基于对比学习的单细胞多组学整合框架scMDCF,该方法能够在保留细胞内生物异质性的前提下,对齐不同组学的表征空间,实现跨组学一致的低维表示学习。具体而言,scMDCF由跨模态对比学习模块与跨模态特征融合模块构成:前者用于协调不同类别组学数据的表示,后者进一步提取可用于下游分析的通用潜在表示,以更好地平衡多组学数据的异质性特征(图1)。
![]()
![]()
在多类单细胞多组学数据集的基准评估中, scMDCF 在聚类性能与去批次效果方面表现出较强的竞争力,并能够识别部分在其他方法中较难区分的细胞亚群。该方法在保 持同一细胞类型内部结构一致性的同时,提高了对细胞亚型差异的分辨能力,并在不同组织来源与实验条件差异带来的批次偏移下维持了较好的表征稳定性。除性能评估外,研究还展示了 scMDCF 在生物学发现方面的潜在价值。例如,在接种 BNT162b2 mRNA疫苗个体的CITE-seq数据分析中, scMDCF 识别到疫苗诱导的特定B细胞亚群,并据此探讨了相关免疫反应过程中的动态变化与可能的调控关联。在阿尔茨海默病相关数据中, scMDCF 能够从计算上占比较低的细胞群中识别小胶质细胞与内皮细胞亚群,并提出 ELF1 作为小胶质细胞中潜在的转录因子候选标志物。进一步结合验证分析 发现 ELF1可能与GTPase活性调控相关,并可能参与影响神经炎症与疾病进展的细胞过程,为后续机制研究与潜在干预靶点探索提供了 新的思路 。
![]()
综上所述, 该研究提出的 scMDCF 为单细胞多组学数据的跨 组学 对齐与异质性解析提供了一种对比学习视角的 深度学习 框架,有助于在复杂批次差异背景下获得更稳定、可比较且具有生物学信息的细胞表征。该方法未来也有望扩展应用于更广泛的多组学测序平台与疾病研究场景。
本文的通讯作者为吉林大学人工智能学院李向涛教授。吉林大学人工智能学院、北京 中关村学院程悦同学为第一作者。
原文链接:https://doi.org/10.1186/s13073-025-01586-7
制版人:十一
BioArt
Med
Plants
人才招聘
学术合作组织
(*排名不分先后)
![]()
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.