![]()
随着单细胞多组学技术的快速发展,研究者已经能够在同一细胞中同时获取转录组、染色质可及性等多层分子信息,从而以前所未有的分辨率描绘细胞状态及其调控机制。然而,单细胞多组学数据中既包含各组学层自身携带的“私有信号”,也包含反映跨组学协同调控的“共享信号”。这两类信息彼此交织,再叠加技术噪声、批次差异以及非配对数据带来的错配问题,使多组学整合面临重要挑战。
吉林大学李向涛团队在PNAS发表研究论文Orthogonal disentanglement of single-cell multi-omics reveals private and shared drivers of tissue development and pathogenesis,提出了面向单细胞多组学分析的新方法 OmiDos。这一方法从“信号解耦”的角度出发,为复杂生物系统中基因表达与调控网络的联合解析提供了新的计算框架。
![]()
与传统方法将不同模态信息直接压缩进统一潜在空间不同,OmiDos 显式地区分并学习两类表示:一类用于刻画组学特异特征,另一类用于捕捉跨组学协调调控信息。通过这种“正交解耦”设计,模型能够在保留各组学层独特信息的同时,更准确地提取具有生物学意义的共享调控程序,从而提升多组学整合的准确性。
OmiDos 还是一个无需预先细胞信息的深度学习框架。在方法设计上,它通过正交约束实现共享信息与组学特异信息的有效分离,并结合对抗学习、噪声对比估计以及 MMD 正则化,使模型能够适用于配对数据、非配对数据以及存在批次差异的复杂多组学数据。同时,OmiDos 还可服务于生物标志物发现、发育轨迹推断、顺式调控元件识别以及增强子—靶基因关联分析等多类下游研究。
为了系统评估 OmiDos 的性能,研究团队在多个人类和小鼠单细胞多组学数据集上开展了广泛的基准测试。在具有代表性的基准数据集中,OmiDos 与 GLUE等多种主流方法进行了比较。结果表明,OmiDos 在大多数数据集上取得了更优的整合效果,并在复杂组织环境中保持了更稳健的聚类性能。更值得关注的是,OmiDos 的优势并不只体现在“指标更高”,还体现在对复杂异质性组织的适应能力上。一些方法在相对容易区分的数据集中表现良好,但在脑组织等细胞异质性更强的场景中性能会明显下降;相比之下,OmiDos 在简单与复杂组织环境中都能保持较为稳定的表现,体现出更强的鲁棒性。
OmiDos 的价值也不止于整合性能的提升,更在于它帮助研究者看到传统方法容易混淆或忽略的调控层信息。在小鼠继发腭发育数据中,OmiDos 识别出一个与 Muc4 相关的候选远端增强子,并揭示其与上皮细胞分化和迁移过程的关联。研究表明,这一增强子信号与发育阶段动态高度一致,体现了 OmiDos 在解析细胞类型特异性调控网络方面的能力。在髓母细胞瘤研究中,OmiDos 进一步揭示了 Neurod1 附近远端调控元件的动态变化,并提出与 Stat2 相关的染色质调控变化可能参与了肿瘤进展中的表观遗传重编程。该发现为理解 SHH 型髓母细胞瘤从正常到恶性转化过程中的分子调控机制提供了新的线索。
这项工作表明,单细胞多组学分析不应只是简单地“把不同模态放在一起”,更关键的是识别哪些信息属于组学特异性变化,哪些信息反映跨模态共享的生物学规律。OmiDos 通过正交解耦共享信号与私有信号,不仅提升了跨模态整合、批次校正和非配对数据对齐的效果,也增强了对细胞异质性和调控机制的解释能力。
![]()
图1 OmiDos技术路线图
原文链接:https://www.pnas.org/doi/10.1073/pnas.2519870123
制版人:十一
BioArt
Med
Plants
人才招聘
学术合作组织
(*排名不分先后)
![]()
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.