网易首页 > 网易号 > 正文 申请入驻

一个模型搞定各种组学!哈工大等带来通用多组学高精度反卷积框架

0
分享至



编辑丨&

在精准医学研究中,一个核心问题是:如何从大量已有的组织样本数据中,解析出其中的细胞类型组成?反卷积算法为此提供了低成本、高通量的解决方案。

不过可惜的是,现有方法大多为单一组学「量身定制」——转录组有 CIBERSORTx、蛋白组有 scpDeconv,而代谢组甚至还没有专用工具。这种「各自为战」的格局,使得跨组学、跨队列的比较充满系统性偏差,严重制约了大规模多组学研究的发展。

来自哈尔滨工业大学等的团队带来了一个名为 DECODE 的通用反卷积框架。它通过精巧的深度学习架构,首次实现了对转录组、蛋白组和代谢组数据的统一、高精度反卷积,并能在参考单细胞数据不完整的情况下依然稳健工作,为充分利用海量多组学组织数据提供了强大工具。

相关研究内容以「DECODE: deep learning-based common deconvolution framework for various omics data」为题,于 2026 年 3 月 2 日发表在《Nature Methods》。



论文链接:https://www.nature.com/articles/s41592-026-03007-y

通用反卷积框架

目前的反卷积工具遵循「针对化」发展路径。转录组工具基于特定分布假设(如泊松分布),蛋白组工具则有不同的数学模型,而代谢组反卷积仍是空白。当研究者想比较不同组学层、不同队列的细胞丰度时,方法的异质性引入了无法量化的系统偏差,破坏了整合分析的可靠性。

而在当下的组学研究中,不同组学数据在尺度、分布、稀疏性和特征维度上差异巨大。并且,单细胞参考数据往往无法覆盖组织中存在的所有细胞类型,参考数据与组织目标数据通常来自不同供体、技术和健康状态,生理和技术变异引入的批次效应会严重干扰真实生物学信号的识别。

这就要求反卷积模型架构需要高度灵活、自适应力强,且必须能在参考数据缺失某些细胞类型(即存在未知细胞类型)的情况下,依然准确估计已知细胞类型的相对丰度。这也就成为了 DECODE 的基础设计需求。



图 1:DECODE 框架。

DECODE 框架主要包含了四个阶段,这些阶段共同确保对不同组学数据的精确且可靠的解卷:

  1. 第一阶段:构建「伪组织」训练集:从单细胞数据中随机抽取细胞,根据随机生成的比例向量进行聚合,模拟出具有已知细胞组成的「伪组织」样本。这为模型提供了无限且带有真实标签的训练数据。
  2. 第二阶段:消除批次效应(对抗训练):这是 DECODE 的关键创新之一。框架引入了一个编码器、一个鉴别器和一个反卷积器。编码器提取特征,鉴别器试图判断这些特征来自伪组织还是真实目标组织,而反卷积器则专注于学习细胞组成信息。
  3. 利用对抗训练,迫使鉴别器无法区分数据来源,从而在保留生物学信号的同时,有效消除了训练数据与目标数据之间的批次效应。此阶段完成后,编码器参数被固定。
  4. 第三阶段:提升稳健性(对比学习与降噪):为了应对各种噪声和组学数据差异,DECODE 对每个伪组织样本随机添加不超过 10% 的噪声,构建成对训练数据。
  5. 一个注意力机制降噪器将嵌入特征分离为噪声特征和纯化特征。同时,对比学习策略拉近同一组织样本不同噪声版本的特征表示,推远不同样本的表示,从而增强模型对噪声的抵抗力。
  6. 第四阶段:推理与应用:DECODE 提供两条路径——当单细胞参考数据能完全覆盖目标组织细胞类型时,走「标准反卷积」路径;当存在未知细胞类型时,走带有降噪器的「相对反卷积」路径,确保依然能准确估计已知细胞类型的比例。

性能超越

研究团队设计了极其严苛的验证方案,在 15 个数据集上构建了 7 大测试场景,涵盖了转录组、蛋白组、代谢组,以及空间转录组数据。



图 2:DECODE 转录组学和蛋白质组学数据解卷积性能概述。

在跨供体、跨疾病状态、跨健康状态、跨数据集、空间转录组、多细胞类型等几乎所有场景中,DECODE 的一致性相关系数均排名第一。即使在部分方法的「原问题设定」下,DECODE 的表现也优于它们。在真实组织数据上,DECODE 同样展现出卓越的准确性。



图 3:DECODE 代谢组学数据解卷积性能概述。

最为亮眼的是,DECODE 完成了代谢组学反卷积的突破。研究首次在三个单细胞代谢组数据集(小鼠肝脏、骨髓和人类结直肠癌)上验证了反卷积的可能性。在跨细胞类型、跨疾病状态、跨平台的测试中,DECODE 均取得了极高的预测精度。

经过四种扰动场景下的分析与在伪多组学和真实多组学队列中的应用,DECODE 在缺少模拟数据的情况下依然发表现出远超其他模型的精度。在批次效应干扰实验中,DECODE的表现也最为稳定。

通用化范式跃迁

DECODE 是一种能够处理转录组学、蛋白质组学和代谢组学数据的去卷积算法,它首次将反卷积从「组学专属」的工具箱,升级为跨组学的「通用」框架。

它不仅填补了代谢组学反卷积的空白,更重要的是,它为整合海量、异质的现有组学数据提供了统一的分析平台。有了 DECODE,研究者可以更可靠地比较不同疾病队列、不同组学层次的细胞组成变化,从而获得对复杂生物系统更完整的分子层面理解。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
首映轰下5580万票房,《寒战1994》夺冠,梁乐民把陈思诚打懵了

首映轰下5580万票房,《寒战1994》夺冠,梁乐民把陈思诚打懵了

电影票房预告片
2026-05-01 23:36:23
中方不得不投出弃权票

中方不得不投出弃权票

第一财经资讯
2026-05-01 17:17:06
虚构分析:孩子生在这三个时辰是全家的福气!命里带财、光宗耀祖

虚构分析:孩子生在这三个时辰是全家的福气!命里带财、光宗耀祖

卡西莫多的故事
2026-04-28 09:36:44
大师靠“美国崩溃论”卷走百亿,跑路美国后,痛骂中国人

大师靠“美国崩溃论”卷走百亿,跑路美国后,痛骂中国人

谈史论天地
2026-04-25 11:00:08
郑丽文官宣,即将访美!大陆的回应亮了,国民党高层是时候清醒了

郑丽文官宣,即将访美!大陆的回应亮了,国民党高层是时候清醒了

爱意随风起呀
2026-05-02 01:26:43
小米汽车将推出全新品牌,首款车曝光!

小米汽车将推出全新品牌,首款车曝光!

新浪财经
2026-05-02 01:28:09
傅作义亲手放走5个蒋介石嫡系将领,几十年后才知他保全的是什么

傅作义亲手放走5个蒋介石嫡系将领,几十年后才知他保全的是什么

睡前讲故事
2025-12-09 13:06:03
恋情瓜再爆!窦靖童私生活被深挖,王菲最担心的事还是来了

恋情瓜再爆!窦靖童私生活被深挖,王菲最担心的事还是来了

孤城落日
2026-04-29 11:29:15
央视多次科普:每台存钱手机都建议开启,守住钱包减少盗刷

央视多次科普:每台存钱手机都建议开启,守住钱包减少盗刷

娱乐圈见解说
2026-05-01 19:07:40
津门虎2-2十人三镇,季胜攀绝平,哈达斯点射,亚姆卡姆染红

津门虎2-2十人三镇,季胜攀绝平,哈达斯点射,亚姆卡姆染红

懂球帝
2026-05-01 22:02:41
斩杀中年男性的三件套:阳痿、失业和心梗!

斩杀中年男性的三件套:阳痿、失业和心梗!

灯锦年
2026-04-30 10:04:05
以媒:美国“即将决定”是否重启对伊朗军事行动

以媒:美国“即将决定”是否重启对伊朗军事行动

新华社
2026-05-01 15:47:15
把刘涛抱在怀里,有谁注意到他手上的小动作,人品如何一目了然。

把刘涛抱在怀里,有谁注意到他手上的小动作,人品如何一目了然。

陈意小可爱
2026-05-02 00:21:51
妻子住院60天儿女从不探望,我默默捐掉公司,儿子怒吼质问

妻子住院60天儿女从不探望,我默默捐掉公司,儿子怒吼质问

晓艾故事汇
2026-05-01 14:35:07
美国准时动手,一致同意对付中方,过去24小时,中美已打2通电话

美国准时动手,一致同意对付中方,过去24小时,中美已打2通电话

温读史
2026-05-02 05:14:43
北京始发的T297次,列车员清理中铺时竟然发现外籍旅客遗失万元现金

北京始发的T297次,列车员清理中铺时竟然发现外籍旅客遗失万元现金

辉哥说动漫
2026-05-01 21:18:06
变则通!杜锋一大改变,盘活了整支广东队

变则通!杜锋一大改变,盘活了整支广东队

体育哲人
2026-05-01 22:09:42
能不能发生关系,为何永远都是女人说了算?

能不能发生关系,为何永远都是女人说了算?

朗威谈星座
2026-04-13 10:33:16
33岁郭晓婷近况曝光!与王天辰因戏生情,如今婚姻生活很幸福

33岁郭晓婷近况曝光!与王天辰因戏生情,如今婚姻生活很幸福

代军哥哥谈娱乐
2026-05-01 12:26:49
西方害怕中国治沙?《自然》新评揭开真相:他们怕的并非沙漠消失

西方害怕中国治沙?《自然》新评揭开真相:他们怕的并非沙漠消失

生活的哲学
2026-04-29 06:41:35
2026-05-02 06:03:00
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1292文章数 227关注度
往期回顾 全部

科技要闻

DeepSeek发布多模态论文又连夜删除

头条要闻

美国也搞起"人肉代购" "去墨西哥买中国车"教程疯传

头条要闻

美国也搞起"人肉代购" "去墨西哥买中国车"教程疯传

体育要闻

无奈!约基奇:这要在塞尔维亚 全队早被炒了

娱乐要闻

马筱梅产后身材恢复超好 现身户外直播

财经要闻

GPU神话松动,AI真正的战场变了

汽车要闻

限时9.67万起 吉利星越L/星瑞i-HEV智擎混动上市

态度原创

教育
手机
时尚
健康
公开课

教育要闻

高考地理概念:地下水

手机要闻

曝iPhone18Pro相机史诗级升级,这次你期待吗?

这个夏天,彩色裤子又火了!

干细胞治烧烫伤面临这些“瓶颈”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版