网易首页 > 网易号 > 正文 申请入驻

Nat Methods | 刘琦团队开发单细胞扰动响应全面基准评估平台及提出可泛化的扰动响应预测策略

0
分享至


近年来,单细胞扰动测序(single-cell perturbation sequencing)技术快速发展,使研究者能够在单细胞分辨率下系统刻画药物处理、基因敲除/激活等多种扰动对细胞状态的影响。基于单细胞扰动数据构建具备良好泛化能力的 细胞扰动响应 预测模型和虚拟细胞(virtual cell)系统,已成为理解细胞因果调控、加速药物与靶点发现的重要方向。然而,目前单细胞扰动响应预测算法种类繁多,涵盖从传统机器学习模型到大规模深度学习模型( 如基座模型等 )的 诸多 范式, 对于这些算法 在不同任务和数据条件下的优劣表现以及 其 在真实应用场景中的泛化能力,仍缺乏系统、定量且规范的评估框架。 对于单细胞扰动响应的全面基准评估及提出有效的可泛化的扰动响应预测策略,是领域内基本而重要的科学问题。

同济大学生命科学与技术学院-上海自主智能无人系统科学中心刘琦教授团队 长期致力于发展 AI赋能组学解析和精准干预,进行数字生命智能体构建、推理及精准医学应用和转化。 面向单细胞组学驱动的数字细胞A I 算法设计,团队前期开发了单细胞扰动数据分析平台Per turbase1,单细胞扰动效应预测算法STAMP2以及单细胞因果解耦模型C ausCell3

针对 领域内单细胞扰动预测基准评估这一基本而重要的科学 问题, 2025年12月11日,刘琦教授团队 在 Nature Methods 杂志发表了题为 Benchmarking algorithms for generalizable single-cell perturbation response prediction 的论文,构建了面向单细胞扰动响应预测的全面基准评估平台 scPerturBench(Benchmarking algorithms for generalizable single-cell perturbation response prediction ,图1) 。该工作围绕“单细胞扰动响应预测模型的可泛化性”这一核心科学问题,面向27种扰动预测算法,从评估指标体系构建、任务场景定义以及模型表现系统比较三个层面开展系统梳理和研究工作,系统回应了领域内关于大模型与基线模型孰优孰劣的争论,并全面总结了当前方法在实际预测中面临的关键挑战。在此基础上, 进一步 提出了基于解耦学习的 cell line embedding 策略,以增强模型在新细胞背景下的泛化能力。



图 1: scPerturBench 评估的算法、指标和数据集

在评估体系方面, 研究 团队首先对单细胞扰动预测领域现有文献和工具中使用的评价指标进行了系统梳理与去冗余,最终 从领域内常用的1 9 个指标中筛 选出 6 个具有互补性的核心指标。其中:MSE、PCC-delta 和 E-distance 侧重评估算法对群体均值扰动效应的预测能力;Wasserstein distance、Kullback–Leibler divergence 和 Common-DEGs 侧重刻画算法对群体分布形状及差异表达模式的预测性能。该指标体系同时覆盖传统数值误差和分布层面的刻画,更加全面地反映了模型在单细胞扰动响应预测任务中的整体表现 。

在任务设计方面,scPerturBench 将单细胞扰动预测问题拆解为两个具有代表性的泛化场景:细胞背景泛化场景(cellular context generalization scenario)和扰动泛化场景(perturbation generalization scenario)。在细胞背景泛化场景中 的1 4 个算法中 ,trVAE4、CellOT5、scPRAM6和 scVIDR7的预测性能相对较好。然而,系统分析进一步表明,现有模型的预测性能普遍对训练集与测试集之间的相似性高度敏感:当测试细胞背景与训练细胞背景差异增大时,模型预测准确性会明显下降。鉴于当前该场景下可用训练数据规模整体仍然有限, 研究 团队提出了一种基于大模型先验 cell line embedding,并结合解耦学习策略的新方法,将细胞系特异信息与扰动响应建模过程进行有效解耦,从而在新细胞背景中显著增强模型的泛化能 力(图2)


图2:基于大模型cell line embedding 的解耦学习框架

在扰动泛化场景中,scPerturBench 首次对领域内广受关注的“大模型与基线模型的性能对比”问题给出了系统性、数据驱动的 解析和回答 。研究结果表明:在训练数据量较小的条件下,结构相对简单的基线模型往往能够取得更优表现;随着微调数据(训练数据)规模的逐步增加,大模型 如scGPT8在大多数任务中逐渐超越基线模型,展现出更强的特征表示和迁移学习能力。这一发现 尝试 明确了大模型与基线模型在不同数据规模条件下的适用边界,提示在数据资源有限的情形下,轻量级模型仍具有较高实用价值,而在数据充足的场景中, 基座 模型 可能 更 具有 优势。

综上所述,scPerturBench 为单细胞扰动响应预测领域提供了一个系统而全面的基准评估框架,从评估指标体系构建、典型泛化任务场景设计到多类模型性能比较,全面刻画了当前算法在细胞背景与扰动泛化中的优势与局限,并给出了关于“大模型 vs. 基线模型”适用边界的定量评估和证据支撑同时,平台提出的基于解耦学习的 cell line embedding 策略,为提升模型在新细胞背景下的泛化能力提供了可行路径。该工作有望为未来单细胞扰动响应预测模型的算法设计与选择等应用提供重要参考。

值得一提的是,该研究论文上线之时,正值国际第一届AI 虚拟细胞挑战赛( Virtual Cell Challenge )揭榜。该竞赛基于三个指标进行基因扰动响应预测评估( PDS - 是否能区分不同扰动,DES - 是否能找到正确的 DEGs,MAE- 是否能量化预测表达变化)。其结果显示排名靠前的算法均面向三个指标(或其中部分指标)进行特调,但在换一批指标或者在更多指标的整体评估场景下( Generalist )性能差强人意,提示设计客观、全面、合理的评估体系和方法至关重要,同时也表明该领域算法研究尚有巨大提升和发展空间。

同济大学博士后危志庭、博士生王毅恒、高溢骋和王曙光为本文共同第一作者。同济大学生命科学与技术学院刘琦教授 为论文最后通讯作者 。

论文链接:

https://www.nature.com/articles/s41592-025-02980-0

制版人: 十一

参考文献

1. Wei, Z. et al. PerturBase: a comprehensive database for single-cell perturbation data analysis and visualization.Nucleic Acids Res53, D1099-D1111 (2025).

2. Gao, Y. et al. Toward subtask-decomposition-based learning and benchmarking for predicting genetic perturbation outcomes and beyond.Nat Comput Sci4, 773-785 (2024).

3.Gao, Y. et al. Causal disentanglement for single-cell representations and controllable counterfactual generation.Nat. Commu.16, 6775 (2025).

4. Lotfollahi, M., Naghipourfar, M., Theis, F.J. & Wolf, F.A. Conditional out-of-distribution generation for unpaired data using transfer VAE.Bioinformatics36, i610-i617 (2020).

5. Bunne, C. et al. Learning single-cell perturbation responses using neural optimal transport.Nat Methods20, 1759-1768 (2023).

6. Jiang, Q., Chen, S., Chen, X. & Jiang, R. scPRAM accurately predicts single-cell gene expression perturbation response based on attention mechanism.Bioinformatics40 (2024).

7. Kana, O. et al. Generative modeling of single-cell gene expression for dose-dependent chemical perturbations.Patterns(N Y) 4, 100817 (2023).

8. Cui, H. et al. scGPT: toward building a foundation model for single-cell multi-omics using generative AI.Nat Methods21, 1470-1480 (2024).

学术合作组织

(*排名不分先后)



战略合作伙伴

(*排名不分先后)



转载须知


【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。

BioArt

Med

Plants

人才招聘

近期直播推荐


点击主页推荐活动

关注更多最新活动!


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
提前涨停!603933,股票复牌

提前涨停!603933,股票复牌

中国基金报
2026-04-09 22:55:27
中东停火不到24小时,美国就调转枪口对准中国,F-35密集“压境”

中东停火不到24小时,美国就调转枪口对准中国,F-35密集“压境”

荷兰豆爱健康
2026-04-09 15:39:02
绝非卫星那么简单!伊朗导弹40天命中率翻8倍:美国一直查不明白

绝非卫星那么简单!伊朗导弹40天命中率翻8倍:美国一直查不明白

李健政观察
2026-04-09 16:51:01
“最打扰他的人是你!”姐弟相处视频流出,妈妈成了最多余的那个

“最打扰他的人是你!”姐弟相处视频流出,妈妈成了最多余的那个

知晓科普
2026-03-02 14:39:10
NASA局长称,如果没有特朗普,“阿尔忒弥斯二号”任务不可能成功

NASA局长称,如果没有特朗普,“阿尔忒弥斯二号”任务不可能成功

混沌录
2026-04-07 21:38:06
Netflix下架《边境杀手》:9.1分神作只剩7天

Netflix下架《边境杀手》:9.1分神作只剩7天

追星雷达站
2026-04-09 15:51:39
C罗坐不住了?38岁本泽马乱杀:42分钟3球+率队6-0 只差胜利2分了

C罗坐不住了?38岁本泽马乱杀:42分钟3球+率队6-0 只差胜利2分了

风过乡
2026-04-09 05:58:51
40.28万起!丰田新车官宣:正式上市

40.28万起!丰田新车官宣:正式上市

高科技爱好者
2026-04-08 23:24:07
CBA罚单:宁波主场观众向主队扔烟盒罚3万 贝兹利引内讧是起因

CBA罚单:宁波主场观众向主队扔烟盒罚3万 贝兹利引内讧是起因

醉卧浮生
2026-04-09 17:55:57
王晶再揭关之琳秘史!高尔夫球只是冰山一角,刘銮雄自爆真相太扎心

王晶再揭关之琳秘史!高尔夫球只是冰山一角,刘銮雄自爆真相太扎心

动物奇奇怪怪
2026-04-01 18:50:33
410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

深度报
2025-12-14 22:36:54
孙杨一家5口同住杭州大平层,首次公开孩子,父母出镜婆媳关系好

孙杨一家5口同住杭州大平层,首次公开孩子,父母出镜婆媳关系好

离离言几许
2026-04-09 15:47:15
拼多多3元一斤的猪肺,我哭着看完评论区

拼多多3元一斤的猪肺,我哭着看完评论区

风味人间
2026-04-08 12:33:00
你永远想不到医院的八卦能有多炸裂?一件提神醒脑,两件直接撂倒

你永远想不到医院的八卦能有多炸裂?一件提神醒脑,两件直接撂倒

另子维爱读史
2026-01-22 18:21:09
意媒:为引进格雷茨卡,米兰可能会出售福法纳筹措资金

意媒:为引进格雷茨卡,米兰可能会出售福法纳筹措资金

懂球帝
2026-04-09 20:43:53
一吨560元到无人问津!废旧玻璃,为何不能熔成新玻璃?

一吨560元到无人问津!废旧玻璃,为何不能熔成新玻璃?

阿校谈史
2026-04-08 11:55:16
卸任泰安市副市长、市公安局局长职务,窦清波新职明确

卸任泰安市副市长、市公安局局长职务,窦清波新职明确

齐鲁壹点
2026-04-09 18:06:52
西部乱不乱,火箭说了算

西部乱不乱,火箭说了算

毒舌NBA
2026-04-09 15:04:48
“不能为美国流血,找中国去”

“不能为美国流血,找中国去”

观察者网
2026-04-09 10:05:03
中国战舰现身霍尔木兹,镇守一周释放信号,和平不靠喊话靠底气

中国战舰现身霍尔木兹,镇守一周释放信号,和平不靠喊话靠底气

補懂事的孩紙
2026-04-10 00:42:01
2026-04-10 01:31:00
BioArt incentive-icons
BioArt
探索生物艺术之奥秘
9729文章数 18507关注度
往期回顾 全部

科技要闻

Meta凌晨首发闭源大模型 扎克伯格又行了?

头条要闻

媒体:"浑身是血"的美军上校藏身山缝 15分钟内被转移

头条要闻

媒体:"浑身是血"的美军上校藏身山缝 15分钟内被转移

体育要闻

8万人面前心脏骤停 现在他还站在球场上

娱乐要闻

金莎官宣结婚 与老公孙丞潇相差18岁

财经要闻

停火又悬了,最糟糕的情况要来了?

汽车要闻

文飞掌舵,给神行者带来了什么?

态度原创

数码
健康
教育
亲子
手机

数码要闻

华为多款新品在路上:Pura 90、阔折叠、AI眼镜、平板耳机全都有

干细胞抗衰4大误区,90%的人都中招

教育要闻

全国正确率只有5%的中考易错题

亲子要闻

白血病的雷,早在胎儿时期就已埋下,但未必会炸

手机要闻

荣耀600系列再次曝光:AI两亿主摄+AI按键,电池超大!

无障碍浏览 进入关怀版