
近年来,单细胞扰动测序(single-cell perturbation sequencing)技术快速发展,使研究者能够在单细胞分辨率下系统刻画药物处理、基因敲除/激活等多种扰动对细胞状态的影响。基于单细胞扰动数据构建具备良好泛化能力的 细胞扰动响应 预测模型和虚拟细胞(virtual cell)系统,已成为理解细胞因果调控、加速药物与靶点发现的重要方向。然而,目前单细胞扰动响应预测算法种类繁多,涵盖从传统机器学习模型到大规模深度学习模型( 如基座模型等 )的 诸多 范式, 对于这些算法 在不同任务和数据条件下的优劣表现以及 其 在真实应用场景中的泛化能力,仍缺乏系统、定量且规范的评估框架。 对于单细胞扰动响应的全面基准评估及提出有效的可泛化的扰动响应预测策略,是领域内基本而重要的科学问题。
同济大学生命科学与技术学院-上海自主智能无人系统科学中心刘琦教授团队 长期致力于发展 AI赋能组学解析和精准干预,进行数字生命智能体构建、推理及精准医学应用和转化。 面向单细胞组学驱动的数字细胞A I 算法设计,团队前期开发了单细胞扰动数据分析平台Per turbase【1】,单细胞扰动效应预测算法STAMP【2】以及单细胞因果解耦模型C ausCell【3】。
针对 领域内单细胞扰动预测基准评估这一基本而重要的科学 问题, 2025年12月11日,刘琦教授团队 在 Nature Methods 杂志发表了题为 Benchmarking algorithms for generalizable single-cell perturbation response prediction 的论文,构建了面向单细胞扰动响应预测的全面基准评估平台 scPerturBench(Benchmarking algorithms for generalizable single-cell perturbation response prediction ,图1) 。该工作围绕“单细胞扰动响应预测模型的可泛化性”这一核心科学问题,面向27种扰动预测算法,从评估指标体系构建、任务场景定义以及模型表现系统比较三个层面开展了系统的梳理和研究工作,系统回应了领域内关于大模型与基线模型孰优孰劣的争论,并全面总结了当前方法在实际预测中面临的关键挑战。在此基础上, 进一步 提出了基于解耦学习的 cell line embedding 策略,以增强模型在新细胞背景下的泛化能力。
![]()
![]()
图 1: scPerturBench 评估的算法、指标和数据集
在评估体系方面, 研究 团队首先对单细胞扰动预测领域现有文献和工具中使用的评价指标进行了系统梳理与去冗余,最终 从领域内常用的1 9 个指标中筛 选出 6 个具有互补性的核心指标。其中:MSE、PCC-delta 和 E-distance 侧重评估算法对群体均值扰动效应的预测能力;Wasserstein distance、Kullback–Leibler divergence 和 Common-DEGs 侧重刻画算法对群体分布形状及差异表达模式的预测性能。该指标体系同时覆盖传统数值误差和分布层面的刻画,更加全面地反映了模型在单细胞扰动响应预测任务中的整体表现 。
在任务设计方面,scPerturBench 将单细胞扰动预测问题拆解为两个具有代表性的泛化场景:细胞背景泛化场景(cellular context generalization scenario)和扰动泛化场景(perturbation generalization scenario)。在细胞背景泛化场景中 的1 4 个算法中 ,trVAE【4】、CellOT【5】、scPRAM【6】和 scVIDR【7】的预测性能相对较好。然而,系统分析进一步表明,现有模型的预测性能普遍对训练集与测试集之间的相似性高度敏感:当测试细胞背景与训练细胞背景差异增大时,模型预测准确性会明显下降。鉴于当前该场景下可用训练数据规模整体仍然有限, 研究 团队提出了一种基于大模型先验 cell line embedding,并结合解耦学习策略的新方法,将细胞系特异信息与扰动响应建模过程进行有效解耦,从而在新细胞背景中显著增强模型的泛化能 力(图2)。
![]()
图2:基于大模型cell line embedding 的解耦学习框架
在扰动泛化场景中,scPerturBench 首次对领域内广受关注的“大模型与基线模型的性能对比”问题给出了系统性、数据驱动的 解析和回答 。研究结果表明:在训练数据量较小的条件下,结构相对简单的基线模型往往能够取得更优表现;随着微调数据(训练数据)规模的逐步增加,大模型 如scGPT【8】在大多数任务中逐渐超越基线模型,展现出更强的特征表示和迁移学习能力。这一发现 尝试 明确了大模型与基线模型在不同数据规模条件下的适用边界,提示在数据资源有限的情形下,轻量级模型仍具有较高实用价值,而在数据充足的场景中, 基座 模型 可能 更 具有 优势。
综上所述,scPerturBench 为单细胞扰动响应预测领域提供了一个系统而全面的基准评估框架,从评估指标体系构建、典型泛化任务场景设计到多类模型性能比较,全面刻画了当前算法在细胞背景与扰动泛化中的优势与局限,并给出了关于“大模型 vs. 基线模型”适用边界的定量评估和证据支撑。同时,平台提出的基于解耦学习的 cell line embedding 策略,为提升模型在新细胞背景下的泛化能力提供了可行路径。该工作有望为未来单细胞扰动响应预测模型的算法设计与选择等应用提供重要参考。
值得一提的是,该研究论文上线之时,正值国际第一届AI 虚拟细胞挑战赛( Virtual Cell Challenge )揭榜。该竞赛基于三个指标进行基因扰动响应预测评估( PDS - 是否能区分不同扰动,DES - 是否能找到正确的 DEGs,MAE- 是否能量化预测表达变化)。其结果显示排名靠前的算法均面向三个指标(或其中部分指标)进行特调,但在换一批指标或者在更多指标的整体评估场景下( Generalist )性能差强人意,提示设计客观、全面、合理的评估体系和方法至关重要,同时也表明该领域算法研究尚有巨大提升和发展空间。
同济大学博士后危志庭、博士生王毅恒、高溢骋和王曙光为本文共同第一作者。同济大学生命科学与技术学院刘琦教授 为论文最后通讯作者 。
论文链接:
https://www.nature.com/articles/s41592-025-02980-0
制版人: 十一
参考文献
1. Wei, Z. et al. PerturBase: a comprehensive database for single-cell perturbation data analysis and visualization.Nucleic Acids Res53, D1099-D1111 (2025).
2. Gao, Y. et al. Toward subtask-decomposition-based learning and benchmarking for predicting genetic perturbation outcomes and beyond.Nat Comput Sci4, 773-785 (2024).
3.Gao, Y. et al. Causal disentanglement for single-cell representations and controllable counterfactual generation.Nat. Commu.16, 6775 (2025).
4. Lotfollahi, M., Naghipourfar, M., Theis, F.J. & Wolf, F.A. Conditional out-of-distribution generation for unpaired data using transfer VAE.Bioinformatics36, i610-i617 (2020).
5. Bunne, C. et al. Learning single-cell perturbation responses using neural optimal transport.Nat Methods20, 1759-1768 (2023).
6. Jiang, Q., Chen, S., Chen, X. & Jiang, R. scPRAM accurately predicts single-cell gene expression perturbation response based on attention mechanism.Bioinformatics40 (2024).
7. Kana, O. et al. Generative modeling of single-cell gene expression for dose-dependent chemical perturbations.Patterns(N Y) 4, 100817 (2023).
8. Cui, H. et al. scGPT: toward building a foundation model for single-cell multi-omics using generative AI.Nat Methods21, 1470-1480 (2024).
学术合作组织
(*排名不分先后)
![]()
战略合作伙伴
(*排名不分先后)
![]()
![]()
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
近期直播推荐

点击主页推荐活动
关注更多最新活动!
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.