![]()
在显微镜下,研究者正在观察某个细胞的状态。它可能正在分化、受药物作用,或者被辐射轻微损伤。如果能预测它接下来会发生什么——会凋亡?转分化?恢复?——我们就能提前干预疾病、优化药物设计。
这一想法如今正在美国哥伦比亚大学(Columbia University)与斯坦福大学(Stanford University)等的研究团队手下变为现实。他们提出了一种名为 Squidiff 的基于扩散模型(diffusion model)的细胞状态预测框架,能在多种扰动条件下生成「未来的单细胞转录组」。
该研究以「Squidiff: predicting cellular development and responses to perturbations using a diffusion model」为题,于 2025 年 11 月 3 日刊登在《Nature Methods》。
![]()
论文链接:https://www.nature.com/articles/s41592-025-02877-y
细胞系统中的 AI 视角
在单细胞生物学中,常用 RNA 测序(scRNA-seq)来观察细胞的基因表达谱。但这些数据只是静态快照——研究者只能看到「此刻的细胞」,却看不到它「接下来的变化」。
以往的算法如scGen、GEARS尝试预测扰动后的状态,但都有局限:它们假设扰动与反应的关系是线性的;很难捕捉到细胞发育或药物反应中的非线性动态轨迹;对复杂多扰动(如药物联用、双基因编辑)往往失效。
Squidiff 的思路与之不同——它引入了扩散模型的时间逆推机制:通过学习细胞表达谱从「噪声」到「有序状态」的生成过程,模型不仅能还原静态数据,更能模拟状态转变的过程。
![]()
图 1:Squidiff 概述及其在合成数据上的性能。
Squidiff 可生成代表不同细胞状态的新转录组,并利用这些信息合并各种扰动条件,包括基因编辑和具有特定结构和剂量的药物化合物。接下来,它能在潜空间中逐步生成符合条件的未来表达谱。
Squidiff 集成了数据生成用的扩散模型和用于编码潜在表示的语义编码器,有了它,研究者就可以给模型「加一个条件」,例如「给予药物X」或「暴露在辐射剂量Y」,AI 就能输出该细胞在这些条件下的转录组预测。
AI 模拟发育、药物与辐射三类扰动
为了解释 Squidiff 框架,研究者们在多个数据集上验证了 Squidiff 的能力。
以 iPSC 分化的公共单细胞转录组学数据集为例,仅根据第 0 天和第 3 天的数据进行训练,Squidiff 就通过扩散和去噪过程有效地捕获了从第 0 天到第 3 天从 iPSC 到中胚层和最终内胚层细胞的状态变化。
Squidiff 还可以预测细胞对基因扰动和药物治疗的反应。通过利用向量运算,训练完毕的 Squidiff 模型可以跨条件泛化单细胞转录组数据,准确模拟复杂的细胞反应。在双基因敲除实验(ZBTB25 + PTPN12)中,Squidiff 成功预测出下游信号的非线性叠加模式,性能显著优于 scGen 与 GEARS。
![]()
图 2:Squidiff 预测细胞分化(部分)。
最后,团队将 Squidiff 应用于血管类器官(blood vessel organoid)暴露实验,模型准确再现辐射后炎症反应、p53 通路激活、细胞凋亡上调等转录信号,并进一步预测G-CSF(粒细胞刺激因子)处理可显著缓解这些分子变化。
细胞的预测方式
Squidiff 模型打开了一条用生成式模型做生物学假设演化实验的道路。这意味着研究者可以在不动细胞、不开实验的情况下,模拟不同药物、剂量或辐射条件下的基因表达变化。
在药物开发中,它能用于筛选最可能有效的组合;在放射生物学中,它能预测剂量–响应曲线与修复窗口。Squidiff 不仅能成为治疗应用的工具,而且可以继续完善揭示细胞适应、应激反应和命运决定的根本机制的途径。
未来的工作中,提高 Squidiff 的可扩展性和计算效率对于将其应用于大规模数据集并确立 Squidiff 作为一个更通用的基础模型至关重要。它仍需要整合更多的多组学数据,以此完善其预测机制。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.