网易首页 > 网易号 > 正文 申请入驻

自然·机器智能:神经SDE破译单细胞命运密码

0
分享至


导语

单细胞测序赋予了我们捕捉细胞分子“快照”的能力,但在发育与疾病的复杂舞台上,细胞命运的抉择往往是确定性趋势与随机性波动共舞的结果。现有的漂移-扩散模型虽然擅长描述细胞状态的确定性漂移,却常将至关重要的随机扩散简化为恒定的背景噪声,难以完全捕捉生命的动态调控逻辑。为了突破这一局限,研究人员引入了 scDiffEq——一种基于神经随机微分方程的全新生成式框架。该模型通过显式学习生物学中的确定性与随机性动力学,在造血发育研究中展现了卓越的细胞轨迹重构与命运预测能力。它不仅能通过计算机模拟(in silico)精确重现 CRISPR 基因扰动下的动力学变化,还能突破数据限制,从单一时间点快照中推演出高分辨率的发育轨迹,为解析基因层面的时间依赖性动力学提供了强大的新工具。

关键词:单细胞动力学 (Single-cell Dynamics)、神经随机微分方程 (Neural Stochastic Differential Equations)、细胞命运预测 (Cell Fate Prediction)、计算扰动 (In Silico Perturbation)、发育轨迹 (Developmental Trajectory)

彭晨丨作者

王璇丨审校


论文题目:Learning cell dynamics with neural differential equations 论文链接:https://www.nature.com/articles/s42256-025-01150-3 发表时间:2025年12月18日 论文来源:Nature Machine Intelligence

引言:从静态快照到动态电影的跨越

在生命科学的前沿探索中,理解细胞动力学是揭示发育奥秘和疾病机制的关键,动力系统支撑着包括分化和癌症在内的生物学基本过程。基因表达作为分子代理,被广泛用于表征细胞的状态。然而,现有的观测手段存在一个根本性的问题:单细胞RNA测序(scRNA-seq)虽然能捕捉到细胞在稳定和瞬态之间的快照,但这一过程本身是破坏性的,测量即意味着细胞的毁灭。这使得我们无法直接观测同一个细胞的过去、现在和未来,只能通过计算推断来重建细胞之间的时间动态和调控动力学。

为了跨越这一障碍,计算生物学家开发了一系列复杂的工具。近年来,RNA速率(RNA velocity)及其衍生方法(如Dynamo和CellRank)通过利用转录动力学的假设来推断细胞的未来状态。然而,这些基于RNA速率的方法主要模拟细胞状态的平均漂移(Drift),即确定性部分,却往往忽略了细胞特异性的扩散(Diffusion),即随机性部分,或者仅仅将其视为均匀的高斯噪声。事实上,随机性在生物发育中绝非仅仅是噪音,它是从共同祖细胞生成多样化细胞类型的必要条件,与确定性调控机制协同工作。解释确定性和随机基因表达之间的相互作用对于模拟复杂的细胞决策至关重要。为了填补这一空白,本研究开发了一种名为scDiffEq的全新深度学习框架。

scDiffEq框架:神经随机微分方程的生物学重构

scDiffEq的核心创新在于引入了神经随机微分方程(Neural Stochastic Differential Equations, Neural SDEs)来直接参数化漂移-扩散方程。这种方法不再依赖于数十年的经验假设或局限于低维数据,而是利用深度神经网络的强大拟合能力来数值近似复杂的动力学。

该框架将细胞在转录空间中的运动分解为两个部分:由漂移网络(Drift Network, f)控制的确定性动力学,以及由扩散网络(Diffusion Network, g)控制的随机动力学。具体而言,scDiffEq通过最小化预测细胞群体与观察到的细胞群体之间的Sinkhorn散度(一种正则化的Wasserstein距离)来学习这些网络。这意味着,模型通过让虚拟细胞在“发育时间”中演化,不断调整漂移和扩散参数,直到模拟出的细胞分布与真实观测到的后续时间点的细胞分布高度吻合。

这种设计使得scDiffEq不仅能够捕捉细胞发育的主流方向,还能精确量化在不同细胞状态下随机噪声的大小和方向。研究人员使用包含谱系追踪信息的scRNA-seq数据(LARRY数据集)对模型进行了基准测试,该数据集通过可遗传的条形码记录了细胞的真实系谱关系,为验证模型的预测提供了“金标准”。


图 1. scDiffEq 算法概览及应用。

超越传统:细胞命运预测精度的飞跃

为了验证scDiffEq的性能,研究团队首先进行了一项极具挑战性的任务:预测多能祖细胞的最终命运。在LARRY数据集中,研究人员利用早期的祖细胞数据训练模型,并尝试预测它们分化为中性粒细胞、单核细胞等成熟细胞的概率。结果显示,scDiffEq在命运预测准确性上显著优于现有的单细胞特定方法。相比于仅达到4.1%至46.1%准确率的现有方法,scDiffEq实现了58.5%的准确率,超越了之前的最先进模型PRESCIENT(图 2d)。值得注意的是,基于RNA速率的方法(Dynamo, CellRank)在此任务中表现不佳,这突显了在长时程发育预测中,仅仅依赖转录动力学假设的局限性。

这一性能的提升并非偶然。研究团队发现,模型中“扩散”项的引入至关重要。当通过消融实验移除细胞特异性的扩散模拟,转而使用均匀的高斯噪声时,模型的预测准确率下降了11.1%,且交叉熵显著增加。这表明,仅仅知道细胞“想去哪里”(漂移)是不够的,还需要理解它们在旅途中“有多犹豫”(扩散)。scDiffEq能够捕捉到多能祖细胞复杂的命运轨迹,而不仅仅是单一的确定性路径,从而更真实地反映了生物发育的多样性。

此外,研究还揭示了漂移与扩散之间的最佳比例。系统评估显示,当漂移/扩散比率维持在2.5左右时,模型的性能达到最佳。这一发现不仅优化了模型参数,也暗示了生物系统中确定性驱动力与随机扰动之间存在某种内在的平衡常数。

填补空白:稀疏时间点下的动力学插值

在实际的生物学研究中,我们往往无法获得连续密集的时间序列数据。scDiffEq展示了其强大的插值能力,能够从稀疏的时间点数据中恢复出连续的发育轨迹。在实验中,研究人员仅使用第2天和第6天的细胞数据训练模型,然后让模型预测被故意隐去的第4天的细胞状态。结果显示,scDiffEq生成的第4天细胞分布与真实观测到的数据在Sinkhorn距离上非常接近,优于PRESCIENT模型。这一能力证明了神经SDE不仅是在记忆数据,而是真正学习到了潜在的动力学规律。这种时间插值能力对于理解快速发育过程或难以频繁采样的临床样本具有极高的应用价值。


图 2. 使用谱系追踪的造血发育数据对scDiffEq性能进行基准测试。

虚拟实验室:计算机模拟的基因扰动筛选

scDiffEq最令人兴奋的应用前景之一是进行计算机模拟(in silico)的基因扰动实验。传统的基因功能研究通常需要昂贵且耗时的CRISPR筛选或转基因动物模型,而scDiffEq提供了一个高效的虚拟替代方案。研究团队对参与粒细胞生成的关键转录因子(如Lmo4, Dach1, Klf4, Cebpe)进行了模拟扰动。结果令人印象深刻:当在模型中模拟过度表达这些转录因子时,细胞群体的命运明显向中性粒细胞偏移,而单核细胞的比例则相应减少;反之,模拟敲低这些基因则产生了相反的效果。这种剂量依赖性的反应与已知的生物学事实高度一致,且线性回归模型完全无法捕捉这种动态变化。

进一步地,研究人员利用scDiffEq对全基因组范围内的基因进行了虚拟筛选,试图寻找决定粒细胞-单核细胞祖细胞(GMP)分化命运的关键调节因子。模型成功识别出了Gfi1作为中性粒细胞命运的促进因子,以及Ir8和Klf4作为抑制因子,这些预测与已知的血液学知识相吻合。更有趣的是,模型还发现了一些非转录因子的标记基因(如Mpo, Elane)在扰动后也会产生强烈的命运偏向,这虽然在生物学上可能意味着模型捕捉到了状态与命运的强相关性而非因果性,但也为发现新的调控机制提供了线索。这一功能不仅在小鼠数据上得到验证,还成功迁移到了人类造血数据上,重现了SPI1基因对单核细胞命运的剂量依赖性影响。这标志着scDiffEq有望成为药物靶点发现和基因治疗策略设计的强大辅助工具。


图 3. 计算机模拟的基因扰动分析和跨数据集的泛化。

深入机制:随机性是细胞可塑性的指纹

scDiffEq的独特之处在于它能够将细胞动力学解耦为漂移和扩散两个分量,这为我们提供了一个全新的视角来审视细胞的可塑性。研究人员分析了不同命运潜能的细胞轨迹,发现了一个引人注目的规律:细胞的漂移和扩散幅度与它的命运多能性(Plasticity)正相关。也就是说,那些能够分化成多种细胞类型的多能祖细胞,其内部的随机波动(扩散)和确定性驱动(漂移)都比单能细胞更强烈。这表明,细胞在分化潜能最高的阶段,处于一种高能量的活跃状态,积极地通过随机波动来探索不同的命运可能性。

在具体的中性粒细胞-单核细胞分化轨迹中,scDiffEq揭示了扩散并非均匀分布。在决定命运的关键分叉点附近,扩散幅度显著升高,而在细胞最终定型后则降低。此外,通过将转录因子表达与动力学参数相关联,研究者发现某些基因(如Myc, Cebpa)主要与扩散相关,而另一些基因(如Gfi1, Lmo4)则更多地驱动确定性的漂移。这种细粒度的解析能力,让我们得以窥见细胞如何在噪声中通过特定的基因调控网络锁定最终命运。


图 4.谱系定型(Lineage Commitment)过程中细胞特异性漂移-扩散动力学的分解和转录调控。

结语与展望

scDiffEq的提出标志着单细胞动力学建模进入了一个新的阶段。它不仅在技术上实现了利用神经随机微分方程处理高维单细胞数据的突破,更在生物学意义上强调了随机性在细胞发育中的核心地位。通过明确模拟漂移和扩散,scDiffEq比以往的方法更准确地描绘了细胞命运的决策过程,特别是对于那些罕见或多命运的复杂轨迹。

尽管目前的模型仍依赖于PCA降维后的潜在空间,可能掩盖部分基因间的直接相互作用,但其展现出的可扩展性和通用性令人振奋。scDiffEq已被证明可以处理超过100万个细胞的数据集,并具有近线性的计算扩展能力。未来,随着多模态数据(如染色质可及性、蛋白质组学)的整合,以及无模拟流匹配(flow-matching)算法的引入,scDiffEq有望发展成为解析生命动态过程的通用引擎,为发育生物学和再生医学提供更深邃的洞见。

细胞动力学读书会


细胞绝非孤立的单元,生命的智慧,如同蚁群的协作,涌现在细胞间复杂的相互作用之中。跨越临界点,简单规则便能催生全新的、稳定的结构与功能。


半个世纪以来,复杂系统科学为我们提供了洞见生命现象的全新工具箱。本期活动,我们将融合物理学、复杂科学与系统生物学,从Waddington景观、自组织临界,到反应-扩散模型与类器官实验,绘制一幅理解细胞命运与群体动力学的连贯地图。


本次读书会由李辉、王维康、韦晓慧三位学者及王艳博士共同发起,并沿两条主线展开:一是探讨细胞命运、多稳态等理论核心;二是结合单细胞测序、时序推断等方法,学习如何将静态数据转化为动态模型。




详情请见:


1.

2.

3.

4.

5.

6.

7.

8.

9.

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
炸裂!中粮集团春招公告,学历从大专起步,外语水平居然不设限…

炸裂!中粮集团春招公告,学历从大专起步,外语水平居然不设限…

火山诗话
2026-01-22 10:40:46
2-4!乒坛再爆冷门:日本三大世界冠军被淘汰,张本美和女单四连冠!

2-4!乒坛再爆冷门:日本三大世界冠军被淘汰,张本美和女单四连冠!

好乒乓
2026-01-24 10:39:08
大寒时节,民间老话讲:“大寒吃三宝,丢掉老棉袄”,是指哪3宝

大寒时节,民间老话讲:“大寒吃三宝,丢掉老棉袄”,是指哪3宝

江江食研社
2026-01-24 07:30:06
太阳报:前西班牙主帅莫雷诺执教过度依赖AI,甚至用AI签球员

太阳报:前西班牙主帅莫雷诺执教过度依赖AI,甚至用AI签球员

懂球帝
2026-01-25 06:16:40
北京下了死命令,2027年底前,所有中小学必须告别“校外配餐”

北京下了死命令,2027年底前,所有中小学必须告别“校外配餐”

近史博览
2026-01-19 15:32:32
风向有点不对了!市场开始喊出“去白银化”,难道风暴要来了吗?

风向有点不对了!市场开始喊出“去白银化”,难道风暴要来了吗?

流苏晚晴
2026-01-24 20:37:01
三峡大坝账本曝光:运行了 20 余年,2500 亿投入如今回本了吗?

三峡大坝账本曝光:运行了 20 余年,2500 亿投入如今回本了吗?

现代小青青慕慕
2026-01-23 21:35:30
快船球星哈登回应全明星:一切顺其自然&会带儿子来快船现场观看

快船球星哈登回应全明星:一切顺其自然&会带儿子来快船现场观看

郭錉包工头
2026-01-25 03:41:25
演员王传君发文宣布退出

演员王传君发文宣布退出

乔话
2026-01-22 17:43:06
万万没想到,丁克大半辈子的张铎,如今在46岁迎来了人生高光时刻

万万没想到,丁克大半辈子的张铎,如今在46岁迎来了人生高光时刻

胡一舸南游y
2026-01-14 13:20:09
最快几天内,恐要开战!伊朗革命卫队开始转移大量导弹和无人机

最快几天内,恐要开战!伊朗革命卫队开始转移大量导弹和无人机

青青子衿
2026-01-23 02:15:44
向美国捐8亿被骂叛徒!无锡唐氏21代掌门:我的钱只认文明归属

向美国捐8亿被骂叛徒!无锡唐氏21代掌门:我的钱只认文明归属

李砍柴
2025-07-18 23:42:24
1-2,联赛第14遭联赛第23掀翻,英超前冠军连续3轮不胜

1-2,联赛第14遭联赛第23掀翻,英超前冠军连续3轮不胜

侧身凌空斩
2026-01-25 01:09:21
上海一大爷在直播间“上头了”,砸进去10多万,买回数十条号称“野生高货”的手串,突然发现不对劲!

上海一大爷在直播间“上头了”,砸进去10多万,买回数十条号称“野生高货”的手串,突然发现不对劲!

环球网资讯
2026-01-24 15:33:08
闻名后世的“桑弘羊之问”,难倒了中国历代的知识精英!

闻名后世的“桑弘羊之问”,难倒了中国历代的知识精英!

尚曦读史
2025-12-19 10:28:06
PS5暴死新游被LGBT群体嘲讽:这就是"反觉醒"的下场

PS5暴死新游被LGBT群体嘲讽:这就是"反觉醒"的下场

游民星空
2026-01-23 13:13:21
湖人消息:裁判报告公布,老詹离队倒计时,战独行侠出场更新

湖人消息:裁判报告公布,老詹离队倒计时,战独行侠出场更新

冷月小风风
2026-01-24 10:40:01
今年,可能是史上最冷清的春节。

今年,可能是史上最冷清的春节。

诗词中国
2026-01-23 19:24:10
北京下最后通牒?新加坡连夜撕毁半世纪盟约,赖清德谋独彻底崩盘

北京下最后通牒?新加坡连夜撕毁半世纪盟约,赖清德谋独彻底崩盘

听风行天涯
2026-01-24 18:01:24
惊人小魔术,刘谦来了都得看两遍

惊人小魔术,刘谦来了都得看两遍

远方青木
2026-01-23 00:24:26
2026-01-25 09:52:49
集智俱乐部 incentive-icons
集智俱乐部
科普人工智能相关知识技能
5625文章数 4662关注度
往期回顾 全部

科技要闻

马斯克SpaceX背后的她:现实版钢铁侠小辣椒

头条要闻

媒体:特朗普发布与一只企鹅上格陵兰岛图片 举世哗然

头条要闻

媒体:特朗普发布与一只企鹅上格陵兰岛图片 举世哗然

体育要闻

当家球星打替补,他们在故意摆烂?

娱乐要闻

回归还是顶流 凤凰传奇将现身马年春晚

财经要闻

隋广义等80人被公诉 千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

艺术
时尚
家居
本地
旅游

艺术要闻

18位西方画家笔下的女人,美得惊艳了时光!

冬天最佳“显瘦”公式:上短+下长

家居要闻

在家度假 160平南洋混搭宅

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

旅游要闻

云南昌宁金山云海美成流动仙境

无障碍浏览 进入关怀版