![]()
撰文丨王聪
编辑丨王多鱼
排版丨水成文
要全面理解细胞生命活动的规则,我们必须了解细胞随时间和空间变化(4D)的完整定量特征,以及细胞内部的化学和物理过程如何协同作用来驱动细胞状态的变化。
目前,任何单一实验都无法同时确定整个细胞的分子组成和结构,但在细胞状态的计算建模方面已取得重大进展,同时也有越来越多的努力将不断增长的大量生物数据集串联起来,利用机器学习(ML)和人工智能(AI)形成细胞状态的快照。以这种方式整合定量生物数据,有望预测细胞在其生命周期不同时间点的完整分子环境。然而,利用 ML 或 AI 方法预测细胞状态的快照(包括分子组成和物理特征),只是对可能结果的抽样,无法揭示导致细胞状态随时间变化的潜在生物、化学和物理过程。
2026 年 3 月 9 日,伊利诺伊大学厄巴纳-香槟分校的研究人员在国际顶尖学术期刊Cell上发表了题为:Bringing the genetically minimal cell to life on a computer in 4D 的研究论文。
该研究成功在计算机上建立了一个包含空间和时间的“4D 全细胞模型”(4DWCM),完整模拟了地球上已知的能够正常分裂的基因最少的生命体——JCVI-syn3A细菌的整个生命周期(从诞生到生长再到分裂)。这不仅是一次炫技,而是人类首次在虚拟世界中,从分子层面逼真地“复活”并“驱动”一个完整的生命体“度过”它的一生。
![]()
![]()
JCVI-syn3A
要理解这项研究的雄心,首先得认识其研究对象——JCVI-syn3A。它并非自然界中天然存在的细菌,而是由人类科学家创造的生命体。
早在 2010 年,J. Craig Venter 研究所的研究团队从丝状支原体(
Mycoplasma mycoides)出发,构建了首个完全合成基因组的细胞 ——JCVI-syn1.0。2016 年,他们删除其中的非必需基因,构建了只有 473 个基因JCVI-syn3.0,这也是地球上已知的基因数量最少的可独立复制的生命体,相比之下,大肠杆菌拥有大约 4000 个基因。但 JCVI-syn3.0 分裂后会出现多种形态异常。2021 年,研究团队构建了JCVI-syn3A,这一版本拥有 493 个基因,每 105 分钟分裂一次,且能够维持规则的球形形态。
这个极其精简的基因组最小细胞,成为理解生命所需“最低配置”以及整个细胞周期全细胞建模的绝佳平台。
此前的研究,或是聚焦于其静态结构,或是将其细胞内部视为均匀混合的“汤”,忽略了分子在三维空间中的精确定位与碰撞过程。而现实是,细胞内部是一个高度结构化、拥挤而动态的世界,分子的位置决定其命运。
混合模拟,跨界协作
为了模拟这个微小而复杂的世界,研究团队采用了“混合模拟”的超级算法。这就像用不同焦距的镜头同时观察同一个场景——
反应-扩散主方程,负责处理基因表达等随机化学反应,它将细胞三维空间离散成边长 10 纳米的微小立方体网格,追踪每一个蛋白质、RNA 分子在这些“小房间”中的扩散与相遇。
布朗动力学模拟,专门驱动染色体这条巨大的“聚合物项链”,它模拟 DNA 链的弯曲、拉伸,以及像“结构维持染色体蛋白”这样的分子机器如何在 DNA 上形成环状结构,帮助染色体在复制后顺利分离。
常微分方程组,则掌管新陈代谢,它计算细胞如何摄取葡萄糖等养分,转化为能量和建造新零件的原料,例如合成 DNA 所需的核苷酸。
最后,一个几何生长模型根据新合成的脂质和膜蛋白数量,实时更新细胞膜的形态,模拟细胞从球形生长、拉长到最终分裂成两个的过程。
这些计算模块并非各自为政,而是每 12.5 毫秒就同步一次数据,形成一个有机的整体。模拟一个JCVI-syn3A细胞的 105 分钟的生命周期,需要在两台高性能 GPU 上不眠不休地运行 4-6 天,消耗约 250 个 GPU 小时。为了获得可靠的统计数据,团队共模拟了 50 个这样的“虚拟细胞”。
![]()
4DWCM 的三维组件可视化
虚拟照进现实
这个复杂的虚拟世界,并非科学家的凭空想象,其构建和验证深深植根于海量的实验数据。模型的初始参数,例如每种蛋白质的数量,来源于真实的蛋白质组学测量。
细胞生长和分裂的形态,则受到新型荧光显微镜成像实验的直接约束。研究显示,这个最小化细胞主要通过对称分裂进行繁殖,形态多为球形、长椭球形或哑铃形。
模型最令人信服的成就之一是其预测与 DNA 测序实验的高度吻合,模型预测的 DNA 复制时间与实验测量的结果几乎一致。通过分析 DNA 测序的“阅读深度”,研究团队可以计算出染色体复制起点和终点的拷贝数比例。模型预测的比例为 1.28,而实验测得的比例为 1.21,两者高度接近,强有力地证明了模型的准确性。
生命的随机性与确定性
模拟揭示了生命过程中精妙的随机性与稳健的确定性并存。在 50 个被模拟的“同胞”细胞中,DNA 复制开始的时刻最早为 2 分钟,最晚可推迟到 46 分钟,波动很大。
但所有细胞最终都成功完成了复制和分裂。由于空间随机性的存在,细胞分裂时,核糖体、蛋白质等在两个子细胞中的分配并非精确的一半一半,而是接近二项分布,就像随机撒豆子。此外,没有两个模拟的细胞是完全相同的,这正反映了真实生命的独特性和多样性。
![]()
细胞分裂后,大分子在反应扩散主方程(RDME)晶格上随机扩散,从而分配到子细胞中
模型还量化了细胞“工厂”的繁忙程度:平均而言,在任何时刻,大约 70% 的“复印机”(RNA 聚合酶)处于活跃状态,55% 的“装配机”(核糖体)正在工作。模型还预测了每种 mRNA 的平均寿命和翻译效率,这些都与在其他细菌中的测量范围相符。
![]()
基因表达与大分子组装的动力学
意义、局限与未来
这个4D 全细胞模型(4D whole-cell model,4DWCM)的构建,是系统生物学和计算生物学领域的一次巨大飞跃。它首次在时空维度上整合了最小细胞的所有核心生命过程,为在分子层面理解生命的基本原理提供了一个“数字沙盒”。
研究人员可以在这个模型上进行“虚拟实验”,例如敲除某个基因或改变环境参数,观察其对整个生命系统的级联效应,这比真实实验更快、成本更低。当然,模型仍有其局限。例如,为了计算可行性,它尚未模拟“多聚核糖体”现象,这可能会低估某些长蛋白质的合成速度。此外,染色体最终分离到子细胞的过程,目前依赖一个假设的微小外力辅助,其确切的生物学机制有待进一步研究。模型的部分参数借鉴自其他细菌,需要未来在 JCVI-syn3A 中直接测量代谢物浓度、mRNA 半衰期等数据来进一步完善。
尽管如此,这项工作已经为我们打开了一扇前所未有的窗口,它不仅帮助我们理解最简生命,其构建框架和方法也为未来模拟更复杂的细胞(例如人类细胞)奠定了基础。
论文链接:
https://www.cell.com/cell/fulltext/S0092-8674(26)00174-1
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.