革命性凝胶微胶囊技术CAGES问世
在当今生命科学研究中,单细胞测序技术已成为揭示细胞异质性与动态过程的利器。然而,该领域长期面临一个关键瓶颈:如何将需要多步操作、条件各异的基因组学分析(尤其是涉及活细胞的实验)拓展至高通量水平。现有的主流技术,如微孔板、微滴或细胞内条形码标记,各自在通量、灵敏度或实验复杂度上存在局限,难以在维持细胞活性的同时,进行复杂的多步骤分子生物学操作。
为此,哈佛医学院系统生物学系的Allon M. Klein团队开发了一项突破性技术——具有两亲性凝胶外壳的胶囊(CAGES)。CAGES能够选择性截留细胞和大分子分析物,同时允许培养基、酶和小分子试剂自由进出,从而首次实现了将活细胞培养与全基因组测序相结合的高通量多步骤实验。研究人员还建立了相应的胶囊内DNA文库条形码标记方法,并成功应用于对数万个扩增细胞克隆的转录组进行测序,以研究基因表达程序的持久性。CAGES与多种酶促反应的兼容性,有望极大扩展当前单细胞高通量测量的范围,并将其延伸至活细胞分析领域。相关论文以“Multistep genomics on single cells and live cultures in subnanoliter capsules”为题,发表在
Science上。
![]()
这项技术的核心在于CAGES独特的设计与制备。如图1所示,研究人员利用微流控液滴内的液-液相分离技术,构建了由Pluronic F127二丙烯酸酯等两亲性聚合物形成的凝胶外壳。这种外壳具有类似泡沫的多孔结构(孔径10-50纳米),能允许小蛋白(如DNA聚合酶)和寡核苷酸等小分子扩散通过,却能将双链DNA等大分子有效截留在胶囊内部的液体核心中(图1F, G, H, I)。这种可调控的通透性阈值使CAGES成为一个物理性质稳定的通用平台,既能像微孔板一样培养和操作单个活细胞或克隆(图1D),又能像微滴一样进行大规模并行处理,甚至可以通过流式细胞分选仪进行分选富集(图1J)。
![]()
图1:Pluronic二丙烯酸酯胶囊的概念、开发与表征。 (A)半透性胶囊示意图及其对高通量单细胞分析的相关特性。(B)胶囊中大规模并行多步骤分析潜力示意图,包括通过迭代添加和去除试剂、成像、分选和测序对单个或培养细胞进行处理。(C)明场显微照片(左)和示意图(右)显示使用微滴发生器共流动两亲性功能化外壳聚合物和亲水性核心聚合物生成CAGES的过程,该体系在液滴形成时发生相分离。随后通过405nm依赖的外壳聚合物交联将其转化为CAGES。红色箭头指示单个细胞。插图为间隔0.12秒的两个快照。比例尺 = 100 μm。(D)在含有单个细胞的DPBS中,8% (w/v):1% (w/v) F127DA:PPPDA外壳、13% (w/v)葡聚糖核心的CAGES的明场显微照片。(E)明场显微照片证明多种两亲性PEG共聚物可形成胶囊。比例尺 = 50 μm。(F)冷冻断裂胶囊的冷冻扫描电镜图像,显示Pluronic二丙烯酸酯外壳膜上孔隙的放大图。红色箭头指向表面孔隙。(G)分析物扩散时间序列中胶囊的共聚焦和明场成像的示例合成显微照片。(H)量化不同大小分析物在不同盐浓度存在下通过CAGE外壳的扩散半衰期的强度时间序列。(I)扩散半衰期显示CAGE通透性存在尖锐的尺寸依赖性截断。图表表示来自≥3次独立实验的平均数据,误差条为标准差;完整数据见表S2。(J)基于流式细胞术的CAGES富集。初始含有<10%标记胶囊的样本(左上)和分选后样本(右上)的合成荧光和明场显微照片,分选后产生约98% FITC阳性CAGES(下图)。比例尺 = 100 μm。
为实现对海量胶囊内样本的高通量测序,团队开发了名为“inC-seq”的灵活拆分-合并条形码标记策略(图2A)。该策略通过在胶囊内进行多轮连接和PCR反应,为每个胶囊内的DNA文库赋予独特的组合条形码。实验证明,该方法能高效地区分来自不同胶囊的样本,交叉污染率极低,与泊松加载模型的预期一致(图2D)。这表明CAGES在整个复杂的多步条形码标记过程中,能有效地隔离每个单元内的生物材料。
![]()
图2:基于拆分-合并策略的CAGES条形码标记用于高通量测序(inC-seq)。 (A)胶囊内DNA文库拆分-合并条形码标记示意图,展示了本工作中使用的通过连接和PCR进行三轮条形码标记的示例。初始文库在共同文库末端序列中含有一个尿嘧啶残基(红色),该残基可被尿嘧啶特异性切除试剂切割,产生具有5‘-磷酸的黏性末端。该黏性末端与含有孔板特异性条形码的条形码双链寡核苷酸阵列连接。重复此过程以引入第二个条形码,并通过PCR引物引入第三个条形码。(B)在CAGES中高效顺序酶促处理DNA的演示,实现了(A)中的步骤(1)。初始未标记文库(左图)通过将胶囊在PCR反应混合物中孵育进行扩增,PCR引物含有尿嘧啶和其3‘末端的Cy5标记。PCR和洗涤后(中图),CAGES显示出保留了现在附着在胶囊内DNA上的Cy5荧光。尿嘧啶切除和洗涤切除了标记引物,产生突出端并失去Cy5荧光(右图)。(C)五步条形码标记方法后DNA扩增子测序数据中的条形码表示:在扩增期间添加了14个PCR条形码,随后进行3步48重拆分-合并条形码添加和胶囊溶解后的16个索引。(D)通过胶囊有效分离文库,通过单细胞gDNA转基因位点(编码GFP或RFP序列)的inC-seq分析观察到低交叉污染。图表显示映射到GFP或RFP的读数数量,每个点对应一个唯一的胶囊条形码。观察到的双联体率符合预期(2.1%),对应于平均细胞负载为0.1个细胞/CAGE、观察到细胞负载比例为70:30 RFP:GFP生成的CAGES。插图为裂解前含有细胞的CAGES示例。比例尺 = 50 μm。
凭借CAGES的通用性,研究人员成功建立了多种单细胞基因组学分析方法。他们优化了单胶囊转录组测序(inC-RNA-seq)和单胶囊染色质可及性测序(inC-ATAC-seq)方案(图3A, B)。无论是分析人鼠混合细胞以验证样本隔离效果(图3C, D),还是对标商业液滴系统(10x Genomics)的性能,inC-RNA-seq均展现出高灵敏度和可重复性(图3E)。此外,该技术还成功应用于处理固定后复苏、低温冻存甚至在培养基中直接封装的细胞样本,显示出处理复杂样本的巨大潜力(图3F-H)。在对人外周血单个核细胞(PBMC)的大规模分析中,inC-RNA-seq获得了超过4.3万个细胞的转录组,清晰解析了PBMC的各类细胞亚群,其性能与主流方法相当(图3I-M)。
![]()
图3:胶囊通过多步处理实现单细胞基因组学分析。 (A)inC-RNA-seq和inC-ATAC-seq文库制备模式的示意图。在通过逆转录和转座步骤捕获转录本(RTb和UMI)和可及gDNA区域(Tn5b)期间,会添加额外的条形码和序列。捕获并扩增的含dU分子经过拆分-合并条形码标记和测序。(B)显微照片显示在CAGES中进行单细胞RNA-seq文库制备的连续阶段,从初始细胞封装到裂解,再到in-CAGE条形码标记前生成扩增的互补DNA(cDNA)文库。gDNA用SYBR Safe染料染色;cDNA用与PCR扩增引物结合的Cy5荧光团染色。(C和D)图表显示每个CAGE对应的映射到人(y轴)和小鼠(x轴)RNA-seq(左)或ATAC-Seq(右)inC-seq文库的UMI或DNA片段数量。观察到的混合物种双联体率符合预期:(C)为2.1%(负载为0.083个细胞/CAGE),(D)为1.9%(负载为0.1个细胞/CAGE)。(E)对来自CAGE scRNA-seq文库的读数进行下采样后,与公开可用的10x Genomics NextGem v3.1数据比较的UMI/reads图表。(F至H)针对从新鲜或PFA固定的K562细胞(F)、新鲜或冷冻的HEK293T细胞(G)或使用DPBS或培养基制备的胶囊(H)生成的文库,如(E)的UMI/reads图表。(I)来自外周血单个核细胞(PBMC)的inC-RNA-Seq数据的二维UMAP嵌入。(J)显示低丰度和高丰度细胞类型特异性基因覆盖度的基因表达热图,以及(K)T细胞和NK细胞亚群划分的高分辨率群体结构。(L)如(F)生成的UMI/reads图表,现针对PBMC数据生成,并比较inC-seq与10x Genomics GEMCode的数据。(M)比较inC-seq和10x Genomics NextGem v3.1之间,每个细胞检测到的基因数量与测序深度的函数关系。
CAGES最具革命性的应用在于其支持大规模的活细胞克隆培养与功能分析。通过优化封装条件,研究人员成功在胶囊内培养了多种细胞系、小鼠原代造血干细胞乃至人诱导多能干细胞,且细胞在胶囊内的分裂速度与在培养板中无显著差异,转录组也未发生显著改变(图4A-C)。利用这一能力,他们设计了一项大规模平行活细胞实验,以研究表观遗传记忆的持久性以及药物对其的影响。他们将经过DNA甲基转移酶抑制剂(地西他滨、5-氮杂胞苷)或组蛋白去乙酰化酶抑制剂(伏立诺他)预处理的K562和L1210癌细胞封装入CAGES,在持续给药条件下培养6天,并分时间点对数千个克隆进行转录组测序(图4D)。通过非负矩阵分解分析,他们识别出在克隆间持续异质表达的基因程序(图4E, F, G),其中一些程序在克隆扩增后仍保持互斥表达模式(图4H)。
![]()
图4:CAGES中的活细胞克隆扩增揭示了持续的基因表达程序。 (A)显示培养细胞系、小鼠原代骨髓造血干细胞(mHSCs)和人诱导多能干细胞(hiPSCs)的克隆在CAGES中生长的显微照片。比例尺 = 50 μm。(B)同时培养的封装克隆的显微照片。比例尺 = 100 μm。图像显示了在CAGES中扩增的高密度K562(多克隆)克隆。(C)在培养板或CAGES中培养的细胞的分裂时间。每个点对应于通过延时显微镜评估的单个细胞分裂时间(K562: n=156;L1210: n=127)。t检验p值>0.8。(D)用于鉴定癌细胞系在经载体(对照)、DNMT抑制剂(5-氮杂胞苷(Aza);地西他滨(Dec))或HDAC抑制剂(伏立诺他(Vor))处理后,持续基因表达程序的实验方案图。显微照片显示了不同时间点的示例胶囊。(E至H)K562细胞中持续基因表达程序的证据;L1210细胞见图S6。(E)在第4-6天K562细胞对照样本中,克隆间基因-基因表达相关性聚类显示出结构化的程序证据,而当随机将第0天取样的细胞组合成“模拟”克隆时,这些程序消失。(F)通过非负矩阵分解(NMF)鉴定的基因表达程序的主要贡献基因,识别出红系、细胞周期、波形蛋白和角蛋白相关程序。完整程序负载见表S3。(G)对照克隆之间15个NMF衍生程序变异的箱线图,显示与模拟克隆相比,随时间推移存在持续的异质性。(H)一些基因表达程序在克隆扩增后仍保持互斥性,从观察到的混合NMF程序克隆数量低于预期可以看出(观察值/预期值 = fObs/fExp;p值来自Fisher精确检验)。
通过对克隆生长过程中基因程序使用情况的动态建模与统计推断(图5A, B),研究人员量化了每种药物对特定基因程序状态切换速率和稳态偏好的影响(图5C, D, E)。有趣的是,与预期相反,这些表观遗传药物并未普遍降低克隆异质性,而是以程序特异性的方式改变了状态的持久性。例如,在K562细胞中,所有三种药物都促使细胞向红系分化状态(程序3)偏移,并增加了该分化状态的持久性(图5C)。这些变化与单个基因的平均表达变化并不完全一致(图5F),揭示了药物作用更复杂的动力学层面。
![]()
图5:DNMT或HDAC抑制剂处理后克隆记忆的改变。 (A)药物治疗对表观遗传记忆可能影响的示意图。在未经处理的对照中,细胞占据每个观察到的程序的高和低基因表达状态。表观遗传修饰酶抑制剂可能会改变状态的相对稳定性(上图情景),也可能降低持久性(较浅的能阱,下图情景)。通过对生长中的克隆进行inC-RNA-seq,可以推断出状态转换速率(箭头)。(B)通过将细胞状态转换的随机模型拟合到观察到的随时间变化的NMF程序使用情况,从克隆inC-RNA-seq数据推断转换速率的方案图。该模型用于推断每种处理条件下每个程序的程序诱导速率(r01)和丢失速率(r10)(见补充文本1)。(C)以一个程序(程序3)为例的拟合转换速率,所有药物都增加了“高”状态的持久性,同时使“低”状态不稳定。(D)从拟合的动态转换速率得出的K562基因表达程序持久性时间的变化,显示一些程序的克隆记忆减少(蓝色),但其他程序则未减少(红色)。(E)相应的稳态偏好(即活跃状态细胞比例)变化,显示出与程序持久性不同的变化。(F)持久性的变化与单个基因平均表达的变化不同,以K562细胞中的一种药物(Aza)为例显示。
总之,CAGES技术的建立为高通量单细胞及单克隆基因组分析提供了一个多功能平台。它不仅兼容复杂的多步骤分子生物学反应,更首次将大规模活细胞培养与功能性基因组读数无缝连接。尽管当前技术在用于单细胞分析时存在空胶囊、反应条件需优化以及活细胞回收困难等局限性,但其在分析难处理样本、研究细胞间相互作用(如发育或免疫互作)、大规模类器官或克隆形成实验等方面前景广阔。CAGES有望成为连接细胞表型与基因型的有力工具,助力构建数据驱动的细胞动力学预测模型,推动基础生物学研究和精准医疗的发展。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.