撰文 | 咸姐
对于癌症而言,相互作用的细胞类型的复杂群体形成了塑造肿瘤发生的强大信号网络,而通过靶向策略控制这些网络正在慢慢地改变癌症治疗,如免疫检查点抑制剂(ICI)在多种晚期实体癌症中的成功【1, 2】。然而,目前临床上对于ICI的反应率存在巨大的异质性,大多数实体瘤患者无法获得长期的临床益处。毫无疑问,全面了解肿瘤相关细胞状态、它们的相互作用模式及其对临床结果的影响势必将有助于为疾病管理和治疗干预提供新的机会。
从T细胞发炎的肿瘤(“热”)到T细胞耗竭的肿瘤(“冷”),已有研究揭示了人类肿瘤中广泛的表型类别[1]。这种分类方式显示了肿瘤特征(包括对ICI的反应),但是却过度简化了肿瘤微环境(TME)的细胞类型和细胞状态。另一方面,单细胞基因组学、空间转录组学和多重成像技术已经成为直接从原始组织标本获得高分辨率肿瘤细胞生态系统图像的强大技术【1, 2】。然而,实际应用上的很多因素在很大程度上限制了这些检测仅能用于单一肿瘤类型、中等规模的样本队列或少量表型标记。
基于以上,2021年9月30日,来自美国斯坦福大学的Andrew J. Gentles和Aaron M. Newman团队在Cell上在线发表题为 Atlas of clinically distinct cell states and ecosystems across human solid tumors 的文章,介绍了一个机器学习框架——EcoTyper,用于从大量、单细胞和空间解析的基因表达数据中大规模识别和验证细胞状态和生态系统,深入了解人类癌症的细胞背景和群落结构,从而阐明了人类癌症中细胞组织的基本单位,并为大规模分析任何组织中的细胞生态系统提供了框架,对新的诊断和个体化治疗具有重要意义。
本文研究人员设计了EcoTyper作为一个广泛适用的框架,用于从原始组织标本中高通量识别细胞状态和多细胞群落。它包括三个关键步骤:从大量组织转录组中对细胞类型特异性基因表达谱进行数字纯化;对转录水平上定义的细胞状态进行识别和定量;以及确定形成多细胞群落的细胞状态之间的联合模式(图1)。EcoTyper的应用包括从新鲜、冷冻或固定生物样本中发现表型和生物标记物;通过整合已知配体-受体对来研究细胞间信号网络;对空间转录组学数据中的多细胞群落进行探索。
为了证明EcoTyper的功能,研究人员利用它来深入分析了16种具有公开的广泛的基因组和临床数据的恶性上皮肿瘤,并且选择了12种细胞类型,它们共同跨越了人类上皮肿瘤中发现的大多数免疫和结构细胞。经过初始质量控制筛选后,EcoTyper产生了71种离散细胞状态,每个细胞类型的状态从3到9个不等。大多数状态在癌中普遍存在,并且在恶性组织中显著富集,强调了独立于肿瘤部位的一些关键共性。然而,许多状态的组织学或临床分别也各有不同。同时,研究人员还观察到细胞谱系和肿瘤类型的基本差异——上皮状态对特定肿瘤类型的特异性最强,其次是成纤维细胞、内皮细胞、髓样细胞和淋巴细胞。
图1 EcoTyper框架示意图及其在16种人类癌症中的应用
EcoTyper实现了一个用于引用引导注释的监督框架,在这个框架中,在一个数据库中学习到的细胞状态可以在另一个数据库中被识别和统计评估。为了评估EcoTyper定义的71种细胞状态的保真度,研究人员探究了4种人类癌症的200,000个单细胞转录组中每种状态的存在情况。在scRNA-seq数据中,94%的细胞状态(71个中的67个)可显著恢复,而且无论平台、细胞类型或数据集如何,恢复率都很高,突显了结果的可靠性。
随后,研究人员通过与已知转录程序、显著表达的标记基因和先前的scRNA-seq研究定义的状态进行比较,对EcoTyper定义的每个状态进行注释。大约2/3的EcoTyper状态可归为已有文献中确定的基因或表型,它也同时揭示了对癌症中可塑性知之甚少的细胞类型,更重要的是,近1/3的EcoTyper状态似乎是新发现的,或是之前未被人类癌症的scRNA-seq所确定。
总的来说,上述这些分析证明了EcoTyper的性能,并强调了它在定义细胞类型特异性转录程序方面的价值,其规模目前超过了其他技术的实际限制。进一步地,研究人员利用EcoTyper的独特输出,绘制了15,008例肿瘤中69种细胞状态的预后图。在发现队列调查的16种上皮癌类型中,大多数细胞状态(69种中的39种)与总生存率显著相关,49%(n=34)在结合了疾病分期、年龄和性别的多变量分析中显著,而且这些结果具有普遍性,在其他数据集中也得到了验证。
肿瘤是一个由空间上和时间上相互联系的细胞状态组成的复杂生态系统,因此,本文研究人员设计了一种基于共生和相互回避模式的数据驱动的细胞状态聚类方法,以确定EcoTyper是否能够重建多细胞生态系统。通过将该方法应用于发现队列中的肿瘤样本,研究人员确定了十个显著紧密结合的细胞群落——“癌症生态型(CE)”。与此同时,通过不同技术实验也验证了此方法的结果,在大量的以及单细胞表达的数据中确定了不同的多细胞群落,并将CE作为人类癌症细胞进行组织的基本单位。随后,研究人员开始探索这些CE的细胞、基因组和临床特征。在发现队列中,8个CE在单变量模型中与预后显著相关;在对分期、年龄和性别进行多变量调整后,有5个CE仍然与预后显著相关。值得注意的是,有两种CE在肿瘤及癌旁组织中出现的频率相似,但在健康组织中消失,提示潜在的区域效应。而通过与其他预测指标进行比较,研究人员发现CE分析可以改善临床结果分析和对免疫治疗反应的预测,即使在没有优化的情况下,多细胞群落也可以捕获具有较高预测价值的生物信号。值得一提的是,研究人员发现两个促炎细胞群(CE9和CE10)在空间上是不同的,可以用来预测早期肺癌的发展,从而将CE动力学与早期肺癌发展联系起来,并提出了一个平台可系统地研究肿瘤细胞生态系统的诊断和治疗潜力。
综上所述,本研究描述了一个可以从基因表达数据解码细胞状态和多细胞群落的整合系统——EcoTyper。阐释了如何从大量组织转录组中分析细胞状态和多细胞群落、如何在不依赖平台的表达数据库中恢复细胞状态和多细胞群落、细胞状态和多细胞群落与免疫治疗反应如何产生关系、以及如何跨越空间和发育时间对细胞状态和多细胞群落进行跟踪。毫无疑问,该方法是精确的,是对现有单细胞分析的补充,并且在产生可实验验证的假设方面具有重大潜力。鉴于EcoTyper的独特功能,其终将被证明在高分辨率和大规模重建健康和疾病中的细胞群落结构方面的巨大作用。
原文链接:
https://doi.org/10.1016/j.cell.2021.09.014
制版人:十一
参考文献
1. Binnewies, M., Roberts, E.W., Kersten, K., Chan, V., Fearon, D.F., Merad, M., et al. (2018). Understanding the tumor immune microenvironment (TIME) for effective therapy. Nat. Med. 24, 541–550.
2. Smith, E.A., and Hodges, H.C. (2019). The Spatial and Genomic Hierarchy of Tumor Ecosystems Revealed by Single-Cell Technologies. Trends Cancer 5, 411–425.
转载须知
【原创文章】BioArt原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.