乳腺癌是全球女性中最常见的癌症,也是导致女性癌症相关死亡的主要原因之一。揭示乳腺癌的起源,解析演化过程中基因如何影响表型并驱动乳腺癌的发展,对于乳腺癌的预防和治疗具有重要意义。人类乳腺癌可分为雌激素受体(ER)阳性、ER阴性、人表皮生长因子受体(HER2)阳性和三阴性乳腺癌等多种亚型。正常乳腺组织中的上皮细胞有三种:包括激素响应型腔面细胞(LumHR)、分泌型腔面细胞(LumSec)和基底 - 肌上皮细胞(MyoEpi)。然而,由于乳腺癌细胞具有高度的表型可塑性,不同亚型的乳腺癌究竟源自哪种上皮细胞一直缺乏直接的证据。
肿瘤祖先克隆由于其基因组变化小,表型上更接近于正常的上皮细胞,是推断肿瘤起源的最直接线索。但该群体通常存在的比例极低(甚至进化过程中已消失),一直难以被捕获和研究。另一个亟待解决的科学问题是:在乳腺癌进展过程中,基因型(如DNA拷贝数的变异:CNAs)如何影响表型(如基因的表达变化),进而推动乳腺癌的发展。根据经典的基因剂量模型, DNA 拷贝数变化往往导致同一染色体区域基因表达水平的相应变化。然而,由于缺乏单细胞水平上的基因型和表型的对应关系,这种变化一直难以被准确量化。回答上述两个核心科学问题的最大挑战在于缺乏一种高通量、高分辨率的单细胞基因型-表型共测序技术。
为了克服该挑战, 2025年9月4日, 中国科学院分子细胞科学卓越创新中心(生物化学与细胞生物学研究所)的王开乐课题组与MD安德森癌症中心的Nicholas Navin课题组合作在Cell上发表了Coalescing single cell genomes and transcriptomes to decode breast cancer progression论文。该论文报道了首个高通量、高基因组分辨率的单细胞基因组(DNA)与转录组(RNA)共测序方法:wellDR-seq。为了实现同时对单细胞的DNA和RNA分子进行测序,该技术的主要开发者王开乐和叶睿通过对反应体系成百上千次的优化,实现了在一个纳升反应小孔里面同时完成对DNA和RNA分子的标记和扩增。进一步将该反应体系结合双重组合索引技术和纳升小孔芯片,最终实现了同时对1-2千个单细胞的基因组和转录组进行高质量测序。
图一:wellDR-seq简略示意图
研究人员首先利用MDA-MB-231细胞系对wellDR-seq方法进行了全面的评估。评估发现wellDR-seq的DNA数据质量等同或优于与其他单细胞DNA单模态测序方法,其RNA的数据质量也达到了其他单细胞RNA单模态测序的水平。在肿瘤研究中,利用单细胞RNA测序(scRNA-seq)数据推测拷贝数变化,被广泛用来描述肿瘤基因组异质性。然而,推测的拷贝数数据真的可靠吗?利用wellDR-seq数据,作者比较了wellDR-seq测到的DNA拷贝数数据和用RNA推测出来的DNA拷贝数数据,发现仅用scRNA-seq推测出来的DNA拷贝数存在大量的假阳性事件,尤其是小的拷贝数事件(整体相关性仅有50%左右)。这一结果提示,在解读仅利用scRNA-seq推测出来的拷贝数事件时要十分小心,警惕过分解读假阳性结果导致的错误结论。wellDR-seq的数据也为评估仅通过scRNA-seq数据推测DNA拷贝数变化的方法(如inferCNV,copyKAT等)提供了金标准。
验证了该技术之后,作者对12例ER+乳腺癌样本的三万多个细胞进行了wellDR-seq测序。通过分析wellDR-seq的单细胞DNA数据,在4例乳腺癌中鉴定到了肿瘤的祖先克隆群体。进一步对该群体的单细胞转录组数据分析,发现这些肿瘤的祖先克隆群体都具有最高的LumHR上皮细胞特征计分。说明这些祖先克隆来源于LumHR上皮细胞,而癌症克隆又来源于这些肿瘤祖先克隆。因此可以推测,ER+的乳腺癌起源于正常乳腺的LumHR上皮细胞。通过ER+乳腺癌的例子,作者证明了wellDR-seq可以用来鉴定肿瘤的起源。值得一提的是,wellDR-seq是一种通用性单细胞DNA&RNA共测序方法,并不局限于乳腺癌,该技术也可被应用于鉴定各种不同类型的肿瘤起源问题。
除了鉴定肿瘤的起源,利用wellDR-seq,作者还发现在非肿瘤的上皮和基质细胞(本研究没有包含免疫细胞)中也存在DNA拷贝数变化。通过进一步分析发现,上皮细胞中含有突变的细胞全部来自于腔面上皮(LumHR和LumSec),且这些突变主要在常染色体区域;而基质细胞中突变的细胞来自成纤维细胞(fibroblast)、周细胞(pericyte)和内皮细胞(endothelial cells),这些突变主要集中在ChrX。这也从侧面提示上皮细胞更容易导致癌症的发生。
此外,该研究首次在单细胞层面系统性地量化了基因拷贝数变异对基因表达的影响。通过对多个ER+乳腺癌样本的分析,研究者 惊讶地 发现, 两个亚克隆之间的差异表达基因主要(69%)分布在克隆间染色体拷贝数没有变化的区域,而非有拷贝数变化的区域。在DNA片段化水平上,进一步对具有CNAs的DNA片段内所有基因的平均表达量变化分析发现,有56%的CNAs片段与平均基因表达量成正相关,且 随着拷贝数增加,基因表达水平呈 近线性 增长 。在单基因表达水平上,研 究 进一步 将所有基因分为 剂量敏感型 和 剂量不敏感型 , 并且鉴定了哪些乳腺癌常见基因为剂量敏感性(如 PGR、AURKA和RB1 ),哪些为不敏感型( 如PIK3CA、BRCA1和TP53 )。这些数据 表明,CNA s 虽然对基因表达有直接影响,但并非所有基因表达差异的唯一决定因素。通过wellDR-seq的 双 模态数据, 该研究 揭示了基因组变异对转录组的复杂影响,为理解肿瘤的表型多样性提供了重要依据。
总之,该研究开发了高通量的单细胞基因组和转录组共测序技术wellDR-seq,鉴定了导致乳腺癌起始的祖先克隆群体,揭示了LumHR上皮细胞为ER+乳腺癌的起源细胞,发现并鉴定了含有拷贝数变化的非肿瘤细胞的细胞类型,定量表征了乳腺癌进展中的拷贝数变化与基因表达复杂的调控关系。wellDR-seq是一种通用技术,可被广泛应用于研究不同肿瘤的起源和演化、研究基因型与表型的互作。除癌症研究外,wellDR-seq 在生物学和生物医学的多个领域都将具有广泛的应用,包括产前基因检测、DNA复制、发育生物学、神经科学、正常组织嵌合体、衰老以及微生物学等。
图二 wellDR-seq研究ER+乳腺癌的起源和亚克隆基因剂量效应
中国科学院分 子细胞 科学 卓越 创新 中心 (生物化学与细胞生物学研究所)、核糖核酸功能与应用全国重点实验室的 王开乐 研究员和MD安德森癌症中心的Nicholas Navin为本文的共同通讯作者。同时王开乐研究员和MD 安德森癌症中心 的 叶睿 博士 为该论文的共同第一作者 。MD安德森癌症中心的柏珊珊、肖珍娜、杨蕾、李剑卓、唐晨领等,分子细胞中心的彭瑾雨以及MD安德森和贝勒医学院的临床医生也为本研究做出了重要贡献。
王开乐课题组长期招聘基因组学和计算生物学博士后,欢迎感兴趣同学申请(详情请见: https://wanglab.sibcb.ac.cn/wanglab/index.html )。
https://doi.org/10.1016/j.cell.2025.08.012
制版人: 十一
学术合作组织
(*排名不分先后)
战略合作伙伴
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
近期直播推荐
点击主页推荐活动
关注更多最新活动!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.