![]()
撰文 |章台柳
短串联重复序列( short tandem repeats , STRs )是一类重要的遗传变异,可导致多种神经退行性和神经肌肉疾病,包括亨廷顿病(HD)、运动神经元病(MND)、脊髓小脑性共济失调(SCAs)、强直性肌营养不良 1 型(DM 1 )和 2 型(DM 2 )以及脊髓延髓性肌萎缩症(SBMA)。重复序列在代际传递或体细胞过程中发生的扩增增加,以及重复基序组成的变化,已被证明会影响疾病风险、外显率、严重程度、进展和发病年龄。自 1991 年首次发现 FMR1 基因中的致病性重复序列与脆性 X 综合征之间的关联以来,目前已有超过 70 种神经系统疾病与重复扩增相关。重复序列相关疾病可通过多种机制表现,包括 RNA 积累( DM1 )、蛋白质错误折叠( SCA2 )、翻译后修饰( SCA1 )以及由于高甲基化导致的转录抑制(脆性 X 综合征)。尽管这些疾病较为罕见,但治疗、护理的高昂成本,为病人带来沉重的经济和精神负担,更突显了更好地理解这些疾病以促进和支持药物发现的必要性。
虽然某些重复扩增疾病(例如 HD 和 SCAs )在特定国家和人群中的患病率估计值已有报道,但大多数 STR 的频率和外显率估计值存在偏差,这些偏差源于疾病确定、罕见性、疾病认知度、获得可靠医疗保健的机会以及患者参与基因检测的意愿。事实上,两项使用 PCR 估算重复长度的大规模人群研究(一项针对 DMPK ,涵盖超过 50,000 名个体【1】;另一项针对 HTT ,涵盖超过 7,000 名个体【2】)估计的重复扩增携带者频率高于先前报道。这些观察结果说明了采用基因型优先方法进行人群规模研究的必要性,以检查扩增重复序列的频率、与重复长度增加相关的风险以及重复位点中基序的变异性。目前为止,专注于重复扩增相关疾病的研究大多是疾病特异性或位点特异性的,样本量受到疾病罕见性以及估算重复长度检测方法高昂成本的限制。然而,由于生物库规模的全外显子组测序(WES)和全基因组测序(WGS)数据的广泛可用性以及专用的计算方法,现在正在出现能够同时调用多个位点的重复序列并提供对潜在致病性扩增普遍性见解的人群规模分析。
2 026 年 4 月 8 日 ,来自 再生元遗传学中心 (Regeneron Genetics Center) 的 Sahar Gelfman 团队 在 Nature 杂 志上发表文章 Population-scale repeat expansions elucidate disease risk and brain atrophy ,利用短读长测序的全外显子组和全基因组数据,分析了1,020,833个多样化样本,对病理性重复扩增进行了人群规模的调查,估算了37个疾病相关STR位点的重复长度,计算了致病性重复序列的携带者频率,并比较了不同祖先群体的差异。与先前研究结果一致,对于大多数位点,致病性重复序列的频率高于相应疾病的患病率,在不同祖先群体之间有所不同,并且与流行病学研究中报道的亚群间疾病患病率差异相对应。重复长度与 7,671 种二元性状的关联分析捕捉到了已知的位点 - 性状关联,包括 HTT 与亨廷顿病、 DMPK 与强直性肌病、 C9orf72 与运动神经元病等。最后,即使在疾病诊断之前,几个位点的重复扩增也与神经丝轻链蛋白水平升高( NfL )以及特定疾病相关脑区脑容量减少密切相关。例如, HTT 扩增携带者表现出 22.1% 的壳核体积损失,而 CACNA1A 扩增携带者则显示出 24.6% 的小脑体积损失。这些观察结果表明,脑容量减少和 NfL 水平升高均发生在疾病诊断之前。本研究展示了如何利用短读长测序数据在多样化人群规模队列中表征重复扩增,及其在流行病学和临床生物标志物开发中的应用。
![]()
研究人员综合全外显子组和全基因组数据,并设计了一个工作流程对来自7个队列的1,020,833个全外显子组测序样本中3 7 个疾病相关STR位点进行分析。在整个队列水平,以及由遗传祖先定义的五个亚组(欧洲祖先、非洲祖先、南亚祖先、混血西班牙裔或拉丁美洲祖先以及东亚祖先)中,计算了每个位点上携带重复序列长度超过已报道的前突变和致病阈值的个体频率。接着,基于以下标准为每个位点独立定义了重复扩增阈值:(1) 前突变和 (2) 来自广泛文献检索得到的致病截断值,以及 (3) 根据每个队列中重复长度分布经验得出的前1%、(4) 前0.1%和 (5) 前0.01%的阈值。然后,在这些重复长度基因型与7,671个基于ICD10的二元性状之间进行了全表型组关联研究。最后,比较了致病性重复扩增携带者与非携带者在1,201个脑影像衍生定量体积表型和2,939个蛋白质表达水平上的差异。
研究人员生成了通过全外显子组测序或全基因组测序数据(或两者)可靠调用的37个位点中每个位点的重复长度分布,并计算了前突变和致病范围内重复携带者的频率,并与疾病患病率进行比较。结果显示,致病性重复携带者的频率高于其相关疾病的患病率,与之前的研究结果一致。使用一组单核苷酸多态性来推断遗传结构,将每个样本分配到以下五个组之一:欧洲祖先(EUR)、非洲祖先(AFR)、南亚祖先(SAS)、混血西班牙裔或拉丁美洲祖先(AMR)以及东亚祖先(EAS)。计算每个组内的携带者频率,确定了几个已知和未报道过的血统特异性富集。例如, AR ( 2.51% )和 CACNA1A ( 0.11% )的致病性扩增在 EAS 中富集,特别是与 AFR 中的低频率相比时( AR : 0.46% ,; CACNA1A : 0.01% )。这些富集与相应祖先和地理区域中疾病患病率的已知差异一致,例如 AFR 中 SBMA ( AR )的较低患病率以及日本和韩国中 SCA6 ( CACNA1A )的较高患病率。与其他祖先相比,EUR中出现DMPK(WES)以及C9orf72、FXN和TCF4(WGS)的扩增富集,与报道的EUR中ALS、Fuchs内皮角膜营养不良和弗里德赖希共济失调的较高患病率一致。除了复现已报道的疾病富集外,还发现与 EUR 相比, AFR 中 CNBP 和 JPH3 前突变扩增存在新的富集( CNBP : WGS , 0.98% vs 0.12% ,; JPH3 : WGS , 0.98% vs 0% )。在特定祖先群体中观察到的这些富集和缺失,有助于为特定亚群中的疾病风险建立基线预期。
那么,重复扩增的长度与性状之间是否关联?研究确定了7个独特位点的1 68 个显著关联:AR、ATXN2、CACNA1A、C9orf72、DMPK、HTT和TCF4,其中75个是独特的位点-性状关联,每个位点有多个显著的重复阈值。观察到较为主要的关联包括:DMPK的致病性(≥50个重复序列)扩增与强直性肌病、HTT的致病性(≥40)扩增与亨廷顿病、C9orf72的致病性(≥60)重复长度与MND、TCF4(≥50)与遗传性角膜营养不良等。对于每个位点,观察到多个与相关性状的显著关联。例如,白内障、心脏起搏器和植入物与DMPK扩增密切相关,这与DM1广泛且预期的临床谱一致。值得注意的是,位点 - 性状风险通常随着重复长度阈值的增加而增强。例如,在 HTT 重复长度阈值的前 0.01% ( WES 和 WGS 分别为 44 和 41 个重复序列)观察到最强的 HD 风险, OR 为 2,570 。然而,在 1% 重复阈值( 1:100 ,即 32 个 CAG 重复序列, WES 和 WGS , OR = 62 )和 0.1% 阈值( 1:1,000 , WES 和 WGS 分别为 38 和 37 , OR = 410.2 )仍然观察到高风险,这表明较短重复序列的外显率较低,并随重复长度逐渐增加。同时,外显率随着年龄的增长而逐渐增加,并且在较长致病性重复序列的携带者中更为明显。
在神经退行性疾病中,脑容量减少和NfL水平升高是预期会发生的变化,那么从未诊断为相应疾病的重复扩增携带者的脑影像和NfL读数是否会发生变化?研究人员选择了导致神经退行性疾病的基因,这些基因在UKB中既有未确诊的致病性重复扩增携带者,也有相应的MRI或NfL数据。结果显示,HTT、CACNA1A、C9orf72和TCF4这四个位点与体积表型显著相关,且每个位点扩增携带者受影响最大的区域与相应疾病早期阶段受影响的区域相同。测试HTT、CACNA1A和C9orf72重复序列对从血浆中2,939种蛋白质表达的影响,发现 HTT 重复序列与 NfL 水平升高之间存在强关联。这种相关性意味着,与 HTT 正常重复序列携带者相比,致病性重复序列携带者的 NfL 水平增加了 1.9 倍。与正常重复序列携带者相比, C9orf72 致病性重复序列携带者的NfL水平确实显示出显著增加(1.14倍变化)。在CACNA1A扩增携带者中未观察到这种效应。
总的来说,研究利用大规模人群数据,系统性地描绘了致病性重复扩增的携带者频率,量化了其与疾病风险和脑结构变化的关联,强调了重复长度在疾病发生发展中的核心作用。
https://www.nature.com/articles/s41586-026-10345-6
制版人:十一
参考文献
1. Kay, C. et al. Huntington disease reduced penetrance alleles occur at high frequency in the general population.Neurology87 , 282–288 (2016).
2. Johnson, N. E. et al. Population-based prevalence of myotonic dystrophy type 1 using genetic analysis of statewide blood screening program.Neurology96 , e1045–e1053 (2021).
BioArt
Med
Plants
人才招聘
学术合作组织
(*排名不分先后)
![]()
转载须知
【原创文章】BioArtMED原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArtMED所拥有。BioArtMED保留所有法定权利,违者必究。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.