全基因组关联研究(GWAS)为揭示人类遗传多态性如何影响人类表型多样性提供了基石性的平台,而数量性状基因座对于基因表达的影响(expression quantitative trait loci,eQTL)则通过特定基因的表达桥接了基因型和表型之间的关联。然而,一个重要的问题是,人类基因组中的基因型数据,是通过何种原理来调节特定基因表达量数据的?一个重要猜想是,转录因子及其他转录相关蛋白,通过结合非编码区的顺式调控元件,进而实现对于特定基因表达的机制性调控。因此,基因组领域近期的部分工作通过解析非编码区突变,提出了顺式作用元件染色质可及性影响的重要性,进一步强化了“基因型-染色质状态-基因表达-人类表型多样性”的关联性证据链。然而,大量的基因型数据仅在个体,原初细胞状态下存在,领域内尚缺乏足量的与染色质状态直接具有组织特异性对应的基因型信息,进而影响和局限了在特定谱系和细胞系状态下,对于遗传突变如何影响表型多样性这一问题的机制性深度挖掘的可能性。
染色质可及性的测序数据本身包含了谱系和细胞状态特异性开启区域中所涵盖的部分基因型数据,并且随着DNase-Seq和ATAC-Seq等测序方案的大量普及和深度应用,领域内存在着大量的染色质可及性数据库,且具有与之相对应的RNA-Seq数据集。因此,如何高效利用和挖掘染色质可及性数据库,并在其中提取到关键的基因型信息,成为研究更细化的细胞谱系特异性状态中基因型与表型因果性关联中的核心挑战。
近日,来自约翰霍普金斯大学的 Alexis Battle 研究组和来自宾夕法尼亚大学Christopher D. Brown研究组在Genome Biology上发表标题为
Genotype inference from aggregated chromatin accessibility data reveals genetic regulatory mechanisms的研究论文(共同一作为宾大博士研究生Brandon Wenz与约翰霍普金斯大学博士毕业生何源),通过整合公共数据库中超过10000个以上的ATAC-seq样本,创新性地开发了一套从染色质可及性数据中萃取基因型,并系统鉴定caQTL(染色质可及性数量性状位点)的分析流程,揭示了遗传变异如何通过调控染色质开放状态影响基因表达及复杂性状,为GWAS信号的分子机制解析提供了重要资源宝库。
研究人员首先整合了GEO数据库中的653项研究中的,涵盖10293个ATAC-Seq样本,这些数据本身覆盖了多种细胞和组织类型,及不同的生理和病理性状态。研究人员对比采用了多种基因型恢复算法,发现基于连锁不平衡进而增强基因型补充的Gencove算法,对比其他的方案,在ATAC-Seq的基因型萃取任务中具有更好的表现,其对基因组的覆盖要求低至0.04x,并且在短片段和长片段的归因回补(imputation)中均可高效实现较为准确的预测。紧接着,研究者利用恢复的基因型恢复了1454名独特数据供体,避免QTL计算中出现重复样本。此外,研究者还对ATAC-seq数据校正做了进一步优化,包括ATAC-Seq特异性校正和样本批次校正。
图1 研究样本和流程总结
利用萃取得到的基因型数据和校正后的ATAC-seq,研究人员通过QTL分析鉴定出了多达24159个的caQTL。研究人员发现,这些caQTL富集于顺式作用元件当中(如增强子,启动子等),并与转录因子结合区域重合,揭示了caQTL的基础原理之一,是通过影响转录因子在特定区域的结合,进而影响该区域的染色质开放程度。此外,研究者还通过分类ATAC-seq数据,指出样本来自不同组织来源,从而鉴定出了组织特异的caQTL,发现其中36%的caQTL仅在部分组织中显示出潜在调控作用。
那么系统性的caQTL分析,是否可以成为桥接GWAS和基因表达的机制性方案呢?研究人员将找到的caQTL与已知的eQTL进行位点共享分析,发现其两者共享13%的最强变异点(lead variants)。进一步的,当加入caQTL和eQTL的共调控分析后,GWAS的可解释率比单纯的eQTL高28%,提示“SNP-caQTL-eQTL-traits”的全关联性证据链对于GWAS的机制性挖掘具有更好的准确性和特异性。
综上,这项研究不仅提供了丰富的caQTL资源宝库,更重要的是展示了整合多组学数据解析复杂性状遗传基础的强大潜力。未来,随着单细胞技术和空间组学的发展,研究者有望在更精细的尺度上揭示遗传变异的调控机制。该研究的分析流程和资源将为功能基因组学和精准医学研究提供重要参考。
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-025-03538-1
制版人: 十一
学术合作组织
(*排名不分先后)
战略合作伙伴
(*排名不分先后)
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
会议资讯
近期直播推荐
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.