华中农业大学 生命科学技术学院、生物医学与健康学院陈振夏课题组与信息学院章文教授课题组合作在国际学术期刊Genome Biology在线发表了题为Mammalian conservation of endogenous G-quadruplex reveals their associations with complex traits的 研究论文 。该研究系统解析了人类内源性G-四链体(eG4)在哺乳动物谱系的演化图谱,并基于DNA大语言模型开发出性能领先的跨物种eG4预测工具,揭示了高度保守eG4在基因调控与人类复杂性状中的重要作用,为理解基因组调控元件的演化规律及疾病机制研究提供了全新视角。
解密“基因调控枢纽”的演化密码
DNA 并非仅以双螺旋形式存在,由 鸟嘌呤富集 序列形成的 G- 四链体( G4 )是一类重要的非 B 型 DNA 结构。生物体细胞内存在的内源性 G- 四链体( eG4 )被证实是调控基因表达的“分子枢纽”,能影响转录因子结合、染色质状态,进而调控关键生命过程。然而,长期以来,人类 eG4 的演化保守模式及其与功能的关联,一直是基因组学领域的未解之谜。
演化保守性是判断调控元件“功能性”的金标准之一。为此,研究团队整合 EndoQuad 数据库与 7 种人类细胞系的 G4 CUT &Tag 数据,构建了包含 404,538 个 eG4 的全面参考集,并结合 Zoonomia 联盟的 241 种哺乳动物基因组比对数据,首次绘制出人类 eG4 在哺乳动物谱系的演化图谱(图1)。
通过计算每个 eG4 在 240 个非人类哺乳动物基因组中的碱基保守率,研究团队发现人类 eG4 主要由三种不同演化保守模式的 eG4 组成(图1):高度保守型( C1 )、活跃演化型( C2 )和灵长类特异型( C3 )。其中, 92,910 个 高度保守 eG4 (占比 23% )表现出最强的跨物种序列保守性。研究团队还发现转座元件对灵长类特异型 eG4 的演化扩张具有重大贡献。 SINE-VNTR-Alu ( SVA ) 反转录转座子主要驱动人类特异型 eG4 的演化扩张。而对于仅在人猿总科、狭鼻下目和简鼻亚目中保守的 eG4 来说,其演化扩张主要由内源性逆转录病毒 1 ( ERV1 )反转录转座子驱动。
突破性工具 eG4finder :基于 DNA 大语言模型预测 eG4 的“利器”
为了 验证人类 eG4 的 演 化保守模式与其结构保守水平之间的一致性 ,研究团队还开发了基于大语言模型的 eG4 预测工具 eG4finder(图2)。 eG4finder 以 DNABERT-2 为基础,该基础模型使用了包含人类在内的共 135 个物种的基因组进行预训练,捕获了全面的基因组语法规则并具有极强的泛化能力。通过人类 eG4 的全面参考集进行 微调 , eG4finder 能仅根据 DNA 序列精准预测潜在 G4 序列在体内形成 eG4 的潜力。
在 eG4 预测任务中, eG4finder 在人类测试集上的预测准确率达 0.89 , AUROC 达 0.94 ,较其他 G4 预测工具性能提升 23% 至 106% 。 eG4finder 在小鼠、猪、鸡等跨物种预测中同样表现优异。这为解析不同物种中 eG4 的演化与功能提供了高效工具,将极大推动比较基因组学研究。
哺乳动物谱系中高度保守的 eG4 是关联发育、衰老与复杂性状的关键调控 元件
利用 eG4finder 预测非人类哺乳动物 eG4 ,研究团队验证了高度保守型 eG4 的高度跨物种结构保守性。进一步研究发现,不同演化保守模式的 eG4 具有不同的功能分工:高度保守型 eG4 主要富集于发育和衰老相关的关键生物过程,活跃演化型 eG4 集中于糖代谢相关功能,而灵长类特异型 eG4 则更多参与嗅觉相关通路。
更重要的是,高度保守 eG4 展现出极强调控潜力:它们更倾向于分布在染色质调控区域(启动子和增强子),具有更高的染色质可及性、更丰富的转录激活型组蛋白修饰(如 H3K4me3 和 H3K27ac ),且 DNA 甲基化水平更低,与大多数转录因子的亲和力更高,是名副其实的转录调控枢纽。
在与人类复杂性状的关联分析中,高度保守 eG4 的优势进一步凸显(图3):全基因组关联研究( GWAS )中与疾病、表型相关的遗传变异在高度保守 eG4 中富集度最高,而常见变异的富集度最低,且其携带的变异更可能影响致死基因、高度保守基因的表达。例如,位于高度保守 eG4 中的变异 rs402072 ,可调控致死基因 PRKD2 的表达,与糖尿病患病风险密切相关。这表明高度保守 eG4 受到严格的种群内纯化选择,其内的遗传变异可能直接影响关键基因活性,进而影响复杂性状和疾病风险。
华中农业大学 生命科学技术学院博士生张泽昊 、信息学院博士生王紫嫣和武汉大学泰康医学院博士后李聪慧 为该论文的共同第一作者,陈振夏教授 与章文教授 为该论文的 共同通讯作者 。
论文链接:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-025-03750-z
制版人:十一
BioArt
Med
Plants
人才招聘
学术合作组织
(*排名不分先后)
战略合作伙伴
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.