一般认为,植物细胞中的叶绿体和线粒体起源于原始蓝细菌和ɑ-变形菌,是真核细胞中拥有少量基因组的半自主性细胞器。在包括水稻在内许多现存的真核生物中发现线粒体DNA(mitochondrial DNA, mtDNA)和叶绿体DNA(plastid DNA, ptDNA)向细胞核基因组的转移,形成了核内线粒体DNA(nuclear mitochondrial DNA, NUMT)和核内叶绿体DNA(nuclear plastid DNA, NUPT),统称为核内细胞器DNA(nuclear organelle DNA, NORG)。这种细胞器DNA向细胞核的转移显著增加了细胞核基因组的遗传多样性,并在生物演化中发挥了重要作用。
2025年4月25日(DNA日),华中农业大学作物遗传改良全国重点实验室、洪山实验室水稻研究团队联合沙特阿卜杜拉国王科技大学在Genome Research发表了题为Continuous infiltration and evolutionary trajectory of nuclear organelle DNA inOryza的研究论文。该研究以稻属(Oryza)为研究对象,通过泛基因组分析和系统发育追踪,系统揭示了核内细胞器DNA(NORG)的插入模式、结构复杂性及演化规律,展开植物细胞器DNA核转移机制研究,为深入理解植物基因组演化提供了新视角。
在本研究中,通过对7个稻属物种的22个高质量基因组组装进行解析,发现稻属物种中普遍存在丰富的细胞器DNA插入事件,其中20,085个存在于AA基因组中的NORG被归类为3,406个同源NORG组(orthologous NORG group, ONG)。每个基因组中的NORG数量与染色体大小呈强正相关,而总长度与染色体大小的相关性较弱,其主要为 < 1 kb 的短片段,在染色体中接近均匀分布,且通常不位于基因和外显子区域以避免破坏基因功能(图1)。NORG可以包含单个细胞器DNA(orgDNA)片段,也可以由多个orgDNA构成,其中由线粒体DNA和叶绿体DNA共同构成的镶嵌NORG约占11%(图2)。
图1. NORG 长度各异,但在水稻基因组中的数量和分布相对恒定。(A-B) NORG的数量在水稻基因组中相对恒定,且与染色体长度正相关。(C-D) NORG的长度在水稻基因组中差异较大,与染色体长度相关性较弱。(E) NORG主要为1 kb以下的短片段。(F) NORG在染色体上接近均匀分布。
图2. NORG 类型随长度变化,但其比例在水稻基因组中保持一致。(A-E) NORG的5种类型。(F) 不同基因组种NORG类型的比例。(G) NORG的类型随长度变化,>1 kb的NORG主要为复杂NORG。(H) 三种复杂NORG的细胞器DNA片段数。
进一步分析发现,13%的ONG包含接近完整的细胞器基因(NIOG),它们可能是演化中功能性基因替代的来源。在20个AA基因组中,ONG丰富的存在与不存在变异(presence/absence variation, PAV)表明细胞器DNA向细胞核的转移在持续进行,约每百万年发生631–944个插入。越古老的演化分支所共有的ONG越少,这表明NORG在演化过程中不保守,本研究中发现的NORG大多数为AA和BB基因组物种分化后形成(图3)。
图3. 稻属基因组中同源NORG组(ONG)的丰富的存在与不存在变异(PAV)。(A) 5个AA基因组物种的ONG的PAV信息。(B-C) 亚洲栽培稻和非洲栽培稻/野生稻的ONG存在频数。(D) ONG在AA基因组物种中的分布。
进一步使用了3,458个包含亚洲栽培稻(O. sativa)、非洲栽培稻(O. glaberrima)和非洲野生稻(O. barthii)的重测序样本,获得了754个ONG在亚洲和非洲稻群体水平的分布。ONG的多维尺度分析(MDS)很好地区分了亚洲和非洲群体、非洲栽培稻和非洲野生稻、亚洲栽培稻的四个主要群体以及粳稻的三个亚群体,但对籼稻群体的区分效果不佳。进一步观察到ONG的分布具有种群和物种特异性(图4)。
图4. ONG的PAV反映了群体结构和亚群体差异。(A-E) ONG PAV多维尺度分析(MDS)能够区分亚洲稻和非洲稻不同群体。(F) 754个ONG在不同亚群体中的存在频率。
为了探讨NORG的形成机制,作者检查了828个多态性ONG的NORG插入位点的连接序列。结果显示,48%的NORG连接处发现了微同源序列(≥ 1 bp),其长度显著超过随机预期的长度。此外,NORG插入位点还发现了靶位点重复(TSD)和DNA丢失。大多数ONG通过双链断裂修复(DSBR)形成,主要机制是典型的非同源末端连接(c-NHEJ)。基于复制的机制(RBM)如复制叉停滞和模板切换(FoSTeS)、微同源介导的断裂诱导复制(MMBIR)贡献了剩余ONG的形成,导致序列丢失和侧翼序列重复(TSD),这些现象无法用双链断裂修复机制解释。综上所述,双链断裂修复和基于复制的机制都可以生成NORG(图5A-E)。
图5. 细胞器DNA插入的特征反映其形成机制。(A-B) NORG和侧翼序列连接处、NORG插入位点的特征。(C-E) 细胞器DNA插入的特征示意图。(F) 第二染色体上相邻的4个独立NORG插入。
对复杂NORG的形成机制,作者提出了三个假设:(1)单次突变事件,涉及在核插入之前或期间将细胞器DNA片段连接;(2)同一位置的多次插入事件;(3)细胞器DNA插入后的后插入重排。进一步分析显示,大多数复杂NORG是通过单次突变事件形成的(图5F)。转座子(TE)的影响导致了NORG的片段化。例如,ONG0400870在AA基因组祖先中是一个66 kb的线粒体DNA插入,伴随10 kb以上的染色体DNA序列,这些序列在不同演化分支中经历了独立的变化。在亚洲栽培稻、非洲栽培稻和非洲野生稻的共同祖先中,NUMT的中部发生了一段丢失。在亚洲栽培稻中,NORG内部发生了多次独立插入,导致其分散和片段化(图6)。
图6. 转座子造成NORG片段化。(A-D) 转座子在不同材料中的独立插入造成NORG的动态变化。
综上所述,该研究在泛基因组水平将NORG分类为ONG,分析了它们在稻属中的特征和多态性。研究结果揭示NORG在进化过程中的持续插入和非保守性导致种内和种间的变异。细胞器DNA的转移通过双链断裂修复和基于复制的模板转换等机制直接由DNA介导整合到细胞核中,复杂的NORG可以通过单次插入多个叶绿体或线粒体DNA连接片段的突变事件形成。此外,转座子(TE)在造成NORG片段化的演化过程中也发挥了重要的作用。本研究不仅为植物细胞器DNA向细胞核转移的持续和动态进化过程和机制提供了新视角,也为基于泛基因组挖掘新型基因进行作物改良开辟了新思路。
NORG形成和片段化的机制
华中农业大学周菲教授、张建伟教授、林拥军教授及沙特阿卜杜拉国王科技大学Rod A. Wing教授为论文共同通讯作者,华中农业大学宫晨波博士为论文第一作者。该研究得到农业生物育种国家科技重大专项、湖北洪山实验室重大项目、国家自然科学基金、湖北省基础研究重大项目、国家水稻产业技术体系等资助,华中农业大学作物遗传改良全国重点实验室生物信息计算平台提供了数据分析计算资源的支持。
https://doi.org/10.1101/gr.279609.124
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.