大豆是世界范围内的重要粮食经济作物,高质量参考基因组是其深入功能研究和高效分子育种的基础。 2018年,Science China Life Science 发表了中科院遗传发育所、中科大、江苏省农科院、北京贝瑞和康生物技术有限公司联合完成的国产大豆“中黄13”的高质量参考基因组 (Gmax_ZH13) ,基因组Contig N50达到 3.46 Mb的高连续性。 然而,受当时测序及组装技术限制,仍有大量的小片段未被定位至染色体。
近日,中科院遗传发育所田志喜课题组和梁承志课题组通力合作,进一步提升了中黄13基因组的组装质量,相关研究成果 (Gmax_ZH13_v2.0) 以“Update soybean Zhonghuang 13 genome to a golden reference”为题,刊出于Science China Life Science2019年第9期。 在Gmax_ZH13的基础上,通过加测数据和更新组装流程,Gmax_ZH13_v2.0的组装质量得到了明显提升 (图1) 。 与Gmax_ZH13相比,未定位小片段 (un-anchored contig) 数目从549个减少至36个,减少17倍; Contig N50从3.46 Mb提高到22.6 Mb,升高6.5倍; 缺口 (gap) 数目从815个减少至448个,减少1.8倍; 缺口 (gap) 长度从20.49 Mb缩短至2.33Mb,缩短 8.8倍。 这些高质量的组装参数充分显示Gmax_ZH13_v2.0已达到了高度的完整性。 除核基因组外,线粒体和叶绿体基因组也被成功组装。 在完整组装基因组序列的基础上,通过加测27个来自不同组织不同发育时期大豆样品的RNA-seq和smRNA-seq数据,研究人员对Gmax_ZH13_v2.0的功能区域进行了详细注释,得到了包括55573个蛋白编码基因、331个MIRNA、297个rRNA、1112个tRNA、166个snRNA、1816个snoRNA和35926个TE在内的注释信息。 同时,所有蛋白编码基因和MIRNA在大豆全生长过程的表达模式被解析。这些信息能够为大豆功能研究人员提供丰富的背景资料,加速大豆的基础研究和分子育种进程。![]()
图1 Gmax_ZH13_v2.0 基因组的更新
A, 基因组组装流程;B,基因组注释信息,从外往内依次为染色体以及蛋白编码基因、重复序列、snoRNA、tRNA、miRNA、snRNA和rRNA的密度;C:蛋白编码基因(左图)和MIRNA(右图)的表达模式。
广州中医药大学中药学院申妍婷研究员 (中科院遗传发育所田志喜课题组博士) 为论文第一作者,中科院遗传发育所在读博士研究生杜会龙为论文共同第一作者。中科院遗传发育所田志喜研究员为论文通讯作者,梁承志研究员为共同通讯作者。该研究得到了国家重点研发计划、国家自然科学基金和植物细胞与染色体工程国家重点实验室项目的资助。
论文链接:https://doi.org/10.1007/s11427-019-9822-2
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.