2月6日,广西大学农学院、广西甘蔗生物育种实验室、亚热带农业生物资源保护与利用国家重点实验室张积森团队牵头,联合福建农林大学、云南农科院等单位在上发表了题为“Multiscale pangenome graphs empower the genomic dissection of mixed-ploidy sugarcane species”的研究论文(Research Article)。该研究以广西大学为第一通讯单位和共同第一作者单位,标志着我国在甘蔗图泛基因组与多倍体遗传解析领域取得重大突破。
该研究首次构建了覆盖现代甘蔗主栽品种及其野生祖先物种的多尺度图谱泛基因组(super-pangenome graph),在此基础上系统解析甘蔗复杂混合倍体基因组结构,提出适用于高倍体作物的剂量感知关联分析(DosageGWAS)新方法,成功锁定一批与分蘖数、产量、含糖量和叶片角度等重要农艺性状相关的关键基因,并通过CRISPR基因编辑验证了SaTB1基因显著促进分蘖、成倍提高甘蔗产量的功能。
这一工作不仅为甘蔗高产优质育种提供了全新的“基因资源地图”和分析工具,也为小麦、棉花、马铃薯等复杂多倍体作物的基因发掘与分子设计育种提供了可直接借鉴的技术路线。
![]()
![]()
甘蔗复杂多倍体图泛基因组策略提升育种关键基因挖掘。
甘蔗基因组为何难解?
甘蔗(Saccharum spp.)是全球最重要的糖料和能源作物之一,提供了世界约 80% 的食糖和 40% 的燃料乙醇。现代栽培甘蔗品种源于高含糖的热带种甘蔗(S. officinarum)与高抗逆的野生甘蔗(S. spontaneum)在一个多世纪前的杂交回交,其基因组呈现出极端复杂的结构特征:倍性高达 8–10 倍甚至更高,染色体数目在 100–130 条之间;同源多倍体与异源多倍体成分并存;染色体断裂、融合和非整倍体现象普遍;重复序列和转座子高度富集。这些特征使得传统的单一线性参考基因组难以同时容纳不同倍性、不同染色体数和不同遗传背景,等位基因剂量难以准确区分,测序数据在比对过程中出现大量多重比对和信息丢失等问题。研究指出,传统“单一线性基因组”范式在甘蔗等复杂多倍体作物中已接近失效,亟需新的基因组参考体系。
解锁甘蔗超级图谱密码
针对上述挑战,研究团队构建了多尺度图谱泛基因组框架。研究选取了覆盖甘蔗属及近缘种的 9 套染色体水平基因组,包括野生近缘种斑茅(Erianthus rufipilus)、不同类型的割手密种(S. spontaneum)、热带种甘蔗(S. officinarum)代表材料以及3个现代主栽甘蔗品种。研究者通过无参考的染色体“社区”构建方法,将来自不同物种和倍性的染色体按序列相似性划分为 10个“染色体群落”,对应甘蔗祖先的 10 条原始染色体,建立了跨物种、跨倍性的统一坐标体系。在此基础上,研究利用图结构将 47–57 条单倍型路径压缩到同一坐标框架中,形成包含约 425.9 万个节点、累计长度约 14.7Gb的超级泛基因组图谱。在总体序列长度约 43.2Gb的情况下,该图谱实现了约 34% 的压缩率,同时捕获了约 82% 的甘蔗基因组多样性,而现有最优单一参考基因组仅能覆盖约34%。这意味着绝大多数自然变异首次被纳入一个统一、可解析的框架中。
![]()
甘蔗属相关染色体群落与图泛基因组。
看清多倍体基因调控玄机
在建立统一的图谱参考体系后,研究团队以此为基础构建了开放染色质图谱、转录组图谱和甲基化图谱,并与传统线性参考进行了系统比较。结果显示,在代表性材料S. officinarum(LA-purple)和S. spontaneum(SES-208)中,图谱参考在保持总体比对率相当的同时,“唯一比对读段”比例显著提升,较单倍体线性参考提高2倍以上,较等位基因级线性参考提高10倍以上,大幅增强了有效信号获取能力。基于图谱分析,研究还识别出 6800–19000 余个仅在线性参考中无法检测的新增开放染色质区域,这些区域富集大量等位变异,揭示了不同物种间转录因子结合位点的系统性差异。以关键蔗糖转运基因 1 为例,图谱显示家种甘蔗特有的上游开放染色质区域与其更高的基因表达水平和更强的糖分运输能力高度一致,为等位特异性调控提供了直接证据。在 RNA-seq和全基因组甲基化测序分析中,图谱同样显著提高了读段比对质量和甲基化位点检出率。这表明,在高倍体基因组中,图谱泛基因组是连接“序列多样性”和“功能调控差异”的更可靠桥梁。
![]()
基于甘蔗属图泛基因组的ATAC-seq分析。
驯化足迹与趋同选择“一网打尽”
依托超级泛基因组,研究团队对 417 份甘蔗及其近缘材料开展了系统的图谱比对和群体遗传分析,材料涵盖野生甘蔗、家种甘蔗、现代栽培品种及近缘种等多个类群。研究共获得 774 万余个高质量SNP,并对等位剂量进行精确估算。群体结构和系统发育分析结果清晰区分了不同物种与杂交群体,证实现代栽培甘蔗中约 70–90% 的遗传成分来源于热带种甘蔗(S. officinarum),并系统量化了不同类群之间的遗传分化与基因组渗入特征。在此基础上,研究进一步开展跨种群选择扫描,重点比较高糖的热带种(S. officinarum)与高抗逆的割手密种(S. spontaneum),在全基因组范围内识别出约 43 Mb的选择清扫区域。这些区域显著富集于碳水化合物和淀粉/蔗糖代谢、植株结构发育及抗逆响应等功能通路,锁定了一批与糖运输与代谢、株型与分蘖、开花期及逆境适应相关的关键候选基因,其中超过一半仅在图谱分析框架下得以发现。在更大的进化尺度上,研究将甘蔗与同属黍族的高粱和玉米进行比较,发现甘蔗与高粱之间存在显著富集的共选基因对,主要涉及碳代谢和激素及胁迫响应通路,而与玉米的共选基因对数量明显较少。上述结果从群体基因组学层面揭示了“高糖、高生物量型”作物在驯化和改良过程中,围绕碳代谢和应激响应模块经历了高度趋同的人工选择。
![]()
甘蔗属群体结构和遗传多样性。
基因编辑解锁甘蔗高产潜能
在众多候选基因中,研究团队重点解析了黍族中经典的驯化基因 TB1(TEOSINTE BRANCHED1)。该基因曾驱动玉米由多分枝的野生类型演化为少分枝、高产的现代栽培型,被认为是作物驯化的重要里程碑基因之一。研究发现,在蔗茅(E. rufipilus)、高粱和玉米之间,TB1 所在基因组区域具有高度共线性;在已驯化或栽培的类群中,TB1 周围的遗传多样性显著下降,表明其在演化过程中受到强烈人工选择。相比之下,八倍体热带种甘蔗(S. officinarum)中 TB1 区域的多样性下降幅度较小,提示在高倍体背景下,驯化过程中等位基因更难被完全固定,这也与甘蔗仍保持一定分蘖能力的田间表现相一致。为验证 TB1在甘蔗中的功能,研究团队利用CRISPR/Cas9技术对热带种(S. officinarum)中的 1 进行定向敲除,获得 21 条不同编辑效率的突变系,其中部分材料的等位协同编辑效率超过80%。与野生型相比,高效突变材料的分蘖数提高约4.0–4.6 倍,分蘖启动显著提前,单位面积蔗茎产量提升约 3.8–4.5 倍,且相关性状与编辑效率呈显著正相关。研究表明,1 是控制甘蔗分蘖和产量的关键驯化基因,传统驯化未能完全“用尽”其潜力,通过定向基因编辑有望实现产量的跨越式提升。
![]()
基于图泛基因组的甘蔗群体基因组学分析及其重要农艺性状趋同选择研究。
新方法破解复杂多倍体遗传解析难题
针对多倍体作物中传统基因组关联分析(GWAS)难以准确刻画等位剂量信息的难题,研究团队在图谱泛基因组框架下提出了剂量感知关联分析新方法(DosageGWAS)。该方法依托超级泛基因组和图结构比对,对等位位点进行连续剂量估算,并在统计模型中综合考虑不同同源及同源异源染色体上的等位剂量,从而突破了二倍体“0/1/2”模型在混倍体作物中的应用限制。与基于线性参考的常规 GWAS相比,“图谱 +DosageGWAS”框架显著提高了关联分析的灵敏度和解释力,不仅检测到更多显著关联位点,而且对糖分性状和叶片角度性状的遗传力解释度由约 0.56/0.58 提升至 0.62/0.78,独立验证的剂量差异位点数量也明显增加。在该框架下,研究成功鉴定出两个具有代表性的关键候选基因。其一是10,位于甘蔗第 9 号染色体约 57Mb区域,在 8 项糖分相关性状中有 6 项表现出显著关联。该基因为水稻细胞壁合成基因10 的同源基因,在甘蔗中,其与高糖相关的衍生等位剂量在驯化过程中呈持续累积和固定趋势,显示出明显的正向选择信号。其二是 5,作为叶片角度和株型调控的关键因子,在第 3 号染色体启动子区域集中富集多个显著关联位点;等位剂量越高,其表达水平越低,对应叶片越直立,相关有利等位在现代栽培甘蔗中显著富集,说明株型改良已成为近现代育种的重要方向之一。上述结果证明,在混倍体作物中精确量化“等位剂量”并纳入统计模型,是打破“隐匿遗传力”和提升关联分析信号的关键。
![]()
基于图泛基因组的剂量GWAS分析与关键位点挖掘。
跨作物推广的技术突破
为验证方法的普适性,研究团队将这一多尺度图谱泛基因组策略推广至异源多倍体小麦、棉花以及同源多倍体马铃薯等多倍体物种。通过对这三类典型多倍体作物构建图谱超级泛基因组并进行比对,结果显示,构建的图谱超级泛基因组能够捕获约 94–97% 的基因组多样性,远高于最佳单一参考基因组的 48–65%,同时显著提升了读段比对质量,弥补了因结构变异而丢失的多样性信息。在马铃薯小规模GWAS实验中,该方法同样提升了关联信号和遗传力解释度。这表明,“多尺度图谱 + 剂量感知GWAS”框架不仅适用于甘蔗,也可跨物种、跨多倍体作物广泛推广,为复杂作物基因组研究和分子育种提供通用工具。
![]()
多尺度图泛基因组策略同样适用于异源多倍体(小麦、棉花)与同源多倍体(马铃薯)。
为复杂作物“换代”铺路
长期以来,现代甘蔗育种高度依赖有限的亲本材料,遗传基础狭窄、种质资源利用不足,制约了产量和抗逆性进一步提升。本研究构建的甘蔗多尺度图谱泛基因组及配套分析流程,有望在多个层面加速育种进程。一是支撑高质量分子标记开发与基因组预测。该体系提供了剂量精确、结构信息丰富的大规模变异数据,可设计适用于多倍体的单剂量标记和高密度芯片,并将剂量感知信息纳入基因组预测模型,有望显著提高多倍体作物的选择准确度,加快早代材料淘汰和优系筛选。二是高效挖掘野生与稀有优良等位。依托图谱开展跨物种比较和群体扫描,可快速锁定来源于野生近缘种或地方品种的抗病、抗逆、高糖、高纤维等优良等位,为“回交导入+基因编辑”提供精准靶点。三是为未来“甘蔗泛基因组联盟”奠定基础。随着中国种、印度种等历史品种和区域性地方品种基因组的不断发布,现有甘蔗属超级泛基因组可持续扩展,逐步形成覆盖全球甘蔗种质的动态演进型“甘蔗基因资源基础设施”。
研究团队同时指出,图谱泛基因组仍面临转录组标准化分析工具不足、复杂重复区域的计算效率,以及不同同源或同源异源拷贝间拷贝数与表达定量缺乏统一标准等挑战。随着相关算法、比对软件和下游分析工具的持续发展,图谱泛基因组有望逐步取代单一线性参考,成为复杂作物基因组学与分子育种的新型基础设施。
研究成果系统突破了多倍体遗传解析的关键技术瓶颈,精准定位了分蘖、糖分等一批重要农艺性状相关基因及其调控元件,并已直接服务于甘蔗高糖、高产分子育种实践。在百余份材料中完成糖分性状关联分析,在遗传多样性捕获、关键性状定位和育种靶标挖掘等方面取得显著成效,为多倍体作物分子设计育种提供了核心技术支撑,应用前景广阔。
本研究得到国家重点研发计划、国家自然科学基金、广西科技重大专项、广西重点研发计划等多个项目的联合资助。
专家点评
从甘蔗到复杂多倍体作物:图泛基因组引领复杂基因组育种新时代
韩斌(中国科学院院士)
张积森团队在发表于《》的研究工作中(Huang et al., 2026),构建了首个面向混合倍性甘蔗种质的多尺度图泛基因组,统一整合了多个物种和数十条单倍型信息,实现了在同一坐标系下对结构变异、拷贝数差异及剂量敏感位点的精确表征。
该研究不仅彻底改写了人们对甘蔗基因组“不可解”的传统认知,还为将甘蔗这一高复杂度基因组作物推进至可设计育种提供了一条通用技术路线,为小麦、苜蓿、马铃薯等复杂多倍体作物的精准改良提供了重要范式。
突破多倍体基因组解析极限,引领甘蔗育种新范式
刘耀光(中国科学院院士)
甘蔗作为全球重要的糖料和能源作物,被视为植物基因组学中最难解析的作物之一。本研究提出的图超泛基因组构建通用策略同样适用于其它植物同源多倍体(如小麦、棉花)和自交多倍体(如马铃薯),可在统一框架下区别处理不同倍性类型,为混合倍性作物组学研究和分子育种提供可复制的技术蓝本与系统性方法范式。
我国是甘蔗种植与蔗糖生产大国,保障糖业安全关乎国计民生。该成果不仅在甘蔗基础研究领域巩固和提升了我国的国际引领地位,也为其他多倍体作物的分子育种提供了系统技术支撑,彰显了从基础前沿突破到产业关键问题解决的贯通式创新,对推动我国甘蔗种业振兴与糖业高质量发展具有重要示范意义。
甘蔗异源多倍体遗传解析与分子育种的新范式
张献龙(中国工程院院士)
张积森团队在近期发表于《》的研究(Huang et al., 2026)中构建了面向混合倍性甘蔗种质的多尺度图泛基因组,将不同物种来源、不同拷贝数及剂量状态的单倍型统一映射到同一坐标系,为异源多倍体“还原”出一个可计算、可推理的遗传框架。
通过将代表基因功能验证与图泛基因组解析紧密衔接,该研究为甘蔗这一“非整体”的复杂多倍体基因组建立了可操作的遗传—育种路径,突破了复杂多倍体领域长期悬而未解的关键难题,也为复杂多倍体作物在真实剂量背景下开展精细遗传改良提供了可推广的技术范式。

来源丨农学院
编稿丨覃靖雯
排版丨周灏
责编丨叶维佶 陈喜 覃靖雯 谷雯琴
初审丨韦俞妃 黎锦
审核丨欧阳雄姣 杨璞
审定丨孙瑞
出品丨党委宣传部
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.