![]()
长读长测序技术已在全基因组层面实现了对人类结构变异的深度解析,同时提升了对嵌合结构变异的识别能力。随着单倍型分型技术的不断发展,结构变异检测迎来了全新技术路径——无需依赖全基因组从头组装,便可直接获得单倍型分辨率水平的变异信息。然而,当前主流方法在单体型信息的挖掘与利用上仍存在明显不足,难以精准区分多等位基因及嵌合结构变异;同时,在多种测序平台间的普适性依然受限。这些瓶颈正成为阻碍高效、精准单倍型感知结构变异分析的关键挑战。
01
cuteHap方法创新构建
近日,哈尔滨工业大学王亚东、姜涛团队在Advanced Science期刊发表题为“cuteHap: Haplotype-Aware Structural Variant Detection in Phased Long-Read Sequencing Data”的研究论文,提出了一种面向分型长读长测序数据的单倍型感知结构变异检测新方法cuteHap(图1)。该方法创新性提出了基于分型质量的基因组区域评分量化方法,将基因组划分为高质量区与低质量区,并根据区域质量决定后续等位基因聚类与识别过程对分型信息的依赖程度。针对不同区域采用差异化的等位基因识别策略:在分型高质量区域,进行单倍型特异的自适应聚类与等位基因整合;在分型低质量区域,采用基于聚类可信度优先的集束搜索,结合改进的贝叶斯估计框架推断基因型。两种策略有效地利用了单倍体分型信息,获得精准的且具有单倍型分辨率的结构变异集合。同时,该方法根据测序片段的单倍型溯源分布实现低等位基因嵌合变异检测,为遗传学、临床医学研究提供了有效方法。
![]()
文章发表在
Advanced Science
![]()
图1. cuteHap方法的示意图
01
cuteHap实现卓越结构变异检测
研究团队基于HG002、NA12878等多个国际人类金标准数据集开展系统测试(图2)。在最新HG002 T2T金标准下,cuteHap在PacBio HiFi与ONT测序平台均达到最高F1分数(分别为94.66%、93.75%)。在单个等位基因严格比对中,cuteHap优势进一步凸显,较次优方法分别提升6%和3%。在模拟数据集、复杂医学相关基因挑战集、白金家系样本上,cuteHap均持续保持最优F1表现。同时,该方法还能够精准解析杂合变异连锁关系、识别多态性等位基因,充分验证了其优异的单倍型感知变异检测性能。
![]()
图2. 不同数据集下的基准测试结果
02
cuteHap稳健兼容上游差异
为了深入探究分型工具、测序深度等关键因素对cuteHap性能的影响,研究团队进行了系统性评估(图3)。在分型工具选择上,无论采用LongPhase还是WhatsHap,cuteHap在真实数据中F1分数波动均不超过0.5%,展现出优异的稳定性与工具兼容性。在测序深度方面,cuteHap在20×深度下性能保持稳定,且优于其他同类工具;当深度降至5×时,ONT数据的性能出现明显下降。进一步溯源分析表明,低深度下SNP检测与分型准确性显著受限,进而制约了cuteHap的性能。因此,与相关研究结论一致,推荐使用不低于10×的测序数据开展变异检测。
![]()
图3. 不同上游条件下的测试结果
03
cuteHap实现低频嵌合变异检测
人类基因组中,除胚系结构变异外,细胞在受精后还会产生DNA序列改变,即体细胞嵌合变异。这类变异仅存在于部分细胞中,等位基因频率低、检测难度大。cuteHap专门设计了嵌合变异检测模块,通过等位基因识别与单倍型追溯,将仅来自同一单倍体、且不满足杂合胚系结构变异特征的低频变异,判定为嵌合变异。模拟与混样实验证实,cuteHap可识别更多准确的嵌合结构变异(图4)。
体细胞嵌合变异中,肿瘤相关变异是重要研究方向。研究团队以HG008(胰腺癌样本)、COLO829(黑色素瘤样本)两个真实肿瘤样本为对象,人工构建肿瘤相关低频变异基准集。在不同测序平台数据中,cuteHap检出的低频结构变异数量更多、类型更全(缺失、插入、倒位、易位均覆盖),可为体细胞低频结构变异解析与临床研究提供可靠方法支撑。
![]()
图4. 嵌合变异检测结果
04
总结展望
研究团队长期深耕基因组解析算法研究,建立了cute系列结构变异检测算法“全家桶”(表1)。2020年8月发表了cute系列首个结构变异检测算法cuteSV,该算法已经成为当前国际上最为广泛使用的结构变异检测算法工具之一。2025年6月和12月再次相继发表了结构变异基因型重分型算法cuteFC、结构变异实时检测算法cuteSV-OL。cuteHap是继cuteSV、cuteFC、cuteSV-OL之后又一方法力作,实现了高性能、单倍型分辨率的结构变异检测。通过单倍型特异的自适应聚类与基于聚类可信度优先的集束搜索两大策略,充分挖掘并利用分型信息。与当前主流先进方法相比,cuteHap在准确性、鲁棒性、高效性上均表现更优,是高质量单倍型感知结构变异检测的有力工具,有望为基因组学前沿研究与精准医学提供重要支撑。
表1. cute系列结构变异检测算法“全家桶”
![]()
论文链接:
Cao, S., Liu, Y., Cui, M., Gao, R., Guo, W., Wang, G., Wang, Y., & Jiang, T. (2026). cuteHap: Haplotype-Aware Structural Variant Detection in Phased Long-Read Sequencing Data.Advanced science (Weinheim, Baden-Wurttemberg, Germany), e19314. Advance online publication. https://doi.org/10.1002/advs.202519314.
相关代码与数据:
https://github.com/Meltpinkg/cuteHap
01
02
03
|GWAS荟萃分析结果发布
04
05
快点亮"在看”吧!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.