大规模群体遗传图谱的构建离不开群体联合变异检测技术,其中结构变异( SV)基因型重分型的准确性至关重要,直接影响群体SV频率的精确构建。然而,现有方法在 多等位基因区域识别能力不足 , 且 面临测序错误、有效特征信息捕获不充分 以及 计算效率瓶颈 等挑战,严重制约了大规模人群SV研究的进展。
近日,哈尔滨工业大学 王亚东、汪国华、姜涛团队 在Genome Biology期刊发表题为cuteFC:regenotypingstructural variants through an accurate and efficient force-calling method的研究论文,提出了一种基于强制调用(force-calling)的SV基因型重分型新方法cuteFC(图1)。
该方法创新性地采用了 自主感知聚类策略 ,能根据多态性智能选择“ 自适应聚类” 或 “多等位基因感知聚类” 模式,显著提升SV信号识别精度。同 时,团队设计了一种 高效的基因组位置扫描算法( GPS) ,使测序片段统计能在线性时间复杂度内完成。 cuteFC 兼具准确性与高效性,为大规模人群基因组研究提供了有力工具,有望推动群体遗传学和精准医学研究的深入发展。
图 1 cuteFC 方法的示意图
研究团队利用国际人类金标准数据集 HG002进行个体样本测试。结果显示, cuteFC 在所有测序技术( PacBio HiFi, PacBio CLR, ONT, ULONT)下均取得 最高F1分数 (分别为95.77%、92.85%、95.31%、94.36%),平均比次优方法( cuteSV 和Sniffles2) 高出2% ,较其他方法优势 超过10% 。即使在基因组重复区域(如STR、VNTR和 SegDup )的挑战下, cuteFC 性能依然 显著优于 其他工具。在针对复杂医学相关基因区域(采用GIAB CMRG基准)的评估中, cuteFC 凭借其多等位基因感知聚类算法, 所有测试均获最优F1分数 ,并能 精准识别双杂合SV 。 特别是在采用 PacBio HiFi测序数据(具有高碱基识别率)和基于最新纳米孔设计的ONT测序数据时 , cuteFC 表现尤为卓越。
在 100名中国人群样本的大规模队列分析中,团队运用 cuteFC 进行联合SV检测,并通过变异等位基因频率(VAF)评估。经哈代-温伯格平衡(HWE)与过量杂合性( ExcHet )质控, cuteFC 精准分型了最多数量的SV ,有效保留了包括常见插入、缺失以及不常见 的 反转、重复、易位在内的高质量变异位点(HWE通过率94.93%, ExcHet 通过率97.19%)。为验证稀有变异分型准确性,团队随机选取两样本,结合PacBio HiFi测序和单倍型组装真值集评估。结果显示, cuteFC 不仅能 分型更多稀有变异 (singleton/doubleton),且 与真值集一致性更高 ,在保证低错误发现率的同时实现了 更优的检测灵敏度 ,是构建高一致性群体SV数据集的可靠工具。
cuteFC 在运行效率和资源消耗上优势显著。在HG002数据集上,其运行时间随线程增加呈现 近乎线性提升 。使用16线程时, cuteFC 与Sniffles2并列成为 最快工具 (处理 PacBio HiFi、 PacBio CLR、ONT、ULONT数据分别仅需2.95、7.08、2.23、5.95分钟 , 图4A)。在大规模队列分析中, cuteFC 展现出 卓越的并行能力 ,平均每个样本 仅需约3分钟 即可完成SV基因型重分型。
在内存使用方面, cuteFC 同样高效。16线程处理单个HG002样本时,内存占用 稳定在约5GB ;处理大规模群体样本时,平均内存消耗 仅为4.84GB 。这种稳定 的 低内存占用特性,结合其快速运行速度,充分证明了 cuteFC 在大规模人群基因组学研究中的 高效性和可扩展性 。
cuteFC 是一种基于长读长测序的高效基因型重分型方法,能精准为群体结构变异分配基因型。与现有最先进方法相比, cuteFC 在各项评估指标上均表现 更优异 ,其在大规模人群队列研究中的应用也充分验证了其在群体SV高质量分析方面的 可靠性 。我们预期 cuteFC 将助力研究人员获取更准确的群体SV等位基因频率,为群体遗传学研究和多组学整合分析等前沿领域提供重要支持。
论文链接:https://doi.org/10.1186/s13059-025-03642-2
相关代码与数据:https://github.com/Meltpinkg/cuteFC
制版人:十一
BioArt
Med
Plants
人才招聘
学术合作组织
(*排名不分先后)
战略合作伙伴
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.