近日,由台湾大学林盈仲团队与阳明交通大学苏溶真合作完成的研究成果发表于Briefings in Bioinformatics(五年影响因子8.7)。该研究开发了一套针对纳米孔转录组测序数据的高效预处理工具 NanoPrePro,为长读长转录组数据分析提供了系统化解决方案。
纳米孔转录组测序能够直接获得从 5’ 到 3’ 端的完整转录本序列,为剪接变体解析、转录本定量以及转录后调控研究提供了重要结构信息。然而,该技术的原始测序数据往往包含较高错误率,并夹杂接头、引物、多聚腺苷尾以及嵌合读段等复杂结构,使得数据预处理成为后续分析准确性的关键环节。研究指出,纳米孔读段预处理长期缺乏系统整合,相关流程与标准仍不完善。
![]()
针对这一问题,研究团队开发了 NanoPrePro,对纳米孔转录组数据预处理进行了全面整合。该工具可同时完成六项关键任务,包括低质量过滤(quality filtering)、全长转录本识别(full-length identification)、链特异性保留(strand information)、嵌合读段去除(chimera removal)、接头去除(adapter removal)以及 polyA/T 序列修剪(polyA/T removal),从而为后续分析提供高质量输入数据。
在算法设计上,NanoPrePro通过综合(1)序列相似性、(2)接头位置及(3)接头长度等信息,实现自适应参数优化,可自动为不同测序数据集选择最合适的处理策略。基于模拟数据与真实测序数据的评估结果显示,该工具在识别全长读段方面的准确性优于现有主流预处理软件 Pychopper,并显著提升整体数据质量。
此外,性能测试表明,NanoPrePro在计算效率与资源消耗方面具有明显优势。与现有最佳工具相比,其运行速度可提升约38倍,同时显著降低内存占用,使其适用于大规模转录组数据分析场景。
![]()
研究团队认为,NanoPrePro为纳米孔转录组数据预处理建立了系统化框架,可有效提升长读长转录组研究的可靠性与效率。该工具的开发有助于推动纳米孔测序技术在转录本结构解析、功能基因组学以及无参考基因组研究中的进一步应用。
原文连接:
https://doi.org/10.1093/bib/bbag063
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.