李雷廷
PyPore: Nanopore 测序数据处理工具
2019-7-8 09:47
阅读:6043

Oxford Nanopore 测序通量已经提高到了 10-20 Gb,每次可以产生数百万的 reads。这些产生的数据是以 FAST5 格式保存。FAST5 是 HDF5 格式的一个变种。但目前能直接处理这种数据格式并辅助下游分析的软件还比较少。2019 年 4 月 16 日,Bioinformatics 杂志发表了意大利的学者完成的题为“PyPore: a python toolbox for nanopore sequencing data handling”的论文,介绍了 Nanopore 测序数据处理工具 PyPore,这个软件可以生成信息丰富、交互式的图表,对于快速评价实验质量具有重要价值。



PyPore 包含三个工作模块。第一个模块读取 FAST5 文件中的信息并总结成信息丰富的质量参数图表;第二个模块把原始数据转换为 FASTQ 格式;第三个模块利用最先进的比对工具把测序数据比对到参考基因组上,并收集比对的统计信息。



PyPore 利用 Python 2.7 写作的,源代码地址为:https://github.com/rsemeraro/PyPore



PyPore 的第一个模块为 seqstats,基本用法为:

输出结果类似如下示例:



PyPore 的第二个模块为 fastqgen,基本用法为:



PyPore 的第三个模块为 alignment,基本用法为:


生成的统计交互图类似如下示例:


转载本文请联系原作者获取授权,同时请注明本文来自李雷廷科学网博客。

链接地址:https://wap.sciencenet.cn/blog-656335-1188546.html?mobile=1

收藏

分享到:

当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?