zd200572的个人博客分享 http://blog.sciencenet.cn/u/zd200572

博文

qiime2学习笔记(一)

已有 11419 次阅读 2018-4-22 18:55 |个人分类:biology|系统分类:科研笔记

最近学习肠道微生物方面的知识,有一部分测序数据需要学习分析。鉴于qiime已经升级为qiime2,还有了图形版本,真是越来越人性化了,但是图形版本还处于原型阶段,测试安装两次以失败告终,可能是我的系统是deepin,通用性不好,如果在原生的ubuntu或许可以安装成功。话说qiime2已经在今年1月份代替qiime1成为官方支持版本,qiime1已经停止维护了,我表示对于我这种几乎没有qiime1使用经验的人来说,直接上手qiime2也不错。

我的理解中,qiime2最大的区别除了从python2进化到python3,还有一个新的数据格式qza,这又多了一步数据格式导入和转换的步骤。我想官方做出这一选择肯定是有他的道理的,应该是更易用了,毕竟都开始上图形界面了。

下面是我的pipeline学习笔记:

1.样本表的获得

开始我参考的是微信公众号 统计咨询 的《肠道菌群研究 – 从生物信息分析开始(内含代码)》。但是发现样本表的文件名已经变成了样本文件所在文件夹名+mainifest,而我的文件名还是csv的。。。。。。ps.我的shell水平几乎没有,于是用python代替,虽然简单问题有点复杂化了。

view source

01import os
02
03path = '/home/zjd/qiime2/test'
04fout = open('%s-manifest' % path,'w')
05fout.write("sample-id,absolute-filepath,direction" + '\n')
06#path = '/home/zjd/qiime2/test'
07for i in os.listdir(path):
08        if 'R1.fastq.gz' in i:
09                sample_id = i.split('__R1')[0]
10                fout.write(str(sample_id) + ',' + path + '/' + sample_id + '__R1.fastq.gz' +',' + 'forward' + '\n')
11                fout.write(str(sample_id) + ',' + path + '/' + sample_id + '__R2.fastq.gz' +',' + 'reverse' + '\n')
12fout.close()

获得的文件内容类似于:

view source

1sample-id,absolute-filepath,direction
2XK-27F-10,/home/zjd/16s/test/XK-27F-10_1.fastq.gz,forward
3XK-27F-10,/home/zjd/16s/test/XK-27F-10_2.fastq.gz,reverse

2.导入数据

view source

1#然后,是qiime正式的第一步,导入数据,转换成qza格式。
2 qiime tools import  \
3 --type 'SampleData[PairedEndSequencesWithQuality]'  \
4 --input-path test-manifest  \
5 --output-path test.qza  \
6 --source-format PairedEndFastqManifestPhred33

据说phred64的数据处理起来特别慢,要提前转换。这个过程一个单样本时间只花了几十秒大概。




https://wap.sciencenet.cn/blog-623545-1110348.html

上一篇:华为荣耀畅玩4x lineges os 15.0 rom下载(8.0 Oreo)
下一篇:QIIME2学习笔记(二)

收藏 IP: 183.212.160.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-11 13:10

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部