zd200572的个人博客分享 http://blog.sciencenet.cn/u/zd200572

博文

新技能Get!宏基因组分析结果导入qiime2分析和可视化

已有 2899 次阅读 2021-5-18 08:32 |系统分类:科研笔记

最近读微生态公众号中宏基因组的文章,发现阿童木写的教程,宏基因组的数据可以导入qiime2分析。于是有了发现新大陆的感觉,qiime2是一个优秀的可视化工具,有它在手,分析不愁呀,可是作者并没有给出怎样导入数据的教程,我摸索了一番,基本解决了问题,欢迎交流呀! 数据是使用biobakery的流程得到的metaphlan3的结果,如下图所示:如果不清楚biobakery流程可以参考BioLink-鲍志伟的这篇: https://mp.weixin.qq.com/s/ET6Jl9kld0oHKLbK2OS-Rw qiime2基本只认基于feature table的数据,也就是以前的OTU表(biom)格式,那么先转化一下,然后微调,就可以分析啦!

# qiime2使用,先转换成biom格式,界门纲目科属种间是以|分隔的,要替换成;,还有就是要去除属以上的级别,只保留种就可以了,qiime2会自动合并,否则导入不识别。
cp output_data/metaphlan/merged/metaphlan_taxonomic_profiles.tsv .
# qiime2认的表头有点死,改成它认的
cat meta.txt | cut -f 1 |sed  's/|/;/g' |less >tax_temp.txt
cat meta.txt | cut -f 1 |paste -  tax_temp.txt > tax_temp2.txt
echo "Feature ID\tTaxon" > tax.txt
sed -i '1d' tax_temp2.txt
cat tax_temp2.txt >> tax.txt
# 格式转换
  biom convert -i meta.txt \
  -o metaphlan.biom  --to-hdf5 --table-type="OTU table"
# 导入特征表
qiime tools import --input-path metaphlan.biom \
  --type 'FeatureTable[Frequency]' --input-format BIOMV210Format \
  --output-path zfg_table.qza
qiime tools import --input-path tax.txt \
  --type 'FeatureData[Taxonomy]' --input-format TSVTaxonomyFormat \
  --output-path zfg_tax.qza
# 堆叠柱状图展示
qiime taxa barplot \
  --i-table zfg_table.qza \
  --i-taxonomy zfg_tax.qza \
  --m-metadata-file sample-metadata.tsv \
  --o-visualization taxa-bar-plots.qzv
# 属
  qiime taxa collapse \
  --i-table zfg_table.qza \
  --i-taxonomy zfg_tax.qza \
  --p-level 6 \
  --o-collapsed-table table-l6.qza
# 多样性
for a in ace shannon simpson
do
qiime diversity alpha \
 --i-table table-l6.qza \
 --p-metric $a \
 --o-alpha-diversity ${a}.qza 
 qiime diversity alpha-group-significance \
  --i-alpha-diversity ${a}.qza \
  --m-metadata-file sample-metadata.tsv \
  --o-visualization alpha/${a}_group.qzv
 done
 
 for b in braycurtis jaccard 
do
qiime diversity beta \
 --i-table table-l6.qza \
 --p-metric $b \
 --o-distance-matrix ${b}.qza 
# qiime diversity adonis \
#  --i-distance-matrix ${b}.qza \
#  --m-metadata-file sample-metadata.tsv \
#  --p-formula 
#  --o-visualization ${b}_adonis.qza
qiime diversity beta-group-significance \
 --i-distance-matrix ${b}.qza \
 --m-metadata-file sample-metadata.tsv \
 --m-metadata-column Group \
 --o-visualization alpha/${b}_group.qzv
 
 qiime diversity pcoa \
   --i-distance-matrix ${b}.qza \
   --o-pcoa ${b}_pcoa.qza
 
 qiime emperor plot \
  --i-pcoa ${b}_pcoa.qza \
  --m-metadata-file sample-metadata.tsv \
  --o-visualization ${b}.qzv
 
 done

Happy的用qiime2进行宏基因组分析吧,当然也有两三个插件可以用来做宏基因组分析,有没有经验分享呀,一起探索?QIIME 2 Library放张图:




https://wap.sciencenet.cn/blog-623545-1287056.html

上一篇:高效R编程
下一篇:《高效R语言编程》笔记汇总
收藏 IP: 180.111.178.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-16 22:42

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部