卢锐
宏基因组Binning软件MetaBat2的安装与使用
2019-10-17 18:20
阅读:13546
标签:宏基因组, 分箱, 聚类, MetaBat, binning

1. MetaBat2的安装

MetaBat2引文[1]提供的下载地址,从以下路径下载到最新版本的MetaBat2

https://bitbucket.org/berkeleylab/metabat/downloads/

 

mkdir metabat2 & cd metabat2

wget https://bitbucket.org/berkeleylab/metabat/downloads/metabat-static-binary-linux-x64_v2.12.1.tar.gz

 

tar -zxvf  metabat-static-binary-linux-x64_v2.12.1.tar.gz

#下载后解压即可使用,主程序为runMetaBat.sh


 

2. MetaBat2的使用

MetaBat2的输入为组装的contig序列以及将二代reads比对到contig序列上的比对文件(bam格式)

比对可以采用BWABowtie2,以Bowtie2为例进行比对,Bowtie2的安装可参见之前写的博文:Bowtie2Samtools软件更新

/path/to/bowtie2-build --threads 30 assembly_contig.fasta assembly_contig

/path/to/bowtie2 --threads 30 -x assembly_contig -1 /path/to/wgs_reads_R1.fastq.gz -2 /path/to/wgs_reads_R2.fastq.gz | samtools sort --threads 30 -o sample.sort.bam -

# 其中assembly_contig.fasta是宏基因组组装软件组装出的结果;wgs_reads_R1.fastq.gzwgs_reads_R2.fastq.gz是二代数据reads

 

比对完生成sample.sort.bam文件,再采用MetaBat2Binning

sh /path/to/runMetaBat.sh /path/to/assembly_contig.fasta  /path/to/ sample.sort.bam

运行完会生成assembly_contig.fasta.metabat-bins目录

 

3. 评估

这是这篇博文的重点!

本博文采用的测试数据来自材料[2],文章中既测了二代WGS数据,也测了HiC数据,我们可以采用HiC数据可视化地查看聚类结果如何。通过比对后可视化结果如下:


图中一个蓝色框表示聚的一个类。结果显示有一些类结果比较好,如4-7个蓝色框(Cluster);也有一些聚类结果不好,如1-3个蓝色框(Cluster)

 

上述图中我们发现不同Cluster的颜色深浅不同,而互作图中颜色深浅可以评估出互作强度。那么很自然,会再去查看一下二代WGS数据比对到每个Clustercontigs上,Cluster的平均深度如何?

结果如下,除第7Cluster测序深度不同外,其它几个Cluster差异并不大


参考文献

[1] Dongwan D. Kang, Feng Li, Edward Kirton, et al. MetaBAT2: an adaptive binning algorithm for robust and efficient genome reconstruction from metagenome assemblies. 2019. Peerj.

[2] Joshua N. Burton, Ivan Liachko, Maitreya J. Dunham, et al. Species-Level Deconvolution of Metagenome Assemblies with Hi-C Based Contact Probability Maps. 2014. G3

转载本文请联系原作者获取授权,同时请注明本文来自卢锐科学网博客。

链接地址:https://wap.sciencenet.cn/blog-2970729-1202341.html?mobile=1

收藏

分享到:

当前推荐数:1
推荐人:
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?