1. MetaBat2的安装
按MetaBat2引文[1]提供的下载地址,从以下路径下载到最新版本的MetaBat2
https://bitbucket.org/berkeleylab/metabat/downloads/
mkdir metabat2 & cd metabat2
wget https://bitbucket.org/berkeleylab/metabat/downloads/metabat-static-binary-linux-x64_v2.12.1.tar.gz
tar -zxvf metabat-static-binary-linux-x64_v2.12.1.tar.gz
#下载后解压即可使用,主程序为runMetaBat.sh
2. MetaBat2的使用
MetaBat2的输入为组装的contig序列以及将二代reads比对到contig序列上的比对文件(bam格式)。
比对可以采用BWA或Bowtie2,以Bowtie2为例进行比对,Bowtie2的安装可参见之前写的博文:Bowtie2和Samtools软件更新
/path/to/bowtie2-build --threads 30 assembly_contig.fasta assembly_contig
/path/to/bowtie2 --threads 30 -x assembly_contig -1 /path/to/wgs_reads_R1.fastq.gz -2 /path/to/wgs_reads_R2.fastq.gz | samtools sort --threads 30 -o sample.sort.bam -
# 其中assembly_contig.fasta是宏基因组组装软件组装出的结果;wgs_reads_R1.fastq.gz和wgs_reads_R2.fastq.gz是二代数据reads
比对完生成sample.sort.bam文件,再采用MetaBat2做Binning
sh /path/to/runMetaBat.sh /path/to/assembly_contig.fasta /path/to/ sample.sort.bam
运行完会生成assembly_contig.fasta.metabat-bins目录
3. 评估
这是这篇博文的重点!
本博文采用的测试数据来自材料[2],文章中既测了二代WGS数据,也测了HiC数据,我们可以采用HiC数据可视化地查看聚类结果如何。通过比对后可视化结果如下:
图中一个蓝色框表示聚的一个类。结果显示有一些类结果比较好,如4-7个蓝色框(Cluster);也有一些聚类结果不好,如1-3个蓝色框(Cluster)
上述图中我们发现不同Cluster的颜色深浅不同,而互作图中颜色深浅可以评估出互作强度。那么很自然,会再去查看一下二代WGS数据比对到每个Cluster的contigs上,Cluster的平均深度如何?
结果如下,除第7个Cluster测序深度不同外,其它几个Cluster差异并不大
参考文献
[1] Dongwan D. Kang, Feng Li, Edward Kirton, et al. MetaBAT2: an adaptive binning algorithm for robust and efficient genome reconstruction from metagenome assemblies. 2019. Peerj.
[2] Joshua N. Burton, Ivan Liachko, Maitreya J. Dunham, et al. Species-Level Deconvolution of Metagenome Assemblies with Hi-C Based Contact Probability Maps. 2014. G3
转载本文请联系原作者获取授权,同时请注明本文来自卢锐科学网博客。
链接地址:https://wap.sciencenet.cn/blog-2970729-1202341.html?mobile=1
收藏