1. BWA软件的适用范围和应用场景
bwa 是一款将序列比对到参考基因组上的软件,包含了以下3种算法:
BWA-backtrack:用于进行Illumina reads的比对,reads的长度最大为100bp。
BWA-SW:用于比对long-read,支持的长度为70bp-1Mb;同时支持剪接性比对(split alignments)。
BWA-MEM:最新的算法。和BWA-SW的适用性一致,但是更加快速和准确;同时与BWA-backtrack相比,在对70bp-100bp reads的比对上有更优的性能。通常情况下选择BWA-MEM算法就好。
2. BWA软件的下载与安装
可以直接去github上下载(https://github.com/lh3/bwa),也可以使用git clone直接拷贝到本地,如:
git clone https://github.com/lh3/bwa.git
进入bwa目录,直接make,等待安装完成即可。
安装完成后,输入bwa,就能查看帮助信息。
3. 实战:使用BWA软件生成质粒基因组的SAM文件
使用BWA整个比对过程主要分为两步,第一步建索引,第二步进行比对。
示例数据:
├── plasmid_genome.fasta………………………………………………质粒基因组序列
├── plasmid_R1.fq.gz……………………………………………………测序数据read1
├── plasmid_R2.fq.gz……………………………………………………测序数据read2
操作:
$ bwa index plasmid_genome.fasta -p plasmid_index ……………………建立索引
$bwa mem plasmid_index -t 16 plasmid_R1.fq.gz plasmid_R2.fq.gz > plasmid_pe.sam……使用bwa-mem算法进行双端比对
结果:
我们将持续分享微生物组学研究和生信分析相关的专业技能资料。推荐课程请搜索“密码子学院”。课程问题或个性化分析需求,请联系小唯(微信号:winnerbio01)。
转载本文请联系原作者获取授权,同时请注明本文来自牛祥娜科学网博客。
链接地址:https://wap.sciencenet.cn/blog-3447233-1494963.html?mobile=1
收藏