Xiaowuguijinniu的个人博客分享 http://blog.sciencenet.cn/u/Xiaowuguijinniu

博文

[转载]本地blast

已有 2849 次阅读 2020-6-29 07:58 |系统分类:科研笔记|文章来源:转载

1、格式化数据库
命令:
makeblastdb -in db.fasta -dbtype prot -parse_seqids -out dbname
参数:
-in:待格式化的序列文件
-dbtype:数据库类型,prot或nucl
-parse_seqids:自动解析seqid
-out:数据库名

2、蛋白序列比对蛋白数据库
命令:
blastp -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10
-num_threads 8
参数:
-query: 输入文件路径及文件名
-out:输出文件路径及文件名
-db:格式化了的数据库路径及数据库名
-outfmt:输出文件格式,总共有12种格式,6是tabular格式对应BLAST的m8格式
-evalue:设置输出结果的e-value值
-num_descriptions:tabular格式输出结果的条数。-max_target_seqs(outfmt>4用-max_target_seqs控制数据数量)
-num_threads:线程数

3、核酸序列比对核酸数据库

命令:
blastn -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10
-num_threads 8

4、核酸序列比对蛋白数据库

命令:
blastx -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10
-num_threads 8


查询序列ID标识比对上的目标序列ID标识序列比对的一致性百分比符合比对的比对区域的长度比对区域的错配数比对区域的gap数目比对区域在查询序列(Query id)上的起始位点比对区域在查询序列(Query id)上的终止位点比对区域在目标序列(Subject id)上的起始位点比对区域在目标序列(Subject id)上的终止位点比对结果的期望值比对结果的bit score值
Query_1LNAC01000153.190.629747700628082571536257377601354


一般情况我们看第31112两列,e值越小越可靠。

5.输出对应的scaffold

命令:

blastdbcmd -db name -entry 1 -out name-scaffold

 

在实际操作中,我比较喜欢以下步骤,较为直观简单的找到blast结果(若不当,请批评指出):

(1)makeblastdb -in db.fasta -dbtype prot -parse_seqids -out dbname

(2)blastn -query seq.txt -out gene+name  -db  Actata  -num_alignments 4 –evalue 1e-5 -num_threads 4 -word_size 11




https://wap.sciencenet.cn/blog-3433349-1239789.html

上一篇:[转载]Alpha多样性与箱线图
下一篇:[转载]基于全基因组的基因家族分析(2):SlNRAMP家族基因成员鉴定
收藏 IP: 61.179.124.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-29 12:19

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部