NiuXiangna的个人博客分享 http://blog.sciencenet.cn/u/NiuXiangna

博文

BLAST比对结果的输出方式和结果解读

已有 103 次阅读 2025-6-9 15:40 |系统分类:科研笔记

BLASTBasic Local Alignment Search Tool)是一款由 NCBI(美国国家生物技术信息中心)提供的生物信息学工具,用于比较基因或蛋白质序列。比对结果通过outfmt参数指定输出格式,官方提供的输出格式是19种,值分别是0-18,以下是具体的介绍。

outfmt 0

软件默认的输出格式,与网页版展示的比对结果类似。包括比对统计结果、比对序列等信息,示例如下:

1.png

outfmt 1

这种格式只保留了序列比对信息,给出输入序列,库中一致的用.表示,不一致的会显示不一致的碱基,可读性更强。

2.png

outfmt 2

outfmt 1一致,只是序列展示有区别,所有比对的序列都保留碱基序列格式。

3.png

outfmt 3/4

两种输出格式与outfmt 1/2格式完全一致。

outfmt 5

这种格式为xml格式的文件,很多种编程语言都可以直接解析。每一个输入序列及比对结果都会以嵌套格式进行整理。

4.png

outfmt 6

这种格式会输出比较多的统计信息,包括比对位置、得分、evalue等,可读性很强,一般都会选择输出这种格式。

5.png

总共对应12列结果,每一列的含义如下:

query id:查询序列ID标识;

refer id:参考序列ID标识;

identity (%):序列比对的一致性百分比;

alignment length:符合比对的比对区域的长度;

mismatches:比对区域的错配数;

gap openings:比对区域的gap数目;

q.start:比对区域在查询序列上(query id)的起始位点;

q.end:比对区域在查询序列上(query id)的终止位点;

s.start:比对区域在参考序列上(refer id)的起始位点;

s.end:比对区域在参考序列上(refer id)的终止位点;

e-value:比对结果的期望值,将比对序列随机打乱重新组合,与数据库进行比对,如果功能越保守,则该值越低;

bit score:比对结果的bit score值。

outfmt 7

这种格式基本与outfmt 6一致,只不过每条序列加了说明信息,便于查看结果,相当于加了一个表头。

6.png

outfmt 8/9

两种格式的编码方式是ASN.1,格式与xml格式类似,都是采用嵌套的方式进行展示。

7.png

outfmt 10

这种格式的数据与outfmt 6/7基本一致,只不过分隔符由tab键换成了逗号。

8.png

outfmt 11

这种格式也是一种ASN.1格式的文件,只不过是用blast编码对数据进行了处理,序列信息使用一种叫NCBI2na的方法进行重新编码,具体可参照https://ncbi.github.io/cxx-toolkit/pages/ch_datamod

9.png

 其他格式 outfmt 12-18

多数使用json或者xml格式的文件进行编码,具体包括以下几个。

12 = Seqalign (JSON),

13 = Multiple-file BLAST JSON,

14 = Multiple-file BLAST XML2,

15 = Single-file BLAST JSON,

16 = Single-file BLAST XML2,

17 = Sequence Alignment/Map (SAM),

18 = Organism Report

上述格式中,如果输入文件中存在多条序列,标注Multiple的会单独输出每条序列的比对结果。其中17输出sam格式的文件,18一般的比对时不能使用。

 我们将持续分享微生物组学研究和生信分析相关的专业技能资料。推荐课程请搜索“密码子学院”。课程问题或个性化分析需求,请联系小唯(微信号:winnerbio01)。



https://wap.sciencenet.cn/blog-3447233-1489111.html

上一篇:BLAST本地比对操作指南
下一篇:BLAST软件输出结果的整理与后加工
收藏 IP: 183.193.236.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-6-12 17:25

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部