一、什么是多序列比对?
多序列比对(Multiple Sequence Alignment, MSA)是一种将多个生物学序列(如DNA、RNA或蛋白质序列)进行比对排列,以识别它们之间相似性和差异性的生物信息学方法。
在比对过程中,多个序列中相同或相似的部分会尽可能被对齐到同一列,而插入或缺失的区域则以“-”进行表示。
二、多序列比对与BLAST比对的差异
三、多序列比对结果的展示方法
ESPript 3.0(https://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi)是一款适用于展示多序列比对结果的工具,能够清晰呈现同源序列之间的整体相似性和细微差异。此外,它还可以标注蛋白质的二级结构,帮助分析突变位点与二级结构的关系。
使用方法:
1、生成对齐序列结果(fasta格式),比如使用MEGA等软件的ClustalW或MUSCLE功能进行多序列比对。
2、将比对文件上传至ESPript 3.0网页。
示例:
以mcr-9.1~mcr-9.4的多序列比对结果为例,由于序列较长,这里仅展示后半部分差异区域的情况。
四、密码子生信云带您零基础做生信
如果需要忽略保守区域,突出不同序列之间的SNP差异,可以尝试唯那生物生信云平台(https://cloud.mimazi.net)的“多序列比对可视化(snipit)”小工具。唯那生物密码子生信云将操作流程简单化,无需安装软件,无需配置环境,即可快速输出可视化图片(pdf格式)。
仅需扫码注册一个账号,找到免费小工具“多序列比对可视化(snipit)”,提交多序列比对文件(fasta格式),并选择所分析序列的类型(核酸/蛋白),就能快速得到绘图结果。
需要注意的是该程序默认以文件中的第一条序列作为参考序列。如下图所示,SNP差异位点1439和1589指向的是差异碱基在mcr-9.1上的位置。同时Indel并不会显示在图中。
以下两项工具同样基于多序列比对数据进行分析,可根据需求选择使用:
“基于多序列比对结果分析SNP/Indel”
“基于多序列比对文件生成SNP距离矩阵(snp-dists)”
此外,密码子生信云还提供云流程和其它各色小工具分析服务。
为细菌基因组研究量身定制的智能云流程从基因组测序原始数据(fastq)或组装序列(fasta)出发,一键化完成细菌基因组全套分析流程,包括基因预测、多功能注释和多数据库分析。而多种多样的实用小工具,可以为您精准解决碎片化需求,包括序列处理、统计绘图、基因组注释等等,助力您轻松完成数据分析。
转载本文请联系原作者获取授权,同时请注明本文来自牛祥娜科学网博客。
链接地址:https://wap.sciencenet.cn/blog-3447233-1497611.html?mobile=1
收藏