|
Prokka是有澳大利亚墨尔本大学生物信息学家“Torsten Seemann”开发的基因结构注释软件,可以对细菌、古菌和病毒基因组进行快速高效注释。
Prokka的安装
conda 安装
conda install Prokka
预编译可执行文件安装(Centos/Fedora/RHEL)
#下载可执行文件
git clone https://github.com/tseemann/prokka.git $HOME/prokka
# 运行安装程序
$HOME/prokka/bin/prokka --setupdb
Prokka的使用
输入文件
Prokka要求以FASTA格式的预组装基因组DNA序列为输入文件。
基因组注释
prokka--outdirmydir--cpus 16 --prefixmygenomecontigs.fa
参数介绍:
contigs.fa输入文件
--outdir 生成文件输出的文件夹
--cpus要使用的cpu数量(默认'8')
--prefix注释好文件的文件名
--kingdom注释模式,Archaea|Bacteria|Mitochondria|Viruses (默认 'Bacteria')
--genus需要注释基因组的菌株的属名(默认为“genus”)
--species菌株的种名(默认为“species”)
--strain菌株名称(默认'strain')
输出结果
Extension | Description |
.gff | GFF格式注释文件,它可以直接在Artemis 或 IGV中查看 |
.gbk | genbank格式的注释文件 |
.fna | 输入的核苷酸序列文件 |
.faa | 输入的核苷酸序列翻译为氨基酸序列文件 |
.ffn | 注释的核苷酸序列文件 |
.sqn | 用于提交的可编辑格式文件 |
.fsa | 用于提交的核苷酸序列文件 |
.tbl | 用于提交的特征表格文件 |
.err | prokka对注释结果存在的一些疑问进行报告的信息 |
.log | prokka运行日志 |
.txt | prokka注释的各种类型序列统计信息 |
.tsv | 注释基因的列表 |
参考资料:
Anna Syme, Torsten Seemann, Simon Gladman,Genome annotation with Prokka (Galaxy Training Materials).https://training.galaxyproject.org/training-material/topics/genome-annotation/tutorials/annotation-with-prokka/tutorial.htmlOnline; accessed Thu Jan 18 2024
Hiltemann, Saskia, Rasche, Helena et al., 2023Galaxy Training: A Powerful Framework for Teaching!PLOS Computational Biology10.1371/journal.pcbi.1010752
Batut et al., 2018Community-Driven Data Analysis Training for BiologyCell Systems10.1016/j.cels.2018.05.012
https://github.com/tseemann/prokka
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-9-4 03:13
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社