NiuXiangna的个人博客分享 http://blog.sciencenet.cn/u/NiuXiangna

博文

Prokka安装和使用教程——快速原核基因组注释

已有 211 次阅读 2025-9-1 09:47 |系统分类:论文交流

Prokka是有澳大利亚墨尔本大学生物信息学家“Torsten Seemann”开发的基因结构注释软件,可以对细菌、古菌和病毒基因组进行快速高效注释。

c21c91f5cc.png

Prokka的安装

conda 安装

conda install Prokka

预编译可执行文件安装(Centos/Fedora/RHEL)

#下载可执行文件

git clone https://github.com/tseemann/prokka.git $HOME/prokka

# 运行安装程序

$HOME/prokka/bin/prokka --setupdb

Prokka的使用

输入文件

Prokka要求以FASTA格式的预组装基因组DNA序列为输入文件。

基因组注释

prokka--outdirmydir--cpus 16 --prefixmygenomecontigs.fa

参数介绍:

contigs.fa输入文件

--outdir 生成文件输出的文件夹

--cpus要使用的cpu数量(默认'8')

--prefix注释好文件的文件名

--kingdom注释模式,Archaea|Bacteria|Mitochondria|Viruses (默认 'Bacteria')

--genus需要注释基因组的菌株的属名(默认为“genus”)

--species菌株的种名(默认为“species”)

--strain菌株名称(默认'strain')

输出结果

ExtensionDescription
.gffGFF格式注释文件,它可以直接在Artemis 或 IGV中查看
.gbkgenbank格式的注释文件
.fna输入的核苷酸序列文件
.faa输入的核苷酸序列翻译为氨基酸序列文件
.ffn注释的核苷酸序列文件
.sqn用于提交的可编辑格式文件
.fsa用于提交的核苷酸序列文件
.tbl用于提交的特征表格文件
.errprokka对注释结果存在的一些疑问进行报告的信息
.logprokka运行日志
.txtprokka注释的各种类型序列统计信息
.tsv注释基因的列表

 

参考资料:

Anna Syme, Torsten Seemann, Simon Gladman,Genome annotation with Prokka (Galaxy Training Materials).https://training.galaxyproject.org/training-material/topics/genome-annotation/tutorials/annotation-with-prokka/tutorial.htmlOnline; accessed Thu Jan 18 2024

Hiltemann, Saskia, Rasche, Helena et al., 2023Galaxy Training: A Powerful Framework for Teaching!PLOS Computational Biology10.1371/journal.pcbi.1010752

Batut et al., 2018Community-Driven Data Analysis Training for BiologyCell Systems10.1016/j.cels.2018.05.012

https://github.com/tseemann/prokka



https://wap.sciencenet.cn/blog-3447233-1499904.html

上一篇:细菌基因组注释 | 第一站:全自动注释神器Prokka
下一篇:实用组学小工具——序列ID简化
收藏 IP: 183.193.236.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-9-4 03:13

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部