牛祥娜
【脚本】从gbk文件中提取核苷酸序列以及注释信息
2025-4-17 09:08
阅读:271

脚本已上线密码子学院平台,链接:【脚本】从gbk文件中提取核苷酸序列以及注释信息

这周给大家分享了【脚本】从gbk文件中提取蛋白质序列以及注释信息。今天接着给小伙伴们分享很实用的脚本,当我们下载大量的gbk文件时,我们可以从gbk文件中提取蛋白质序列,CDS序列,tRNA以及rRNA序列,以便于下载对这些序列做进一步的分析,如进行找同源单拷贝基因,基于16S rRNA构建进化树等等。这次小编分享的脚本是从gbk文件中,提取CDS、rRNA和tRNA序列以及对应的注释信息。

脚本运行环境

  1. 安装python解释器:安装教程

  2. 安装biopython模块

# 使用pip安装

pip install biopython

# 使用conda安装

conda install -c bioconda biopython

查看脚本参数

python gbk_extea_nucleotide.py -h

微信图片_20250417084156.png

实战演练

# 提取CDS序列以及注释信息

python gbk_extea_nucleotide.py -g k12.gbk -t CDS -o k12_cds.fnn

# 提取rRNA序列以及注释信息

python gbk_extea_nucleotide.py -g k12.gbk -t rRNA -o k12_rRNA.fnn

# 提取tRNA序列以及注释信息

python gbk_extea_nucleotide.py -g k12.gbk -t tRNA -o k12_tRNA.fnn

结果展示

微信图片_20250417084414.png

转载本文请联系原作者获取授权,同时请注明本文来自牛祥娜科学网博客。

链接地址:https://wap.sciencenet.cn/blog-3447233-1482320.html?mobile=1

收藏

分享到:

当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?