NiuXiangna的个人博客分享 http://blog.sciencenet.cn/u/NiuXiangna

博文

【脚本】从gbk文件中提取核苷酸序列以及注释信息

已有 91 次阅读 2025-4-17 09:08 |系统分类:科研笔记

脚本已上线密码子学院平台,链接:【脚本】从gbk文件中提取核苷酸序列以及注释信息

这周给大家分享了【脚本】从gbk文件中提取蛋白质序列以及注释信息。今天接着给小伙伴们分享很实用的脚本,当我们下载大量的gbk文件时,我们可以从gbk文件中提取蛋白质序列,CDS序列,tRNA以及rRNA序列,以便于下载对这些序列做进一步的分析,如进行找同源单拷贝基因,基于16S rRNA构建进化树等等。这次小编分享的脚本是从gbk文件中,提取CDS、rRNA和tRNA序列以及对应的注释信息。

脚本运行环境

  1. 安装python解释器:安装教程

  2. 安装biopython模块

# 使用pip安装

pip install biopython

# 使用conda安装

conda install -c bioconda biopython

查看脚本参数

python gbk_extea_nucleotide.py -h

微信图片_20250417084156.png

实战演练

# 提取CDS序列以及注释信息

python gbk_extea_nucleotide.py -g k12.gbk -t CDS -o k12_cds.fnn

# 提取rRNA序列以及注释信息

python gbk_extea_nucleotide.py -g k12.gbk -t rRNA -o k12_rRNA.fnn

# 提取tRNA序列以及注释信息

python gbk_extea_nucleotide.py -g k12.gbk -t tRNA -o k12_tRNA.fnn

结果展示

微信图片_20250417084414.png



https://wap.sciencenet.cn/blog-3447233-1482320.html

上一篇:[转载]文献速览 | 鲍曼不动杆菌耐药性传播
下一篇:知识小卡片 | 三代测序数据组装工具
收藏 IP: 183.194.129.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-4-26 09:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部