沉闷科学的掘墓人分享 http://blog.sciencenet.cn/u/Bearjazz

博文

使用R语言提取genbank下载序列索取号

已有 5199 次阅读 2013-1-13 11:06 |个人分类:我的研究|系统分类:科研笔记| R语言, 序列, genbank, 索取号

使用R语言提取索取号

 

 

熊荣川

 

xiong rongchuan

 

六盘水师范学院生物信息学实验室

 

xiongrongchuan@126.com

 

http://blog.sciencenet.cn/u/Bearjazz

从Genbank下载的序列,通常序列较长,提取这些索取号是一件体力活,因此我们编写了下面的函数已解决此问题。

fasGBS <- function(name){
   xiong = strsplit(name,'\|')
   xiong = unlist(xiong)
   index = grep("gb",xiong)
   return(xiong[index+1])
}

使用举例:

name = ">gi|308051814|gb|GU013768.1| Rana grahami clone 162 bradykinin precursor, gene, complete cds" #genbank下载序列的fasta格式序列名称

fasGBS(name) #调用fasGBS函数

[1] "GU013768.1" #结果

 

就这么简单,祝您科研愉快

 



https://wap.sciencenet.cn/blog-508298-652571.html

上一篇:用source函数代替繁冗的R语言打包过程
下一篇:R语言数据框合并函数merge()使用范例【转载+评述】
收藏 IP: 119.78.81.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-29 12:42

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部