沉闷科学的掘墓人分享 http://blog.sciencenet.cn/u/Bearjazz

博文

R语言终止密码子统计

已有 4115 次阅读 2014-1-7 16:14 |个人分类:我的研究|系统分类:科研笔记| R语言, 统计, 终止密码子

熊荣川

六盘水师范学院生物信息学实验室

xiongrongchuan@126.com

http://blog.sciencenet.cn/u/Bearjazz

 



#R语言终止密码子统计
setwd("**")
infile = "protein1.fasta"
outname = sub(".fas","",infile)
proseq = readLines(infile)
proseq = proseq[!grepl(">",proseq)]
proseq = strsplit(proseq, "")
proseq = matchar(proseq)
stop.p = grep("\*",proseq)
L = length(stop.p)
mat = matrix(NA,length(stop.p),7)
mat[,2] = stop.p
mat[1,1] = 1
mat[2:L,1] = stop.p[1:(L-1)]
for(i in 1:L){
 mat[i,3] = mat[i,2]-mat[i,1]-1
 mat[i,4] = mat[i,1]*3+1
 mat[i,5] = mat[i,2]*3-3
 mat[i,6] = mat[i,5]-mat[i,4]+1
}
colnames(mat) = c("pre.start","post.stop","length","DNA.start","DNA.stop","DNA.L","pro.name")
mat[,7] = outname
writeWorksheetToFile("**.xlsx", data=mat, sheet=outname)



https://wap.sciencenet.cn/blog-508298-756826.html

上一篇:R语言boxplot箱体图命令生成表
下一篇:如何让无参考转录组数据更有效
收藏 IP: 119.78.81.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-29 18:03

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部