fawnshao的个人博客分享 http://blog.sciencenet.cn/u/fawnshao

博文

基因组坐标

已有 3881 次阅读 2013-1-3 21:24 |个人分类:基因组工具|系统分类:科研笔记| 基因组

缺少规范的后果就是,每用一个文件都得去确认它的标准。
基因组文件也是个烦人的问题,有些格式是的第一个碱基是0,有些又是1,要做精确到碱基的分析时,就比较烦恼了。
现在把常用的坐标起始问题记录一下。

UCSC注释文件的起始坐标都是0,参见https://cgwb.nci.nih.gov/goldenPath/gbdDescriptions.html
ENCODE peak文件起始坐标也是0,参见http://genome.ucsc.edu/FAQ/FAQformat.html#format13
GFF格式起始坐标是1,说明同上。
MACS输出文件储xls格式外,其余也都是0起始,参见https://github.com/taoliu/MACS/
NCBI genbank文件起始坐标应该是1.



https://wap.sciencenet.cn/blog-824692-649267.html

上一篇:UCSC genome browser 镜像搭建
下一篇:随机取fastq序列
收藏 IP: 158.182.150.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-3 18:33

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部