QHbinma的个人博客分享 http://blog.sciencenet.cn/u/QHbinma

博文

RPKM和FPKM值衡量基因表达量

已有 49869 次阅读 2019-3-27 18:29 |个人分类:转录组|系统分类:科研笔记

衡量基因表达量的RPKMFPKM两种方法

RPKMReads Per Kilobase per Million)和FPKMFragments Per Kilobase per Million)

同一个样本中基因A和基因B的相对表达量,或者不同样本中,同一个基因的相对表达量。

引入“每一千碱基(per kilobase)”的原因在于,不同的RNA可能有不同长度,长度越长,对应的reads就越多。当每个RNA都除以自身长度(以1000碱基为单位)时,就可以比较同一个样本中不同基因的相对表达量了。相似地,引入“每一百万reads”的原因是,不同的样本可能测序的深度不一样,深度越深,当然对应的reads就越多了。如果结果除以各自库的数量(以一百万reads为单位),那么我们就能很好地衡量两个不同样本中同一个基因的相对表达量。

RPKM是将Map到基因的Reads数除以Map到Genome的所有Read数(以Million为单位)与RNA的长度(以KB为单位)。

FPKM是将Map到基因的Fragments数除以Map到Genome的所有Read数(以Million为单位)与RNA的长度(以KB为单位)。

计算方法

第一步先将测序深度标准化,计算方法很简单,先分别计算出每个样本的总reads数,然后将表中数据分别除以总reads数即可,这样就得到了reads per million。

第二步基因长度的标准化。将第一步的read per million直接除以基因长度即可。

FPKM和RPKM的定义是相同的,唯一的区别是FPKM适用于双端测序文库,而RPKM适用于单端测序文库

TPM的不同在于它的处理顺序是不同的。即先考虑基因长度,再考虑测序深度。



https://wap.sciencenet.cn/blog-3395691-1169982.html

上一篇:[转载]转录组测序设计
下一篇:新一代测序(NGS)的发现和应用
收藏 IP: 124.119.50.*| 热度|

1 李万峰

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 20:31

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部