ChengyangWang的个人博客分享 http://blog.sciencenet.cn/u/ChengyangWang

博文

TPM、read counts、RPKM/FPKM你选对了吗?

已有 31717 次阅读 2017-12-15 15:04 |个人分类:RNA-seq|系统分类:科普集锦| RNA-seq


本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome

作者:小哈  来源:嘉因

RNA测序分析,哪家公司适合我一文中,聊过类似的问题。


这次小哈搬来了statQuest的3个最新视频,https://statquest.org/video-index/,点击左下角“阅读原文”直达statQuest视频目录。帮你理清RNA-seq数据预处理方法,哪个更适合你的问题。


先说结论:

  1. 学术界已经不再推荐RPKM、FPKM;

  2. 比较基因的表达丰度,例如哪个基因在哪个组织里高表达,用TPM做均一化处理;

  3. 不同组间比较,找差异基因,先得到read counts,然后用DESeq2或edgeR,做均一化和差异基因筛选;如果对比某个基因的KO组和对照,推荐DESeq2。


如果找公司做RNA-seq数据处理,计算表达量时,记得要read counts。




RPKM/FPKM、TPM



RNA-Seq分析|RPKM, FPKM, TPM, 傻傻分不清楚?里,根据上面的视频用汉语描述了这三个值的区别。


下面是视频截图

不再用RPKM/FPKM,现在推荐用TPM

一表看懂TPM更适合比较同一基因在不同sample间表达丰度的差异

DESeq2或edgeR


DESeq2和edgeR不用RPKM/FPKM或TPM做均一化,而是直接用原始的read counts做均一化处理。


DESeq2和edgeR能很好的解决这两个问题

测序深度的差异问题,用RPKM/FPKM、TPM、DESeq2和edgeR都能处理

如果组间RNA成分差异较大,怎么办?


例如liver跟spleen比,组织特异性表达基因在里面捣乱;再例如常见的某个基因KO组与对照相比,该基因成分在KO组里缺失。



DESeq2做均一化



用edgeR作均一化







https://wap.sciencenet.cn/blog-3372875-1089851.html

上一篇:同样用Ensembl算TPM,结果还是不一样? | Ensembl的注意事项
下一篇:同一套RNA-seq,公司筛出的差异基因跟师兄筛出的为什么不一样?
收藏 IP: 124.77.56.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-9 07:12

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部