微生信分享 http://blog.sciencenet.cn/u/chinapubmed 0代码在线绘制160+科研图

博文

RNA-seq测序中intronic reads占比较多的原因?

已有 3808 次阅读 2019-8-23 07:17 |个人分类:生物信息|系统分类:科研笔记| RNA-seq, 内含子, reads

使用ReSeQC做RNA-seq reads distribution时,会发现intronic占比比较多,大概30-40%,原因如下:

1,由于转录是个动态过程,期间会存在incompleted (nancant, on-going, co-transcripted,unspliced ...) spliced RNA,并且由于intron的长度一般是exon的20倍左右,所以即使有1%的incompleted spliced RNA,也会对这个分布产生较大影响。这是一个不可避免的主要原因,并且与物种、样品来源(cell, tissue, ...)等相关。

参考:

Total RNA sequencing reveals nascent transcription and widespread co-transcriptional splicing in the human brain


例如

pre-mrna    fraction

Intronic   read fraction

1%

16%

2%

28%

5%

49%


2,存在genomic DNA污染,这个也是一部分原因,主要看实验过程的技术、试剂、操作等


3,基因组注释不全。这个对于研究较多的物种,一般没太大影响,不过也是一个因素。


4,其他因素:所使用的分析软件,包括比对软件,intronic reads的定义等等。


参考:

http://seqanswers.com/forums/showthread.php?t=5519 http://seqanswers.com/forums/showthread.php?t=15296

https://wap.sciencenet.cn/blog-707141-1194860.html

上一篇:MaxQuant处理质谱原始数据记录
下一篇:CFEA:游离DNA表观遗传修饰(5mC、5hmC、核小体定位)数据库
收藏 IP: 221.239.130.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-29 22:41

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部