ChengyangWang的个人博客分享 http://blog.sciencenet.cn/u/ChengyangWang

博文

哪个转录因子调控你的基因?Plan C,不需要那么多ChIP-seq

已有 8397 次阅读 2018-2-23 10:49 |个人分类:转录调控|系统分类:科普集锦| 转录调控

 

本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome

作者:小丫  来源:嘉因

哪个蛋白质调控我感兴趣的基因?》一文讲了找上游转录因子的三种策略:

如果您感兴趣的细胞类型样本很难收集,ChIP-seq数据特别少,没法实现Plan A,还有Plan C来帮你。

其实《任意两组RNA-seq变身,国自然得AAA》一文介绍的找关键转录因子的思路就应用了Plan C:先找差异DHS,再搜DHS上的motif,推测出决定两种状态差异的关键调控因子,用关键调控因子的ChIP-seq数据证实它的确结合在差异位点。

今天带你实现Plan C:

  1. 原理

  2. 用DNase/ATAC-seq找DHS

  3. 找DHS区域的motif

  4. 用ChIP-seq数据验证

  5. 结果展示

  6. 速查表


1. 原理

调控蛋白结合位点附近很容易被DNase I或Tn5酶切到,前者叫做DNase I hypersensitive site (DHS),后者叫做transposase-accessible chromatin,本文为方便叙述,把他们统称为DHS。

用DNase/ATAC-seq能够找出有调控蛋白结合的区域。怎样才能知道是哪个调控蛋白呢?DHS上存在大量的调控元件,查查看这上面存在哪些转录因子的motif,就能推测出该区域结合的调控蛋白是谁。

怎样验证推测出来的转录因子的确结合在这个位点呢?找这些转录因子的ChIP-seq数据,看看有没有peak,或者自己做ChIP-seq/qPCR。

跟DNase-seq比起来,ATAC-seq用的细胞数更少,500-50,000个细胞就能做,实验更稳定,需要做的话找嘉因。近两年各物种都在努力积累ATAC-seq数据:

2. 用DNase/ATAC-seq找DHS

ENCODE已产生860个DNase-seq和175个ATAC-seq数据,包括人、小鼠和果蝇,几十个tissue,几乎涵盖了人们感兴趣的细胞类型。具体是哪些tissue,到本文第6部分查找。

DNase/ATAC-seq数据的下载方法跟这篇的第5步一样:《神技能!批量解决哪个转录因子调控你的基因

3. 找DHS区域的motif

找到了DHS,说明这个位置有调控因子结合,具体是谁呢?要扫motif。到JASPAR 2018下载motif文件,http://jaspar.genereg.net/downloads/。人、小鼠选Vertebrates,植物的选Plants,果蝇、蜜蜂选Insects,线虫选Nematodes,真菌,海鞘,各取所需。

怎样扫motif呢?这篇介绍的方法总有一款适合你《点鼠标就能找启动子区的motif | meme-FIMO》。

4. 用ChIP-seq数据验证

在DHS找到了几个转录因子的motif,它们不一定真的能够结合。我们用这些转录因子的ChIP-seq数据做验证,筛选出真的在这里有结合信号的转录因子。方法见这篇《Plan A详细步骤1234 | 哪个转录因子调控我的基因?

5. 结果展示

展示方法类似于这张图《他中了国自然,因为最后一周补了这张图》,比它多个motif。举个栗子:

做植物的亲们,小丫这次找了个拟南芥的Plant physiology做例子,亲切吧!

Liu, T.L., Newton, L., Liu, M.J., Shiu, S.H. and Farré, E.M., 2016. A G-box-like motif is necessary for transcriptional regulation by circadian pseudo-response regulators in Arabidopsis. Plant physiology, 170(1), pp.528-539.

6. 速查表

ENCODE产生的DNase/ATAC-seq数据,各tissue数据数量

81kidney
74musculature of body
70skin of body
64lung
60connective tissue
59epithelium
59limb
50intestine
44brain
37large intestine
34heart
27vasculature
26blood
26embryo
25penis
24stomach
21blood vessel
21extraembryonic component
18mammary gland
18ureter
14adrenal gland
14pancreas
14small intestine
13liver
13placenta
12bone element
11uterus
10gonad
10thymus
9artery
9eye
9prostate gland
8esophagus
8lymph node
7lymphoid tissue
7spinal cord
7thyroid gland
6skeleton
6testis
5ovary
4adipose tissue
4breast
4mouth
4nerve
3spleen
2bronchus
2lymphatic vessel
2tongue
2vagina
2vein
1bone marrow
1nose
1trachea
1urinary bladder


小鼠

40brain
33embryo
14liver
11heart
8epithelium
8limb
8lung
7kidney
6intestine
5eye
5spleen
5stomach
4blood
4connective tissue
3lymph node
2adipose tissue
2bone element
2bone marrow
2spinal cord
2thymus
1breast
1extraembryonic component
1gonad
1large intestine
1musculature of body

果蝇


其他物种的ATAC-seq数据数量,看这篇《做过ChIP-seq或ATAC-seq的物种速查

Organism Name

中文名数量
Homo sapiens6019
Mus musculus小鼠2223
Drosophila  melanogaster果蝇122
Danio rerio斑马鱼25
Saccharomyces  cerevisiae酿酒酵母23
Arabidopsis  thaliana拟南芥23
Strongylocentrotus  purpuratus海胆21
Oryza sativa水稻20
Caenorhabditis  elegans线虫10
Capsaspora  owczarzaki变形虫5
Schizosaccharomyces  pombe粟酒裂殖酵母5
Streptococcus  agalactiae无乳链球菌4
Sorghum  bicolor高粱3
Solanum  lycopersicum番茄2
Medicago  truncatula苜蓿2
Oryza sativa  Japonica Group水稻2
Setaria  italica小米2
Zea mays玉米2
Zea mays subsp. mays玉米1
Branchiostoma lanceolatum文昌鱼1
Oryzias latipes青鱂鱼1



https://wap.sciencenet.cn/blog-3372875-1100837.html

上一篇:国自然有这个图,谁敢说缺创新点
下一篇:用别人的数据发自己的Science | 给你的文章加5分
收藏 IP: 124.77.56.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-10 07:15

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部