xiaokeshengming的个人博客分享 http://blog.sciencenet.cn/u/xiaokeshengming

博文

视频解读!任兵/Jussi Taipale/严健合作系统解析非编码DNA突变对转录因子结合的影响

已有 2698 次阅读 2021-1-28 10:49 |个人分类:小柯生命|系统分类:论文交流


北京时间2021年1月28日凌晨0时,《自然》杂志发表了西北大学生命科学与医学部功能基因组学研究组严健教授团队等的最新研究成果——《系统解析非编码DNA突变对转录因子结合的影响》。


该研究在国际上首次公布了该团队成功利用SNP-SELEX技术,分析人类基因组中近10万个常见的非编码位点突变对270个转录因子蛋白质结合的影响。研究成果为揭示2型糖尿病等复杂疾病的遗传机制提供了重要的理论依据,是后基因组时代的一项突破性的研究进展。



论文共同第一作者为严健教授、美国加州大学圣迭戈分校邱耘疆博士、巴西帕拉联邦大学的André M Ribeiro dos Santos博士。通讯作者为严健教授、美国路德维格癌症研究所任兵教授和瑞典卡罗林斯卡医学院Jussi Taipale教授。


14.jpg


全基因组关联分析(GWAS)是目前广泛用于寻找复杂遗传疾病关联基因的重要手段。目前,全世界范围内已广泛开展了4000多项GWAS研究,发现了超过10万个与各种疾病以及重要生理性状关联的基因位点(数据来源:欧洲生物信息学研究所:https://www.ebi.ac.uk/gwas/home)。


但这些结果都是来源于人群大数据关联,一方面由于采样人群或者人种之间等位基因频率的差异,不同GWAS的研究结果往往存在一定差异,例如欧洲人群的糖尿病关联分析结果很难在亚洲人群中得到验证;另一方面,关联分析基于统计假设检验,并不能直接反映分子机理的因果关系,所以GWAS找到的很多位点并不是直接的疾病因果位点,无法使我们深入理解疾病的发生机理,甚至出现误导的情况。因此,探索这些非编码位点的功能对于理解遗传疾病的发病机理有着至关重要的作用。


近年来,越来越多的研究表明,这些疾病风险位点大部分位于基因组非编码区域[1],它们并不会改变蛋白质的序列与结构,而可能在基因表达调控上发挥作用。例如这些突变位点能够改变一些序列特异性结合蛋白与DNA结合的亲和力,从而影响下游目标基因的调控作用[2, 3]。


但是,搞清楚一个位点突变的分子机理往往需要大量的时间和人力投入,单个突变一般需要有经验的研究组2-3年的时间完成,而且实验室之间、实验系统之间的差异还会干扰数据之间的可比性。考虑到目前已积累超过10万个疾病关联位点,而且GWAS还远远没有到达平台期出现饱和,随着研究手段的进一步改进,这样的位点还会越来越多(图1)。因此亟需开发一种可以高通量、系统性的办法来研究这些突变位点的分子功能。


15.jpg


图1、近年GWAS数据增长与功能研究增长对比。红色表示GWAS发现的位点随着时间推移的增加,蓝色表示对GWAS发现位点的功能研究的积累。

 

2013年,严健教授在Jussi Taipale教授指导下发明了HT-SELEX技术(全称High Throughput Systematic Evolution of Ligands by Exponential Enrichment)[4],通过在体外表达纯化DNA结合蛋白,与人工合成的长度为40bp随机序列DNA片段结合,再经过多轮缓冲液的清洗去除非特异性结合,最后洗脱结合力强的DNA,经过高通量测序计数,定量分析转录因子的DNA序列结合特异性(图2)。


16.jpg


图2、SELEX原理示意图。红色波浪线表示长度为40bp的双链DNA片段,每一轮循环表示一次富集过程,可以通过增加循环来提高富集度。注:图片来自[4]。

 

由HT-SELEX技术所产生的数据可以用于生成位置权重矩阵模型(PWM),该模型被广泛应用于预测转录因子能否与某DNA序列片段相结合。但研究团队经过对比发现,在预测SNP对于转录因子结合力影响时,PWM的效果并不理想,尤其是一些位于低亲和力结合位点的SNP。这些信息提示我们,在今后的研究中需要慎重考虑PWM预测模型的结果。


为了摆脱了对预测模型的依赖,在实验水平直接分析SNP对转录因子的影响,严健教授、任兵教授和JussiTaipale教授于2015年再次联合提出改进HT-SELEX方法:在合成长度为40bp配体DNA时,不再使用随机序列的DNA,而以包含待研究的SNP及其附近的基因组序列取而代之,再利用HT-SELEX实验进行分析。


在本研究中,研究人员利用该方法,定量分析了270个转录因子,在与95,886个非编码SNP结合时,不同等位基因序列(allele)与其结合强弱的差异,并记录了量化这些差异的大量数据。这些数据为解释疾病机理提供了重要的理论依据。以2型糖尿病风险位点SNP rs7118999为例,我们发现该位点可以影响转录因子HLF结合,并通过染色质长距离相互作用参与APOC3基因的表达调控,调节血脂水平(图3)。


17.jpg


图3、左图展示了在基因组浏览器中观察到的SNP rs7118999可以影响HLF转录因子的亲和力,从而通过三维基因组折叠的方式,引起下游APOC3基因表达的差异。右图展示了在肝脏细胞中敲低HLF会导致APOC3基因表达的下降,进一步验证了该团队的科学假设。

 

研究团队相信,本研究所产生的这些数据在后GWAS时代,对于揭示突变位点,尤其是非编码突变的分子机理,以及疾病的遗传模型有着重要的意义。本文以GWAS研究覆盖面较广的2型糖尿病作为研究基础,发现了一些未知的非编码SNP的分子功能。此外,研究方法可以进一步扩展到其他遗传疾病,包括肠癌、前列腺癌等,对解释相关疾病的遗传特性,找到临床诊断的分子标记物等都具有建议、指导的作用。


为了方便其他研究人员使用这些实验数据,文章中的所有SNP-SELEX结果可以通过GVAT网页公开访问(http://renlab.sdsc.edu/GVATdb/)。研究人员在该网页内输入感兴趣的转录因子名字或者SNP的rsID,便可快速找到与其相互作用的SNP或者转录因子,以及他们之间的量化影响(图4)。

 

18.jpg


图4、GVAT网页截屏,可以通过search功能找到TF或者SNP对应的相互作用分子

 

严健教授认为:“之前的类似研究都是以单个或几个突变作为对象,这样要完全了解2型糖尿病这样同时受到几百上千个突变影响的复杂疾病,在短时间内是无法完成的,大大阻碍了开发治疗手段的进程。而这项研究一下子就解决了近10万个突变的分子功能问题,是一项重大突破。”


同时,任兵教授亦表示:“目前我们的研究只包含了270个转录因子的SNP-SELEX数据,相比人类基因组中存在的1200-2000个转录因子还仅仅是一小部分。因此,我们的研究还会继续,期待能够全面了解非编码SNP的分子功能。”


该工作得到了来自美国、英国、瑞典、巴西以及中国等多个研究所的支持以及各国各地科学家们的通力合作,充分体现了国际合作在攻克科研难题中的重要意义。

 

相关论文信息:

https://doi.org/10.1038/s41586-021-03211-0

 

参考文献

[1] D. Hnisz, B.J. Abraham, T.I. Lee, A. Lau, V. Saint-Andre, A.A. Sigova, H.A. Hoke, R.A. Young, Super-enhancers in the control of cell identity and disease, Cell 155(4) (2013) 934-47.

[2] S. Tuupanen, M. Turunen, R. Lehtonen, O. Hallikas, S. Vanharanta, T. Kivioja, M. Bjorklund, G. Wei, J. Yan, I. Niittymaki, J.P. Mecklin, H. Jarvinen, A. Ristimaki, M. Di-Bernardo, P. East, L. Carvajal-Carmona, R.S. Houlston, I. Tomlinson, K. Palin, E. Ukkonen, A. Karhu, J. Taipale, L.A. Aaltonen, The common colorectal cancer predisposition SNP rs6983267 at chromosome 8q24 confers potential to enhanced Wnt signaling, Nat Genet 41(8) (2009) 885-90.

[3] Q. Huang, T. Whitington, P. Gao, J.F. Lindberg, Y. Yang, J. Sun, M.R. Vaisanen, R. Szulkin, M. Annala, J. Yan, L.A. Egevad, K. Zhang, R. Lin, A. Jolma, M. Nykter, A. Manninen, F. Wiklund, M.H. Vaarala, T. Visakorpi, J. Xu, J. Taipale, G.H. Wei, A prostate cancer susceptibility allele at 6q22 increases RFX6 expression by modulating HOXB13 chromatin binding, Nat Genet 46(2) (2014) 126-35.

[4] A. Jolma, J. Yan, T. Whitington, J. Toivonen, K.R. Nitta, P. Rastas, E. Morgunova, M. Enge, M. Taipale, G. Wei, K. Palin, J.M. Vaquerizas, R. Vincentelli, N.M. Luscombe, T.R. Hughes, P. Lemaire, E. Ukkonen, T. Kivioja, J. Taipale, DNA-binding specificities of human transcription factors, Cell 152(1-2) (2013) 327-39.





https://wap.sciencenet.cn/blog-3423233-1269373.html

上一篇:重磅视频!中国科学家高清解码灵长类大脑三维基因组图谱
下一篇:视频解读!4亿年前“鸭嘴兽古鱼“的脑腔和内耳新知提出有颌脊椎动物早期演化新框架
收藏 IP: 121.19.43.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-29 21:51

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部