编码还是非编码,这是一个问题
克里克在1970年发表在《自然》杂志上的一篇文章中阐述了分子生物学的中心法则:信息通过信使RNA (mRNA)从DNA(基因)传递到蛋白质。大约50年后,中心法则仍然存在。然而,它只是我们基因组表达功能分子的众多机制之一。
多年来,越来越明显的是,我们的基因组DNA普遍被转录。转录成mRNA的部分,被翻译成2万个蛋白质,是最小的(2%-5%)。其余的大部分(75%-90%)远不是“垃圾DNA”,而是被转录成成千上万的非编码RNA(ncRNAs),这些非编码RNA正在成为基因表达的复杂调节器。它们与蛋白质一起控制胚胎发育、维持生理状态、确定生物体的复杂性,并与包括癌症的遗传性和非遗传性疾病有因果关系。
根据功能不同,ncRNA可分为管家型ncRNA和调控型ncRNA。管家型ncRNA(核糖体RNA(rRNA)、转运RNA(tRNA)、小核RNA(snrna)和小核仁RNA(snoRNA))是第一批被鉴定和研究的ncRNA。它们长度约4.5 kb,在细胞存活的重要过程中无处不在地表达。具体来说,rRNA和tRNA存在于细胞质中,是蛋白质翻译机制的核心组成部分。rRNA代表核糖体的RNA成分,而tRNA作为mRNA和氨基酸之间的接头。snRNA和snoRNA位于细胞核中。snRNA代表剪接体的RNA成分。snoRNA代表小核仁核糖核蛋白颗粒(snoRNP)的RNA成分,其通过核苷修饰(主要是甲基化和假尿嘧啶化)负责rRNA前体的成熟。有趣的是,在人类癌症中具有致癌或抑制肿瘤作用的rRNA、tRNA、snRNA和snoRNA的例子越来越多,正是因为它们调控了基因表达的核心机制。它们也被探索作为诊断和预后的生物标志物。
调控型ncRNA根据其长度进一步划分。在短型ncRNA (< 200 nt)中,有PIWI互作RNA和microRNA (miRNA)。长型ncRNA (lncRNA,≥500 nt)包括长基因间非编码RNA(lincRNA)、伪基因RNA(PG)、天然反义转录物(NAT)和环状RNA (circRNA)。调控型ncRNA的表达受到严格控制,它们执行一系列与蛋白质一样广泛的功能,它们的失调与包括癌症在内的许多病理状况有关。
有些基因组位点既可以被认为是编码的,也可以是非编码的,因为它们以互斥或共存的方式表达mRNA和ncRNA(图1)。这些基因组位点被定义为“混合”或“双功能”的。高通量测序的出现揭示了我们的基因组普遍被转录成RNA,而这些RNA似乎并没有被翻译成蛋白质。研究还发现,非编码RNA转录本的数量超过规范的蛋白质编码基因。这一令人难以置信的发现促使非编码RNA研究激增,开始揭示这些新遗传单位的功能相关性,动摇了“基因”的经典定义。当非编码RNA革命仍在进行时,肽可以从非规范的开放阅读框中翻译。因此,很明显,编码与非编码的二分法比预期的要模糊得多。
图1 双功能基因组位点表达mRNA和ncRNA。当基因组位点可以被认为是编码(橙色)和非编码(蓝色)时,它们被定义为双功能位点,因为它们通过以下机制之一表达mRNA和ncRNA。a ncRNA是可选剪接的产物,例如通过内含子的保留或选择可选剪接位点。b在反向剪接中,上游3'剪接受体与下游5'剪接供体的连接导致非编码环状RNA的产生。NAT是由相反的DNA链转录而来的非编码RNA分子。根据与正以链编码mRNA的重叠程度,将NAT定义为头对头(重叠在5′区,左)、尾对尾(重叠在3′区,中)或嵌入(重叠完全,右)。d外显子组成翻译成蛋白质的mRNA,而内含子组成非编码RNA,如miRNA。ncRNA被称为“基因内基因”,而它所在的编码基因被称为“宿主基因”
考虑到这种令人难以置信的复杂性,Poliseno等人在最新综述中概述“编码基因”与“非编码基因”的分类已经过时的情况,因为同一基因产生编码元件和非编码元件。他们还讨论了在癌症中独立或相互依赖的表达调控以及和谐或不和谐的生物输出方面,这种吝啬使用遗传单位的含义。此外,他们指出了研究双功能基因所需的方法进步,特别强调了体内模型的重要性。最后,他们强调了与双功能基因在抗癌治疗发展中的治疗意义相关的机遇和挑战。
参考文献
[1] Poliseno L, Lanza M, Pandolfi PP. Coding, or non-coding, that is the question. Cell Res. 2024. doi:10.1038/s41422-024-00975-8
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
转载本文请联系原作者获取授权,同时请注明本文来自张俊鹏科学网博客。
链接地址:https://wap.sciencenet.cn/blog-571917-1444919.html?mobile=1
收藏