zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

长链非编码RNA定义、功能、挑战和建议

已有 1019 次阅读 2023-12-13 16:12 |个人分类:科普|系统分类:科普集锦

长链非编码RNA定义、功能、挑战和建议 

长链非编码RNA(long non-coding RNAlncRNA)是复杂生物体基因组的主要输出物,但其研究从一开始就受到不确定性和争议的困扰。lncRNA有一个不幸的区别,那就是它们被命名为它们不是什么,而不是它们是什么。这种松散的描述源于这样一种信念,即RNA的主要作用是充当基因和蛋白质之间的中介,其他管家非编码RNA,如核糖体RNA (RNAs)、转移RNA (tRNAs)、小核仁RNA (snoRNA)、剪接体RNA和其他小核RNA (snRNA)都是辅助这一功能的。 

随着大量小干扰RNA(siRNA)、微RNA (miRNA)piwi相互作用小RNA (piRNA)的意外发现,RNA作为一种调控分子在21世纪头十年的早期得到了广泛的认识,这些小干扰RNA (siRNA)通过Argonaute家族蛋白进行调控真核生物中转录、转录后和翻译水平的基因表达,尽管文献中也有其他小调控RNA的例子,特别是在细菌中。一些长调控RNA,特别是分裂酵母裂糖酵母中的meiRNA, hsrω,果蝇中的roX1roX2,以及哺乳动物中的H19XIST,在前几年也被报道过,但更多的是被认为是奇怪的,而不是普遍现象的早期例子。此外,小的调控RNA并没有扰乱大多数基因编码蛋白质的概念框架,而是很好地适应了这个框架。然而,后来发现,虽然一些miRNA是由mRNA的内含子产生的,但miRNAsnoRNA的非编码初级转录本也可以具有功能,并且rRNAtRNAsnoRNA被加工成小的调控RNA,包括miRNA,在某些情况下有助于跨代表观遗传。 

21世纪第一个十年的早期和中期出现了对遗传信息主流理解的更大惊喜和挑战,当时旨在更好地定义蛋白质组的转录组学分析显示,动物和植物的大多数基因组都被动态转录成更长的RNA,这些RNA很少或根本没有蛋白质编码潜力。令人惊讶的是,相关的研究发现,蛋白质编码基因的数量和在很大程度上,在发育和认知复杂性大不相同的动物中是相似的。例如,秀丽隐杆线虫(~1000个体细胞组成)和人类(~30×1012个体细胞)都有~20000个蛋白质编码基因——这被称为“g值悖论。相反,非编码DNA的范围,以及因此产生的非编码RNA的转录,随着发育复杂性的增加而增加。 

可以理解的是,分子生物学社区的最初反应是怀疑这些不寻常的RNA是转录噪声,因为它们通常具有低水平的序列保守性,低水平的表达和在遗传筛选中的低可见性。然而,从那时起,在广泛的技术发展的帮助下,报道lncRNA的动态表达和生物学功能的出版物数量激增。这些技术发展使lncRNA的鉴定和表征成为可能,尽管只有少数lncRNA有可靠的注释,很少有机制信息。认识到植物和动物的基因组表达了大量的lncRNA,需要一个框架来分类和理解它们的功能。更深刻地说,需要重新评估复杂生物体发育所需信息的数量和类型。 

在最近共识声明中,Mattick等人呈现了lncRNA在细胞和发育生物学中的作用的当前和连贯画面,确定理解其功能的关键问题,并绘制了前进的道路。作者们讨论了lncRNA的定义、命名、保护、表达、表型可见性、功能分析和分子机制,包括lncRNA与染色质结构、表观遗传过程、增强子功能和生物分子凝聚的联系,以及lncRNA在核外的作用。作者们认为表达lncRNA的位点应该被视为真正的基因,并讨论lncRNA结构-功能关系作为解析机制和途径的手段。最后,作者们确定了当前的挑战,并为理解lncRNA与基因组结构、基因调控和细胞组织的关系提供了建议。本共识声明的作者是根据同行的建议提出的,通过小组邮件和讨论达成了共识。详细研究内容可以参考文献[1] 

参考文献

[1] Mattick JS, Amaral PP, Carninci P, Carpenter S, Chang HY, Chen LL, Chen R, Dean C, Dinger ME, Fitzgerald KA, Gingeras TR, Guttman M, Hirose T, Huarte M, Johnson R, Kanduri C, Kapranov P, Lawrence JB, Lee JT, Mendell JT, Mercer TR, Moore KJ, Nakagawa S, Rinn JL, Spector DL, Ulitsky I, Wan Y, Wilusz JE, Wu M. Long non-coding RNAs: definitions, functions, challenges and recommendations. Nat Rev Mol Cell Biol. 2023 Jun;24(6):430-447. doi: 10.1038/s41580-022-00566-8. 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

 

image.png




https://wap.sciencenet.cn/blog-571917-1413700.html

上一篇:CellPhoneDB v5:从单细胞多组学数据中识别细胞通讯网络
下一篇:TidyGEO:从GEO准备数据集进行下游分析
收藏 IP: 202.203.17.*| 热度|

2 杨正瓴 李升伟

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-16 03:40

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部