||
LncSEA 2.0:长链非编码RNA相关集和富集分析平台
长链非编码RNA(lncRNAs)作为分子支架、诱饵或转录调节因子调节基因表达水平,在发育、分化和免疫应答等众多生物过程中发挥着至关重要的调节作用。lncRNA作为一种关键的细胞调节因子,存在于细胞质和细胞核中,在转录前和转录后水平上发挥广泛的功能。从机制上讲,核定位lncRNA可以与染色质或剪接因子相互作用来控制下游基因。细胞质定位的lncRNA可以作为竞争性内源性RNA(ceRNA)或相互作用物调节基因表达。例如,HOTTIP可以与WDR5-MLL复合体相互作用,激活HOXA基因簇5’末端。ANRASSF1可以形成R-loop结构,募集PRC2复合物,并沉默RASSF1A基因,参与乳腺癌和前列腺癌的发生。GUARDIN可与BRCA1和BARD1蛋白相互作用,稳定BRCA1蛋白,促进DNA修复,抑制结肠癌细胞凋亡和衰老。新出现的证据表明,lncRNA在调节肿瘤免疫状态中起着关键作用。研究发现lncRNAs可以通过调节T细胞亚群对凋亡的易感性来改变肿瘤微环境中T细胞亚群的平衡,从而提出了肿瘤免疫逃避的新机制。此外,lncRNAs可通过影响糖代谢、脂代谢、氨基酸代谢和线粒体功能,影响病毒感染、肥胖、糖尿病、动脉粥样硬化等免疫代谢相关疾病的发生和发展。此外,lncRNA已被证明与癌症的发生、进展和转移有关。MALAT1、HOTAIR和H19等lncRNA在多种癌症中表现出异常表达模式,包括肺癌、乳腺癌和结直肠癌。这些失调的lncRNA可以促进癌细胞增殖,破坏平衡的肿瘤微环境,加速肿瘤的生长和转移。
随着对lncRNA作用机制的深入研究,人们提出了更多lncRNA的调控作用。lncRNA可以与染色质内的DNA和蛋白相互作用,从而促进或抑制靶DNA区域内的蛋白质结合活性。除了与染色质内的DNA和蛋白质相互作用外,lncRNA还依赖于蛋白质介导的远端染色质相互作用来发挥其调节作用。CCCTC结合因子(CTCF)等蛋白质在介导这些相互作用中起着至关重要的作用。通过促进远端染色质环化和使远端调控元件(如远端增强子)更接近靶基因启动子,lncRNA可以直接增强其影响特定靶基因转录活性的能力。大量研究表明,转录调控程序中的主要调控因子是转录因子(transcription factors,TFs)、转录辅助因子(transcription co-factors,TcoFs)和染色质调控因子(chromatin regulators,CR)。TF通常与特定的DNA顺式调控元件结合,连接远端或近端调控信号,通过招募协同转录调控因子来调节lncRNA的表达。例如,实验证实,SMARCA4作为抑制上游染色质重塑因子和心脏特异性lncRNA Mhrt的TcoF,从而促进心脏肥厚和心力衰竭的发生。同时,m6A修饰是细胞生物学中最先进的机制之一。研究表明m6A修饰是lncRNA-MALAT1在肿瘤转移中的关键因素。具体来说,当lncRNA-MALAT1发生m6A修饰时,YTHDC1可以识别lncRNA-MALAT1的修饰位点,导致核斑点蛋白组成的重组,进而促进附近癌基因的表达,从而促进肿瘤转移。此外,m6A诱导的lncRNA-RP11被发现通过上调Zeb1来触发CRC细胞的迁移和增殖。总结lncRNA的这些调控作用或功能有助于全面了解lncRNA相关的调控图景。
近年来,研究人员开发了EVLncRNAs、MNDR、LncRNAWiki、lncRNADisease、Lnc2Cancer等多个LncRNA相关数据库,详细记录了LncRNA的基本标记信息和LncRNA相关疾病的表型信息。此外,RNAInter、NPInter和ENCORI专注于提供RNA-RNA和蛋白质-RNA相互作用的信息。ImmReg,InnateDB和ImmPort提供了lncRNA在癌症免疫学中的调节作用的信息。这些数据库是研究lncRNA相关调控轴的宝贵资源。然而,所有这些lncRNA相关的注释信息和调控信息都散布在众多的资源中,缺乏完整的lncRNA列表和lncRNA功能分类。随着lncRNA在人类疾病和生物过程中的相关研究越来越多,由于高通量或低通量实验产生和积累了大量的功能性lncRNA,迫切需要对人类lncRNA进行全面的收集和分类。2020年,开发了LncSEA 1.0,为用户提供各种类型的lncRNA集合,并支持lncRNA注释和富集分析。通过lncRNA富集分析,用户可以预测不同功能lncRNA集合对应的特定细胞、组织和疾病类型,并分析其在调节基因表达和细胞功能中的潜在作用。富集分析还可以帮助发现lncRNA与其他上游转录调控因子(如TFs、TcoFs和CRs)之间的相互作用网络。此外,自LncSEA 1.0发布以来,更多的lncRNA功能数据集不断被发现,为探索lncRNA的潜在功能提供了有价值的信息。因此,迫切需要进一步整合这些积累的大规模数据集,探索lncRNA的功能和生物学意义,为进一步研究lncRNA相关的分子机制和治疗应用提供调控线索。
最近,Zhang等人提出了LncSEA 2.0(图1,http://bio.liclab.net/LncSEA/index.php),这是一个更新和大幅扩展的平台,支持超过40万个参考lncRNA集,包括33个类别和86个子类别,涵盖超过20万个lncRNA。值得注意的是,与LncSEA 1.0相比,LncSEA 2.0中的lncRNA集数据量有了显著增加。除了LncSEA 1.0提供的基因集富集算法外,LncSEA 2.0还增加了更高级的富集分析,包括GSEA和GSVA。LncSEA 2.0不仅从下游调控数据源中整理lncRNA集,还通过整合来自数百种人类细胞类型的ChIP-seq、DNase-seq、ATAC-seq和H3K27ac ChIP-seq数据,计算出大量由上游转录调控因子和DNA调控元件调控的lncRNA集。LncSEA 2.0提供了与上游调控元件和下游靶标相关的lncRNA集的注释和富集分析功能。此外,LncSEA 2.0具有一个用户友好的界面,用于搜索,浏览和可视化这些lncRNA集的详细信息。综上所述,LncSEA 2.0是一个强大的平台,为用户提供了多种类型的lncRNA集,并支持lncRNA标注和富集分析功能。
图1 数据库内容和建设。LncSEA 2.0不仅更新了原始数据集,还收集了更多可用的lncRNA集资源。LncSEA 2.0包括浏览、搜索、下载和可视化lncRNA集的功能,并支持多种lncRNA集丰富功能
参考文献
[1] Zhang G, Song C, Fan S, Yin M, Wang X, Zhang Y, Huang X, Li Y, Shang D, Li C, Wang Q. LncSEA 2.0: an updated platform for long non-coding RNA related sets and enrichment analysis. Nucleic Acids Res. 2023 Nov 20:gkad1008. doi: 10.1093/nar/gkad1008.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-27 09:31
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社