zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

lncHUB2:汇总和推断人类和小鼠lncRNA知识

已有 477 次阅读 2024-3-13 08:43 |个人分类:科普|系统分类:科普集锦

lncHUB2:汇总和推断人类和小鼠lncRNA知识 

与蛋白质编码基因相比,大多数转录基因组编码非编码RNA(ncRNA)ncRNA曾被认为没有功能,由于缺乏蛋白质产物而被称为垃圾RNA”。然而,人们很快意识到ncRNA在真核生物的功能和调控中起着关键作用。有趣的是,研究表明,随着生物体复杂性的增加,ncRNA的数量呈指数增长。迄今为止,大多数证据表明,ncRNA在调节基因表达方面发挥着重要作用,而许多ncRNA被认为是多种疾病的关键因素。长链非编码RNA (lncRNA)被定义为长度大于200个核苷酸的ncRNA,占ncRNA的最大比例。然而,对其功能的了解仍然有限。lncRNA已被证明可以直接与蛋白质、DNA以及其他RNA分子相互作用,这表明它们可能参与大分子复合物的形成和参与许多生物过程。lncRNA在细胞分化和发育中也发挥着重要作用。lncRNA因其稳定性而被认为是疾病的生物标志物。lncRNA与心血管疾病、神经系统疾病和各种癌症等疾病有关。尽管进展迅速,但只有少数lncRNA在生物学过程、途径和疾病中的功能、定位和成员地位已被阐明。近年来,随着lncRNA与疾病关联的数量增加,人们对其作为药物靶点的潜在作用的兴趣也在增加。目前,很少有基于RNA的治疗方法,包括以序列特异性方式结合RNA的小干扰RNA (siRNA)和反义寡核苷酸(ASO) 由于lncRNA能够形成二级结构,并且能够以结构特异性的方式与靶标相互作用,小分子也可以靶向lncRNA,因为它们能够破坏lncRNA-靶标相互作用。 siRNAASO相比,小分子的生产成本更低,也更容易运输。然而,siRNAASO具有更特异的优势,同时需要更少的精力、时间和成本来识别和开发。 

为了填补目前对人类和小鼠lncRNA作用的理解中存在的知识空白,整合lncRNA信息的数字资源开发有所增加。例如,Rfam数据库从文献中编译序列和结构信息以创建数千个ncRNA家族的多序列比对、二级结构和协方差模型,促进了ncRNA DNA/RNA序列注释。lncBOOK是一个基于网络的资源,提供关于人类lncRNA的知识,包括保守、变异、甲基化、表达、相互作用和疾病关联。类似地,LNCipedia是一个Web服务器资源,提供关于lncRNA出版物的人工管理数据。 这两个数据库都提供了直接从文献中整理的约3000个人类lncRNA的功能知识。 

其他几个数据库从文献中手动整理lncRNA与疾病、靶点和生物学功能的关联,如LncRNADisease 2.0Lnc2Cancer 3.0LincSNP 3.0LncTarDLncACTdb 3.0。另一方面,LncRNA2FunctionCo-LncRNA是基于RNA-seq共表达数据推断lncRNA知识的Web服务器应用程序。为了扩展这一思路,Lnc-GFPLncRNAs2Pathways整合了共表达数据和蛋白-蛋白相互作用数据,并使用图论算法来预测人类lncRNA的基因功能。此外,LnCompare整合了基因结构和进化守恒等附加功能来改进预测。很少有资源提供lncRNA/小分子关联的信息。例如,LncTarD提供了lncRNA与药物靶点之间的关联。LNCmap通过Connectivity Map (CAMP)数据库识别出1262个小分子干扰的lncRNA组,并通过富集分析将疾病与这些药物联系起来。D-lnc重新分析了来自基因表达数据和CMAP数据库的7037个微阵列基因表达数据集,以关联差异表达lncRNA对药物扰动的响应,并利用lncRNA序列相似性和药物结构相似性预测lncRNA -药物相互作用。然而,LNCmapD-lnc都受到lncRNA覆盖率相对较低的限制。最近,基因-基因共表达相关性被用于扩大lncRNA覆盖范围。在他们的研究中,Wang等人通过计算CMAP中每种药物的差异表达基因与TCGA中通过计算不同癌症类型的共表达相关性发现的lncRNA相关基因之间的重叠,来优先调节癌症相关lncRNA的药物。然而,这两项研究都没有利用LINCS L1000数据的可用性,该数据包含>3万个小分子的> 300万个表达谱。LINCS L1000数据集是对原始CMAP的主要扩展。为了总结lncRNA知识库和资源的收集,并将其与lncHUB2提供的信息进行比较,表1组织了这些资源中的关键共同特征。 

1 从提供lncRNA相关信息或分析的资源中比较特征。如果资源的URL不完整,则从相关文献中获取其特性。列值如下:A:跨组织表达,B:变体,C:药物,D:共表达基因,E:功能预测,F:保守,G:甲基化,H:文献,I:结构,J:序列,K: API, L:亚细胞定位,M:URL

image.png  

在这里,Marino等人介绍了lncHUB2(图1https://maayanlab.cloud/lncHUB2),它产生了关于18705个人类和11274个小鼠lncRNA的功能和调控的报告,这些lncRNA是从RNA-seq基因-基因共表达相关性推断出来的。lncHUB2页面报告提供了lncRNA的预测结构、相关出版物、最相关的编码和非编码基因、预测生物学过程、转录因子调控、疾病关联、组织和细胞系的平均表达、细胞定位,以及基于LINCS L1000数据预测单个基因的小分子和CRISPR敲除上调/下调lncRNA的表达。总的来说,lncHUB2是一个在全基因组范围内弥合lncRNA、疾病、生物功能和小分子之间知识鸿沟的综合性资源。 

image.png

1 lncHUB2应用程序和Web应用程序工作流。lncHUB2应用程序或基于Web的应用程序将18 705个唯一的人类lncRNA11274个唯一的小鼠lncRNA作为输入,并生成报告。该报告包含有用的信息,如预测二级结构和表达水平在各种组织和细胞系。此外,利用ARCHS4公开的RNA-seq数据生成的基因-基因相关性,lncHUB2提供预测的生物学功能,以及预测的小分子和CRISPR-KO基因调控因子,以及基因-基因共表达网络,以基于表达相似性探索密切相关的基因和lncRNA的关联 

参考文献

[1] Marino GB, Wojciechowicz ML, Clarke DJB, Kuleshov MV, Xie Z, Jeon M, Lachmann A, Ma'ayan A. lncHUB2: aggregated and inferred knowledge about human and mouse lncRNAs. Database (Oxford). 2023 Mar 4;2023:baad009. doi: 10.1093/database/baad009.     

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

 

image.png

 



https://wap.sciencenet.cn/blog-571917-1425115.html

上一篇:lncRNA研究生物信息学工具推荐
下一篇:肿瘤免疫的泛癌蛋白基因组学表征
收藏 IP: 112.116.155.*| 热度|

1 杨正瓴

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-30 23:48

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部