||
文章发表 | Cycle:识别自闭症细胞类型特异性lncRNA调控网络
自闭症谱系障碍(Autism spectrum disorder, ASD)是指具有高度遗传多样性和复杂性的神经发育障碍的集合。ASD个体从小就在社会交往和语言沟通方面存在着广泛的困难和缺陷。尽管ASD研究取得了惊人的进展,已有研究表明ASD具有很强的遗传异质性,并且许多分子参与调控一系列复杂的生物过程,包括神经元活动、和免疫反应,对ASD病理生物学的理解仍然不清楚。在分子调控水平上揭示ASD的潜在发病机制对早期发现和个性化治疗具有深远的意义。
长链非编码RNA(Long non-coding RNA, lncRNA)是一类长度通常超过200个核苷酸的非编码RNA,它们在神经系统疾病(如ASD)中起着重要的调节作用。在神经生物学领域,以往研究揭示了许多lncRNA发挥特定于细胞类型的生物学功能,包括神经元分化、突触发育和可塑性。此外,lncRNA调控还表现出组织特异性和细胞发育阶段特异性。由于ASD发展的异质性和复杂性,研究细胞类型特异性或动态lncRNA调控可以为发现潜在的ASD治疗策略提供新的视角。
最近,计算方法是破译lncRNA在调控ASD相关生物过程中的功能的潜在方法。通过使用bulk转录组学数据,识别lncRNA调控的计算方法可以分为三大类:依赖于核酸序列特征的序列方法,关注lncRNA表达变化的表达方法,以及结合多个数据源的集成方法。序列方法通过计算RNA碱基对的结合能来推断lncRNA-靶标对。一个典型的例子是LncTar,它利用最近邻热力学模型来计算lncRNA-RNA对的结合自由能。表达方法包括多种方法,包括统计方法、深度学习方法和因果推理方法。这些方法利用基因表达谱来推导和建立lncRNA-靶标相关性或因果关系对。集成方法结合不同类型的数据(如序列信息和表达谱),从而提高lncRNA靶点预测的精度和可靠性。
上述使用bulk转录组学数据的方法主要局限性是它们忽略了不同样本(细胞系或组织)中lncRNA调控的异质性。随着单细胞和单核RNA测序技术的不断发展,以单细胞或细胞类型分辨率推断lncRNA调控为探索ASD中特定细胞或细胞类型的lncRNA调控开辟了一条途径。在细胞特异性基因调控方面,CSN (Cell Specific Network)方法率先利用单细胞转录组数据构建细胞特异性网络。随后,作为CSN的改进,c-CSN、loc-CSN和p-CSN也被提出来分别推断条件网络、局部网络和部分细胞特异性网络。为了探索细胞特异性miRNA调控,CSmiR也被用于研究miRNA表达的单细胞水平调控。在个体细胞类型特异性调控方面,scHumanNet旨在利用HumanNet参考交互组和单细胞表达数据中包含的信息,为个体细胞类型生成专门的基因调控网络(GRN)。最近,scMTNI整合了单细胞多组学数据集来构建跨细胞系的特定细胞类型GRN。然而,这些细胞特异性或细胞类型特异性调控方法首先优先考虑转录因子或miRNA调控,而不是lncRNA调控。为了推断lncRNA在生物学条件下的特异性调控,CDSlncR可以推断与大脑新皮层不同发育状态相对应的lncRNA调控网络。鉴于ASD的发病涉及一系列由lncRNA调控的细胞类型和生物学过程,因此研究细胞类型特异性的lncRNA在ASD中的调控至关重要。
为了探索不同ASD细胞类型之间lncRNA的动态调控,我们提出了一种新的方法,Cycle(Cell type-specific lncRNA regulatory network,细胞类型特异性lncRNA调控网络,图1)来构建ASD细胞类型特异性lncRNA调控网络。Cycle有以下两个主要贡献。首先,Cycle并没有考虑所有基因之间的相互作用(lncRNA和mRNA),而是专注于鉴定lncRNA和mRNA之间的调控作用。其次,考虑到细胞和细胞类型的多样性和特异性,Cycle识别出每种细胞类型特异性的lncRNA调控网络。
图1 Cycle工作流。首先,Cycle利用HGNC (HUGO gene Nomenclature Committee)的基因注释信息提取匹配的lncRNA和mRNA表达数据,并进一步保留每种细胞类型的高表达lncRNA和mRNA。我们总共获得了17个高表达lncRNA和mRNA的细胞类型特异性表达数据。其次,Cycle构建了17种ASD细胞类型的细胞类型特异性lncRNA调控网络。此外,Cycle利用构建的lncRNA调控网络识别差异、稳定模块,以及枢纽lncRNA。最后,Cycle进行了四种下游分析,包括网络拓扑分析、独特性分析、细胞相似性网络构建和富集分析
我们将Cycle应用于ASD脑组织的单核RNA测序(snRNA-seq)数据,以构建ASD细胞类型特异性lncRNA调控。我们研究发现,每种ASD细胞类型在lncRNA调控中都是独特的。值得注意的是,超过三分之一的细胞类型特异性lncRNA调控网络是无标度的,并且它们都表现为小世界。在17种ASD细胞类型中,我们基于所识别的细胞类型特异性lncRNA调控网络推断出19个差异模块和11个保守块,以及8个差异枢纽lncRNA和3个保守枢纽lncRNA。重要的是,发现的差异和稳定模块以及保守枢纽lncRNA与ASD密切相关。此外,在构建的细胞相似网络中,更相似的ASD细胞类型往往紧密相连。最后,我们的比较结果表明,在阐明细胞类型特异性lncRNA调控方面,Cycle是一种很有前途的方法。
综上所述,Cycle可用于构建ASD中细胞类型特异性lncRNA调控的景观,并有助于阐明不同ASD细胞类型下lncRNA调控的异质性。Cycle详细代码和用户文档见https://github.com/chenchenxiong/Cycle。
参考文献
[1] Xiong C, Zhang M, Yang H, Wei X, Zhao C, Zhang J. Modelling cell type-specific lncRNA regulatory network in autism with Cycle. BMC Bioinformatics. 2024 Sep 27;25(1):307. doi: 10.1186/s12859-024-05933-0.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-1 18:17
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社