||
文章发表 | Scan:bulk和单细胞转录组数据中识别样本特异性miRNA调控
MicroRNA (miRNA,长度为19 - 25nt)作为一种调控型非编码RNA (non-coding RNA,ncRNA),可以调控数千种编码RNA的表达水平,在人类癌症的生物学过程、信号通路和病理过程中发挥关键作用。由于miRNA在生物系统中的重要性,它们在临床应用中有可能成为乳腺癌、白血病、前列腺癌等人类癌症的生物标志物。
生物网络有多种类型,包括生物样本(细胞或组织)内的基因调控网络。在不同类型的生物网络中,基因调控网络被认为是生物样本的一个重要特征,并导致了每个生物样本的独特性。在基因调控领域,miRNA调控由于其潜在的临床应用价值而引起了广泛的关注。因此,推断和表征miRNA调控是揭示系统生物学中miRNA调控机制的核心问题。就像生物样本(细胞或组织)中的动态生物系统一样,miRNA的调控也趋于动态。例如,通过使用bulk和单细胞转录组数据,现有研究发现miRNA调控网络具有条件特异性、组织特异性和细胞特异性。此外,众所周知,生物样本具有异质性,并被证明是独一无二的。因此,为了了解生物样本(特别是癌症组织或细胞)特异性miRNA调控,有必要研究样本特异性miRNA调控(即: 样本特异性miRNA调控网络)。
在单样本水平上,已有CSN、DEVC-net、EdgeBiomarker、SSN、LIONESS、c-CSN、LocCSN、SWEET、P-CSN和Normi等方法用于识别样本特异性基因调控(一个样本对应一个基因调控网络),这些方法识别的基因调控网络为无向网络。为了推断特异于单个样本的因果调控网络(即定向网络),还提出了一种使用漂移扩散过程和NME的推理方法。然而,上述计算方法旨在探索样本特异性转录调控,而不是样本特异性miRNA调控。为了研究单细胞水平的miRNA调控,引入CSmiR从单细胞miRNA-mRNA共测序数据(其中每个单细胞视为一个样本)推断细胞特异性miRNA调控。如CSmiR中所述,对于少于100个单细胞的单细胞miRNA-mRNA共测序数据,CSmiR需要使用重采样技术插入伪细胞。然而,原始的单细胞miRNA-mRNA共测序数据本身包含技术噪声(例如缺失数据),通过添加伪细胞来扩大数据可能会加剧技术噪声。
为了在单样本水平上模拟miRNA的动态调控过程,在这项工作中,我们提出了一个样本特异性miRNA调控(Sample-specific miRNA regulation,Scan)框架(图1),从bulk和单细胞转录组数据中识别样本特异性miRNA调控。为了探索miRNA-mRNA调控关系,已经提出了大量网络推理方法,可分为Correlation、Distance、Information、Regression、Bayesian、Proporality和Causality七大类别。 最近,出现了两种主要策略,统计扰动和线性插值,可以预测样本特异网络。由于单一网络推理方法或策略并不总是在所有类型的新数据中表现最佳,Scan结合了27种网络推理方法和两种策略,从bulk或单细胞转录组数据中推断组织特异性或细胞特异性miRNA调控。 给定具有或不具有miRNA-mRNA相互作用先验信息的bulk或单细胞转录组数据,Scan中27种常用的网络推断方法可用于计算miRNA和mRNA之间的强度。基于miRNA和mRNA之间的强度,Scan采用两种策略:统计扰动和线性插值来推断样本特异性miRNA调控网络。
图1 Scan示意图。给定具有或不具有miRNA-mRNA相互作用先验信息的bulk或单细胞转录组数据,Scan使用27种网络推理方法中的一种来构建miRNA-mRNA关系矩阵,这些网络推理方法包括Correlation、Distance、Information、Regression、Bayesian、Proporality和Causality等七种类型。Scan使用27种网络推理方法中的一种,构建了两个miRNA-mRNA关系矩阵(一个用于所有样本,另一个用于除第k个样本外的所有样本)。然后,对于样本(细胞或组织)k, Scan从两个构建的miRNA-mRNA关系矩阵中进行样本特异性网络推断,推断出样本k的特异性miRNA调控网络。Scan总共可以识别m个样本中的m个样本特异性miRNA调控网络(一个样本对应一个网络)
通过将Scan应用于两个RNA测序数据集,一个来自乳腺癌组织的bulk数据集和一个来自慢性髓性白血病(CML)细胞的单细胞数据集,我们证明了Scan在miRNA靶点预测的准确性和效率方面的有效性。此外,使用和不使用先验信息的性能比较表明,使用miRNA靶点的先验信息一般可以提高miRNA靶点预测的准确性。我们还发现Scan可以帮助构建样本相关网络和恢复融合miRNA调控网络。与CSmiR的比较表明,在使用miRNA靶点的先验信息的情况下,Scan在推断CML数据集的细胞特异性miRNA调控方面,大多具有比CSmiR更好或相近的性能。此外,在不使用miRNA靶点的先验信息的情况下,Scan在从乳腺癌数据集推断组织特异性miRNA调控方面的表现大多优于或与CSmiR相近。总之,Scan为识别人类癌症中样本特异性miRNA调控提供了一种有用的方法,并有助于在单个样本分辨率上阐明miRNA调控机制。
总之,我们提供了一种称为Scan的有用方法来识别样本特异性miRNA调控,有助于了解单个样本的异质性。本研究结果揭示了miRNA调控在K562细胞和BRCA组织中的异质性。我们认为Scan适用于在单个样本分辨率下探索miRNA调控机制。详细代码和用户文档参见https://github.com/zhangjunpeng411/Scan/ 或https://doi.org/10.5281/zenodo.13346。
参考文献
[1] Zhang J, Liu L, Wei X, Zhao C, Luo Y, Li J, Le TD. Scanning sample-specific miRNA regulation from bulk and single-cell RNA-sequencing data. BMC Biol. 2024 Sep 27;22(1):218. doi: 10.1186/s12915-024-02020-x.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-1 11:30
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社