HCNetlas:人类细胞网络图谱
人体组织由多种细胞类型组成,每种细胞类型都具有不同的功能作用,并且影响疾病基因如何促进疾病的发生和发展。掌握特定细胞类型如何影响疾病基因的作用是人类遗传学的一个复杂且尚未解决的问题。人类细胞图谱(Human Cell Atlas,HCA)项目收集了来自健康组织的大量单细胞RNA测序(scRNA-seq)数据,旨在通过基因表达谱阐明细胞类型与疾病之间的关系。
然而,疾病基因在特定细胞类型中的作用不仅仅在基因表达水平,它可以延伸到到基因网络中的位置和影响,即网络中心性。为了解决这个问题,我们需要一种以网络为中心的方法,将疾病基因定位到特定细胞类型中的功能景观。在之前,scHumanNet利用HumanNet作为基础相互作用组,根据基因表达的细胞间差异来构建基因关系。该scHumanNet框架能够通过对比健康组织和患病组织的细胞类型特异性基因网络(cell type-specific gene network,CGN)来辨别疾病基因的网络拓扑结构,从而确定疾病基因影响的细胞类型。通常,这涉及为健康和病变组织样本分别创建CGN。
识别疾病中改变的细胞状态通常需要与匹配的对照样本进行比较,这可能需要额外的成本和努力,有时甚至无法获得。如果能够获得来自健康个体的参考细胞的全面收集,如细胞图谱,则可以减轻这一挑战。这种资源可以潜在地消除生成对照样本的需要。类似地,为来自健康个体的多种细胞和组织类型提供参考CGN的网络图谱可以显著简化疾病状态网络改变的研究。此外,虽然个体基因表达值容易根据不同批次混杂的生物变异的技术来源而聚集,但当使用大量样本(例如细胞)时,足够细胞数量的基因关联推断通常受这种差异的影响较小。这是因为共表达信号在每个批次内本质上是归一化的,使得它们在网络比较中更可靠。因此,从细胞图谱中收集完整的CGN,将为疾病基因的细胞类型特异性分析提供一个强大的框架。这种方法可以避免需要匹配的对照样本,为了解疾病机制提供更有效的途径。
最近,Jiwon等人介绍了HCNetlas(人类细胞网络图谱,图1,https://github.com/netbiolab/HCNetlas),与HCA在疾病研究中的潜在影响相似,这是来自广泛的健康组织细胞的参考CGN集合。通过利用这些参考CGN,仅依靠疾病样本数据的可用性,就可以揭示疾病基因与特定细胞类型之间的关联。这种方法还绕过了从匹配的对照样本中推断CGN的必要性,简化了在特定细胞类型中识别疾病特异性基因相互作用的过程。HCNetlas 目前包括198个CGN,涵盖25个器官的61种细胞类型。HCNetlas根据它们的疾病特征对CGN进行了聚类,并观察了由相似细胞类型组成的模块。这种聚类模式表明这些CGN有潜力有效地解决疾病基因功能的细胞特异性。此外,HCNetlas实施了三种基于网络的方法来评估疾病基因的细胞类型特异性功能。利用这一分析框架对参考CGN和来自病变组织的CGN进行分析,使我们能够确定与各种疾病相关的细胞类型,从而验证HCNetlas在细胞类型水平解决疾病遗传学中的有效性。因此,HCNetlas在加速发现专门针对疾病基因的细胞环境的生物标志物和治疗靶点方面具有很大的希望,为人类疾病中细胞类型特异性基因作用的复杂网络提供了一个精细的视角。
图1 从单细胞转录组数据收集到构建HCNetlas的工作流程示意图。使用scHumanNet框架,使用预标注细胞类型的单细胞RNA测序数据构建细胞类型特异性基因网络(CGN)。HCNetlas由这些基因网络组成,代表了各种人体组织和细胞类型
在这项研究中,通过充分利用HCNetlas:一个来自健康个体单细胞表达图谱的参考CGN图谱,作者们已经证明了网络生物学方法在细胞水平上描述疾病遗传学的有效性。通过比较参考CGN和患病CGN,可以测量区分健康和患病状态的网络拓扑结构的变化。这些CGN是由疾病背景下相同细胞类型的单细胞转录组数据构建的。在HCNetlas中纳入了三种分析方法:紧致度差异、枢纽差异和通路差异分析。这些方法被应用于三个不同的案例研究,分别针对免疫系统疾病、神经系统疾病和癌症,从而证实了HCNetlas在研究与细胞类型特异性相关的疾病基因方面的广泛适用性。紧致度差异分析确定了与疾病相关的细胞类型。研究发现,鉴定疾病相关细胞类型的参考CGN和疾病CGN之间的差异枢纽基因是预测细胞类型特异性疾病基因的有效方法。此外,通过检查参考和疾病CGN之间与前几个枢纽基因相关的差异通路,可以深入了解疾病相关细胞类型中潜在驱动发病机制的分子机制。因此,HCNetlas被证明是识别参与疾病的特定细胞类型、基因和分子途径的强大框架,从而显著推进我们对疾病如何以细胞类型特异性方式表现的理解。
这项研究强调了在识别疾病基因的细胞类型特异性方面,基于网络的分析比传统的基于表达方法更有效。例如,在肺癌病例研究中,发现在多种免疫细胞类型中只有少数获得性基因是共享的,这强调了网络结构的改变,而不仅仅是基因表达的变化,更准确地反映了基因的细胞类型特异性功能。此外,研究结果表明,与差异表达分析相比,差异枢纽对癌症相关基因提供了更大的预测能力。一个值得注意的观察结果是,尽管许多基因在不同的免疫细胞类型中表达差异,但这些基因中只有有限的子集被证实与肺癌有关。这突出表明,基因的特性是一种细胞类型所特有的,如枢纽差异,可以显著提高疾病基因预测的准确性。此外,尽管它们没有通过表达水平优先级确定,但与上调的差异表达基因不同,发现获得性基因与肿瘤样本表达谱的关联具有预后价值。这意味着,在特定细胞类型中,通过与其他基因的相互作用影响疾病的基因的表达水平更相关,更能指示疾病背景。因此,HCNetlas不仅鉴定了疾病相关基因,而且还提供了对这些基因在特定细胞环境中的功能意义的见解。
尽管有这些令人鼓舞的发现,HCNetlas仍有一些局限性。一个重要的限制是目前缺乏用于广泛细胞类型和组织的“控制”单细胞基因表达数据。数据的缺乏限制了HCNetlas的范围和适用性,因为CGN的全面定位取决于广泛转录组学数据的可用性。因此, 创建真实参考CGN的努力受到图谱级别资源的限制,这些资源具有不同的健康状况(不一定患病)。然而,随着单细胞转录组学领域的不断发展,这一限制有望减少。随着产生的数据越来越多,特别是健康组织的数据,构建更全面的CGN数据,覆盖更广泛的细胞类型将成为可能。因此,HCA项目的进展可能会显著增强HCNetlas效用,使其能够扩展到更广泛的疾病中,并加深我们对各种病理状态下细胞行为的理解。
HCNetlas的另一个挑战源于我们的网络推理方法的固有局限性,它依赖于参考交互组。所述参考相互作用组主要使用来自控制状态而不是来自疾病状态的数据进行映射。因此,这种方法可能会忽略疾病状态特有的相互作用,因为这些相互作用可能在参考相互作用组中未被充分代表或完全不存在。这样的遗漏会限制HCNetlas的分析能力,特别是在准确描绘疾病特异性网络动态方面。此外,低数量的细胞(低于大约1000个细胞)经常模拟不完整的网络结构,从而可能阻碍依赖于数据输入的疾病分析。例如,这使得我们无法用scRNA-seq数据观察小胶质细胞(一种与该疾病相关的重要细胞类型)。为了解决这个问题,未来HCNetlas的发展可能需要包括直接从疾病样本数据中对基因网络进行从头推断。将这些疾病特异性网络整合到HCNetlas中,将为各种疾病中发生的基因相互作用提供更全面的视角。这种改进不仅可以克服当前的限制,还可以丰富HCNetlas平台,使其能够在分子水平上对疾病机制提供更细致和准确的见解。
参考文献
[1] Jiwon Yu, Junha Cha, Geon Koh, Insuk Lee. HCNetlas: Human cell network atlas enabling cell type-resolved disease genetics. bioRxiv, 2024.06.07.597878; doi: https://doi.org/10.1101/2024.06.07.597878
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
转载本文请联系原作者获取授权,同时请注明本文来自张俊鹏科学网博客。
链接地址:https://wap.sciencenet.cn/blog-571917-1454395.html?mobile=1
收藏