SpaceSequest:空间转录组学数据分析统一流程
单细胞RNA测序(scRNA-seq)的出现彻底改变了我们对细胞异质性和基因表达动力学的理解。它代表了批量RNA-seq的重大进步,后者只能提供混合细胞群体的平均表达谱,从而模糊了潜在的细胞多样性。尽管scRNA-seq可以对细胞异质性产生宝贵的见解,但它缺乏空间信息,因为它将细胞从其原始组织环境中分离出来。了解复杂组织和器官中基因表达的复杂空间组织对于解开生物学之谜至关重要。空间转录组学(ST)已经成为一种变革性的技术,它可以量化完整组织切片中的RNA,使研究人员能够探索其原生空间背景下的基因表达模式。
ST可以通过识别病变组织内的异质性来精确了解疾病进展,这对于研究肿瘤和神经系统疾病等复杂疾病非常有用。例如,使用ST数据,Berglund等人不仅区分了健康和患病区域,而且能够通过分析肿瘤微环境中的基因表达梯度,特别是在肿瘤区域附近的基质中,识别重新分层的肿瘤异质性。这些进步为解决关键的生物学问题开辟了新的途径。首先,ST在表征组织的细胞类型组成中起着关键作用。虽然定义通常来源于大规模单细胞RNA-seq或表观遗传学数据集,并投射到ST数据上,但该技术也允许从空间转录组学数据本身直接生成细胞类型定义。这一应用已被广泛应用,从而创建了多种组织的组成图谱,包括神经系统、人体肾脏、心脏、睾丸和肺。其次,ST促进了细胞相互作用的探索,揭示了不同细胞类型之间空间共变的规则和模式。例如,对小鼠视觉皮层的研究发现了抑制性神经元亚型的优先空间邻近性,揭示了它们的组织原理。类似的接近性分析在阐明与阿尔茨海默病相关的基因表达模式和表征创伤性脑损伤的组织病理学反应方面发挥了重要作用。最后,ST在原位基因表达上的转录组数据使组织组分之间的分子相互作用得以阐明。通过识别不同空间距离的细胞类型之间的配体-受体对,我们可以识别肿瘤与微环境相互作用、组织免疫浸润和发育梯度建立等现象背后复杂的通信网络。
有两种不同的ST方法:(i)基于测序的ST和(ii)基于成像的ST。在基于测序的ST方法中,DNA条形码表面用于从完整的组织切片中捕获RNA分子。然后对这些捕获的RNA分子进行下一代测序,以确定它们各自的基因身份。相比之下,在基于成像的方法中,使用荧光原位杂交(FISH)或直接原位测序在完整组织中同时检测多个mRNA转录物。基于成像的方法,如10x Genomics Xenium和NanoString CosMx,适合于假设检验,因为这些方法允许在单细胞分辨率下进行转录组分析,尽管目标基因的数量有限。相反,基于测序的方法产生无偏的全转录组谱,适用于假设生成。典型的方法包括10x Genomics Visium,Visium HD和NanoString GeoMx,并带有测序读数。然而,从这些方法获得的转录组学特征不能直接在单细胞分辨率下解决。
当前基于网格的ST分析方法(Visium、Slide-seq和HDST)的一个关键缺点是它们无法实现单细胞分辨率。这些技术在每个组织位置结合多个细胞或多个细胞的部分,限制了辨别单个细胞贡献的能力。然而,这一限制可以通过计算集成来解决,利用从偶联单细胞RNA测序(scRNA-seq)谱中获得的细胞类型的参考转录组特征。通过整合ST数据和scRNA-seq数据,研究人员可以反卷积细胞类型组成,并从空间解析的基因表达模式中获取更多信息。
空间转录组学数据分析的前景已经看到了几个数据分析管道的发展,包括ST Pipeline和Spacemake。ST Pipeline主要关注处理FASTQ格式Visium数据衍生的原始文件所需的基本工具和脚本,为下游分析提供数据集。相比之下,Spacemake代表了一个更全面的解决方案,与ST Pipeline相比,它提供了更广泛的功能。该工具擅长处理来自不同平台的空间转录组数据,如Visium, Slide-seq, Seq-scope等。Spacemake的另一个显著特点是它利用了NovoSpaRc,允许将snRNASeq数据映射到空间坐标。最近开发的管道专注于特定任务,例如,PIPEFISH是专为FISH空间转录组学设计的,ENACT是专为Visium HD数据分析设计的,而Panpipes是专为空间多组学分析而创建的。虽然这些现有的管道是有用的,但它们的能力在从不同的空间转录组学数据集中提取全面和有意义的生物学见解方面存在不足。
最近,Sun等人介绍了SpaceSequest(图1,https://github.com/interactivereport/spacesequest),SpaceSequest综合空间转录组学数据分析管道专为几个主要平台的分析而定制,包括10X Genomics Visium(图2),Visium HD(图3),Xenium(图4)以及NanoString GeoMx(图5)和CosMx(图6)平台。通过利用尖端的计算方法,SpaceSequest简化了一系列基本分析,以提取有意义的生物学见解。该管道与多种输入格式兼容,可以无缝地通过关键步骤进行导航,包括聚类、反卷积、细胞类型注释和差异表达分析。这种综合方法为研究人员提供了一个强大的工具来剖析空间定义的分子景观,促进对复杂生物系统及其微环境相互作用的更深入理解。
图1 SpaceSequest组成,能处理10X Genomics Visium, Visium HD, Xenium以及NanoString GeoMx和CosMx平台的数据
图2 Visium数据处理流程
图3 Xenium和CosMx数据处理流程
图4 GeoMx数据处理流程
图5 Visium HD数据处理流程
参考文献
[1] Yu H. Sun, Sarbottam Piya, Zhengyu Ouyang, Yirui Chen, Jake Gagnon, Shaolong Cao, Haotian Zhang, Baobao Song, Jing Zhu, Khyati Chandratre, Houlin Yu, Wenxing Hu, Matthew Ryals, Fergal Casey, Dann Huh, Baohong Zhang. SpaceSequest: A unified pipeline for spatial transcriptomics data analysis. bioRxiv 2025.09.15.676389; doi: https://doi.org/10.1101/2025.09.15.676389
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库
转载本文请联系原作者获取授权,同时请注明本文来自张俊鹏科学网博客。
链接地址:https://wap.sciencenet.cn/blog-571917-1507013.html?mobile=1
收藏