张俊鹏
单细胞组学的临床路径图
2025-7-18 13:42
阅读:277

单细胞组学的临床路径图 

在短短几年内,单细胞组学技术从仅少数专业实验室采用的开创性技术,发展成为生物研究中的普遍特征,并成为科学发现的关键推动力。单细胞组学检测的广泛采用和发展引发了日益高涨的热情,认为这些技术有望提高诊断的精确性、疾病进展的监测以及治疗策略的个性化。然而,尽管单细胞技术在临床环境中有初步应用,但目前尚未常规用于指导医疗或手术决策。最近,Skinnider等人在《Cell》杂志识别并分类了当前阻碍单细胞组学临床应用的关键实验、计算和概念障碍。重点关注单细胞转录组学在通过开发组合生物标志物来指导临床决策的潜力,这些生物标志物可同时量化多种细胞类型特异性病理生理过程。此外,他们阐述了一个框架,用于识别可能从这些生物标志物中获益的患者亚群,并概述了从单细胞组学中获取可重复且具有临床指导意义的读数所需的实验和计算要求。 

引言

将人类病理学划分为疾病及其亚型的分类学一直是医学数千年的核心目标。这些分类学最初源于对临床观察的整理尝试,随着新的生理学、生物化学和放射学测量技术的开发并在临床实践中应用,它们逐渐得到完善。在过去的一个世纪里,人类疾病的分类学基于日益精确的分子测量得到了进一步细化。基因组学、转录组学、蛋白质组学、代谢组学和脂质组学在人体组织中的应用,为许多疾病提供了详细的分子图谱。对这些检测方法的改进,使它们能够达到单细胞分辨率。单细胞组学作为生物医学研究普遍特征的兴起,进一步深化了我们对人类病理生理学的测量能力,通过捕捉疾病中发生的全部分子和细胞失调谱。 

2009 年首次测序单细胞转录组以来,单细胞组学已扩展到整个生物体,并已成为生物医学研究中的一个普遍特征。它能够测量疾病和生物扰动引起的细胞和分子变化的能力,使许多科学领域取得了深刻的发现。在神经科学中,单细胞组学已识别出控制蛰伏、调节口渴或能在瘫痪后恢复行走的中枢神经元亚群。在癌症生物学中,单细胞组学揭示了胶质母细胞瘤中恶性肿瘤细胞的转录程序汇聚于四种主要的细胞状态,每种状态都与不同的遗传驱动因素相关。在再生过程中,单细胞组学发现了恢复组织细胞,这些细胞协调受伤肢体、器官和受损神经系统的再生长。 

单细胞组学对科学发现的影响与其对临床实践的冲击形成鲜明对比,迄今为止后者影响甚微。为什么随着单细胞组学的成熟,分子和细胞测量的分辨率显著提高,却未能转化为人类疾病诊断、预后或管理的改进?普遍认为,这种有限的临床影响是由于单细胞组学转化为临床和外科环境仍需克服的多方面实验、计算和概念障碍所致。单细胞转录组学作为技术、概念和商业上最成熟的单细胞组学检测方法,因此最适合临床转化。然而,实验、计算和概念障碍同样适用于其他单细胞组学方法,例如单细胞水平的染色质可及性或蛋白质丰度测量。 

生物标志物:进入临床医学的入口

历史上,测量技术的进步通常通过推动人类疾病的诊断,对临床护理产生了最直接的影响。这些诊断进步通常表现为新的分子生物标志物。传统“整体”组学技术的开发,这些技术测量生物样本中所有细胞内分析物的平均丰度,导致了在临床前模型中的大量发现,这些发现现已通过新的生物标志物的临床实施直接整合到患者护理中。例如,测序技术现在在临床中常规用于识别相关的癌症突变,指导靶向治疗或诊断遗传疾病。 

单细胞转录组学提供的更高分辨率激发了人们对于这项技术能够进一步提升诊断的精确性、疾病进展监测的准确性以及个性化医疗准确性的期待。由于生物组织的bulk转录组分析会将细胞类型比例的变化与细胞类型内在的基因表达变化混淆在一起,这些测量可能会忽略疾病生理学的重要方面,甚至导致错误发现。一个典型的例子是神经退行性疾病,其中与突触功能相关的基因的明显下调实际上反映了神经元的丢失以及伴随的胶质细胞比例的增加。整体转录组分析也可能忽略细胞类型特异性的转录变化,特别是在目标组织中相对稀有的细胞类型中;例如,小胶质细胞在神经炎症刺激下会差异表达数百个基因,这无法通过全脑组织的整体转录组分析检测到。通过解耦这些生物学变异轴,单细胞转录组学有可能揭示特定细胞亚群中的临床意义变化,这些变化可能提供更精确和准确的疾病生物标志物。例如,中枢神经系统的研究通过揭示神经元亚型对脊髓损伤(SCI)的特异性反应,或将细胞类型比例的变化与细胞类型特异性的差异表达解耦,从而识别出对损伤或疾病具有独特耐受性或易感性神经元亚群。 

单细胞转录组学衍生生物标志物的临床影响可能比目前所认识到的更为广泛(图 1)。例如,考虑单细胞转录组学在创伤性脊髓损伤背景下的潜在临床应用。这是一种临床诊断很少困难且目前尚无有效药物治疗的疾病。然而,细胞类型特异性生物标志物可以指导有前景的治疗的临床实施在临床前模型中逐渐出现的新方法。在脊髓损伤(SCI)中,初始的脊髓创伤不一定是对神经功能预后的主要决定因素。这种创伤还会启动一系列复杂且渐进的生化过程,统称为继发性损伤,涉及中枢神经系统的所有主要细胞类型和亚型。历史上,针对脊髓损伤的治疗方法通常试图在单个细胞类型中针对继发性损伤反应的某些方面——例如,通过抑制免疫反应或促进神经元发芽。然而,尽管经过数十年的研究,这些方法未能转化为有效的疗法。最近,协调靶向多种细胞类型特异性反应,包括星形胶质细胞、神经元、血管和免疫细胞特异性程序,产生了在临床前模型中可以逆转瘫痪的更有前景的疗法。这些疗法的临床转化需要这些多细胞反应在人类患者中同样可以被调节和靶向。然而,如果无法测量每种细胞类型对多方面策略中每个个别成分的反应,那么这些治疗哪些方面成功或失败可能永远无法明确。因此,可以合理预期,将针对多种细胞类型特异性反应同时进行的多方面疗法转化为临床应用,可能需要多细胞生物标志物来确定可能从这些疗法中获益的患者特征。 

image.png

1 单细胞组学转化性临床生物标志物应用可能性。单细胞组学生物标志物的临床应用示例。(A) 基于神经元和微胶质细胞基因表达程序的连续细胞水平分布,用于对脊髓损伤(SCI)患者进行分层的多细胞生物标志物。(B) 基于罕见细胞群体存在及伴随的血脑屏障(BBB)失调的胶质瘤细胞生物标志物 

SCI 的例子说明了监测协调但细胞类型特异性的分子程序的生物标志物的潜在临床影响,即使在诊断不确定性较小的疾病中也是如此。基于单细胞转录组学的生物标志物的潜在益处可能在与诊断困难或存在临床上有意义的亚型相关的疾病中要大得多;在准确预后需要整合多种细胞类型特异性反应的情况下;或在更精确的诊断或预后会改变治疗性质或时间的情况下。相反,许多临床情境不太可能从单细胞组学的应用中获益,无论是由于诊断或管理相对明确,还是因为可以在不测量多种细胞类型中的许多分析物的情况下获得临床可操作的情报,作者们概述了一个框架来优先考虑那些证明单细胞组学分析额外成本和复杂性合理的场景。 

临床转化障碍

然而,当前的这种潜在益处完全是理论上的。单细胞转录组学为何至今未能影响临床实践,以及哪些因素阻碍了其融入临床决策?作者们将阻碍单细胞技术在临床实践中实现变革性潜力的障碍分为三类:实验障碍、计算障碍和概念障碍(图 2)。 

image.png

2 基于单细胞转录组学的协调多细胞生物标志物实施中的实验、计算和概念障碍。顶部,作为中心实验障碍的大规模患者队列招募。左下,作为中心计算障碍的有效统计分析。右下,从单细胞谱中设计患者级表型预测的机器学习模型作为中心概念障碍 

实验障碍

可以说,单细胞转录组学识别和转化生物标志物的最显著障碍是现有单细胞检测的相对高成本和有限的可扩展性。来自宏组学的临床发现是由研究大型患者队列所实现的,这些队列通常由数百人组成。相比之下,只有少数研究使用单细胞转录组学分析了规模相当的患者队列。即使是包含数十名患者的队列也并不常见。 

人类疾病本质上具有异质性。疾病的细胞和分子表现会根据每个患者的年龄、性别、遗传背景、暴露史、疾病严重程度、发病时间和用药史而有所不同。因此,仅包含少数患者的队列不太可能支持发现稳健且普适的生物标志物。相反,为了识别超越患者特异性生物学异质性和不可避免的实验技术变异的疾病相关分子程序,有必要组装能够捕捉疾病全部表现的大型患者队列。 

另一方面,仅靠组建大型患者队列无法克服研究设计层面引入的任意变异性。例如,在单个研究中涵盖多种原发性癌症类型的图谱对生物发现具有重要价值,但它们无法支持在特定患者群体中识别可靠的生物标志物,例如接受相同类型癌症相同治疗方案的患者群体。旨在识别稳健分子和细胞生物标志物的研究需要更周全的队列确认方法,以减轻与这些生物标志物的临床应用无关的生物变异性。 

直到最近,对大量患者进行单细胞转录组分析的努力一直受到这些测量成本的影响,以及文库制备耗时且复杂的特性,再加上获取新鲜生物组织的困难。单细胞技术的可扩展性进步(例如基于探针的多重检测或基于孔的联合索引)有望增加单个实验中可以分析样本的数量。此外,从石蜡固定或冷冻组织中回收 RNA 转录本的技术进步可能为利用现有医院组织库进行生物标志物发现开辟新的机会。将这些进步与谨慎的患者招募相结合,可以加速发现与细胞类型特异性分子改变相关的可靠生物标志物的速度,并将这些生物标志物转化为临床实践。 

尽管取得了这些进展,技术挑战依然存在。例如,希望以单细胞分辨率分析转录组的调查者必须在从完整的、完整的细胞中测序 RNA(真正的单细胞转录组学)或仅从分离的细胞核中测序核 RNA(单核转录组学)之间做出选择。后者具有的优点在于它能够分析那些难以通过机械或酶解方法分离的组织,并减轻与分离程序本身相关的转录失调。然而,现在已经清楚的是,单细胞和单核转录组学都未能恢复某些细胞类型或基因特征,这表明任何一种方法都可能被忽略相关生物标志物。此外,准确诊断或预测某些疾病可能需要的信息可能无法在转录组中捕获,但可能仅在表观基因组、蛋白质组或代谢组中特有地表现出来。尽管多模态单细胞分析技术取得了进步,但这些技术的成本和复杂性通常限制了研究人员仅选择一种模态进行分析,尤其是在研究较大患者队列时。 

单细胞转录组学的临床转化还面临一个额外的实验挑战,即这些生物标志物将获得临床应用批准的监管环境。当前标准要求,从任何给定的临床样本中获得的结果必须能够由其他提供相同样本的实验室独立重复。要实现这种程度的可重复性,将需要大量时间和资源投资,以标准化组织制备、这些组织的单细胞分析以及测序数据的计算分析。这种标准化需要考虑医院环境的异质性,并需要跨医院和地区的专业人员的培训,以根据标准操作程序(SOP)执行和解释相同的检测。这种标准化的成本和复杂性可能会促进新的工业合作关系的形成,这些合作关系对于实现生物医学专业知识和开发及实施单细胞检测所需的生物技术基础之间的结合是必要的。 

计算障碍

超越实验障碍,还存在重要的计算障碍,需要克服这些障碍才能实现单细胞转录组学的潜在临床影响。这些挑战可以大致分为发现候选生物标志物的障碍和临床实施的障碍。 

在单细胞转录组学的早期阶段,实验方法和计算流程迅速且同步发展。在这个形成期,计算生物学家大量借鉴了最初开发的方法在宏转录组学的背景下。后续发展识别出单细胞转录组学数据的所谓不同统计特性,并引入了针对这些特性的方法。其中许多假设和计算方法逐渐固化为标准工作流程。随着时间的推移,人们逐渐意识到许多这些工作流程依赖于有缺陷的方法论或统计假设。 

使用不恰当的统计方法来分析转录组数据,由于这些方法容易产生假发现,因此成为发现稳健且普适性生物标志物的重大障碍。例如,对一个单细胞数据集进行聚类以识别细胞类型,然后使用相同的数据来识别不同细胞类型间差异表达的基因,这代表了一种统计上的“双重使用”形式,即使数据中不存在任何潜在结构也会产生假发现。同样的问题在其他广泛使用的计算范式中也反复出现,例如伪时间分析。假发现的产生进一步加剧了普遍使用不当统计方法的问题,这些方法将单个细胞错误地视为观察单位。实际上,单细胞数据具有层次结构,来自同一患者的细胞不能被视为统计上独立。未能考虑样本间的生物学变异,会将重复内的变异和重复间的变异混淆,并在没有实际差异的情况下产生数千个假发现。 第三种挑战来自于希望识别那些因疾病而数量变化的细胞类型或状态。由于单细胞转录组学研究的是细胞类型和状态的相对比例而非绝对数量,一种细胞类型的数量增加可能会产生所有其他细胞类型数量减少的错觉。 

通过统计方法识别的生物标志物容易产生假发现,因此临床验证和转化这些生物标志物的努力可能不会成功。幸运的是,有替代方法可用。计数拆分将潜在变量估计与统计推断分离,从而在聚类或伪时间分析后实现有效的差异表达。广义线性混合模型或“伪bulk”差异表达方法考虑了生物学重复之间的变异,从而避免了假发现。许多方法通过考虑单细胞数据集的组成性质,实现了有效的差异丰度分析。然而,这些方法的采用程度不一且不完整。在标准分析工作流程中用统计有效的方法替代不适当的方法,是利用单细胞数据做出可推广发现并转化为临床进步的重要第一步。 

将单细胞转录组学应用于临床和手术环境中的人体组织也带来了新的计算挑战。基于单细胞转录组学的生物标志物的承诺是将多种协调的、细胞类型特异性的改变整合到一个单一的诊断或预后读数中。统计或机器学习模型提供了一个自然的框架来实现这一承诺(尽管这绝非唯一的方法)。在这个框架中,一个在单细胞转录组学数据上训练的模型被用于预测新队列中的表型:例如,诊断疾病、分层疾病严重程度或监测治疗反应。然而,这种场景带来了巨大的计算挑战,这些挑战仅得到有限程度的解决。尽管已经开发出少数模型用于预测未知患者的表型,但它们采用了不同的方法论;由于这些工作仍处于早期阶段,这些方法尚未在任何独立的验证队列中得到测试。因此,关于如何通过机器学习最有效地解决单细胞转录组学数据表型预测挑战的问题还有很多未解之谜。初步尝试已经揭示了在原则上考虑技术批次效应和生物异质性的核心重要性。与输入数据的最佳表示和预测任务本质相关的其他开放性问题更具概念性。 

除了表型预测之外,建立单细胞转录组学数据计算分析的重复性标准操作规程(SOP)也将引入新的计算挑战。目前,数据分析的标准计算工作流程需要在读对齐后几乎每个阶段都进行相当程度的主体性手动干预,包括细胞质量控制、双细胞去除、环境 RNA 去除、数据整合和细胞类型注释。在每个这些步骤中选择的特定参数值会显著改变最终数据集。单细胞数据集分析中固有的主观性与现代法规要求不同实验室对任何给定样本产生相同临床结果的要求相冲突。因此,单细胞转录组学的临床应用需要开发计算协议,以标准化和自动化针对每种特定疾病背景的这些步骤。这种标准化是一个艰巨的挑战,目前尚未得到成功解决。 为了让单细胞组学满足临床使用的监管标准,作者们主张将可重复的自动化分析工作流程的发展提升到计算研究社区的核心优先事项。满足这一要求可能需要重新调整学术激励机制,目前这些机制更倾向于引入新方法,而不是实现临床转化所需的不那么吸引人的工作。 

概念障碍

除了与单细胞转录组学在临床环境中实施相关的具体实验和计算障碍之外,还存在更广泛的概念性问题,这些问题与实现这些技术的临床潜力有关。例如,哪些患者群体将从基于单细胞转录组学的生物标志物中受益?对于这些患者,如何将每个疾病相关的协调的和细胞类型特异性的分子改变整合起来,以产生临床可操作的读数? 

对于许多疾病,临床护理不会直接受益于单细胞转录组学或更广泛意义上的单细胞组学。例如,诊断不太可能通过在疾病状态可以通过简单的实验室或临床检查明确确定时,多细胞生物标志物是必要的。例如,确定患者是否患有高血压或缺铁性贫血,单细胞组学并非必需。同样,对于具有明确手术指征的疾病,如阑尾炎或脑积水,单细胞组学至少在临床决策的初始阶段不太可能产生有意义的影响。 

那么,哪些疾病将从单细胞生物标志物中受益呢?受益最大的疾病是那些病理生理学涉及多种细胞类型协调分子改变,并且评估这些多细胞改变能够显著改善诊断、管理或预后的疾病。诊断的改进最相关的是当它们提供可操作的资讯,能够迅速改变管理并改变患者的预后时。管理的改进最相关的是当临床医生必须考虑大量可能的治疗方案时,或者当干预措施应何时实施尚不明确时。 

技术因素也起作用。如果无需测量多种细胞类型的许多基因就能获得临床可操作的资讯,那么通过更简单的方法,例如对单个细胞亚群进行分选并定量单个转录本或表面蛋白的丰度,临床获益可能更容易实现——这在许多血液肿瘤的治疗中就是标准做法。此外,如果疾病发生的组织在临床上无法获取,而其他可获取的组织如血液、尿液或脑脊液(CSF)又无法捕捉到相关的细胞和分子改变,那么基于单细胞转录组学的生物标志物的潜在获益将大大降低。 

有一些疾病符合上述所有标准,因此可能受益于单细胞转录组学衍生的生物标志物。例如,大多数实体瘤作为常规实践的一部分会被活检,这意味着病变组织在临床上是可获取的。肿瘤是复杂的生态系统,通常包含多个恶性亚克隆以及基质和免疫细胞的微环境,而每个这些细胞区室都可能影响疾病进展。因此,在转录组的整个尺度上监测肿瘤内的多细胞改变具有明确的合理性。数十年的研究表明,组织学上均匀的肿瘤可以根据其分子特征进行区分,其中一些分子亚群具有不同的预后和对特定治疗方案的特征性反应。例如,胶质瘤的单细胞生物标志物可以识别起源的胶质细胞状态,通过识别耐药亚克隆的存在来提供预后信息。胶质母细胞瘤干细胞,并指导临床医生考虑临床问题,例如保守手术与激进手术切除的选择、化疗和放疗在治疗计划中的作用,以及这些干预措施是否可能改变患者的预后。类似地,自身免疫性疾病的诊断和治疗可以通过识别外周血中的特定炎症细胞亚群来指导,特别是当每个亚群对靶向免疫疗法有不同的反应时。 

一旦一种疾病被确定作为生物标志物开发的合理目标,并且已经从一个大而经过仔细确认的患者队列中收集了单细胞转录组数据,接下来的问题就是如何将来自任何特定患者的多方面单细胞数据转化为具有临床意义的读数。现有的旨在从整体组学数据中产生诊断或预后读数的计算范式不太可能直接转化为单细胞转录组学的环境,因为数据结构存在深刻差异。相反,部署协调的多细胞生物标志物的努力必须仔细考虑这样一个概念框架:即如何将数万个基因在数千个细胞(这些细胞可能被分组为几十种细胞类型)中测量的数据转化为临床医生历来珍视的标量值读数。从机器学习的角度来看,我们可能会问:我们的模型的输入是什么,它被训练来预测,什么作为输出? 

源自单细胞生物标志物的临床意义读数可能呈现更多种形式,这些形式在迄今为止的文献中已有描述。在目前已开发的少数计算框架中,所有框架都假设需要预测单个患者级别的输出:例如,疾病与对照的二元诊断分类。然而,在某些情况下,从单个细胞级别的预测中可能获得更具行动性的生物标志物。这种情况可能发生在,例如,少数具有特定分子特征的细胞的存在或比例对诊断或预后具有关键重要性时。前者可以由罕见耐药癌细胞群的存在来举例,这些细胞最终会导致复发。在后者中,胶质瘤中表达特定分子特征的星形胶质细胞的比例可能会提高肿瘤分期的分辨率,从而提高预后准确性。 

用于预测单个细胞表型而非生成患者级输出的机器学习模型,将为每位患者生成数千个预测。为了让这些预测能够指导临床决策,它们需要被总结为可解释的患者级读数。如何将细胞级预测汇总到患者级?来自同一个人的细胞将表现出对疾病的分子反应,这些反应在性质和强度上都是异质的。这些反应的分布可以以多种方式总结:例如,通过反映对疾病平均分子反应的中心趋势指标,或通过极端值的存在,如罕见耐药癌细胞的情况。 

无论机器学习模型生成的是患者水平还是细胞水平的预测,下一个问题将是生物标志物是否必须包含组织中所有细胞类型的信息,还是只需包含与所讨论疾病最相关的细胞类型的信息。一个相关的问题是,通过为每种细胞类型分别训练模型,还是设计一个能够整合多种细胞类型信息的单一模型,能够获得更准确的预测。在单一模型中整合不同细胞类型的信息,可以通过输入数据的表示方式或模型本身的架构来实现。例如,将样本表示为细胞类型或细胞状态频率的向量,使模型能够同时从多种细胞类型中学习;而基于注意力多实例学习的神经网络架构,在生成患者水平预测时,能够自动优先考虑与疾病最相关的细胞和细胞类型。 

将新的计算方法引入以从层次单细胞数据中得出临床可操作的推论,并通过对这些方法进行统计比较而非模型性能的点估计进行仔细的基准测试,将引导该领域走向最佳分析方法的识别。然而,上述问题不会有唯一答案。相反,特定疾病的发生发展和给定生物标志物应用的临床背景将指导基于单细胞技术的生物标志物的设计和实施。需要计算科学家和临床医生之间的紧密合作,才能充分实现这些技术的临床潜力。 

在现有基础上构建

在上述章节中,主要关注了基于单细胞转录组学的生物标志物临床转化所面临的主要障碍。同样重要的是要认识到已经取得的令人瞩目的进展,以及现有的计算和实验技术,这些技术有望实现生物标志物的发现。正是凭借这些进步,该领域现在才处于开始考虑单细胞技术临床应用的位置。实验方法现在明确达到了所需的规模和通量,能够对前瞻性临床试验中精心设计的患者队列进行特征分析,这一点有少数研究收集和分析了涵盖数百名患者的单细胞数据集作为证据。计算技术的进步同步扩展,使得能够使用标准工作流程分析这些大型数据集,尽管这些工作流程的许多方面仍然是争论的焦点。尽管在单细胞数据分析工作流程的重要步骤(如标准化、聚类或数据整合)方面仍在持续改进,但这些工具现在已足够成熟,在临床和手术环境中的部署不会损害单细胞转录组学的临床前景。上述每个步骤都经过了广泛的基准测试,这些基准测试通常证实了顶尖方法之间性能的高度相似性。相反,对于分析工作流程中的其他步骤,如差异表达和差异丰度分析,基准测试已经识别出不同方法之间的性能差异,并在某些情况下阐明了这些差异背后的机制。尽管进一步优化现有的计算基础设施无疑是宝贵的,但从临床角度来看,这种优化可能只会带来渐进式的进步。相反,如果单细胞转录组学的临床潜力要得以实现,克服上述实验、计算和概念上的障碍必须是最高优先级。 

超越转录组

到目前为止,主要关注单细胞转录组学,因为该模式的实验和计算工作流程是所有单细胞组学检测中最成熟的技术和商业化的,因此最适合临床转化。尽管其他单细胞组学检测现在已常规应用于临床前环境或人类组织疾病病理生物学的初步研究中,但为了实现它们在临床环境中的实施,仍需克服额外的障碍。例如,在转座酶可及染色质测序(ATAC-seq)的单细胞检测中,数据分析的基本方面,如染色质可及性是否应被视为定性或定量测量,或是否应从给定数据集中重新识别可及染色质区域或基于外部参考定义,仍然存在争议。这样的辩论并未排除基于染色质可及性谱的协调多细胞生物标志物的翻译,但它会阻碍其在临床上的验证,因为生物标志物发现中的假阳性或假阴性风险会增加。 

另一方面,单细胞转录组学以及单细胞染色质可及性、T B 细胞受体测序、蛋白质组学(无论是通过质谱分析还是基于抗体测序的工作流程)或更新兴的技术,如脂质组学和代谢组学,在单细胞谱的本质和临床应用方面也存在基本相似性。此外,这些方法的组合可以监测单个细胞中的多种模式,基于这些技术开发的协调多细胞生物标志物的开发和应用,同样需要分析大量经过仔细确认的患者队列,实施能够满足监管要求的实验和计算标准操作程序,使用有效的统计分析方法,以及设计能够将数千个单个细胞的层次数据转化为可重复的患者水平读数的计算框架。 

随着其他单细胞组学检测技术的成熟,一个问题将越来越多地出现:哪种技术最适合特定的临床。在临床背景下。尽管我们出于技术原因主要关注单细胞转录组学,但不太可能有一种特定的检测方法在所有情况下都最合适。相反,选择特定的检测方法以促进协调的多细胞生物标志物的发展,应该反映生物标志物发展背后的生化机制和病理生理机制。例如,当抗癌治疗的持久性反应受少数具有特定基因组改变的耐药细胞持续存在的影响时,基因组 DNA 测序可能比转录组学检测为预后提供更可靠的基础。 

空间组学检测的出现为临床转化带来了新的、更具概念差异化的机遇。这类检测最有可能整合到病理学实践中,其中单个细胞内的形态和分子变化长期以来一直在其细胞结构背景下被认识。基于传统组织学染色的数字病理学 AI 指导工作流程已获得监管机构批准,但将空间组学数据整合以获得临床可操作的读数仍处于早期阶段。因此,与分离细胞的单细胞分析相比,仍需观察空间坐标基因表达和细胞整合在多大程度上以及在何种背景下能够具体增强临床决策。 

通往临床的道路

单细胞技术的成熟现在使得我们能够超越描述性分析,将单细胞组学整合到医疗和外科实践中(图 3)。过去的经验表明,这些技术将如何影响临床决策的最直接机制是通过引入新的生物标志物,这些生物标志物通过改善诊断、促进治疗选择、监测治疗效果和预测疾病进展来实现精准医疗的愿景。要实现这一潜力,需要分析大量并经过仔细确认的患者队列,并使用有效的统计方法分析产生的数据,以发现稳健的生物标志物。一旦确定了生物标志物,就需要开发实验和计算标准操作规程(SOP),以便在任何医院环境中使实验室能够将单细胞组学数据转化为可重复的临床结果。克服这一挑战将需要新的计算基础设施,该基础设施能够自动化单细胞数据分析。由于并非所有疾病或临床决策都能从单细胞生物标志物中获益,因此这种程度的努力最好投入到单细胞组学对患者护理能产生最大影响的疾病中。将多维单细胞数据集压缩为可操作的临床结果将需要针对临床环境量身定制的计算协议。迄今为止,人们相对较少关注这一点,特别是在使用机器学习为患者水平表型进行分配方面。克服所有这些障碍需要临床医生、计算科学家和生物技术产业之间的密切合作,以便单细胞组学能够影响常规临床实践。 

image.png

3 单细胞组学融入医学和外科实践的路径图。单细胞组学临床应用的实验、计算和概念关键障碍总结,以及本文提出的解决方案 

参考文献

[1] Skinnider MA, Courtine G, Bloch J, Squair JW. A clinical road map for single-cell omics. Cell. 2025 Jul 10;188(14):3633-3647. doi: 10.1016/j.cell.2025.06.009. 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源

38. LncPepAtlas:探索lncRNA翻译潜力综合资源

39. SPATCH:高通量亚细胞空间转录组学平台

40. MirGeneDB 3.0miRNA家族和序列数据库

image.png

 

转载本文请联系原作者获取授权,同时请注明本文来自张俊鹏科学网博客。

链接地址:https://wap.sciencenet.cn/blog-571917-1494236.html?mobile=1

收藏

分享到:

下一篇
当前推荐数:1
推荐人:
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?