单细胞测序:测序技术变得更具特异性
2018-12-05 18:23

 
你是伐木的还是劈柴的?几个世纪以来,生物学家一直在思考这个基本的认识论二分法问题:他们是应该对广阔的生命领域进行全面的研究,还是走还原主义的道路,将其分解成最基本的组成部分?
 
分子生物学家们长期以来以还原主义者自居,但是却始终有一个令人沮丧的制约条件。当他们以惊人的速度和精准度对DNA和RNA进行测序时,他们的数据所展现的是整个细胞群体的混合信息,而非单个的基因组。无论是一个组织切片,一个肿瘤活检样品,还是一个细菌培养样品中所得到的测序数据展现的都是样品中所有细胞基因组的平均信息,虽然研究人员知道每个样品中细胞与细胞之间都可能有着惊人的多样性。
 
在过去的几年里,研究人员和设备商终于开始打破这个技术瓶颈,开发出一系列新的工具和技术用于单细胞测序。单细胞RNA测序现在能够完整地绘制单个样品中的转录活性谱图,而单细胞DNA测序数据可以揭示那些从前看起来一样的细胞之间基因组中的微小差异。新的结果是令人振奋的,但是有些技术,尤其是DNA测序,也对新手隐藏了一些陷阱。
 
读通转录组
 
在两种技术中,单细胞RNA测序得到了更多的支持。有些公司在出售相关的试剂盒设备,用来从单细胞中分离RNA,同时可以独立保存数以千计的样品。还有些公司将这些技术作为一种服务来提供,他们拿走客户装有细胞的样品管,再送回完整的单细胞RNA测序数据。计划进行大量单细胞RNA分析的研究人员甚至可以购买完整的系统。
 
“任何人都可以购买我们的系统,我们就是打算把它做成一个高度分布式,易于使用的平台。”位于加州普莱森顿的10X Genomics公司的首席科学官和共同创始人Ben Hindson解释说。10x系统使用微流控芯片将细胞样本分割成数十万个微小液滴。然后这些液滴与凝胶珠混合,每个凝胶珠都带有独特的寡核苷酸“条形码”。10x的专有条形码合成和混合系统确保几乎每个细胞都有一个对应的条形码珠。然后,使用标准的RNA测序技术就可以产生数百万个短序列,包括细胞RNA和条形码。通过将RNA序列与条形码连接,系统的开源软件可以为每个细胞重建RNA序列池。
 
整理这么多数据显然需要复杂的计算,但Hindson表示,他们公司非常重视保持系统的用户友好性。“我们的目标是把万能钥匙型解决方案交给那些生物信息学功底不太深厚的用户,”他还补充道,“这使得系统的受众更加广泛”。10x的软件不仅包括解码单细胞数据所需的基本功能,还包括一套用于分析和可视化的工具。因为10x软件是开源的,经验丰富的用户可以对其进行修改,甚至将原始数据导出到自己的程序中。
 
然而,在购买单细胞RNA系统或将样本送给外包服务公司之前,研究人员应该仔细考虑他们的需求。他们应该问问自己:“你在分析什么类型的样品,你需要达到什么样的灵敏度,从这些细胞中你想要获得什么样的信息?”Hindson解释说。专精于这些技术的公司乐于和潜在客户讨论这些问题。Hindson补充道,那些看起来简单的问题,比如测序之前细胞如何分离和保存,都可能对数据的质量造成巨大的影响。
 
选取任何一个细胞
 
小心细致的样品处理是许多单细胞分离策略的基本要求,这一类型的方法近年来呈指数增长。分析DNA比RNA更需要选择好的单细胞分离方法,这一点尤为重要。
 
“有很多选项,但是每一个选项都有它的优点和缺点。对于研究人员来说,根据他们的具体应用来选择合适的分离方法,这很重要。”德国希尔登的Qiagen公司的生命科学部高级市场经理Mary Langsdorff说。
 
对于那些知道目标细胞是什么样子的研究人员来说,最好是手工挑选。为了尽量温和地做到这一点,Qiagen公司的QIAscout细胞分离系统将细胞分散在一个有磁性的膜片微阵列上。从而,研究人员只需使用一台普通的倒置显微镜就可以将所需的细胞取出,并将其转移到单独的样品管或微滴孔中。
 
一旦完成细胞分离,下一步就是选择一种分析策略。对于DNA测序,首先需要扩增每个细胞的基因组,以便构建测序库。虽然聚合酶链反应(PCR)仍然是大多数实验的标准DNA扩增技术,即使是高保真的PCR技术在从单个基因组为模板进行复制时也会引入数以百万计的错误。这就是为什么大多数单细胞DNA测序现在依赖于多重置换扩增(MDA)的原因。
 
MDA在恒定温度下工作,不需要有序列特异性的引物,并且很少引入错误。“多重置换技术使用的酶具有很高的流变性,也是一种非常高保真的酶。所以我们可以在这个过程中保证基因组得到一致的覆盖率……和非常高的序列复制准确性。”Langsdorff说。
 
DNA扩增结束后,研究人员就可以进行建库和测序了。即使基因组测序的价格下降到每个人类基因组1000美元以下,但对数十或数百个单个细胞的基因组测序显然也很昂贵,这凸显了事先仔细选择和处理细胞的重要性。尽管如此,在尝试识别变异之前对多个细胞进行测序仍至关重要。那是因为单细胞DNA测序的深度通常很浅,一般只有1倍或更少。“然后你需要对比一下……你已经建立的所有测序库。只有当一种突变同时出现在多个库中时,你才能将其称为突变。” Langsdorff解释道。
 
尽管与单细胞RNA研究相比,单细胞DNA测序仍面临挑战。但显然,它越来越受欢迎了。研究人员已经在使用单细胞分析技术来识别肿瘤和组织内的基因突变,Langsdorff说这项技术也很快在微生物学领域站稳脚跟。
 
非自然选择下的突变
 
使用者需要比较多个细胞的DNA序列来鉴别真性遗传突变和人为误差,这限制了单细胞测序的应用潜力。对于想要识别单核苷酸突变的研究人员来说,这是一个特别严重的问题。最近的报道指出,传统的细胞分离和基因组扩增策略,即使是MDA,也会在人类基因组中引入多达上百万的假阳性单核苷酸突变,超过了真正的阳性突变(1)。
 
这些差错大部分源于研究人员习惯使用的细胞裂解实验流程。“当你进行细胞裂解和DNA变性时,会引入一种叫做脱氨胞嘧啶的人为突变,这是由过程中的加热步骤造成的。”加州丘拉维斯塔的Novogene公司的全球市场总监Joyce Peng解释说。但最近纽约的SingulOmics公司的研究人员开发了一种新的技术,可以避免对细胞和DNA进行加热。将该方法与高保真MDA扩增相结合,可以将假阳性率降低两个数量级。
 
SingulOmics和Novogene正在合作,他们把完整的单细胞基因组工作流程作为一项服务。研究人员可以将他们的细胞送到SingulOmics进行样品制备和基因组扩增,然后再将扩增后的DNA送到Novogene进行测序。一旦测序完成,SingulOmics还可以提供数据分析服务。过程的两个部分也可以单独进行。倾向自己进行测序和分析的研究人员可以在这个过程中略过Novogene,而单纯地获取来自SingulOmics扩增的DNA。而那些能够轻松分离细胞,只需要测序的客户,就可以直接去Novogene公司。“有两类客户。一类是按照我们的讲解,自己分离细胞;另一类是由我们分离细胞,所以他们只需要提供一个细胞悬浮液。”来自Novogene的Peng介绍。
 
雇佣外包公司来处理整个过程对单细胞测序新手来说尤其有效。因为服务提供商“为了完善这些技术,犯过很多错误,花过很多钱,”Peng强调,研究人员应该“为了节约时间而雇佣服务提供商”。
 
单细胞DNA工作的新手为了适应复杂和不断发展的扩增技术,可能也需要帮助。“有很多全基因组扩增实验流程,但有些研究人员不太清楚哪种流程对他们的研究最有利。”马萨诸塞州坎布里奇的BGI的领域应用专家Zonghui Peng介绍。
 
虽然MDA已成为鉴定单核苷酸突变类项目的首选扩增方法,但寻找基因拷贝数突变的实验室通常更热衷于一种称为“多退火和环基扩增循环”(MALBAC)的方法。与PCR一样,MDA允许基因组的扩增产物作为进一步扩增的模板;但MALBAC只扩增原始基因组的DNA。这使MALBAC成为精确计算每个细胞中基因拷贝数的理想方法。基因组扩增方法的多样性凸显了一个必要步骤的重要性,那就是在开始单细胞测序实验之前,研究人员应该有一个明确的科学问题。
 
需要仔细规划实验的另一个原因是成本。“全基因组、单细胞测序的成本与大量细胞测序的成本大致相同。”BGI的Peng解释。由于研究人员不可避免地需要对样本中的数十或数百个细胞进行测序,错误或设计不当的实验可能很快就会吞噬掉大量经费。
 
与SingulOmics和Novogene一样,BGI也提供一系列单细胞基因组学服务。“BGI能够处理已经分离的单个细胞和大批量细胞这两种类型的样品。”Zonghui Peng介绍。客户还可以让BGI提供各种类型的对照样本,并选择他们想要的数据类型。“如果我们的客户自己有能力做生物信息学分析,他们通常会要原始数据,否则我们会建议BGI来完成生物信息学分析。”他补充道。
 
与业内其他人一样,BGI的Peng也强调了从一开始就认真处理样品十分重要。他还建议对部分样本进行普通的大量细胞测序,以便与单细胞DNA数据进行比较。
 
BGI和Novogene也都提供单细胞RNA测序服务。
 
个体与整体
 
随着设备制造商和服务提供商试图让更多实验室能够接触到单细胞测序技术,这个领域里最前沿的研究人员正为这项技术开拓一片全新的疆土。对于单细胞DNA测序来说尤其如此,这个工具的潜在用户刚刚开始探索。
 
虽然新技术提高了研究人员分离和扩增单个基因组的能力,但另一个重大问题随之逼近,它映射出了人们耳熟能详的整体论和还原论之间的矛盾关系。“归根结底,我们谈论的是生物系统——我们对单独的一个细胞并不感兴趣,我们感兴趣的是如何通过分析许多个单细胞来帮助我们更好地理解整个系统。”加州大学旧金山分校药学院的生物工程专业副教授Adam Abate说。例如,即使是对一个小肿瘤,要构建一个完整的基因突变图谱,也需要对数万亿个单细胞进行测序。“现在这根本不可能。”他表示。
 
然而,这也许很快就会成为可能。在最近的一项概念验证实验中,Abate和他的同事对海水样本进行了单细胞基因组测序。“我们希望在不进行任何培养的情况下,尽可能地获取样本中每个细胞的全基因组序列。”Abate说。通过这个项目,他们开发了一套高通量测序实验流程。只需单次运行,就可以检测到超过50,000个微生物细胞的部分基因组(2)。
 
这项技术在很大程度上依赖于定制化的微流控芯片。这种器件可以将细胞分离到单个的凝胶液滴内,它使得研究人员在分离细胞的同时,裂解细胞并对其DNA进行扩增。随后,这些液滴与另一组含有寡核苷酸条形码的液滴合并。尽管这些条形码与10X Genomics公司的RNA测序条形码合成方式不同,但它们的作用是相似的。条形码将对每个细胞基因组扩增得到的片段与一个独特的识别序列联系起来。最后,研究团队对带条形码标记的基因组进行测序并分析数据。
 
尽管这些实验结果允许Abate的实验室区分单个微生物物种,鉴定抗生素抗性基因,并发现毒性因子,但他认为还有很大的改进空间。“在每个基因组里,我们平均只能得到1%的覆盖率,而且统计分布差异非常大。很多细胞的覆盖率远远超过1%,还有很多细胞的覆盖率却远远不到1%。”他解释道。Abate的研究团队正在努力改进这些统计方法,他位于加州南旧金山的公司Mission Bio,正在开发微流控芯片的商业化版本,以便让其他研究人员能够使用这项技术。
 
随着成本的降低和方法的标准化,该领域的专家期待单细胞测序将成为转录组学和基因组学研究的新模式。研究人员不再需要在大块样品的整体分析和单个成分的简化分析之间做出艰难抉择,而是能够把这两种方法结合起来,得到整个生物系统的综合图谱。“这是一项真正具有变革性的技术,它产生的影响在之前是绝对无法想象的,” Abate评价说。■
 
(译者李楠是中国科学院深圳先进技术研究院的副研究员。)
 
引用文献:
1. X. Dong, et al., Nat. Methods14, 491-493 (2017), doi:10.1038/nmeth.4227.
2. F. Lan, et al., Nat. Biotechnol.35, 640-646 (2017), doi:10.1038/nbt.3880.
 
作者Alan Dove是常驻马萨诸塞州的科学作家和编辑。
鸣谢:“原文由美国科学促进会(www.aaas.org)发布在2017年11月2日《科学》杂志”。官方英文版请见http://www.sciencemag.org/features/2017/11/singles-seen-sequencing-gets-specific。
 
《科学新闻》 (科学新闻2018年11月刊 科学·生命)

分享到:

0