全基因组变异显示COVID-19有多个传播源,华南海鲜市场不是病毒第一起源地
张亮生1,杨建荣2,张振国3,林振国4
1福建农林大学;2中山大学医学院;3加州独立学者;4圣路易斯大学
摘要:
我们根据冠状病毒(SARS-CoV-2)的基因组变异把它们分成基因型I和基因型II(Genotype I和Genotype II,简写Type I 和Type II),其中Type I 的三个位点与蝙蝠一致,而Type II这三个位点突变了,因此Type I是祖先类型,Type II是由Type I变异而来的。结合SARS-CoV-2对应的病人信息,Type II主要来自华南海鲜市场,而Type I没有直接与华南海鲜市场有接触证据,因此推测病毒最初起源地不是来自华南海鲜市场。
其中Type I又可以分成Type IA和Type IB,加上Type II,当前至少有三个传播源,其中Type IA是最早的传播源,其次是Type IB,他们不是发生在华南海鲜市场,显示最初传播源不是来自华南海鲜市场。这三个传播源(Type IA, Type IB和Type II)的病毒样本数量分别是10,18和69个,显示Type II来自华南海鲜市场是当前主要传播源。根据变异位点特征,我们发现Type II的两个变异位点对应的密码子tRNA基因数量更多,说明Type II病毒编码的蛋白可能具有更高的翻译效率,可能是导致Type II成为主要传播源因素之一。
基于少量的病人病毒基因组,我们就初步勾勒出病毒传播历史,因此很有必要对更多病人的病毒基因组进行测序,这样可以推断出更加详细的传播历史,为疫情监控和防治提供指导。同时根据病毒属于不同类型,对病人的症状进行研究,归纳出不同类型病毒的致病特点,可以对不同类型病毒感染者做针对性治疗。
背景和结果
2019年冠状病毒疾病(COVID-19)已经确诊的人数超过了7万,死亡人数超过2千,重症人数超过1万。当前在中国的传播趋势在减弱,但是在其它国家呈上升趋势,疫情防控形势艰巨。最近COVID-19的病毒命名为SARS-CoV-2,主要依据其与SARS-CoV病毒亲缘关系最近。我们近期的结果显示SARS-CoV-2与SARS-CoV具有共同祖先,它们两是姐妹类群,且SARS-CoV-2与两个SARS-like蝙蝠病毒聚集在一起[1] ciaa112.pdf。 SARS病毒与其最近蝙蝠病毒的共同祖先的进化树上的支长(0.03)比较短,SARS-CoV-2与两个SARS-like蝙蝠病毒的支长较长(0.09),说明中间还有很多病毒没有发现。近期发现的2013年云南蝙蝠冠状病毒(BatCoV RaTG13),其与SARS-CoV-2亲缘关系最近[2] FIg S1.PDF。SARS-CoV-2与它们共同祖先的进化树的支长只有0.02。因此我们可以用BatCoV RaTG13来作为外类群研究SARS-CoV-2的起源和传播历史。
我们收集了98个病人病毒基因组样本,加上2013年云南蝙蝠样本BatCoV RaTG13,总共99个样本。其中病人病毒基因组变异(突变)很小,绝大部分基因组只有0到3个变异(图1)。相对于3万个碱基的基因组,只有几个变异还是很小,所以很少有两个病毒基因组共有一样的变异,除非它们有共同祖先,也就是来自同一个传播源。
COVID-19病毒基因组变异和进化树显示其可以分成基因型I和基因型II(Genotype I和Genotype II,简写Type I 和Type II),其中Type II的样本占主要,包括了69个样本,而Type I只有28个样本(图1)。Type I又可以分成Type IA(10个样本)和Type IB(18个样本)(图1)。进一步分析为啥分两个类型,主要是因为三个位点的差异。特别的Type IA 的三个位点与云南蝙蝠样本BatCoV RaTG13的位点一致,Type IB有两个位点一致。因此,相比Type II,Type I应该是祖先。也就是说Type IA是最初的传播源,然后突变一个位点变成了Type IB,再变了两个位点变成了Type II(图2)。Type IA,Type IB和Type II代表着三个传播源。我们之前用10几个样本,用蝙蝠做外类群,Type IA中的广东样本就是靠近蝙蝠[1],与我们这里的结果一致。
图1 COVID-19病毒样本基因组进化树和变异位点。A,是病毒的进化树;B,97个病毒基因组差异位点,序列比对最上面一条是2013年云南蝙蝠序列;C,三个变异位点的特征分析。
Type I主要是包括广东,国外的样本,并且包括了一个没有接触华南海鲜市场样本(WH04)[3],这些样本没有直接接触华南海鲜市场证据。而接触华南海鲜市场的样本都聚集在Type II,且包括了两个来自华南海鲜市场环境样本。因此合理的解释是Type I不是来自华南海鲜市场,是祖先,说明最初传播源不是来自华南海鲜市场(图2)。Type II是来自华南海鲜市场,Type II是从Type IB某一个样本变异而来。
图2 COVID-19病毒的传播模型
由于Type II占了70%的样本,说明华南海鲜市场是一个爆发地,是主要传播源。Type I和Type II包括各个国家样本,说明这三个传播源都已经在世界各地传播。Type II包括了更多样本,有可能是Type II具有更强的传播性,因此我们分析Type I和Type II差异的三个位点的特点,除了28112位点是影响ORF8基因的氨基酸变化,是一个非同义突变,而另外两个位点是同义突变,不影响氨基酸变化,但是在突变后对应的密码子的tRNA基因要比祖先多了很多(图1C)。如8750位置的密码子在Type I中对应的tRNA基因是零个,是要与其它tRNA基因共享,而在Type II中对应的tRNA基因是8个。这可能影响蛋白的翻译,增强了Type II的基因组中一些编码蛋白的翻译速度,而导致Type II具有更强的传播性。
我们上述结果把现在的冠状病毒分成两个主要类型,其中Type I又可以分成Type IA和Type IB,加上Type II,当前至少有三个传播源。其中Type IA是最早的传播源,其次是Type IB,他们不是发生在华南海鲜市场,显示最初传播源不是来自华南海鲜市场。Type II来自华南海鲜市场,是主要传播源。
Type IA,Type IB和Type II类型可能导致的病人症状不一样,值得检测这两个类型病人症状差异以及针对性治疗。近期发现了一些未有症状的传播者,值得检测它们携带病毒类型,是不是主要属于Type I。因此,通过病毒基因组特征可以发现病毒传播历史,对流行病学监测和疫情防控具有指导作用,有必要对更多病人基因组进行测序,以至于得到更加全面的病毒传播历史,甚至发现超级传播源,以及不同类型病毒致病性是否具有差异。
文章已经在预印本网站Medrxiv上在线:https://www.medrxiv.org/content/10.1101/2020.02.25.20027953v1
参考文献:
1. Zhang L., et al., Origin and evolution of the 2019 novel coronavirus. Clin Infect Dis, 2020. ciaa112.pdf (最早报道新冠状病毒起源与进化文章之一)
2. Zhou, P., et al., A pneumonia outbreak associated with a new coronavirus of probable bat origin. Nature, 2020.
3. Lu, R., et al., Genomic characterisation and epidemiology of 2019 novel coronavirus: implications for virus origins and receptor binding. The Lancet, 2020.
相关专题:聚焦武汉新型冠状病毒肺炎疫情
转载本文请联系原作者获取授权,同时请注明本文来自张亮生科学网博客。
链接地址:https://wap.sciencenet.cn/blog-54593-1220853.html?mobile=1
收藏