|||
鱼类基因组研究综述(1)
本人一直在做水生动物和昆虫的基因组数据分析,最近有空总结了下鱼类基因组研究的内容,方法做了一点粗浅的总结,才疏学浅,请大家多多指教。
在这个文章中我主要写了,如下几点
Ø 鱼类的系统分类
Ø 鱼类基因组基本特点
Ø 鱼类免疫系统的基因组研究:鳕鱼,鲨鱼,大黄鱼
Ø 鱼类性别决定的基因组研究:半滑舌鳎,罗非鱼
Ø 鱼类体形发育的基因组学研究:海马,半滑舌鳎,腔棘鱼
Ø 如何迅速将一个鱼类变成模式生物:killfish
Ø 鱼类基因组基本研究方法和个人感想
鱼类系统发育
鱼类,是最古老的脊椎动物。它们几乎栖居于地球上所有的水生环境,从淡水的湖泊、河流到咸水的大海和大洋。鱼类是终年生活在水中,用鳃呼吸,用鳍辅助身体平衡与运动的变温脊椎动物。全球现生种鱼类共有24618种,占已命名脊椎动物一半以上,且新种鱼类不断被发现,平均每年以约150种计,十多年应已增加超过1500种,目前全球已命名的鱼种约在32100种。(来自百度)
既然这么多鱼类,要研究就必须做好分类。关于鱼类的系统进化关系,可以参考NCBI 的taxa 数据库,或者tree of life 数据库。这两个数据库主要是依据形态学分类。更新的分子分类数据当然要查看文献了。其中要属于“The Tree of Life and a New Classification of BonyFishes”这个文章研究的最全面,在这篇文章中作者对于1410个bony fish,选取了其21个marker ,其中包括线粒体上的一个基因和20个核基因;该研究将这些鱼类分成了1093个种,369个科。如下图所示,这是一个在目水平上的一个分类,要更详细的图当然要去原文下载高清的了。
Figure 1 .Bony fish系统发生关系;
鱼类基因组特点
鱼类基因组普遍在1G左右,个别目的鱼类如三文鱼,虹鳟因为多一轮的全基因复制加上重复序列的扩张在2-3G左右;详细情况可以参考下表:
Table 1已发表鱼类基因组的大小统计;
中文名 | 拉丁名 | 发表时间 | 杂志 | 目 | 基因组大小(MB) |
三刺鱼 | Gasterosteus aculeatus | 2012.04 | Nature | 刺鱼目 | 463 |
海马 | Hippocampus comes | 2016.12 | Nature | 刺鱼目 | 501 |
半滑舌鳎 | Cynoglossus semilaevis | 2014.02 | Nature Genetics | 鲽形目 | 477 |
牙鲆 | Paralichthys olivaceus | 2016.12 | Nature Genetics | 鲽形目 | 546 |
青鳉鱼 | Oryzias latipes | 2007.06 | Nature | 颌针目 | 700 |
月光鱼 | Xiphophorus maculatus | 2013.03 | Nature Genetics | 鳉形目 | 669 |
金枪鱼 | Thunnus orientalis | 2013.06 | PNAS | 鲈形目 | 800 |
大黄鱼 | Larimichthys crocea | 2014.11 | Plos genetics | 鲈形目 | 728 |
弹涂鱼 | Boleophthalmus pectinirostris | 2014.12 | Nature Communications | 鲈形目 | 966 |
红鳍东方豚 | Fugu rubripes | 2002.12 | Science | 鲀形目 | 380 |
黑斑鲀 | Tetraodon nigroviridis | 2004.1 | Nature | 鲀形目 | 340 |
沟鲶 | Ictalurus punctatus | 2016.7 | Nature Communications | 鲇形目 | 1004 |
斑马鱼 | Danio rerio | 2013.04 | Nature | 鲤形目 | 1400 |
鲤鱼 | Cyprinus carpio | 2014.09 | Nature Genetics | 鲤形目 | 1830 |
草鱼 | Ctenopharyngodon idellus | 2015.05 | Nature Genetics | 鲤形目 | 1070 |
三文鱼 | Salmo salar | 2016.04 | Nature | 鲑形目 | 2970 |
虹鳟鱼 | Oncorhynchus mykiss | 2014.04 | Nature Communications | 鲑形目 | 1900 |
大西洋鳕鱼 | Gadus morhua | 2011.08 | Nature | 鳕形目 | 830 |
腔棘鱼 | Latimeria chalumnae | 2013.04 | Nature | 腔棘鱼目 | 2860 |
鱼类基因组最显著的改变是硬骨鱼中多一轮全基因组复制,但是鱼类的基因数目并没有明显的多,相对于大部分哺乳动物,鱼类也是2w多个基因,应该是多一轮的基因组复制的基因大都丢失掉了;但是在鲤鱼(common carp),鲑鱼中均有35000个基因;是因为近期的第四轮基因组复制时间(约100 million 年前)比较短这些基因还没丢失?或者因为自然选择的原因这些基因不能丢失?还需要深入研究。这莫非就是鲤鱼能肆虐五大湖,中国吃货蠢蠢欲动的基因组学解释?
大部分鱼类基因组重复序列在30%左右,如西洋鳕鱼25.4% ,三刺鱼25.2%,大黄鱼18.1%;一些基因组比较大的鱼类如斑马鱼,三文鱼重复序列就分别达到52%和60% ,这比较高了。鱼类基因组的杂合率都比较低,因为脊椎动物的种群数量和繁殖周期都不是那么短,而且大都是人工养殖的;已测序的鱼类中没有报道杂合率比较高的鱼类,我们见过最高的是大黄鱼的,达到了0.5%。
综上所述,根据鱼类基因组的特征,通过新一代测序技术还是比较容易得到一个draft genome的,个别重复序列很高的,可能要用到第三代测序技术了。
关于鱼类免疫系统的关注点有如下问题:
l 脊椎动物如人,老鼠中发现的基因鱼类中都存在吗?
l 它们有没有什么变化?如拷贝数差异,结构变异?
第一个问题主要在没有基因组技术以前,通过克隆一些序列或者从EST中获得,效率比较低,比较辛苦。下边这本书比较系统的总结了这些发现:
《The Evolution of theImmune System Conservation and Diversifiation》这本书系统的总结了动物中各种
Figure 2 IL-12 家族在不同倍数的全基因复制脊椎动物的拷贝数变异;
如上图实例,系统的分析了IL-12 家族在不同的全基因组复制时间后的基因拷贝数变化。
当有了基因组后,免疫基因可以通过生物信息的方法可以直接从基因组中获得。其中首先引起大家关注的是大西洋鳕鱼的基因组(http://www.nature.com/nature/journal/v477/n7363/full/nature10342.html)研究中首次发现,鳕鱼竟然丢失了MHCII 和CD4 序列,众所周知,这两个分子是和脊椎动物适应性免疫相关核心分子;同时还发现了MHCI基因的大量扩增。如下图所示。那MHCI的增多是不是可以弥补MHCII的丢失呢?MHCI 扩张 和MHCII孰先孰后?
2016年,在Nautregenetics(http://www.nature.com/ng/journal/v48/n10/full/ng.3645.html上,发表了通过对于65种鱼基因组测序研究,MHC2的丢失和MHC1的扩张,是鳕形目特异的,约在一亿年前就失去了免疫系统中MHC II,而后发展成鳕鱼种系。有趣的是,在少了 MHC II 这个基因之后,为了要补足缺少 MHC II 的功能缺陷,鳕鱼发展出的替代策略是大量的扩增MHC I;
Figure 3由此图可以看到通过7种脊椎动物(大部分是硬骨鱼的)比较发现在鳕鱼中MHC1发生了扩张。
其实相似的研究还在鲨鱼中使用(Elephantshark)中,如2014年,发表在nature上的象鲛组学研究中就对于重要免疫分子进行了调查,发现CD4 和IL 等很多相关分子竟然都没有。虽然鲨鱼没有这些重要的分子,但是鲨鱼依然能够很好的适应环境,说明鲨鱼的免疫系统有其自身特点,其免疫适应性方面机制不同。
在大黄鱼基因组中,我们也做了这个工作,通过大黄鱼基因组免疫基因的系统调查,我们发现最近(67 million前)才形成的属于硬骨鱼,鲈形目的鱼类,其免疫系统十分完善,仅仅丢失了TSLP和IL5,而且这些基因都有其它旁路可以代替;在这个过程中,我认为在技术上最重要的是要排除了基因组组装和注释的问题,毕竟只用NGS,弄出一个很高质量的基因组也不现实。而且由于免疫基因在序列层面的差异很大,如很多IL只有一个半胱氨酸是保守的。要注释需要用到一些特殊的软件,并结合转录组数据,共线性关系等。
Figure 4象鲛免疫基因调查;
Figure 5 大黄鱼基因组中免疫基因调查。
未完待续…
最后,祝大家工作好,身体好,学习好!
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-21 19:35
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社