||
如何根据模式模式作物拟南芥和水稻的基因序列寻找小麦里的直系同源基因
话说最近安装一个R包,折腾了两天之后,最后没有办法了果断将R版本降低,没成想却成功了。这也许就是学习的代价。每当我们开展新课题并且需要新的分析方法时,总会经历这样一段学习积累的时期。一旦体系建立,后面再次进行就会快很多。小至个人,大至实验室都有这样一个过程。同时,也需要我们不断进行迭代和积累新的体系,这样才能保持不落伍。但是,抛弃成熟体系,拥抱新体系绝对是一个痛苦的过程。学习和积累过程中学习到的经验和技能是可以迁徙的,注意总结这种经验和技能以便应对未来的新体系。
废话少说,正式进入我们的话题。模式植物拟南芥和模式作物水稻的基因已被广泛研究,这些被广泛研究的基因能够加速我们对小麦基因的了解和认识。结构决定功能,结构越相似功能也越想似。如果两个基因在序列(DNA,RNA,蛋白)水平上具有很高的相似性,那么在基因功能上也往往具有相似性。所以利用好这些功能已知基因,会有利于我们的研究。那么如何才能找到小麦里与水稻和拟南芥同源的基因呢?如果你会,你可能觉得很简单;如果你不会,那么可能会认为高深莫测。显然多数新生是不会的,很简单他们接触的教材上没有,今天我们就介绍下这个过程。这方面的老司机完全可以离开了。
首先,我们要先介绍下水稻(http://rice.plantbiology.msu.edu/)和拟南芥(https://www.arabidopsis.org/)的两个网站,其中拟南芥的这个网站相对来说功能较全,甚至包括一些最新报道的文献,而水稻的网站则不具备,所以我们要补充水稻的另一个网站,这个网站专门收集(https://funricegenes.github.io/)已报道基因的网站,这个网站是华中农大的姚文师兄建立的。对类似这些在线数据库的了解和熟悉也是非常必要的。由于与今天的主题相关性不大我们就不再详细介绍了,多看看就了解了。
我们今天就以水稻里的ARE1基因为例来说明该如何找到ARE1在小麦里对应的基因。
ARE1与氮的吸收和利用有关,首先根据文章里提供的信息我们可以知道该基因的编号是LOC_Os08g12780。根据这个编号我们就可以在上述水稻网站里找到该基因的DNA序列,转录本序列以及编码的蛋白序列。如下图所以,点击“Locus Search”。
这之后会出现如下页面,粘贴复制上述基因编号即可。
点击“Search”,会出现
点击“Download Sequence”,就会跳到基因序列页面。
到这一步我们就获得了水稻里ARE1基因的序列(DNA,编码区,蛋白),我们可以选择编码区序列与小麦数据库比对,也可以选择蛋白序列与小麦序列比对。下面我们要继续展示操作过程。首先要进入到这个小麦网站(https://wheat-urgi.versailles.inra.fr/Seq-Repository)。
点击上图左侧的Blast,出现如下页面,点击下图的第二个blast,即需要注册才能访问的这个。
点开之后会出现如下的页面,粘贴复制水稻ARE1基因的基因组序列并选择数据库。然后点击下图左下角的“Basic search”,开始进行搜索。这里要说明一点,由于文章还未发表,这个网站现在只提供了最新版本的小麦基因组序列,并没有提供具体的基因序列。如果要直接搜索小麦的基因序列,可以暂时使用这个网站(https://plants.ensembl.org/Triticum_aestivum/Tools/Blast?db=core),操作是类似的。
接下来出现的结果页面如下,通过下图的结果,我们可以判断得出小麦的ARE1基因位于小麦第七部分同源群,点击图中第一条结果中的JBrowse,可以跳转至JBrowse页面。这里还是要说句题外话,那就是对于blast工具以及结果的了解这里并没有介绍,大家可以在网上搜索各种教程进行了解,其中樊龙江主编的《生物信息学》中有详细介绍,建议打算学习生物信息学的小伙伴可以买一本来学习。
下面的页面展示的是JBrowse里的页面,从这个页面我们可以获取很多信息,以后有机会我们会做详细的介绍,大家有时间也可以自行了解。从这个页面上我就可以获取小麦7B上的ARE1基因序列(基因编号是TraesCS7B01G196800)以及其他与之相关的信息。至此我们就找到了与水稻ARE1直系同源的小麦基因(分别位于7A,7B,7D上)。这里只是展示了7B上基因的获取过程,7A与7D的原理同上。
其实很想吐槽他们的JBrowse,有很多不方便的地方,相信文章发表后会继续完善。这里放一张私人的jbrowse。罗马不是一天建立起来的,还需要进一步的完善。
其实类似的介绍我们瑞哥也介绍过,还是建议大家关注一下我们早期发表的一些内容。上文提到的小麦网站(https://wheat-urgi.versailles.inra.fr/Seq-Repository),里边还有很多其他内容,比如基因表达数据库的链接,变异数据库等都有。
当然反之也是可以的。比如,我们有一个小麦基因,我们想知道该基因在水稻和拟南芥等植物里的同源基因是否有报道。首先要做的也是通过blast找到对应的基因,在根据该基因的信息查阅文献等。上述提到的两个水稻和拟南芥的网站都可以进行,特别是拟南芥的网站,找到基因页面之后还会有详细的研究文献。当然这种操作在很多的生物在线数据库都可以进行,比如NCBI,EnsemblPlants(https://plants.ensembl.org/index.html)。
今天的介绍就到这里吧,希望能起到一个抛砖引玉的作用。这个玉,其实还得要靠我们自己去发现的。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-27 12:08
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社