mashengwei的个人博客分享 http://blog.sciencenet.cn/u/mashengwei

博文

小麦生信菜鸟(三)----常见问题

已有 4700 次阅读 2018-1-29 15:27 |系统分类:科研笔记| 小麦, 基因组, jbrowse, 节节麦, 山羊草



1.29 本期作者:Rui Wang




上次把小麦最新的物理图谱介绍了一下,群里最近有小伙伴经常讨论一些相关的问题,我就找了两个比较有代表性的跟大家探讨一下。

1. 接着上次咱们那个case study,我们的QTL markers与在RefSeq 1.0 上的物理图谱之间线性关系很差,那我们该怎么办呢?

(1). 还记得我们这个小麦生信系列的第一篇(小麦生信必备网站和数据库一)给大家介绍的那个万能数据库GrainGenes吧,除了RefSeq1.0以外,还有很多其它数据库啊。假如我们的QTL在A或者B genome上,那可以对Zavitan(公众号对这个数据库有介绍:野生二粒小麦基因组在science发布野生二粒小麦基因组下载)进行BLAST啊,如下图

出来的结果如下,红色方框处就是物理图谱的位置。我没有找到这个genome的可视化网站(JBrowse),大家有知道的请在留言处告知。


(2). 假如这个QTL是在D genome上,也可以在GrainGenes对节节麦的两个不同版本的数据库进行BLAST(我们的公众号也有介绍:Nature在线发表小麦D基因组供体——粗山羊草的基因组研究论文又一篇节节麦基因组文章来袭--聊一聊你的关注点在哪?)。当然也可以去官方网站进行BLAST http://aegilops.wheat.ucdavis.edu/ATGSP/blast.php,出来的结果跟上图差不多,首先找到我们这个marker所对应的物理图谱位置。然后进入下面这个JBrowse可视化网站,在红色方框处手动输入上面所找出来的物理位置,就可以查看相关的信息了。这个D genome JBrowse 用法跟小麦那个是一样的,大家在上面多花些时间,同样可以找出很多有用的东西。

http://aegilops.wheat.ucdavis.edu/jbrowse/index.html?data=Aet%2Fdata%2F&loc

更多的对这个数据库的使用请参见我们以前的另一篇推送(节节麦基因组数据使用和下载

(3),实在找不到好的相关性,那也不要气馁,我们还有各种小麦的近亲和远亲啊,这些数据库在我们上次介绍的IWGSC那个BLAST数据库都可以选择,或者在GrainGenes,EnsemblePlants里也都有。利用这些数据库有的时候不仅可以找到更好的线性关系或者candidate gene,有时也可以帮助更好的理解candidate gene的进化等等各方面信息,我们以后会结合EnsemblePlants里Compara功能给大家介绍一下这方面的信息。下图是GrainGenes里各种数据库的页面。

2.现在QTL的文章已经海量了,我们做出的结果跟前人研究有什么关系呢?

其实思路很简单,那就是找到前人那个基因或者marker的序列在我们所谈到过的数据库中进行BLAST来确定它们的物理位置,这样就可以很直观的比较跟我们的QTL之间的距离了。

(1). 在NCBI上找已克隆的小麦基因序列:(https://www.ncbi.nlm.nih.gov/gene/)。这个大家应该比较熟悉,我就直接贴一个结果图,我搜的是“Wheat Q”,结果中第一个就是,点进去就可以找到相关信息和序列了。


(2). 前人的研究多用的是SSR marker或者DArT marker:

首先再提一下GrainGenes这个数据库,基本上所有的SSR marker信息和引物序列都可以在这个网站上找到,而DArT marker的序列我只能在发表的文章中找,还不知道哪个网站能把所有的DArT marker 序列全列出来(知道的小伙伴赶紧分享给大家吧)。找到这些序列以后就可以直接去BLAST了,不过SSR marker这里需要注意一件事情:一般找出来的序列都只是两个引物的序列,也就20-30bp,进行BLAST的时候经常不能得到结果,是因为默认的Basic search程序E value 非常低。这时就需要用advanced search 来手动调节一下 E value的阈值,一般调到10就行了。当然,在advanced search中还有很多其它设置选项,大家可以多调节一下,看看搜出来的结果会有什么不同(这里又不得不说GrainGenes数据库的BLAST,这个BLAST用basic search搜SSR引物序列一般是没问题的,反正这几天IWGSC的BLAST也不能用,大家都来用GrainGenes吧)。

(3). 但如果找不到SSR引物或DArT序列怎么办?再说每次都得一个一个找,多麻烦啊!有没有一个一劳永逸的办法呢!办法肯定是有的,就是在开始的时候稍微得花点时间,看看我们群里有没有大公无私的小伙伴为我们做一下分享给大家。方法就是按照我们上次介绍的IWGSC RefSeq1.0 的JBrowse中,选定一条染色体后,放到最小的view(整条染色体),数据库就会给出整条染色体的所有相关marker,然后点击下图中的那个小三角,再点击“save track data”就能下载这条染色体中所有的marker(90K, SSR, DArT需要分三次下载)。有了这个文件,我们以后拿到任何一个marker名字,在这个文件中一搜就找到了。大家可以每人认领一条或几条染色体,然后最后再整理到一起!

整理好请发送到rui.wang225@hotmail.com,小编看情况会有奖励的奥!

请点击此处输入图片描述


今天小编就不额外加干货了,大家如果没过瘾,可以再把今天引用的五篇以前的推送好好看一下,保证有收获!






https://wap.sciencenet.cn/blog-1094241-1097445.html

上一篇:谁说传统抗病基因的研究过时了—看看人家的LRR
下一篇:小麦未知基因的快速克隆方法6—利用BSA+RNA-Seq进行快速定位
收藏 IP: 58.213.93.*| 热度|

1 信忠保

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-27 09:35

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部