基因组信息挖掘分享 http://blog.sciencenet.cn/u/hsm 基因组像无标点的天书,需要慢慢理解,慢慢加标点。

博文

基因大数据和云计算在生物育种中的应用能走多快?

已有 4099 次阅读 2015-9-21 11:45 |系统分类:科研笔记| 云计算, 基因大数据

 如今基因组测序成本的降低,催生了基因大数据,由此催生了云计算的应用。基因大数据和云计算在生物育种中的应用能走多快,取决于两个因素:1)应用工具的开发;2)用户的衔接;

首先讲应用的开发。我们知道基因大数据,只是数据,如何由数据转变成有价值的知识,再由知识转变成经济价值。基因数据获取后的第一步是过滤,过滤的序列包括污染序列和低质量序列等;第二步是拼接或比对,拼接是把基因给拼接出来,一般耗费的内存比较大,而比对需要的内存较小;第三步是基因变异的检出,包括SNPindelSVCNV等;第四步是与表型的关联,包括QTL定位和关联分析两种方法。第五步是关联数据库的构建,目前表型数据有传统表型和分子表型,传统表型包括农艺性状和品质性状,分子表型包括转录组、蛋白组、代谢组和生理表型等。综合各种表型和基因的关联结果,进行数据挖掘,找到基因之间的关系。还有与环境型的结合,任何表型都是基因型和环境互作的结果,在个性化育种时代,找出适应特殊环境的基因型显得尤其重要。第六步是数据的查询和展示,增强用户体验的方法就是界面友好,能让用户快速找到自己想要的数据,包括图和表的展示。要把这六个步骤实现,需要基因大数据与云计算从业者与育种家通力合作。



 

 

再者,用户的衔接。目前的生物育种科研体系得与基因大数据和云计算的特征相衔接。需要整个科研体系人员通力合作。但是我们目前的问题在于通力合作存在阻碍,我们目前的科研群体普遍采用课题组制,每个课题组相对独立,课题组间交流有限,导致每个课题组各自为政,每个课题组间的关系竞争大于合作。导致我们的科研力量不能往一处使,我们的科研不能统筹安排。导致我们的基因大数据不能充分发挥作用。目前科研体系内部是分散的,我们有功能基因组研究课题、有植物营养研究课题、有遗传育种研究课题、有植物保护研究课题、有植物生理研究课题、有加工品质研究课题。但是我们每个课题使用的实验材料存在差异,研究可能存在重复,因为每个课题面对的是独立的考核,之间是竞争关系,导致协同很少。而我们基因大数据和云计算是大平台,只有我们每个课题使用同一套材料,我们这个大平台才会发生作用。

 基因大数据和云计算在生物育种中的应用能走多快?取决于计算机专家、生物信息学家和育种家的合作,取决于科研体系内的通力合作。




https://wap.sciencenet.cn/blog-442719-922336.html

上一篇:bsub批量提交任务注意事项
下一篇:centos的perl GD 画图环境配置
收藏 IP: 221.232.200.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-26 07:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部