孙学军
科学家利用众包概念解决基因组信息收集难题
2015-10-12 04:46
阅读:2958

  学术研究没有固定模式和规范,许多模式和规范都是在一代代科学家逐渐摸索和建立起来的.科学的特点是新,其中研究模式和研究方法的创新也是科学研究的重要组成部分,有时候会带来革命性影响。例如现在的DNA序列测定技术,给肿瘤基因突变为基础的诊断带来了商业运行的可能,也直接推动了精准医疗的发展,并逐渐形成潮流和概念。

美国的精准医疗项目有一个对100万肿瘤患者基因组序列分析的内容,因为基因序列分析已经商业化,许多商业公司都拥有一定数量的基因组数据,如果能将这些已经有的基因数据收集起来,将能建立非常好的数据库。许多基因测定公司也愿意与研究人员分享共享数据,但是由于隐私问题,一般都不提供这些数据来源的个人信息,甚至不提供个人的基因组数据。由于这些数据缺乏与来源个体健康和疾病等信息的关联,导致这些数据的价值打打折扣。

常言说,不怕做不到,就怕想不到。当今网络时代,不仅给商业带来各种新模式,也给科学研究带来革命性影响。最近有学者发起一个名为DNA.LAND(建议翻译“基因世界”)众包项目,目的是吸引所有基因组分析的用户个人,让他们分享基因数据和个人信息,供科学家进行研究和分析。这一思路克服了商业公司因为怕泄露隐私不愿意提供个人信息的障碍。

纽约基因组中心和哥伦比亚大学计算遗传学家Joseph Pickrell这样说。目前已经有数百万人进行了基因组测定,将来会有更多人加入这个队伍,这些都是重要的研究资源,利用众包的方法将这些数据收集起来,可以不用检测基因组费用,免费获得大量宝贵研究数据。

Erlich1010日马里兰召开的美国人类基因组学会年会上发布的这一消息,这不是第一次试图动员公众提供研究用大数据。例如他曾经成功利用家谱网站的数据建立了世界上最大的家庭树,拥有1300万人的信息。

西奈山医学院生物伦理学和法学专家Michelle Meyer 说,DNA.Land是典型的人类受试者研究“参与者转换”的案例。这是一个非常聪明的研究模式,因为这一思路不仅能用最小的代价保留数据价值,而不会触犯关于基因检测的联邦法律。

Erlich的目标是收集三百万个基因组信息,相当于三家大型基因分析公司23andMeAncestry.comFamily Tree DNA的数据总规模。这些公司允许人们下载自己的基因序列资料。

将这些基因序列信息与受试者其他信息如健康状况结合起来,Erlich希望建立一个大型数据库。最近分析预测,到2025年将会有20亿人的基因组被测定。空间是巨大的。

如果收集的数据足够大,将会吸引许多相关研究学者参与分析。将会形成良性互动的局面。

转载本文请联系原作者获取授权,同时请注明本文来自孙学军科学网博客。

链接地址:https://wap.sciencenet.cn/blog-41174-927456.html?mobile=1

收藏

分享到:

当前推荐数:4
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?