潘锋

杨子恒院士:在海量数据中“淘金”
2007-09-11 06:17

 
英国皇家学会杨子恒院士在计算和进化生物学研究中心成立仪式上作学术报告。(本报记者 潘锋/摄影)
 
依托中国科学院动物研究所组建的计算和进化生物学研究中心(CCEB)日前在北京正式成立,英国皇家学会院士、英国伦敦大学学院教授杨子恒受邀出任研究中心主任。该中心的成立旨在加强北京地区生物学、数学、统计学和计算机科学科研人员的合作与交流,提升我国生命科学的研究水平。
 
应对海量生物学数据挑战
 
21世纪被誉为生命科学的世纪,随着后基因组时代的到来,生物学数据的积累呈指数级增长,快速发展的先进的测序和分析技术,正在帮助科学家们获取越来越多的与遗传和结构功能相关的生物学信息。对于不断增长的海量生物学数据,如何从中挖掘出最有用的信息,是对生命科学以及医药研究的一个巨大挑战。
 
杨子恒院士在接受记者采访时说,计算生物学还是一个“年轻”的学科,它主要是强调用数学、统计学、计算机科学等方法来研究生物学问题。计算生物学近年来之所以变得越来越重要了,主要原因是生物学数据的积累和增长特别快,面对海量生物学数据,必须要借助数学和统计学的理论和方法才能完成研究工作。计算生物学已经成为生物学研究中必不可少的重要方法之一。
 
中国科学院动物研究所副所长张德兴研究员也向记者表达了同样的观点。张德兴说,以前生物学家能够积累到足够的数据已经很不容易了,随着技术的进步,现在获取数据已不再是件十分困难的事情。但是,生物的进化是一个复杂的过程,如何从已经得到的海量数据中挖掘出最有用、最可靠的信息却是一个难题,这就要依靠计算生物学。
 
杨子恒院士强调,计算生物学应着眼于生物学问题,要用复杂的数学或统计学方法为生物学服务,而不是去研究跟实际应用无关的数学问题。进化生物学是生物学研究的重要组成部分,传统的进化生物学研究方法主要是根据形态进行的,例如物种的分类,而现在则更多的是在分子水平上研究物种的进化过程及其影响因素。随着人类基因组、黑猩猩基因组、昆虫基因组、微生物基因组、植物基因组等越来越多生物物种基因组测序的完成,科学家已经可以对不同物种或同一物种不同个体之间DNA序列进行分析,以此来了解基因在健康和疾病中所扮演的角色,来了解它们与环境因素之间的相互关系,通过相互比较来分析物种之间的差异,以及这些差异在进化过程中所起的作用,这些都需要利用计算生物学的方法。
 
杨子恒院士介绍说,计算机科学的飞速发展,数学和统计学领域不断涌现出的新的算法为解决复杂生物学问题提供了动力,如何解读生物学海量数据也对统计学和计算算法提出了新的命题。目前,对生物学研究中提出的问题,有的是可以用现有的统计学或数学方法来进行分析解决的,而更多的是现有的方法无法解决的。因此,为了回答复杂的生物学问题,就需要统计学家、数学家与生物学家合作,发展新的算法甚至是全新的方法,而不仅仅只是改进现有的理论和方法。
 
提升生物学研究水平
 
“计算和进化生物学的方法对于提高研究水平的作用是显而易见的。从科研期刊发表的相关研究论文上可以很清楚地看到,在很多生命科学研究领域,高水平、高质量的论文中,没有计算和进化生物学的参与是不可能的。突破性算法的出现,必将加深人类对生命现象本质的认识,催生更多的突破性研究成果。” 张德兴说。
 
由于进化生物学问题非常复杂、系统非常大,如果不建立数学计算模型对其加以简化,那是很难下手的。计算生物学在国际上正在受到高度重视。一个用于基因和蛋白质序列分析的工具BLAST得到了空前广泛的应用,在10年的时间里该算法的引用率高达10万多次。很多传统学科,例如种群遗传学、分子进化学以及分子系统发育学已经开始广泛应用概率和统计学,并多次推动统计学中新的方法和算法的发展。基因组时代遗传数据的快速积累,使得方法研究更为迫切。
 
美国国立卫生研究院(NIH)是在2003年确立的中长期发展规划——“国立卫生研究院路线图”中,启动了一个名为“生物信息学和计算生物学”的计划,希望通过该项目的实施铺设一条通向生命科学未来的信息高速公路。该项目计划建立数个“国立生物医学计算中心”,开发相关软件和数据管理工具,用以推动美国21世纪的生物学研究水平的提高。
 
杨子恒院士表示,目前尽管中国的生物学家在通过实验获得大量数据方面经验丰富,但是既懂理论又致力于研究生物学数据分析方法的科学家很少,与国际上有着较大的差距,因此,构建一个可以让不同专业背景的研究人员相互沟通交流的平台、形成不同团体相互协调合作的机制,对于计算和进化生物学的发展是非常重要的。
 
搭建平台 促进交流
 
张德兴说,从进化生物学以及相关学科的长远发展考虑,需要概率、统计、随机过程分析等数学理论的帮助,需要数学家和其他专业人员的参与。尽管北京地区在这方面有很丰富的资源和合作潜力,但现在不同背景的科学家间还很少有这样的机会,缺乏有效的交流渠道。科学的思维非常重要,科学家之间互相的评述十分重要。由中科院动物所牵头成立计算和进化生物学研究中心的一个目的就是要搭建这样一个平台,促进不同领域的科学家相互交流。大家交流多了,对复杂生物学问题的认识就会更清晰,就会产生一些全新的思路,就能形成一定的共识,就会碰撞出不同学科之间交叉的新的研究方向。
 
计算和进化生物学研究中心现为跨单位、跨学科的开放性非实体机构,中心邀请了一批对使用统计学方法和计算机算法分析生物学数据感兴趣的数学家加入,同时也邀请了一批将从这些研究方法中获益的生物学家作为中心成员加入。其中包括来自中科院动物研究所、中科院植物研究所、中科院北京基因组研究所、中科院遗传与发育生物学研究所、中科院微生物研究所、中科院数学与系统科学研究院应用数学研究所等机构的中国科学家,和来自英国伦敦大学学院、美国加州大学、欧洲生物信息研究所等机构的国外专家,作为客座教授参与研究中心的合作与交流。
 
杨子恒院士表示,研究中心将涵盖利用统计学方法和计算机算法分析遗传和基因组数据的所有学科领域,强调以生物学数据为基础,用数学、统计学、计算机科学等方法进行分子进化、分子分类、分子遗传,群体遗传等方面的研究,涉及动物、植物、病毒、微生物等物种。除计算速度外,还强调分析方法的统计特性,鼓励概率模型的相关研究。
 
中国科学院生物局局长康乐在计算和进化生物学研究中心成立仪式上说,生命科学涉及的范围越来越大,也面临更多的挑战。人类健康、环境保护以及生物多样性的保护等问题都和生命科学密切相关。希望计算和进化生物学研究中心能够更好地利用非实体中心的灵活机制,利用北京地区丰富的研究所资源,促进计算和进化生物学研究的发展,为该领域培养更多的国际一流的科学家。
 

分享到:

0
一周排行