信息化的本质分享 http://blog.sciencenet.cn/u/Babituo

博文

学点生物信息学-2

已有 4995 次阅读 2011-9-9 12:48 |个人分类:基因软件开放实验室|系统分类:科研笔记| 生物信息学

功能基因组学
    功能基因组的任务是进行基因组功能注释(Genome annotation),了解基因的功能,认识基因与疾病之间的关系,掌握基因的产物及其在生命活动中的作用。功能基因组学从基因组整体水平上对基因的活动规律进行阐述,这从根本上改变了传统生物学的思维方式。
 
功能基因组学的研究主要包括以下几个方面的内容,并且这几方面都与生物信息学密切相关。
(1)进一步识别基因,识别基因转录调控信息,分析遗传语言。
(2)注释所有基因产物的功能,这是目前基因组功能注释的主要层次。序列同源性分析、生物信息关联分析、生物数据挖掘是进行功能注释的主要生物信息学手段。
(3)研究基因的表达调控机制,研究基因在生物体代谢过程中的地位,分析基因、基因产物之间的相互作用关系,绘制基因调控网络图;
(4)比较基因组学研究,在基因组水平对各个生物进行对照比较,可以揭示生命的起源和进化、发现蛋白质功能。
在不同物种、不同进化水平的生物的相关基因之间进行比较分析,是基因研究的重要手段。基因组是生物进化史的记录,是生物物种的数据库。
 
在过去的40余年中,仅仅围绕人类基因组中3%左右的编码序列的研究,就造就了几十名诺贝尔奖获得者。可以想象,人类基因组中另外97%的非编码序列,会有多少信息等待我们去发掘
 
蛋白质组学
在特定时间、特定环境和实验条件下,基因组活跃表达的蛋白质为功能蛋白质组 (Functional Proteome) ,功能蛋白质组只是总蛋白质组的一部分。蛋白质组和功能蛋白质组是生命科学新的研究内容。蛋白质组学(Proteomics)是研究细胞内所有蛋白质及其动态变化规律的科学,旨在阐明生物体全部蛋白质的表达模式及功能模式,其内容包括鉴定蛋白质的表达、存在方式 (修饰形式 )、结构、功能和相互作用等。
 
生物信息学在蛋白组学研究中的最主要任务是产生、分析和预测蛋白质的结构,并将结构知识应用于生物学、医学、药学等生命科学领域。
 
蛋白质的序列与蛋白质的结构存在着一种对应的关系,这是目前蛋白质结构预测的一种前提性假设。在该假设下,我们可以研究如何根据蛋白质序列来预测蛋白质的结构。蛋白质的空间结构比蛋白质序列更保守,因此可以认为同源的蛋白质具有相似的空间结构。在进行蛋白质结构预测时,首先寻找待定结构蛋白质的同源物,并且要求知道所找到的同源蛋白质的结构。这样,利用同源相似性,推测未知蛋白质的结构。
 
在设计新的药物分子时,往往要考虑使得所设计的药物小分子结构与靶的活性部位互补,这样才能使得药物分子与靶结合,从而发挥药效。这就要求知道相应蛋白质活性部位的空间结构。
 
 
蛋白质序列比较比DNA序列比较更加复杂,其中一个原因是,DNA序列仅由4种碱基组成,而蛋白质序列则由20种氨基酸所组成。蛋白质序列不仅组成元素多,而且组成元素之间的关系复杂,例如,各个氨基酸之间的关系可以是理化性质相似的,也可以是对应密码子相邻的。因此,对蛋白质序列相似关系的评价更加复杂。
 
生物信息学研究结果数据库

数据库的内容十分丰富,除上述DNA序列、蛋白质序列和结构数据库之外,还有表达序列标记数据库、序列标记位点数据库、蛋白质序列功能位点数据库、基因图谱数据库等一些具有特殊功能的数据库。

从数据库的类型可以知道生物信息数据的层次性,从而了解生物基于基因构造的层次架构特征。
 
在分子生物学中,DNA或蛋白质的相似性是多方面的,可能是核酸或氨基酸序列的相似,可能是结构的相似,也可能是功能的相似。一个普遍的规律是序列决定结构,结构决定功能。
 
在面向对象的软件设计中,设计工具也是将一个类的定义序列化为一个流文件保存在存储器中,编译工具或运行引擎可以解密这些序列,建立相应的执行期内存结构。而执行期内存结构的变化,正是软件功能的内在表现。可以说,现有软件的开发和运行模式,确实已经在一定程度上接近生物信息系统的架构了。
 
对于DNA序列,同源搜索除有助于确定其功能之外,还有助于确定编码区域,确定基因。对于蛋白质,我们希望能够直接从蛋白质序列准确地预测蛋白质的结构和功能。通过序列的比较分析,特别是将一个未知结构、功能的蛋白质序列与已知结构、功能的蛋白质序列进行比较,可以得到一些关于蛋白质结构或功能的有用信息。通过比较不同种属的同源序列,还可以得到这些种属由他们共同祖先进化而来的信息
 
学习到这里,我头脑中开始产生了一些具体想法火苗了,对于类生命的软件,也就是我们未来通过生命架构仿生的软件(之后简称软件生命)而言,应该找到与分子、蛋白质、细胞、组织相对比的概念,在相对比的概念层次考虑架构的特征可以如何仿生,逐渐形成整体架构的仿生。
 
第一直觉是:仿生的软件对象,可以对应生命活体的细胞。
软件生命中的对象,和生物生命中的细胞具有同等架构层次的结构-功能特征。
对象是软件生命的基本功能单位,细胞是生物生命的基本功能单位;
对象可以有不同的类别,不同的类别具备不同的功能,细胞也有不同的类别,不同类别的细胞也具有不同的功能;
不同类别的对象通过协作可形成一定的运行机制,从而产生组织层次的功能;不同类别的细胞通过协作可构成组织器官,具备系统层次的基本功能。
 
正如细胞是生命体的基本功能单位一样,这里,软件中的对象,是面向生命体功能的对象,而非生命基本组成元素的对象。这个区分非常重要,是从有机表达到生命表达的涌现的层次。细胞内部,仅仅是蛋白质、氨基酸等的有机表达层次;对象内部,仅仅是数据结构、运算操作、程序指令的有机表达层次。只有出现了细胞这个表达生命机能的基本单位出现,生命活体的构造才开始起步;只有出现应用领域的对象,应用系统的构造才开始起步。这是一个分水岭。


https://wap.sciencenet.cn/blog-33982-484496.html

上一篇:学点生物信息学-1
下一篇:四年前的畅想:基因软件
收藏 IP: 112.91.148.*| 热度|

1 许培扬

该博文允许注册用户评论 请点击登录 评论 (9 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 00:09

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部