思想独立,个性自由分享 http://blog.sciencenet.cn/u/zls111 为自己的信仰而奋斗,为我们的未来而努力 http://baike.baidu.com/item/张亮生

博文

基因家族的定义

已有 31959 次阅读 2012-3-28 11:10 |系统分类:科研笔记| 基因, 结构域, 基因家族

今天有个同学发信息问我:如何检测一个基因是否存在家族基因? 正好最近在写博士论文有相关内容,就贴出来。

什么是一个基因家族呢?由一个共同的祖先基因经过重复(duplication)和突变(mutation)产生的、外显子中具有相似的序列的一组相关基因被称为基因家族(gene family)。基因重复主要有三种方式:片段复制、串联重复和逆转录转座或其他转座事件等,基因重复后可以彼此形成基因簇(gene clusters)同一家族中的成员有时紧密的排列在一起,成为一个基因簇;更多的时候,它们却分散在同一染色体的不同部位,甚至位于不同染色体上,具有各自不同的表达调控模式。基因突变是基因分子进化的第一原因,由核苷酸替代、插入/缺失、重组和基因转换等引发的突变基因或DNA序列,通过群体水平的遗传漂变和/或自然选择进行扩散,并最终在物种基因组中得以固定,这种方式产生的新基因一般拷贝数目不会增加,相对基因重复是非常少的,主要是影响基因的序列以及其编码的蛋白。基因家族主要是指一组功能相似且核苷酸序列具有同源性的基因,是具有显著相似性的一组基因,编码相似的蛋白质产物

有时定义基因家族,从结构域角度来刻画。如:一类基因,其编码蛋白都含有同一个结构域,这一类基因是一个基因家族。比如MADS-box基因家族,这类基因都含有MADS-box结构域,还有SET结构域基因家族。这个定义信息更偏向功能信息,一般来说结构域决定某种功能,因为结构域序列保守,易形成稳定的三维结构。这与共同祖先的定义有些差别,很多结构域难找得到其共同祖先。另外一个基因的共同祖先定义比较复杂的,越是历史久远的祖先,因为物种的在进化过程中发生了很多丢失和增加事件。共同祖先是个相对的概念,比如植物的共同祖先,一般包括藻类及其它绿色植物,而被子植物共同祖先,根据已经测序的基因组,一般指单双子叶之前就可以。如果从共同祖先定义基因家族,很多已知的基因家族就要被分成很多个基因家族。有很多网站(数据库)专门收集结构域,比如Pfam和InterPro,这两个数据库内容差不多。这些数据库以Hmmer算法为基础,根据Uniprot中包含的蛋白,进行序列连配找到保守的片段(结构域),再以这些序列使用Hmmer构建种子,保存这些种子。一个蛋白拿过来后,与这些种子比对,根据打分能判断出这个蛋白是不是含有这个结构域,这也是判断一个基因编码蛋白是不是属于这个家族。

 



https://wap.sciencenet.cn/blog-54593-552534.html

上一篇:冯康先生和华罗庚先生的创新和科学贡献
下一篇:美国财政收入17.5%投入医疗
收藏 IP: 180.172.134.*| 热度|

3 许培扬 余国志 wormbreeder

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-22 01:22

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部