yzy2020的个人博客分享 http://blog.sciencenet.cn/u/yzy2020 技术体现的是术,可以通过多次练习掌握,不要迷恋术,idea是道,需要通过文献加强训练。总之,孰能生巧!

博文

[转载]eggNOG数据库相关文件理解

已有 1379 次阅读 2023-5-17 16:48 |个人分类:linux学习|系统分类:科研笔记|文章来源:转载

一、

1、eggNOG注释原理

通过已知蛋白未知序列进行功能注释;

通过查看指定的eggNOG编号对应的protein数目,存在及缺失,从而能推导特定的代谢途径是否存在;

每个eggNOG编号一类蛋白,将query序列比对上的eggNOG编号的proteins进行多序列比对,能确定保守位点,分析其进化关系

2、访问在线工具,比对好的蛋白序列只需要eggNOG注释,在线工具即可满足,单个文件蛋白序列最高1M。

http://eggnogdb.embl.de/#/app/emapper

3、使用eggNOG数据库进行功能注释新基因、蛋白序列。常用于新基因组、转录组和宏基因组的基因集。直系同源(orthology)功能预测认为比传统的同源搜索更准确,可以避免直接从旁系同源(paralogs)借用功能注释(基因重复有很高的机会形成功能分化)。

4、[project_name].emapper.annotations文件,最终需要的文件

[project_name].emapper.annotations文件:比对结果整理,这才是重点。
This file provides final annotations of each query. Tab-delimited columns in the file are:

文件由制表符分隔为13列,如下:

    1 序列名query_name: query sequence name
    2 eggNOG编号seed_eggNOG_ortholog: best protein match in eggNOG
    3 seed_ortholog_evalue: best protein match (e-value)
    4 seed_ortholog_score: best protein match (bit-score)
    5 预测基因名predicted_gene_name: Predicted gene name for query sequences
    6 逗号分隔的GO注释GO_terms: Comma delimited list of predicted Gene Ontology terms
    7 KO编号注释KEGG_KO: Comma delimited list of predicted KEGG KOs
    8 代谢反应BiGG_Reactions: Comma delimited list of predicted BiGG metabolic reactions
    9 注释物种范围Annotation_tax_scope: The taxonomic scope used to annotate this query sequence
    10 OG编号Matching_OGs: Comma delimited list of matching eggNOG Orthologous Groups
    11 best_OG|evalue|score: Best matching Orthologous Groups (only in HMM mode)
    12 COG分类COG functional categories: COG functional category inferred from best matching OG
    13 模型注释eggNOG_HMM_model_annotation: eggNOG functional description inferred from best matching OG

5、具体命令行直接参考 :刘老师 https://blog.csdn.net/woodcorpse/article/details/83144768


————————————————
版权声明:本文为CSDN博主「刘永鑫Adam」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/woodcorpse/article/details/83144768



https://wap.sciencenet.cn/blog-3434047-1388388.html

上一篇:[转载]【链接】估算系统树分歧时间 —— paml.mcmctree,r8s
下一篇:[转载]基因家族收缩和扩张分析
收藏 IP: 221.11.67.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-17 03:21

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部