wbb121的个人博客分享 http://blog.sciencenet.cn/u/wbb121

博文

Greengenes Database 13_5 介绍

已有 10808 次阅读 2018-5-25 16:05 |个人分类:生物数据|系统分类:科研笔记| Greengenes, 16S rRNA

Greengenes Database官方网站: http://greengenes.secondgenome.com

本篇文章为13_5版本中的文件00README中的部分内容,此处主要给出文件列表及其说明,更详细的请参阅附件或在http://greengenes.secondgenome.com/downloads/database/13_5下载。

  • gg_13_5.fasta.gz (265756 KiB)全部未比对的序列(不删除碱基),即没有比对上的序列

  • gg_13_5.fasta.gz.md5 (1 KiB)

  • gg_13_5.sql.gz (1007175 KiB)完整Greengenes记录。这是一个mysqldump。,用户是没有密码的'greengenes',数据库被命名为'greengenes'。 注意:此数据库当前仅包含发布中包含的那些记录的序列信息,但是描述了包含可对齐16S的所有已审核的Genbank记录。 这是一项正在进行的工作,将在后续版本中添加额外的记录数据和功能。

  • gg_13_5.sql.gz.md5 (1 KiB)

  • gg_13_5_00CHANGELOG (3 KiB)自上次发布以来的重大更改

  • gg_13_5_00README (12 KiB)数据库的基本介绍

  • gg_13_5_00ROADMAP (1 KiB)计划的更改和添加,包括发布日期

  • gg_13_5_00STATS (1 KiB)包含在不同相似性级别的序列数量的快速统计

  • gg_13_5_accessions.txt.gz (7528 KiB)从Greengenes ID到外部数据库的映射。这主要是Genbank的参考文献,但因为没有自动的方式来推断一些NCBI的加入,所以包括几百个IMG基因组ID的链接。即ID之间对应关系

  • gg_13_5_accessions.txt.gz.md5 (1 KiB)

  • gg_13_5_chimeras.txt.gz (506 KiB)当前的嵌合体黑名单

  • gg_13_5_chimeras.txt.gz.md5 (1 KiB)

  • gg_13_5_img.txt.gz (40 KiB)Greengenes ID和IMG Genomes之间的特定映射。即与IMG之间的ID对应关系

  • gg_13_5_img.txt.gz.md5 (1 KiB)

  • gg_13_5_otus.tar.gz (310867 KiB)使用QIIME获得的OTU

  • gg_13_5_otus.tar.gz.md5 (1 KiB)

  • gg_13_5_otus_99_annotated.tree.gz (1843 KiB)99%OTU相似性的有根树,使用FastTree进行系统发育重构(Price,et al 2010),以tax2tree为基础分类法(McDonald,et al 2011)。

  • gg_13_5_otus_99_annotated.tree.gz.md5 (1 KiB)

  • gg_13_5_pynast.fasta.gz (593730 KiB)几乎所有版本中比对后的序列。 大约1400个SSU-Align的序列未能与PyNAST(Caporaso 2010)比对。 由于使用了最初的Greengenes核心集,这可能是导致比对失败的原因。即比对序列

  • gg_13_5_pynast.fasta.gz.md5 (1 KiB)

  • gg_13_5_ssualign.fasta.gz (454572 KiB)所有版本中比对后的序列。使用SSU-Align (Nawrocki 2009)进行序列比对。作为这个软件的结果,移除从SSU-Align模型中的结构转向对应的碱基。 不建议将这种比对用于探针设计或任何其他需要访问序列中所有连续碱基的操作。每个序列用7,682个字符表示。虚线( - )表示缺失数据或者比对缺口。即比对上的序列

  • gg_13_5_ssualign.fasta.gz.md5 (1 KiB)

  • gg_13_5_taxonomy.txt.gz (9315 KiB)这个版本中所有序列的全部分类,每个分类都由7个不同水平组成。即为每条序列的分类学记录

  • gg_13_5_taxonomy.txt.gz.md5 (1 KiB)


附件: gg_13_5_00README.txt




https://wap.sciencenet.cn/blog-3388297-1115723.html

上一篇:Ubuntu中安装QIIME2
下一篇:使用QIIME分析微生物群落的16S rRNA序列(fasta格式序列)
收藏 IP: 58.194.181.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-29 05:36

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部