woodcorpse的个人博客分享 http://blog.sciencenet.cn/u/woodcorpse

博文

Nature Method:DEMIC——使用宏基因组数据预测细菌的生长速率

已有 4749 次阅读 2018-12-8 11:27 |个人分类:软件|系统分类:科研笔记

image

基于多宏基因组样本的细菌生物动态定量和比较

Quantifying and comparing bacterial growth dynamics in multiple metagenomic samples

Nature Methods, [26.919], Article, 2018-11-12

原文链接: https://www.nature.com/articles/s41592-018-0182-0

第一作者:Yuan Gao

通讯作者:Hongzhe Li

主要单位:宾西法尼亚大学,Perelman医学院,流行病与生统系

摘要

准确定量没有完整序列的微生物生长动态是具有生物学意义的,但在宏基因组计算中存在挑战。我们提出了微生物群体动态估计软件DEMIC(https://sourceforge.net/projects/demic/DEMIC),可以基于多个宏基因组样本的重复的contigs和覆盖度的值准确比较细菌的生长速度。本软件在不同测序量样本和多个直实或人工模拟样本中表现稳定。

正文

图1.DEMIC的计算流程

image

a. 基于分箱(binning)算法鉴定的重叠群(contig)组,基因组的位置、潜在的污染(图中不同颜色)是未知的;
b. 采用滑窗法计算重叠群的覆盖度(coverage,也称测序深度sequencing depth);
c. 采用线性混合效应模型(linear mixed-effects models, LMM)对GC偏好进行迭代校正,使用PCA距离进行污染重叠群过滤;
d. 结合样本和重叠群集,基于有意义的样本估计生长速度。虚线表示不同样本中重叠群覆盖度对数转换的线性回归,可以从重复来源推断相对距离;
e. 方法应用于每个重叠群组(bin)。NA代表无法估计物种生长率的样本。

图2.基于三个物种测序数据集的效果评估

image

a,b 在36个E. faecalis(a)数据集和50个 C. rodentium数据集(b)相关估计DEMIC和iRep的PTR值。阴影表示99%的置信区间。
c,d,评估DEMIC和iRep在重叠群组中的污染率(c)和完整度(d)。基于L. gasseri, E. faecalis, C. rodentium (每个样本n= 10)估计样本大小和叠连群组的完整性和污染率。绘制评估的相关性图,箱线图展示中位数、第1和3分位数。

图3.基于5个属45个相关物种的模拟数据评估DEMIC

image

a, 模拟PTR的估计数;
b, PTR与DEMIC估计41个叠连群簇相关;
c, 基于不同ANI物种组评估iRep和DEMIC结果(样本数1917,按ANI值划分为66-74,74-82和82-90三种相似各度)。双尾Mann–Whitney U-tests, P< 0.05, P< 0.01, P< 0.001. b,c 箱线图展示中位数、第1,3分位数。
d, 基于41个物种的DEMIC和iREP估计的皮尔森相关系数。子图展示两种方法相应的PTR大于0.9。

热心肠总结

① 在宏基因组中准确定量没有完整序列的微生物生长动态具有重要意义但充满挑战;

② DEMIC 基于多样本宏基因组中重叠群和覆盖度的值,通过评估重叠群相对于复制原点的间距,准确比较样品间细菌生长速率的差异;

③ DEMIC 在不同样本大小和组装质量的模拟和真实数据中表现良好,好于既有的 iRep 方法,与 PTRC 方法相当(但该方法仅适用于有完整基因组的物种);

④ DEMIC 使用 Perl 和 R 语言开发,以命令行模式运行,通过 GPL 协议发布。

Reference

软件主页 https://sourceforge.net/projects/demic/files/

猜你喜欢

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外2600+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
image

学习扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
image

image

点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA



https://wap.sciencenet.cn/blog-3334560-1150503.html

上一篇:评论:玉米可利用气生根进行高效生物固氮
下一篇:R语言:聚类分析hclust
收藏 IP: 118.26.142.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-18 12:23

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部