Atlantis Press China分享 http://blog.sciencenet.cn/u/atlantispress 数字出版平台,开放获取先锋

博文

文章荐读 | 深度学习在微生物组学数据分析中的应用

已有 3840 次阅读 2020-12-29 18:34 |个人分类:文章荐读|系统分类:论文交流

文章荐读 | 深度学习在微生物组学数据分析中的应用

导读

微生物组学大数据隐藏着大量宝藏有待挖掘,基于深度学习的数据分析方法将有助于人们发现其中的秘密。来自华中师范大学计算机学院的蒋兴鹏教授、武汉纺织大学数学与计算机学院的朱强博士等在期刊 Journal of Artificial Intelligence of Medical Sciences(JAIMS)上发表了题为Application of Deep Learning in Microbiome文章,系统总结了当前深度学习在微生物组学数据分析上的最新进展。

高通量测序技术的广泛运用产生了海量微生物组数据,对微生物数据的理解可以帮助我们了解微生物与环境、人体健康之间的关系。由于微生物组学数据具有高维、稀疏和复杂等特性,而深度学习的兴起使我们能够有效地处理复杂数据以获取有价值的知识。本文讨论了深度学习在微生物组学数据分析中最新进展,包括宏基因组分类、基因功能预测等,并介绍了基于系统发育树的微生物组分类可以有效地提高模型性能。然后,本文分析了深度学习在微生物组学数据分析中存在的问题,包括模型的可解释性、数据量、超参数等问题。基于上述讨论,本文建议在使用深度学习进行微生物组关联分析时,融入系统构发育树等先验知识,将有助于提升模型预测的准确性和可解释性。

要点介绍

微生物组学数据分析主要目标之一是通过研究微生物的高通量测序数据,找到微生物与环境、人体健康之间的关系,为进一步应用后续治疗或法医鉴定奠定基础。机器学习常被用于微生物组学数据分析,它一般包括两个主要步骤:数据预处理(如特征选择)和模型预测(如监督学习)。如图1:首先,需要从与各种环境或宿主相关的细菌群落中收集测序数据,这些序列可以直接作为机器学习模型的输入,也可以进行预处理。预处理步骤通常可以改善模型的预测结果。例如,如果模型能够预先学习微生物组的层次关系,将更容易构建好的预测模型;此外它还可以在嵌入结构化信息(例如系谱之间的系统发育关系和序列之间的平均核苷酸相似性),从而改善微生物组关联预测结果。

微信图片_20201229182540.png

1 机器学习方法在微生物数据上的分析流程

当前深度学习在图像识别、文本处理和自动翻译等领域取得了惊人的成功。因此,越来越多的研究人员正试图将深度学习技术应用于生物医学数据分析。与传统机器学习相比,深度学习的优势在于其端到端的学习能力,能够自动发现多个表征以实现更好的预测。在这些深度学习架构中,低级特征如DNA序列基序或病理图像中的模式,高级特征如受损的RNA剪接,这些特征可以从数据中学习,从而以减少或消除对人工特征工程的需要。因此,基于深度学习的微生物组学数据分析方法越来越受到重视。然而,当前还缺乏相关文献来系统总结基于机器学习特别是深度学习在微生物组学数据分析上的进展。

本论文的主要贡献有:1. 系统地介绍了深度学习在微生物组学数据分析中的以下三个主要应用:基于深度学习的宏基因组分类、基因预测和微生物组关联分析;2. 本文提出在运用深度学习进行微生物组关联分析时,融入系统构发育树等先验知识,将有助于提升模型预测的准确性和可解释性。

参考文献

[1].    J.A. Gilbert, R.A. Quinn, J. Debelius, Z.Z. Xu, J. Morton, N.Garg,J.K. Jansson, P .C. Dorrestein, R. Knight, Microbiome-wideassociation studies link dynamic microbial consortia to disease,Nature. 535 (2016), 94–103.

[2].    D. Knights, E.K. Costello, R. Knight, Supervised classification of human microbiota, FEMS Microbiol. Rev. 35 (2011), 343–359.

[3].    T.H. Clarke, A. Gomez, H. Singh, K.E. Nelson, L.M. Brinkac, Integrating the microbiome as a resource in the forensics toolkit, Forensic Sci. Int. Genetics. 30 (2017), 141–147.

[4].    P. Mamoshina, A. Vieira, E. Putin, A. Zhavoronkov, Applications of deep learning in biomedicine, Mol. Pharm. 13 (2016),1445–1454.

[5].    C. Angermueller, T. Pärnamaa, L. Parts, O. Stegle, Deep learning for computational biology, Mol. Syst. Biol. 12 (2016), 878.

[6].    M. Wainberg, D. Merico, A. Delong, B.J. Frey, Deep learning in biomedicine, Nat. Biotechnol. 36 (2018), 829–838.

[7].    D.M. Camacho, K.M. Collins, R.K. Powers, J.C. Costello, J.J.Collins, Next-generation machine learning for biological net-works, Cell. 173 (2018), 1581–1592.

[8].    G. Eraslan, Ž. Avsec, J. Gagneur, F .J. Theis, Deep learning: new computational modelling techniques for genomics, Nat. Rev. Genetics. 20 (2019), 389–403.

[9].    J.A. Gilbert, J.K. Jansson, R. Knight, The earth microbiome project: successes and aspirations, BMC Biol. 12 (2014), 69.

[10]. J.A. Navas-Molina, E.R. Hyde, J.G. Sanders, R. Knight, The microbiome and big data, Curr. Opin. Syst. Biol. 4 (2017), 92–96.

原文信息

Q. Zhu, B. Huo, H. Sun, B. Li, X. Jiang, "Application of Deep Learning in Microbiome", Journal of Artificial Intelligence for Medical Sciences, 2020, DOI: 10.2991/jaims.d.201028.001.

微信图片_202012291825401.png

扫描二维码,获取英文原文

https://www.atlantis-press.com/journals/jaims/125945663

关于期刊

Journal of Artificial Intelligence of Medical Sciences (JAIMSeISSN 2666-1470是一本国际性的、经过严格同行评审的开放存取期刊,刊载人工智能在医学、医疗保健和生命科学所有交叉学科方向的理论,方法和应用的研究。编辑团队尤其欢迎在机器/深度学习、数据科学、自然语言处理(NLP)等支持下,为医学诊断、药物开发、护理、精准治疗等领域提供最近见解的原创性研究文章、综合评论、通信和观点。

JAIMS 由荷兰阿姆斯特丹自由大学黄智生教授担任创刊主编,来自八个国家的36名领域一流学者担任首届编委会,致力于将期刊打造为医学人工智能领域的首选阵地和开放科学平台。文章成果版权作者保留,不收取任何费用。欢迎各位专家投稿!

Atlantis Press.png

 




https://wap.sciencenet.cn/blog-3453320-1264772.html

上一篇:特刊文章锦集荐读 | 新兴系统和应用的计算智能
下一篇:文章荐读 | 改进型同轴静电喷雾制备聚合物基药物缓控释微纳米颗粒
收藏 IP: 123.53.26.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-29 12:50

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部