zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

生物学家的机器学习指南

已有 2459 次阅读 2022-1-10 11:33 |个人分类:科普|系统分类:科普集锦

写在前面

PLoS Computational Biology杂志中,曾经发表了一篇标题为《Ten simple rules for biologists initiating a collaboration with computer scientists》(图1)的文章。当生物学家想与计算机学家合作时,里面的第一条规则是:不要试图将计算机学家变成生物学家(Do not try to turn them into biologists)。生物学家要想避开这个雷区,有必要了解一下机器学习方面的知识。这次就推荐一个指南。

 

67aad4fbe85c3c28cebf43ce51690a7.png

1 生物学家与计算机学家合作10条准则

 

01

动机

在生物学中,生物数据的大体量和复杂性对机器学习的需求日益增长,机器学习方法旨在构建隐藏在生物过程中的信息和预测模型。所有机器学习技术依赖数据拟合模型,然而机器学习方法具有特异性。因此,有必要对一些重要的机器学习技术(包括深度神经网络)进行梳理。另外一方面,不同机器学习技术可能适用于特定的生物数据类型,当生物学家想利用机器学习开展生物学实验时,提供合适的机器学习方法将会事半功倍。这些都是综述文章《A guide to machine learning for biologists》(图2)要解决的问题。

463cb23f2cde9b9670f3008e3df16fc.png

2 生物学家机器学习指南

 

 

02

内容

文献《A guide to machine learning for biologists》从基本概念(包括基本术语,监督和非监督学习,分类、回归和聚类问题,类别和标签,损失和代价函数,参数和超参数,训练、验证和测试,执行机器学习,过拟合和欠拟合,折中归纳偏差和方差偏差)、传统机器学习到人工神经网络进行了综述,还对机器学习应用于生物学所面临的挑战进行了阐述。详细内容见文献[1]

 

后话

机器学习是辅助生物实验设计的良好工具和手段,本文献是生物学家和计算生物学家了解机器学习良好的入门综述。可以充当手册及时查阅基本的概念和方法适用范围。

 

 

参考文献:

[1] Greener JG, Kandathil SM, Moffat L, Jones DT. A guide to machine learning for biologists. Nat Rev Mol Cell Biol. 2022 Jan;23(1):40-55. doi: 10.1038/s41580-021-00407-0. Epub 2021 Sep 13. PMID: 34518686.

[2] Cechova M. Ten simple rules for biologists initiating a collaboration with computer scientists. PLoS Comput Biol. 2020 Oct 22;16(10):e1008281. doi: 10.1371/journal.pcbi.1008281. PMID: 33091012; PMCID: PMC7580977.

 

更多背景知识如下:

1. miRNA是何方神圣?

2. What?植物miRNA能够调控动物靶基因?

3. miRNA也走非主流路线!

4. Tools4miRs:只为miRNA分析

5. miRNA序列与表达谱数据库

6. miRNA有个DIANA系列

7. miRNA富集分析之miRPath

8. miRNA富集分析之TAM

9. miRNA富集分析之miEAA

10. miRNA富集分析之clusterProfiler

11.miRNA靶基因识别

12. miRNA靶基因识别:下一步

13. miRNA靶基因之实验验证型数据库

14. miRNA靶基因之预测型数据库

15. miRNA靶基因之综合型数据库

16. miRNA靶基因之miRLAB

17. miRNA靶基因之miRBaseConverter

18. miRNATF互为调控

19. miRNA与人类疾病

20. miRNA靶基因与人类疾病

21. miRNAEMT

22. miRNA协作

23. miRNA协作之MFSN

24. miRNA协作之因果推理方法

25. 单细胞水平miRNA调控

26. miRNA靶基因识别之IDA

27. EMT,你怎么那么多调控因子!

28. miRNA靶基因识别之DirectTarget

29. miRNA靶基因识别之JointIDA

30. miRNA靶基因识别之hiddenICP

31. miRNA活性识别之因果推理方法

32. 因果推理综述推荐一篇

33. 构建条件单细胞基因调控网络

 

号外,为了便于交流,我们为miRNA介导的ceRNA研究在Frontiers in Molecular Biosciences杂志( 2020_IF = 5.246)整了个专刊,主题为“Computational Identification of ceRNA Regulation”。投稿链接:https://www.frontiersin.org/research-topics/24340/

63d25fd0cd99aff79a95ef40128386e.png

8e1a5769ae8b45a5bd0a59cd34bc8f6.png



https://wap.sciencenet.cn/blog-571917-1320343.html

上一篇:构建条件单细胞基因调控网络
下一篇:关于开设课程微信公众号的问卷调查
收藏 IP: 39.129.48.*| 热度|

1 李宏翰

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 21:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部