知识发现(Knowledge Discovery in Database, KDD),是所谓"
数据挖掘"的一种更广义的说法,即从各种媒体表示的信息中,根据不同的需求获得知识。
知识发现的目的是向使用者屏蔽原始数据的繁琐细节,从原始数据中提炼出有意义的、简洁的知识,直接向使用者报告。基于数据库的知识发现(KDD)和数据挖掘还存在着混淆,通常这两个术语替换使用。KDD表示将低层数据转换为高层知识的整个过程。
KDD简单定义为:KDD是确定数据中有效的、新颖的、潜在有用的、基本可理解的模式的特定过程。而数据挖掘可认为是观察数据中模式或模型的抽取,这是对数据挖掘的一般解释。虽然数据挖掘是知识发现过程的核心,但它通常仅占KDD的一部分(大约是15% 到25%) 。
数据挖掘仅仅是整个KDD过程的一个步骤,对于到底有多少步以及哪一步必须包括在KDD过程中没有确切的定义。然而,通用的过程应该接收原始数据输入,选择重要的数据项,缩减、预处理和浓缩数据组,将数据转换为合适的格式,从数据中找到模式,评价解释发现结果。
这几年,我做了大量生物医学知识发现的实例,有的发现,对科研选题和进行中的相关科研工作很有启发作用和参考意义,大家可以参考。科研人员应该自己亲自去做知识发现,而不是只做信息检索和信息分析。
许培扬博客 知识发现栏目
生物医学知识发现实例:
https://wap.sciencenet.cn/blog-280034-600896.html
上一篇:
雷帕霉素与肥胖研究的知识发现下一篇:
刘翔术后报平安