|||
《情报学报》2019年第9期上发表的论文《杰出科学家的科研产出规律——以拉斯克医学研究奖得主为例》提及利用KNIME软件进行了文本预处理,具体包括:字符串转换、去除标点与数字、大小写转换、词干提取、停止词过滤、过滤少于3个字母的单词。
任晓亚,张志强,陈云伟.杰出科学家的科研产出规律——以拉斯克医学研究奖得主为例[J].情报学报,2019,38(09):894-906
下面是一些与KNIME有关的材料:
此网站可以下载KNIME,网站还提升学习、社区等相关资料。
(2)KNIME 数据分析平台
https://blog.csdn.net/imbenben/article/details/70666717
该网页介绍了KNIME的基本情况、安装等内容。
KNIME的发展始于2004年1月,由康斯坦茨大学的软件工程师团队作为专有产品。由Michael Berthold领导的原始开发团队来自硅谷的一家公司,为制药行业提供软件。最初的目标是创建一个模块化,高度可扩展和开放的数据处理平台,从而轻松集成不同的数据加载,处理,转换,分析和可视化探索模块,而不必关注任何特定的应用领域。该平台旨在成为一个协作和研究平台,也应作为各种其他数据分析项目的集成平台。
(3)KNIME学习记录
https://blog.csdn.net/u012325865/article/details/81117131
主要介绍的是如何用数据挖掘软件KNIME来构建社会网络。
(5)KNIME!一款支持Python功能甩Excel几条街的免费数据分析工具
https://baijiahao.baidu.com/s?id=1637404871417846230&wfr=spider&for=pc
俗话说一个好汉三个帮。KNIME还支持多种数据分析工具和语言,包括支持R语言和Python语言。当然,结果分析出来不可视化出美丽报表,也是不不行的。所以,强大的可视化功能也是必须的。它提供了易于使用的图形化接口,能够把分析结果通过生动形象的图形展示给用户。最最最重要的是其提供了1500多个模块,且现在第三方模块数量还在不断的增长。
(6)KNIME Analytics Platform
https://github.com/knime/knime-core
(7)KNIME + Python = 数据分析+报表全流程
https://www.cnblogs.com/luweiseu/p/8487225.html
理想的数据分析应该包括:清晰的数据流和数据分析流程;直观的数据分析结果报告。
经过对多种开源方案的比较,我选择使用knime+python的方案,可以有以下的优点
利用python和相关数据分析库的能力,对数据建模、分析、可视化,这块基于Anaconda;
利用knime的可视化数据流和report design能力,对数据ETL、建模、分析、报告。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-9 07:27
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社