傅平
使用文本挖掘工具对专有数据库的数据进行热门话题研究
2021-12-29 19:46
阅读:2083

        上次我在关于如何撰写期刊论文方法一章中提到过一些专有数据库厂商开发提供的文本和数据挖掘工具(text&data mining tools),使用这些工具可以对专有数据库的数据进行热门话题研究。比如Jstor Constellate。我们学校作为合作伙伴,我参加过Jstor Constellate的培训。可以使用Jupiter networks和Python语言对Jstor的文献进行大数据处理和分析,提炼元数据(metadata and pre-processing)预处理,字数频率的(word frequency)处理,重要的术语(significant term)提炼,提炼出主题模型(topic modeling)。其他厂商也有类似的产品如ProQuest的TDM studio。对国内的产品不了解,有了解可以介绍一下。这些工具还可以用于数字人文项目的研究,比如某个时间跨越段对某个主题有多少篇学术论文等,主题是啥等等,可以看出趋势和进行归纳总结。

转载本文请联系原作者获取授权,同时请注明本文来自傅平科学网博客。

链接地址:https://wap.sciencenet.cn/blog-3316383-1318712.html?mobile=1

收藏

分享到:

当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?