|
上次我在关于如何撰写期刊论文方法一章中提到过一些专有数据库厂商开发提供的文本和数据挖掘工具(text&data mining tools),使用这些工具可以对专有数据库的数据进行热门话题研究。比如Jstor Constellate。我们学校作为合作伙伴,我参加过Jstor Constellate的培训。可以使用Jupiter networks和Python语言对Jstor的文献进行大数据处理和分析,提炼元数据(metadata and pre-processing)预处理,字数频率的(word frequency)处理,重要的术语(significant term)提炼,提炼出主题模型(topic modeling)。其他厂商也有类似的产品如ProQuest的TDM studio。对国内的产品不了解,有了解可以介绍一下。这些工具还可以用于数字人文项目的研究,比如某个时间跨越段对某个主题有多少篇学术论文等,主题是啥等等,可以看出趋势和进行归纳总结。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-25 14:10
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社