许培扬博客分享 http://blog.sciencenet.cn/u/xupeiyang 跟踪国际前沿 服务国内科研

博文

采用主题词进行文献计量分析的主要问题

已有 3709 次阅读 2012-5-30 15:51 |个人分类:信息分析|系统分类:科研笔记| 主题词

 
       很多医学文献计量分析采用PUBMED/MEDLINE数据库中的医学主题词(MESH)作为分析依据,根据主题词的词频来确定研究热点和趋势分析等。有几个问题应该注意,在分析和讨论中最好予以说明。
1   主题词是人工受控语言,词量的控制有一定人为性。
2   数据库的主题标引深度是预先人为确定的,MEDLINE数据库的标引深度为平均每篇文献12个主题词。
3   文献标引有漏标引和误标引的问题,组配标引也有漏组配和误组配的问题,特别是文献中的重要主题概念被漏标引或误标引。MEDLINE数据库一直是由标引员人工标引的,虽然标引质量很好,但也有一定的标引误差存在。
4  标引的一致性问题,MEDLINE数据库的主题标引一致性,主题词标引一致性为62%;主题词与副主题词组配标引的一致性为48%。
5  从科研结束----论文发表----数据库收录到主题标引需要1-2年时间,因此主题词分析不能准确反映研究热点或动态趋势。
 
最好采用自然语言(关键词,文本词)进行文献计量分析,或主题词与关键词分别比较分析,看看分析结果有多大差别。


https://wap.sciencenet.cn/blog-280034-576671.html

上一篇:SCI 数据库文献计量分析的局限性
下一篇:女性乳腺癌与上夜班关系密切
收藏 IP: 222.35.21.*| 热度|

0

发表评论 评论 (2 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-17 02:55

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部