|
论文发表于: Proceedings of 9th Chinese Lexical Semantics Workshop (CLSW2008),
SINGAPORE, COLIPS PUBLICATION, 2008: 362-369.
基于语义的非相关文献知识发现研究
1刘耀 2段慧明 2穗志方 1王惠临 3周扬 3王振国
1(中国科学技术信息研究所北京 100038)
2(北京大学计算语言学研究所 北京 100871)
3(山东中医药大学文献研究所 济南 250014)
摘要:本文利用自然语言处理(NLP)技术与方法,针对中文非相关文献知识发现所需的数据基础进行研究,采用以词义为主轴的综合型语言知识库构建思路与方法,结合中医药文献特点,开发相应工具,实现了文本的自动切分与词性标注。在此基础上构建专业语义词典、针对性停用词表,研发基于语义的中文非相关文献的知识发现辅助系统,利用语义网络、语义词典、显性关系排除、语义限制、频率过滤等技术和方法,对非相关文献之间的关联性进行智能化初选,成功地模拟了非相关文献知识发现的过程,达到了帮助科研人员揭示中文文献中的隐性关联,引导并实现知识发现的预期目标。
关键词:非相关文献;自然语言处理;知识发现
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-4-27 10:45
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社