|
该文发表于: 中文信息学报,2008,22(4):24-30
中医药古文献语料库设计与开发研究[1]
刘耀1 段慧明2 王惠临1 周扬3 王振国3 李宏展2
1(中国科学技术信息研究所 北京 100038)
2(北京大学 计算语言学研究所 北京 100871)
3(山东中医药大学 文献研究所 济南 250014)
摘要:专业领域语料库是对专业领域文献进行自然语言处理的重要的不可或缺的基础,是对专业文本内容与意图进行深层把握的必由之路。本文通过对研究背景的分析,进一步明析了专业文献进行自然语言处理的必要性,并在对专业文献语料库的研究特点进行分析的基础上,深入探讨了专业语料库的设计思想及原理,同时,对语料库词类的标注信息进行了深入研究。成功地开发了针对专业领域语料库的辅助加工系统,为专业领域语料库建设提供了理论指导和技术支撑。
关键词:自然语言处理 语料库 中医药古文献 知识工程
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-21 11:57
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社