刘耀
中医药古文献语料库设计与开发研究
2008-9-8 12:19
阅读:5592

    

该文发表于: 中文信息学报,2008,22(4):24-30

中医药古文献语料库设计与开发研究[1]

刘耀1 段慧明2 王惠临1  周扬3 王振国3 李宏展2

1(中国科学技术信息研究所 北京 100038

2(北京大学 计算语言学研究所 北京 100871

3(山东中医药大学 文献研究所 济南 250014

摘要:专业领域语料库是对专业领域文献进行自然语言处理的重要的不可或缺的基础,是对专业文本内容与意图进行深层把握的必由之路。本文通过对研究背景的分析,进一步明析了专业文献进行自然语言处理的必要性,并在对专业文献语料库的研究特点进行分析的基础上,深入探讨了专业语料库的设计思想及原理,同时,对语料库词类的标注信息进行了深入研究。成功地开发了针对专业领域语料库的辅助加工系统,为专业领域语料库建设提供了理论指导和技术支撑。

关键词:自然语言处理 语料库 中医药古文献 知识工程



[1] [基金项目]本文得到国家科技支撑计划项目(2006BAH03B00)、国家973项目(2007CB512601)、教育部人文社科项目(06JC870001)、山东省中医药科技专项项目(2003-14)的支持。

[作者简介]刘耀,男,1972年生,副研究员,北京大学信息管理系管理学博士,北京大学计算语言学研究所出站博士后,主要从事知识工程与中文信息处理方向研究;段慧明,女,1957年生,北京大学计算语言学研究所高级工程师,主要从事计算语言学方向研究;王惠临,男,1948年生,研究员,北京大学信息管理系博士生导师,主要从事自然语言处理方向研究。

论文全文:中医药古文献语料库设计与开发研究

转载本文请联系原作者获取授权,同时请注明本文来自刘耀科学网博客。

链接地址:https://wap.sciencenet.cn/blog-5573-38187.html?mobile=1

收藏

分享到:

当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?