刘耀分享 http://blog.sciencenet.cn/u/liuysd 中国科学技术信息研究所 研究员 硕士生导师

博文

中医药古文献语料库设计与开发研究

已有 5456 次阅读 2008-9-8 12:19 |个人分类:科研笔记

    

该文发表于: 中文信息学报,2008,22(4):24-30

中医药古文献语料库设计与开发研究[1]

刘耀1 段慧明2 王惠临1  周扬3 王振国3 李宏展2

1(中国科学技术信息研究所 北京 100038

2(北京大学 计算语言学研究所 北京 100871

3(山东中医药大学 文献研究所 济南 250014

摘要:专业领域语料库是对专业领域文献进行自然语言处理的重要的不可或缺的基础,是对专业文本内容与意图进行深层把握的必由之路。本文通过对研究背景的分析,进一步明析了专业文献进行自然语言处理的必要性,并在对专业文献语料库的研究特点进行分析的基础上,深入探讨了专业语料库的设计思想及原理,同时,对语料库词类的标注信息进行了深入研究。成功地开发了针对专业领域语料库的辅助加工系统,为专业领域语料库建设提供了理论指导和技术支撑。

关键词:自然语言处理 语料库 中医药古文献 知识工程



[1] [基金项目]本文得到国家科技支撑计划项目(2006BAH03B00)、国家973项目(2007CB512601)、教育部人文社科项目(06JC870001)、山东省中医药科技专项项目(2003-14)的支持。

[作者简介]刘耀,男,1972年生,副研究员,北京大学信息管理系管理学博士,北京大学计算语言学研究所出站博士后,主要从事知识工程与中文信息处理方向研究;段慧明,女,1957年生,北京大学计算语言学研究所高级工程师,主要从事计算语言学方向研究;王惠临,男,1948年生,研究员,北京大学信息管理系博士生导师,主要从事自然语言处理方向研究。

论文全文:中医药古文献语料库设计与开发研究



https://wap.sciencenet.cn/blog-5573-38187.html

上一篇:7月30—8月2日到山东泰安参加了“中药药性理论相关基础研究(国家973项目)”工作会议
下一篇:基于语义的非相关文献知识发现研究
收藏 IP: .*| 热度|

0

发表评论 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-24 19:26

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部