武汉大学数字人文研究中心 第五期 跨学科论坛
二十四史是中国古代各朝撰写的二十四部史书的总称,是被历来的朝代纳为正统的史书,故又称“正史”。它上起传说中的黄帝(前2550年),止于明朝崇祯十七年(1644年),计3213卷,约4000万字,用统一的有本纪、列传的纪传体编写。
对二十四史进行语义提取,知识库构建并在此基础上进行语义检索将是一个浩大的工程。该项目采用语义技术来对史籍语料进行组织。解决了史籍底本信息实体信息标注与抽取、底本格式转换与索引、关系模式转换为语义模式、地点沿革等技术和非技术上的难题,实现了标注底本全文阅读、史籍语义检索、知识的可视化检索、时空分析功能。项目中大量应用了现已成熟的前端技术、开源工具与框架、大数据索引与存储以及语义相关的工具与技术,如Jquery、Lucene、AlleGroGraph、protege、TouchGraph等。
主讲人:徐雷 博士
时间:2012年4月26日(周四) 晚上 7:30
地点:信息管理学院 108会议室
https://wap.sciencenet.cn/blog-67855-563137.html
上一篇:
数字人文与信息化可视化:创新与整合下一篇:
文化遗产数字化与数字人文