王晓光分享 http://blog.sciencenet.cn/u/limer 武汉大学信息管理学院

博文

数字人文公共软件平台

已有 6143 次阅读 2013-11-27 04:02 |系统分类:科研笔记| 数字人文

在我们还在考虑如何如何数字化文本的时候,美国的数字人文研究者已经开始开始建造数字文本的“显微镜和立体成像系统”,来全面透视文本的内涵和意义,使得人文学者有了强有力的软件工具。


以上文字有感于美国加州大学伯克利分校数字人文研究者开发的WordSeer软件。

该软件是一个集成化的文本分析工具,可以用于人文和社会科学研究。它使用了文本可视化、信息检索、意义建构、自然语言处理等多种基础,支持文本的统计、情境化导航、阅读和使用。


看到这个软件时有个感觉就是功能实在是新颖强大,虽然也见过很多类似软件,但这个软件可以让研究者全面透视一个文本,不管它是小说还是喜剧、诗歌或者政策文本。它不单是一个检索统计工具,关键是它能给人文研究者一种新的发现和揭示文本蕴含意义和知识的途径,它完全可以嵌入人文研究的流程内部,而不是一个对人文研究来说可有可无的东西。显然, 这个软件与我们自己开发的一款分析科研主题演化的软件NEViewer在知识发现方向上并不相同,我们的软件主要用于发现一个研究领域的宏观知识,而这个软件则可以用来发现一篇文章内部的微观细节知识。


就像今天的学者离不开电子文献一样,Wordseer完全有潜力成为一个人文学者离不开的软件平台,可以辅助人文学者做到已往不能做到的事情,发现已往不能发现的人文文本中的细节及其背后的意义,从而推动Digital Scholarship的发展,以及新型数字人文研究范式的形成。


如果用一个比喻来描述, 那就是Wordseer是人文文本研究领域的哈勃望远镜,它可以让我们看得更远更细致。


令人欣喜的是,我们的统计表明  在最近几年 国家社科一般项目和重大项目中 特定领域的文献数字化和数字资源库建设正在加速,而且在很多领域全面开花,包括 历史、文艺、社会学、古籍、民族学、考古、政治、法律等等,但分布并不均衡。


趋势已经很明显,中国的数字人文研究环境正在发展,文献资源的数字化是一方面,高级软件环境的开发是另一方面,相对而言,我们在第二方面明显不足。


高级软件环境的开发会不会是中国高等教育文献保障系统(China Academic Library & Information System,简称CALIS)下一步的发展方向呢?当我们有了数字信息资源,并在对资源进行深度整合和数字出版的同时,是否也应该关注终端用户的应用需求,也就是建设公共性的和开放性的软件工具平台,给终端的学术用户使用呢?


毋庸置疑,在这个过程中,图书情报学和数字出版的基本理论、方法、技术和标准将大有用武之地。新的需求更会拉动这些学科研究内容的创新和发展。



https://wap.sciencenet.cn/blog-67855-744976.html

上一篇:范式竞争与跨学科的发展
下一篇:科技革命与图情档出版学科
收藏 IP: 130.126.255.*| 热度|

4 武夷山 赵宇翔 章成志 刘淼

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 10:47

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部