最近准备搞点词表互操作的东西,但中间有点疑问,那就是搞互操作的意义。国外互操作是搞得如火如荼,国内是冷冷清清?是驱动问题还是体制问题?
词表互操作很大一个作用就是解决分布式资源的一站式检索问题,而这大多是针对采用词表进行过规范加工的资源,且是多由不同单位使用不同词表加工的资源。从手边掌握的一些信息看,国外对于资源的深度标引加工还是比较重视的,甚至一些学科资源网关中对网页资源都进行了规范加工。但在中文资源中貌似这种加工情况比较简单,似乎加工层次和加工范围都相对比较狭窄,比如直到书和刊进行规范加工,而对具体的期刊论文采用的是自由标引或不标引;加工对象仍是学术出版物,对于网络资源热情不够,中科院的几个主题网关似乎很久没有更新了,其他的一些网关也只是做了简单的元数据,根本没有做到采用某部词表或分类法来组织揭示。
另外,公共图书馆和高校图书馆系统的编目工作似乎只使用《中图法》和《中分表》两大词表,各种词表百花齐放的情形在国内信息机构表现的不是很明显,竟然使用的词表都是统一的,互操作看来只能是自然语言与受控语言的映射了,而目前国外的互操作技术更强调的是受控词表之间的互操作,技术上有一定的区别。
基于这样一种情况:词表相对单一集中,资源加工情况简单,还有必要做中文词表的互操作研究吗?抑或可以考虑做做中文与外文词表的映射?很迷茫,没有明确的应用,做起来有点摸不着北了!
https://wap.sciencenet.cn/blog-110726-222622.html
上一篇:
动一动的勇气下一篇:
[转载]——世界上最美的图书馆