||
数字资源统计标准与规范是围绕数字资源的全生命周期管理制定的一套系统性规则,旨在确保资源的质量、可访问性、安全性及可持续利用。她在高校图书馆工作中很重要。笔者曾在科学网图谋博客发布系列博文(见延伸阅读),有个人的观察与思考,有以“圕人堂话题”组织的专题讨论,有相关研究成果的专题摘编(科学普及),有高校图书馆同行的观察与思考。
COUNTER(Counting Online Usage of NeTworked Electronic Resources) 是由全球图书馆、出版商和学术机构共同制定的电子资源使用统计国际标准,旨在解决学术出版领域长期存在的“数据孤岛”问题。其核心目标是通过统一的统计方法论和数据格式规范,实现图书馆与出版商之间资源使用数据的可对比性、可验证性和可重复性,为电子资源采购、评估和优化提供科学依据。5.1版(发布于2023年5月5日)于2025年1月起正式成为现行《实践准则》,并作为符合COUNTER标准的要求生效。多家数据库商从 2025 年 1 月起提供版本 5.1 格式的数据。
COUNTER是具有代表性的数字资源使用统计国际标准。近日笔者重点考察了Elsevier(E-PIC)、Springer Nature、IEEE、中国知网的使用统计模块动态。前两家已从从 2025 年 1 月起提供版本 5.1 格式的数据,后两家目前尚未提供。个人认为,Elsevier在使用统计方面,较为全面系统地贯彻与落实COUNTER,是做的最好的。种种原因,专业化、标准化、规范化可谓“道阻且长”“任重道远”,一言难尽。具体的实践探索,单单是每家每户的统计模块较为系统地体验一下,需要花不少时间和精力,倘若需要进一步与数据库商方面沟通与反馈,更需要劳心劳神。某种意义上,我还算是幸运者,有幸可以多接触一些、多了解一些、多分享一些。
当前有一种“偷懒”的方法,借助生成式AI可以快速、高效归纳与总结。笔者使用“文心4.5 Turbo”解答“高校图书馆数字资源统计标准与规范实施的重点与难点”,答案并不完美,但确实具有较高参考价值。
1 实施重点
1.1 统计指标体系与技术应用
核心指标覆盖:需建立涵盖下载量(全文、章节)、访问量(点击、浏览)、检索次数、参考文献引用量等关键指标,并通过Web服务器工具(如Google Analytics)、代理服务器日志分析及数据库自带统计功能(如CNKI、万方)实现数据采集。
学术影响力评估:利用引文索引数据库(如Web of Science、Scopus)统计数字资源在学术文献中的引用次数,评估资源学术价值。
技术整合:采用端口镜像技术采集校园网核心交换机数据流量,过滤无关信息,确保统计真实性;通过WebVPN统一资源访问入口,解决外网访问难题,并支持用户行为统计(如山东大学案例)。
1.2 数据质量与标准化管理
统一计量标准:按数据库最小销售单元计量,避免重复统计;混合型数据库需拆分电子图书、期刊等类型分别计量,但数据库个数不重复计算。
动态馆藏管理:购买永久使用权的资源纳入馆藏计量,未购买的按使用权期限纳入,过期后扣除;二次文献数据库暂不换算为馆藏册数。
数据清洗与验证:建立数据清洗流程,剔除冗余或错误数据,通过日志分析(如用户IP、访问时间)验证数据真实性。
1.3 技术解决方案与系统升级
访问控制与安全:引入CAS接口实现单点登录,提升系统稳定性与用户并发能力(如山东大学支持999个并发用户);采用动态黑名单和恶意下载检测,自动禁止异常访问行为。
跨平台兼容性:确保统计系统兼容多终端(如PC、移动端),支持LDAP/RADIUS等认证系统,实现内外网用户统一身份管理。
1.4 法律合规与隐私保护
著作权合规:遵守《著作权法》,明确资源合理使用范围(如个人学习、科研目的),避免侵权;与出版商签订合同,规范资源使用权限。
违规使用处罚:制定恶意下载、账号共享等违规行为处理办法(如太原师范学院图书馆对违规者封禁账号、追究赔偿责任)。
隐私保护:加密存储用户行为日志,限制访问权限,避免个人信息泄露。
1.5 人员培训与制度保障
专业能力提升:定期培训统计人员,强化统计知识、计算机操作及数据分析能力;引进专职统计人员,或由各部门兼职人员承担统计任务(如采编部负责图书入库统计)。
标准化流程制定:建立数据采集、处理、分析的标准化流程,确保数据持续积累与可比性;制定统计制度,明确人员职责与考核机制。
2 实施难点
2.1 技术整合与成本压力
多系统数据孤岛:图书馆管理系统(如采访、编目系统)与学术资源平台(如CNKI、Web of Science)数据格式不统一,整合难度大。
技术升级成本高:引入WebVPN、CAS认证等技术需对接现有系统(如LDAP/RADIUS),增加硬件投入与维护成本。
2.2 数据安全与隐私风险
用户行为溯源难:恶意下载行为需结合日志分析、IP追踪等技术,但用户可能使用代理服务器隐藏身份。
数据泄露风险:用户访问记录、检索关键词等敏感信息需加密存储,防止内部人员滥用或外部攻击。
2.3 标准化与跨部门协作障碍
缺乏国家统一标准:各馆分类编目方法不一(如“中图法”与“科图法”并存),导致馆际数据不可比。
部门利益冲突:学院资料室与图书馆统计口径不一致,数据共享意愿低,影响全校资源配比优化。
2.4 法律合规复杂性
资源授权许可模糊:混合型数据库需明确电子图书、期刊的计量规则,避免与出版商产生纠纷。
违规使用界定难:如“连续下载”需结合出版商报告与校内行为日志,但判断标准主观性强。
2.5 人员与制度瓶颈
统计人员素质参差不齐:部分人员缺乏统计知识或计算机技能,导致数据采集错误或分析浅显。
领导重视不足:统计工作被视为“辅助性任务”,缺乏人力与制度保障,数据真实性受影响(如临时造假应付检查)。
3 突破路径
技术层面:研发跨平台数据整合中间件,降低整合成本;采用区块链技术追溯数据流转,提升安全可信度。
标准层面:推动国家层面制定高校图书馆数字资源统计标准,统一计量单位与分类方法。
法律层面:完善资源授权许可模板,明确使用权限与违规处理条款;建立出版商-图书馆联合监管机制。
管理层面:将统计工作纳入图书馆绩效考核,设立专职统计岗位;开展跨部门数据共享培训,提升协作意愿。
经济层面:申请技术升级专项经费,降低高校成本压力;引入第三方统计服务机构,提供专业化支持。
延伸阅读:
科学网图谋博客相关博文辑录
(1)关于数据库种数统计的思考.https://blog.sciencenet.cn/blog-213646-1275385.html
2021-3-7 09:12
(2)高校图书馆电子资源现行统计指标对比分析.https://blog.sciencenet.cn/blog-213646-1305264.html
2021-9-22 17:51
图谋摘编自:熊霞,高凡,李睦,何雪梅,胡秀梅.高校图书馆电子资源统计指标体系设计与构建 .大学图书馆学报,2021,39(03):59-66.
(3)关于数字资源统计的思考.https://blog.sciencenet.cn/blog-213646-1305474.html
2021-9-24 09:29
(4)关于高校数据库利用统计的思考.https://blog.sciencenet.cn/blog-213646-1376535.html
2023-2-16 17:30
(5)关于图书馆统计与评价的思考.https://blog.sciencenet.cn/blog-213646-1401725.html
2023-9-6 17:08
(6)圕人堂话题:数字资源利用统计与绩效评价.https://blog.sciencenet.cn/blog-213646-1412301.html
2023-12-3 22:41
(7)圕人堂话题:数字资源统计标准与规范.https://blog.sciencenet.cn/blog-213646-1450140.html
2024-9-8 08:32
(8)图漾:电子资源访问量统计标准与规范之我见.https://blog.sciencenet.cn/blog-213646-1450706.html
2024-9-11 16:26
图谋按: 《圕人堂话题:数字资源统计标准与规范》( https://blog.sciencenet.cn/blog-213646-1450140.html )发布后,圕人堂群成员图漾老师进行了进一步深入思考与总结。
(9)COUNTER 5.1使用统计报告学习笔记.https://blog.sciencenet.cn/blog-213646-1483335.html
2025-4-25 08:47
(图谋注:上述博文可以根据标题检索“圕人堂libchat”微信公众号中同题推文阅读全文。)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-4-29 14:31
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社