(本文发表于《图书情报工作》2021年第8期P107-113)
摘要: [目的/意义] 旨在对大量的中文专利实现快速分类,满足专利审查以及情报分析等工作的要求。[方法/过程] 结合专利文本的固有格式以及存在多个IPC分类号的实际情况,将多示例多标签学习应用于专利自动分类中,在介绍几种经典的多示例多标签模型的基本原理之后,将这些模型运用于中文专利IPC分类号的确定。[结果/结论] 实验证明,多示例多标签模型适合运用在专利的自动分类中,并且从Average precision、Hamming Loss、Ranking Loss、One Error、Coverage、Training time等指标分析可以发现,MIMLRBF模型能快速、准确地运用在中文专利IPC分类号的确定中,为大规模专利的自动分类提供借鉴。
关键词:专利, 分类, IPC分类号, 多示例多标签
链接:多示例多标签学习在中文专利自动分类中的应用研究 http://www.lis.ac.cn/CN/10.13266/j.issn.0252-3116.2021.08.011
2021-多示例多标签学习在中文专利自动分类中的应用研究.pdf
https://wap.sciencenet.cn/blog-39723-1301223.html
上一篇:
四川省图书馆下一篇:
统计源期刊/2020年中国科技核心期刊目录(图书情报与档案管理)