天上人间分享 http://blog.sciencenet.cn/u/terahertz 淡泊明志,宁静致远 liuguifeng29@163.com

博文

基于多示例学习框架的专利文本分类方法研究

已有 2538 次阅读 2018-11-26 16:43 |个人分类:发表论文|系统分类:论文交流| 专利, 文本, 分类, 论文, 期刊

(本文发表于《情报理论与实践》2018年第11期)

摘要 [目的/意义]为了满足对海量专利数据进行自动分类的需求,提出了一种基于多示例学习框架的专利文本分类方法。[方法/过程]将专利文本当作包,专利文本的标题和摘要分别作为两个示例,通过数学建模将专利文本映射成无向图,构建基于无向图的高斯核函数,运用SVM方法训练分类器,完成对无标记专利文本的预测。[结果/结论]实验结果表明,该方法相较于传统的SVM、KNN方法能更加有效准确地预测未标记专利文本的分类,为文本挖掘领域相关方向的研究提供新的视角。[局限]实验样本数量有待进一步丰富。

关键词 : 专利文本分类,  多示例学习,  分类方法,  支持向量机  


链接:基于多示例学习框架的专利文本分类方法研究  http://www.itapress.cn/CN/abstract/abstract515.shtml 



https://wap.sciencenet.cn/blog-39723-1148389.html

上一篇:高校科研数据管理与共享政策的案例与执行模型研究
下一篇:基于复杂网络理论的图书借阅分析
收藏 IP: 221.6.159.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-22 14:30

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部