天上人间分享 http://blog.sciencenet.cn/u/terahertz 淡泊明志,宁静致远 liuguifeng29@163.com

博文

一种基于概率潜在语义分析的专利主题标引方法研究

已有 2128 次阅读 2020-8-20 09:27 |个人分类:发表论文|系统分类:论文交流| 专利, 信息, 情报, 文献, 数据

(本文发表于《情报工程》2020年第3期P15-24)


摘要: 为了准确稳定地对专利主题进行标引,本文提出了一种基于概率潜在语义分析的专利主题标引方法。首先建立由共同主题和特定主题所联合起来的混合模型;然后通过这两类主题相关性推断出训练集和测试集特定主题的映射关系;最后选择相似度最高的主题作为专利的主题完成标引。实验结果表明,该方法能较为准确、稳定地对未标记专利进行主题标引。本文尝试将概率潜在语义分析运用到专利文本的标引中,既是对专利标引自动化的一种积极尝试,也为深层次挖掘专利信息情报技术提供了一种新的思路。  

关键词:专利;标引;概率潜在语义;主题


链接:一种基于概率潜在语义分析的专利主题标引方法研究-A Patent Topic Indexing Method Based on Probabilistic Latent Semantic Analysis http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202003002&flag=1 



https://wap.sciencenet.cn/blog-39723-1247090.html

上一篇:2019年图书情报类SSCI期刊影响因子
下一篇:《块数据4.0——人工智能时代的激活数据学》
收藏 IP: 121.248.208.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-2 03:42

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部