武夷山分享 http://blog.sciencenet.cn/u/Wuyishan 中国科学技术发展战略研究院研究员;南京大学信息管理系博导

博文

中国科技信息研究所在美国“发明人名称消歧竞赛”中取得优异成绩

已有 3484 次阅读 2015-12-15 16:10 |个人分类:图书情报学研究|系统分类:博客资讯

中国科学技术信息研究所在美国“发明人名称消歧竞赛”中取得优异成绩

武夷山

 

据《中国科技资源导刊》2015年第5期的报道:

 

2015 9 24 美国专利与商标局USPTO首席经济学家办公室在美国弗吉利亚州USPTO总部举办了旨在提高现有专利发明人名称数据精度的“PatentsView专利发明人名称消歧技术研讨会”。会议期间举行了专利发明人名称消歧竞赛”。此次竞赛的目的是通过设计专利发明人名称消歧算法USPTO收录的近40 19762014 的美国专利发明人数据1239 万条记录进行唯一标识以改进现有的专利发明人标识算法中国科学技术信息研究所派出代表队参加了这次竞赛并凭着在预赛和复赛阶段的突出表现取得了第二名的优异成绩

参加本次专利发明人名称消歧竞赛的代表队分别来自美国比利时澳大利亚德国中国等国家的高等学校和科研机构他们是宾夕法尼亚州立大学美国)、马萨诸塞大学美国)、加州大学圣巴巴拉分校美国)、鲁汶大学比利时)、斯文本科技大学澳大利亚)、欧洲经济研究中心德国)、中国科学技术信息研究所中国在竞赛中中国科学技术信息研究所代表队提出了一套全新的发明人消歧混合算法Mixed Method)。该算法融合了机器学习方法概率记录链接方法规则分类方法以及图聚类方法其核心思想是通过机器学习以及概率链接方法首先划定整个发明人名称匹配对的核心区域然后通过加入分类规则逐步扩张发明人名称匹配对的外部边界在保证计算结果的高准确性同时兼顾了整体算法的稳健性该算法在AWS平台C3.8xlarge实例上的运行时间为7小时经过3轮共计20万数据集的测试该算法的平均精准率Precision达到99.52%平均召回率Recall88.96%左右平均F1值为93.94%中国科学技术信息研究所代表队算法的最终测评结果也优于PatentsView平台目前正在运行的算法

PatentsViewhttp://www.patentsview.org/web/是由USPTO首席经济学家办公室主持开发的一个面向未来的专利检索与分析平台该平台是以提高美国专利数据价值功能及实用功能为目的的可视化分析平台USPTO为实现其数据透明化便利创新者知识产权从业者企业及个人利用专利数据而开发的搜索工具专利发明人消歧问题是目前学术界关注的热点问题通过对发明人名称进行消岐能够提升现有科研绩效评价社会网络分析的准确度也可以为国际人才流动知识溢出等问题提供更为准确的数据支持中国科学技术信息研究所代表团队取得的研究成果将为相关方面的研究工作提供更为精确的数据支持

USPTO全程直播PatentsView发明人名称消歧技术研讨会”。研讨会的视频已上传网站敬请收看视频地址为http://www.uspto.gov/about-us/organizationaloffices/office- policy-and-international-affairs/

patentsview-inventor

杨冠灿 供稿

 

   向中信所的参赛团队表示衷心的祝贺!




https://wap.sciencenet.cn/blog-1557-943573.html

上一篇:马克思谈剽窃(外一则)
下一篇:英语专业的学生打点工,就比我们挣得多----日记摘抄(413)
收藏 IP: 168.160.158.*| 热度|

8 赵美娣 钟炳 李杰 史晓雷 赵星 魏瑞斌 章成志 赵凤光

该博文允许注册用户评论 请点击登录 评论 (4 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-19 14:56

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部