科学网

 找回密码
  注册
专利引文数量到底有多少?
热度 1 杨冠灿 2013-8-8 10:41
最近,大数据一词炒的很热,我不知道专利数据是否能算做大数据,但我认为是很接近的。 原因有几条: 1. 专利数据很复杂,远超过论文数据库的信息复杂度。 2. 上百年来积累的数据量也不小。根据PATSTAT的统计(不含全文),题录数据约包含170G(截止2013年6月)。 3. 其中,包括技术分类、法律状态、引文数据、专利权人 ...
个人分类: 专利|5580 次阅读|2 个评论 热度 1
中国专利质量观察——利用专利家族(三国)指标
热度 1 杨冠灿 2013-8-1 21:19
专利质量评价中最通用的三个指标是专利引文、专利持续时间以及专利家族,分别代表影响力、时间以及空间范围。引文更多反映了技术的影响力,而持续时间和专利家族本质上反映了专利权人投入的成本(或者说是收益预期) 但是真实的专利家族评价过程中,并不能简单的依据专利家族的数量大小来评价,如在20个国家获得授权 ...
个人分类: 专利|4297 次阅读|2 个评论 热度 1
patstat 数据库结构
热度 1 杨冠灿 2013-7-28 18:35
PATSTAT是当前世界上收录最全,且专门面向专利分析人员、统计决策人员、高级研究人员的专利数据库。 该数据库的主要特点在于: 数据来源超过100个国家; 包含6000万专利申请和3000万专利授权(包括PCT申请) 还有一个特点,它是以CAV格式保存的,与DOCDB的XML格式有所区别。 一句话够全。 其数据库结构如下: ...
个人分类: 专利|8443 次阅读|2 个评论 热度 1
EXCEL删除重复项的做法
热度 1 杨冠灿 2013-7-17 17:53
在EXCEL中删除行的重复项比较好处理,EXCEL有专门的工具辅助处理,在数据》数据工具》删除重复项就可以解决。但​删除列的重复项则没有对应简易的处理方法,今天初步找了一种方法。 数据如下: 比如共分类号: 表单1 B05N B05N B22C B29C B05N H02J H02J F16G C23G H01M B41J B41J 可以采用如下的函数,单 ...
个人分类: 专利|3504 次阅读|1 个评论 热度 1
美国专利号的一些标签特征
杨冠灿 2013-7-17 11:14
专利号不仅仅是一个数字编码,从专利号上是可以观察到许多特征的。 U.S. Application Series Codes Code: Filing Dates: 02 Filed prior to January 1, 1948 03 January 1, 1948 through December 31, 1959 04 January 1, 1960 through December 31, 1969 05 January 1, 1970 through December 31, 1978 06 January ...
个人分类: 专利|5007 次阅读|没有评论
利用专利引文网络做出的“烟花“图
热度 3 杨冠灿 2013-5-15 23:27
最近用一个自己使用的专利数据做了一张烟花图。效果不错吧。 专利数据一并附送,有喜欢的可以自己试一下。 CIT2.txt 该数据为美国专利引文数据,其中包含了1426项专利,2474条边。 1. “烟花图”部分图 2. “烟花图”全图 3. “烟花图”核心的另一种展示 哈哈,做这个图只是想试下效果。并不用于做科学 ...
个人分类: 专利|5229 次阅读|5 个评论 热度 3

本页有 4 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-30 02:54

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部