大数据环境下多源信息融合的理论与应用探讨
化柏林 李广建
北京大学信息管理系
摘要:[目的/意义]从理论、方法、技术与应用的视角研究大数据环境下的多源信息融合问题。[方法/过程]探索多源信息融合的理论基础与科学依据,梳理多源信息融合的问题与现象,对多源信息融合的技术与方法进行归纳总结,对构建大数据环境下的多源信息融合应用进行探讨。[结果/结论]大数据环境下的多源信息融合理论包括相关性原理、多元表示原理、意义建构理论等,多源信息融合方法包括统一标识、数据比对、异构加权等一系列过程以及多种分析建模方法,多源信息融合在国家层面、城市或行业组织层面、企业机构层面都有着广泛的需求与应用。
关键词:大数据 多源信息融 情报分析
高被引论文与“睡美人”论文引用曲线及影响因素研究
王海燕 马峥 潘云涛 武夷山
中国科学技术信息研究所,中国科学技术发展战略研究院
摘要:[目的/意义]通过对潜在“睡美人”论文的引用分布分析,提炼其特征,以期为“睡美人”论文的预判研究提供思路。[方法/过程]采用引用曲线这一更为直观的反映论文引用分布的方法,以“天文学和天体物理”这一领域为例,构建其10的高被引论文、“睡美人”论文的10-20年被引用数据并进行引文分布的对比分析。[结果/结论]研究发现两类文献的引用曲线模式及特点——高被引论文的持续增长型、显峰型、双峰型、振荡型,“睡美人”论文的持续增长型、显峰型、双峰型、振荡型、稳定型等被引用曲线模式;针对施引文献、研究主题演化方向探讨了各模式引用曲线形成的相关因素,发现两类文献达到引用高峰的时间存在差异。
关键词:引用曲线 高被引论文 “睡美人”论文 天文学和天体物理
本文识别“睡美人”论文的具体计量标准为:论文发表前3年无被引频次,而在此后几年引用频次激增,且在统计时间窗口该论文的总被引频次居当年发表论文被引频次的前30%。
注:这个识别标准有一定的参考价值,但对于不同学科、不同时间段的论文在识别“睡美人”文献时如果根据大量引文数据提出一个定量模型可能更有意义。
转载本文请联系原作者获取授权,同时请注明本文来自魏瑞斌科学网博客。
链接地址:https://wap.sciencenet.cn/blog-113146-928267.html?mobile=1
收藏