|
统计学广泛应用于科学学研究中,但经常有一些误用导致研究结果不合理或不可重复。为此JDIS策划推出“科学学中的统计学”专辑,旨在为领域内统计学的正确使用提供指导和参考。
科学学中双重差分(DID)回归的实践操作与理论基础
近几十年来,随着大规模科学语料数据集的可用,双重差分法(DID)在科学学和文献计量学研究中得到越来越多的应用。DID方法可以在多个假设,特别是共同趋势假设都成立的情况下输出无偏估计。作者系统地论证了DID在科学学中的应用,并提出了提高DID方法精度的潜在途径。
断点回归(RDD)的应用
随着大规模学术数据集的可用,各个领域的科学家开始希望了解科学背后的潜在机制,于是形成了“科学学”这样一个充满活力的新领域。由于科学学研究结果往往具有强烈的政策含义,因此理解变量之间的因果关系就变得尤为重要。然而,所有因果推断方法中最可信的准实验方法,也是实证研究中非常有价值的一个工具——断点回归设计(RDD)——却尚未在科学学领域充分利用。本文就旨在系统阐述RDD方法在科学学中的应用。
文章首先介绍了RDD的基本假设、数学符号以及两种类型的RDD,即清晰RDD和模糊RDD。其次使用Web of Science和Microsoft Academic Graph数据集研究RDD论文的演变和引用模式。此外,文章还综述了RDD方法在各个科学领域以及科学学中的应用。最后,以一个实际案例提供了RDD实操指南。
查看全文请点击:
基于回归统计控制的因果推断:来自计量经济学的启示
回归分析是经济学研究中广泛使用的一种工具。在观察性研究中,基于一些假设,回归分析统计控制方法试图通过添加控制变量来分析治疗和结果之间的因果关系。然而,这种方法可能无法产生可靠的因果效应估计值。除了方法本身的缺陷外,还与经济学中模糊的表述有关,比如选择性偏差的定义、核心控制变量的选择以及鲁棒性测试的方法等。在因果模型框架内,文章阐明了基于回归分析的统计控制的因果推断假设,讨论了如何选择核心控制变量以满足这种假设,并对回归估计进行鲁棒性测试。
查看全文请点击:
关于会议论文和期刊论文的差别,以往有很多研究立足作者、引用、h指数等单独角度展开探讨。本文对多个角度之间的联系和交互进行了系统考察。
作者采用贝叶斯网络来探究计算机科学领域会议论文和期刊论文之间的差异,这是一种可以模拟网络中所有变量之间关系的知识表征框架。文章定义了贝叶斯网络建模所需的变量,基于Aminer数据集(计算机科学领域的文献数据集)计算了每个变量的值。通过学习贝叶斯网络,并根据网络推理发现,会议对高级学者更具吸引力,会议论文的学术影响略高于期刊论文,但会议论文是否比期刊论文更具创新性尚不确定。
查看全文请点击:
Mingyue Sun, Mingliang Yue, Tingcan Ma†.(2023).Differences between journal and conference in computer science: a bibliometrics view based on Bayesian network. Journal of Data and Information Science, https://doi.org/10.2478/jdis-2023-0017
关于JDIS: JDIS面向整个科学界,以荟萃使用跨学科方法和大型数据集来研究科学研究本身的基础机制为使命,以加深各界对科学主体(科学家、科研机构、国家等)之间相互作用的定量理解为愿景,为促进科学创新提供工具和决策参考。 ImpactFactor:1.5,13/77 CiteScore:3.6,Q1 投稿:www.jdis.org 联络:jdis@mail.las.ac.cn
主要发表以科学研究和创新活动本身为研究对象的数据挖掘和决策支持相关文章,例如科学学、循证决策、科研评价、科学计量学/信息计量学/文献计量学等,收文类型包括原创研究、综述、观点、通讯、笔记等八种长短文。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-4-28 06:40
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社