李宏翰
关于标准:最爱最恨都是你 精选
2021-4-18 23:57
阅读:82896

心理学研究中,特别是在统计分析的时候,会遇到各种标准问题。这些标准,很容易成为研究者的最爱,并且熟记于心,做研究时期盼获得的结果符合标准。同时,如果结果没有达到标准,那么,这些标准就是研究者的苦闷来源,又成了他们的最恨。

心理学研究者,倾向于严格遵照标准行事。不过,使用标准的前提是,了解这类标准究竟是什么,它们是怎么制定出来的。

简单而言,心理学研究中存在的标准,其实是有关领域的研究先驱,在工作中感到需要有一定的标准,于是他们就提出或建议各种标准。这些标准在制定时虽然是有一定依据的,然而,有关依据可能深受某个或某些研究先驱偏好或直觉的影响。

现实情况是,如果没有标准,研究者可能还会认真思考有关问题,而一旦有了标准,研究者倾向于直接采用这些标准,基本不再考虑具体情况。这就陷入一种状态,即,研究者在实际工作中,没有标准想要标准,有了标准会把标准固定下来,很难具体问题具体分析了。

在心理学研究中,常见的标准有:统计显著性检验的p值、因素分析的特征根、信度指标的克隆巴赫α系数、结构方程模型的拟合指数。这里以p值和α系数为例,简介有关问题(其他情况,以后再说)。

先讲统计显著性检验的p值标准。

按照统计学上的说法,p值是指在零假设为真时,获得与目前样本相同或者更为极端的结果的概率。p < 0.05就是在零假设为真时,获得与目前样本相同或者更为极端的结果的概率< 0.05。因为概率< 0.05是个小概率事件,在一次试验中基本不可能发生,所以拒绝零假设,接受备择假设。(所谓零假设,就是没有差异的假设——有的文献也译为虚无假设,我认为不准确,也很费解。所谓备择假设,就是否定零假设的陈述,通常正是研究假设。)

为什么把统计性显著的两个常用标准定为p < 0.05p < 0.01呢?如果定为p < 0.06p < 0.02又如何?其实,这里的p < 0.05p < 0.06并无实质性差异,p < 0.01p < 0.02也是这样,之所以定为p < 0.05p < 0.01,那是统计学家Fisher的偏好(显然,也是一般人的偏好,即人们更喜欢15这样的数字)。

其实,在不同的情况下,应该采用不同的统计显著性水平标准为了防止假阳性的研究结果,一些专家建议,采用p < 0.005的标准。资料显示,粒子物理学研究统计显著性准是p < 0.0000005

同时,很多人也不知道:在tF检验中,p < .05p ≤ .05是完全一样的,即p < .05的表达包含了p = .05的情况(原来的文献中,就是写为p ≤ .05)——只要了解这里的p表示的是连续变量的概率,就清楚p < .05等价于 p ≤ .05

再讲信度指标的克隆巴赫α系数标准

这个系数反映的是一个测验所有可能的分半信度的平均数。它基本上是用来代替分半信度的,因为它评估所有项目(而非比较测验的两半)的平均相关,并且考虑了测验长度(即测验中的题目数)。所以,如果报告了一个测验的克隆巴赫α系数,就不用再报告分半信度(重测信度往往是需要检验和报告的。)

克隆巴赫α系数的最大值为1,大的数值表示更高的内部一致性。按照惯例,大于0.7的克隆巴赫α系数是可接受的。低的克隆巴赫α系数表明测验是不可靠的,因为测验项目测量的不是相同的内容。

然而,把克隆巴赫α系数定为大于0.7为可接受标准,其实并无理论依据,它是一位研究者(并非克隆巴赫)凭直觉确定并沿用下来的——这是标准带有随意性的典型例子。

因此,如果心理学家用测验做出重要决定,那么,克隆巴赫α系数应当在0.8以上,甚至是0.9。低的克隆巴赫α系数意味着测验可能不可靠,从而用这样的测量工具得到的任何结果和结论都可能是无效的。

特别地,如果一个测验的内部一致性太低,计算出的克隆巴赫α系数甚至是负的。

但是,如果一个测验的克隆巴赫α系数很大(比如,0.95以上),那么就应当警惕。此时,这个测验中的项目过于类似了。例如,倘若一个责任感测验的项目包括“我总是准时上班”、“我总是准时约会”、“我总是准时与家人共进午餐”等项目,那么就会得到很高的克隆巴赫α系数,因为此时在评估一个含义极窄的特质:这个测验实际上在测量守时性,而非研究者更感兴趣的含义更广的责任感。

总之,心理学研究中的标准,其实是需要研究者灵活掌握和使用的,不能陷于机械和僵化。

转载本文请联系原作者获取授权,同时请注明本文来自李宏翰科学网博客。

链接地址:https://wap.sciencenet.cn/blog-2619783-1282653.html?mobile=1

收藏

分享到:

当前推荐数:14
推荐到博客首页
网友评论4 条评论
确定删除指定的回复吗?
确定删除本博文吗?