李宏翰
代表性难说,样本量易讲 精选
2022-3-10 23:57
阅读:58081

当前,编制心理量表的主流取向需要进行因素分析——先做探索性因素分析,再做验证性因素分析。由于已有统计软件可以方便地做因素分析,因此,有些研究者不愿系统学习有关原理,只想通过参考有关文献而简单操作并得到结果。其实,因素分析是非常复杂的研究技术,即使无意系统学习有关原理,也得了解一些基本常识,否则,很容易出现误解误用,得出粗制滥造的研究结果。

探索性因素分析是编制心理量表的初级阶段,需要注意的事项较多,这里介绍就是其他心理学研究也需要注意的两个基本问题:样本特征和样本量,它们有关又有别。样本特征涉及的是被试样本的代表性。总体而言,代表性是很难说清楚的问题,而样本量则容易讲明白。

先说样本特征。编制量表研究中,被试样本的代表性并不需要密切代表任何明确界定的总体,只要那些得分高的人和那些得分低的人都有很好的代表性即可(Gorsuch, 1997)。许多学者一贯主张,量表编制研究,应当采用大样本,其中的一个原因是,量表得分由具体被试引起的变异,往往会随样本量的增加而被随机效应所抵消(Tabachnick & Fidell, 2001)。

当然,如果样本不能充分代表目标总体,那么,就会影响因素结构的稳定性和推广性。当所有被试都取自具有某些特征(例如,年龄、教育、社会经济地位、种族)的特定群体时,即使大样本也不足以控制由这些特征而产生的系统变异。可以把这种情况理解为研究的系统误差。因此,明智的作法是,在做探索性因素之前,尽可能保障样本的充分性。

在咨询心理学等研究领域,关于样本特征需要特别注意的是,存在很多潜在的总体,其成员可能难以识别或者难以招募,例如,同性恋者、双性恋者、变性者、残疾者。如果研究者认为样本特征可能与未知的总体特征有差异,那么,他/她就应当考虑得更为周全,选取一个虽不理想但还合适的样本再进行探索性因素分析(Worthington & Navarro, 2003)。

实际上,量表编制与测试,乃至一般的心理学研究,都涉及研究工具、研究过程适当性的问题。例如,测试和研究智力,用的是统一的智力量表,不会对低智力的人再编制一个智力量表。然而,这是一个复杂的问题,很难说如些测试与研究就是合适的或不合适的。对文盲进行一般的智力测量,智商不会太高,但是,他们的智力未必真的低。

在实际的研究中,通常都是便利取样、目的取样或者基于目的的便利取样,例如,以研究者所在单位或所属领域的大学生为取样总体,并且把编制的量表用“大学生”来标识。对照智力研究,可以开放性地思考量表编制的样本特征问题。例如,研究者会编制一个大学生智力量表吗?这样的问题其实是,如何理解人类的心理属性——强调一般性还是强调特殊性?

再讲样本量。显然,样本量是一个在因素分析文献中得到系统讨论的问题。很多学者都意识到,被试太少有两个主要风险:其一,协方差模式可能不稳定,因为被试与题项比(the ratio of participants to items)较低时,随机因素可能在很大程度上影响题项之间的相关;其二,编制量表的样本可能无法充分代表目标总体(DeVellis, 2003)。

研究者经常引用的样本量分类,其实仅仅基于样本中被试的人数,从N=50为“很差”到N=1,000为“很好”,而推荐的因素分析最小样本量是300Comrey, 1973)。也有人提出,最小被试与题项比是5:110:1Gorsuch, 1983),这在咨询心理学研究中广为引用。不过,其他研究者指出,这样的一般性指南可能是误导(例如,Tabachnick & Fidell, 2001)。为什么呢?因素分析结果的稳定性还与其他方面有关。

总体而言,关于量表编制时的样本量,已有共识,即,更大的样本量可以得到变量之间更稳定的相关,从而,探索性因素分析结果的可重复性就更大。这是可以实证研究或模拟研究的问题。例如,Velicer & Fava1998)研究发现,被试与题项比小于3:1,都是不合适的。另有研究表明,因素饱和度(factor saturation,即,一个因素的题项数)与题项共同度(item communality,即,一个题项在所有因素上的载荷平方和)是样本量充足性的最重要决定因素(MacCallum et al., 1999)。

有人提出了探索性因素分析时,判定样本量是否充足的4个总体指南:(1)在大多数情况下,样本量=300就足够了;(2)对于共同度>.50的数据,或者对于题项与因素比(the ratio of items to factors=10:1并且因素载荷为|.40|左右的数据,样本量为150~200就足够了;(3)如果所有题项的共同度都.60,或者题项与因素比4:1,并且因素载荷>|.60|,那么,较小的样本量也是合适的;(4)如果样本量<100,或者被试与题项的比<3:1,那么,这样的样本量是不合适的(Thompson, 2004)。

显然,共同度、题项的因素载荷、题项与因素比,都是探索性因素分析的结果,因此,上述指南提示,研究者在测试前应当设定一个最小的样本量,在初始探索性因素分析结果的基础上,评估样本量是否足够,从而,确定是否需要收集额外的数据。

在实际的研究中,研究者确定样本量时,往往只考虑两个方面,即样本量的绝对数量、被试与题项的比。这是不合适的。当然,现在可以进行线上测试,从而,招募更多被试比以前容易多了,编制量表时样本量不足的问题,也逐渐消解了。

总之,在进行探索性因素分析前需要考虑被试特征,即代表性问题,在分析前、分析中和分析后,都需要考虑样本量问题。

参考文献

Comrey, A. L. (1973). A First Course in Factor Analysis. New York: Academic Press.

DeVellis, R. F. (2003). Scale Development: Theory and Applications (2nd ed.). Thousand Oaks, CA: Sage.

Gorsuch, R. L. (1983). Factor Analysis (2nd ed.). Hillsdale, NJ: Lawrence Erlbaum.

Gorsuch, R. L. (1997). Exploratory factor analysis: Its role in item analysis. Journal of Personality Assessment, 68, 532-560.

MacCallum, R. C., Widaman, K. F., Zhang, S., & Hong, S. (1999). Sampel size in factor analysis. Psychological Methods, 4, 84-99.

Tabachnick, B. G., & Fidell, L. S. (2001). Using Multivariate Statistics (4th ed.). New York: Harper & Row.

Thompson, B. (2004). Exploratory and Confirmatory Factor Analysis: Understanding Concepts and Applications. Washington, DC: American Psychological Association.

Velicer, W. F., & Fava, J. L. (1998). Effects of variable and subject sampling on factor pattern recovery. Psychological Methods, 3, 231-151.

Worthington, R. L., & Navarro, R. L. (2003). Pathways to the future: Analyzing the contents of a content analysis. The Counseling Psychologist, 31, 85-92.

转载本文请联系原作者获取授权,同时请注明本文来自李宏翰科学网博客。

链接地址:https://wap.sciencenet.cn/blog-2619783-1328886.html?mobile=1

收藏

分享到:

当前推荐数:18
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?