博文

代表性难说，样本量易讲精选

已有 57012 次阅读 2022-3-10 23:57 |系统分类:科研笔记

当前，编制心理量表的主流取向需要进行因素分析——先做探索性因素分析，再做验证性因素分析。由于已有统计软件可以方便地做因素分析，因此，有些研究者不愿系统学习有关原理，只想通过参考有关文献而简单操作并得到结果。其实，因素分析是非常复杂的研究技术，即使无意系统学习有关原理，也得了解一些基本常识，否则，很容易出现误解误用，得出粗制滥造的研究结果。

探索性因素分析是编制心理量表的初级阶段，需要注意的事项较多，这里介绍就是其他心理学研究也需要注意的两个基本问题：样本特征和样本量，它们有关又有别。样本特征涉及的是被试样本的代表性。总体而言，代表性是很难说清楚的问题，而样本量则容易讲明白。

先说样本特征。编制量表研究中，被试样本的代表性并不需要密切代表任何明确界定的总体，只要那些得分高的人和那些得分低的人都有很好的代表性即可（Gorsuch, 1997）。许多学者一贯主张，量表编制研究，应当采用大样本，其中的一个原因是，量表得分由具体被试引起的变异，往往会随样本量的增加而被随机效应所抵消（Tabachnick & Fidell, 2001）。

当然，如果样本不能充分代表目标总体，那么，就会影响因素结构的稳定性和推广性。当所有被试都取自具有某些特征（例如，年龄、教育、社会经济地位、种族）的特定群体时，即使大样本也不足以控制由这些特征而产生的系统变异。可以把这种情况理解为研究的系统误差。因此，明智的作法是，在做探索性因素之前，尽可能保障样本的充分性。

在咨询心理学等研究领域，关于样本特征需要特别注意的是，存在很多潜在的总体，其成员可能难以识别或者难以招募，例如，同性恋者、双性恋者、变性者、残疾者。如果研究者认为样本特征可能与未知的总体特征有差异，那么，他/她就应当考虑得更为周全，选取一个虽不理想但还合适的样本再进行探索性因素分析（Worthington & Navarro, 2003）。

实际上，量表编制与测试，乃至一般的心理学研究，都涉及研究工具、研究过程适当性的问题。例如，测试和研究智力，用的是统一的智力量表，不会对低智力的人再编制一个智力量表。然而，这是一个复杂的问题，很难说如些测试与研究就是合适的或不合适的。对文盲进行一般的智力测量，智商不会太高，但是，他们的智力未必真的低。

在实际的研究中，通常都是便利取样、目的取样或者基于目的的便利取样，例如，以研究者所在单位或所属领域的大学生为取样总体，并且把编制的量表用“大学生”来标识。对照智力研究，可以开放性地思考量表编制的样本特征问题。例如，研究者会编制一个大学生智力量表吗？这样的问题其实是，如何理解人类的心理属性——强调一般性还是强调特殊性？

再讲样本量。显然，样本量是一个在因素分析文献中得到系统讨论的问题。很多学者都意识到，被试太少有两个主要风险：其一，协方差模式可能不稳定，因为被试与题项比（the ratio of participants to items）较低时，随机因素可能在很大程度上影响题项之间的相关；其二，编制量表的样本可能无法充分代表目标总体（DeVellis, 2003）。

研究者经常引用的样本量分类，其实仅仅基于样本中被试的人数，从N=50为“很差”到N=1,000为“很好”，而推荐的因素分析最小样本量是300（Comrey, 1973）。也有人提出，最小被试与题项比是5:1或10:1（Gorsuch, 1983），这在咨询心理学研究中广为引用。不过，其他研究者指出，这样的一般性指南可能是误导（例如，Tabachnick & Fidell, 2001）。为什么呢？因素分析结果的稳定性还与其他方面有关。

总体而言，关于量表编制时的样本量，已有共识，即，更大的样本量可以得到变量之间更稳定的相关，从而，探索性因素分析结果的可重复性就更大。这是可以实证研究或模拟研究的问题。例如，Velicer & Fava（1998）研究发现，被试与题项比小于3:1，都是不合适的。另有研究表明，因素饱和度（factor saturation，即，一个因素的题项数）与题项共同度（item communality，即，一个题项在所有因素上的载荷平方和）是样本量充足性的最重要决定因素（MacCallum et al., 1999）。

有人提出了探索性因素分析时，判定样本量是否充足的4个总体指南：（1）在大多数情况下，样本量=300就足够了；（2）对于共同度>.50的数据，或者对于题项与因素比（the ratio of items to factors）=10:1并且因素载荷为|.40|左右的数据，样本量为150~200就足够了；（3）如果所有题项的共同度都≥.60，或者题项与因素比≥4:1，并且因素载荷>|.60|，那么，较小的样本量也是合适的；（4）如果样本量<100，或者被试与题项的比<3:1，那么，这样的样本量是不合适的（Thompson, 2004）。

显然，共同度、题项的因素载荷、题项与因素比，都是探索性因素分析的结果，因此，上述指南提示，研究者在测试前应当设定一个最小的样本量，在初始探索性因素分析结果的基础上，评估样本量是否足够，从而，确定是否需要收集额外的数据。

在实际的研究中，研究者确定样本量时，往往只考虑两个方面，即样本量的绝对数量、被试与题项的比。这是不合适的。当然，现在可以进行线上测试，从而，招募更多被试比以前容易多了，编制量表时样本量不足的问题，也逐渐消解了。

总之，在进行探索性因素分析前需要考虑被试特征，即代表性问题，在分析前、分析中和分析后，都需要考虑样本量问题。

参考文献

Comrey, A. L. (1973). A First Course in Factor Analysis. New York: Academic Press.

DeVellis, R. F. (2003). Scale Development: Theory and Applications (2nd ed.). Thousand Oaks, CA: Sage.

Gorsuch, R. L. (1983). Factor Analysis (2nd ed.). Hillsdale, NJ: Lawrence Erlbaum.

Gorsuch, R. L. (1997). Exploratory factor analysis: Its role in item analysis. Journal of Personality Assessment, 68, 532-560.

MacCallum, R. C., Widaman, K. F., Zhang, S., & Hong, S. (1999). Sampel size in factor analysis. Psychological Methods, 4, 84-99.

Tabachnick, B. G., & Fidell, L. S. (2001). Using Multivariate Statistics (4th ed.). New York: Harper & Row.

Thompson, B. (2004). Exploratory and Confirmatory Factor Analysis: Understanding Concepts and Applications. Washington, DC: American Psychological Association.

Velicer, W. F., & Fava, J. L. (1998). Effects of variable and subject sampling on factor pattern recovery. Psychological Methods, 3, 231-151.

Worthington, R. L., & Navarro, R. L. (2003). Pathways to the future: Analyzing the contents of a content analysis. The Counseling Psychologist, 31, 85-92.

转载本文请联系原作者获取授权，同时请注明本文来自李宏翰科学网博客。
链接地址：https://wap.sciencenet.cn/blog-2619783-1328886.html

上一篇：要编制量表，用因素分析
下一篇：能否成因素，需统计检验

收藏 IP: 220.173.127.*| 热度|

moralscience的个人博客分享 http://blog.sciencenet.cn/u/moralscience

博文

代表性难说，样本量易讲精选

当前推荐数：18 推荐人：侯丹 李世斌 杨韩 王平平 陈波 郑永军 杨正瓴 曹俊兴 罗春元 张晓良 孙颉 宁利中 杜占池 张俊鹏 李毅伟 王启云 何应林 马鸣

该博文允许注册用户评论请点击登录评论 (0 个评论)

李宏翰

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

moralscience的个人博客分享 http://blog.sciencenet.cn/u/moralscience

博文

代表性难说，样本量易讲 精选

当前推荐数：18 推荐人： 侯丹 李世斌 杨韩 王平平 陈波 郑永军 杨正瓴 曹俊兴 罗春元 张晓良 孙颉 宁利中 杜占池 张俊鹏 李毅伟 王启云 何应林 马鸣

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

李宏翰

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

代表性难说，样本量易讲精选

当前推荐数：18 推荐人：侯丹李世斌杨韩王平平陈波郑永军杨正瓴曹俊兴罗春元张晓良孙颉宁利中杜占池张俊鹏李毅伟王启云何应林马鸣

该博文允许注册用户评论请点击登录评论 (0 个评论)