樊超的学术博客分享 http://blog.sciencenet.cn/u/supermac 让思维随车轮转动

博文

关于相关性的几个统计量

已有 17416 次阅读 2014-8-23 11:32 |个人分类:科研资料|系统分类:科研笔记| 统计, 相关性

关于相关性的几个统计量

在数据的统计分析中经常需要判断两个统计量之间的相关性是否显著,特别地,在大数据时代,相关性比因果性受到了更多的关注和讨论。那么如何判断两个统计量之间的相关性呢?在我们最近的工作中用到了Pearson系数、Spearman系数、Point-biserial相关系数和Biserial相关系数,其中前二者和后二者分别成对。这两组相关系数的区别和联系如下:

l 关于Pearson相关系数和Spearman相关系数

二者的区别在于:前者是product-moment correlation,基于均值和标准差,度量的是两个变量之间的线性相关性,并且默认变量服从正态分布;而Spearman是基于排序的rank correlation,则没有这个限制,属于非参数统计方法,对原始变量分布不作要求,可以度量变量之间的非线性相关性。故在使用前应先考察各个变量的概率分布,绘制散点图观察两个变量之间的关联性,再选择合适的度量指标。

l 关于Point-biserial相关系数和Biserial相关系数

Point-biserial correlation coefficient用于度量一个自然区分的二元变量和一组间隔尺度之间的相关程度,例如学生的性别(0-1,自然区分)和成绩(离散变量)之间的相关性;而 Biserial correlation coefficient 用于度量一个人工区分的二元变量和一组间隔尺度之间的相关程度,例如中期考核(离散变量百分制)和期末成绩(分ABCDEA-D为通过,E为不通过,人工区分)。

l 几种相关系数

Types of Correlation Coefficients

Correlation Coefficient

Types of Scales

Pearson product-moment

Both scales interval (or ratio)

Spearman rank-order

Both scales ordinal

Phi

Both scales are naturally dichotomous (nominal)

Tetrachoric

Both scales are artificially dichotomous (nominal)

Point-biserial

One scale naturally dichotomous (nominal), one scale interval (or ratio)

Biserial

One scale artificially dichotomous (nominal), one scale interval (or ratio)

Gamma

One scale nominal, one scale ordinal

 

资料:

Pearson R: http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient  

Spearman R: http://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coefficient 

Point-biserial: http://en.wikipedia.org/wiki/Point-biserial_correlation_coefficient 

Difference between Point-biserial and Biserial: http://jalt.org/test/bro_12.htm

An example of how to perform Point Biserial Correlation Test in SPSS: https://www.youtube.com/watch?v=76ipx-ta8FY

机器学习中的相似性度量:

http://amberlife.net/2012/06/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E4%B8%AD%E7%9A%84%E7%9B%B8%E4%BC%BC%E6%80%A7%E5%BA%A6%E9%87%8F/



https://wap.sciencenet.cn/blog-419840-821646.html

上一篇:人动笔记4(长程相关性)
下一篇:签到行为的可预测性及影响因素分析
收藏 IP: 182.131.19.*| 热度|

3 强涛 黄盼华 王满喜

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 03:20

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部