Minwu的个人博客分享 http://blog.sciencenet.cn/u/Minwu

博文

P值为何这样计算?统计检验的一个基础问题。

已有 15576 次阅读 2014-2-20 14:04 |系统分类:教学心得| 统计, P值

   作为一个非数学专业的学生,统计检验的原理一直让我觉得头疼。特别是有一个很基础的问题一直找不到解答。这个问题如下:不给定特定情形,就一般论,p值该如何计算?
   举一个简单的例子,一个6面骰子,掷三次,结果都是6点。假设骰子的重心没有偏移,怎么计算这个结果的p值?
   通常的做法是:按照假设,一次实验中掷出6的概率为1/6,则三次都是6的几率为(1/6)*(1/6)*(1/6)=1/216。因为不存在更极端的情形,这个概率就是p值。因为它比较小,我们可以主张骰子不合格(这取决于事先设定的阈值水平)。
   那么,如果掷出的结果是(1,6,6)的话,p值如何计算呢。可以构造一个统计量s等于三次结果的和。现在s=13。我们计算s>=13的概率,就是p值了。结果我就偷懒不算了,应该是不显著的吧。
但是且慢,为什么要计算s>=13,而不是s=13的概率呢。更极端一点,为什么不直接计算出现(1,6,6)这个排列的概率呢。我们知道,在原假设下,出现任意一种序列的概率都是一样的,即1/216。那么为什么(1,6,6)和(6,6,6)一个被接受,另一个被拒绝呢。
   可能有人会说,你的统计量构造的不对,应该用卡方检验来做测试。不错,我的这个统计量有点弱,它不能检测出诸如(3,3,3)这样的极端状况。但是同样的疑问仍然存在,(1,6,6)和(6,6,6)出现的概率是一样的,而用卡方检验得出的p值却不一样。(6,6,6)更容易被用来拒绝原假设!
我们来总结一下现在的疑问:p值一般来说并不是实验结果出现的概率。而是包含了实验结果在内的一系列结果出现的概率。这样做有什么依据吗?
   这个问题在面向非数学专业读者的教科书中很难找到解释,而解释统计检验基本理论的书籍又很难懂。这个问题困扰了我很久,但是随着相关知识的增加,渐渐有一点理解了。以下为我不成熟的解释。如有错误,还望高手指点。
-------------------以下解释基于个人理解--------------------------------------------------------
   按照现代统计检验理论,假设检验乃是一种决策方法。依据实际观测到的数据来决定是接受还是否定一个假设。但是否定原假设后,需要一个备选假设来替代。这个备选假设就决定了p值的计算方法。

   还是以上述掷骰子的实验为例。在卡方检验中,原假设为:骰子重心无偏,所有点数概率均为1/6,备选假设为:骰子有偏使得掷出的不同点数的次数有显著差异。于是连续3次6点就很异常,而像(1,3,6)这样比较均匀的分布就可以被接受。
   换一种方式,原假设不变,备选假设改为:骰子有偏使得掷出的点数和显著偏大。则我上面构造的统计量s就起作用了。在这种情况下,(6,6,6)仍然很异常,而(3,3,3)这种在卡方检验中异常的结果却可以被接受了。
   让我们再考虑一种有趣的情形:原假设仍然不变,但备选假设变为:选手通过某种高超的技巧使得结果一定为(1,2,3)。在这种假设下,(6,6,6)成为了正常情形,而掷出(1,2,3)的话我们就要考虑接受备选假设!
   请看,相同的实验结果在不同的备选假设下得出了完全不同的解释。备选假设既然如此关键,那我们怎么决定备选假设呢。很遗憾,只能根据经验来决定。如果我们根据事先物理检查否决了骰子存在问题的可能性,那么上述前两个备选假设自然不合理。进一步的,如果该选手以前就展示过掷出(1,2,3)的技巧。那么备选假设3自然是最合理的。
   于是得出结论,p值的计算方法取决于原假设与备选假设。正确的计算方法下,p值越小,则备选假设应当显得越合理。
   反之,不考虑备选假设的话,谈论p值毫无意义。
   最后提出我的一个看法:任何事件都有可能被判断为正常事件,任何事件也都有可能被判断为异常事件,这取决于备选假设的选取,而非原假设。这是否正确,请高手指点。



https://wap.sciencenet.cn/blog-1183315-769184.html

上一篇:学习笔记-后扣带皮层中存在其他脑区域的回音(echoes)
收藏 IP: 133.50.144.*| 热度|

1 zhoulong

该博文允许注册用户评论 请点击登录 评论 (4 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2022-12-8 08:03

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部