heninghuang的个人博客分享 http://blog.sciencenet.cn/u/heninghuang

博文

用非贝叶斯方法求解一个引发科学网7年前一场大辩论的概率问题

已有 767 次阅读 2024-2-6 11:03 |个人分类:统计推断与概率|系统分类:科研笔记

20174月,科学网上展开了一场关于应用贝叶斯定理(方法)的大辩论,起因是张天蓉老师在博文【1】中列举了生活中的一个概率问题

image.png

张天蓉老师应用贝叶斯方法求解了王宏患X病的概率问题,求解过程和结果如下【1】:

image.png

然而高山博主立即发表了一篇博文,认为张天蓉老师的计算结果是错误的(后续又发表了两篇博文)。接着袁贤讯、徐晓、文克玲、陆绮、刘学武、岳东晓等博主纷纷加入了辩论。袁老师在两个星期内连续发表了9篇博文(4月3 日、7日、8日、9日、10日、12日、13日、16日09:58、16日12:04); 徐老师发表了3篇博文(4月9日、4月12日、5 月1日);文老师发表了两篇博文(4月2日、4月6日);陆老师发表了两篇博文(4月2日、4月8日);刘老师和岳老师分别发表了一篇博文(分别为44 日和4月9日)。其中有9篇博文获得科学网精选。在这些博文的评论区,许多网友积极参与了讨论。这场科学网上的大辩论可以说是盛况空前。但是遗憾的是,高老师在这场大辩论后退出了科学网并且删除了所有信息,他的3篇博文已经无从查找。陆老师于2017年8月从科学网上隐退;袁老师2019年6月从科学网上隐退,仅于200227月在科学网露面发起并主持召开了一个关于测量不确定度的小型网络会议

从张天蓉老师的求解过程可以看到,贝叶斯方法涉及条件概率和全概率的计算,因此对于非概率与统计学专业人士比较难以理解 。那么,除了贝叶斯方法,有没有非贝叶斯方法可以求解王宏患X病的概率问题呢?

答案是肯定的。我们可以应用信息度理论the theory of informity中的信息谱合成定律 (the law of combination of information spectrums) 来求解王宏患X病的概率问题。对于离散随机变量,信息谱等同于概率质量函数。信息谱合成定律提供了将来自多个独立信息源的信息合成的机制。

考虑两个独立离散随机变量 X1 X2,其信息谱(即概率质量函数)分别为 P1 (x) P2 (x) ,则根据信息谱合成定律,合成信息谱 Pc (x) 为【2】

image.png

对于王宏患X病的概率问题,我们考虑的样本空间为{ x1=阳,x2=阴}。我们有两个独立的信息源:(1)群体患X病的信息谱 P1 (x)={0.001, 0.999}(即先验信息谱), 2)测验仪器实测王宏患X病的信息谱P2 (x)={0.99, 0.1}(即当前信息谱)。分别将P1 (x1)=0.001P2 (x1)=0.99带入上式得到Pc (x1)=0.0902。分别将P2 (x2)=0.999P2 (x2)=0.1带入上式得到Pc (x2)=0.9098。因此合成信息谱 Pc (x)={0.0902, 0.9098}(即后验信息谱),其中第一个元素0.0902为王宏患X病的概率,这个结果与贝叶斯公式的结果是一样的,但是不必涉及比较难理解的条件概率和全概率的概念,而且给出了完整的后验信息:即合成信息谱 Pc(x)={0.0902, 0.9098}

值得注意的是,尽管“当前概率”(即仪器实测王宏患X病的概率)很高,为0.99,王宏患X病的概率(即后验概率)很低,只有0.0902。这是因为“先验概率”(即群体患X病的概率)非常低,只有0.001。对于贝叶斯统计推断的争议之一是先验概率的选择对结果影响很大,而如何选择先验概率没有公认的标准。为了分析先验概率对王宏患X病的概率(后验概率)的影响,我们假设不同的先验概率,计算了相应的后验概率,结果显示在图A中。

image.png

A 后验概率(即王宏患X病的概率)与先验概率(即群体X病的概率)的关系(假定当前概率=0.99

由图A可以看到,随着先验概率的增大,后验概率迅速增大。当先验概率=0.01时,后验概率=0.5;当先验概率=0.1时,后验概率=0.9167。也就是说,如果王宏来自一个群体患X病的概率为1%的居民区,王宏患X病的概率为50%;如何王宏来自一个群体患X病的概率为10%的居民区,王宏患X病的概率为91.67%。

各位网友:您认为用这个非贝叶斯方法求解这个概率问题比用贝叶斯方法更容易(或是更难)理解吗?

参考文献

1张天蓉(2017)概率论悖论, 科学网,https://blog.sciencenet.cn/blog-677221-1042909.html

2Huang, H. (2023) The theory of informity, preprint, ResearchGatehttps://www.researchgate.net/publication/376206296_A_theory_of_informity

3】陆绮(2017形象思维是个好东西——再谈概率题, 科学网,https://blog.sciencenet.cn/home.php?mod=space&uid=5525&do=blog&id=1047504

image.png

image.png

image.png

image.png



https://wap.sciencenet.cn/blog-3427112-1420787.html

上一篇:试用“信息度增益原理”解释“图书为何要分章节?”
下一篇:“裁判员抛硬币的做法公平吗?”-- 与高宏博主商榷
收藏 IP: 104.63.253.*| 热度|

7 尤明庆 宁利中 孙颉 刘全慧 高宏 刘跃 杨正瓴

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-30 03:10

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部