文克玲
为什么说“高山根本不懂贝叶斯统计”
2017-4-6 22:38
阅读:5883

为什么说“高山根本不懂贝叶斯统计”


在“深入探讨上次概率问题错误的根源”,http://blog.sciencenet.cn/blog-907017-1043990.html,一文中,高山声称:

“文老师,张老师,我无意与两位为敌,但是事关科学问题,

我不能不讲真话,得罪了。我下面的公式和计算如果有错误,

还请指出来,不必客气,大家把问题搞清楚就好”。

我是这次2017-4-1的张天蓉博文的讨论中开始学习贝叶斯统计的。高山这篇博文给了一个链接:https://www.math.hmc.edu/funfacts/ffiles/30002.6.shtml ,是至今为止我看到的对贝叶斯统计的最好最清楚的解释。

那篇文章里讨论了这样一个例子:

Suppose that you are worried that you might have a rare disease. You decide to get tested, and suppose that the testing methods for this disease are correct 99 percent of the time (in other words, if you have the disease, it shows that you do with 99 percent probability, and if you don't have the disease, it shows that you do not with 99 percent probability). Suppose this disease is actually quite rare, occurring randomly in the general population in only one of every 10,000 people.

If your test results come back positive, what are your chances that you actually have the disease?

Do you think it is approximately: (a) .99, (b) .90, (c) .10, or (d) .01?

Surprisingly, the answer is (d), less than 1 percent chance that you have the disease!

翻译成中文,意思是:

有一种检查某种罕见病的方法,它的准确率是99%。准确率的定义是:

1. 对于确实有病的人,阳性结果的比率是99%;

2. 对于确实没病的人,阴性结果的比例是99%。

注意,我们在此文中是形式逻辑的忠实信徒,规定一个人或者有此病,或者没有。

假定这种病确实罕见,人群中患病的比例是0.01%,即万分之一。

好了,现在假定你既无家族遗传史,也没有相关症状,纯属杞人忧天,跑到医院去作了一次检查,结果是:阳性!那么,你确实有病的概率是多少? 0.99 ,0.9,0.1,还是0.01?

令人惊异的是,根据贝叶斯定理,你虽然是阳性结果,真正有病的概率只是1%!

简单地解释一下。道理其实很简单。10000个人作检查,其中平均只有一个病人,而平均会有101个阳性结果,所以阳性结果的有病的概率真的只有1%。

张天蓉文章中,人群中患病的比例是0.1%,即千分之一。此时阳性结果的真正有病的概率是9%。

这些结果说明,对于罕见病,检查方法的假阳性率,即对没有病的人给出阳性结果的比率,1%其实是太大了。要达到(有病/阳性)的比率等于0.99以上,检查方法的假阳性率必须比罕见病的患病率低两个数量级。

高山错在什么地方,请自行检查。

我的真话今天就到此为止。

相关专题:概率问题与贝叶斯定理

转载本文请联系原作者获取授权,同时请注明本文来自文克玲科学网博客。

链接地址:https://wap.sciencenet.cn/blog-583426-1046483.html?mobile=1

收藏

分享到:

当前推荐数:4
推荐到博客首页
网友评论20 条评论
确定删除指定的回复吗?
确定删除本博文吗?