||
马丁·加德纳(Martin Gardner,1914年10月21日—2010年5月22日)是美国数学家,著名的数学科普作家。
1959年10月,马丁·加德纳在《科学美国人》杂志的<数学游戏专栏>中,发表了他的“两个孩子问题(The Two Children Problem)”,其中提出了两个这样的问题:
问题1:琼斯先生有两个孩子。大孩子是个男孩。两个孩子都是男孩的概率有多大?
问题2:史密斯先生有两个孩子。其中至少有一个是男孩。两个孩子都是男孩的概率有多大?
加德纳对琼斯先生的问题给出了1/2的答案,对史密斯先生的问题给出了1/3的答案,这样做引起了一阵骚动。这两个概率怎么会不同呢?后来被称为“男孩或女孩悖论(Boy or Girl paradox)”。
这篇博文除了讨论上述加德纳提出的问题1和问题2外,还将讨论“两个孩子问题”的一个变种——“星期二男孩问题”:
问题3:福什先生有两个孩子。其中一个是星期二出生的男孩。两个孩子都是男孩的概率有多大?
问题1
有两个孩子的家庭,鉴于老大是男孩,老二也是男孩的概率有多大?
问题1的答案:1 / 2。
用B表示男孩,G表示女孩。有两个孩子的家庭,有四种可能的家庭配置Ω = {GG, GB, BG, BB} ,例如,BG表示第一个孩子是男孩,第二个是女孩。有两个孩子的家庭有4种同样可能的安排:
如果我们随机选择一个第一个是男孩的家庭,那就排除了第一种和第二种可能性,剩下两种同样可能的可能性。这两种中,只有一种有两个男孩。所以这个家庭两个孩子都是男孩的概率是1 / 2。
概率推理(不关心数学细节者跳过):
现在条件K是“第一个孩子是男孩”。显然,“较大的孩子是男孩,年幼的孩子是女孩”和“较大的孩子是男孩,年幼的孩子是男孩”都意味着“第一个孩子是男孩”。于是,
P(K|BB) = P(K|BG) = 1 , P(K|GB) = P(K|GG) = 0
条件K的概率可以划分为
P(K)=P(K|BB)×P(BB)+P(K|BG)×P(BB)+P(K|GB)×P(GB)+P(K|GG)×P(GG)
=1/4×1+1/4×1++1/4×0++1/4×0=1/2
最后,使用贝叶斯定理,我们得到
问题2
有两个孩子的家庭,鉴于其中一个孩子是男孩,两个孩子都是男孩的概率有多大?
问题2的答案:1/3。
仍然用B表示男孩,G表示女孩。正如前面提到的,有两个孩子的家庭,有四种可能的家庭配置Ω = {GG, GB, BG, BB}。
如果我们随机选择一个至少有一个男孩的家庭,那就排除了第一种可能性,剩下三种同样可能的可能性。这三种中,只有一种有两个男孩。所以这个家庭两个孩子都是男孩的概率是1 / 3。
概率推理(不关心数学细节者跳过):
考察一个二孩家庭X中有两个男孩的概率的可能性。X ∈ {BB,BG,GB,GG}。现在我们引入进一步的条件K,即“至少有一个孩子是男孩”。贝叶斯定理意味着
BB的先验或无条件概率为P(BB) = 1/4。显然,“较大的孩子是男孩,年幼的孩子是女孩”、“较大的孩子是女孩,年幼的孩子是男孩”和“较大的孩子是男孩,年幼的孩子是男孩”,都意味着“至少一个男孩”。于是,
P(K|BB) = P(K|BG) = P(K|GB) = 1 , P(K|GG) = 0
所以,
P(K)=P(K|BB)×P(BB)+P(K|BG)×P(BB)+P(K|GB)×P(GB)+P(K|GG)×P(GG)
=1/4×1+1/4×1+1/4×1+1/4×0=3/4
这表示,在所有二孩家庭中,“至少有一个孩子是男孩”有四分之三的可能性,所以我们有P(K) = 3/4。
利用贝叶斯定理,我们得到
问题3:
有两个孩子的家庭,鉴于其中一个孩子是星期二出生的男孩,两个孩子都是男孩的概率有多大?
问题3的答案:13/27。
这个问题是加里·福什(Gary Foshee)是在第九届“加德纳聚会”(G4G9)上提出。加德纳聚会是灵感来自马丁·加德纳的作品讨论会,每两年举行一次,参与者聚集在一起,讨论数学、科学、艺术、文学、魔术、谜题以及这些学科的交叉。至今已经举办15届(G4G15是在2024年2月21日至25日举办的)。
2010年3月24日至28日,在佐治亚州亚特兰大举行的G4G9上,共有75场演讲,时长从几分钟到半小时不等。加里·福什走到讲台上发表演讲。他说:“我有两个孩子。一个是星期二出生的男孩。我有两个男孩的概率是多少?”“你想到的第一件事是‘星期二和这件事有什么关系?’”福什面无表情地说,“好吧,这一切都与它有关。”然后他从讲台上走了下来。这被人称为”有史以来最短的数学演讲,听众们鸦雀无声思考这个问题。不久,“星期二男孩问题”在学术界引发热烈讨论。
乍一看,问题3似乎与问题2相同,因为其中一个男孩出生的日期与其兄弟姐妹的性别有任何关系似乎很荒谬。令人惊讶的违反直觉的结果是,添加这个额外的条件“出生在星期二”,两个孩子都是男孩的概率从问题2的1/3(大约33%),提升到了问题3的13/27(大约48%)。
要了解原因,用B表示男孩,G表示女孩,考虑两个孩子可能以下列任何顺序出生:BB、BG、GB。因为至少有一个男孩,顺序GG是不可能的。进一步用数字1,2,…,7来表示一周中的每一天,1表示星期一,2表示星期二,依此类推。现在我们可以把“一个男孩出生在星期n”这一事件称为Bn。例如,B3意味着男孩出生在星期三,G1意味着女孩出生在星期一。使用这种符号,我们可以写出像B5G1这样的事件,意思是“第一个孩子是在星期五出生的男孩,第二个孩子是在星期一出生的女孩”。
让我们假设一个孩子在一周中的任何一天出生的可能性是相等的。这导致了以下27种同样可能的孩子出生的方式(每种方式都必须包含B2,代表一个星期二出生的男孩):
上面的表格是一个完整的列表,列出了当两个孩子中至少有一个是出生在星期二的男孩,所有可能的出生方式。
在我们的假设下,所有这些事件都有同等的可能性。有27种可能性,其中13种(阴影部分)包括两个男孩,其概率是13/27。
同样,这还可以用下图重新表述,包括4×7×7=196种情况,如B1G1、B1G2、B2G1等。下图图案填充的单元表示“有一个星期二出生的男孩”,共有27种情况。深色的图案填充的单元表示“有两个男孩”,共有13种情况。容易看出,在“有一个星期二出生的男孩”条件下,“有两个男孩”的概率为13/27。
概率推理(不关心数学细节者跳过):
我们使用符号bb表示“有两个男孩”事件,包括B1B1,B1B2,...,B7B7等等,共49种情况。用b2表示“有一个星期二出生的男孩”事件,包括B2B1,B2B2,...,B7B7,B2G1,...,B2G7,B1B2,B3B2,...,B7B2,G1B2,...,G7B2等等,共27种情况。可以看出,P(b2)=27/196,P(bb)=1/4,P(b2|bb)=13/49。
利用贝叶斯定理计算:
也就是说,在有一个星期二出生的男孩条件下,有两个男孩的概率为13/27≈48%。
条件“出生在星期二”,可以替换为“不是出生在星期二”、“出生在正午之后”、“出生在秋天”等,得到不同的概率估计。
计算机模拟
利用计算机模拟程序验证问题1~3,模拟100个双孩家庭,每个孩子的性别和出生在星期几都是随机生成的。其运行的结果截屏如下图:一个双孩家庭,在“第一个孩子是男孩”、“有一个男孩”、“有一个男孩出生在星期二”条件下,另外一个是男孩的几率大约是0.500...、0.334...、0.483...,分别接近于相应的概率估计1/2、1/3和13/27。
结语
“男孩或女孩悖论”,与“蒙蒂霍尔问题”(见我的上一篇博文)一样,有一个不直观的解决方案。
“男孩或女孩悖论”的一个场景揭示了两个孩子的家庭其中有男孩,其余一个也是男孩的概率,不是1/2而是1/3。而另一个场景,我们知道大孩子是个男孩,两个孩子都是男孩的几率上升到1/2。第三个场景,当给出“有一个星期二出生的男孩”条件下,其余一个也是男孩的概率是13/27。这些例子显示悖论的反直觉性质。
数学模型解释了违反直觉的结果,常常让那些研究悖论的人感到惊讶。这一悖论挑战了我们对机会和结果的直觉理解,促使我们更深入地探索概率数学及其呈现的有趣场景。
贝叶斯定理是概率论中的一个重要定理。这个曾经鲜为人知的数学公式,不但可以用于解决如同“男孩或女孩悖论”和“蒙蒂霍尔问题”,现在正被用于环境保护、气象预测、疾病诊断、疫情预测、信用评估、故障检测、推荐系统、垃圾邮件过滤、资源勘探、城市管理、经济金融,以及智能手机和无人驾驶汽车等。这项技术表明数学公式可以帮助改进人类专家的决策过程。现在常可以看到冠以“贝叶斯”名字的术语,如,贝叶斯网络、贝叶斯机器学习、贝叶斯医学诊断、贝叶斯信息准则、贝叶斯分类器...。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-1 10:20
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社