安静分享 http://blog.sciencenet.cn/u/physicsxuxiao 致远

博文

答李铭老友:概率解算

已有 3835 次阅读 2013-9-1 15:45 |个人分类:科研笔记|系统分类:科研笔记

上篇博文,李铭老友要求加以说明。

本文首先简略介绍公理化概率体系产生的原因,基本概念,然后就上篇博文的具体例子做出说明。

现说明如下:

 1. 公理化概率体系简介

概率之产生,起于十六世纪cardano(http://en.wikipedia.org/wiki/Girolamo_Cardano)之赌博技术,在其早期,处理问题简单,虽然有种种争议,但是在整个19世纪人们广泛接受了拉普拉斯的古典定义。但是随其发展,尤其出现了Bertrand奇论(Bertrand Paradox:http://en.wikipedia.org/wiki/Bertrand_paradox_(probability))后,针对有关几何问题的概率,人们认识到“概率”“随机”“等可能”等等术语的含义非常含糊,往往随实验而异。而随着Lebesgue测度理论(http://en.wikipedia.org/wiki/Lebesgue_measure)的建立,至Kolmogrov(http://en.wikipedia.org/wiki/Kolmogorov),将集合理论和事件运算联系起来,将概率和测度论联系起来,成功地建立了概率化公理体系,使得概率论的术语建立在如同欧几里得几何理论般严密的公理体系基础上,有了明确清楚的定义方式。

故此,考虑概率问题,不论繁复简单,都要有概率化公理体系的有关支撑,方能清楚明白。

概率化公理体系的三个重要概念,是样本空间、事件代数和概率。

样本空间(sample space)的基本构成元素是样本点(sample point)。一个样本点是某个实验或者观察的结果之一。这些结果“互不相容”,或者说“互斥”。这是说,一次实验的结果不能既是某个样本点,又是另外的样本点。现在我们以最近科学网比较火热的小三小四的问题来说明样本点。(见刘兰兰和镜兄的争论)在中国,你娶老婆,一次只能取一个,或者是小红,或者是小开。不能娶一个妻,这个妻既是小红,又是小开。当然你会辩论,现在“二奶”、“小三”怎么算?注意概念要精细,观察要仔细-二奶小三等等不能算你娶的妻。当然,出现小三等等状况,现在算是重婚,虽然犯法,但是这是可能发生的事,应该算在样本空间之内。那咋办呢?这个时候,你就要将重婚的状况算着样本点,那么单独娶小红算是个样本点,单独娶小开是另一个样本点,而某个时间段内又娶小红又娶小来小开则被算做除以上两个样本点以外的另外一个样本点。(当然这里有个很特殊的样本点,空集,由于平时解释碰不到,先略去不谈。)

针对某个实验的样本点的全体的集合被称为样本空间。注意,是指全体,也就是一个可能出现的结果都不能少。比如讲到射箭,如果以单次射箭记,除了考虑十环到一环,你还必需将脱靶考虑到。当然也不能多,比如你考虑单次射箭,就不能将下一次射箭或者上一次射箭的结果考虑进来。(顺便说一下,如果考虑多次射箭,你就要另外设计样本点和样本空间,这些样本点和样本空间可以由单次射箭的样本空间复合而成。)

这些概念往往是学习概率理论的人容易忽略的地方。

大多数情况下,人们在概率运算问题上犯迷糊,就是未能清楚定义样本点和样本空间。等一会我们讨论董明和应老师的邮递问题的时候再谈。

在样本空间上就可以通过样本空间的子集来定义事件。所有的事件都应该是样本空间的子集。所谓事件A发生,就是指你的实验或者观察结果正好是A这个集合内的一个样本点。(注意只能是一个样本点,一次实验不可能对应多个样本点,这也是经常让人犯迷糊的地方。)

注意,并不是样本空间的所有子集都是事件。

对于古典的概率类型,其处理的问题的样本点总是离散的,而且大多数情况下,样本点数目有限。所以这个时候每一个的样本点都是一个事件。推而广之,样本空间的所有子集都是事件。比如上面讨论的你娶老婆的问题。你娶老婆是一个事件,这个事件对应的集合就是样本点全体;你娶小红也是一个事件,包括你单独娶小红和你同时娶小红和小开;你单独娶小红还是一个事件,就包含你单独娶小红一个样本点。

但是,对于像几何概率这样的问题,由于Bertrand Paradox的存在,使我们认识到有些样本点的集合是不能定义为事件的。其原因后述。

事件之间可以进行运算,其对应的正好是集合论的集合求并求交等集合运算。比如你娶小红这个事件和你单独娶小红的事件彼此求交,就得到彼此的集合的交对应的事件,就是你单独娶小红。这些运算和这些事件的全体合起来,叫做事件代数。将之称为“代数”原因,是集合求交求并等等是一些运算,只是这些运算的对象是具体的事件而已,但是运算法则还是类似我们平时进行代数运算的那些法则。

有了事件代数以后,对应不同的事件就可以定义概率了。换言之概率是定义于事件的。

对于样本点离散并且个数有限的情况,其方法非常简单,就是给每个样本点-这里每一个样本点都是一个事件-指定一个非负的实数作为概率值,并且要使针对样本空间的所有的样本点的概率值的和为1。每个样本点的概率值是根据实际情况的经验和测量情况而取的。往往有些读者认为古典的概型里,每个样本点的取值是相等的。这是不对的,比如对于你娶老婆的事情,单独娶小红,单独娶小开,同时娶小红和小开的概率值往往不一样。

对于样本点连续且有无穷多的情形,问题就比较复杂。比如我们为每个样本点指定一个概率为0,则所有的样本点合起来的概率值还是0,不能满足所有样本点合起来的概率值为1的要求。而对于每个样本点,如果我们指定一个样本点的概率值为不为0的有限大小的数,则其合起来的概率值将为无穷大,也不能满足概率值的和为1的要求。所以这个时候单个的样本点我们不能作为事件,而需要利用所谓的测度理论才能指定事件的概率值。再强调一下:这个时候,我们就不能将单独的样本点指定为事件了。

 

 2. 邮件问题

 

现在具体邮件问题,先看董明的问题http://blog.sciencenet.cn/blog-746555-720255.html

 

儿子在网上买了几本书, 刚刚收到发货 通知, 儿子就开始问书什么时候到,

以后几天,这成了我和儿子每天早上的标准对话 (邮局下午送信)。

“今天书会不会到?”

“可能,机会比昨天大一点。”

我开始考虑每天书到货的概率密度曲线,想象中是类似标准分布 的 ,均值和发货城市和我家的距离 相关。


某天,儿子没按导演意图,突然自己改了台词:

“今天书会不会到?”

“可能,机会比昨天大一点,明天到的可能性比今天大一点”

”要是一直不来,那十年后,可能性是不是就大得不得了? “

”那书可能 就再也来不了了, 寄丢了。“


儿子好对付,概率密度曲线该怎么写? 概率密度曲线的积分是1,就是说事件一定会发生, 但书寄到家这个事件有可能发生不了(书 寄丢了), 那每天我收到书的概率该怎么描述呢?

 3. 应老师的模型

再看应老师关于这个问题的模型:

http://blog.sciencenet.cn/blog-826653-720837.html

在应老师的模型中定义了事件如下:

n:代表从订书开始到第n天收不到书的事件;

$D_{n}$:代表过了第n天正好收到书的事件;

A:正常邮递情况;

B:寄丢了的情况。

那么稍稍思考,就可以知道应老师定义了怎样的样本点和样本空间了:

样本点有:(1)第n天后正好收到书;n=0,1,2,。。。无穷大;我们正好可以用 $D_{n}$表示。

                    (2)永远收不到书。这里就是书寄丢的情况,只有一个样本点,我们正好可以用B表示。

这样两类样本点的全体就构成了样本空间。

这样我们就知道应老师定义的事件在集合中是什么意思:

n:包含所有第n天后收到书的样本点和永远收不到书的样本点共同构成的集合;

$D_{n}$:代表过了第n天正好收到书的样本点;

A:代表除了(2)以外的所有样本点;

B:代表(2)所定义的那个样本点。

4.我的推导

现在我来解释上一篇博文的推导:

 

由条件概率公式及各事件之定义,有:

 $P(D_{n}|n)=P(D_{n})P(n|D_{n})/P(n)$  (这是条件概率的定义式,为了理解,可以自己画一下n发生的情况下,集合里还剩哪些元素;或者$D_{n}$发生的情况下,集合里还剩哪些样本点。)

而由事件定义易知:

          $P(n|D_{n})=1$        (既然是第你天后收到书,那当然在前你天是没有收到书了,所以这个条件概率的值为1)

故       $P(D_{n}|n)=P(D_{n})/P(n)$    (这是上两式直接带入运算的结果)

又有:    

P        $P(D_{n})=P(A)f(D_{n})$           (这是应老师直接给定的定义,其中$f_{n}$代表在正常邮递的情况下第n天后正好收到书的概率,即$f_{n}=P(D_{n}|A)$。)

         $P(n)=P(A)(1-\sum_{i=0}^{n-1}f(D_{i}))+1-P(A)=1-P(A)(\sum_{i=0}^{n-1}f(D_{i}))$(这里$\sum_{i=0}^{n-1}f(D_{i})$是指所有在正常邮递情况下到第n天为止,书邮到的概率,这个量被减掉,当然就是$(1-\sum_{i=0}^{n-1}f(D_{i}))$,是指在正常邮递的情况下,第n天后收到书的概率;而P(B)=1-P(A),就是永远收不到书的概率。)

故得

        $P(D_{n}|n)=P(A)f(D_{n})/(1-P(A)(\sum_{i=0}^{n-1}f(D_{i})))$(这是直接推导出来的。)

 



https://wap.sciencenet.cn/blog-731678-721319.html

上一篇:与应行仁老师探讨:邮件问题
下一篇:为什么科斯离世科学网没大动静的原因
收藏 IP: 14.150.78.*| 热度|

10 刘全慧 李学宽 赵美娣 李小文 陈安 董明 杨正瓴 丁大勇 qqlisten zzjtcm

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-17 07:49

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部