|||
历史或将铭记这个至简至明的分布成因公式
美国归侨冯向军博士,2017年8月3日写于美丽家乡
np = -log(f(x)) (1-1)
【定理】对于任意给定的分布f(x),假设可将f(x)视为在变量间隔x以后指定事件才出现的特殊形式的二项概率分布,那么导致成就f(x)的原因就是参数np满足式(1-1)。这其中n是把变量x等分后的等分数,而p是指定事件在任意变量等分片段上出现一次的概率。np可解读为指定事件在变量间隔x内实际可能出现的总次数的统计平均值。因为-log(f(x))可解读为给定分布所包含的信息
I = -log(f(x)),所以又有给定分布f(x)的成因是:
np = 给定分布f(x)所包含的信息I (1-2)
证明:
(一)二项分布
考察由n次随机实验所组成的随机现象,它满足以下条件:1)重复进行n次随机实验;2)n次实验相互独立;3)每次实验仅有两个可能结果;4)每次实验中给定事件出现的概率为p,不出现的概率为1-p。假设X表示n次独立重复实验中给定事件出现的次数,显然X是可以取0,1,…,n等n+1个值的离散随机变量。设这n次实验中,每个“给定事件出现k次的结果”为Ek,显然Ek的发生概率为pk(1-p)n-k。因为这样的结果有:n!/k!(n-k)!个,所以按照柯尔莫哥洛夫概率的可加性,这n次实验中,给定事件出现k次的概率
P(X=k) = n!/(k!(n-k)!)pk (1-p)(n-k) (1-3)
(1-3)式就是二项分布的概率分布表达式。
(二)任意给定的分布f(x)的成因
假设把变量x等分成n个变量片段。当n足够大时,在每个等分变量片段上给定事件要么出现1次,要么不出现。又假设给定事件出现(1次)的概率p与变量x及其等分数n成一较为复杂的待定函数关系,有:p = λy(x)/n,这其中y(x)是关于变量x的待定函数。
按(1-3)式,变量间隔x之内给定事件出现的概率的分布为
P(X = k) = n!/(k!(n-k)!)(λy(x)/n)k (1-λy(x)/n)(n-k) (1-4)
P(X = k) = n!/(nk(n-k)!)(1-λy(x)/n)-k(λy(x))k/k!(1-λy(x)/n)n
考察给定事件在变量间隔x以后才出现的概率P0(x),就有:
P0(x) = P(X=0) = (1-λy(x)/n)n (1-5)
当n->无穷大,有:
P0(x) = exp(-λy(x)) (1-6)
下面来确定待定函数y(x)和参数np。
命:P0(x) = 任意给定的合乎条件的分布f(x),就有:
待定函数 y(x) = -1/λlog(f(x)) (1-7)
参数np = λy(x) = -log(f(x)) (1-8)
这其中n是把变量x等分后的等分数,而p是指定事件在任意变量等分片段上出现一次的概率。np可解读为指定事件在变量间隔x内实际可能出现的总次数的统计平均值。因为
-log(f(x))可解读为给定分布所包含的信息I = -log(f(x)),所以又有给定分布f(x)的成因是:
np = 给定分布f(x)所包含的信息I
证毕。
【举例】
(1)负指数分布:因为 f(x) = aexp(-λx),所以 np = -log(a) + λx。
(2)幂律分布:因为 f(x) = ax-λ,所以 np = -log(a) + λlog(x)。
(3)Tsallis 分布:因为f(x) = a(1 - (1-q1)λx)1/(1-q1),所以
np = -log(a) + 1/(q1-1)log(1 - (1-q1)λx)。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-1 08:10
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社