冯向军的科学研究博客分享 http://blog.sciencenet.cn/u/冯向军 在本博客中专门从事以统计力学为核心的理论物理研究。

博文

关于决定性事件的概率论第二章

已有 3926 次阅读 2017-8-21 23:04 |个人分类:决定性概率论|系统分类:论文交流

关于决定性事件的概率论第二章

前一章

后一章

最新篇章

关于决定性事件的概率论

A Probability Theory of Decisive Events

冯向军著

Feng Xiangjun



最大概率公理

最大发生概率原理

冯向军泛有序对

冯向军知觉模型及其对信息测度的统一

对于宏义观控科学技术的一些发展

对张学文广义集合的一些发展

现代泛系概貌

现代泛系复杂逻辑和统一解悖原理

现代泛系量子微积分


冯向军工作室

2017年7月16日-


第二章最大概率公理和最大发生概率原理

(2017年7月18日)

§2.1 最大概率公理

凡所能发生的,都是发生概率最大的。发生概率不是最大的都不可能发生。这就是最大概率公理。

一般而言发生概率就是事情能发生、存在或出现的概率。因为事情得以发生、存在或出现的原因以及所遵循的规律各各不同,因此发生概率的具体表现形式是多样化的。狭义的发生概率则是指在两两相互垂直、正交或对立的n个广义方向上分布有概率p1,p2,...,pn的广义系统G或广义向量能发生、存在或出现的概率

P = p1 * p2 *...* pn        (2.1-1)

对于广义系统G, p1 +  p2 + p3 +  ...+  pn = 1; 对于广义向量,一般而言,

p1 +  p2 + p3 + ...+ pn 不等于 1

本书中发生概率专指服从式(2.1-1)的狭义的发生概率。关于广义系统的定义请参考本书§1.2.9。假设广义系统 G = (p1,p2,...,pn),那么

G = p1(1,0,...,0)+

+ p2(0,1,...,0)+

+ ...+

+ pn(0,0,...,1)        (2.1-2)

由此可见,具有概率分布p1,p2,...,pn的广义系统要发生,就必须同时以概率p1,p2,...,pn在代表n个两两垂直、正交或对立的广义方向单位向量(1,0,...,0),(0,1,...,0),...,(0,0,...,1)上发生。因此所谓发生概率就是广义系统得以发生的概率或广义系统同时以概率p1,p2,...,pn在n个两两垂直、正交或对立的广义方向上得以发生的概率。所谓发生概率也是广义向量得以发生的概率或广义向量同时以概率p1,p2,...,pn在n个两两垂直、正交或对立的广义方向上得以发生的概率。

§2.2 最大发生概率原理

在任何约束条件下,广义系统的概率分布p1,p2,...,pn要得以发生,就必须令发生概率P最大。发生概率P满足式(2.1-1):P = p1 * p2 *...* pn 。最大发生概率原理只针对广义系统。对于广义系统, p1 +  p2 + p3 +  ...+  pn = 1。

§2.3 基于最大发生概率原理的简明实用理论

发生在本书作者我身上的事实证明:基于最大发生概率的简明理论对包括如何把赚到钱的概率提高到最大在内的许许多多现实问题都很实用。这个理论对科学创新也十分有益。为了读者加深对本书最重要的概念:发生概率的感觉和理解,特以如何提高成就科学创新的概率为例,阐明基于最大发生概率的简明理论。

定理2.3.1:成就科学创新的概率最大,当且仅当你钻进科学搞科学创新又完全平等地跳出科学搞科学创新。

证明:

假设“钻进科学搞科学创新”= A = (1,0)

那么“跳出科学搞科学创新”= 非A = (0,i * 1), i = +1 或 i = -1。这也就是说若把“钻进科学搞科学创新”视为单位向量A,那么“跳出科学搞科学创新”就是与A垂直正交或对立的单位向量非A。不失一般性,“成就科学创新”这一事件可以表达为以A和非A为基础所构成的二维正交坐标系中的归一化向量。

成就科学创新”= p1A + p2非A = p1(1,0)+ p2(0,i * 1)    (2.3-1)

这其中,p1成就科学创新”表现为钻进科学搞科学创新”的概率。p2成就科学创新”表现为跳出科学搞科学创新”的概率。p1 + p2 = 1,这就是归一化的确切含义。有:P = p(A) * p(非A / A)    (2.3-2)

这其中,P是成就科学创新”的发生概率,p(A)是成就科学创新”表现为钻进科学搞科学创新”的概率,而p(非A / A)则是在成就科学创新”表现为钻进科学搞科学创新”的前提下,成就科学创新”表现为跳出科学搞科学创新”的概率。

于是:

P = p1 * p2 = p1 * (1-p1) = -(p1-0.5)2 + 0.52    (2.3-3)

由此可见若按非此即彼的二分法:要么钻进科学搞科学创新”,要么跳出科学搞科学创新”来企图成就科学创新成就科学创新”的发生概率其实都最小,等于0,因为这时p1 = 1 或 p1 = 0,按(1-3)式都将导致成就科学创新”的发生概率P = 0。唯有向量子力学中的薛定鄂猫学习:钻进科学搞科学创新又完全平等地跳出科学搞科学创新成就科学创新”的发生概率才最大,这是因为 p1 = p2 = 0.5,按(2.3-3)式 将导致P取最大值0.25。

证毕。

用完全类似的方法,可以证明如下所示的定理。

定理2.3.2:你赚到钱的概率最大,当且仅当你钻进钱眼赚钱又完全平等地跳出钱眼赚钱。

定理2.3.3:得到的概率最大,当且仅当你努力去得又完全平等地努力去舍。

定理2.3.4:成功的概率最大,当且仅当你在成功中求成功又完全平等地在失败中求成功。

§2.4 发生概率的基本性质

§2.4.1 无中生有的涌现(Emergence)特性

对于具有概率分布p1,p2,...pn的n元广义系统,发生概率具有无中生有特性。对于概率分布p1,p2,...,pn及其所对应的代表广义方向的相互垂直正交或对立的单位向量A1,A2,...An,有整体的发生概率

P(p1A1 + p2A2 +...+ pnAn) = p1 * p2 * ... * pn    (2.4-1)

而无论i取什么值i = 1,2,...,n),都有部分的发生概率

P(piAi) = P(0*A1 + 0*A2 + pi*Ai...+ 0*An) = pi * 0  = 0 (2.4-2)

从式(2.4-1)和式(2.4-1)概率p1,p2,...pn全都不等于零,就可得:

P(p1A1 + p2A2 +...+ pnAn) > P(p1A1) + P(p2A2) +...+ P(pnAn) = 0    (2.4-3)

这也就是说:整体(部分之和)的发生概率大于部份的发生概率之和:零。这就是发生概率的无中生有的涌现(Emergence)特性。

§2.4.2发生概率的一个重要数理性质

定理2.4.1概率分布p1,p2,...,pn的发生概率P满足:

P  <=  (1/n)n,并且当且仅当概率分布p1,p2,...,pn呈均匀分布p1= p2=...=pn=1/n时,发生概率P才能取最大值。

证明:按几何平均值与算术平均值的关系不等式有:

P = p1p2...pn <= ((p1 + p2 +...+ pn)/n)n = (1/n)n并且当且仅当概率分布p1,p2,...,pn呈均匀分布p1=p2=...=pn=1/n时,发生概率P才能取最大值。

证毕。

§2.4.3统计力学第一定理

从定理2.4.1,容易证明如下所示的类似于牛顿第一定律的统计力学第一定理。

定理2.4.2(统计力学第一定理):在无任何非自然约束条件下,一切分布均以最大发生概率成为均匀分布。

证明:根据定理2.4.1,在无任何非自然约束条件下,概率分布p1,p2,...,pn的发生概率P当且仅当概率分布p1,p2,...,pn呈均匀分布p1=p2=...=pn=1/n时,才能取最大值。又根据最大发生概率原理,概率分布p1,p2,...,pn要得以发生,就必须令发生概率P最大。因此,在无任何非自然约束条件下,一切分布均以最大发生概率成为均匀分布。

§2.5 统计力学的根本因果规律和自洽约束条件

统计力学的根本因果规律就是以果为因必得果,或所谓"以果地觉为因地心则必证果”。具体来说,假设欲成就的概率分布为f(xi),又假设把以成就分布f(xi)为目标的概率分布或“因”分布pi固定为分布f(xi),则必有作为结果的分布或“果分布”的pi等于f(xi),或pi = f(xi),i = 1,2,...,n。 换句话说:在约束条件

pi/f(xi) = 1,i = 1,2,...,n    (2.5-1)

p1/f(x1) + p2/f(x2) +...+ pn/f(xn) = 常数 = n    (2.5-2)

下,必有作为结果的分布或“果分布”的pi等于f(xi),或pi = f(xi),i = 1,2,...,n。这其中,式(2.5-1)和式 (2.5-2)所规定的约束条件就叫做自洽约束条件。

§2.6 “科学新皇帝”最大发生概率原理

定理2.6.1:在任何以拉格朗日乘数法为基础的决定概率分布的极值原理中,唯有在目标函数中至少包含发生概率的对数log(P)的极值原理才可能符合统计力学的根本因果规律,换句话说,唯有包含最大发生概率原理的极值原理才可能符合统计力学的根本因果规律。

证明:假设把“因”分布pi固定在f(xi)上,就有:pi服从自洽约束条件:

pi/f(xi) = 1,i = 1,2,...,n。   (2.5-1)

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n   (2.5-2)

命目标函数中与自洽约束条件相对应的部分为T,根据柯尔莫哥洛夫概率的规范性,有:

p1 + p2 + ... + pn = 1   (2.5-3)

命由T,式(2.5-2)所表达的自洽约束条件以及由式(2.5-3)所规定的自然约束条件所构成的拉格朗日算子为L,就有:

L = T + C1(p1 + p2 + ... + pn - 1) +

+ C2(p1/f(x1) + p2/f(x2) + ... + pn/f(xn) - n)

对拉格朗日算子L求一阶偏导数dL/dpi,并令之为零,就有:

dL/dpi = dT/dpi + C1 + C2/f(xi) = 0,i = 1,2,...,n。

dT/dpi = -C1 - C2/f(xi),i = 1,2,...,n。

欲令分布f(xi)成为令目标函数中与自洽约束条件相对应的部分T取最值或极值的最值分布或极值分布,必有:pi = f(xi)。于是:

dT/dpi = -C1 - C2/pi,i = 1,2,...,n。这就是说:假设把“因”分布pi固定在f(xi)上又想最值分布或极值分布pi = f(xi),以符合统计力学的根本因果规律,就必有:目标函数中与自洽约束条件相对应的部分T的一阶偏导数dT/dpi必须是概率pi的倒数的线性组合。必有:

n*T = -C1 -C2log(p1*p2...*pn) + C3,这其中C1,C2和C3为常量(本式的推导中用到了柯尔莫哥洛夫概率的规范性,或,p1+p2...+pn=1)


T = a + blog(P)    (2.5-4)

这其中 a = 1/n*(-C1+C3),b = -C2/n。这也就是说:唯有在目标函数中至少包含发生概率的对数log(P)的极值原理才可能在把“因”分布pi固定在f(xi)上这个约束条件下令最值分布或极值分布pi = f(xi),以符合统计力学的根本因果规律。因此,在任何以拉格朗日乘数法为基础的决定概率分布的极值原理中,唯有在目标函数中至少包含发生概率的对数log(P)的极值原理才可能符合统计力学的根本因果规律,换句话说,唯有包含最大发生概率原理的极值原理才可能符合统计力学的根本因果规律。

证毕。  

定理2.6.2:迄今为止,除了最大发生概率原理这个"科学新皇帝”外,包括最大信息熵原理【1-5】和最大Tsallis广义熵原理【1-6】在内的所有其他以拉格朗日乘数法为基础的决定概率分布的极值原理,一般而言,都不符合统计力学的根本因果规律,换句话说,一般而言,都是与统计力学的根本因果规律相违背的。

证明:因为除了最大发生概率原理这个"科学新皇帝”外,包括最大信息熵原理和最大Tsallis广义熵原理在内的所有其他以拉格朗日乘数法为基础的决定概率分布的极值原理中,在目标函数中均未包含发生概率的对数log(P),根据定理2.6.1,这些极值原理,一般而言,都不符合统计力学的根本因果规律,换句话说,一般而言,都是与统计力学的根本因果规律相违背的。

证毕。

定理2.6.3:“科学新皇帝”最大发生概率原理与统计力学的根本因果规律自洽。

证明:假设把“因”分布pi固定在f(xi)上,就有:pi服从自洽约束条件:

pi/f(xi) = 1,i = 1,2,...,n。   (2.5-1)

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n   (2.5-2)

命目标函数T为发生概率的对数log(P),就有:

T = lop(P) = log(p1) + log(p2) + ... + log(pn)    (2.5-5)

根据柯尔莫哥洛夫概率的规范性,有:

p1 + p2 + ... + pn = 1   (2.5-3)

命由目标函数T,式(2.5-2)所表达的自洽约束条件以及由式(2.5-3)所规定的自然约束条件所构成的拉格朗日算子为L,就有:

L = log(p1) + log(p2) + ... + log(pn) +

+ C1(p1 + p2 + ... + pn - 1) +

+ C2(p1/f(x1) + p2/f(x2) + ... + pn/f(xn) - n)

对拉格朗日算子L求一阶偏导数dL/dpi,并令之为零,就有:

dL/dpi =  1/pi + C1 + C2/f(xi) = 0,i = 1,2,...,n。

命 C1 = 0,C2 = -1,就有:

pi = f(xi),i = 1,2,...,n。

之所以可以命C1=0,那是因为,当把“因”分布pi固定在f(xi)或pi = f(xi),i = 1,2,...n时,柯尔莫哥洛夫概率的规范性或

p1 + p2 + ... + pn = 1 已经自动得到满足的缘故。

但是,拉格朗日算子L的二阶偏导数矩阵是一主对角线上元数恒负其余元素全为零的负定矩阵,所以上述令拉格朗日算子L的一阶偏导数dL/dpi为零的分布pi = f(xi)必定也是令约束条件下目标函数发生概率的对数log(P)取最大值的最大值分布【2-1】。这也就是说:假设把“因”分布pi固定在f(xi)上,就有分布pi = f(xi)必定也是令约束条件下发生概率P取最大值的最大值分布。这既符合最大发生概率原理又符合统计力学的根本因果规律。“科学新皇帝”最大发生概率原理与统计力学的根本因果规律自洽。

证毕。

定理2.6.4(类似于牛顿第二定律的统计力学第二定理的形式之一): 除自然约束条件以外的与因果律相符合的约束条件,是非均匀分布产生的原因。与因果律相符合的约束条件包括而不限于自洽约束条件:若欲成就的“果”分布为f(xi),则可命“因”分布pi 服从约束条件(i = 1,2,...n):

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数n (2-2)

证明:用完全类似于定理2.6.3的证明方法即可证明本定理。

定理2.6.5:凡所发生的分布都是在分布已发生的前提下,发生概率最大的分布。

证明:假设pi等同于分布f(xi)业已发生,就有:pi服从自洽约束条件:

pi/f(xi) = 1,i = 1,2,...,n。   (2.5-1)

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n   (2.5-2)

命目标函数T为发生概率的对数log(P),就有:

T = lop(P) = log(p1) + log(p2) + ... + log(pn)    (2.5-5)

根据柯尔莫哥洛夫概率的规范性,有:

p1 + p2 + ... + pn = 1   (2.5-3)

命由目标函数T,式(2.5-2)所表达的自洽约束条件以及由式(2.5-3)所规定的自然约束条件所构成的拉格朗日算子为L,就有:

L = log(p1) + log(p2) + ... + log(pn) +

+ C1(p1 + p2 + ... + pn - 1) +

+ C2(p1/f(x1) + p2/f(x2) + ... + pn/f(xn) - n)

对拉格朗日算子L求一阶偏导数dL/dpi,并令之为零,就有:

dL/dpi =  1/pi + C1 + C2/f(xi) = 0,i = 1,2,...,n。

命 C1 = 0,C2 = -1,就有:

pi = f(xi),i = 1,2,...,n。

但是,拉格朗日算子L的二阶偏导数矩阵是一主对角线上元数恒负其余元素全为零的负定矩阵,所以上述令拉格朗日算子L的一阶偏导数dL/dpi为零的分布pi = f(xi)必定也是令约束条件下目标函数发生概率的对数log(P)取最大值的最大值分布【2-1】。这也就是说:假设pi等同于分布f(xi)业已发生,就有分布pi = f(xi)必定也是令约束条件下发生概率P取最大值的最大值分布。凡所发生的分布都是在分布已发生的前提下,发生概率最大的分布。在分布已发生的前提下,不是已发生的分布的分布或未发生的分布都不是发生概率最大的分布。这符合最大发生概率原理,也符合常识。

证毕。

§2.7 百花齐放百家争鸣的发生概率和广义熵同时最大原理

我于公元2017年7月24日正式发明并在中华人民共和国科学网上首次公开发表了发生概率和广义熵同时最大原理的两种具体形式【2-2】【2-3】,并以此作为主流科学理论《关于决定性事件的概率论》发展史上的一个重要里程碑。有道是一重境界一重天;欲穷千里目更上一层楼。经过穿越重重迷雾而后彻见青天白日的心路历程,我现在恍然大悟:

(一)发生概率和广义熵同时最大原理才是既符合因果律又具备最广泛的实用价值的现代统计力学和热力学新世代中决定概率分布的新一代核心极值原理。她包含而超越了现代统计力学和热力学的一切基于拉格朗日乘数法的决定概率分布的极值原理。

(二)所谓发生概率和广义熵同时最大原理的全面而正式的表述是指:在任何约束条件下,一般而言,都必须令发生概率或发生概率和某种包括詹尼斯信息熵和Tsallis广义熵在内的广义熵之和最大,以同时实现(1)在概率分布得以发生的前提下发生概率最大。(2)在系统约束条件等非自然约束条件下,某种包括詹尼斯信息熵和Tsallis广义熵在内的广义熵最大。

(三)现在终于十分清楚了,一般而言,得以发生的平衡态概率分布pi = f(xi),i = 1,2,...n同时满足自然约束条件,自洽约束条件和系统约束条件。

所谓自然约束条件是指:

p1 + p2 + ...+ pn = 1    (1-1)

所谓自洽约束条件是指:

p/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n    (1-2)

所谓系统约束条件则是指:

p1x1 + p2x2 + ... + pnxn = 常量    (1-3)

系统约束条件就是历史上著名的“变量的统计平均值不变”。之所以系统约束条件在系统平衡态普遍存在,那是因为在系统平衡态位于广义能级x上的粒子数不再变化从而令系统的总广义能量

N(p1x1 + p2x2 + ... + pnxn)(这其中N是系统宏观粒子总数)

不变的缘故。

(四)现在业已证明:在发生概率和广义熵同时最大原理中,百花齐放,百家争鸣。除了能够给出无一切非自然约束条件下的均匀分布以外,发生概率和种种广义熵同时最大原理可以分别给出种种常见的概率分布:

(1)标准负1次幂律;

(2)负指数分布;

(3)非负1次标准幂律;

(4)Tsallis非标准非负1次幂律分布;

(5)对数分布;

(6)正态分布;

...

§2.7.1“科学新皇帝”灵光独耀于齐普夫定律的标准负1次幂律帝国

(一)释题

“科学新皇帝”是指主流科学理论《关于决定性事件的概率论》所提出来的决定概率分布的最大发生概率原理;齐普夫定律是指关于标准负1次幂律的用途十分广泛的齐普夫定律(Zipf's Law)。所谓“科学新皇帝”灵光独耀于齐普夫定律的标准负1次幂律帝国,则是指在所有基于拉格朗日乘数的现代统计力学和热力学的极值原理中,在普适性的系统约束条件下唯独只有作为发生概率和广义熵同时最大原理的共同基础和重要组成部分的“科学新皇帝”最大发生概率原理能够推导出著名的齐普夫定律(Zipf's Law)。

(二)发生概率和广义熵同时最大原理

所谓发生概率和广义熵同时最大原理的全面而正式的表述是指:在任何约束条件下,一般而言,都必须令发生概率或发生概率和某种包括詹尼斯信息熵和Tsallis广义熵在内的广义熵之和最大,以同时实现

(1)在概率分布得以发生的前提下发生概率最大

(2)在系统约束条件等非自然约束条件下,某种包括詹尼斯信息熵和Tsallis广义熵在内的广义熵最大。

(三)普适约束条件

现在终于十分清楚了,一般而言,得以发生的平衡态概率分布

pi = f(xi),i = 1,2,...n同时满足自然约束条件,自洽约束条件和系统约束条件这三种普适约束条件。

所谓自然约束条件是指:

p1 + p2 + ...+ pn = 1    (2.7.1-1)

所谓自洽约束条件是指:

p/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n    (2.7.1-2)

所谓系统约束条件则是指:

p1x1 + p2x2 + ... + pnxn = 常量    (2.7.1-3)

系统约束条件就是历史上著名的“变量的统计平均值不变”。之所以系统约束条件在系统平衡态普遍存在,那是因为在系统平衡态位于广义能级x上的粒子数不再变化从而令系统的总广义能量

N(p1x1 + p2x2 + ... + pnxn)(这其中N是系统宏观粒子总数)

不变的缘故。

(四)最大发生概率原理

在任何约束条件下,广义系统的概率分布p1,p2,...,pn要得以发生,就必须令发生概率P最大。发生概率P满足式:P = p1 * p2 *...* pn 。尽管发生概率的概念既适合于广义向量,又适合于广义系统,但是,最大发生概率原理只针对广义系统。对于广义系统, p1 +  p2 + p3 +  ...+  pn = 1。

(五)齐普夫定律简介【2-4】

早在上个世纪30年代,就有人(Zipf)给出了齐普夫定律(Zipf’s Law):一个词在一个有相当长度的语篇中的等级序号(该词在按出现次数排列的词表中的位置,他称之为rank,简称r)与该词的出现次数(他称为frequency,简称f)的乘积几乎是一个常数(constant,简称C)。用公式表示,就是

r × f = C 。Zipf定律是文献计量学的重要定律之一,它和罗特卡定律、布拉德福定律一起被并称为文献计量学的三大定律。Zipf的专业是比较语文学,但是,以其名字命名的定律却早已走出语言学,进入了信息学、计算机科学、经济学、社会学、生物学、地理学、物理学等众多研究领域 ,在学术界享有极高的声誉。

(六)齐普夫标准负1次幂律的特点:

齐普夫标准负1次幂律的特点是自洽约束条件同了系统约束条件:

p1x1 + p2x2 + ... + pnxn = 常量    (2.7.1-3)

我们知道,所有基于拉格朗日乘数的现代统计力学和热力学的极值原理中,在自洽约束条件下唯独只有最大发生概率原理能够推导出作为最值或极值分布的已发生的分布,又因为对于齐普夫标准负1次幂律,自洽约束条件等同于系统约束条件,所以:在普适性的系统约束条件下唯独只有作为发生概率和广义熵同时最大原理的共同基础和重要组成部分的“科学新皇帝”最大发生概率原理能够推导出著名的齐普夫定律(Zipf's Law)。

(七)用最大发生概率原理推导出标准负1次幂律

对于标准负1次幂律pi=f(xi)=C/xi,i = 1,2,...,n,目标函数发生概率的对数log(P) = log(p1) + log(p2)+ ... + log( pn),自洽约束条件和系统约束条件(式(1-2)和式(1-3))以及自然约束条件,最大发生概率原理所对应的拉格朗日算子为

L = log(p1) + log(p2)+ ... + log( pn) + C1(p1 + p2 +...+ pn - 1)

+ C2(p1/f(x1) + p2/f(x2) +...+ pn/f(xn) - C3)

令拉格朗日算子L的一阶偏导数dL/dpi等于零,有:

dL/dpi = 1/pi + C1 + C2/f(xi) = 0

又命:

C1 = 0, C2 = -1

就有:

pi=f(xi)=C/xi    (2.7.1-4)

但是拉格朗日算子L的二阶偏导数矩阵是一主对角线上元素恒负而其余元素全为零的负定对称矩阵,因此令拉格朗日算子L的一阶偏导数dL/dpi为零的上述分布pi=f(xi)=C/xi也就是令约束条件下发生概率的对数log(P)或发生概率P最大的分布【2-1】。这种标准负1次幂律符合最大发生概率原理。

(八)齐普夫定律的本质

由以上推导可见齐普夫定律的本质是:齐普夫分布或标准负1次概率分布是在系统约束条件(变量的统计平均值不变)及与之相同的自洽约束条件发生概率最大的分布。

§2.7.2 用最大发生概率原理推导均匀分布

(一)均匀分布的特点

(1)均匀分布是现代统计力学和热力学中所有基于拉格朗日乘数法的有效极值原理在且仅在自然约束条件下的唯一共同最值或极值分布。在且仅在自然约束条件下,詹尼斯最大信息熵原理、Tsallis最大广义熵原理、最大发生概率原理最小平均概率原理【2-5】最小现代科学阴符数MSYFN原理【2-6】以及发生概率与广义熵同时最大原理等等均以均匀分布为唯一共同最值或极值分布。

(2)均匀分布在且仅在自然约束条件下发生,这时自洽约束条件同了自然约束条件。这是因为对于所发生的均匀分布pi = 1/n,i = 1,2,...,n,有自洽约束条件:

p1/(1/n) + p2/(1/n) +...+ pn/(1/n) = n    (1-1)

p1 + p2 + ... + pn = 1    (1-2)

(二)用最大发生概率原理推导均匀分布

对于均匀分布pi=f(xi)=1/n,i = 1,2,...,n,目标函数发生概率的对数log(P) =log(p1) + log(p2)+ ... + log( pn),自洽约束条件和自然约束条件(式(1-2)),最大发生概率原理所对应的拉格朗日算子为

L = log(p1) + log(p2)+ ... + log( pn) + C1(p1 + p2 +...+ pn - 1)

令拉格朗日算子L的一阶偏导数dL/dpi等于零,有:

dL/dpi = 1/pi + C1  = 0

pi = -1/C1,i = 1,2,...,n

因为:

p1 + p2 + ... + pn = 1    (1-2)

所以:

pi = 1/n,i = 1,2,...,n。C1 = -n。    (1-3)

但是拉格朗日算子L的二阶偏导数矩阵是一主对角线上元素恒负而其余元素全为零的负定对称矩阵,因此令拉格朗日算子L的一阶偏导数dL/dpi为零的上述均匀分布pi=1/n也就是令约束条件下发生概率的对数log(P)或发生概率P最大的分布【2-1】。这种均匀分布pi=1/n符合最大发生概率原理。

(三)均匀分布的物理意义

万法同归均匀分布,难道是偶然的吗?不是的!均匀分布是大自然大自在中事物的存在形式:平等遍历两两相互对立的各种广义方向。

§2.7.3用发生概率和广义熵同时最大原推导负指数分布的关键步骤

(一)关键步骤

对于任何处于平衡态的系统的非均匀概率分布p1,p2,...pn而言,一般说来,均存在自然约束条件自洽约束条件和系统约束条件,这是现代统计力学和热力学的过去认识模糊且不全面的一个地方。人们只是片面地认识到这三种同时存在的约束条件中的某一种或两种,因此导致以拉格朗日乘数法为基础的种种极值原理普遍存在不自洽和有违统计力学和热力学的根本因果律等重大理论问题。

所谓自然约束条件是指:p1 + p2 + ...+ pn = 1    (2.7.3-1)

自然约束条件之所以普遍存在,那是因为一切服从科尔莫哥洛夫概率公理的概率分布均具有规范性的缘故。

所谓自洽约束条件是指:

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n    (2.7.3-2)

自洽约束条件之所以在系统的平衡态普遍存在,那是因为一切在平衡态已发生的分布pi=f(xi)(i = 1,2,...,n)不再变化的缘故。

所谓系统约束条件则是指:

p1x1 + p2x2 + ... + pnxn = 常量    (2.7.3-3)

系统约束条件就是历史上著名的“变量的统计平均值不变”。之所以系统约束条件在系统平衡态普遍存在,那是因为在系统平衡态位于广义能级x上的粒子数不再变化从而令系统的总广义能量

N(p1x1 + p2x2 + ... + pnxn)(这其中N是系统宏观粒子总数)

不变的缘故。

在自然约束条件、自洽约束条件和系统约束条件下,所谓推导负指数分布f(xi)=aexp(-bxi),i = 1,2,...,n,就是要在给定约束条件下,根据拉格朗日乘数法选定目标函数,以确保负指数分布f(xi)=aexp(-bxi)即是最值分布或极值分布。由此可见推导负指数分布f(xi)=aexp(-bxi)的关键步骤就是选定目标函数。因为自洽约束条件,为使拉格朗日算子的一阶偏导数为零,最简单的方法就是在目标函数中包含发生概率的对数log(P);因为系统约束条件,为使拉格朗日算子的一阶偏导数为零,最简单的方法就是在目标函数中包含詹尼斯信息熵,于是就有了目标函数T = 发生概率的对数log(P)+ 詹尼斯信息熵。以上就是发明发生概率信息熵同时最大原理的真实过程。

(二)用发生概率信息熵同时最大原理推导负指数分布

对于平衡态负指数分布pi=f(xi)=aexp(-bxi),i=1,2,...,n

因为:

log(P) + S = -(p1-1)log(p1) -(p2-1)log(p2)-...-(pn-1)log(pn)(目标函数)

p1/f(x1) + p2/f(x2) +...+pn/f(xn) = 常数 = n (自洽约束条件)    

p1 + p2 +...+pn = 1  (自然约束条件)

又因为:

f(xi) = aexp(-bxi),i=1,2,...,n

p1x1 + p2x2 +... + pnxn = 常量

所以:

-p1log(f(x1))-p2log(f(x2))-...-pnlog(f(xn)) = 常量  (系统约束条件)

可构造拉格朗日算子

L = -(p1-1)log(p1) -(p2-1)log(p2)-...-(pn-1)log(pn)

+ C1(p1 + p2 +...+ pn - 1)

+  C2(p1/f(x1) + p2/f(x2) +...+ pn/f(xn) - C3)

+ C4(-p1log(f(x1))-p2log(f(x2))-...-pnlog(f(xn)) - C5)

对于拉格朗日算子L求一阶偏导数dL/dpi(i=1,2,...,n)并令之为零。有:

dL/dpi = -log(pi) -1 + 1 /pi + C1 + C2/f(xi) - C4log(f(xi))= 0,

i = 1,2,...,n。

当C1 = 1, C2 = -1,C4 = -1,有:

pi = f(xi) = aexp(-bxi),i = 1,2,...,n。        

但是拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵,因此令拉格朗日算子L一阶偏导数为零的上述负指数分布pi =aexp(-bxi)也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数 + 信息熵取得最大值或极大值的概率分布。这种负指数分布pi = aexp(-bxi)符合发生概率和信息熵同时最大原理

§2.7.4律成因新探与幂律分布的新推导

(一)律成因新探

幂律分布【2-7】广泛存在于物理学、地球与行星科学、计算机科学、生物学、生态学、人口统计学与社会科学、经济与金融学等众多领域中,且表现形式多种多样. 在自然界与日常生活中,包括地震规模大小的分布、月球表面上月坑直径的分布、行星间碎片大小的分布 、太阳耀斑强度的分布 、计算机文件大小的分布 、战争规模的分布 、人类语言中单词频率的分布 、大多数国家姓氏的分布 、科学家撰写的论文数的分布、论文被引用的次数的分布、网页被点击次数的分布 、书籍及唱片的销售册数或张数的分布、每类生物中物种数的分布、甚至电影所获得的奥斯卡奖项数的分布等,都是典型的幂律分布。尽管关于幂律成因有种种学说,但是本人根据冯向军一般化知觉模型对几乎所有流行的信息测度的统一而创关于幂律成因的一家之言:一切主观上的感觉量和客观上的信息量都是对客观刺激量及其变化的反应的测度。客观信息量之源和主观感觉量之源都是客观刺激量及其变化。客观信息量和主观感觉量与客观刺激量之间的关系服从同一个一般模型。这个一般模型就是冯向军一般化知觉模型【2-8】。客观信息量的变化deltaS与刺激量ST及其变化量deltaST之间服从如下幂律关系:

deltaS = -(ST)q-2deltaST    (2.7.4-1)  

-客观信息量的变化deltaS / 刺激量的变化deltaST =  刺激量的幂律(ST)q-2    (2.7.4-2)

并且以概率p为刺激而以必然事件的概率p=1为门槛刺激量(在门槛刺激量下客观信息量为零)时,作为客观信息量的具有概率p的单个事件的Tsallis信息量就形成了:

S = 具有概率p的单个事件的Tsallis信息量 = 1/(q-1)(1 - pq-1)        (2.7.4-3)

作为概率分布p1,p2,...,pn的平均客观信息量的平均Tsallis信息量就是著名的Tsallis广义熵:

Tsallis广义熵 = 1/(q-1)(1 - p1q -p2q -...- pnq)    (2.7.4-4)

幂律的成因是:幂律是因为在系统约束条件下作为概率分布p1,p2,...,pn的平均客观信息量的Tsallis广义熵必须最大的缘故而形成的。本文在此幂律成因理论的基础上,用发生概率和Tsallis广义熵同时最大原理推导出了标准幂律。

(二)用发生概率和Tsallis广义熵同时最大原理推导标准幂律

对于平衡态标准幂律分布pi=f(xi)=axi-b,b > 0,i=1,2,...,n,同时存在自然约束条件自洽约束条件和系统约束条件:

p1 + p2 +...+ pn = 1    (2.7.4-5)(自然约束条件)

p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) = 常数 = n    (2.7.4-6)(自洽约束条件)

p1x1 + p2x2 +...+ pnxn = 常量    (2.7.4-7)(系统约束条件)

因为:

log(P) + S = log(p1) + log(p2) +...+ log(pn) +

+ 1/(q-1)(1 - p1q -p2q -...- pnq )(目标函数)

可构造拉格朗日算子

L = log(p1) + log(p2) +...+ log(pn) +

+  1/(q-1)(1 - p1q -p2q -...- pnq ) +

+  C1(p1 + p2 +...+ pn - 1)

+  C2(p1/f(x1) + p2/f(x2) +...+ pn/f(xn) - C3)

+ C4(p1x1 + p2x2 +...+ pnxn - C5)

对于拉格朗日算子L求一阶偏导数dL/dpi(i=1,2,...,n)并令之为零。有:

dL/dpi =  1 /pi -q/(q-1)piq-1 + C1  + C2/f(xi) + C4xi= 0,

i = 1,2,...,n。

当C1 = 0, C2 = -1,a = (C4*(q-1)/q)1/(q-1),b = 1/(1 - q)时,有:

pi = f(xi) = axi-b    (2.7.4-8)  

又因为b > 0,所以q < 1。

但是当q > 0时拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵。因此,当 0 < q < 1时,令拉格朗日算子L一阶偏导数为零的上述标准幂律分布pi=f(xi)=axi-b也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数 + Tsallis广义熵取得最大值或极大值的概率分布。这种标准幂律分布pi=f(xi)=axi-b符合发生概率和Tsallis广义同时最大原理

§2.7.5用发生概率和Tsallis广义熵同时最大原理推导Tsallis分布

 当你亲手推导Tsallis 分布【2-9】,你才会晓得所谓Tsallis 分布是指如下所示的非标准非负1次幂律分布:

pi = a(1 -(1-q1)λxi)1/(1-q1),i = 1,2,...,n。(2.7.5-1)

这其中,q1 = 2 - q。

pi = a(1 -(q - 1)λxi)1/(q - 1),i = 1,2,...,n。(2.7.5-2)

当q -> 1 或 q1 -> 1,pi ->或还原成负指数分布aexp(-λxi),i = 1,2,...,n。

对于平衡态的Tsallis分布pi=f(xi),i=1,2,...,n,同时存在自然约束条件自洽约束条件和系统约束条件:

p1 + p2 +...+ pn = 1    (2.7.5-3)(自然约束条件)

p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) = 常数 = n    (2.7.5-4)(自洽约束条件)

p1x1 + p2x2 +...+ pnxn = 常量    (2.7.5-5)(系统约束条件)

因为:

log(P) + S = log(p1) + log(p2) +...+ log(pn) +

+ 1/(q-1)(1 - p1q -p2q -...- pnq )(目标函数)

可构造拉格朗日算子

L = log(p1) + log(p2) +...+ log(pn) +

+  1/(q-1)(1 - p1q -p2q -...- pnq ) +

+  C1(p1 + p2 +...+ pn - 1)

+  C2(p1/f(x1) + p2/f(x2) +...+ pn/f(xn) - C3)

+ C4(p1x1 + p2x2 +...+ pnxn - C5)

对于拉格朗日算子L求一阶偏导数dL/dpi(i=1,2,...,n)并令之为零。有:

dL/dpi =  1 /pi -q/(q-1)piq-1 + C1  + C2/f(xi) + C4xi= 0,

i = 1,2,...,n。

C2 = -1时,有:

pi = f(xi) = (C1(q-1)/q)1/(q-1)(1 + C4/C1xi)1/(q-1)

命:a = (C1(q-1)/q)1/(q-1)C4/C1 = -(q - 1)λ,有

pi = f(xi) = a(1 -(q - 1)λxi)1/(q - 1) = a(1 -(1-q1)λxi)1/(1-q1)    (2.7.5-6)

因为q < 1时,1/(q - 1) < 0, 又因为当q > 0时拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵。因此,当 0 < q < 1时,令拉格朗日算子L一阶偏导数为零的上述服从式(2.7.5-6)的Tsallis分布pi=f(xi)也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数 + Tsallis广义熵取得最大值或极大值的概率分布。这种Tsallis分布pi=f(xi)符合发生概率和Tsallis广义同时最大原理

§2.7.6大自然的宠儿幂律分布的重要特性:因果相对变化的相似性或不变弹性

相似性是几何学或分形几何学的概念,弹性则是经济学概念。所谓因果相对变化的相似性或不变弹性在数学上指的是同一回事。

对于在自变量x处可微的表示某种因果关系的因变量或函数y=f(x),如果

dy/y = k(dx/x)    (2.7.6-1)

并且k为常数,就称因变量或函数y=f(x)具有因果相对变化的相似性或不变弹性。这其中dx/x是自变量或因的相对变化,而dy/y则是因变量或果的相对变化。k = (dy/y)/(dx/x),在经济学上被称为弹性或弹性系数。当k为常数时,就称k为不变弹性或不变弹性系数。

我一直在猜想:作为大自然的宠儿的幂律分布,其存在是如此广泛以致几乎到了无所不在的地步,应该总有某种重要而根本的原因吧。因为世出世间一切事都逃不出因果,所以我一直在找大自然之所以如此偏爱幂律分布的因果律方面的原因。经过多年来不懈的努力探索,我终于恍然大悟:原来幂律分布如此普遍,或许原因无他,只因为幂律分布具有因果相对变化的相似性或不变弹性而已。

非常幸运而又值得一提的是,《关于决定性事件的概率论》所发明的发生概率和广义熵同时最大原理,可以在平衡态普遍存在的自然约束条件自洽约束条件和系统约束条件下,统一推导出齐普夫定律(Zipf's Law)所描述的标准负1次幂律各种标准非负1次幂律和非标准非负1次幂律:Tsallis分布。仅因此一发明《关于决定性事件的概率论》就应该问世应世济世。

§2.7.7用发生概率广义熵同时最大原理推导对数分布

 对于平衡态的对数分布pi=f(xi)=log(bxi+c),i=1,2,...,n,同时存在自然约束条件自洽约束条件和系统约束条件:

p1 + p2 +...+ pn = 1    (2.7.7-1)(自然约束条件)

p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) = 常数 = n    (2.7.7-2)(自洽约束条件)

p1x1 + p2x2 +...+ pnxn = 常量    (2.7.7-3)(系统约束条件)

我们来考察如下新的目标函数发生概率的对数log(P) + T。这其中:

T = nexp(1/(a*n)) -  exp(p1/a) - exp(p2/a) - ... -exp(pn/a))

当概率分布在自然约束条件下处于均匀分布时,T达到最大值零。

在变量的统计平均值不变的约束条件下,不失一般性,有:

p1(r1x1 + r2) + p2(r1x2 + r2) + ...+ pn(r1xn + r2) = 常量C (2.7.7-4)

这其中r1和r2是常数。又有自然约束条件:

于是拉格朗日算子为:

L = log(p1) + log(p2) + ... + log(pn)+

+ nexp(1/(an)) -  exp(p1/a) - exp(p2/a) - ... -exp(pn/a) +

+ C1(p1 + p2 +... + pn - 1) +

+ C2(p1(r1x1 + r2)+ p2(r1x2 + r2) + ...+ pn(r1xn + r2) - C3)

+ C4(p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) - n)

拉格朗日算子L求一阶偏导数dL/dpi并令之为零,就有:

dL/dpi = 1/pi -1/a *exp(pi/a) + C1 + C2(r1xi + r2) + C4/f(xi) = 0

当 C4 = -1,pi = f(xi) = a*log(a*(C1 + C2(r1xi + r2)))

命:

b = a*C2*r1, c = a*C1 + a*C2*r2

有:

pi = a*log(bxi + c), i = 1,2,...,n (2.7.7-5)

这就是对数分布。

但是拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵。因此,令拉格朗日算子L一阶偏导数为零的上述服从式(2.7.7-5)的对数分布pi也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数log(P) + 广义熵T取得最大值或极大值的概率分布。这种对数分布pi符合发生概率和广义同时最大原理

对数分布的一个实用例子就是作为概率分布的归一化于宏义观控隶属度【2-10】。对于作为概率分布的归一化于宏义观控隶属度,有:

xi = i,i = 1,2,...,n。

a = 1/(log(n+1)*(F(1) + F(2) + ...+ F(n)))

b = -1

c = n + 2

p(I) = a*log(n+2-I), I = 1,2,...,n (1-4)

这其中 F(I)是定性序号或名次I所对应的于宏义观控隶属度,I = 1,2,...,n。


图一  观控隶属度F(I)与定性序号或名次I之间的关系

§2.7.8平衡态的一般化系统约束条件

(一)平衡态的一般化系统约束条件  

在先前的篇章中,我们强调了平衡态的概率分布pi = f(xi)所普遍承受的三种约束条件:自然约束条件自洽约束条件和系统约束条件。这三种约束条件的数学表达式如下所示。

p1 + p2 + p3 +...+ pn = 1    (2.7.8-1)(自然约束条件)

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = n    (2.7.8-2)(自洽约束条件)

p1x1 + p2x2 + ... + pnxn = 常量    (2.7.8-3) (系统约束条件)

这其中自然约束条件自洽约束条件的形式相对不变。

但是现在看来,系统约束条件的形式不仅可以变化而且可以多样化。这是因为,在平衡态,变量概率以及整体与部分的所有关系都是确定不变的缘故。因此我们有如下平衡态的一般化系统约束条件:

p1fp(x1) + p2fp(x2) + ... + pnfp(xn) = 常量    (2.7.8-4)

这其中fp(xi)是关于xi的某一符合实际和需要的函数,

i = 1,2,...,n。

上述平衡态的一般化系统约束条件将极大地扩展最大发生概率原理以及发生概率和广义熵同时最大原理的实用范围。本文将用平衡态一般化系统约束条件来推导正态分布对数正态分布等概率分布并重新推导幂律。

(二)用最大发生概率原理推导正态分布

在平衡态,固然变量的算术统计平均值可视为不变。但是任意的由确定的概率分布和与之相对应的确定的一组变量值所决定的函数fp(x),其统计平均值又何尝不可视为不变呢?一旦认可在平衡态任意函数fp(x)的统计平均值均可视为不变,那么发生概率本身也就变成了一种功能强大的决定系统状态和分布的广义熵,而最大发生概率原理本身就是一种功能强大的发生概率广义熵同时最大原理,可用来推导种种常见分布。

对于平衡态的正态分布pi=f(xi)=aexp(-b(x-m)2),这其中a、b、m均为常量,同时存在如下所示的三种约束条件:

p1 + p2 +...+ pn = 1    (自然约束条件)

p1/aexp(+b(x1-m)2) + p2/aexp(+b(x2-m)2) +...+

+ pn/aexp(+b(x1-m)2) = n (自洽约束条件)

p1/aexp(+b(x1-m)2) + p2/aexp(+b(x2-m)2) +...+

+ pn/aexp(+b(x1-m)2) = n

(同了自洽约束条件的一般化系统约束条件)

自洽约束条件和同了自洽约束条件的一般化系统约束条件可统一表达为:p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = n

于是最大发生概率原理所对应的拉格朗日算子为:

L = log(p1) + log(p2) + ... + log(pn)+

+ C1(p1 + p2 +... + pn - 1) +

+ C4(p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) - n)

拉格朗日算子L求一阶偏导数dL/dpi并令之为零,就有:

dL/dpi = 1/pi  + C1  + C4/f(xi) = 0

当 C4 = -1,C1 = 0 ,有:

pi = f(xi) = a*exp(-b(xi-m)2), i = 1,2,...,n (2.7.8-5)

这就是正态分布。

但是拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵。因此,令拉格朗日算子L一阶偏导数为零的上述服从式(2.7.8-5)的正态分布pi也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数log(P)取得最大值或极大值的概率分布。这种正态分布pi符合发生概率最大原理

(三)用最大发生概率原理推导对数正态分布

 对于平衡态的对数正态分布pi=f(xi)=a/xi*exp(-b(x*log(xi)-m)2),这其中a、b、m均为常量,同时存在如下所示的三种约束条件:

p1 + p2 +...+ pn = 1    (自然约束条件)

p1*x/aexp(+b(log(x1)-m)2) + p2*x2/aexp(+b(log(x2)-m)2) +...+

+ pn*xn/aexp(+b(log(x1)-m)2) = n (自洽约束条件)

p1*x/aexp(+b(log(x1)-m)2) + p2*x2/aexp(+b(log(x2)-m)2) +...+

+ pn*xn/aexp(+b(log(x1)-m)2) = n

(同了自洽约束条件的一般化系统约束条件)

自洽约束条件和同了自洽约束条件的一般化系统约束条件可统一表达为:p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = n

于是最大发生概率原理所对应的拉格朗日算子为:

L = log(p1) + log(p2) + ... + log(pn)+

+ C1(p1 + p2 +... + pn - 1) +

+ C4(p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) - n)

拉格朗日算子L求一阶偏导数dL/dpi并令之为零,就有:

dL/dpi = 1/pi  + C1  + C4/f(xi) = 0

当 C4 = -1,C1 = 0 ,有:

pi = f(xi) = a/xi*exp(-b(log(xi)-m)2), i = 1,2,...,n (2.7.8-6)

这就是对数正态分布。

但是拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵。因此,令拉格朗日算子L一阶偏导数为零的上述服从式(2.7.8-6)的对数正态分布pi也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数log(P)取得最大值或极大值的概率分布。这种对数正态分布pi符合发生概率最大原理

(四)用最大发生概率原理重新推导幂律分布

 对于平衡态的幂律分布pi=f(xi)=axi-b,这其中a、b均为常量,同时存在如下所示的三种约束条件:

p1 + p2 +...+ pn = 1    (自然约束条件)

p1/ax1+b + p2/ax2+b +...+  pn/axn+b = n (自洽约束条件)

p1/ax1+b + p2/ax2+b +...+  pn/axn+b = n (自洽约束条件)

(同了自洽约束条件的一般化系统约束条件)

自洽约束条件和同了自洽约束条件的一般化系统约束条件可统一表达为:p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = n

于是最大发生概率原理所对应的拉格朗日算子为:

L = log(p1) + log(p2) + ... + log(pn)+

+ C1(p1 + p2 +... + pn - 1) +

+ C4(p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) - n)

拉格朗日算子L求一阶偏导数dL/dpi并令之为零,就有:

dL/dpi = 1/pi  + C1  + C4/f(xi) = 0

当 C4 = -1,C1 = 0 ,有:

pi = f(xi) = axi-b, i = 1,2,...,n (2.7.8-7)

这就是对数正态分布。

但是拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵。因此,令拉格朗日算子L一阶偏导数为零的上述服从式(2.7.8-7)的幂律分布pi也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数log(P)取得最大值或极大值的概率分布。这种幂律分布pi符合发生概率最大原理

§2.8最大发生概率原理与波函数坍缩

§2.8.1经验两类分:共时性的全面经验和历时性的片面经验

一眼望去,你看到桌子上有一个萍果和两只香蕉。这就是一种简单的共时性的全面经验。从其本质上来看,这种简单的共时性的全面经验甚至可以堪称:“神目如电”。通过这一简单的共时性的全面经验,你就知道了:

(一)桌子上的水果的真相是决定性的或确定性的具有一定复杂程度的复杂整体:同时具有1/3的萍果和2/3的香蕉两种成份的复杂整体。

(二)概率分布就是对水果的真相:具有一定复杂程度的复杂整体的复杂程度之共时性测度。

但是对桌子上的水果的随机试验或随机抽样却是一种片面的历时性经验:

(1)每次在桌子上抽取一个水果这种一次性随机试验或随机抽样的结果必然是不确定的。这种一次随机试验或随机抽样的结果不确定的必然性恰好证明一次随机试验或随机抽样这种经验的先天不足。这种先天不足就是不能全面测度桌子上的水果的真相:决定性的或确定性的具有一定复杂程度的复杂整体。

(2)大量历时的随机试验或随机抽样又必然具有统计确定性:抽得萍果的频率的极限为1/3而抽得香蕉的频率的极限为2/3。这种统计确定性也恰好体现事情的真相:桌子上的水果的确定性的复杂程度。

如此看来所谓随机试验或随机抽样是一种片面的历时的经验。每一次随机试验或随机抽样都不能全面地测度事情的真相而大量历时的随机试验或随机抽样却能无限逼近事情的真相。

§2.8.2波函数坍缩是以作为片面的经验的测量来测度真相的必然结局

 叠加原理是量子力学中的一个基本原理,它说明了波函数的性质。如果ψ1是体系的一个本征态,对应的本征值为A1ψ2是体系的另一个本征态,对应的本征值为A2,那么根据薛定鄂方程的线性性,叠加态ψ = C1ψ1 + C2ψ2也是体系一个可能的存在状态。但是在一次测量结果中,体系可能的存在状态ψ却只可能取ψ1态或ψ2态而不可能同时既是ψ1态又ψ2态,而且系统取ψ1态的概率是|C1|2而取ψ2态的概率是|C2|2如果在这个状态ψ下对可观察量A进行测量,测量到的A值也要么是A1要么是A2,测得A1A2 的概率之比为 |C1|2/ |C2|2。这就是所谓的量子态坍缩或波函数坍缩。

定理1:假如体系可能存在的叠加状态ψ以确定性概率分布同时拥有ψ1ψ2态两种成份,而作为片面的经验的测量却只允许ψ在一次测量中要么取ψ1态要么取ψ2态,就必有:在一次测量结果中,体系可能的存在状态ψ以最大发生概率要么取ψ1态,要么取ψ2态。

证明:假设A=一次测量的结果是ψ1态而非A=一次测量的结果是ψ2态。A=(1,0)而非A=(0,1)。A与非A是代表两个相互对立的广义方向的单位向量。那么,不失一般性,总有一次测量ψ的取值的结局R = p1A + p2非A。这其中p1和p2是科尔莫哥洛夫概率分布。 对于一次测量结果R,同时存在自然约束条件、自洽约束条件和非自然约束条件。

p1 + p2 = 1    (1-1) (自然约束条件)

pi - fi = 0,i = 1或2    (1-2) (自洽约束条件)

pi - 1 = 0,i = 12   (1-3) (测量所强加的非自然约束条件)

因为目标函数为发生概率的对数log(P),可构造拉格朗日算子L

L = log(p1) + log(p2) +

+ C1(p1 + p2 -1) +

+ C2(pi - fi) +

+ C3(pi - 1)

对拉格朗日算子L求关于p1和p2以及C1,C2和C3的一阶偏导数并令之为0,就有:

1/pi + C1 + C2 + C3 = 0 ,i = 1或2   (1-4)

1/pj + C1 + C2 = 0,j = 2或1    (1-5)

p1 + p2  - 1 = 0    (1-6)

pi - fi = 0,i = 1或2    (1-7)

pi -1 = 0,i = 1或2    (1-8)

就有:

pi = fi = 1,i = 1或2

pj = fj = 0,j = 2或1。

ψ的取值的结局R是要么取ψ1态,要么取ψ2态。

但是拉格朗日算子的二阶偏导数矩阵是一主对角线上元素恒负而其余元素全为零的负定矩阵,因此上述令拉格朗日算子L一阶偏导数为零的概率分布

pi = fi = 1,i = 1,2;

pj = fj = 0,j = 2,1。

必定也是令约束条件下的发生概率的对数取最大值的分布。这种分布符合最大发生概率原理。换句话说: 假如体系可能存在的叠加状态ψ以确定性概率分布同时拥有ψ1ψ2态两种成份,而作为片面的经验的测量却只允许ψ在一次测量中要么取ψ1态要么取ψ2态,就必有:在一次测量结果中,体系可能的存在状态ψ以最大发生概率要么取ψ1态,要么取ψ2态。

证毕。    

引理:(伯努利大数定律)设fn为n重伯努利试验中事件A发生的次数,p为A在每次试验中发生的概率,则对任意给定的实数ε>0,有图片中的数学公式成立,即n趋向于无穷大时,事件A在n重伯努利中发生的频率fn/n无限接近于事件A在一次试验中发生的概率p。


定理2:假如体系可能存在的叠加状态ψ以确定性概率分布|C1|2|C2|2同时拥有ψ1ψ2态两种成份,而作为片面的经验的测量却只允许ψ在一次测量要么以概率|C1|2ψ1态要么以概率|C2|2ψ2态,就必有经过n次重复测量且n趋向于无穷大时,测得ψψ1态的频率无限逼近|C1|2ψψ2态的频率无限逼近|C2|2

证明:由引理中所示的伯努利大数定律,定理2得证。  

§2.8.3波函数为什么会坍缩?一种非常合情合理的假说

§2.8.2前文已说道:波函数之所以必然会坍缩,是因为以作为片面的经验的测量来测度真相的必然结局。那么为什么所有的量子测量都必然是片面的呢?那是因为所有的测量本身都服从二元对立或二分性的原则。测量的前提是有对能测者和所测者的执着和分别。能测者就是能测者;所测者就是所测者;能测者绝对不是所测者而所测者也绝对不是能测者。这就是所有的量子测量本身都服从的第一个二元对立或二分性的原则。其次所有的测量本身都对所测对象同时间同空间客观存在着的相互对立的本征态1与本征态2按二元对立或二分性的原则来执着和分别:本征态1(例如薛定鄂猫的生)就是本征态1;本征态2(例如薛定鄂猫的死)就是本征态2在测量结果中绝对不允许本征态1(例如薛定鄂猫的生)同时间同空间又本征态2(例如薛定鄂猫的死);绝对不允许本征态2(例如薛定鄂猫的死)同时间同空间又本征态1(例如薛定鄂猫的生)。这就是所有的量子测量本身都服从的第二个二元对立或二分性的原则。因为所有的量子测量都服从上述两种带根本性的二元对立或二分性的原则的缘故,所有的量子测量都必然是不能同时全面地反映事情的真相的片面经验,因此必然导致波函数坍缩。

§2.9 统计力学第二定理:关于分布成因的定理

 统计力学第二定理产生概率p(x)变化的原因是与变量值x1和x2相对应的概率的信息量变化:

deltaS = -log(p(x2))-(-log(p(x1))    (2.9-1)

总有:p(x1)/p/(x2) = exp(deltaS)    (2.9-2)

概率的信息量变化deltaS = 广义的玻尔兹曼熵log(W)的变化(2.9-3)

概率的信息量变化deltaS = 广义的克劳修斯熵的变化    (2.9-4)

广义的玻尔兹曼熵log(W)的变化 = 广义的克劳修斯熵的变化。

广义的克劳修斯熵的定义表达式是:

广义的克劳修斯熵 = -log(f(x)/a)    (2.9-5)

这其中f(x)是所产生的分布,f(x) = af1(x),而f1(x)=f(x)/a 则是所产生的分布的形态。广义的玻尔兹曼熵是系统微观状态总数,实际上代表一种发生概率。广义的克劳修斯熵是平衡态的或最大的广义的玻尔兹曼熵,因此代表一种最大的发生概率。以广义的玻尔兹曼熵log(W)的变化 = 广义的克劳修斯熵的变化来决定概率分布实际上是一种最大发生概率原理。

概率的信息量变化deltaS = n0p0    (2.9-6)

这其中,W是系统的微观状态总数,n0是把变量间隔(0,x2)等分的等分数n2与变量间隔(0,x1)等分的等分数n1之差。n0=n2-n1。p0则是在任意一个足够小的变量等分上作为伯努利事件的指定事件出现的概率。

证明:

因为任何具有概率p > 0的单一事件的信息量=-log(p),所以变量值x1和x2相对应的概率p(x1)和p(x2)的信息量变化:deltaS = -log(p(x2))-(-log(p(x1)),式(2.9-1)成立。

由式(1-1),自然总有:p(x1)/p/(x2) = exp(deltaS),式(2.9-2)成立。

考察仅有两个广义能级x1和x2(x2 > x1)所组成的系统。处于能级x1上的的粒子数为n1,而处于能级x2上的粒子数为n2,n1+n2=N。当系统获得广义能量x2-x1使得在新的平衡态处于能级x1上的粒子数少了一个而处于能级x2上的粒子数多了一个。就有新旧两个平衡态所对应的系统微观状态总数W1和W2分别为:W1=N!/(n1!n2!)以及

W2=N!/((n1-1)!(n2+1)!)。因为与变量值x1和x2相对应的概率的信息量变化为:

deltaS= -log(p(x2))-(-log(p(x1))

=log(p(x1)/p(x2))=log(n1/n2),又因为广义的玻尔兹曼熵log(W)的变化

=log(W2)-log(W1)

=log(W2/W1)=log(n1/(n2+1))=log(n1/n2) (这是因为n2远大于1的缘故),就有:

概率的信息量变化deltaS = 广义的玻尔兹曼熵log(W)的变化,式(2.9-3)成立。  

作为热温商Q/T的狭义的克劳修斯熵是平衡态的玻尔兹曼熵。因为平衡态的玻尔兹曼熵最大,所以狭义的克劳修斯熵也就是最大的玻尔兹曼熵。所谓广义的克劳修斯熵就是与平衡态的任意给定的分布f(x)相对应的最大的广义的玻尔兹曼熵。所以由式(2.9-3)立即有:

概率的信息量变化deltaS = 广义的克劳修斯熵的变化,式(2.9-4)得证。

因为对应于玻尔兹曼分布f(Q)=aexp(-Q/(kT))的狭义的克劳修斯熵或最大的玻尔兹曼熵klog(W)=Q/T,所以狭义的克劳修斯熵的本质是狭义的克劳修斯熵=-klog(f(Q)/a)。因为

广义的玻尔兹曼熵=log(W)=玻尔兹曼熵klog(W)/k,所以对于玻尔兹曼分布,有:

广义的克劳修斯熵=狭义的克劳修斯熵/k=-log(f(Q)/a)

将上式推广至所形成的任意分布f(x)就有:

广义的克劳修斯熵=-log(f(x)/a),定义式(1-5)由此而生。因为对于所形成的分布f(x),有p(x1)=f(x1),p(x2)=f(x2),所以由式(1-5)所定义的广义的克劳修斯熵满足式(2.9-4)

考察由n次伯努利随机试验所组成的随机现象,它满足以下条件:1)重复进行n次随机试验;2)n次实验相互独立;3)每次实验仅有两个可能结果;4)每次实验中给定事件出现的概率为p,不出现的概率为1-p。假设X表示n次独立重复的伯努利试验中给定事件出现的次数,显然X是可以取0,1,…,n等n+1个值的离散随机变量。设这n次实验中,每个“给定事件出现k次的结果”为Ek,显然Ek的发生概率为pk(1-p)n-k。因为这样的结果有:n!/k!(n-k)!个,所以按照柯尔莫哥洛夫概率的可加性,这n次实验中,给定事件出现k次的概率

P(X=k) = n!/(k!(n-k)!)pk (1-p)(n-k)        (2.9-7)

假设把变量x等分成n个变量片段。当n足够大时,在每个等分变量片段上给定事件要么出现1次,要么不出现。又假设给定事件出现(1次)的概率p0与变量x及其等分数n成一较为复杂的待定函数关系,有:p0 =λy(x)/n,np0 =λy(x)。这其中y(x)是关于变量x的待定函数。 按(1-7)式,变量间隔x之给定事件出现的概率的分布为

P(X = k) = n!/(k!(n-k)!)(λy(x)/n)k (1-λy(x)/n)(n-k)        (2.9-8)

P(X = k) = n!/(nk(n-k)!)(1-λy(x)/n)-kλy(x))k/k!(1-λy(x)/n)n

考察给定事件在变量间隔x以后才出现的概率P0(x),就有:

P0(x) = P(X=0) = (1-λy(x)/n)n    (2.9-9)

当n->无穷大,有:

P0(x) = exp(-λy(x))    (2.9-10)

假设在变量间隔x以后才出现的指定事件的概率为f(x)。就有:

f(x) =  exp(-λy(x))

f(x)的信息量 = -log(f(x)) = λy(x) = np0    (2.9-11)

概率的信息量变化deltaS=-log(f(x2)-(-log(f(x1))=n2p0-n1p0=(n2-n1)p0=n0p0  

式(2.9-6)得证。

§2.10 彻底突破二元对立或二分性的革命性统计力学第三定理的证明及其推论

 统计力学第三定理:无任何非自然约束条件下,任何存在A都在时间和空间等存在的形式上,与其对立面非A平等地合一:平等的A与非A以最大发生概率同时空发生。以上现代统计力学和热力学新世代的统计力学第三定理之所以被称为定理,那是因为可以简明地给出这第三定理的数学证明。 对于概率分布p1,p2,...,pn,上述发生概率P有确切定义:

P = p1 * p2 *...* pn (2.10-1)

 证明:假设传统意义下的存在A = 我 =(1,0),那么就有传统意义下的存在A的对立面非A  = 非我 = (0,i * 1), i = +1 或 i = -1。这也就是:传统意义下的存在A或我与其对立面非A或非我可表达为相互垂直正交或对立的两个单位向量。不失一般性,“我”这一事件可以表达为以A和非A为基础所构成的二维正交坐标系中的归一化向量。

“我”= p1A + p2非A = p1(1,0)+ p2(0,i * 1)    (2.10-2)

这其中,p1“我”表现为A或我的概率。p2“我”表现为非A或非我的概率。p1 + p2 = 1,有:P = p(A) * p(非A/A)    (2.10-3)

这其中,P是“我”的发生概率,p(A)是“我”表现为A或我的概率,而p(非A/A)则是在“我”表现为A或我的前提下,“我”表现为非A或非我的概率。

于是:

P = p1 * p2 = p1 * (1-p1) = -(p1-0.5)2 + 0.52    (2.10-4)

由此可见若按非此即彼的二元对立或二分性:要么“我”绝对是A或我,要么“我绝对是非A或非我“我”的发生概率其实都最小,等于0,因为这时p1 = 1 或 p1 = 0,按(2.10-3)式都将导致“我”的发生概率P = 0的缘故。唯有“我”是以0.5的概率具有A或我的成份又完全平等地以0.5的概率具有非A或非我的成份“我”的发生概率才最大,这是因为 p1 = p2 = 0.5,按(2.10-3)式 将导致P取最大值0.25。此时,

“我”= 叠加态0.5A + 0.5非A = 0.5我 + 0.5非我   (2.10-5)

用完全类似的方法可以证明:唯有“非我”是以0.5的概率具有A或我的成份又完全平等地以0.5的概率具有非A或非我的成份“非我”的发生概率才最大。所以按照“科学新皇帝”最大发生概率原理就必有:无任何非自然约束条件下,

“我”=“非我”= 叠加态0.5A + 0.5非A = 0.5我 + 0.5非我     (2.10-6)

这也就是说: 在无任何非自然约束条件下,任何存在A都在时间和空间等存在的形式上,与其对立面非A平等地合一:平等的A与非A以最大发生概率同时空发生,成就相同的“我”与“非我”:叠加态0.5A + 0.5非A

证毕。

三定理的推论:无任何非自然约束条件下,任何道法自然的存在“我”和“非我”都在时间和空间等存在的形式上自然彻底突破二元对立或两分性:(1)自然彻底突破二元对立或两分性的我执性。对于任何存在“我”和“非我”而言:“我”就是我;“非我”就是非我这个观点不再成立。“我”不是我(A);“非我”不是非我(非A);“我”与“非我”以最大发生概率及0.5和0.5这种均匀概率分布同时间同空间具有A与非A两种成份:处于叠加态0.5A + 0.5非A = 0.5我 + 0.5非我(2)自然彻底突破二元对立或两分性的完全可分别性。“我”绝对不是非我(非A);“非我”绝对不是我(A)这个观点也不再成立。“我”与“非我”以最大发生概率及0.5和0.5这种均匀概率分布同时间同空间具有A与非A两种成份:处于叠加态0.5A + 0.5非A = 0.5我 + 0.5非我

§2.11 与牛顿力学中牛顿三大定律相对应的统计力学三大定理汇总

 统计力学第一定理在无任何非自然约束条件下,一切分布均以最大发生概率成为均匀分布。

 统计力学第二定理产生概率p(x)变化的原因是与变量值x1和x2相对应的概率的信息量变化:

deltaS = -log(p(x2))-(-log(p(x1))    (2.11-1)

总有:p(x1)/p/(x2) = exp(deltaS)    (2.11-2)

概率的信息量变化deltaS = 广义的玻尔兹曼熵log(W)的变化(2.11-3)

概率的信息量变化deltaS = 广义的克劳修斯熵的变化    (2.11-4)

广义的玻尔兹曼熵log(W)的变化 = 广义的克劳修斯熵的变化。

广义的克劳修斯熵的定义表达式是:

广义的克劳修斯熵 = -log(f(x)/a)    (2.11-5)

这其中f(x)是所产生的分布,f(x) = af1(x),而f1(x)=f(x)/a 则是所产生的分布的形态。广义的玻尔兹曼熵是系统微观状态总数,实际上代表一种发生概率。广义的克劳修斯熵是平衡态的或最大的广义的玻尔兹曼熵,因此代表一种最大的发生概率。以广义的玻尔兹曼熵log(W)的变化 = 广义的克劳修斯熵的变化来决定概率分布实际上是一种最大发生概率原理。

概率的信息量变化deltaS = n0p0    (2.11-6)

这其中,W是系统的微观状态总数,n0是把变量间隔(0,x2)等分的等分数n2与变量间隔(0,x1)等分的等分数n1之差。n0=n2-n1。p0则是在任意一个足够小的变量等分上作为伯努利事件的指定事件出现的概率。

 统计力学第三定理: 在无任何非自然约束条件下,任何存在A都在时间和空间等存在的形式上,与其对立面非A平等地合一:平等的A与非A以最大发生概率同时空发生。 以上现代统计力学和热力学新世代的统计力学第三定理之所以被称为定理,那是因为可以简明地给出这第三定理的数学证明。对于概率分布p1,p2,...,pn,上述发生概率P有确切定义:P = p1 * p2 *...* pn

 统计力学三定理的推论:无任何非自然约束条件下,任何道法自然的存在“我”和“非我”都在时间和空间等存在的形式上自然彻底突破二元对立或两分性:(1)自然彻底突破二元对立或两分性的我执性。对于任何存在“我”和“非我”而言:“我”就是我;“非我”就是非我这个观点不再成立。“我”不是我(A);“非我”不是非我(非A);“我”与“非我”以最大发生概率及0.5和0.5这种均匀概率分布同时间同空间具有A与非A两种成份:处于叠加态0.5A + 0.5非A = 0.5我 + 0.5非我(2)自然彻底突破二元对立或两分性的完全可分别性。“我”绝对不是非我(非A);“非我”绝对不是我(A)这个观点也不再成立。“我”与“非我”以最大发生概率及0.5和0.5这种均匀概率分布同时间同空间具有A与非A两种成份:处于叠加态0.5A + 0.5非A = 0.5我 + 0.5非我

参考文献

【2-1】田学全 李青,的方法,塔里木农垦大学学报,第14卷第3期,2002年9月。https://wenku.baidu.com/view/f84592324a7302768e9939f4.html

【2-2】冯向军,《关于决定性事件的概率论》的里程碑:发生概率和信息熵同时最大原理,科学网,2017年7月24日。http://blog.sciencenet.cn/blog-1968-1067848.html

【2-3】冯向军,发生概率和Tsallis广义熵同时最大原理,科学网,2017年7月24日。http://blog.sciencenet.cn/blog-1968-1067918.html

【2-4】Zipf定律,360百科,https://baike.so.com/doc5509828-5745574.html

【2-5】冯向军,关于平均概率的系统性研究,科学网,2017年6月12日。

http://blog.sciencenet.cn/blog-1968-1060381.html

【2-6】冯向军,n元现代科学阴符数(n-ary MSYFN ),科学网,2017年7月8日。http://blog.sciencenet.cn/blog-1968-1065135.html

【2-7】百度百科,幂律分布。https://baike.baidu.com/item/%E5%B9%82%E5%BE%8B%E5%88%86%E5%B8%83/4281937?fr=aladdin

【2-8】冯向军,冯向军一般化知觉模型及其对几乎所有的信息测度的统一,科学网,2017年6月30日。http://blog.sciencenet.cn/blog-1968-1063880.html

【2-9】Wikipedia,Tsallis distribution,https://en.wikipedia.org/wiki/Tsallis_distribution

【2-10】冯向军,基于概率的于宏义观控测度,科学网,2017年6月17日。http://blog.sciencenet.cn/blog-1968-1061285.html










https://wap.sciencenet.cn/blog-1968-1072135.html

上一篇:关于决定性事件的概率论第一章
下一篇:《关于决定性事件的概率论》的序章
收藏 IP: 45.56.155.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-18 02:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部