冯向军的科学研究博客分享 http://blog.sciencenet.cn/u/冯向军 在本博客中专门从事以统计力学为核心的理论物理研究。

博文

现代统计力学和热力学的“前世”与“今生”的详细对比

已有 2049 次阅读 2017-8-1 20:14 |个人分类:决定性概率论|系统分类:论文交流| 现代热力学和统计力学

现代统计力学和热力学的“前世”与“今生”的详细对比

美国归侨冯向军博士,2017年8月1日写于美丽故乡



【摘要】《关于决定性事件的概率论》对于现代统计力学和热力学的贡献是划时代的。本文详细对比了现代统计力学和热力学的“前世”与“今生”。

【自洽性的定义】无须任何什么极值原理都知道:若把概率分布pi固定在特定分布f(xi)上,或令:

pi = f(xi),i = 1,2,...,n    (1-1)

那么pi = f(xi)就是上述约束条件下的任何目标函数的最值点或极值点或者说最值分布或极值分布。这是因为可能的分布唯一的缘故。因此任何基于拉格朗日乘数法的极值原理,想要配得上“自洽”的美称就必须在式(1-1)所示的约束条件下导出最值点或极值点或者说最值分布或极值分布:

pi = f(xi)

因此就定义:任何基于拉格朗日乘数法的极值原理,若在式(1-1)所示的约束条件下能够导出最值点或极值点或者说最值分布或极值分布:

pi = f(xi)

就称这个极值原理是自洽的,否则就称这个极值原理是不自洽的。

【发生概率的定义】

一般而言发生概率就是事情能发生、存在或出现的概率。因为事情得以发生、存在或出现的原因以及所遵循的规律各各不同,因此发生概率的具体表现形式是多样化的。狭义的发生概率则是指在两两相互垂直、正交或对立的n个广义方向上具有概率分布p1,p2,...,pn的广义系统G能发生、存在或出现的概率

P = p1 * p2 *...* pn        (1-2)

《关于决定性事件的概率论》中发生概率专指服从式(1-2)的狭义的发生概率。假设广义系统 G = (p1,p2,...,pn),那么

G = p1(1,0,...,0)+

+ p2(0,1,...,0)+

+ ...+

+ pn(0,0,...,1)        (1-3)

由此可见,具有概率分布p1,p2,...,pn的广义系统要发生,就必须同时以概率p1,p2,...,pn在代表n个两两垂直、正交或对立的广义方向的单位向量(1,0,...,0),(0,1,...,0),...,(0,0,...,1)上发生。因此所谓发生概率就是广义系统得以发生的概率或广义系统同时以概率p1,p2,...,pn在n个两两垂直、正交或对立的广义方向上得以发生的概率。

现代统计力学和热力学“前世”与“今生”的极值原理的自洽性】

现代统计力学和热力学“前世”的极值原理一般而言都不具备自洽性,而现代统计力学和热力学“今生”的极值原理具备自洽性。

现代统计力学和热力学“前世”与“今生”的极值原理所导出的分布的发生概率】

现代统计力学和热力学“前世”的极值原理所导出的分布一般而言都不具备给定约束条件下的最大发生概率,而现代统计力学和热力学“今生”的极值原理所导出的分布具备给定约束条件下的最大发生概率

现代统计力学和热力学“前世”与“今生”的极值原理的梦想与现实】

现代统计力学和热力学“前世”的极值原理都梦想在一个统一的目标函数下,配合所选定的非自然约束条件来确定所选定的非自然约束条件下的唯一分布或所有分布。但现实是这一梦想均未得以实现。先是在1957年至1988年这31年间独霸现代统计力学和热力学科学舞台的詹尼斯最大信息熵原理就一直在预言:按最大信息熵原理,在变量的统计平均值为不变的特定值这一非自然约束条件下,变量所服从的分布是唯一确定的负指数分布。到了1988年,巴西人Tsallis所提出的并为日后众多领域中的越来越多的复杂系统所应证的最大Tsallis广义熵原理就宣告了上述詹尼斯最大信息熵原理重要预言的破产:在变量的统计平均值为不变的特定值这一非自然约束条件下,变量所服从的分布不是确定而是很不确定:既可以是负指数分布又可以是由独立变量q的无穷多个值所决定的无穷多个不同的非标准幂律分布。但是在所选定的非自然约束条件下,Tsallis广义熵也给不出所有可能的分布,这是因为象Tsallis广义熵原理那样仅仅只是能够令分布在非自然约束条件下最大限度地逼近自然约束条件下的均匀分布的极值原理不唯一的缘故。

 现代统计力学和热力学“今生”的极值原理的现实是:

定理:对于任意给定的概率分布形态f(xi),以下自洽约束条件

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n    (1-4)

外加自然约束条件

p1 + p2 +...+ pn = 1    (1-5)

以最大发生概率唯一决定满足自洽性的概率分布

pi = f(xi),i = 1,2,...n。

【均匀分布】

根据上述定理,以最大发生概率唯一决定满足自洽性的均匀分布

p1 = p2 =...=pn = 1/n

的自洽约束条件是:

p1*n + p2*n + ...+ pn*n = 常数 = n

p1 + p2 +...+ pn = 1

这也就是说:对于均匀分布而言,自洽约束条件同了自然约束条件。

【标准负一次幂律】

根据上述定理,以最大发生概率唯一决定满足自洽性的著名的齐普夫定律(Zipf's Law)所描述的标准负一次幂律的自洽约束条件是:

p1x1 + p2x2 + ...+ pnxn = 常量 = n*C

这其中C是 标准负一次幂律常量:

pixi = C,i = 1,2,...,n。

【负指数分布】

根据上述定理,以最大发生概率唯一决定满足自洽性的负指数分布

pi = aexp(-bxi),i = 1,2,...,n

自洽约束条件是:

p1/aexp(+bx1) + p2/aexp(+bx2) +...+ pn/aexp(+bxn) = 常数 = n。

【幂律分布】

根据上述定理,以最大发生概率唯一决定满足自洽性的幂律分布

pi = axi-b,i = 1,2,...,n

自洽约束条件是:

p1/ax1+b + p2/ax2+b +...+ pn/axn+b= 常数 = n。

【Tsallis分布】

根据上述定理,以最大发生概率唯一决定满足自洽性的Tsallis分布

pi = a(1 -(1-q1)bxi)1/(1-q1), q1 = 2 - q,i = 1,2,...,n

自洽约束条件是:

p1/a(1 -(1-q1)bx1)1/(q1-1) + p2/a(1 -(1-q1)bx2)1/(q1-1) +

+...+  pn/a(1 -(1-q1)bxn)1/(q1-1) = 常数 = n。

【正态分布】

根据上述定理,以最大发生概率唯一决定满足自洽性的正态分布

pi = aexp(-b(xi-m)2),i = 1,2,...,n

自洽约束条件是:

p1/aexp(+b(x1-m)2) + p2/aexp(+b(x2-m)2) +...+ pn/aexp(+b(xn-m)2)

= 常数 = n。

【对数正态分布】

根据上述定理,以最大发生概率唯一决定满足自洽性的对数正态分布

pi = a/xexp(-b(log(xi)-m)2),i = 1,2,...,n

自洽约束条件是:

p1x1/aexp(+b(log(x1)-m)2) + p2x2/aexp(+b(log(x2)-m)2) +...+pnxn/aexp(+b(log(xn)-m)2)

= 常数 = n

现代统计力学和热力学的“今生”救活了“前世”

 现代统计力学和热力学的“今生”为在理论上抢救对科学作出过重大贡献并且至今仍有广泛的实用价值但是存在重大理论缺陷的现代统计力学和热力学的“前世”,提出了以发生概率广义熵同时最大原理取代现代统计力学和热力学的“前世”的所有极值原理:在这所有极值原理的目标函数中统统加入发生概率的对数log(P)并增添自洽约束条件,一举令现代统计力学和热力学的“前世”的所有极值原理坐拥自洽性和与从前一模一样的但却具有最大发生概率的所导出的分布。所以说:现代统计力学和热力学的“今生”救活了“前世”。

【附录1】定理的证明

证明:命自然约束条件所对应的拉格朗日乘数为C1,又命目标函数T为:

T = -C1(p1 + p2 + ... + pn) + log(p1) + log(p2) + ...+ log(pn)

T = -C1(p1 + p2 + ... + pn) + log(P)    (1-6)

这其中P为发生概率。

命由目标函数T定理中所言自洽约束条件以及自然约束条件所构成的拉格朗日算子为L,则有:

L = -C1(p1 + p2 + ... + pn) + log(p1) + log(p2) + ...+ log(pn) +

+ C1(p1 + p2 + ... + pn - 1) +

+ C2(p1/f(x1) + p2/f(x2) + ... + pn/f(xn) - n)    (1-7)

对拉格朗日算子求一阶偏导数dL/dpi并命之为零,就有:

dL/dpi = -C1 + 1/pi + C1 + C2/f(xi) = 0

pi = f(xi)/(-C2),i = 1,2,...,n。

因为所给定的概率分布f(xi)和待决定的概率分布pi都是柯尔莫哥洛夫概率分布,所以都具有所谓规范性,或者说都服从自然约束条件。有:

p1 + p2 + ... + pn = 1

T = -C1 + log(P)    (1-5)

f(x1) + f(x2) + ... + f(xn) = 1

就有:

C2 = -1

并且令拉格朗日算子L的一阶偏导数为零的分布pi为:

pi = f(xi),i = 1,2,...n。    (1-8)

但是,拉格朗日算子L的二阶偏导数为一主对角线上元素恒负而其他元素恒等于零的负定对称矩阵。因此上述令拉格朗日算子L的一阶偏导数为零的分布pi=f(xi)必定也是令自洽约束条件和自然约束条件下的满足式(1-5)的目标函数T = -C1 + log(P)取最大值或极大值的函数。这也就是说上述令拉格朗日算子L的一阶偏导数为零的分布pi=f(xi)必定也就是令自洽约束条件和自然约束条件下发生概率P最大的分布。这种分pi=f(xi)符合最大发生概率原理。因此:

自洽约束条件

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n    

外加自然约束条件

p1 + p2 +...+ pn = 1    

以最大发生概率唯一决定概率分布

pi = f(xi),i = 1,2,...n。

又因为

概率分布

pi = f(xi),i = 1,2,...n

是在自洽约束条件下由极值原理最大发生概率原理所导出被固定的最值点或极值点或者说最值分布或极值分布,所以也就满足自洽性。

证毕。

【附录2】

第三只眼看Tsallis分布:根本无须所谓的Tsallis广义熵

美国归侨冯向军博士,2017年8月2日写于美丽家乡


(一)二项分布

考察由n次随机实验所组成的随机现象,它满足以下条件:1)重复进行n次随机实验;2)n次实验相互独立;3)每次实验仅有两个可能结果;4)每次实验中给定事件出现的概率为p,不出现的概率为1-p。假设X表示n次独立重复实验中给定事件出现的次数,显然X是可以取0,1,…,n等n+1个值的离散随机变量。设这n次实验中,每个“给定事件出现k次的结果”为Ek,显然Ek的发生概率为pk(1-p)n-k。因为这样的结果有:n!/k!(n-k)!个,所以按照柯尔莫哥洛夫概率的可加性,这n次实验中,给定事件出现k次的概率

P(X=k) = n!/(k!(n-k)!)pk (1-p)(n-k)        (1-1)

(1-1)式就是二项分布的概率分布表达式。

(二)Tsallis分布的一种不完备形式

假设把变量x等分成n个变量片段。当n足够大时,在每个等分变量片段上给定事件要么出现1次,要么不出现。又假设给定事件出现(1次)的概率p与变量片段的长度x/n成正比。有:p = λx/n。按(1-1)式,变量间隔x之给定事件出现的概率的分布为

P(X = k) = n!/(k!(n-k)!)(λx/n)k (1-λx/n)(n-k)        (1-2)

P(X = k) = n!/(nk(n-k)!)(1-λx/n)-kλx)k/k!(1-λx/n)n

考察给定事件在变量间隔x以后才出现的概率P0(x),并命:(1-q1) = 1/n, q = 2 - q1,就有:

P0(x) = P(X=0) = (1-(1-q1)λx)1/(1-q1)    (1-3)

P0(x)就是标准的Tsallis分布。但是在式(1-3)中,q1 = 1 - 1/n,而n为正整数,所以q1还不能象Tsallis分布一样含盖所有不等1的实数。于是我又探索出一条新路来证明我的基本观点是正确的。

(三)再探完美无缺的Tsallis分布的成因

假设把变量x等分成n个变量片段。当n足够大时,在每个等分变量片段上给定事件要么出现1次,要么不出现。又假设给定事件出现(1次)的概率p与变量x及其等分数n成一较为复杂的待定函数关系,有:p = λy(x)/n,这其中y(x)是关于变量x的待定函数。

按(1-1)式,变量间隔x之给定事件出现的概率的分布为

P(X = k) = n!/(k!(n-k)!)(λy(x)/n)k (1-λy(x)/n)(n-k)        (1-5)

P(X = k) = n!/(nk(n-k)!)(1-λy(x)/n)-kλy(x))k/k!(1-λy(x)/n)n

考察给定事件在变量间隔x以后才出现的概率P0(x),就有:

P0(x) = P(X=0) = (1-λy(x)/n)n    (1-5)

当n->无穷大,有:

P0(x) = exp(-λy(x))    (1-6)

下面来确定待定函数y(x)。

命:P0(x) = Tsallis分布 = (1 - (1-q1)λx)1/(1-q1),就有:

待定函数 y(x) = 1/(λ*(q1-1))log(1 - (1-q1)λx)    (1-7)

这其中,q1为不等1的一切实数。

因此所谓的 Tsallis分布的全部形式,无非就是一种给定事件在变量间隔x以后才出现的基于二项分布的概率P0(x)。对于 Tsallis分布,给定事件在变量片段x/n上出现(1次)的概率p与变量x及其等分数n成一较为复杂的待定函数关系,p = λy(x)/n,这其中:

y(x) = 1/(λ*(q1-1))log(1 - (1-q1)λx))。这其中,q1为不等1的一切实数。

我们根本无须所谓Tsallis广义熵也能推导出完美无缺的Tsallis分布。

【附录3】

大道至简至简离大道更近

美国归侨冯向军博士,2017年8月2日


大道至简。至简离大道更近。如此看来,我把现代统计力学和热力学分为“前世”与“今生”并不为过。这是因为现代统计力学和热力学的“前世”都称不上至简而现代统计力学和热力学的“今生”堪称至简:在至简的统一约束条件自洽约束条件下依最大发生概率唯一决定概率分布。为什么说自洽约束条件是至简的呢?那是因为所谓自洽约束条件就是:想要得到的分布是什么就把所有可能的分布都唯一固定在想要得到的分布,不允许任何其他分布发生。在这样的约束条件下,难道还会得到别的什么分布吗?现代统计力学和热力学的“前世”怪就怪在这里,在这样至简的自洽约束条件下,一般都还真得不到想要得到的分布!究其根本原因,那是因为现代统计力学和热力学的“前世”的所有极值原理中都不包含至简的最大发生概率原理。

【附录4】

从作为二项分布的概率分布来看最大熵原理对人们的严重误导

美国归侨冯向军博士,2017年8月3日写于美丽家乡


自1957年首次问世以来【1】,各种基于最大熵和拉格朗日乘数法的极值原理都在把某个广义熵作为目标函数,并在关于变量的某种统计平均值不变这种非自然约束条件下,以最大广义熵为目标来预言变量所服从的概率分布。

我业已证明,任何变量x所服从的概率分布P0(x)均可视为二项分布的特殊形式,而这种二项分布的特殊形式完全为变量间隔x内指定事件实际可能出现的总次数的统计平均值所决定,与变量本身的统计平均值无关。例如时间间隔t后,下一个婴儿出生的概率分布完全由时间间隔t内婴儿可能出生的总数统计平均值所决定,而与时间t本身的统计平均值无关。任何变量值xi所对应概率P0(xi)只与变量值xi有关,与其他变量值无关,i = 1,2,...,n。任何变量值xi所对应概率P0(xi)完全由变量间隔xi内指定事件实际可能出现的总次数的统计平均值或指定事件实际可能出现的频率所决定,与变量本身的统计平均值无关。

因此最大熵原理在观念上严重误导了人们。各种广义熵对于确定变量的概率分布似乎都是不必要的。把任何变量x所服从的概率分布P0(x)均视为二项分布的特殊形式,就不再需要用于决定变量所服从的概率分布的形形色色的所谓广义熵。

任何变量x所服从的概率分布P0(x)均视为二项分布的特殊形式 + 最大发生概率原理 + 自洽约束条件业已构成现代统计力学和热力学新世代的基本形态。

参考文献

1】Jaynes, E. T. (1957). "Information Theory and Statistical Mechanics", Physical Review,Vol. 106,No. 4,620-630,May 15,1957. http://www.doc88.com/p-9942714807822.html

【附录5】

历史或将铭记这个至简至明的分布成因公式

美国归侨冯向军博士,2017年8月3日写于美丽家乡


np = -log(f(x)) (1-1)

【定理】对于任意给定的分布f(x),假设可将f(x)视为在变量间隔x以后指定事件才出现的特殊形式的二项概率分布,那么导致成就f(x)的原因就是参数np满足式(1-1)。这其中n是把变量x等分后的等分数,而p是指定事件在任意变量等分片段上出现一次的概率。np可解读为指定事件在变量间隔x内实际可能出现的总次数的统计平均值。因为-log(f(x))可解读为给定分布所包含的信息

I = -log(f(x)),所以又有给定分布f(x)的成因是:

        np = 给定分布f(x)所包含的信息I  (1-2)        

证明:

(一)二项分布

考察由n次随机实验所组成的随机现象,它满足以下条件:1)重复进行n次随机实验;2)n次实验相互独立;3)每次实验仅有两个可能结果;4)每次实验中给定事件出现的概率为p,不出现的概率为1-p。假设X表示n次独立重复实验中给定事件出现的次数,显然X是可以取0,1,…,n等n+1个值的离散随机变量。设这n次实验中,每个“给定事件出现k次的结果”为Ek,显然Ek的发生概率为pk(1-p)n-k。因为这样的结果有:n!/k!(n-k)!个,所以按照柯尔莫哥洛夫概率的可加性,这n次实验中,给定事件出现k次的概率

P(X=k) = n!/(k!(n-k)!)pk (1-p)(n-k)        (1-3)

(1-3)式就是二项分布的概率分布表达式。

(二)任意给定的分布f(x)的成因

假设把变量x等分成n个变量片段。当n足够大时,在每个等分变量片段上给定事件要么出现1次,要么不出现。又假设给定事件出现(1次)的概率p与变量x及其等分数n成一较为复杂的待定函数关系,有:p = λy(x)/n,这其中y(x)是关于变量x的待定函数。

按(1-3)式,变量间隔x之给定事件出现的概率的分布为

P(X = k) = n!/(k!(n-k)!)(λy(x)/n)k (1-λy(x)/n)(n-k)        (1-4)

P(X = k) = n!/(nk(n-k)!)(1-λy(x)/n)-kλy(x))k/k!(1-λy(x)/n)n

考察给定事件在变量间隔x以后才出现的概率P0(x),就有:

P0(x) = P(X=0) = (1-λy(x)/n)n    (1-5)

当n->无穷大,有:

P0(x) = exp(-λy(x))    (1-6)

下面来确定待定函数y(x)和参数np。

命:P0(x) = 任意给定的合乎条件的分布f(x),就有:

待定函数 y(x) = -1/λlog(f(x)) (1-7)

参数np = λy(x) = -log(f(x)) (1-8)

这其中n是把变量x等分后的等分数,而p是指定事件在任意变量等分片段上出现一次的概率。np可解读为指定事件在变量间隔x内实际可能出现的总次数的统计平均值。因为

-log(f(x))可解读为给定分布所包含的信息I = -log(f(x)),所以又有给定分布f(x)的成因是:

np = 给定分布f(x)所包含的信息I

毕。

【举例】

(1)负指数分布:因为 f(x) = aexp(-λx),所以 np = -log(a) +  λx。

(2)幂律分布:因为 f(x) = ax-λ,所以 np = -log(a) +  λlog(x)。

(3)Tsallis 分布:因为f(x) = a(1 - (1-q1)λx)1/(1-q1),所以

np  = -log(a) + 1/(q1-1)log(1 - (1-q1)λx)。




















https://wap.sciencenet.cn/blog-1968-1069059.html

上一篇:唯一决定常见概率分布形态的具体自洽约束条件
下一篇:Tsallis广义熵流行的真正原因:太多的实际分布缺乏模型解释
收藏 IP: 113.222.189.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-1 21:47

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部