杨正瓴
[数学文化,笔记] 正态分布的多种稳定性质(关联不能被预报预测)
2024-11-1 22:49
阅读:1516

[数学文化,笔记] 正态分布的多种稳定性质(关联不能被预报预测)

                        

Abraham de Moivre   mw191475_564x800.jpg

图1  棣莫弗 Abraham de Moivre, 1666-05-26 ~ 1754-11-27, 87

https://collectionimages.npg.org.uk/large/mw191475/Abraham-de-Moivre.jpg

            

              

一、正态分布在数学方面具有多种稳定性质

https://www.global-sci.org/intro/article_detail/mc/11639.html

https://www.global-sci.org/intro/articles_list/mc/1412.html

      

   1. 两个正态分布密度的乘积还是正态分布

   2. 两个正态分布密度的卷积还是正态分布,也就是两个独立正态分布随机变量的和还是服从正态分布

   3. 正态分布 N(0,σ2) 的傅立叶变换正规化为密度分布后还是正态分布

   4. 中心极限定理保证了多个随机变量的求和效应将导致正态分布

   5. 正态分布和其它具有相同均值、方差的概率分布相比,具有最大熵

             

   前三个性质说明了正态分布一旦形成,就容易保持该形态的稳定,兰登对于正态分布的推导也表明了,正态分布可以吞噬较小的干扰而继续保持形态稳定。后两个性质则说明,其它的概率分布在各种的操作之下容易越来越靠近正态分布。正态分布具有最大熵的性质,所以任何一个对指定概率分布的操作,如果该操作保持方差的大小,却减少已知的知识,则该操作不可避免地增加概率分布的信息熵,这将导致概率分布向正态分布靠近。

             

二、正态分布还有更多令人着迷的数学性质

https://www.global-sci.org/intro/article_detail/mc/11639.html

https://www.global-sci.org/intro/articles_list/mc/1412.html

             

   * 二项分布 B(n, p) 在n 很大时逼近正态分布 N(np,np(1 - p))

   * 泊松分布 Poisson(λ) 在λ 较大时逼近正态分布 N(λ, λ)

   * χ2(n) 在n 很大的时候逼近正态分布 N(n, 2n)

   * t 分布在n 很大时逼近标准正态分布 N(0, 1)

   * 正态分布的共轭分布还是正态分布

   * 几乎所有的极大似然估计在样本量n 增大的时候都趋近于正态分布

   * 克拉美分解定理( 之前介绍过) :如果 X, Y 是独立的随机变量,且 SXY 是正态分布,那么 X, Y 也是正态分布

   * 如果 X, Y 独立且满足正态分布 N(μ, σ2), 那么 XY, XY 独立且同分布,而正态分布是唯一满足这一性质的概率分布

   * 对于两个正态分布 X, Y , 如果 X, Y 不相关则意味着 X,Y 独立,而正态分布是唯一满足这一性质的概率分布

             

三、[打听] 上面的性质,与正态分布的时间序列不能被预报/预测有关吗?

   在时间序列预测时,一般将剩余的残差(residual)具有正态性作为“可预测/预报 forecast/predict”的结束。

   这是为什么?

       

         

参考资料:

[1] 2024-03-07,时间序列/time series/王德辉,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=235065&Type=bkzyb&SubID=59859

   其中,Xt为时间序列;ai为常数项;εt为白噪声序列。

[2] 2022-01-20,残差/residual/彭军还,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=50636&Type=bkzyb&SubID=79654

[3] 2023-05-10,残差平方和/residual sum of squares/唐炎林,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=51378&Type=bkzyb&SubID=59837

[4] 2023-03-03,残差检验法/residual checking method/杨浩,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=322986&Type=bkzyb&SubID=167923

[5] 2023-07-06,残差分析/residual analysis/崔恒建,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=497866&Type=bkzyb&SubID=220131

   ②误差正态分布;

   如果多元线性回归模型的假定成立,从理论上可以证明标准化残差相互独立且近似服从标准正态分布N(0,1)所以残差图中大约有95%的散点应随机的分布在-2到+2的带状区域里;更进一步地,约有99%散点随机分布在-3到+3的带状区域中;并且显示不出任何明显的趋势。

[6] 2023-01-05,一般线性模型/general linear model/贺建波,管荣展,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=527248&Type=bkzyb&SubID=216792

[7] 2023-12-20,回归分析/regression analysis/崔恒建,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=199999&Type=bkzyb&SubID=61708

   回归模型通常分为三大类:参数回归模型、非参数回归模型和半参数回归模型。

[8] Regression analysis. Encyclopedia of Mathematics.

https://encyclopediaofmath.org/wiki/Regression_analysis

[9] Weisstein, Eric W. "Least Squares Fitting." From MathWorld--A Wolfram Web Resource.

https://mathworld.wolfram.com/LeastSquaresFitting.html

   This approach does commonly violate the implicit assumption that the distribution of errors is normal, but often still gives acceptable results using normal equations, a pseudoinverse, etc.

[10] 靳志辉. 正态分布的前世今生(下))[J]. 数学文化, 2023, 4(2): 54-62.

https://www.global-sci.org/intro/article_detail/mc/11639.html

https://www.global-sci.org/intro/articles_list/mc/1412.html

[11] 靳志辉. 正态分布的前世今生(上)[J]. 数学文化, 2023, 4(1): 54-62.

https://www.global-sci.org/intro/article_detail/mc/11616.html

https://www.global-sci.org/intro/articles_list/mc/1411.html  

[12] Normal distribution. Encyclopedia of Mathematics.

https://encyclopediaofmath.org/wiki/Normal_distribution

[13] Central limit theorem. Encyclopedia of Mathematics.

https://encyclopediaofmath.org/wiki/Central_limit_theorem

        

相关链接:

[1] 2024-04-13,[数学文化,P vs NP] 正态分布的四种推导

https://blog.sciencenet.cn/blog-107667-1429560.html

[2] 2021-07-25,[阅读笔记] 神奇的正态分布与中心极限定理

https://blog.sciencenet.cn/blog-107667-1296916.html

[3] 2021-07-27,[苦啊!] 到底为什么“正态分布随机数不能被预报?”

https://blog.sciencenet.cn/blog-107667-1297235.html

[4] 2024-03-30,[笔记,数学文化] 用清晰的思想代替盲目的计算:香农的信息熵

https://blog.sciencenet.cn/blog-107667-1427605.html

[5] 2021-02-05,[笔记] 时间序列预测里的一些“专业术语”

https://blog.sciencenet.cn/blog-107667-1270762.html

[6] 2021-06-15,[求助] 时间序列预测里的回归模型“定阶”、“样本容量”的优化方法

https://blog.sciencenet.cn/blog-107667-1291316.html

[7] 2021-07-19,[资料] 时间序列分析与预测的常用误差统计指标

https://blog.sciencenet.cn/blog-107667-1296109.html

[8] 2021-07-22,[重大困惑] 为什么正态分布随机数不能“被”预测

https://blog.sciencenet.cn/blog-107667-1296529.html

                     

感谢您的指教!

感谢您指正以上任何错误!

感谢您提供更多的相关资料!

                     

(热门)[数学文化,笔记] 正态分布的多种稳定性 +1.jpg

转载本文请联系原作者获取授权,同时请注明本文来自杨正瓴科学网博客。

链接地址:https://wap.sciencenet.cn/blog-107667-1458130.html?mobile=1

收藏

分享到:

当前推荐数:25
推荐到博客首页
网友评论12 条评论
确定删除指定的回复吗?
确定删除本博文吗?