[数学文化,笔记] 正态分布的多种稳定性质(关联不能被预报预测)
图1 棣莫弗 Abraham de Moivre, 1666-05-26 ~ 1754-11-27, 87
https://collectionimages.npg.org.uk/large/mw191475/Abraham-de-Moivre.jpg
一、正态分布在数学方面具有多种稳定性质
https://www.global-sci.org/intro/article_detail/mc/11639.html
https://www.global-sci.org/intro/articles_list/mc/1412.html
1. 两个正态分布密度的乘积还是正态分布
2. 两个正态分布密度的卷积还是正态分布,也就是两个独立正态分布随机变量的和还是服从正态分布
3. 正态分布 N(0,σ2) 的傅立叶变换正规化为密度分布后还是正态分布
4. 中心极限定理保证了多个随机变量的求和效应将导致正态分布
5. 正态分布和其它具有相同均值、方差的概率分布相比,具有最大熵
前三个性质说明了正态分布一旦形成,就容易保持该形态的稳定,兰登对于正态分布的推导也表明了,正态分布可以吞噬较小的干扰而继续保持形态稳定。后两个性质则说明,其它的概率分布在各种的操作之下容易越来越靠近正态分布。正态分布具有最大熵的性质,所以任何一个对指定概率分布的操作,如果该操作保持方差的大小,却减少已知的知识,则该操作不可避免地增加概率分布的信息熵,这将导致概率分布向正态分布靠近。
二、正态分布还有更多令人着迷的数学性质
https://www.global-sci.org/intro/article_detail/mc/11639.html
https://www.global-sci.org/intro/articles_list/mc/1412.html
* 二项分布 B(n, p) 在n 很大时逼近正态分布 N(np,np(1 - p))
* 泊松分布 Poisson(λ) 在λ 较大时逼近正态分布 N(λ, λ)
* χ2(n) 在n 很大的时候逼近正态分布 N(n, 2n)
* t 分布在n 很大时逼近标准正态分布 N(0, 1)
* 正态分布的共轭分布还是正态分布
* 几乎所有的极大似然估计在样本量n 增大的时候都趋近于正态分布
* 克拉美分解定理( 之前介绍过) :如果 X, Y 是独立的随机变量,且 S = X + Y 是正态分布,那么 X, Y 也是正态分布
* 如果 X, Y 独立且满足正态分布 N(μ, σ2), 那么 X + Y, X - Y 独立且同分布,而正态分布是唯一满足这一性质的概率分布
* 对于两个正态分布 X, Y , 如果 X, Y 不相关则意味着 X,Y 独立,而正态分布是唯一满足这一性质的概率分布
三、[打听] 上面的性质,与正态分布的时间序列不能被预报/预测有关吗?
在时间序列预测时,一般将剩余的残差(residual)具有正态性作为“可预测/预报 forecast/predict”的结束。
这是为什么?
参考资料:
[1] 2024-03-07,时间序列/time series/王德辉,中国大百科全书,第三版网络版[DB/OL]
https://www.zgbk.com/ecph/words?SiteID=1&ID=235065&Type=bkzyb&SubID=59859
其中,Xt为时间序列;ai为常数项;εt为白噪声序列。
[2] 2022-01-20,残差/residual/彭军还,中国大百科全书,第三版网络版[DB/OL]
https://www.zgbk.com/ecph/words?SiteID=1&ID=50636&Type=bkzyb&SubID=79654
[3] 2023-05-10,残差平方和/residual sum of squares/唐炎林,中国大百科全书,第三版网络版[DB/OL]
https://www.zgbk.com/ecph/words?SiteID=1&ID=51378&Type=bkzyb&SubID=59837
[4] 2023-03-03,残差检验法/residual checking method/杨浩,中国大百科全书,第三版网络版[DB/OL]
https://www.zgbk.com/ecph/words?SiteID=1&ID=322986&Type=bkzyb&SubID=167923
[5] 2023-07-06,残差分析/residual analysis/崔恒建,中国大百科全书,第三版网络版[DB/OL]
https://www.zgbk.com/ecph/words?SiteID=1&ID=497866&Type=bkzyb&SubID=220131
②误差正态分布;
如果多元线性回归模型的假定成立,从理论上可以证明标准化残差相互独立且近似服从标准正态分布N(0,1)所以残差图中大约有95%的散点应随机的分布在-2到+2的带状区域里;更进一步地,约有99%散点随机分布在-3到+3的带状区域中;并且显示不出任何明显的趋势。
[6] 2023-01-05,一般线性模型/general linear model/贺建波,管荣展,中国大百科全书,第三版网络版[DB/OL]
https://www.zgbk.com/ecph/words?SiteID=1&ID=527248&Type=bkzyb&SubID=216792
[7] 2023-12-20,回归分析/regression analysis/崔恒建,中国大百科全书,第三版网络版[DB/OL]
https://www.zgbk.com/ecph/words?SiteID=1&ID=199999&Type=bkzyb&SubID=61708
回归模型通常分为三大类:参数回归模型、非参数回归模型和半参数回归模型。
[8] Regression analysis. Encyclopedia of Mathematics.
https://encyclopediaofmath.org/wiki/Regression_analysis
[9] Weisstein, Eric W. "Least Squares Fitting." From MathWorld--A Wolfram Web Resource.
https://mathworld.wolfram.com/LeastSquaresFitting.html
This approach does commonly violate the implicit assumption that the distribution of errors is normal, but often still gives acceptable results using normal equations, a pseudoinverse, etc.
[10] 靳志辉. 正态分布的前世今生(下))[J]. 数学文化, 2023, 4(2): 54-62.
https://www.global-sci.org/intro/article_detail/mc/11639.html
https://www.global-sci.org/intro/articles_list/mc/1412.html
[11] 靳志辉. 正态分布的前世今生(上)[J]. 数学文化, 2023, 4(1): 54-62.
https://www.global-sci.org/intro/article_detail/mc/11616.html
https://www.global-sci.org/intro/articles_list/mc/1411.html
[12] Normal distribution. Encyclopedia of Mathematics.
https://encyclopediaofmath.org/wiki/Normal_distribution
[13] Central limit theorem. Encyclopedia of Mathematics.
https://encyclopediaofmath.org/wiki/Central_limit_theorem
相关链接:
[1] 2024-04-13,[数学文化,P vs NP] 正态分布的四种推导
https://blog.sciencenet.cn/blog-107667-1429560.html
[2] 2021-07-25,[阅读笔记] 神奇的正态分布与中心极限定理
https://blog.sciencenet.cn/blog-107667-1296916.html
[3] 2021-07-27,[苦啊!] 到底为什么“正态分布随机数不能被预报?”
https://blog.sciencenet.cn/blog-107667-1297235.html
[4] 2024-03-30,[笔记,数学文化] 用清晰的思想代替盲目的计算:香农的信息熵
https://blog.sciencenet.cn/blog-107667-1427605.html
[5] 2021-02-05,[笔记] 时间序列预测里的一些“专业术语”
https://blog.sciencenet.cn/blog-107667-1270762.html
[6] 2021-06-15,[求助] 时间序列预测里的回归模型“定阶”、“样本容量”的优化方法
https://blog.sciencenet.cn/blog-107667-1291316.html
[7] 2021-07-19,[资料] 时间序列分析与预测的常用误差统计指标
https://blog.sciencenet.cn/blog-107667-1296109.html
[8] 2021-07-22,[重大困惑] 为什么正态分布随机数不能“被”预测
https://blog.sciencenet.cn/blog-107667-1296529.html
感谢您的指教!
感谢您指正以上任何错误!
感谢您提供更多的相关资料!
转载本文请联系原作者获取授权,同时请注明本文来自杨正瓴科学网博客。
链接地址:https://wap.sciencenet.cn/blog-107667-1458130.html?mobile=1
收藏