学生氏t-分布无疑是统计学中最著名的抽样分布之一。然而人们往往忽略了学生氏t-分布的局限性并且对其存在一些误解。以下是关于学生氏t-分布的几点澄清:
• 统计量t是样本误差ε与样本标准差s的比值。样本误差ε和样本标准差s是现实世界的物理量,它们都有明确的物理意义:前者是噪声后者是平均噪声的量度。但是两者的比值t 不是现实世界的物理量,没有任何物理意义: t = 噪声ε/平均噪声s 是什么意思?
• 学生氏 t-分布不是误差ε的分布;它是一个扭曲的 z-分布(标准正态分布)(由于 ‘t-转换扭曲’)。也就是说,学生氏t-分布是一个“人造”的、没有物理意义的概率分布。 作为对照,正态分布有明确的物理意义:它被称为‘误差定律’。
• Scaled and shifted t-分布不是样本均值量的抽样分布。 根据中心极限定理,无论尺度参数σ已知还是未知,样本均值量的抽样分布是 scaled and shifted z-分布(即正态分布)。如果σ未知,无论样本量大小,都可以取σ 的‘点估计’值,从而得到样本均值量的“分布估计”。
• 学生氏 t-分布的数学推导没有问题。但是,由于 ‘t-转换扭曲’,基于学生氏 t-分布进行统计推断(例如t-区间)是错误的。这是方法论的问题。
• 贝叶斯方法采用1/σ先验得到 scaled and shifted t-分布完全是“凑巧”。采用其它先验,例如1/σ2,将得到不同的后验分布。事实上,也有一些贝叶斯学者认为1/σ先验不符合正态分布参数的物理意义,因此否定scaled and shifted t-分布的有效性(例如【3】)。
总之,学生氏t-分布是‘t-转换扭曲’的结果。关于‘t-转换扭曲’,感兴趣的读者可以参阅文献【1,2】。
参考文献
【1】 黄河宁,为什么基于t-分布计算小样本测量不确定度是一个谬误?-3 个悖论及其消解,Researchgate 链接:https://www.researchgate.net/publication/343039726_weishenmejiyu_t-fenbujisuanxiaoyangbenceliangbuquedingdushiyigemiuwu_-3_gebeilunjiqixiaojie
【2】Huang H 2018 Uncertainty estimation with a small number of measurements, Part I: new insights on the t-interval method and its limitations Measurement Science and Technology 29 https://doi.org/10.1088/1361-6501/aa96c7
【3】 D’Agostini G 1998 Jeffeys priors versus experienced physicist priors: arguments against objective Bayesian theory Proceedings of the 6th Valencia International Meeting on Bayesian Statistics (Alcossebre, Spain, May 30th-June 4th)
转载本文请联系原作者获取授权,同时请注明本文来自黄河宁科学网博客。
链接地址:https://wap.sciencenet.cn/blog-3427112-1352436.html?mobile=1
收藏