似然函数(likelihood function)是对于给定的数据(即随机变量X的一个样本)关于统计模型中(未知)参数(变量)的函数。概率密度函数则是对于给定的统计模型参数(常数)关于随机变量X的密度函数。 Fisher 【1】指出,“……概率和似然是性质完全不同的量。” Edwards 【2】指出,“…… 这个 [似然] 函数在任何意义上都不会产生统计分布。” 根据 Edwards 【2】,似然函数提供了所考虑的参数值可能性之间的自然偏好顺序。因此,似然函数的模对应于给定数据的最优选参数值。因此, 最大似然法是一种基于似然函数的推断,仅利用似然函数的模对未知参数进行点估计;没有利用整个似然函数曲线 【3】。相比之下,基于概率的推断,无论是频率学派还是贝叶斯学派,使用概率密度函数的整个曲线进行推断 【3】。
连续随机变量的贝叶斯定理将代表未知参数当前信息(测量数据)的似然函数与未知参数的先验概率密度函数结合起来组成未知参数的后验概率密度函数。其表达式为:
后验概率密度函数 ∝ 似然函数 × 先验概率密度函数 (1)
如果没有先验信息,根据Jaynes 的最大熵原理,可以假定先验分布为均匀分布,则式(1)退化为:
后验概率密度函数 = 归一化的似然函数 (2)
因为“概率和似然是性质完全不同的量”【1】和 “…… 这个 [似然] 函数在任何意义上都不会产生统计分布【2】”,式(2)是错误的。事实上,式(1)违反了“自洽运算原则” (the principle of self-consistent operation)【3】。笔者认为,似然函数不应与概率密度函数混合用于统计推断。似然函数是其对应的概率密度函数的扭曲镜像;它在贝叶斯定理中的使用可能是导致传统贝叶斯方法出现偏差或不正确推断的根本原因【3】。
参考文献
【1】 Edwards A W F 1992 Likelihood (expanded edition) Johns Hopkins University Press Baltimore
【2】 Fisher R A 1921 On the ‘Probable Error’ of a coefficient of correlation deduced from a small sample Metron I part 4, 3-32
【3】 Huang H 2022 A new modified Bayesian method for measurement uncertainty analysis and the unification of frequentist and Bayesian inference. Journal of Probability and Statistical Science, 20(1), 52-79. https://journals.uregina.ca/jpss/article/view/515
【4】 Box G E P and Tiao G C 1992 Bayesian Inference in Statistical Analysis Wiley New York
转载本文请联系原作者获取授权,同时请注明本文来自黄河宁科学网博客。
链接地址:https://wap.sciencenet.cn/blog-3427112-1370953.html?mobile=1
收藏