||
题目为“A p-Value Paradox in Proportion Tests and its Resolution” 的论文正式发表在 Journal of Statistical Theory and Practice, Volume 19, article number 71, (2025)。
摘要(译文)如下:
这篇短文探讨了在传统比例检验中出现的 p 值悖论。该悖论被定义为“根据不同样本量的数据对相同效应量做出的决策可能不一致”的现象。该悖论通过临床试验研究中的两个示例进行了说明。我们认为,这个 p 值悖论源于使用(或误用)p 值来比较两个比例并做出决策。我们建议用估计统计方法来取代传统比例检验及其 p 值:包括观察的效应量和信号含量指数 (SCI) (可靠性指标)。
结论与建议(译文)如下:
传统比例检验得出的p值是一个样本统计量,它不提供关于总体的推断信息。换句话说,p值不是用于比较两个比例的推断统计量。使用p值进行决策违反了科学归纳推理的基本原理。p值悖论实际上源于使用(或误用)p值来比较两个比例并进行决策。因此,为了避免p值悖论,在比较两个比例时,首先就不应该使用传统比例检验及其p值。
我们建议用以下方法取代传统比例检验及其p值:(1)使用专业领域的特定知识评估观察到的效应量,以确定其是否具有实际意义;(2)使用信号含量指数(SCI)评估观察到的效应量的可靠性,以确保它是对真实效应量的可靠估计。这种方法符合科学归纳推理的基本原理。
链接:
出版商提供论文全文只读版本的链接如下:
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-8-15 05:36
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社