寻找熊猫家园分享 http://blog.sciencenet.cn/u/zhangjd224 中科院生态与环境研究中心 张晋东的博客

博文

哥色特和t分布

已有 6522 次阅读 2008-12-23 12:51 |个人分类:科研/创新

  统计学上一个著名的假设检验方法,最为普遍的应用让T分布被每一个做过数据统计分析所熟知,现在本人搜集了一些有关t分布的理论与提出着哥瑟特的故事,并加以总结,写下此文,与大家共享。

哥色特,其笔名Student比他的真名更为人所知. 奈曼曾指出,许多统计学家在哥色特于1937年去世后,尚不知他就是Student, 因此我们也从众,在下文中用Student来称呼他.

哥色特1876年出生于坎特伯雷. 他曾在温彻斯特大学和牛津大学就读. 1899年作为一名酿酒师进入爱尔兰的都柏林一家啤酒厂工作,在那里他涉及到有关酿造过程的数据处理问题.。

19061907年他有1年的时间去皮尔逊那里学习和研究统计学。 他着重关心的是由人为试验下所得的少量数据的统计分析问题,在当时这是一个全新的课题,因为如前面曾指出的,当时统计学中占主导地位的卡尔·皮尔逊学派强调的是由自然观察得来的大量数据的统计处理。这一研究的成果就是那篇使他名垂统计史册的论文《均值的或然误差》,发表于1908年的《生物计量》杂志上。而这一思想的中心就是从正态分布的数据中抽取样本,总体标准差未知的情况下,由样本标准差代替,标准化变量并不服从正态分布,而是服从n-1自由度(关于自由度以后有机会再介绍)的t分布,t分布也是一种对称分布,只有一个参数就是样本含量N,随之n的增大经趋向正态分布。现在我们来看一下Student是如何证明他的t分布的:第一步是找到S2的分布,即找到S2峰度系数和偏度系数,据此他推断S2拟合为符合Person三型的分布,注意的是他在拟合;第二步:证明样本方程与总体方程不相关;第三步:计算统计量。

当然推断过程有一些漏洞,但是他首次将小样本理论提到日程。

,随着小样本理论的进度,其重要意义日益为统计学界所理解,特别是t分布的意义,因为这个分布以后多次出现在一些重要统计量分布的结果中,于是Student这一结果的行情逐日看涨,导致后来统计界将他尊为小样本理论的开创者和鼻祖. Student的工作意义和对以后数理统计学发展所起的影响来看,应该说他对这一评价是当之无愧的.

Student20世纪前三十余年是统计界的活跃人物. 他的成就不限于《均》文. 同年他发表了在总体相关系数为0时,二元正态样本相关系数的精确分布,这是关于正态样本相关系数的第1个小样本结果. 他对回归和试验设计方面也有相当的研究,在与费歇尔的通信中时常讨论到这些问题. 费歇尔很尊重他的意见,常把自己工作的抽印本送给Student请他指教. 在当时,能受到费歇尔如此看待的学者为数不多.

Student还有一个优良品质,对当时英国统计学的发展起了有益的影响. 他是一个性格温和,易于与人合作的谦谦君子. 总所周知,当时英国统计学界几位领头的大人物之间多有分歧以至个人成见. 这相当大的程度上固然与学术观点上的分歧有关,但也不无个人性格的因素. 惟有Student一直与各方都保持良好的关系. 有这样一个例子:在大学学院有一个非正式的“生物计量学俱乐部”.1922年费歇尔想把它扩建为一个正式的学会,他了解到此事没有卡尔×皮尔逊发起不行,而他是皮尔逊“最后一个听取其意见的人”,不得已托Student向皮尔逊说情. 事虽未成,颇能看出这三位大家之间的关系. 后来这个计划直到1943年才以建立“国际生物计量学会”而实现,其时距卡尔×皮尔逊逝世已有7.

Student与假设检验理论创始人奈曼和爱根×皮尔逊都保持良好的关系.《耐曼¾现代统计学家》一书中提到奈曼于1925年初到伦敦去大学学院找卡尔×皮尔逊未遇,Student给他帮助的情景. 奈曼与费歇尔初次见面也是由Student居间介绍. 对爱根×皮尔逊,他当然早就认识,因而他是卡尔×皮尔逊的朋友. Student不住在伦敦,但与爱根保持通信联系. 爱根在自己的回忆文章中,提到Student信中阐发的一些思想,对他日后与奈曼合作建立其假设检验理论有着启发性的影响. 他说(引自《耐曼¾现代统计学家》):

“我认为现在统计学界中有非常多的成就都应归功于Student……我想引起人们对他,对他注重实际的作风和研究方法的简明性的注意. 他一生大部分的活动只是简单地与他同时代的数理统计学家接触、通信或个别聚会,以致人们很容易忽视他.”爱根因为Student去世“在情绪上深受影响”,他感到Student在许多方面对他自己的统计学理论的形成所起的作用和奈曼一样多。



https://wap.sciencenet.cn/blog-200081-206850.html

上一篇:博文继续
下一篇:写在5.12地震纪念日之后的文字
收藏 IP: .*| 热度|

1 迟菲

发表评论 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-2 11:07

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部