||
在生物测定中,有时由于被试不足,会导致一个生物测定必须分批完成。我们以一个案例分析如下:
本案例的被试为烟青虫幼虫,红花烟草和黄花烟草植株配对测试,使用的装置为常见的Y形管。
第一批,共23头,选择红花烟草16头,选择黄花烟草7头;
第二批,共20头,选择红花烟草10头,黄花烟草10头;
第三批,共32头,选择红花烟草12头,黄花烟草20头,
第四批,共26头,选择红花烟草20头,黄花烟草6头;
第五批,共36头,选择红花烟草25头,黄花烟草11头。
常见的错误处理方法:
(1)分批计算值和P值,采用Yate修正法或者G检验可以得出结果。
第一批,因做出选择的总虫数为23头,多于npq=20头(p和q为H0成立时选择两个选项的理论比率),又因自由度为1,故用Yate修正法,得到卡方值为3.522,P=0.061,不显著;
第二批,同上条件。卡方值0,P=1,不显著。
第三批,同上条件。卡方值2,P=0.157,不显著。
第四批,同上条件。卡方值7.538,p=0.006,极显著。
第五批,同上条件,卡方值为5.444,p=0.020,显著。
这相当于各个批次没有合并,而且,结果反复冲突太大,或者一会显著、一会不显著,遇上毕业答辩,估计没有一个答辩委员会成员会对这些乱七八糟的结论感兴趣。
(2)第二种错误的做法,是“假合并”。比如,在5批测试中,选择红花烟草的一共83头,选择黄花烟草的一共54头。采用Yate修正的卡方检验,得到卡方值为6.139,p=0.013。
(3)第三种错误的做法,就类似于修剪数据了,比如第三批,为什么其他批次红花烟草的选择频次至少不低于黄花烟草的被选择频次,这一组却突然多起来了?百思不得其解的同学,或许会无视第三批次的简单体力劳动,干脆让它不参与分析了。将上述做法做到“极致”的,就是密立根油滴法测试元电荷,后来1927年,威尔逊云室法尚且不能构建如此有规律的相关曲线,凭什么密立根用简陋的油滴法就能实现?后来得知,密立根修剪了自己认为“不合理”的数据。为此,麻省理工学院许多学生认为,密立根简直是这个学校的耻辱。
那么,正确的做法是什么呢?
(1)如果各批试验的趋势是相同的,那么,应首先分批计算卡方值,将各批试验的卡方值计算结果加和起来,作为总卡方值;再把各批测试的自由度(本例中每批测试的自由度均为1)加起来,作为总自由度。我们假设本案例的趋势相同(实际上第三批的趋势是相反的,这里只是演示计算思路),则最终的结果应当是,总卡方值为18.504(=3.522+0+2+7.538+5.444),总自由度为5,p=0.0024。
(2)如果各批试验的趋势差异较大,例如本例,则需要:a. 剔除无意义测试,即第二批,这批测试选择两种烟草的频次完全相同;b. 分清“大趋势”与“小趋势”。将各批测试的卡方值开方,大趋势的赋予正号,小趋势的赋予负号,求它们的代数和。再除以试验批次数开方,得到正态变换z值,然后不再考虑自由度而直接与1.96或者2.58的临界值比较即可。
上面说的比较乱,我们将第二种思路用公式表示如下:
本例中,
第一批,红>黄,大趋势;
第二批,红=黄,无意义;
第三批,红<黄,小趋势;
第四批,红>黄,大趋势;
第五批,红>黄,大趋势。
由于这个值介于1.96和2.58之间,故判断5批测试合并的检验结论为“显著”,而不是极显著或者不显著。
计算实测概率:p=2*[1-norm.s.dist(2.4781)]=0.0132。
由此可见,教材上早已为大多数学者知晓的卡方独立性检验或者适合度检验,在实践中也会遇到颇为复杂的难题。上面一共5种思路,前三种“不合并”“假合并(或硬合并)”“修剪”都是不正确的。后两种是正确的,但要分情况讨论,最好是以某个选项(如红花烟草选择频次)除以做出选择的总被试数量,根据其是否大于50%,划分为大趋势和小趋势。
这样,我们就能把不同人员、不同实验室、不同日期的分批测试结果合并起来,得到一个整合性结论。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-1 08:14
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社