
A同学第一次考了95分,第二次考了97分;B同学第一次考了30分,第二次考了50分。谁取得的进步较大?
在Fisher的统计框架体系中,是绝对分数差值,即2 vs. 20的比较,当然是后者进步较大。但这并没有考虑到,A同学的基础分数已经接近极限,每进步1分都是非常困难的。
那么,用2/95 vs. 20/30两个相对进展来比较是否可行呢?这只有建立在从0分到100分的全程为线性的情况下才是科学的。但是许多情况下,这种进步是一种加速度不断减小的加速进步,是一种复杂的曲线关系。
这个问题贯穿了当前昆虫学习行为、昆虫寄主选择经历效应的研究中。有人认为昆虫“显著地发生了学习行为”,有的人认为某种昆虫例如一种棋盘格蛱蝶,根本就不会学习。
药效试验也是同样,有时清水对照喷雾,死亡率在20~30%,那么被试药物哪怕100%的致死率,也难以断定为杀虫活性或者杀菌活性优良。
说白了,这和你选择用什么植物来测试,或者用什么无条件刺激作为强化,关系非常大。材料的选择不同,统计结论就会有质的差异。
合理的做法,如果条件允许的话,应当是以一个群体为被试,例如50人。测试一下这50人的基础成绩,然后学习一段材料,以固定的间隔周期测验,观察他们从基础成绩到100分的进步过程中,每次测验的分数与学习时间的曲线回归关系。然后,将A同学的基础成绩放入回归曲线上,观察进步了2分,需要的时间单元。B同学同样处理。然后比较A同学取得的进步和B同学取得的进步,理论上需要花费的时间。以时间为因变量去“简单比较”,因为针对学生的成绩而言,这种比较很显然只有一次,两个孤零零的数字去比较,没有重复,故无法用独立样本t检验等方法。
心理学测试、工业测试,顽强地执行上述步骤,也可以完成。针对昆虫,就不行了。饲养一个世代,花费1个月,成虫期短短只有1周。学生即使愿意昼夜不停地加班,昆虫也不允许,因为昆虫的活动是有节律的。这就导致哪怕拿出上述“0→100”的学习曲线,3年也难以完成,更别说开展“昆虫是否能够学习”的主体试验了。
可是,自从1889年桑代克的猫,以及稍后的巴甫洛夫的狗、斯金纳的鸽子试验之后,人们对动物的学习行为产生了浓厚的兴趣,因为这类结果与人类相比,有“灵魂拷问”的意义。
抗药性测试也是如此,基础抗性测试、漫长的世代培养,耗尽了大部分学生的青春。
在个体发育史上的学习行为和跨世代的遗传学研究上,都涉及这种天花板效应和地板效应问题,如果这两大模块的研究,都是建立在并不坚实的基础上。那么,现代生物学研究,到底取得了什么进展?
我只看到一篇篇SCI在井喷着,却没有人侧重于从这种视角,从“选材”上探讨为什么一些昆虫会学习,一些昆虫不会学习。烟草天蛾、海灰翅夜蛾、菜粉蝶、蜜蜂、果蝇等等,有许多非常合理的试验设计、精湛的试验操作,但用于自己的被试昆虫上,却并不那么容易重现结论。
那么,烟草天蛾、海灰翅夜蛾、菜粉蝶、蜜蜂、果蝇等等,是不是有的“出结果”,有的“不出结果”(当然,这里狭义的出结果,指的是试验结果终于“显著了”,终于和我们的期望一致),“不出结果”的根本就没有发表出来?
或许,“出现期望结果的”,只占5%~10%?
能开发出专门针对“天花板效应”和“地板效应”的统计方法,实在是太重要了。但显然这单纯依赖软件商是不行的,而是由理论数学家着手开始......
转载本文请联系原作者获取授权,同时请注明本文来自李为争科学网博客。
链接地址:https://wap.sciencenet.cn/blog-3612267-1485178.html?mobile=1
收藏