moralscience的个人博客分享 http://blog.sciencenet.cn/u/moralscience

博文

结果是负性,巧舌难辩明 精选

已有 67063 次阅读 2022-4-1 23:56 |系统分类:科研笔记

在心理学研究中,很可能出现负性结果,也就是与原来预期不一致的情况——根据研究方案,应该得到统计显著的结果,然而,相应的结果就是不显著。总体而言,负性结果将研究者陷于困境之中,原因很简单,之所以开展这样的研究,那是研究者基于文献而产生了至少自己认为很有价值的研究思想,构思了研究方案,包括研究假设;但是,负性结果否定了研究假设,也就否定了相应的研究思想,使研究者前后矛盾了。

对于研究中的负性结果,可以分析为什么出现与预期不一致的情况,由此还可能有全新的研究和发现,心理学中不乏此类范例。当然,也可以放弃相应的研究资料,虽然有些可惜。同时,如果有关研究耗费的时间、精力、经费很多,研究者可能舍不得已有数据,仍然要撰写论文,特别地,如果是有关领域的专家,这样的论文还能发表。

撰写负性结果的论文,对研究者应该是极大的考验,因为这需要研究者为自己的意外结果进行辩解。如果研究者花的功夫不够,辩解的效果就将颇为有限。最近的一篇论文(Bongaerts, Schutter & Klaus, 2022)是个值得剖析的例子,前文介绍了它的引言和方法部分,本文介绍并点评它的结果与讨论部分。

预登记的统计分析是用R来计算。对于语言流畅性任务,由于试次较少(每种刺激条件下3个试次),每个被试每节实验中说出的单词个数相加,进行单样本t检验。对于其他各项任务,先对刺激条件的反应时和错误率进行单样本t检验,探索阳极与伪极tDCS之间的差异。接着,计算广义线性混合模型,包括tDCS(阳极vs.伪极)的被试内固定效应、tDCS的被试间截距和被试间斜率。对反应时来说,拟合一个伽玛分布,可以解释分布的右偏态。对于错误率,拟合一个二项分布。最后,探索不同任务间是否存在tDCS效应的被试内一致性,对3种语言任务计算个体tDCS效应(阳极tDCS的因变量均值-伪极tDCS的因变量均值)的相关。所有统计检验都是双尾的。对于t检验和混合模型分析,α水平设定为0.05。为了解释相关分析的多重比较,对应的α水平设定为0.017(即,0.05/3=0.017)。

探索性分析。已有研究报告,小脑tDCS效应是任务特异难度的函数(例如,Maldonado & Bernard, 2021),研究者对句子理解和词汇判断任务,分别做了两个额外的非预登记分析,包括难度(低vs.高)的固定效应。这种区分是可能的,因为两套刺激中有内在的差异,却不能事先完全控制。对于句子理解任务,低难度定义为描绘行为人做出的简单动作,例如,“女孩儿在笑”,高难度定义为行为人向对象发出一个动作,例如,“女孩儿在守护珠宝箱”。对于词汇判断任务,依据单词的形态复杂性,真词和假词分别分为低难度和高难度(Ernestus & Cutler, 2015)。低难度指一个词干带有一个或两个词缀,高难度指两个词干有或没有后缀(即,合成词)。在两个分析中,均包括难度的固定效应,作为主效应及其与tDCS的交互作用。对于句子理解任务,相应的模型不收敛,就简化了模型。

预登记分析。表14项实验任务各刺激条件(真vs.tDCS)因变量的描述统计量。

image.png 

语言流畅性任务。真与伪tDCS条件下说出的单词个数之间没有显著差异,t(35)=0.12, p=.906

句子理解。572个错误反应(7.6%)和96个试次为奇异值(1.3%),从反应时分析中删除。在t检验中,没有显著的tDCS效应(RTt(35)=-0.28, p=.782; 错误率:t(35)=-1.09, p=.285),在线性混合模型中,也没有显著的tDCS效应(RTβ=-7.61, SE=5.36, t=-1.42, p=.156; 错误率:β=-0.06, SE=0.07, z=-0.92, p=.355)。

词汇判断任务。899个错误反应(10.4%)和157个试次为奇异值(1.8%),从反应时分析中删除。对反应时来说,t检验没有发现tDCS条件之间的显著差异(t(35)=-0.47, p=.640)。线性混合模型显示,阳极条件比伪极条件倾向于反应更快(β=-6.32, SE=3.48, t=-1.82, p=.067),即两种条件之间的差异边缘显著。错误率没有显著差异(t检验:t(35)=1.20, p=.236;混合模型:β=0.03, SE=0.04, z=0.82, p=.410)。

控制任务。99个试次为奇异值(2.8%),从分析中删除。阳极与伪极tDCS之间的运动任务反应时几乎是相同的,没有差异(t检验:t(35)=0.65, p=.522; 混合模型:β=0.61, SE=0.94, z=0.65, p=.517)。这里已经说明,该研究的tDCS是无效的。

跨任务tDCS的个体差异。语言任务中的刺激效应(阳极条件的成绩-伪极条件的成绩),词汇判断与句子理解之间存在显著相关(r=0.595, p<.001, R2=35.4%),词汇判断与语言流畅性之间(r=-0.187, p=.275, R2=3.5%)、词语流畅性与句子理解之间(r=-0.254, p=.135, R2=6.5%)的相关均不显著。

探索性分析。对于句子理解任务,包括难度(低vs.高)固定效应的分析表明,tDCS的主效应显著(β=-12.21, SE=3.38, t=-3.62, p<.001),难度的主效应显著(β=233.25, SE=5.26, t=-44.38, p<.001),关键地是,二者的交互作用显著(β=7.35, SE=3.19, t=2.30, p=.021)。随后的比较显示,与伪极tDCS相比,阳极tDCS在低难度条件下促进反应时(β=-39.12, SE=8.94, z=-4.38, p<.001),在高难度条件下没有效应(β=-9.73, SE=9.63, t=-1.01, p=.313)。

对于词汇判断任务,同样的分析表明,难度的主效应显著(β=27.34, SE=3.03, t=9.04, p<.001),tDCS与难度的交互作用显著(β=-9.70, SE=3.40, t=-2.86, p=.004)。与句子理解任务相反,tDCS在高难度条件倾向于有促进效应(β=-30.90, SE=16.80, z=-1.84, p=.066),即边缘显著,在低难度条件没有效应(β=7.90, SE=16.70, z=0.47, p=.637)。

该研究为双盲实验,真的做到双盲了吗?对于tDCS这样的实验,由于阳极刺激会引起头皮微弱发热,被试可能知道接受的是阳极tDCS还是伪极tDCS。在第二节实验结束时,有25名被试正确地猜到自己在哪节实验接受的是哪种刺激条件,另外11名被试没有猜对或不能确定(χ2(1)=4.01, p=.045)。由每节实验最后的感觉问卷,获知被试在阳极tDCS条件下(M=0.68, SD=0.84)比伪极tDCS条件下(M=0.35, SD=0.69)报告更强的温热感(t(33)=2.24, p=.032)。对于这种感觉,每节实验各有一名被试未能说明有任何感觉,这一分析是以34名被试为基础的。被试的报告表明,阳极tDCSM=0.40, SD=0.65)比伪极tDCSM=0.09 SD=0.28)对自己有更强的影响(t(34)=2.75, p=.009),一名被试未能在这个问题上做出反应。其他感觉在刺激条件之间均无显著差异(p>.162)。不过,刺激感觉时间有显著差异(t(35)=6.29, p<.001),对阳极tDCS的感知(M=1.08, SD=0.84)比对伪极tDCS的感知(M=0.17, SD=0.51)要长。这种感觉在3点量尺(0~2)上表示,这意味着,平均而言,被试对阳极tDCS的感知大致在刺激时间的中点。

为了考察真实刺激条件的觉知是否提高了一般警觉,造成非特异促进效应,研究者对正确猜到刺激系列的25名被试的运动控制任务成绩进行分析,然而,却未能发现tDCS的效应(β=1.40, SE=3.00, t=0.46, p=.644)。因此,双盲控制不太有效的问题,不太可能影响被试的成绩。

然而,这里存在更大的问题:小脑参与运动控制,但在该研究中,小脑tDCS却不影响运动控制,即使在被试猜到自己处于真实的tDCS条件,亦是如此。这充分表明,该实验的tDCS本身是无效的,至少是可疑的。特别地,研究者在前面设置了运动控制任务,却没有真正把这种任务当成分析的基础,而只是用来说明双盲控制虽然未能做好,但是不影响研究结果。

该研究的目的是考察小脑右半球在不同语言加工任务中的可能贡献。已有研究报告,对于语言加工的预测方面,小脑tDCS对任务成绩有调节作用(例如,Rice et al., 2021),例文考察的语言加工任务是不能放在预测加工框架里的。他们的预登记分析表明,tDCS没有显著的主效应。探索性分析表明,词汇判断和句子理解任务分别有任务难度的分离效应,即,阳极tDCS减少句子理解任务低负荷条件、词汇判断任务高负荷条件的反应时。总体而言,这些结果未能提供小脑参与语言特定加工的证据,支持小脑在语言加工中具有通用作用的理论(Skipper & Lametti, 2021)。不过,该研究的结果也提示,小脑右半球,特别是后外侧,在语言加工中具有任务特异性和难度特异性。

词汇判断任务,需要手指反应,两种条件产生了相对较小的反应时,显示了阳极tDCS的边缘显著的促进效应。研究者加了一个难度因素,进行额外分析,认为tDCS在词汇判断中的边缘促进效应是对高难度任务的反应造成的,低难度任务不存在这样的效应。研究者据此推测,小脑右半球在更具挑战性的词汇判断任务中有作用,潜在地与对侧前额叶皮层释放额外的资源有关。然而,由于高难度条件的tDCS效应的显著性超出了事先确定的α=0.05的水平(双尾检验),因此,对于这个特定比较,就不得出结论了。

显然,这里至少有两点不妥:其一,不宜用事先确定的α水平为研究结果辩护,因为这样表述的言下之意是,这个α水平影响了自己的结论,带有不甘心的倾向;其二,研究者知道已有研究表明小脑参与词汇判断,从而,这项研究的目的,不是澄清小脑是否参与词汇判断,而是考察小脑参与词汇判断的情况与小脑参与其他语言任务的情况是否相同,因此,这里不该预先设定双尾检验,而应该设定单尾检验。

对于句子理解任务,tDCS的总体效应在统计上也不显著。研究者的辩解是,这项任务比词汇判断任务复杂,平均反应时比词汇判断任务的大2倍,被试间与被试内的变异性更大,因此,对于这样复杂的语言任务,小脑右半球的作用不太关键,或者可能由大脑皮层语言区所补偿。包括难度的额外分析表明,存在一种难度特异模式,即,虽然在高难度条件下没有tDCS效应,但是,在低难度条件下,阳极tDCS显示了促进效应。

这是很奇怪的辩解,在词汇判断任务中,高难度条件才能显示tDCS的效应;而在研究者所说的平均而言难度更高的句子理解任务中,也没显示tDCS的效应,这时,却出现了低难度条件的tDCS效应。虽然,可能存在只有难度合适的语言加工才会显示tDCS效应的情况,但是,研究者在同一研究中,任意更换标准,则是不甚妥当的。特别地,研究者的这类分析是额外的,即面对无法显示tDCS效应的研究结果,又想出来的补救分析,从而,这样的事后解释就愈加意义有限了。

该研究以小脑参与语言加工为前提,整个论证过程也是这样的——字里行间都是这个意思,然而,该文的结论却是“没有提供小脑参与语言加工的证据”,这实在是研究者不甘心的结论,所以,才做了额外分析。这样的额外分析,特别是解释,是捉襟见肘的。如果该研究真得出了“小脑不参与语言加工”的结果,倒是更有意义的——情况显然并非如此。

对于语言流畅性任务,结果表明,也不受小脑刺激的调节。研究者指出,在已有的两项同类研究中,一项显示阳极tDCS对健康个体的成绩有促进作用(Turkeltaub et al., 2016),一项显示阳极tDCS对慢性中风失语症病人无效(DeMarco et al, 2021)。研究者指出,这两项研究是比较tDCS前后的语言流畅性成绩,并且是被试间比较,而自己的研究是比较tDCS中的语言流畅性成绩,并且是被试内比较。当前,尚不知小脑tDCS的即时效应与延时效应是否相同(Grimaldi et al., 2016)。研究者推测,tDCS对语言流畅性的成功调节,至少对于健康个体来说,需要小脑神经递质的慢慢释放,在进行tDCS时,还没有完成这样的过程。

研究者画蛇添足地指出,一项考察4名小脑右半球后内侧损伤病人的研究,发现音位和语义流畅性未受损伤(Geva et al., 2021),研究者据此推测,这个脑区可能对于流畅性成绩并不关键。为了解释自己不显著的研究结果,降低小脑在语言流畅性中的作用,显然也是不妥当的。最后,研究者指出,评估语言流畅性的指标只有一个因变量,即说出的单词个数。这不能排除小脑tDCS影响与这一任务关系更密切的其他过程,比如,词汇聚类的策略或提取的时间过程。

该文最后指出,研究未能提供小脑右半球后侧参与语言加工的证据;探索性分析表明,小脑右半球在语言理解加工的任务与难度方面具有作用,扩展了小脑参与语言预测的研究发现。

显然,这样的表述本身就是矛盾的,至少是混乱的:一方面,得出结论,小脑不参与语言加工;另一方面,又承认小脑参与语言加工。因此,对于负性研究结果,研究者会竭力解释和说明,但是,纵有巧舌,亦难真正辩得明白,各种不当随时都会显露出来。

参考文献

Bongaerts, F. L. P., Schutter, D. J. L. G., & Klaus, J. (2022). Cerebellar tDCS does not modulate language processing performance in healthy individuals. Neuropsychologia, 169, 108206.

DeMarco, A. T., Dvorak, E., Lacey, E., Stoodley, C. J., & Turkeltaub, P. E. (2021). An exploratory study of cerebellar transcranial direct current stimulation in individuals with chronic stroke aphasia. Cognitive and Behavioral Neurology, 34, 96-106.

Ernestus, M., & Culter, A. (2015). BALDEY: A database of auditory lexical decisions. Quarterly Journal of Experimental Psychology, 68, 1469-1488.

Geva, S., Schneider, L. M., Roberts, S., Green, D. W., & Price, C. J. (2021). The effect of focal damage to the right medial posterior cerebellum on word and sentence comprehension and production. Frontiers in Human Neuroscience, 15, 239.

Grimaldi, G., Argyropoulos, G. P., Bastian, A., Cortes, M., Davis, N. J., Edwards, J., et al. (2016). Cerebellar transcranial direct current stimulation (ctDCS): A novel approach to understanding cerebellar function in health and disease. Neuroscientist, 22, 83-97.

Maldonado, T., & Bernard, J. A. (2021). The polarity-specific nature of single-session high-definition transcranial direct current stimulation to the cerebellum and prefrontal cortex on motor and non-motor task performance. The Cerebellum, 20, 569-583.

Rice, L. C., DMello, A. M., & Stoodley, C. J. (2021). Differential behavioral and neural effects of regional cerebellar tDCS. Neuroscience, 462, 288-302.

Skipper, J. I., & Lametti, D. R. (2021). Speech perception under the tent: A domain-general predictive role for the cerebellum. Journal of Cognitive Neuroscience, 33, 1517-1534.

Turkeltaub, P. E., Swears, M. K., DMello, A. M., & Stoodley, C. J. (2016). Cerebellar tDCS as a novel treatment for aphasia? Evidence from behavioral and resting-state functional connectivity data in healthy adults. Restorative Neurology and Neuroscience, 34, 491-505.



https://wap.sciencenet.cn/blog-2619783-1332091.html

上一篇:构思不成熟,费力难讨好
下一篇:小脑有何用?电刺激探索
收藏 IP: 220.173.126.*| 热度|

11 杨韩 李毅伟 宋玉 王平平 张俊鹏 张晓良 范振英 陈新平 孙颉 王安良 杨正瓴

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-29 20:47

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部