|
看到名刊New Phytologist今年发的一篇论文中的下图,用线性模型分析了两个指标和研究地点的干旱指数之间的关系。按理说此等大刊,数据分析方法也应该高度严谨,但就此图来说,似乎并不尽然。
就这个数据来说,干旱指数的梯度非常少,只有4个梯度。用lm来分析这两个指标随干旱指数的变化趋势,可靠度非常有限。也就是说这样的数据,并不足以回答这一问题。且干旱指数在0.3~0.8之间,有非常大的空白,其中包括了多少不确定性不言而喻。尤其是对于图b,强制用直线拟合来分析这个数据,明显说不过去。如果加入二次项,又因为梯度过少,模型显得过于复杂了,有过度拟合的风险,所以无论怎么看,都有问题。
那么对于这种格局的数据,我们该如何处理呢?个人觉得最好的方法就是把干旱指数划分为包括4个梯度的分类变量(或者吓唬人一下,叫哑变量),然后用lm+anova+多重比较来分析,这样就可以回答1)总体上干旱度对两指标有无影响;2)如果有,那么到底是哪些干旱水平之间有差异,即开展不同干旱水平之间的两两比较。这样即可以回答不同干旱程度之间的差异,又避免了妄断指标随着干旱度变化的直线趋势,可谓两全其美。
参考文献:González-Melo, A., B. Salgado-Negret, N. Norden, R. González-M, J. P. Benavides, J. M. Cely, J. Abad Ferrer, Á. Idárraga, E. Moreno, C. Pizano, J. Puentes-Marín, N. Pulido, K. Rivera, F. Rojas-Bautista, J. F. Solorzano, and M. N. Umaña. 2025. Linking seedling wood anatomical trade-offs with drought and seedling growth and survival in tropical dry forests. New Phytologist 245:117-129.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-3-15 02:58
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社