zhang2sha的个人博客分享 http://blog.sciencenet.cn/u/zhang2sha

博文

多分类比率数据,该如何分析?

已有 326 次阅读 2024-7-13 08:16 |系统分类:科研笔记

       通常情况下,在统计模型中,因变量Y都是单独的一个变量,比如体重,产量等。但有时候,Y可能是一个包括多个情况的比率变量。比如,有一种溶液,其成分包括水、糖类、和氨基酸,三者占比之和等于1。如果想分析某变量X对该溶液成分构成的影响,那么这个模型该如何构建呢。

      这里Y是一种典型的多分类比率分布,统计中,Dirichlet 回归,就是专门针对这种数据类型的回归模型。在brms中,我们便可以轻松搞定这种模型。

     比如昨天一位贝叶斯学员就拟合了下面这个Dirichlet 模型,但对如何正确的解读这个模型,有疑问。他的模型和结果如下图:这里,因变量Y分为三种情况An, Ar和Mo, 三者有各自的比率,但三者比率之和等于1。自变量为Season, 分为Spring和Autumn两个水平。

图片.png

那么,我们该如何正确地解读这个结果呢?见下图:

图片.png

我们也可以直接作图查看模型结果:

图片.png

       关于比率数据该如何分析的问题,可以参考此图(Douma and Weedon 2019)。Douma and Weedon大师的这篇论文,也详细介绍了比率数据的分析问题,非常值得推荐。

图片.png

参考文献:

Douma, J. C., and J. T. Weedon. 2019. Analysing continuous proportions in ecology and evolution: A practical introduction to beta and Dirichlet regression. 10:1412-1430.

欢迎大家关注鄙人的微信个人公众号“二傻统计”

图片.png



https://wap.sciencenet.cn/blog-3442043-1442112.html

上一篇:交互作用,为什么有时候做不出来?
下一篇:Nature封面-控制时间自相关的非线性模型
收藏 IP: 117.147.89.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-16 15:27

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部