育种数据分析之放飞自我分享 http://blog.sciencenet.cn/u/yijiaobai 关注:生物统计,数量遗传,混合线性模型,生物信息,R,Perl,Python,GWAS,GS相关方法,文章及代码

博文

混合线性模型的理解 | 学霸和富二代的故事

已有 5568 次阅读 2021-6-5 17:28 |个人分类:农学统计|系统分类:科研笔记

富二代和学霸的故事

看一下lmer函数拟合混合线性模型的通用函数:

举个例子,在一个课堂上,小学六年级,班里面有30个学生,这些学生有一年级到五年级的学习成绩,现在根据这些数据,预测这些学生六年级的成绩。

「学生分类:」

  • 富二代,富二代家里有钱,幼儿园和小学都有私人教师,个性化补习,起点较高。
  • 学霸,学霸就是聪明,知识掌握容易,进步很快
  • 普通学生,起点一般,知识掌握速度也一般

「对应模型:」

lmer混合线性模型中,随机因子的定义有「截距,intercept」「斜率,slope」两个参数。

富二代,就是截距很高,就是起点很高 学霸,就是斜率很高 富二代学霸,就是截距很高,斜率也很高


1. 模型解释

lmer常用模型公式如下:

mod= lmer(data = , formula = y ~ Fixed_Factor + (Random_intercept + Random_Slope | Random_Factor))
  • data,为数据集
  • y,为观测值,所要分析的性状,因变量
  • Fixed_Factor,为固定因子
  • ()内为随机因子
    • Random_intercept,为随机截距,即认为不同群体因变量的分布不同(通俗的解释:有的人生下来起点高,是富二代,有的人是一般群众,起点低)
    • Random_Slope,为随机斜率,即认为不同群体受固定因子的影响不同(通俗解释:有的人是学霸,学习能力强,2个小时学会,斜率高;有的人是学渣,2天才能学会,斜率低)
    • Random_Factor,随机因子

参考: https://zhuanlan.zhihu.com/p/63092231

2. 常用模型

2.1 Random intercept with fixeed mean

这里是截距(intercept)随机,均值(mean)固定。

公式:

  • (1 | g)
  • 也可以写为:1 + (1 | g)

比如下面两种模型是等价的:

mod1a = lmer(Reaction ~ Days + (1 | Subject), data=dat)
mod1aa = lmer(Reaction ~ Days + 1 + (1 | Subject), data=dat)

2.2 Random intercept with a priori means

公式:

  • 0 + offset(0) + (1 | g)
  • 也可以写为:-1 + offset(0) + (1 | g)

这部分没有很理解,也没有例子,官方文档解释如下:

The names of grouping factors are denoted g, g1, and g2, and covariates and a priori known offsets as x and o

2.3 Intercept varying among g1 and g2 within g1

公式:

  • 1 + (1 | g1/g2)
  • 也可以写为:(1 | g1) + (1 | g1:g2)

2.4 Intercept varying among g1 and g2

公式:

  • (1 | g1) + (1|g2)
  • 也可以写为:1 + (1 | g1) + (1|g2)

2.5 Correlated random intercept and slope

公式:

  • x + (x | g)
  • 也可以写为:1 + x + (1 + x|g)

2.6 Uncorrelated random intercept and slope

公式:

  • x + (x || g)
  • 也可以写为:1 + x + (1|g) + (0 + x|g)

「公式汇总:」「注意:」这里,x为数值协变量,gg1g2为因子协变量。

参考:https://cran.r-project.org/web/packages/lme4/vignettes/lmer.pdf

欢迎关注我的公众号:育种数据分析之放飞自我。主要分享R语言,Python,育种数据分析,生物统计,数量遗传学,混合线性模型,GWAS和GS相关的知识。




https://wap.sciencenet.cn/blog-2577109-1289878.html

上一篇:文献下载文献阅读的方法分享 | 我的三板斧
下一篇:混合线性模型的可视化
收藏 IP: 223.90.189.*| 热度|

1 李宏翰

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 05:39

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部