育种数据分析之放飞自我分享 http://blog.sciencenet.cn/u/yijiaobai 关注:生物统计,数量遗传,混合线性模型,生物信息,R,Perl,Python,GWAS,GS相关方法,文章及代码

博文

孟德尔抽样误差和基因组选择

已有 622 次阅读 2021-10-26 20:27 |个人分类:数量遗传学|系统分类:科研笔记

image.png


先说一个现象:一龙生九子,九子各不同。是什么原因造成的?

龙生九子,汉语成语,读音是lóng shēng jiǔ zǐ,意思是多用来比喻同胞兄弟的各有所长,出自《玉芝堂谈荟·龙生九子》。 ----百度百科

  • 传统遗传学的理由:基因重组

  • 数量遗传学的理由:孟德尔抽样

所以,什么是孟德尔抽样?[1]

1. 基本模型

个体的每个表型值是由环境因素和遗传因素共同决定的,可以用下面公式:

表型值环境效应值遗传效应自残差效应值

或者写为:

上面公式中 是个体i的第j个记录; 是固定环境效应值,比如牧场、群、出生年份、性别等; 是个体的加性效应值、显性效应值、上位性效应值的和; 是影响个体i的所有随机环境效应的和。

加性效应值 代表个体基因源自亲本的平均加性效应,称为育种值(breeding value)。

显性效应 代表座位内的互作

互作效应 代表座位间的互作

2. 个体育种值组合

比如 为个体i的育种值, 为父本的育种值, 为母本的育种值,因为父母本各传递一般的效应给子代,所以:

「孟德尔抽样:」 为个体育种值与父母平均育种值的离差,即孟德尔抽样(Mendelian sampling)。因为全同胞后代的基因不完全相同,存在遗传变异。孟德尔抽样可以看作是个体源自亲本的平均加性效应与该亲本传递给所有后代共同平均基因效应的离差。

3. 为何基因组选择估算的育种值准确?

比如系谱:

构建A矩阵,将4,5,6提取出来:

如果个体编号A,3,4,5都有基因型,那么可以构建G矩阵,比如是这样的:

可以看出来,系谱构建的矩阵,亲子的都是0.5,全同胞内部都是0.5625(因为这里父母间有关系系数,如果没有应该是0.5),系谱没有估计出孟德尔抽样。

而基因型数据构建的G矩阵,亲子分别是:0.5150.4810.586,这里的孟德尔抽样就是减去0.5,分别是0.015-0.0290.086,这些值真实反应出了个体间的关系,比系谱更准确。

「混合线性方程组是这样的:」

因为G比A更能反应出个体间的关系,所以评估出的GEBV比EBV更准确。

4, 所以九子各不同是什么原因?

因为孟德尔抽样不一样。[2]

5,什么情况下孟德尔抽样为0?

商品代!!!

比如玉米杂交种F1[3],父母都是高度纯合的自交系,F1的基因型完全一致。即使将个体的基因型检测出来,也是完全一致的,构建矩阵也是完全一致的,这时候和系谱构建的亲缘关系是一致的,就没有孟德尔抽样了。

6,实际应用情况

并不是几个个体检测基因型,构建G矩阵,就可以计算GS,需要一定的量,群体太小也没用,计算得不准确。

Reference

[1]

参考书籍: 《线性模型在动物育种值预测中的应用》第三版

[2]

同义反复: 重复出现,表示强调。

[3]

每年种地时购买的品种,比如郑单958: 如果F1的种子种地时发现高低不一,一定是买了假种子!!!




https://wap.sciencenet.cn/blog-2577109-1309580.html

上一篇:使用TASSEL学习GWAS笔记(4/6):一般线性模型进行GWAS分析(GLM模型)

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-12-3 03:26

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部