||
利用GBLUP方法预测水稻杂交种得表现
Predicting hybrid performance in rice using genomicbest line unbiased prediction
发表杂志:PANS
发表单位:加州大学、华中农业大学
发表时间:2014年5月
摘要:
全基因组选择(Genomic selection,GS)是分子辅助选择(MAS)的升级版,它利用全基因组的标记信息,而且不需要先定位QTL。GS比MAS效率高,特别是针对多基因控制的性状,利用标记信息可以在作物早期进行选择,而不用等到作物性状表现出来再选择,这大大节约了成本。目前,杂交育种成为作物增产的主要方式。这里我们提出和应用了一种预测杂交种表现的方法,用一部分的杂交种和亲本作为训练群体,来预测其它组配杂交种的表现,这种方法就是全基因组最佳线性无偏预测(Genomic best linear unbiased prediction,GBLIP),我们用水稻的210个重组自交系构成的杂交种,随机选择278个杂交种作为训练群体(training sample),预测21945个杂交种得表现。根据GBLUP的预测结果,选择产量前100个的杂交种,结果显示比平均产量高16%,这表明GBLUP预测杂交种产量是非常有效的,这项技术在杂交育种中应用潜力巨大。
背景介绍:
作物育种的主要目的是为了满足人类的需求,杂交育种技术对于粮食产量的增加十分有效,应用杂交育种比较成熟的作物是水稻和玉米。尽管杂交育种非常有效,但是选择优良的杂交种很大程度上还是依靠田间实践经验和对误差的控制,杂交育种中最大的挑战是如何根据现有的数据来选择亲本组配,进而预测杂交种表现。
Bernardo应用BLUP(best linear unbiased prediction)根据杂交种和亲本的系谱信息来预测某两个亲本之间杂交种产量的高低。随着基因组的发展,全基因组标记信息的成本越来越低,这就很容易根据分子标记信息来衡量自交系的血缘关系,这比传统的系谱信息更准确和容易操作,根据分子标记血缘信息构建亲缘关系矩阵来代替传统的系谱信息A矩阵,分析BLUP值,这种方法叫做GBLUP。目前的研究大部分的研究都是根据加性效应(additive effects)进行预测,还没有相关模型将非加性效应(显性效应和上位性效应)考虑进去。
GS和传统预测的区别:
1、MAS是先找到相关的标记,一般是有关联性状的标记,比如QTL定位的标记或者关联分析得到的标记,然后根据标记进行预测。GS应用全部的标记预测基因组育种值。
2、GS不需要估计每一个标记的效应,由于标记数远大于观测值的个数,GS是将标记作为一个整体进行考虑,它预测的结果是所有标记整合后的结果。
GS的方法比较:
1、Bayes B
2、Empirical Bayes
3、LASSO(least absolute shrinkage selection operator)
4、GBLUP
前三种方法可以划分为一类,选择性收缩(selective shrinkage),尽管有模拟的数据试验表明选择性收缩方法要优于GBLUP,但是实际的验证试验结果表明两类方法差别不大。GBLUP对于多基因控制的性状预测效果更好,而大部分经济性状都是数量性状控制的,这表明GBLUP方法是比较强健的。
主要结论:
1、基于REML的GBLUP
狭义遗传力:千粒重0.84,产量0.38;
预测值和观测值相关系数:千粒重0.89,产量0.51
用交叉验证(fivefold cross-validation)计算预测结果和实际结果的相关系数:千粒重0.68,产量0.13
结果表明GS选择最有效的性状是千粒重。
2、比较GBLUP和LASSO、SSVS
结果表明三种方法对于四种性状的交叉验证相关系数差别不大,如下表所示:
3、在GBLUP模型中增加非加性效应
永久F2群体(immortalized F2)可以分析多种遗传效应,主要有6中效应:加性效应(a)、显性效应(d)、加性X加性(aa)、显性X显性(dd)、加性X显性(ad)、显性X加性(da),利用6中模型进行预测,六种模型包含的效应如下:
模型1:仅有加性效应
模型2:加性效应和显性效应
模型3:加性效应 + 显性效应 + 加性效应X加性效应
模型4:加性效应 + 显性效应 + 加性效应X加性效应 + 显性效应X显性效应
模型5:加性效应 + 显性效应 + 加性效应X加性效应 + 显性效应X显性效应 + 加性效应X显性效应
模型6:加性效应 + 显性效应 + 加性效应X加性效应 + 显性效应X显性效应 + 加性效应X显性效应 + 显性效应X加性效应
这六中模型拟合的效果如下图:
上图是预测结果,横坐标是模型的类型,纵坐标是预测值得相关系数(predictability),不同的颜色表示不同的样本数。随着模型的复杂和样本数目的增加,预测的准确性不断增加最后趋于平稳。本实验由于样本数较小,造成标准误(SEs)较大,我们发现增加显性效应和上位性效应的模型变化并不显著。未来需要更大的样本来验证显性和上位性效应增加的效果。
4、用模拟数据研究非加性效应的预测效果
对于大样本,在模型中增加非加性效应会提高模型的拟合性和预测的准确性,在实际的试验中,有些性状主要受加性效应影响,但模拟数据表明,即使影响性状的因素主要是加性效应,在模型中增加显性和上位性效应也不影响预测结果。
编者寄语:
结果展望:实际育种中根据加性效应(育种值)的BLUP方法和GBLUP在动物育种中广泛应用,而且获得了很大的经济效益。在植物中,特别是杂交作物中由于杂种优势的存在,相关模型的研究一直是个瓶颈,该论文在模型中增加非加性效应的模型以及预测的研究,提供一个重要的思路。随着相关研究的进展,相信利用GBLUP估计杂交种产量的方法将会在杂交育种中产生一个很大的变革。
方法讨论:该研究比较了GS中常用的方法,最终认为GBLUP比较强健,因为大部分经济性状都是微效基因控制的数量性状,GBLUP方法有很大的优势。该研究应用的软件是SAS的mixed model,但国际上分析GBLUP方法更普遍的软件是ASReml,它相对于SAS运行速度更快,支持的数据量更大,而且更容易定义G矩阵和R矩阵的方差协方差结构。
参考文献:
Xu S, Zhu D, Zhang Q. Predicting hybridperformance in rice using genomic best linear unbiased prediction.[J].Proceedings of the National Academy of Science, 2014, 111(34):12456-12461.
http://www.pnas.org/content/111/34/12456.full.pdf
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-10-19 22:06
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社