育种数据分析之放飞自我分享 http://blog.sciencenet.cn/u/yijiaobai 关注:生物统计,数量遗传,混合线性模型,生物信息,R,Perl,Python,GWAS,GS相关方法,文章及代码

博文

怎么用R语言做GGE Biplot双标图(how to)(代码分享及结果解读

已有 9832 次阅读 2016-7-31 18:05 |个人分类:农学统计|系统分类:科研笔记

怎么用R语言做GGE Biplot双标图(how to主要结论:

基本可以做出GGE Biplot双标图,颜色有点丑。

在数据没有缺失值的情况下,可以分析,但是如果有缺失值,就不能分析,对数据格式要求较为严格。

如果数据中有缺失值,建议用GenStat分析。

下面的例子说明R语言和GenStat针对同样的数据,如何做GGE Biplot双标图。


数据:yan.csv

安装GGEBiplot包,载入包

######R package GGEBiplot GUI######

install.packages("GGEBiplotGUI")

library(GGEBiplotGUI)

data(Ontario)

head(Ontario)

str(Ontario)

row.names(Ontario)

以上代码是测试软件是否安装成功,是否可以作图双标图。


使用方法:GGEBiplot(data)就可以了。

它的格式比较特别,将yan数据导入后,需要对数据进行操作


然后将gen名换为行号


整理完数据,开始用R中的包和GenStat进行比较。

1、Which-Won-Where View,就是哪个品种哪个环境中是最好的

对应GenStat模型:




R中的操作:

GGEBiplot(fen_a),然后再这个图上进行进一步的调整。




结果:



结果解读:

这张图主要是按照品种与环境的互作来说明各地点产量最高的品种。

  1. 把各个方向上距离最远的点用直线连接起来,比如G8~G18~G7~G12~G13构成了一个五边形,通过中心对五条边做五条垂线,将双标图分为五个扇区,品种在五个扇区都有分布,品种分为两个扇区,E5E7为一组,其它为一组。

  2. 这张图可以得出:位于五边形顶角的品种是扇区内个环境下产量最高的品种,比如G18在环境E5E7产量最高,品种G8在另外7个试验点产量最高。



第二种图:Environmental Vector View,环境之间的关系

对应GenStat模型如下:将产量(value)导入到Y-variate框中,将品种(cul)导入到Genotype框里面,将环境(env)导入到Environments框里面,在Options里面勾选Connectenvironment scores with origin






作图如下:

结果解读:

  1. 本图主要是分析各试验点之间在品种评价上的相似性。从中心到各个环境做一条线段,线段间的夹角和线段本身的长度都有一定的代表意义。

  2. 两环境线段之间的夹角的余弦值是它们的相关系数,夹角小于90度表示正相关,说明两环境对品种排序相似,大于90度表示负相关,表示两环境对品种排序相反,等于90度说明两环境不相关。夹角较小说明试验点是重复设置的,去掉一个不影响对品种的评价。

  3. 环境线段的长度是试验点对品种的区分能力,线段越长,区分能力越强。

  4. 本图可以知道环境E1E2E3E4存在正相关。E5E7比其它点有较强的品种区分能力。





图三:Discriminating Ability VSRepresentativeness View,区分力和代表性

理想的试验点应该具备两个条件:一是对参试品种有较强的区分能力(线段长),二是对目标生态区有较强的代表性。

GenStat模型如下:





图形如下:



本图一个显著的特征是它增加了两条直线,其中带箭头的直线为平均环境轴(Average Environment Axis),通过平均环境(箭头前面的圆圈)和中心点的连线。

结果解读:

  1. 试验点线段和平均环境轴的角度是其对目标环境的代表性的度量,角度越小,代表性越强。如果一个试验点和平均环境轴夹角为钝角,则它不适合作为试验点。

  2. 平均环境轴上箭头所指的方向是对试验点区分力和代表性两方面的评价。

  3. 就区分力来说,E5E7(线段最长)最好,就代表性而言,E1E2E3E4最好(与平均轴夹角最小)。

  4. 没有区分能力的试验点是无用的。

  5. 有区分力但没有代表性的试验点可以淘汰不稳定的品种,但不能用于优良品种的选择。

  6. 只有既有区分力又有代表性的试验点才能最好的选择高产稳产的品种。因此这张图是对试验点的一个综合评价。



图四:Mean vs Stability View,即高产性和稳产性

GenStat模型如下:



作图如下:



R中:



结果解读:

  1. 高产稳产功能图也需要环境平均轴(带箭头的直线),和平均环境值(直线上圆圈表示)。还有一条通过中心与环境平均轴垂直的直线。将品种点和平均环境轴做一条垂线。

  2. 环境平均轴所指的方向是品种在所有环境下的近似平均产量的走向。可知G8平均产量株高,后面依次是G4G10G18,产量最低的是G12,后面依次是G14G7G13。品种G17的平均产量接近试验总平均。

  3. 通过中心(原点)与平均轴垂直的线代表各品种与各环境相互作用的倾向性。品种与平均环境轴之间的垂线越长,表示品种越不稳定。可知G13(线段最长)最不稳定,其次是G8G17G7。比较稳产的是G12G15G16G6G4(与平均环境轴的垂线较短)。

  4. 综合品种产量和稳定的指标,可以看出G4是一个比较高产稳产的品种,G8也高产,但是不稳产。虽然G12很稳产(它几乎就在平均环境轴上面),但是产量最低。





https://wap.sciencenet.cn/blog-2577109-993726.html

上一篇:利用GBLUP方法预测水稻杂交种得表现(文献解析)
下一篇:应用根系表型和分子标记鉴定不同磷处理影响油菜根系发育的遗传位

1 覃伟

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-10-17 13:55

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部