You are on page 1of 143

Universidad Nacional de Córdoba

Facultad de Ciencias Agropecuarias

Escuela para Graduados

ANÁLISIS DE ENSAYOS COMPARATIVOS DE


RENDIMIENTO EN MEJORAMIENTO VEGETAL
EN EL MARCO DE LOS MODELOS LINEALES
MIXTOS

Fernando Casanoves

Tesis

Para optar al Grado Académico de

Doctor en Ciencias Agropecuarias

Córdoba, 2004
ANÁLISIS DE ENSAYOS COMPARATIVOS DE
RENDIMIENTO EN MEJORAMIENTO VEGETAL
EN EL MARCO DE LOS MODELOS LINEALES
MIXTOS

Fernando Casanoves

Comisión Asesora de Tesis

Directora:Ing. Agr. (PhD) Mónica G. Balzarini

Asesores: Ing. Agr. (PhD) Jose Crossa

Ing. Agr. (MSc) Elvio Biderbost

Tribunal Examinador de Tesis

Ing. Agr. (Dr.) Abelardo de la Vega

Ing. Agr. (PhD.) Laura Giorda

Lic. (Dra.) Nélida Winzer

Presentación formal académica: 28 de julio de 2004

Facultad de Ciencias Agropecuarias

Universidad Nacional de Córdoba

ii
Agradecimientos

A mi directora de tesis, Ing. Agr. (Ph D.) Mónica Balzarini por su permanente vocación

de formación para con mi persona y por todo lo que me aportó en mi desarrollo

científico y profesional. Por acompañarme siempre en mis desafios profesionales y

por su espíritu de motivación continua.

Al los doctores Jose Crossa y Elvio Biderbost, miembros del Comité de Tesis, por sus

valiosos aportes y comentarios.

A mis compañeros de trabajo, Julio Di Rienzo, Laura Gonzalez, Margot Tablada,

Walter Robledo, María del Pilar Díaz, Cecilia Bruno y Alejandra Arroyo por

haberme acompañado de diversas maneras durante mi carrera y el desarrollo de

actividades profesionales .

Al Dr. Glenn Galloway y al Lic. Gustavo Lopez por su apoyo permanente e

incondicional.

A los investigadores del Programa de Mejoramiento de Maní de la EEA-Manfredi,

INTA, por haber facilitado sus datos para ser utilizados en este derarrollo y en

particular al Ing. Agr. Jorge Baldessari por los espacios de discusión que generó.

Al la Ing. Agr. (Ph D) Laura Giorda y a la Dra. Susana Hang por sus aportes editoriales

al documento de tesis.

Al Tribunal Examinador de Tesis, Ing. Agr. (Ph D) Laura Giorda, Dra. Nelida Winzer y

Ing. Agr. (Dr.) Abelardo de la Vega por las correcciones y sugerencias realizadas

sobre el documento final.

iii
A la Facultad de Ciencias Agropecuarias de la Universidad Nacional de Córdoba y al

Centro Agronómico Tropical de Investigación y Enseñanza por brindarme el

espacio de trabajo.

A la Agencia Córdoba Ciencia y Fondo Nacional de Ciencia y Tecnología (FONCYT)

por subsidiar el trabajo de investigación en el que está inserto este proyecto de tesis.

A la Escuela para Graduados de la Facultad de Ciencias Agropecuarias.

iv
RESUMEN

Esta tesis se enmarca en el área de estadística aplicada e involucra la evaluación de


metodologías estadísticas para el análisis de información en programas de mejoramiento
genético vegetal. Se considera la modelización de datos de ensayos comparativos de
rendimiento (ECR). Los ECR suelen repetirse en múltiples ambientes (localidades y/o
años) debido a la existencia de interacción genotipoambiente, siendo común observar
variación espacial en función de la ubicación de las parcelas en el campo y diferentes
niveles de precisión entre ensayos conducidos en distintos ambientes. El objetivo de
este trabajo es proponer estrategias de análisis de ECR multiambientales que permitan:
1) elegir, en etapas tempranas, el material genético experimental que debe continuar en
proceso de evaluación, 2) recomendar, en etapas avanzadas, los genotipos con mejor
desempeño y 3) contemplar la correlación espacial entre parcelas y la heterogeneidad en
precisión de los ensayos conducidos en diferentes ambientes. Las metodologías
investigadas consideran el marco teórico del modelo mixto lineal general. Utilizando
ECR del Programa de Mejoramiento de Maní EEA-Manfredi-INTA (Argentina), se
ilustran diversos aspectos de la modelación estadística y se comparan resultados.

Para responder al primer objetivo se evaluó la potencialidad del uso del mejor
predictor lineal insesgado (BLUP) para la elección de líneas experimentales. Como
medida del desempeño que un genotipo podría tener en futuros ECR se utilizaron
BLUPs de efectos aleatorios de genotipo estandarizados por su error de predicción,
basados en uno y dos años de ECR. Los resultados muestran que los BLUPs
estandarizados, aún obtenidos a partir de información de un año de ECR, tienen más
capacidad predictiva que las medias de genotipo. En relación al segundo objetivo, se
analizaron ECR multiambientales por año mediante modelos de efectos fijos sobre
tablas de datos completas y a través de los años mediante modelos mixtos aplicables a
tablas de datos incompletas (i.e. no todos los genotipos en todos los años). Los modelos
fueron ajustados con varianzas residuales homogéneas y heterogéneas a través de los
años. Los resultados permitieron identificar cultivares superiores y confirman la
existencia de un único mega-ambiente para la identificación de cultivares con mayor

v
potencial de rendimiento en la región manisera Argentina. Considerando la necesidad
de contemplar la correlación espacial entre parcelas y las diferencias en precisión de los
ensayos de un ECR multiambiental se evaluaron simultáneamente, sobre diversos ECR,
una decena de modelos estadísticos y se discutió la equivalencia que existe entre
algunos modelos mixtos espaciales en el contexto particular de los ECR
multiambientales. Los resultados sugieren que el modelo con estructura de error
estacionaria anisotrópica AR1AR1 y varianzas residuales heterogéneas constituye la
mejor alternativa de análisis para ECR multiambientales.

Palabras clave: mérito genético, ensayos multiambientales, interacción

genotipoambiente, correlación espacial.

vi
ABSTRACT

This thesis is in the area of Applied Statistics and involves the evaluation of statistical
methodologies for the analysis of information in plant breeding programs. The modeling
of data from yield multi-environments variety trials (MET) is considered. Yield variety
trials are usually repeated in several environments (locations and/or years) due to the
genotype×environment interaction, and it is common to observe spatial variation
according to the location of the plot in the field, and different levels of precision among
trials conducted in different environments. The objective of this work is to propose
strategies for the analysis of multi-environment yield variety trials which permit: 1) to
choose, at early stages, the experimental genetic material to continue the evaluation
process, 2) recommend, at advanced stages, the genotypes with better performance, and
3) to consider the spatial correlation among plots and the heterogeneity in the precision
of trials conducted in different environments. The methodologies reviewed consider the
theoretical framework of the general linear mixed model. Different aspects of the
statistical modeling process are illustrated using yield variety trials form the Peanut
Breeding Program EEA-Manfredi-INTA (Argentina). Results from these analyses are
compared.

In order to address the first objective, the performance of the best linear unbiased
predictor (BLUP) for selecting experimental lines was evaluated. The BLUP´s of the
random effects of genotype, standardized by their prediction error and based on data
from one and two years of variety trials, were used as a measure of the performance that
a genotype could have in future trials. The results show that the standardized BLUP´s,
even the ones obtained from one year, have more predictive ability than those obtained
using fixed effects models for complete data tables, and mixed models for incomplete
data (i.e., when not all genotypes were present in all years). The models were adjusted
with residual variances which were homogeneous and heterogeneous through time. The
results identified superior cultivars and confirm the existence of a single mega-
environment for the identification of cultivars with better yield potential in the peanut
growing region in Argentina. Ten different statistical models were used to account for
the spatial correlation among plots and the differences in precision among different

vii
trials. The equivalence among several of the spatial mixed models in the particular
context of multi-environment trials is discussed. The results suggest that the model with
anisotropic stationary AR1×AR1 with heterogeneous residual variances is the best
alternative for these multi-environment yield trials.

Key words: genetic merit, multi-environment trials, genotypeenvironment interaction,

spatial correlation.

viii
Tabla de Contenido

Pag.

CAPÍTULO I .............................................................................................................................................. 1

REVISIÓN DE ANTECEDENTES ....................................................................................................................... 1

Objetivos ................................................................................................................................................ 5

Objetivo General .................................................................................................................................... 5

Objetivos Específicos ............................................................................................................................. 6

CAPÍTULO II ............................................................................................................................................ 7

MARCO TEÓRICO DE LA MODELACIÓN ESTADÍSTICA EN ENSAYOS COMPARATIVOS DE RENDIMIENTOS ........ 7

El modelo lineal mixto ........................................................................................................................... 7

Aplicación de modelos mixtos en la evaluación de genotipos experimentales .................................... 13

Modelos estadísticos para la evaluación de cultivares en ensayos multiambientales ........................... 18

Análisis de la interacción G×A ......................................................................................................................... 22

Modelos de regresión .................................................................................................................................... 24

Modelos basados en análisis de componentes principales ............................................................................ 28

Interpretación de los gráficos GGE biplot..................................................................................................... 32

Identificación del desempeño de genotipos en un mismo ambiente ........................................................ 32

Identificación del desempeño de un genotipo a través de los ambientes ................................................. 33

Comparación de dos genotipos en diferentes ambientes. ......................................................................... 34

Identificación de los mejores genotipos en cada ambiente ...................................................................... 35

Identificación de grupos de ambientes ..................................................................................................... 36

Identificación de desempeño promedio y estabilidad de genotipos ......................................................... 36

Identificación de la capacidad discriminante y la representatividad de los ambientes ............................. 38

Modelos mixtos para el análisis de la interacción GA ................................................................................ 39

Modelos de regresión factorial ...................................................................................................................... 44

ix
Modelación de la estructura de parcelas en ECR multiambientales ..................................................... 46

CAPÍTULO III ......................................................................................................................................... 52

PREDICTORES LINEALES INSESGADOS (BLUP) EN ENSAYOS COMPARATIVOS DE RENDIMIENTO DE LÍNEAS

EXPERIMENTALES ...................................................................................................................................... 52

Introducción ......................................................................................................................................... 52

Material y Métodos .............................................................................................................................. 53

Base de datos..................................................................................................................................................... 53

Modelos estadísticos ......................................................................................................................................... 55

Estimación de componentes de varianza ....................................................................................................... 55

Predicción de los efectos de genotipo (BLUP) basados en datos de una campaña agrícola .......................... 56

Predictores (BLUP) basados en datos de dos campañas agrícolas ................................................................ 58

Evaluación de las predicciones generadas ......................................................................................................... 59

Resultados y Discusión......................................................................................................................... 60

Estimación de componentes de varianza ....................................................................................................... 60

Capacidad predictiva de los BLUPs de genotipo .......................................................................................... 61

Conclusiones ........................................................................................................................................ 64

CAPÍTULO IV ......................................................................................................................................... 66

EVALUACIÓN DE ENSAYOS COMPARATIVOS DE RENDIMIENTO DE CULTIVARES DE MANÍ (ARACHIS

HYPOGAEA L.)............................................................................................................................................ 66

Introducción ......................................................................................................................................... 66

Material y Métodos .............................................................................................................................. 67

Base de datos..................................................................................................................................................... 67

Modelación estadística ...................................................................................................................................... 70

Análisis de los ECR por campaña agrícola ................................................................................................... 70

Análisis simultáneo de los ECR de los genotipos contenidos en seis campañas agrícolas ............................ 71

Resultados y Discusión......................................................................................................................... 73

x
Análisis de los ECR por campaña agrícola ....................................................................................................... 73

Análisis simultáneo de los ECR de seis campañas agrícolas ............................................................................. 81

Conclusiones ........................................................................................................................................ 86

CAPÍTULO V ........................................................................................................................................... 88

CORRELACIÓN ESPACIAL ENTRE PARCELAS DE ENSAYOS COMPARATIVOS DE RENDIMIENTO

MULTIAMBIENTALES .................................................................................................................................. 88

Introducción ......................................................................................................................................... 88

Material y Métodos .............................................................................................................................. 92

Base de datos..................................................................................................................................................... 92

Procedimientos de análisis ................................................................................................................................ 93

Resultados y Discusión......................................................................................................................... 96

Conclusiones ...................................................................................................................................... 108

CAPÍTULO VI ....................................................................................................................................... 110

CONCLUSIONES GENERALES..................................................................................................................... 110

BIBLIOGRAFÍA CITADA ............................................................................................................................. 113

ANEXO 1 ................................................................................................................................................ 122

RANGOS DE LOS RENDIMIENTOS DE GENOTIPOS AVANZADOS PARTICIPANTES EN LOS ECR DEL PROGRAMA

DE MEJORAMIENTO DE MANÍ DE LA EEA-MANFREDI, INTA EN 23 AMBIENTES (CAMPAÑASSITIO) ...... 122

ANEXO 2 ................................................................................................................................................ 124

VALORES DE MÁXIMA VEROSIMILITUD (-2 RES LOG LIKELIHOOD) PARA 10 MODELOS DE RENDIMIENTOS DE

GENOTIPOS PARTICIPANTES EN LOS ECR DEL PROGRAMA DE MEJORAMIENTO DE MANÍ DE LA EEA-

MANFREDI ............................................................................................................................................... 124

xi
Lista de Tablas

Pag.

Tabla 2.2. Modelos mixtos para el análisis de ECR ...................................................... 41

Tabla 3.1. Número de genotipos participantes en el programa de Mejoramiento

de Maní de la EEA-Manfredi, INTA, en ensayos comparativos de

rendimiento de líneas experimentales de ciclo corto (ECR CC) y largo

(ECR CL) durante ocho campañas agrícolas (1984/85 a 1992/93)........................ 54

Tabla 3.2. Componentes de varianza para ECR de ciclo corto (ECR CC) y ciclo

largo (ECR CL) obtenidas a partir del rendimiento de ocho campañas

agrícolas del Programa de Mejoramiento de Maní de la EEA-Manfredi,

INTA (porcentajes respecto a la variabilidad total) ............................................... 60

Tabla 3.3. Genotipos correctamente clasificados al comparar predicciones de

desempeños genotípicos basados en uno y dos años de ECR (BLUP-e) con

el desempeño observado de dichos genotipos al año siguiente.............................. 62

Tabla 4.1. Sitios intervinientes en el período 1997/97 a 2001/02 en los ECR de

cultivares del Programa de Mejoramiento de Maní de la EEA-Manfredi,

INTA. ..................................................................................................................... 68

Tabla 4.2. Genotipos presentes en los ECR de cultivares del Programa de

Mejoramiento de Maní de la EEA-Manfredi, INTA en las campañas

agrícolas 1996/97 a la 2001/02. ............................................................................. 69

Tabla 4.3. Principales eventos que caracterizaron las campañas agrícolas

1996/97 a la 2001/02 en los sitios en que se condujeron los ECR del

Programa de Mejoramiento de Maní de la EEA-Manfredi, INTA. ....................... 69

xii
Tabla 4.4. Criterios de información para el modelo básico de ECR de efectos

fijos con y sin heterogeneidad de varianzas residual a través de los sitios. ........... 73

Tabla 4.5. Variabilidad de rendimientos entre genotipos (G), sitios (S) e

interacción GS para ECR de maní de la EEA-Manfredi, INTA, para las

campañas 1996/97 a 2001/02. ................................................................................ 74

Tabla 4.6. Rendimientos promedios y medidas de estabilidad para cada uno de

los genotipos participantes en los ECR del Programa de Mejoramiento de

Maní de la EEA-Manfredi, INTA para 6 campañas agrícolas. .............................. 80

Tabla 4.7. Componentes de varianza de rendimientos para genotipos (G),

ambientes (A) e interacción GA para ECR de maní de la EEA-Manfredi,

INTA. Análisis conjunto de las campañas agrícolas 1996/97 a 2001/02............... 81

Tabla 4.8. Criterios de bondad de ajuste para 3 modelos mixtos ajustados a los

datos de ECR de maní de la EEA-Manfredi, INTA. Análisis conjunto de

las campañas 1996/97 a 2001/02. .......................................................................... 82

Tabla 4.9. Rendimientos (kg/parcela)  error estándar de genotipos participantes

en los ECR del Programa de Mejoramiento de Maní de la EEA-Manfredi,

INTA en 23 ambientes (campañassitio) ............................................................... 85

Tabla 4.10. Desempeño genotípico a través de 23 ambientes (CS ). ........................... 86

Tabla 5.1. Sintaxis resumida de comandos de Proc Mixed SAS (Versión 8.2)

para ajustar ocho aplicables a ECR multiambientales. .......................................... 96

Tabla 5.2. Criterios de Akaike (AIC) obtenidos para 10 modelos que incorporan

correlación espacial entre parcelas ajustados para 18 ensayos comparativos

de rendimiento del PMM-INTA........................................................................... 101

xiii
Tabla 5.3. Criterios de Schwarz (BIC) obtenidos para 10 modelos que

incorporan correlación espacial entre parcelas ajustados para 18 ensayos

comparativos de rendimiento del PMM-INTA. ................................................... 102

Tabla 5.4. Estimaciones de componentes de varianza para 10 modelos que

incorporan correlación espacial entre parcelas ajustados para ensayos

comparativos de rendimiento de genotipos de ciclo corto del PMM-INTA. ....... 103

Tabla 5.5. Estimaciones de componentes de varianza para 10 modelos que

incorporan correlación espacial entre parcelas ajustados para ensayos

comparativos de rendimiento de genotipos de ciclo largo del PMM-INTA. ....... 104

Tabla 5.6. Valores del estadístico F en la comparación de medias por localidad

para nueve modelos que incorporan correlación espacial entre parcelas

ajustados para ensayos comparativos de rendimiento de genotipos de ciclo

corto del PMM-INTA. ......................................................................................... 105

Tabla 5.7. Valores del estadístico F en la comparación de medias por localidad

para nueve modelos que incorporan correlación espacial entre parcelas

ajustados para ensayos comparativos de rendimiento de genotipos de ciclo

corto del PMM-INTA. ......................................................................................... 106

Tabla 5.8. Significancias de covariables para ajustar correlación espacial según

el método de Papadakis para tres modelos de covarianza: con covarianza

EO, con covarianza NS y con ambas covarianzas. .............................................. 107

xiv
Lista de Figuras

Pag.

Fig. 2.1. Situaciones de relación entre genotipos y ambientes. A, interacción

genotipoambiente con cambio de rango y varianzas de ambientes

similares; B y C, interacción genotipoambiente sin cambio de rango y

varianzas de ambientes distintas; D, sin interacción genotipoambiente. ............. 23

Fig. 2.2. GGE biplot para la comparación del desempeño de genotipos en el

sitio 3. Puntos oscuros representan genotipos y puntos claros sitios. .................... 32

Fig. 2.3. GGE biplot para la comparación del desempeño del genotipo mf485 en

tres sitios. Puntos oscuros representan genotipos y puntos claros sitios. ............... 33

Fig. 2.4. GGE biplot para la comparación del desempeño de los genotipos

mf480 y mf489 en los sitios evaluados. Puntos oscuros representan

genotipos y puntos claros sitios.............................................................................. 34

Fig. 2.5. GGE biplot para la identificación de los mejores genotipos en cada

sitio. Puntos oscuros representan genotipos y puntos claros sitios. ....................... 35

Fig. 2.6. GGE biplot para la identificación de los mejores genotipos en función

de su producción promedio y su estabilidad de rendimientos a través de los

sitios. Puntos oscuros representan genotipos y puntos claros sitios. El

círculo identifica el lado positivo de la línea media de scores de ambiente. ......... 37

Fig. 2.7. GGE biplot para la identificación de los mejores ambientes. Puntos

oscuros representan genotipos y puntos claros sitios. El círculo identifica el

ambiente ideal. ....................................................................................................... 38

xv
Fig. 4.1. GGE biplots basados en 6 años de ECR del Programa de Mejoramiento

de maní de la EEA-Manfredi, INTA. Puntos oscuros representan genotipos

y puntos claros sitios. A, B, C, D, E y F, años 96/97, 97/98, 98/99, 99/00,

00/01, 00/02 respectivamente. ............................................................................... 76

Fig. 4.2. Comparación del desempeño de genotipos de ciclo corto y largo en

todas las localidades intervinientes en ECR durante la campaña 1997/98.

Puntos oscuros representan genotipos y puntos claros sitios. ................................ 79

Fig. 4.3. Biplot basado en 6 años de ECR del Programa de Mejoramiento de

Maní de la EEA-Manfredi, INTA. Puntos oscuros representan genotipos y

puntos claros ambientes codificados según año de cosecha-sitio. ......................... 83

Fig. 4.4. Estabilidad versus rendimientos en ECR del Programa de

Mejoramiento de Maní de la EEA-Manfredi, INTA. Medida de

estabilidad=producto de los scores de genotipo en la dimensión 1 y 2 del

modelo mixto AMMI (2). ...................................................................................... 84

xvi
Lista de Símbolos y Abreviaturas

A: Efecto principal de ambiente


AIC: Criterio de información de Akaike
AMMI: Efectos principales aditivos e interacción multiplicativa
B: Efecto de bloque
BA: Bloque aleatorio
BAH: Bloque aleatorio errores heterogéneos
BF: Bloque fijo
BFH: Bloque fijo errores heterogéneos
BFPow: Bloque fijo y estructura con función potencia isotrópica
BIC: Criterio bayesiano de Schwarz
BLUP: Mejor predictor lineal insesgado (Best linear unbiased predictor)
C: Efecto principal de campaña agrícola
CA: Completamente aleatorizado
CC: Ciclo corto
CL: Ciclo largo
CCR: Con cambio de rango (Cross-over interaction)
CP: Componente principal
DBCA: Diseño en bloques completos aleatorizados
DBI: Diseño en bloques incompletos
ECR: Ensayos comparativos de rendimiento
EEA: Estación Experimental Agropecuaria
EO: Este-oeste
EO-NS: Este-oeste y norte-sur
EP: error de predicción
FA: Análisis de factor (Factor Analytic)
G: Efecto principal de genotipo
GE: Efecto de la interacción genotipo×ambiente
GGE: G más GE
GL: Efecto de la interacción genotipo×localidad
INTA: Instituto Nacional de Tecnología Agropecuaria

xvii
Máx: Máximo
Mín: Mínimo
ML: Máxima verosimilitud
NS: Norte-sur
L: Efecto principal de localidad
PMM: Programa de mejoramiento de maní
PLS: Mínimos cuadrados parciales (partial least square)
Pow: función potencia isotrópica
Powa: función potencia anisotrópica
PowaH: función potencia anisotrópica errores heterogéneos
REML: Máxima verosimilitud restringida
S: Efecto principal de sitio
SCR: Sin cambio de rango (Noncross-over interaction)
SREG: Regresiones por sitio.
SVD: Descomposición en valor singular

xviii
CAPÍTULO I

REVISIÓN DE ANTECEDENTES

Este trabajo se enmarca en el área de estadística aplicada e involucra evaluación y


desarrollo de metodologías estadísticas para el análisis de información en programas de
mejoramiento genético vegetal. Específicamente, se considera la modelización de datos
experimentales de ensayos comparativos de rendimiento que incluye tanto factores fijos
como aleatorios, i.e. modelos mixtos (Searle et al., 1992; Khuri et al., 1998), con
diversos niveles de desbalance y donde el propósito es la comparación y clasificación de
genotipos y/o ambientes.

La evaluación de germoplasma es una actividad crucial en programas de


mejoramiento vegetal (Stroup, 2000). Generalmente, en etapas tempranas de estos
programas existen un gran número de genotipos experimentales con pocos antecedentes
de evaluación que pueden ser considerados como una colección aleatoria del material
genético de interés. En etapas posteriores de evaluación usualmente se trabaja con pocos
genotipos altamente selectos y se requieren inferencias expresas sobre los genotipos
intervinientes. Esta diferencia justifica que en etapas tempranas de mejoramiento los
efectos de genotipos sean considerados como aleatorios y el análisis de datos
experimentales se centre en el estudio de la variabilidad entre genotipos y en la elección
de genotipos que deberán continuar en evaluación, mientras que en etapas avanzadas los
efectos de genotipos sean considerados como fijos y el análisis se oriente a la
recomendación de cultivares.

Usualmente, al comparar líneas experimentales en ensayos comparativos de


rendimiento (ECR), la decisión de qué genotipos evaluar al año siguiente se toma a
partir de las medias de los genotipos en un año particular (modelo de efectos fijos). Si se
consideran los efectos de genotipo aleatorios es posible utilizar el mejor predictor lineal
insesgado (BLUP) de dicho efecto en lugar de las medias de genotipos. El BLUP
constituye el predictor natural de efectos aleatorios en el contexto del modelo mixto
lineal general, presentando propiedades óptimas en el sentido de minimizar el error
cuadrático medio de la predicción dentro del conjunto de los predictores insesgados
(Harville, 1990; Robinson, 1991). Los BLUP de efectos de genotipo que se usan como
predictores del desempeño futuro de cada genotipo pueden obtenerse a partir de uno o
más años de ensayos experimentales.

En etapas avanzadas de los programas de mejoramiento, comúnmente se


conducen ensayos comparativos de rendimiento (ECR) en distintos sitios durante una
serie de años para obtener información que sustente la recomendación de cultivares
superiores. Los ECR multiambientales se utilizan para comparar rendimientos
promedios y estabilidad de los rendimientos de los genotipos sobre varios ambientes y
promedios de rendimientos en ambientes específicos. Los ensayos multiambientales son
esenciales debido a la presencia de la interacción genotipoambiente, i.e. respuestas
genotípicas diferenciales en diferentes ambientes (Crossa et al., 1990; Cruz Medina,
1992; Kang y Magari, 1996). Conceptos importantes tales como regiones ecológicas,
ecotipos, mega-ambientes, adaptación especifica y estabilidad se pueden analizar a
partir de la interacción genotipoambiente (Yan y Hunt, 2001). La identificación de
mega-ambientes se realiza a partir de la exploración de los patrones de interacción
genotipo×ambiente que son repetibles a través de los años. Entre los aspectos claves
para el análisis de datos de ECR multiambientales no sólo se encuentran aquellos
relacionados con las suposiciones que se deben realizar respecto a los efectos
principales de genotipos, ambientes e interacciones, sino también los supuestos
asociados con las componentes de error derivadas de las parcelas y el arreglo
experimental que se utiliza a campo para conducir cada ensayo ya que es común
observar correlación entre los rendimientos promedio de parcelas vecinas de un mismo
ensayo y/o diferencias en la precisión con la que se conducen ensayos en los distintos
ambientes.

La metodología estadística más difundida para modelar rendimientos en ECR


multiambientales, se basa en variaciones de los modelos de regresión, análisis de
varianza y técnicas de análisis multivariado, donde los efectos involucrados (efectos
principales e interacción) en el modelo se consideran como constantes desconocidas
(efectos fijos) que deben ser estimadas. Generalmente en los modelos de análisis se

2
incorporan efectos de bloques ya que la estructura de parcelas dentro de cada ensayo
común sigue un diseño de bloques completos al azar. Los modelos clásicos asumen
varianza residual homogénea entre los ensayos e independencia entre los errores
asociados a cada observación individual. Existen numerosas propuestas para el análisis
de ECR en mejoramiento vegetal tanto para la estimación de efectos genotípicos e
interacciones (Hanson, 1970; Calinski et al., 1987, Lin y Bins, 1988, Zobel, et al., 1988;
Gauch, 1988; Crossa, 1988, 1990; Crossa et al.,1990; Seyedsadr y Cornelius, 1992;
Kang y Gauch, 1996; Crossa y Cornelius, 1997; Vargas et al., 1999; Yan et al., 2000)
como para la modelación de la variación espacial de los términos de error de parcelas
(Gleeson y Cullis, 1987; Stroup et al., 1994; Gilmour et al., 1997; Casler, 1999; Smith
et al., 2001). Particularmente, para el estudio de la interacción y los análisis que de ella
se derivan, los modelos de interacción multiplicativa (AMMI, Gauch, 1988) han sido
ampliamente difundidos entre los mejoradores. Actualmente, los gráficos GGE biplot
(Yan y Hunt, 2001) representan una metodología novedosa para la identificación de
mega-ambientes, la selección de cultivares dentro de cada ambiente y la selección de
ambientes adecuados para los ensayos. Estos gráficos pueden obtenerse a partir de
modelos que incorporan variables externas, i.e. covariables, tanto de los genotipos como
de los ambientes (Vargas et al., 1998, 1999, 2001). Una técnica utilizada con este fin se
basa en el modelo de regresión factorial (Denis, 1988; Van Eeuwijk et al., 1996).

La mayoría de las propuestas de análisis de ensayos multiambientales suponen


tablas de datos completas. Sin embargo, las listas de genotipos presentes en los ensayos
varían de año a año debido a que nuevos genotipos se introducen cada año y a que otros
se descartan por su pobre desempeño (Hill y Rosemberg, 1985). Por ello, las tablas de
datos genotipoambiente completas son poco frecuentes (no todos los genotipos se
encuentran en todos los ambientes). Esta falta de ortogonalidad se refleja en una
estructura de varianza y covarianzas entre las observaciones más compleja que la
tradicionalmente utilizada en la modelación de datos multiambientales en el marco de
los modelos de efectos fijos. La incorporación de efectos aleatorios permite una
modelación de estructura de correlación y heterogeneidad de varianzas menos restrictiva
que aquella asumida en las aproximaciones clásicas (Patterson et al., 1977; Verbek y
Molenberghs, 1997). Bernardo (1994, 1996a, 1996b, 1999) utiliza modelos con efectos
aleatorios para la identificación de los mejores genotipos vegetales dentro de un

3
conjunto grande de genotipos. Otros autores (Stroup, 1989; White et al., 1986; Bridges,
1989; Chang y Milligan, 1992; Piepho, 1994; Balzarini, 2000) también se basan en la
predicción de efectos aleatorios para la elección de material vegetal. Cullis et al. (1998)
utilizan efectos aleatorios para modelar la estructura de covarianza obteniendo
estimaciones más confiables para la comparación de medias de genotipo que las
logradas con la estrategia tradicional de incorporación del efecto de bloques para
modelar la estructura de parcelas.

A pesar de que los modelos lineales mixtos han sido usados exitosamente en
mejoramiento animal, para la evaluación de mérito genético, el estudio de la naturaleza
de la acción genética y la estimación de componentes de varianzas (Henderson, 1973,
1974, 1975, 1984; Gianola y Hammond, 1990) sus aplicaciones en el campo del
mejoramiento vegetal son menos frecuentes. Tal vez la falta de explotación de los
modelos mixtos en esta área se relacione con problemas computacionales relacionados a
los grandes volúmenes de datos existentes en programas de mejoramiento vegetal y a
las dimensiones de los espacios paramétricos de interés. En la actualidad, existe
software estadístico que permite ajustar modelos mixtos a grandes bases de datos. El
procedimiento Mixed en SAS (SAS, 1997) ha provisto la posibilidad de usar
rutinariamente una gran clase de modelos estadísticos relacionados con la teoría de los
modelos lineales mixtos. Otros desarrollos como ASREML (Gilmour et al., 1999)
permiten estimar componentes de varianza, estimar efectos genéticos, espaciales y
multiambientales desde el marco teórico del modelos lineal mixto general (Searle et al.
1992; Khuri et al., 1998).

Si bien bajo un modelo mixto es posible modelar las estructuras complejas que
caracterizan las bases de datos en mejoramiento vegetal, el uso de estos modelos no
puede realizarse sin considerar de diversos aspectos teóricos y prácticos. Por ejemplo, es
necesario contemplar que la introducción de efectos aleatorios en el modelo modifica la
varianza de las observaciones y por tanto los procedimientos tradicionales para analizar
los factores de efectos fijos deben adecuarse a este cambio (Litell et al., 1996). Además,
los espacios de inferencia deben considerarse en relación a todas las componentes
aleatorias del modelo (Stroup, 1989, 2000; McLean, et al., 1991). Cuando se trabaja
bajo un modelo mixto con ensayos multiambientales u otros ensayos multifactoriales, de

4
las dimensiones que usualmente caracterizan a la experimentación en mejoramiento
vegetal, es necesario tener en cuenta aspectos computacionales relacionados a la
estimación de parámetros. No todas las técnicas de estimación de componentes de
varianza y efectos fijos (Rao, 1973; Searle, 1987, Searle et al., 1992) son igualmente
apropiadas para la estimación de parámetros de los modelos utilizados en programas de
mejoramiento vegetal. También es necesario tener en cuenta que la predicción de
efectos aleatorios o combinaciones de éstos con efectos fijos puede realizarse con
diferentes predictores (Henderson, 1984; Robinson, 1991; Mrode, 1996) y bajos
distintas parametrizaciones del modelo de análisis (Piepho, 1998; Balzarini, 2000).

En el presente trabajo se abordan aspectos metodológicos estadísticos


involucrados en el análisis de datos de ensayos comparativos de rendimiento con
estructuras que caracterizan las distintas etapas de programas de mejoramiento vegetal,
principalmente aquellas orientadas a la elección del material genético experimental que
debe continuar en proceso de evaluación y a la recomendación de genotipos avanzados
desde ensayos multiambientales conducidos en etapas avanzadas del mejoramiento. Las
aproximaciones metodológicas investigadas se definen en el marco teórico del modelo
mixto lineal general. Utilizando la base de datos del Programa de Mejoramiento de
Maní, de la EEA-Manfredi, INTA (PMM-INTA), Argentina, se ilustran diversos
aspectos de la modelación estadística y se comparan los resultados obtenidos con
aquellos producidos a partir de la metodología estadística tradicionalmente utilizada, i.e.
modelos de efectos fijos. La propuesta tiene como finalidad aportar conocimientos que
contribuyan a alcanzar una investigación agrícola eficiente, en términos de cantidad y
calidad de la información obtenida en cada proyecto que produce datos.

Objetivos

Objetivo General

Comparar, bajo la teoría del modelo mixto lineal general, estrategias de


modelación que brinden respuesta a los objetivos definidos en ensayos comparativos de
rendimientos de genotipos experimentales y de genotipos en etapas avanzadas de

5
programas de mejoramiento vegetal

Objetivos Específicos

 Evaluar el uso del BLUP de los efectos genotípicos, basados en


información de uno y de dos años de ensayos comparativos de rendimiento, para
la elección de genotipos experimentales a evaluar en ensayos futuros.

 Comparar la utilidad de diferentes modelos para evaluar y clasificar


genotipos y/o ambientes y explorar patrones de interacción genotipo-ambiente,
que puedan ser aplicables a bases de datos incompletas de ensayos multi-
ambientales.

 Comparar la eficiencia de modelos de la estructura de parcelas basados en


funciones de correlación espacial de los términos de error respecto a los modelos
tradicionalmente usados en ECR multiambientales conducidos según un DBCA
en cada ambiente.

6
CAPÍTULO II

MARCO TEÓRICO DE LA MODELACIÓN ESTADÍSTICA EN


ENSAYOS COMPARATIVOS DE RENDIMIENTOS

El modelo lineal mixto

El modelo lineal clásico ha sido ampliamente utilizado en la experimentación


agrícola para analizar la variabilidad de observaciones (respuestas) realizadas sobre
características de importancia agronómica, en función de una o más variables
predictoras o factores. En notación matricial, el modelo lineal general tiene la forma:

y  Xβ  e (2.1)

donde y es un vector de observaciones, X es una matriz de valores de variables


independientes en el caso del modelo de regresión o la matriz de diseño en el caso del
modelo de análisis de la varianza, β es el vector de parámetros (o efectos fijos) y e es
el vector de errores, definido como e  y  E(y)  y  Xβ . Utilizando el procedimiento
de mínimos cuadrados ordinarios, se puede estimar el vector de parámetros β
resolviendo las ecuaciones normales X´Xβ  X´y . La solución está dada por

βˆ  (X´X) X´y , donde ( X´X) es una inversa generalizada de X´X (Searle, 1971). Para
hallar una estimación del vector de parámetros, no hace falta hacer suposiciones
distribucionales sobre el vector ε . Si se asumen los supuestos del modelo de muestreo
ideal, i.e. términos de error independientes y normalmente distribuidos con media 0 y
varianza  2 , entonces, la matriz de covarianzas de β̂ , utilizada para realizar inferencia

estadística sobre β , es  2 (X´X) .

El modelo lineal general presentado anteriormente es un caso particular del


modelo lineal general mixto (Searle et al., 1992; Khuri et al., 1998), i.e. el modelo con
factores tanto de efectos fijos como aleatorios. La ecuación matricial para el modelo
lineal mixto es:

7
y  Xβ  Zu  e (2.2)

donde y, X, β y e representan las mismas entidades del modelo presentado en la


Ecuación (2.1) y los nuevos componentes son: Z , matriz de incidencia de los efectos
aleatorios y u , vector de efectos aleatorios que usualmente se asume distribuido N (0,
G). Sobre el vector e se supone distribución N (0, R), e es definido como
e  y  E(y | u)  y  (Xβ  Zu) . La matriz R es modelada como R   2I cuando se
considera que los términos de error (generalmente asociados a la parcela en
experimentación agrícola) son independientes y tienen la misma varianza  2 . Los
términos aleatorios en u se suponen independientes de los términos aleatorios en e.
Resumiendo matricialmente los supuestos usuales sobre la esperanza y la varianza de
las componentes aleatorias, se tiene que:

u   0  u   G 0 
E      y Var     
 e  0  e   0 R

Cuando se asume distribución normal para el vector de observaciones, la función


de densidad queda completamente determinada por el vector de valores esperados y la
matriz de varianzas y covarianzas. La matriz de varianzas y covarianzas de y esta dada
por:

V (y )  V  V ( Xβ  Zu  e)
 ZV (u)Z´V (e) (2.3)
 ZGZ´ R

Los supuestos clásicos de independencia y homogeneidad de varianzas para los


términos aleatorios del modelo lineal general (muestreo ideal) se flexibilizan en el
marco del modelo mixto general. Tanto la estructura de correlaciones como la presencia
de varianzas heterogéneas puede ser especificada a través de la modelación de las
matrices de covarianza G y R. Esta característica hace a los modelos mixtos muy
interesantes para el análisis de datos de experimentos conducidos en los programas de
mejoramiento genético vegetal. A través de G y R es posible modelar correlaciones
entre el material genético, entre parcelas experimentales ocasionadas por la distribución

8
espacial y/o temporal de las mismas en el campo y/o considerar diferentes precisiones
de ensayos cuando se combinan experimentos.

Los procedimientos de estimación en el marco de los modelos mixtos son más


complejos que en el modelo lineal general, ya que además de la estimación de β se
deben estimar los parámetros desconocidos en G y R y predecir los efectos aleatorios en
u, pero se encuentran implementados en numerosas herramientas de software. Para los
efectos fijos del modelo mixto, las estimaciones por mínimos cuadrados generalizados
resultan convenientes. Estas estimaciones se obtienen minimizando
(y - Xβ)'V 1 (y - Xβ) (Littell et al., 1996), generalmente reemplazando V por V̂ . El
estimador del vector de efectos fijos β es:

βˆ  (X´V 1X) X´V 1y (2.4)

La varianza de β̂ tiene la forma:

V (βˆ )  ( X´V 1X)  X´V 1V (y )[( X´V 1X)  X´V 1 ]´


 ( X´V 1X)  X´V 1VV 1´X´´( X´V 1X)  ´
 ( X´V 1X)  X´V 1X( X´V 1X) 
 ( X´V 1X)  (2.5)

Si K´β es una función estimable, el mejor estimador lineal insesgado (BLUE) de

K´β es K´βˆ y la varianza de K´βˆ tiene la forma:

Var (K´βˆ )  K´Var (βˆ )K´´ K´(X´V 1X) K (2.6)

Es decir, las combinaciones lineales de coeficientes relacionados a los factores de


efectos fijos del modelo serán evaluados con errores estándares que no son sólo función
de  2 , como en el modelo lineal general, sino de todos los parámetros de covarianza
involucrados en V.

9
Analizando el modelo completo se derivan las ecuaciones normales del modelo
mixto general (Henderson, 1973) que, asumiendo G de rango columna completo, son
utilizadas para obtener un estimador de β y un predictor de u en forma simultanea:

 X´R 1X X´R 1Z 


  βˆ   X´R 1y 
    1 
 X´R 1Z Z´R 1Z  G 1  uˆ   Z´R y 
 (2.7)

La matriz V  ZGZ´R es conocida sólo si se conocen G y R, en cuyo caso las


soluciones obtenidas desde las ecuaciones del modelo mixto representan el mejor
estimador lineal insesgado (BLUE) de los parámetros fijos y el mejor predictor lineal
insesgado (BLUP) de los efectos aleatorios (Searle et al., 1992). En la práctica del
análisis de datos experimentales V usualmente es desconocida y como se dijera
anteriormente se reemplaza por su estimador, V ˆ ´R
ˆ  ZGZ ˆ . Así, el estimador

empírico de β y el predictor de u se expresan como:

βˆ Vˆ  (X´V
ˆ 1X) X´V
ˆ 1y
(2.8)

ˆ ˆ -1 (y - Xβ)
ˆ Vˆ = GZ'V
u ˆ
(2.9)

ˆ 1 contribuye poco en la ecuación y


Cuando los autovalores de Ĝ son grandes, G
û se aproxima al estimador de un vector de efectos fijos. Si por el contrario los
ˆ 1 tiene una alta contribución en la ecuación y
autovalores de Ĝ son muy pequeños, G
û es cercano a 0. Si Ĝ es no invertible las ecuaciones deberán ser modificadas
igualando a 0 los elementos de û correspondientes a la porción no invertible de Ĝ .
ˆ 1 puede ser vista como un corrimiento de la estimación
Para los casos intermedios, G
de u hacia 0. Si se puede asumir que u y e son normalmente distribuidos, la mejor
aproximación para la estimación se logra con métodos basados en máxima verosimilitud
(Jennrich y Schluchter, 1986; Searle et al. 1992). Los métodos de estimación más
usados son máxima verosimilitud (ML) y máxima verosimilitud restringida (REML).
Los logaritmos de la función de verosimilitud y de la función de máxima verosimilitud
deben maximizarse en V. Una forma de expresar estas funciones es:

10
1 n n 2 
LML (V) =  log | V |  log r´V 1r  1  log
2 2 2 n  (2.10)

1 n n p n p  2 
LREML (V) =  log | V |  log | X´V 1X |  log r´V 1r  1  log
2 2 2 2  n  p  (2.11)

donde r = y - X(X´V 1X)- X´V 1y , p es el rango de X y n es el orden del vector y.

Las estimaciones presuponen la especificación de un modelo mixto en términos de


X, Z, G y R. La construcción de X y Z depende del modelo postulado para los datos y
se pueden representar de varias formas alternativas para modelar un conjunto particular
de datos (distintas parametrizaciones). De la misma forma, varias estructuras para la
matrices de covarianzas G y R pueden ser consideradas. Las alternativas de modelación
dependerán de los objetivos de la investigación y de los supuestos que se puedan
sostener.

Al ajustar distintos modelos a un mismo conjunto de datos, es necesario utilizar


criterios para la comparación de los ajustes. Los más usados son el criterio de
información de Akaike (AIC) y el criterio bayesiano de Schwarz (BIC), como así
también la cantidad –2 log (verosimilitud). Al comparar dos modelos con los criterios
AIC y BIC, aquél con valor mayor para estos estadísticos será el mejor modelo, si los
criterios son definidos como en SAS-MIXED (Wolfinger, 1993; Littell et al., 1996),
mientras que si los dos modelos se comparan con –2 log (verosimilitud), el modelo con
menor valor será el mejor. En las versiones más modernas de SAS-MIXED (SAS
Institute, 2001), los criterios AIC y BIC se definen como:

AIC  2L  2d (2.12)

BIC  2L  d ln n (2.13)

donde L es el máximo valor de la función de verosimilitud restringida, d=q+p es la


dimensión del modelo, q es el número de parámetros de covarianza estimados y p es el
rango de la matriz de diseño X. Bajo estas expresiones de AIC y BIC, el mejor modelo
resulta ser aquel con menor valor para ambos criterios de ajuste.

11
Otra alternativa que puede usarse para comparar dos modelos cuando uno de ellos
es un caso particular del otro, es el cociente de verosimilitud 2 que consiste en
comparar dos modelos de covarianza, siendo uno de ellos un caso particular del otro.
Para la construcción de la prueba a la cantidad –2 log(verosimilitud) del modelo con
más cantidad de parámetros se le resta la cantidad –2 log(verosimilitud) del modelo
reducido. La diferencia obtenida se compara con una distribución 2 con grados de
libertad igual a la diferencia entre el número de parámetros estimados por uno y otro
modelo. Si la prueba resulta significativa, el modelo correcto es el más completo, en
caso contrario, el modelo reducido es el adecuado. Esta prueba se puede realizar tanto
con lo estimadores de máxima verosimilitud como con los estimadores de máxima
verosimilitud restringida (Quinn y Keough, 2002).

Para realizar inferencias sobre combinaciones lineales de los parámetros de los

efectos fijos y aleatorios del modelo se considera la función L   . Estas funciones son
β
 
u

llamadas funciones predecibles si satisfacen los requerimientos de estimabilidad


anteriormente citados. Cuando el interés se centra en la estimación de los efectos fijos,
la porción asociada al vector u de la función estimable se asume que es igual a 0. Para

inferencias estadísticas basadas en la hipótesis L   = 0 , con L involucrando una sola


β
 
u

fila, se puede construir una prueba t:

ˆ
L β 
t uˆ 
ˆ
LCL´ (2.14).

donde Ĉ es una estimación de la matriz de covarianzas de β̂ y û , que tiene la siguiente


expresión general:


ˆ 1 ˆ 1Z 
ˆ   X´R X X´R
C  ˆ 1 ˆ 1Z + Gˆ 1 
 Z´R X Z´R  (2.15)

12
Bajo los supuestos distribucionales del modelo ideal sobre u y e, el estadístico t tiene
una distribución T exacta con  grados de libertad. Si el rango de L es mayor a 1,
entonces se construye un estadístico F:

´
βˆ  ˆ 1 βˆ 
uˆ  L´(LCL´) L uˆ 
F   
rango(L) (2.16)

En el modelo lineal mixto, el valor esperado de una observación es:

E(y)  E(Xβ  Zu)  Xβ (2.17)

dado que la esperanza del vector aleatorio u es 0. Por este motivo es llamada esperanza
incondicional de la media de y sobre todos los posibles valores de u. Es decir, los
niveles observados de un efecto aleatorio son una muestra aleatoria de la población de
niveles y la esperanza incondicional es la media de y sobre toda esa población. La
esperanza condicional de y dado u es:

E(y | u)  Xβ  Zu (2.18)

y representa la media de y para el subconjunto específico de niveles del efecto aleatorio


observados en el experimento.

Aplicación de modelos mixtos en la evaluación de genotipos


experimentales

En etapas tempranas de los programas de mejoramiento, los efectos de genotipos


pueden ser considerados como aleatorios y el análisis de datos experimentales se centra
en el estudio de la variabilidad entre genotipos y en la elección de genotipos que
deberán continuar en evaluación. Usualmente, al comparar líneas experimentales, la
decisión de qué genotipos evaluar al año siguiente se toma a partir de las medias de los
genotipos en un año particular (modelo de efectos fijos). Si se consideran los efectos de
genotipo aleatorios es recomendable utilizar el mejor predictor lineal insesgado (BLUP)
de dicho efecto en lugar de las medias de genotipos. El BLUP constituye el predictor

13
natural de efectos aleatorios en el contexto del modelo mixto lineal general, presentando
propiedades óptimas en el sentido de minimizar el error cuadrático medio de la
predicción dentro del conjunto de los predictores insesgados (Harville, 1990; Robinson,
1991). Los BLUP de efectos de genotipo que se usan como predictores del desempeño
futuro de cada genotipo pueden obtenerse a partir de uno o más años de ensayos.

Cuando los efectos de genotipo son considerados como constantes fijas, las
medias de genotipo son los estimadores naturales para la elección de los genotipos que
deberán seguir siendo evaluados. Sin embargo cuando se comparan 2 genotipos a través
de sus medias, no se incorpora información sobre la estructura de varianzas y
covarianzas del conjunto de genotipos evaluados, sólo se utiliza la información de los 2
genotipos que se comparan. El uso del BLUP de genotipos permite ponderar las
predicciones sobre genotipos en relación a la estructura de covarianzas genéticas y/o
experimentales subyacentes. Si se tiene información de pedigree o molecular que
permita establecer relaciones genéticas (covarianzas) entre las líneas comparadas, éstas
pueden ser incorporadas en el modelo mediante la matriz G (Bernardo, 1999; Balzarini,
2000). Los ECR de líneas experimentales muchas veces son conducidos durante varios
años. En cada año nuevas líneas son incorporadas y otras dejan de evaluarse. Si en un
año en particular se quieren comparar un conjunto de genotipos utilizando toda la
información disponible sobre ellos, las bases de datos del análisis serán altamente
desbalanceadas. El uso del BLUP como predictor del desempeño futuro permite
contemplar estas diferencias en tamaño de muestra asociadas a cada genotipo.

Un modelo simple en mejoramiento vegetal, para un ECR conducido según un


DBCA con i=1,...,g líneas experimentales es:

yij =  + Gi + Bj + ij (2.19)

donde yij es la respuesta (rendimiento) del genotipo i, en el bloque j,  es la media


general, Gi es el efecto aleatorio del genotipo i, con i=1,…,g, suponiendo que se tiene
una muestra aleatoria de genotipos, Bj es el efecto del bloque j, con j=1,…,n, que puede
ser fijo o aleatorio, y ij es el término de error aleatorio. Si los bloques son considerados

como aleatorios, se supone que los efectos Gi, Bj y ij son normales, idéntica e

14
independientemente distribuidos con media 0 y varianzas  g2 ,  b2 y 2,

respectivamente. Además, todos los efectos aleatorios se asumen independientes unos


de otros.

Los objetivos clásicos en análisis de datos de ECR en etapas tempranas de


programas de mejoramiento son: 1) estimar las componentes de varianza asociadas con
los efectos de genotipo, 2) estimar si la respuesta que se está analizando puede ser
heredada, i.e. determinar la heredabilidad del carácter, y 3) identificar los genotipos
superiores con el propósito de elegir un subconjunto del conjunto de genotipos
evaluados para continuar en los ECR. Si bien pareciera ideal no descartar ningún
material, la elección de un subconjunto para continuar en evaluación es logísticamente
necesaria debido a que cada año se incorporan nuevos genotipos y no pueden seguir
todos en evaluación. Para realizar una estimación del merito genético,  + Gi, debe
predecirse el valor de una combinación de efectos fijos y aleatorios del modelo. La
obtención del BLUP (+Gi) necesita de la estimación de las componentes de varianza
genética (  g2 ) y residual (  2 ). A partir de estas componentes de varianza también

pueden calcularse heredabilidades para las características en estudio. La heredabilidad


en sentido amplio (base individual) es:

 g2
H  2
2
(2.20)
 g  2

mientras que la heredabilidad en sentido amplio pero expresada en base a promedios de


parcelas es:

 g2
H 2

 g2  
2

b (2.21)

donde b es el número de bloques o repeticiones de cada genotipo en el ensayo.

Si se analizan los datos de varios ECR, el modelo básico para predecir el mérito
genético a partir de la combinación de j=1,...,t ensayos conducidos cada uno según un
DBCA es:

15
yijk =  + Gi + Ej + B(E)k(j) + GE(ij)+ ijk (2.22)

donde yijk es la respuesta (rendimiento) del genotipo i, en el ensayo j;  es la media


general; Gi es el efecto aleatorio del genotipo i con i=1,...,g; Ej es el efecto fijo del
ensayo j con j=1,…,t; B(E)k(j) es el efecto de bloque k dentro del ensayo j; GE(ij) es el
efecto aleatorio de la interacción del genotipo i con el ensayo j; y ijk es el término de
error aleatorio asociado a la observación yijk.

En etapas tempranas de los programas de mejoramiento el análisis de varios ECR


simultáneamente se justifica en el propósito de ampliar el espacio de inferencia. El
análisis no se centra en la diferencia entre ensayos por lo que la comparación de medias
del factor fijo E no es de interés. Los efectos de ensayo sólo han sido incorporados para
descontar posibles diferencias promedios entre ensayos y para considerar que el
desempeño de un genotipo podría cambiar a través de los ensayos. El interés principal
es poder evaluar el desempeño de los genotipos experimentales sobre una base más
amplia de repeticiones.

El BLUP, para la función   Gi  GE(ij ) , usado para predecir el desempeño de un


genotipo en un determinado ensayo (inferencia ambiente-específica) puede expresarse
de acuerdo con el modelo supuesto como:

BLUP(   Gi  GE(ij ) ) = Y...  F G (Yi..  Y... )  F GE (Y...  Yi..  Y. j.  Yij. ) (2.23)

donde F G y F GE son factores de corrimiento, que bajo los supuestos de este modelo
pueden expresarse como funciones de las componentes de varianzas asociadas a los
términos aleatorios del mismo:

 GE
2
 G2 
FG  s
 e2
 
2
G
2
GE 
ns (2.24)

 GE
2
F GL 
 e2
 GE 
2

n (2.25)

16
Cuando el interés se centra en la predicción del efecto de genotipo Gi, i=1,…,g
(inferencia amplia), el objetivo es la obtención del BLUP de G y el único factor de
corrimiento involucrado. Mood (1950) da la ecuación para este estimador del mérito del
individuo:

ˆ i  ˆ
ˆ is  ˆ  (2.26)
ˆ G2
(ˆ G2  ˆ 2 ) / b

donde ˆ is es el BLUP (   Gi ); ̂ es la media general, ˆ i es la media del genotipo i-

ésimo, ˆ G2 es la componente de varianza de genotipo, ˆ 2 es la varianza residual y b es


el número de observaciones por genotipo. Otra forma de expresar el estimador es:

ˆis  Bi ˆ  (1  Bi )ˆi (2.27)

ˆ i2 ˆ G2  ˆ 2
donde Bi  y ˆ 2

ˆ i2  ˆ G2 i
b

En las expresiones anteriores puede verse que el estimador aproxima la media del
genotipo hacia la media general. El grado de corrimiento depende de la magnitud de la
varianza. Una varianza de genotipos grande produce un corrimiento pequeño mientras
que una varianza de genotipos pequeña produce un mayor acercamiento hacia la media
general. La ventaja de este estimador es que cuando las medias de genotipo están muy
por arriba o por debajo de la media general, éstas son regresadas hacia el valor de 
teniendo en cuenta las magnitudes de ˆ G2 relativas a ˆ 2 . De esta forma las medias
extremas son atenuadas por el conocimiento de la variabilidad subyacente reduciendo el
riesgo de mala interpretación de los datos.

Luego, para un modelo con suposiciones simples sobre la distribución de los


efectos aleatorios, se puede interpretar al BLUP del efecto genotipo como una regresión
de las medias de genotipo hacia la media general , con una pendiente dada por la
función F G que toma en cuenta la cantidad de información existente para cada
genotipo. Un valor grande de F G implica un corrimiento pequeño de las medias
genotípicas hacia . En otras palabras, cuando existe una mayor credibilidad en las

17
medias genotípicas, los BLUP de efectos de genotipos se aproximan a las medias de los
genotipos. Un valor pequeño de F G , conduce a una regresión mayor de la medias de
genotipo hacia la media general. En este último caso, la elección de los genotipos
mediante BLUP puede resultar diferente a la que se encontraría usando las medias de
los mismos bajo un modelo de efectos fijos. Este comportamiento puede disminuir el
riesgo de determinar como diferentes a genotipos sin diferencias reales en mérito
genético.

Mientras que la media de los efectos fijos es un promedio realizado sobre todos
los niveles del efecto en la población, el BLUP es una regresión hacia la media general
basada en los componentes de varianza de los efectos del modelo. Esta última es
comúnmente llamada estimación corregida (shrinkage estimation).

Se pueden construir intervalos para los BLUP, de manera análoga a la


construcción de los intervalos de confianza, i.e. BLUP  t, 1- EP, siendo EP el error de
predicción. Al no ser el BLUP una estimación sino una predicción se usa el término
intervalo de predicción.

Modelos estadísticos para la evaluación de cultivares en ensayos


multiambientales

Los ensayos comparativos de rendimiento son también utilizados para realizar


recomendaciones de cultivares en las últimas etapas del mejoramiento. Usualmente se
utilizan ECR en varias localidades (regionales) y generalmente se repiten por varios
años debido a la presencia de la interacción genotipoambiente (GA). Al realizar los
ensayos en distintos ambientes se aumenta el espacio de inferencia y la potencia para
explorar la interacción de los genotipos con los ambientes. Los objetivos generales de
los ECR son: 1) comparar el desempeño de los genotipos a través de las localidades,
años o sus combinaciones y 2) estimar interacciones de los genotipos con las
localidades, años o sus combinaciones.

A partir de la comparación de las contribuciones de distintas fuentes de variación,


los mejoradores vegetales pueden tomar decisiones y emitir juicios sobre aspectos

18
importantes de los programas de mejoramiento vegetal, como ser: 1) la necesidad de
explorar la posible existencia de mega-ambientes (cuando GA es relativamente grande
respecto de A) (Yan et al., 2000; Yan y Hunt, 2002), 2) la necesidad de utilizar modelos
que descuenten efectos principales de ambientes, i.e. modelos SREG (Crossa y
Cornellius, 1997, 2002) cuando la contribución de localidades es la más importante en
relación a los restantes componentes del modelo y 3) la conveniencia de repetir los
ensayos en un determinado número de ambientes, respecto a la de incrementar el
número de ambientes a utilizar (Milligan, 1994). Normalmente se comparan niveles
promedios de rendimiento sobre varios ambientes (inferencia en sentido amplio),
promedios de rendimientos en ambientes específicos (inferencia en sentido estricto),
estabilidad de rendimientos a través de los ambientes, y se exploran los patrones de
interacción GA. También es posible realizar análisis conducentes a obtener una
explicación de la interacción GA mediante la incorporación de variables ambientales
y/o de genotipos al modelo (Vargas et al., 2001).

En el análisis de ECR multiambientales, los efectos de ambiente pueden


modelarse como fijos o aleatorios, dependiendo de la forma de selección de los
ambientes intervinientes. Si los ambientes son años, o combinaciones de localidades y
años, generalmente son considerados como aleatorios. Los efectos de genotipo son
considerados fijos cuando se trata de ECR en etapas avanzadas de los programas de
mejoramiento. Generalmente, los ECR multiambientales son conducidos bajo un diseño
en bloques completamente aleatorizados en cada ambiente, ya sean completos o
incompletos. Los efectos de bloque pueden también modelarse como fijos o aleatorios
dependiendo de la naturaleza de su asignación, pero siempre el efecto de bloque está
anidado en el factor ambiente, ya que en realidad los ECR multiambientales representan
una colección de ensayos a través de los ambientes.

En general las tablas de datos de ECR conducidos en un mismo año o campaña


agrícola son completas. El modelo básico para datos de ECR provenientes de una
misma campaña agrícola es un modelo de ANAVA a dos vías de clasificación:

yijk =  + Gi + Lj + B(L) k(j) + GL(ij)+ijk (2.28)

19
donde yijk es la respuesta del genotipo i, en la localidad j, bloque k;  es la media
general; Gi es el efecto del genotipo i con i=1,...,g; Lj es el efecto de la localidad j con
j=1,…,s; B(L)k(j) es el efecto del bloque k dentro de la localidad j con k=1,...,n; GL(ij) es
el efecto de la interacción del genotipo i con la localidad j y ijk es el término de error
aleatorio asociado a la observación yijk. Cuando se analizan caracteres continuos como
el rendimiento, los términos de error se suponen distribuidos normalmente con media
cero; la varianza de los errores puede ser constante o no. En numerosas ocasiones
resulta apropiado considerar que la variación residual es heterocedástica a través de las
localidades, ya que ECR conducidos en diferentes localidades suelen tener, por
múltiples razones, diferente precisión.

En el modelo de efectos fijos (excepto por los bloques), el término de interacción


GA, interacción del i-ésimo genotipo en el j-ésimo ambiente, es estimado desde la
tablas de medias de genotipo en cada ambiente como el residuo del modelo aditivo,
yij  yi.  y. j  y.. . El término de error del modelo de medias a través de los bloques,

asociado al i-ésimo genotipo en el j-ésimo ambiente es el promedio de los errores


asociados a cada genotipo en cada ambiente,  ij , que usualmente se asume

independiente, normalmente distribuido y con varianza constante. Bajo estas


suposiciones el error estándar para la comparación de medias de genotipos es igual para
todas las comparaciones de a pares entre los genotipos. Cuando las observaciones son
independientes y normalmente distribuidas, el procedimiento de máxima verosimilitud
usado para la estimación de los parámetros de interés, da las mismas soluciones que el
procedimiento de mínimos cuadrados (Searle, 1971). El modelo fijo completo para los
factores genotipo y ambiente (modelo de parcelas divididas) se usa para obtener las
contribuciones aditivas de genotipo, ambiente e interacción GA sobre las respuestas.
Si la interacción GA resulta significativa, los ranking de genotipos usando las medias a
través de los ambientes no son recomendados. El modelo involucra (g-1)(e-1)
parámetros de interacción GA independientes, con e=número de ambientes, los cuales
no proveen mucha información sobre los patrones de la interacción GA. Cuando los
ECR, conducidos en varias localidades se llevan a cabo por más de una campaña
agrícola, el efecto de la campaña puede ser incorporado al modelo:

20
yijkl =  + Lj + Cl + B(LC)k(jl) + Gi + GL(ij)+ GC(il) + GLC(ijl)+ijkl (2.29)

donde yijkl es la respuesta (rendimiento) del genotipo i, en la localidad j, bloque k en la


campaña l;  es la media general; Lj es el efecto de la localidad j con j=1,…,s; B(LC)k(jl)
es el efecto del bloque k dentro de la localidad j y campaña l con k=1,...,n; Cl es el
efecto de la campaña l con l=1,…,a; Gi es el efecto del genotipo i con i=1,...,g; GL(ij) es
el efecto de la interacción del genotipo i con la localidad j; GC(il) es el efecto de la
interacción del genotipo i con la campaña l; GLC(ijl) es el efecto de la interacción del
genotipo i, la localidad j y la campaña l y ijkl es el término de error aleatorio asociado a
la observación yijkl. Este modelo es útil para estimar la contribución relativa de los
términos GC, GL y GCL en la interacción genotipoambiente (GA), así como la
contribución de la variabilidad debida a genotipo, ambiente y GA sobre el total de
(G+A+GA), donde A representa el efecto del ambiente definido por la combinación de
los niveles de los factores L y C.

Luego de analizar las contribuciones de campaña y localidad en forma separada


suele ser conveniente, tanto de un punto de vista computacional como interpretativo,
reparametrizar el modelo como:

yijk =  + Gi + Aj + B(A)k(j)+ GA(ij)+ ijk (2.30)

donde yijk es la respuesta (rendimiento) del genotipo i, en el ambiente j y bloque k;  es


la media general; Gi es el efecto del genotipo i con i=1,...,g; Aj es el efecto del ambiente
j con j=1,…,e; B(A)k(j) es el efecto del bloque k dentro del ambiente j con k=1,...,n;
GA(ij) es el efecto de la interacción del genotipo i con el ambiente j; ijk es el término de
error aleatorio asociado a la observación yijk. En el modelo mixto para ECR con
ambientes de efectos aleatorios, los términos Aj y GA(ij) se consideran variables
aleatorias distribuidas normalmente con media cero y varianzas constantes denotadas
por  A2 y  G2 A respectivamente. Las covarianzas entre los efectos aleatorios de
ambiente e interacción GA se consideran nulas, pero resulta conveniente modelar las
covarianzas entre los términos aleatorios de interacción tratando de buscar un modelo
parsimonioso para la explicación de la interacción GA. El modelo mixto de la
Ecuación (2.30) puede expresarse en términos matriciales como:

21
Y  Xβ  Zu  ε
 1´μ  XGβ1  Z A L  ZGA (GA)  Z B ( A) ( B( A))  ε
(2.31)

donde β1 es el vector de efectos de genotipo (vector de parámetros fijos) y XG su


correspondiente matriz de diseño. Las matrices ZA, ZGA y ZB(A) son las matrices de
diseño asociadas a los factores ambiente, genotipoambiente y bloques dentro de
ambiente, respectivamente. La matriz de varianzas y covarianzas de u, cuando se
supone independencia entre cualquier efecto aleatorio e igualdad de componentes de
varianzas asociadas al factor localidad, i.e.  A2 es constante para todo A, y al factor

GA, i.e.  G2  A constante para todo término GA, tiene la siguiente forma:

 A2 I 0 0 
 
G   0  GAI
2
0 .
 0 0  B2 ( A) I 

Análisis de la interacción G×A

Numerosas estrategias han sido propuestas para explorar los patrones de la


interacción GA por el impacto que ésta tiene en los programas de mejoramiento
vegetal. Cuando la interacción GA es significativa se deben utilizar estrategias de
análisis apropiadas, ya que la comparación de medias de genotipos que no considera la
variabilidad debida a la interacción GA puede ser errónea (Kang, 1990, 1998, 2002).
Examinando la interacción GA, ésta puede dividirse en dos categorías: 1) interacción
GA con cambio de rango (CCR), también conocida como interacción “crossover”
(Cornelius et al., 1996) e interacción GA sin cambio de rango (SCR) o interacción
“noncrossover” (Fig. 2.1). En la Fig. 2.1 A se presenta una situación con interacción
genotipoambiente, hay cambio de rango y las varianzas de los ambientes son similares.
En la Fig. 2.1 B los genotipos interaccionan con los ambientes pero no hay cambio de
rango, las varianzas de los ambientes son diferentes. En la Fig. 2.1 C hay interacción
genotipoambiente sin cambio de rango y las varianzas de los genotipos en los

22
ambientes son distintas. En la Fig. 2.1 D se representan dos genotipos cuya producción
aumenta proporcionalmente con los ambientes, no hay interacción genotipoambiente y
no hay cambio de rango.

A B
35 35

30 30

25 25
rendimiento

rendimiento
20 20

15 15

10 10

5 5

0 0
1 2 1 2
ambiente ambiente

genotipo 1 genotipo 2 genotipo 1 genotipo 2

C D
35 35

30 30

25 25
rendimiento
rendimiento

20 20

15 15

10 10

5 5

0 0
1 2 1 2
ambiente ambiente

genotipo 1 genotipo 2 genotipo 1 genotipo 2

Fig. 2.1. Situaciones de relación entre genotipos y ambientes. A, interacción


genotipoambiente con cambio de rango y varianzas de ambientes similares; B y C,
interacción genotipoambiente sin cambio de rango y varianzas de ambientes distintas;
D, sin interacción genotipoambiente.

El análisis de la interacción GA se puede realizar a partir de modelos basados en


regresiones, modelos basados en análisis de componentes principales, generalmente
estimados en el contexto de los modelos de efectos fijos y modelos mixtos. También
existen alternativas no paramétricas (Hühn, 1979, 1990; Kang, 2002) y propuestas de
uso de Splines para visualización de patrones (Hastie y Tibshirani, 1990). Para

23
cuantificar estabilidad de genotipos en situaciones de tablas de datos de ECR completas
se han propuesto diversas medidas (Shukla, 1972; Eberhart y Russell, 1966; Finlay y
Wilkinson, 1963; Francis y Kannenberg, 1978; Lin y Bins, 1994). También, a partir de
la modelación estadística, se pueden construir gráficos de parámetros del modelo que
permiten interpretar los patrones de interacción GA (Gauch, 1988; Vargas et al., 1999;
Yan et al., 2000; Crossa y Cornelius, 2002).

Modelos de regresión

Son usados para descomponer la interacción GA en un conjunto de términos


multiplicativos y de desviaciones desde ellos. Las aproximaciones univariadas modelan
la interacción GA como una función lineal de efectos de ambiente aditivos, i.e. GAij =
Aj + dij, donde dij es la desviación de la regresión y (1+) es el coeficiente de regresión
lineal de la respuesta del i-ésimo genotipo sobre la media de los ambientes. Al ajustar el
modelo aditivo se obtienen las estimaciones de los términos de interacción GA y luego
se regresan esos valores sobre los efectos ambientales, i.e. y. j  y.. . La interacción GA

es expresada como heterogeneidad de pendientes y la estabilidad óptima es representada


por alta respuesta media, moderada a alta respuesta a los ambientes favorables y bajas
desviaciones de regresión.

Casanoves (1996) resume los estadísticos más frecuentemente utilizados (Tabla


2.1) para la cuantificación de la estabilidad de acuerdo con el concepto de estabilidad
estática y estabilidad dinámica (Becker y Leon, 1988) y en función de su base
estructural (Lin et al., 1986) en el contexto de los modelos lineales de efectos fijos.
Desde el concepto estático, un genotipo se considera estable si posee un desempeño sin
cambios ante variaciones de las condiciones ambientales. Así, los genotipos estables son
aquellos que se comportan similarmente (no muestran variaciones en el rendimiento) en
todos los ambientes en que son probados. Se podría decir que la varianza del
rendimiento a través de los ambientes tiende a cero. Contrariamente, desde el concepto
dinámico, un genotipo se considera estable si tiene una respuesta predecible a las
variaciones ambientales. Para el caso en que el rendimiento es el carácter en estudio, se
espera que un genotipo estable rinda lo estimado o predicho por las condiciones

24
ambientales. Becker (1981) llamó a este tipo de estabilidad el concepto agronómico y lo
distinguió del concepto biológico, el cual es equivalente al concepto estático.

Lin et al. (1986), publican un resumen de ecuaciones para nueve estadísticos de


estabilidad basados ya sea en la desviación respecto a un efecto de genotipo promedio
usando sumas de cuadrados (Grupo A), basados en el término de interacción GA
usando sumas de cuadrados (Grupo B), basados la desviación respecto a un efecto de
genotipo promedio o en el término de interacción GA pero usando coeficientes de
regresión (Grupo C) y basados la desviación respecto a un efecto de genotipo promedio
o en el término de interacción GA pero usando desviaciones de regresión (Grupo D).
La clasificación dada por Lin et al.(1986) representa tres tipos diferentes de conceptos
de estabilidad. Para la estabilidad tipo I, un genotipo es considerado estable si su
varianza entre los ambientes es pequeña. Este tipo de estabilidad sería análogo al
concepto de homeostasis que Becker (1981) llamó estabilidad biológica. Desde un
punto de vista agronómico, genotipos con una buena estabilidad tipo I pueden no ser
preferidos por presentar bajos rendimientos en ambientes que son altamente productivos
para otros cultivares. Obviamente, una respuesta fenotípica de alto rendimiento
acompañada de alta estabilidad tipo I es deseable, pero esto puede ser muy difícil de
alcanzar en la práctica, razón por la cual frecuentemente se hace necesario evaluar los
genotipos desde conceptualizaciones diferentes a la de estabilidad tipo I. La utilidad de
la estabilidad tipo I depende del rango de variación de las condiciones ambientales que
se incorporan en un ensayo. Si se trata de experimentos multiambientales, con
ambientes muy distintos, los estadísticos de estabilidad de tipo I pueden no ser tan útiles
como en ensayos donde se comparan varios genotipos dentro de una región o a través de
ambientes no muy diferentes.

La estabilidad tipo II considera un genotipo estable si su respuesta al ambiente es


paralela a la respuesta promedio de todos los genotipos en el ensayo. Este tipo de
estabilidad sería análogo al concepto agronómico dado por Becker (1981). La
estabilidad tipo II tiene el inconveniente de tomar valores relativos a los genotipos
presentes en el ensayo. Esto dificulta la comparación de genotipos provenientes de
ensayos diferentes, o de genotipos que año a año se van incorporando.

25
Tabla 2.1: Medidas de estabilidad y su clasificación.
Grupo Concepto Estadístico para medir Estabilidad Autores
Estabilidad
A Estático Varianza ambiental Roemer
1 g (1917)
tipo 1 S 2j  
a  1 i 1
(Yij  Y. j )2

A Estático Coeficiente de variación ambiental Francis y


S 2 Kannenberg
CV j 
j
tipo 1 100 (1978)
Y. j

B Dinámico Componente de varianza promedio Plaisted


g g
SCGA Peterson
tipo 2 j  
2( g  1)(a  1) i 1
(Yij  Yi.  Y. j  Y.. )2 
2( g  1)(a  1)
(1959)
g a
donde SCGA   (Yij  Yi.  Y. j  Y.. )2
i 1 j 1

B Dinámico Componente de varianza de la interacción genotipo×ambiente Plaisted


g (1960)
g SCGA
tipo 2 ( j )  
2( g  1)( g  2)(a  1) i 1
(Yij  Yi.  Y. j  Y.. )2 
( g  1)(a  1)

B Dinámico Ecovalencia Wricke


g (1962)
tipo 2 W j2   (Yij  Yi.  Y. j  Y.. )2
i 1

B Dinámico Varianza de estabilidad Shukla


g g
SCGA (1972a)
tipo 2  2j   (Yij  Yi.  Y. j  Y.. )2  ( g 1)( g  2)(a 1)
( g  2)(a  1) i 1
C Dinámico Coeficiente de regresión de valores observados sobre índices Finlay
ambientales Wilkinson
tipo 2 (1963)
g

 (Y ij  Y. j )(Yi.  Y.. )
j  i 1
g

 (Y
i 1
i.  Y.. ) 2

CyB Dinámico Estabilidad genotípica Hanson


g (1970)
tipo 2 D 2j   (Yij  Y. j  bminYi.  bminY.. )2
i 1
D Dinámico Cuadrado medio residual de las desviaciones respecto a las Eberhart
regresiones de valores observados sobre índices ambientales Rusell
tipo 3 1  g g
2
(1966)
 j2   
(a  2)  i 1
(Yij  Y.j ) 2
  j  (Yi .  Y.. ) 
2

i 1 

26
Tabla 2.1(continuación): Medidas de estabilidad y su clasificación.
Grup Concepto Estadístico para medir Estabilidad (*) Autores
o Estabilidad
D Dinámico Cuadrado medio residual de las desviaciones respecto a las regresiones de Perkins
valores observados ajustados por ambiente sobre índice ambiental. Jinks
tipo 3
1  g g
 (1968)
 j2   
(a  2)  i 1
(Yij  Yi .  Y. j  Y.. ) 2
  2
j  (Yi.  Y.. )2 
i 1 
D Dinámico Coeficiente de determinación Pinthus
2 (1973)
S
rj2  1 
tipo 3 dj
2
S yj
B Dinámico Media del valor absoluto de la diferencia entre rangos del genotipo i-ésimo Nassar
sobre todos los ambientes Hühn
2 a (1987)
j 
S (1)  | rij  ri´ j |
a(a  1) i´i 1
B Dinámico Varianza común de los rangos del genotipo i-ésimo entre los ambientes Nassar
(Estático 1 a Hühn
desde
punto
el
de
S (2)
j   (rij  r. j )2
(a  1) i 1
(1987)

vista de los
rangos)
(*) Yij es la respuesta del genotipo i en el ambiente j; Y. j es el promedio sobre genotipos; Yi. es el promedio sobre
ambientes; Y.. es el promedio general; bmin es el mínimo coeficiente de regresión de Finlay y Wilkinson para
genotipo; rij es el rango del genotipo i en el ambiente j .

La selección de los genotipos que intervienen en el ensayo debe ser hecha muy
cuidadosamente y en función del nivel de inferencia que se quiera alcanzar con los
resultados. Por último, el concepto de estabilidad tipo III identifica a un genotipo como
estable si muestra un cuadrado medio residual pequeño cuando se regresa su respuesta
fenotípica sobre índices ambientales. Breese (1969), sugirió que el término estabilidad
debiera ser reservado para medir irregularidades no predecibles en la respuesta a los
ambientes. Así, si al regresar genotipos con ambientes, la variabilidad de la respuesta es
subdividida en una parte predecible (debida a la regresión) y en otra no predecible
(desvíos de la regresión), esta última podría servir como medida de estabilidad. El
problema es que para regresar la respuesta del genotipo con el ambiente, se construyen
índices ambientales a partir de los promedios de rendimiento de los genotipos presentes
en el ensayo, luego el modelo de análisis es descriptivo y no predictivo.

27
Modelos basados en análisis de componentes principales

La interacción GA también puede analizarse mediante modelos lineales y


bilineales (Gollob, 1968), que separan la porción de interacción dada por la
heterogeneidad de las regresiones de genotipos sobre las medias ambientales de la
debida a error. Los modelos lineales-bilineales representan la versión multivariada de
los procedimientos con interacción multiplicativa. Se usan análisis de componentes
principales (CP) para explorar la interacción GA en más de una dimensión.

Numerosos autores han propuesto parametrizaciones de la componente


multiplicativa del modelo de ECR bajo la óptica de los modelos lineales-bilineales
(Cornelius et al., 1992 y 1993; Crossa y Cornelius, 1993, 1997 y 2002, Crossa et al.,
1993 y 1995). El nombre lineal-bilineal se debe a que el modelo para la respuesta del
genotipo i en el ambiente j comprende una parte sistemática que involucra los efectos
aditivos principales de genotipo y ambiente (componentes lineales) como así también
uno o más términos multiplicativos para explicar patrones en el término de interacción
GA (componentes bilineales). Comúnmente la parte aleatoria del modelo involucra al
término de error y a la varianza residual del término de interacción, i.e. la parte de la
interacción GA no explicada por el modelo multiplicativo. La ecuación de un modelo
lineal-bilineal para la respuesta de un genotipo en un ambiente dado es:

r
yij    Gi  A j   nninj  ij   ij (2.32)
n 1

r
donde Gi es el efecto del genotipo i, Aj es el efecto del ambiente j,   
n 1
n ni nj es la

sumatoria de términos multiplicativos que modela la interacción GA, compuesta por el


parámetro de interacción del j-ésimo ambiente, denotado por  nj , del i-ésimo genotipo

para la misma componente o eje, denotado por  ni y el autovalor (medida de variación)

asociado al eje y denotado por n. El parámetro ij representa la porción del ij-ésimo

término de interacción GA no explicado por el modelo multiplicativo y ij es el


término de error aleatorio. El término  ni puede ser interpretado como sensibilidad

28
genotípica a los factores ambientales latentes, los cuales son representados por  nj en el

j-ésimo ambiente.

La estimación de los parámetros de interacción GA en un modelo lineal-bilineal


de efectos fijos se hace por medio de la descomposición por valor singular (SVD) de
una matriz Z, que contiene los residuos del modelo aditivo luego de ajustar por mínimos
cuadrados el modelo de efectos principales. El cociente entre la suma de los n primeros
valores singulares y la suma de todos los valores singulares representa la proporción de
la variabilidad total en Z explicada por las n primeras componentes (CP1 a la CPn). Las
componentes obtenidas a partir de los autovectores de la SVD de Z son ordenadas de
mayor a menor en función a los autovalores asociados. Las matrices que se encuentran a
la izquierda y a la derecha en la expresión de la SVD de Z, proveen los autovectores que
contienen los scores de genotipos y ambientes respectivamente. Generalmente los dos
primeros términos multiplicativos son suficientes para explicar los patrones de
interacción; la variabilidad remanente se interpreta como ruido. Los modelos lineales-
bilineales fueron llamados modelos de efectos aditivos e interacción multiplicativa
(Additive Main effects and Multiplicative Interaction) por Zobel et al. (1988) y Gauch
(1988). Cuando se usa análisis de componentes principales, los genotipos con valores
cercanos a cero en la primera CP son interpretados como adaptados a los ambientes de
prueba o de menor contribución en la interacción G×A.

Para la interpretación de los patrones e interacción GA, los scores de genotipos y


ambientes del término de interacción de un modelo lineal-bilineal son generalmente
visualizados por medio de gráficos biplot (Gabriel, 1971) para identificar los genotipos
y ambientes más importantes para explicar la presencia de interacción GA. El biplot
para un modelo lineal-bilineal se construye graficando los scores de genotipo y
ambiente en un mismo espacio. Existen pruebas basadas en cocientes de verosimilitud
secuenciales para determinar el número de ejes o componentes que se deben usar para
dicha visualización con el fin de evitar malas interpretaciones (Cornelius et al, 1993,
1996; Macchiavelli y Beaver, 1999; Liu y Cornelius, 2001).

Los modelos de regresión por sitio (SREG, Cornelius et al., 1996; Crossa y
Cornelius, 1997 y 2002) son modelos lineales-bilineales que remueven el efecto de sitio

29
y sólo expresan a la respuesta en función de G y G×A. Son aconsejables cuando los
sitios constituyen la fuente de variación más importante en relación a la contribución de
los genotipos y la interacción genotipositio sobre la variabilidad total, situaciones éstas
muy comunes en la práctica. Para visualizar los patrones de interacción con remoción de
los efectos de ambiente (datos centrados por sitio), Yan et al. (2000) proponen los
gráficos GGE biplots. A partir de estos gráficos se puede investigar la diferenciación de
mega-ambientes entre los ambientes en estudio, seleccionar cultivares superiores en un
mega-ambiente dado, seleccionar los mejores ambientes de evaluación para analizar las
causas de la interacción GA. Los gráficos conocidos como GGE biplot son construidos
a partir de modelos SREG, es decir, descomponiendo mediante un análisis de
componentes principales los datos, previo centrado por efecto de ambiente. Así, los
efectos de genotipo y de interacción GA quedan contenidos en la matriz residual y es
ésta la matriz que se somete a SVD. Los GGE biplot facilitan la evaluación visual del
desempeño de los cultivares ya que si bien los caracteres que se evalúan en ECR se
modelan como la combinación de efectos de genotipo, ambiente e interacción GA,
solamente los efectos de genotipo y de interacción GA contienen información
relevante para evaluar el desempeño de los cultivares. Debido a que se evalúan
simultáneamente efectos de genotipo y de interacción GA, se seleccionan genotipos no
sólo por su estabilidad sino también por sus rendimientos promedio.

Los gráficos GGE biplot se suelen construir a partir de tres modelos (Yan y Hunt,
2002): 1) SVD de datos centrados por efecto de ambiente, 2) SVD de datos escalados
por la desviación estándar dentro de ambientes, y 3) SVD de datos escalados por el error
estándar dentro de ambientes. El modelo para construir un GGE biplot con las 2
primeras CP, a partir de la SVD de datos centrados por efecto de ambientes (Yan et al.,
2000; Yan y Hunt, 2002) es:

yij  y j  1i1 j1  2i 2 j 2   ij (2.33)

donde yij es el rendimiento medio del genotipo i en el ambiente j, y j es la media de los

genotipos en el ambiente j, 1 y 2 son los autovalores para la CP1 y CP2

respectivamente, i1 y i 2 son los scores del genotipo i en la CP1 y CP2

30
respectivamente,  j1 y  j 2 son los scores del ambiente j en la CP1 y CP2

respectivamente y  ij es el término residual asociado a la observación promedio del

genotipo i en el ambiente j centrado por el efecto del ambiente j. El modelo es escalado


para asegurar que la CP1 y la CP2 tengan las mismas unidades. El método de
escalamiento consiste en tomar la raíz cuadrada de la variable en su escala original (Yan
y Hunt, 2002):

yij  y j  11/ 2i111/ 2 j1  21/ 2i 221/ 2 j 2   ij . (2.34)

El GGE biplot basado en las dos primeras componentes es construido graficando 11/ 2i1

y 11/ 2 j1 versus 21/ 2i 2 y 21/ 2 j 2 .

Con datos escalados por la desviación estándar de los genotipos dentro de


ambientes (Yan y Hunt, 2002), el modelo que considera dos componentes es:

( yij  y j ) / S j  1i1 j1  2i 2 j 2   ij


(2.35)

donde S j es la desviación estándar de los rendimientos de genotipos en el ambiente j y

los restantes términos son los mismos de la Ecuación (2.34). La tercer propuesta se basa
en el siguiente modelo:

( yij  y j ) / Z j  1i1 j1  2i 2 j 2   ij


(2.36)

donde Z j es el error estándar de las medias de genotipo en el ambiente j y los restantes

términos son los mismos de la Ecuación (2.34). Para poder calcular Z j se requiere que

existan repeticiones dentro de ambientes.

Yan et al. (2000) señalan que usualmente la CP1 representa respuestas de los
cultivares que son proporcionales a través de los ambientes las cuales se asocian con la
interacción GA sin cambio de rango, mientras que la CP2 representa respuesta de los
cultivares no proporcionales a través de los ambientes, es decir aquellas responsables de
la interacción GA con cambio de rango. En el GGE biplot, los cultivares con scores
CP1 altos se interpretan como aquellos que tienden a tener mayores rendimientos y los

31
ambientes con CP1 altos y CP2 cercanos a cero con los ambientes que facilitan la
identificación de dichos cultivares. En la siguiente sección se presenta la discusión
realizada por Yan y Hunt (2002) sobre cómo interpretar los GGE biplot según diferentes
objetivos.

Interpretación de los gráficos GGE biplot

Identificación del desempeño de genotipos en un mismo ambiente

Para identificar los mejores genotipos en un ambiente usando un GGE biplot, Yan
y Hunt (2002) sugieren trazar una línea entre el identificador del ambiente y el origen.
Las perpendiculares a ésta que pasan por los identificadores de genotipo proveen un
ranking de los genotipos en ese ambiente. Todos aquellos genotipos cuyas
perpendiculares a la línea del ambiente queden entre el identificador del ambiente y la
perpendicular al origen rinden por arriba del promedio en ese ambiente y viceversa. En
la Fig. 2.2 se presenta un ejemplo construido a partir de scores de 11 genotipos y 3 sitos
(ambientes).

3.5

sitio2

sitio1
2.0

mf480 Florman Tegua


CP 2

0.5 mf487
manf393
mf484

mf478 sitio4
Sitio3
mf447
mf485
-1.0 mf457 mf489

-2.5
-3.0 -2.0 -1.0 0.0 1.0 2.0 3.0
CP 1

Fig. 2.2. GGE biplot para la comparación del desempeño de


genotipos en el sitio 3. Puntos oscuros representan
genotipos y puntos claros sitios.

En el sitio 3, el ranking de los genotipos que rindieron por arriba de la media es

32
mf485, mf484, mf487, mf489, Tegua y Florman. El genotipo 447 rinde cercano al
promedio en este sitio, ya que está sobre la perpendicular a la recta del sitio 3, el resto
de los genotipos rinden por debajo del promedio del sitio, siendo el mf480 el de peor
desempeño para el sitio 3.

Identificación del desempeño de un genotipo a través de los ambientes

Para visualizar el desempeño de un genotipo en los diferentes ambientes, Yan y


Hunt (2002) sugieren graficar una línea recta entre el marcador del genotipo y el origen
y trazar una línea perpendicular a la línea conectora del genotipo que pase por el origen.
Esta última línea es la que separa los sitios favorables y desfavorables para el genotipo.
Los sitios cuyos identificadores queden en el mismo lado donde esta el genotipo son los
mejores para ese genotipo y los restantes son aquellos donde el genotipo rinde por
debajo de su promedio. En la Fig. 2.3 podemos ver que el mejor sitio para el genotipo
mf485 es el sitio 3 y que le sigue el sitio 2 con rendimientos apenas superiores al
promedio del genotipo. En el sitio 1, el genotipo mg485 rinde muy por debajo de su
promedio.

3.5

sitio2

sitio1
2.0

mf480 Florman Tegua


CP 2

0.5 mf487
manf393
mf484

mf478 sitio4
Sitio3
mf447
mf485
-1.0 mf457 mf489

-2.5
-3.0 -2.0 -1.0 0.0 1.0 2.0 3.0
CP 1

Fig. 2.3. GGE biplot para la comparación del desempeño


del genotipo mf485 en tres sitios. Puntos oscuros
representan genotipos y puntos claros sitios.

33
Comparación de dos genotipos en diferentes ambientes.

Para comparar dos genotipos en diferentes ambientes, se propone unir mediante


una línea recta los genotipos a comparar, luego trazar una línea perpendicular a la línea
conectora que pase por el origen. Esta última línea es la que separa los sitios favorables
a uno y a otro genotipo. Los sitios cuyos identificadores queden en el mismo lado donde
está el identificador de genotipo son los mejores para ese genotipo. Si un ambiente
queda posicionado sobre la línea perpendicular, los dos genotipos tienen similares
rindes en ese ambiente. Si dos genotipos están cercanos, sus rendimientos son similares
en los ambientes evaluados. Por último, si todos los ambientes quedan a un lado de la
línea perpendicular, el genotipo cuyo identificador esta de ese lado rinde más que el otro
en todos los ambientes. En la Fig. 2.4 se compara el rendimiento de los genotipos
mf480 y mf489. Se puede ver que el sitio favorable para el genotipo mf480 es el sitio 1,
mientras que para el genotipo mf489 el sitio más favorable es el sitio 3 seguido por el
sitio 2, aunque en este último los rendimientos están apenas por encima del promedio
del genotipo

3.5

sitio2

sitio1
2.0

mf480 Florman Tegua


CP 2

0.5 mf487
manf393
mf484

mf478 sitio4
Sitio3
mf447
mf485
-1.0 mf457 mf489

-2.5
-3.0 -2.0 -1.0 0.0 1.0 2.0 3.0
CP 1

Fig. 2.4. GGE biplot para la comparación del desempeño de


los genotipos mf480 y mf489 en los sitios evaluados.
Puntos oscuros representan genotipos y puntos claros sitios.

34
Identificación de los mejores genotipos en cada ambiente

La propuesta de Yan y Hunt (2002) de interpretación de los GGE biplot especifica


que, para identificar los mejores genotipos en cada ambiente, en primer lugar se debe
graficar el polígono envolvente de identificadores de genotipo. En el caso presentado en
la Fig. 2.5, los extremos que definen el envolvente están dados por los genotipos mf480,
mf457, mf489, mf485, mf484 y Tegua. Estos son genotipos de comportamiento
extremo, i.e. los de mejor o peor rendimiento en algunos ambientes. A continuación,
para cada uno de los lados del polígono (hay tantos lados como genotipos extremos
haya) se trazan líneas rectas que pasan por el origen y son perpendiculares a cada uno de
los lados del polígono (o a sus proyecciones). De esta forma, el biplot queda dividido en
cuadrantes, generalmente cada uno conteniendo un genotipo en el vértice. Los genotipos
que quedan en el vértice son los que mas rinden en los ambientes que quedan
encerrados en el cuadrante.

3.5

sitio2

sitio1
2.0

mf480 Florman Tegua


CP 2

0.5 mf487
manf393
mf484

mf478 sitio4
Sitio3
mf447
mf485
-1.0 mf457 mf489

-2.5
-3.0 -2.0 -1.0 0.0 1.0 2.0 3.0
CP 1

Fig. 2.5. GGE biplot para la identificación de los mejores


genotipos en cada sitio. Puntos oscuros representan
genotipos y puntos claros sitios.

En el biplot de la Fig. 2.5, se observa que en el cuadrante que tiene como vértice al
genotipo mf480 se encuentra el sitio 1. Este genotipo es el de mayor rinde en ese sitio.

35
Luego le siguen en rendimiento los genotipos mf478 y manf393. El cuadrante cuyo
vértice esta determinado por el genotipo Tegua, involucra al sitio 2. Al genotipo Tegua
le sigue en rendimiento el genotipo Florman, aunque por su cercanía en el biplot estos
tienen rendimientos muy parecidos en ese sitio. El siguiente cuadrante queda
determinado por la proyección de la línea que une a los genotipos mf484 y mf485 y es
perpendicular al origen. Este cuadrante no contiene ningún genotipo ni ningún sitio. El
marcador del genotipo mf485 es el vértice del sector que contiene al sitio 3 y a los
genotipos mf485, mf484m, mf489 y mf487 en orden de mayor a menor rendimiento
dentro de ese sitio. Por último, el cuadrante que tiene por vértice al genotipo mf457 no
comprende ningún sitio, por lo tanto, los genotipos mf457 y mf447 son los de
rendimientos más pobres en todos los sitios evaluados.

Identificación de grupos de ambientes

El GGE biplot (Fig. 2.5) también es útil para indagar sobre el comportamiento de
los ambientes. Todos los sitios que quedan en un mismo cuadrante pueden ser
considerados como pertenecientes a un mega-ambiente. En este ejemplo, en el que la
componente de interacción GA fue mayor que la componente de G, quedan todos los
sitios en distintos cuadrantes, sugiriendo la presencia de tres mega-ambientes diferentes.

Identificación de desempeño promedio y estabilidad de genotipos

Si se identifican distintos mega-ambientes, la selección de genotipos debe hacerse


para cada mega-ambiente en particular. Los genotipos se seleccionan en base a su
desempeño medio y a su estabilidad a través de los ambientes. Cuando no se han
identificado mega-ambientes, como es en el caso de la Fig. 2.6, se puede definir en el
biplot una media de scores de ambiente basados en los scores de la CP1 y la CP2. Los
scores para los sitios1, 2, y 3 en la CP1 son 0.63, 0.60 y 0.49 respectivamente, y el
promedio de éstos es 0.57. Los scores para los sitios 1, 2, y 3 en la CP2 son –0.23,
-0.45 y 0.86 respectivamente, y el promedio de éstos es 0.06. Una vez obtenidos estos
promedios, se traza una línea recta entre el punto medio y el origen, llamada eje de la
media de scores de ambientes (línea que termina con un círculo). Es decir, en este caso
la línea de la media de scores de ambientes pasa por el origen y por el punto (0.57;
0.06). A continuación se traza una línea que pase por el origen y que sea perpendicular a

36
la línea media de scores de ambiente. La proyección de líneas paralelas a esta
perpendicular que pasen por los marcadores de genotipos da un ranking de las medias
de genotipo a través de todos los ambientes. Así, en la Fig. 2.6 se puede observar que el
orden de rendimientos de genotipo de mayor a menor es: mf478, mf393, mf489, mf480,
mf457, mf484 (todos estos por arriba de la media de genotipos a través de los
ambientes), seguidos por mf487, mf485, Tegua y Florman (todos por debajo de la
media). Así como la proyección de los identificadores de genotipo sobre la línea media
de scores de ambiente da una idea del rendimiento de los genotipos sobre el promedio
de ambientes, la magnitud de la proyección de los marcadores de genotipo a la
perpendicular al eje de ambientes da una idea de su estabilidad. Cuanto mayor es esta
magnitud, más inestable es el genotipo. En el biplot de la Fig. 2.6 los genotipos más
estables son mf484 y mf457 mientras que los más inestables son Florman y mf478. Los
genotipos de rendimiento pobre no tienen importancia agronómica aún si su estabilidad
es buena.

3.5
sitio4
Sitio3

2.0

mf487 mf489
mf485 manf393
CP 2

0.5
mf447 mf478

Tegua
Florman sitio1
mf484
-1.0 mf457
sitio2
mf480

-2.5
-3 -2 -1 0 1 2 3
CP 1

Fig. 2.6. GGE biplot para la identificación de los mejores


genotipos en función de su producción promedio y su
estabilidad de rendimientos a través de los sitios. Puntos
oscuros representan genotipos y puntos claros sitios. El
círculo identifica el lado positivo de la línea media de
scores de ambiente.

Generalmente se buscan genotipos de alto rendimiento y lo más estables posible.


En este caso, los genotipos que se recomienda seleccionar si se consideran ambos

37
criterios (rendimiento y estabilidad del rendimiento) son mf478, manf393 y mf447. El
primero, si se desea maximizar el rendimiento a costa de inestabilidad, mf447 si se
desea estabilidad a costa de no tener un rendimiento potencialmente alto y manf393 si
se desea un balance entre rendimiento y estabilidad de los rendimientos.

Identificación de la capacidad discriminante y la representatividad de los

ambientes

Los GGE biplots pueden ser usados también para evaluar ambientes. Los
ambientes ideales no sólo deben producir una alta diferenciación de los genotipos sino
también ser representativos de la región objeto de estudio. Si los sitios son una muestra
representativa de la región en estudio, el ambiente ideal debe estar localizado sobre el
eje de la media de scores de ambientes y tener la mayor distancia sobre las proyecciones
positivas de la CP. Los ambientes son mejores cuanto más cerca están del ambiente
ideal. En la Fig. 2.7 el sitio más cercano al ambientes ideal (marcado con un círculo) es
el sitio 1 ya que esta más cerca de la línea media de scores de ambientes en su
intersección con la proyección del sitio 3 que es el de mayor rendimiento promedio.

3.5
sitio4
Sitio3

2.0

mf487 mf489
mf485 manf393
CP 2

0.5
mf447 mf478

Tegua
Florman sitio1
mf484
-1.0 mf457
sitio2
mf480

-2.5
-3 -2 -1 0 1 2 3
CP 1

Fig. 2.7. GGE biplot para la identificación de los mejores


ambientes. Puntos oscuros representan genotipos y puntos
claros sitios. El círculo identifica el ambiente ideal.

38
Modelos mixtos para el análisis de la interacción GA

Es común pensar que un conjunto de observaciones provenientes de un mismo


ambiente tiendan a estar correlacionadas. Las variables latentes asociadas a cada
ambiente pueden causar dependencias en las respuestas de los genotipos en un ambiente
dado. El desempeño de los genotipos a través de los ambientes puede generar un patrón
estructurado de interdependencia a través de los términos de interacción GA. Este
patrón puede modelarse a través de la matriz de varianzas y covarianzas de las medias
de genotipo dentro de un ambiente. Modelando la estructura de la matriz de varianzas y
covarianzas de los efectos aleatorios de interacción GA, numerosas medidas de
estabilidad pueden ser expresadas como parámetros de un modelo mixto (Piepho, 1998).
Al estimar la estabilidad como parámetro de un modelo, es posible seleccionar la
medida de estabilidad más adecuada mediante criterios de selección de modelos.

En los análisis de la interacción GA bajo los modelos mixtos, los efectos de la
interacción son considerados como variables aleatorias, con media cero, con varianzas
que no necesariamente deben ser homogéneas y covarianzas posiblemente distintas de
cero. Como se considera que los ambientes aportan información independiente unos de
otros, la covarianza entre las observaciones provenientes de distintos ambientes se
asume nula, y por parsimonia, los modelos para la estructura de (co)-varianza de los
términos de interacción se asumen iguales de ambiente a ambiente.

Las medias de cualquier par de genotipos (i, i’) en un ambiente dado (j), yij e yi´ j

tienen covarianzas dadas por:

Cov (yij ,yi´ j ) =  A2 + Cov(GAij , GA i´ j ) , para i i’. (2.37)

Las aproximaciones de regresión para estudiar la sensibilidad de un genotipo a los


cambios ambientales a partir de modelos multiplicativos para la interacción GA puede
ser llevada a cabo usando una estructura de varianzas y covarianzas del tipo factor-
analytic (FA) (Jennrich y Schluchter, 1986) para los términos de interacción GA de un
mismo ambiente. Los modelos mixtos que se presentan en la Tabla 2.2 pueden ser
utilizados para modelar la interacción GA y obtener parámetros de estabilidad. Como

39
puede observarse en la Tabla 2.2, los distintos modelos impuestos sobre los términos de
interacción GA generan distintas estructuras de varianzas y covarianzas para el vector
de observaciones (Balzarini, 2002).

El modelo mixto clásico de un ECR asume que los términos de interacción GA
tienen la misma varianza y son independientes. En el modelo mixto que permite que los
términos de interacción GA sean independientes pero heterocedásticos, las varianzas
de los términos de interacción GA varían de genotipo a genotipo, pero no dentro de un
genotipo en particular a través de los ambientes y por tanto el número de varianzas
distintas que se pueden modelar es igual al número de genotipos. Estas componentes de
varianza, son análogas a la propuesta original de Shukla (1972), llamada varianza de
estabilidad y por ello el modelo suele denominarse Shukla mixto. El modelo AMMI
mixto considera los términos multiplicativos de la interacción GA como aleatorios, es
decir:

GAij = 
m
  dij
mi mj (2.38)

donde el primer término es la suma de los términos multiplicativos usados para explicar
la interacción GA y el segundo es el término de interacción residual. Cada término
multiplicativo puede ser visto como un modelo de regresión lineal de los residuos del
modelo de efectos principales del genotipo i sobre la variable latente no observable
relativa a los efectos de ambiente.

En la Ecuación (2.38) se utiliza una suma de términos multiplicativos para


modelar los patrones de variabilidad en el término de interacción GA en más de una
dimensión. Desde los componentes de la suma se obtienen los scores de genotipo
(efectos fijo) y de ambiente (efecto aleatorio). De esta manera, en cada eje de variación,
el score del genotipo i puede ser interpretado como la respuesta del i-ésimo genotipo a
los cambios en la variable aleatoria latente con valor j en el j-ésimo ambiente. El
modelo AMMI mixto para el término de interacción GA es similar al modelo AMMI
de efectos fijos (Gauch, 1988; Zobel et al., 1988) pero en el modelo AMMI mixto
aleatorio los scores de ambiente son aleatorios. Bajo el modelo de efectos fijos, la suma

40
Tabla 2.2. Modelos mixtos para el análisis de ECR
Modelo Ecuación del modelo (*) Supuestos sobre efectos de interacción Estructura de covarianza para y(j)(**)
[1] ANOVA Mixto yijk =  + Aj + Rk(j) + Gi + GAij + ijk GAij ~ iid N(0,  GA
2
) /amb = J  A2 + I  GA
2

[2] Shukla mixto yijk =  + Aj + Rk(j) + Gi + GAij + ijk GAij ~ iid N(0,  GA
2
) /amb = J  A2 + I  GA
2
(i ) (i )

[3] AMMI mixto yijk =  + Aj + Rk(j) + Gi + GAij + ijk GAi ~ N(0,  2


mi   d2 ) para todo j. /amb = J  A2 +  + I  2

m
GAij =   dij

mi mj
m Cov(GAij, GAi´j)=  para i i
mi mi´
m

[4] Eberhart y Russell mixto yijk =  + Aj + Rk(j) + Gi + GAij + ijk GAi ~ N(0, i2 +  d2 ) para todo j. /amb =  + diag (  2( i ) )
(i )

GAij= i. j  dij Cov(GAij, GAi´j)= ii  para i i

(*) µ= media general; Aj= efecto aleatorio del ambiente j; Rk(j)= efecto aleatorio de la repetición dentro de ambiente; Gi= efecto fijo del genotipo i; GAij= efecto aleatorio de la interacción

GA; mi (i =1,…,g)= factor de peso del genotipo en el m-ésimo término de interacción multiplicativa; mj= predicho del m-ésimo score de una variable ambiental latente para el ambiente j;

dji= término de interacción residual; ijk= término de error asociado con la respuesta yijk (**) y(j)= vector de medias de genotipo en el ambiente j; /amb= Matriz de varianzas y covarianzas de

y(j); J= matriz con elementos 1 de orden gxg; I= matriz identidad gxg; : matriz gxM de factores de peso de genotipos para cada término multiplicativo m=1,..,M.

41
de los términos multiplicativos es parte de la E(yijk) mientras que bajo un modelo de
efectos mixtos ésta se encuentra contemplada en su estructura de varianzas y
covarianzas (Balzarini, 2000). El modelo denominado Eberhart y Russell mixto no
contiene los efectos principales de ambiente y sólo considera los efectos multiplicativos
de la interacción GA, es decir:

GAij= i  j  ij (2.39)

donde i es la sensibilidad del i-esimo genotipo a una variable aleatoria ambiental no


observada j, ij es la parte no explicada de la interacción GA y sus varianzas
residuales pueden ser distintas para cada genotipo. Cuanto mayor es el valor absoluto de
i mayor es la sensibilidad del genotipo a los cambios en la variable ambiental.

Los espacios de inferencia posibles de definir cuando se usa un modelo mixto se


relacionan a dos tipos de inferencia: 1) predicción del desempeño de los genotipos sobre
1 t
todos los ensayos, i.e.    E j  Gi , donde t es el número de ECR con efectos Ej, 2)
t j 1
predicción del desempeño de un genotipo en un ambiente específico, i.e.
  Gi  E j  GEij . Mc Lean et al. (1991) discuten sobre estos dos espacios de
inferencia, denominando al primer tipo de predicción “inferencia en sentido amplio”
mientras que a la segunda la identifican como “inferencia en sentido estricto”. Zeger et
al. (1988) se refieren al primer tipo de inferencia como “inferencia promedio
poblacional” y al segundo tipo como “inferencia sujeto específica” (o en este caso
ambiente-específica). Inferencia amplia e inferencia sobre promedio poblacional
generalmente se refieren a inferencias realizadas sobre efectos fijos y funciones
estimables, mientras que la inferencia estricta o la inferencia sujeto-específica se
refieren a inferencias basadas en funciones predecibles (incluyen efectos aleatorios).

Para ejemplificar las diferencias entre los dos tipos de inferencia, consideramos el
modelo con efectos de genotipo fijos y de ensayos aleatorios, con término de interacción
genotipoambiente aleatorio:

yijk =  + Gi + Aj + GE(ij)+ ijk (2.40)

42
donde yijk es la respuesta (rendimiento) del genotipo i, en el ensayo j;  es la media
general; Gi es el efecto fijo del genotipo i con i=1,...,g; Aj es el efecto aleatorio del
ambiente j con j=1,…,t; GE(ij) es el efecto aleatorio de la interacción del genotipo i con
el ambiente j; y ijk es el término de error aleatorio asociado a la observación yijk. La
esperanza incondicional de una observación es E (Yijk )    Gi . Si se desea estimar el
desempeño promedio del i-ésimo genotipo sobre la población de ambientes, i.e. aquellos
presentes en el ensayo y aquellos que no lo están, se deberá estimar   Gi . De la
misma forma, para estimar la diferencia media entre los genotipos i e i´ sobre toda la
población de genotipos se deberá estimar Gi  Gi´ . En ambos casos los términos
involucran efectos fijos por lo que se realizan estimaciones y la inferencia es
denominada inferencia en sentido amplio.

Sin embargo puede ser de interés evaluar el desempeño de un genotipo para un


conjunto específico de ambientes. En este caso se debe usar la esperanza condicional,
1 e 1 g e
  Gi   j t 
t j 1
A 
i 1 j 1
GAij , donde g es el número de genotipos. Si interesa evaluar

una diferencia promedio entre los genotipos i e i´ se deberá determinar


1 g e
Gi  Gi '   (GAij  GAi ' j ) . En ambos casos se habla de inferencia específica y se
t i 1 j 1
tienen funciones que involucran tanto efectos fijos como efectos aleatorios. Si el interés
se centra en evaluar un determinado ambiente o determinar qué genotipo es mejor para
un ambiente dado, no se buscan promedios sino una cantidad relativa al ambiente. Para
la evaluación de un ambiente sobre el conjunto de genotipos se pueden usar las
siguientes funciones predecibles:

1 g 1 g e
  i j g 
g i 1
G  A 
i 1 j 1
GAij (2.41)

1 g
  Gi  Aj .
g i 1
(2.42)

Para determinar la influencia de un ambiente sobre un genotipo se debe encontrar la


esperanza condicional   Aj  Gi  GAij y para comparar el desempeño de un ambiente

43
a través de los genotipos específicos i e i´ se debe determinar Gi  Gi´  GAij  GAi´ j .
Zeger et al. (1988) denominan a estos términos como sujeto-específico, y si se eliminan
las componentes aleatorias de éstas funciones predecibles sujeto-especifico, se obtiene
el análogo pero en sentido amplio.

Modelos de regresión factorial

Más recientemente, en muchos programas de mejoramiento, la interacción GA


ha sido analizada a través de la incorporación de covariables de ambiente y/o de
genotipo mediante los modelos de regresión factorial y el método de estimación PLS
(partial least squares). Vargas et al. (1999) usaron análisis de regresión factorial y PLS
para identificar los factores ambientales que mejor explican la interacción GA. La idea
básica es identificar la o las covariables ambientales y/o de genotipo que justifican la
presencia de la interacción GA. Los modelos de regresión factorial utilizan, al igual
que el modelo AMMI, una estructura multiplicativa para la interacción. La diferencia
entre regresión factorial y los modelos AMMI es que en regresión factorial la
interacción GA es modelada directamente como una función de las variables
ambientales y/o de genotipos (Vargas et al., 1999). El modelo de regresión factorial
para la respuesta del i-ésimo genotipo en el j-ésimo ambiente y k-ésimo bloque, donde
la interacción se modela con covariables de genotipo es:

C
yijk    Gi  Aj  B  Ak ( j )   xicG jcA   ijk (2.43)
c 1

donde el valor de la covariable c para el i-ésimo genotipo está indicada con xicG y C
indica el número de covariables de genotipo incluidas en el análisis (c = 1,...,C). Las
covariables genotípicas usuales representan características fenológicas, fisiológicas, de
resistencia a plagas y/o enfermedades, marcadores moleculares, etc..

Similarmente, si se usan covariables ambientales, la expresión del modelo para la


respuesta yijk es:

C*
yijk    Gi  Aj  B  Ak ( j )    icG* x Ajc*   ijk
c*1 (2.44)

44
donde x Ajc* (c*= 1, ...,C*) representa la covariables ambiental c* en el j-ésimo ambiente

y C* indica el número de covariables ambientales utilizadas en el análisis. Las


covariables ambientales usuales son variables climáticas y/o variables de suelo.

El modelo de regresión factorial para incorporar simultáneamente variables


ambientales y genotípicas (Denis 1988; van Eeuwijk et al., 1996) es:

C* C C* C
yijk    Gi  Aj  B  Ak ( j )    icG* x Ajc*   xicG jcA   xicG x Ajc*   ijk
c*1 c 1 c*1 c 1 (2.45)

En general estos modelos han sido usados en el marco de los modelos de efectos fijos y
suponiendo términos de error normalmente distribuidos con media cero y varianzas
constantes. Se usan los procedimientos clásicos (Draper y Smith, 1998) de selección de
variables para identificar las covariables de mayor capacidad predictiva. Si se trabaja
con datos de rendimiento medio doblemente centrados (descontando efectos de genotipo
y efectos de ambiente) las covariables seleccionadas explican directamente la
interacción GA.

En términos matriciales el modelo de regresión factorial para los valores promedio


de la respuesta (Vargas et al., 2001) es:

E (Y)  1i 1´j  τ1´j  1i β´  XΓ´ (2.46)

donde E(Y) es la esperanza de la matriz Y (ga) de respuestas de los i=1,...,g genotipos


en los j=1,...,a ambientes,  es un escalar que representa la media general, 1i y 1j son
vectores con elementos 1, de orden g1 y a1 respectivamente,  (g1) es el vector de
efectos principales de genotipo,  (a1) es el vector de efectos principales de ambiente,
X (ggc) es la matriz que contiene los g valores de los genotipos para cada una de las gc
covariables de genotipo(gc g-1), y Γ (agc) contiene los efectos no conocidos de
ambientes sobre cada uno de los genotipos. Si las regresiones de las componentes de
interacción GA se hacen con covariables de los genotipos, los coeficientes de
regresión dependen de los ambientes. El modelo en su expresión matricial (Vargas et
al., 2001) es:

45
E (Y)  1i 1´j  τ1´j  1i β´  ξZ´ (2.47)

donde E(Y) es la esperanza de la matriz Y (ga) de respuestas de los i=1,...,g genotipos


en los j=1,...,a ambientes,  es un escalar que representa la media general, 1i y 1j son
vectores con elementos 1, de orden g1 y a1 respectivamente,  (g1) es el vector de
efectos principales de genotipo,  (a1) es el vector de efectos principales de ambiente,
Z (aac) es la matriz que contiene los a valores de los ambientes para cada una de las cc
covariables ambientales (cc a-1), y ξ (gac) contiene los efectos no conocidos de

ambientes sobre cada uno de los genotipos. La dificultad de explicar la interacción GA
a través de variables ambientales radica en la complejidad estadística, sobre todo
cuando éstas son numerosas, ya que muchas de ellas están correlacionadas y los
métodos de estimación por mínimos cuadrados ordinarios producen estimadores de los
coeficientes de regresión que pueden ser erróneos. La estimación por PLS ofrece una
alternativa estadística con el cual se puede explicar la interacción GA a partir de las
covariables ambientales. Los genotipos, los ambientes y las variables ambientales
pueden ser conjuntamente representados en un gráfico conocido como Triplot. Esta
aproximación ofrece una técnica potente para evaluar la respuesta de los genotipos en
varios ambientes como una función de un conjunto de variables ambientales que colapsa
la información desde los distintos ambientes. La técnica consiste en identificar una
combinación lineal de las variables explicatorias que den un vector latente para predecir
en forma óptima la respuesta usando un procedimiento iterativo. El número de
combinaciones lineales a retener se obtiene por validación cruzada (Stone, 1974) y por
medio de pruebas F (Osten, 1988).

Modelación de la estructura de parcelas en ECR multiambientales

Supongamos que en cada una de l localidades de un ECR multiambiental se tienen


g cultivares con medias de rendimiento 1,...,g y que se asignan al azar en b parcelas
(generalmente b bloques), con un total de n=gb parcelas (cada cultivar aparece sólo
una vez en cada bloque). Si y es un vector n1 que contiene los rendimientos
registrados en una localidad, el vector puede ser expresado como y=X+e, con  un

46
vector de parámetros desconocidos que contiene las g medias de rendimiento (donde
también se podrían incorporar los efectos de bloques si se tratan éstos como efectos
fijos), X la matriz de diseño correspondiente y e un vector de términos de error con un
elemento para cada una de las parcelas que, si se supone que no existen dependencias,
se distribuyen iid N(0,  2 ).

Las dependencias espaciales entre parcelas o correlación espacial positiva se


refieren a la tendencia de observaciones que están en parcelas cercanas a ser más
parecidas que las que están más lejos una vez descontados los efectos de diseño. Para
situaciones donde los errores se suponen correlacionados debido a la variabilidad
espacial existente entre las parcelas, Papadakis (1937) propuso ajustar las medias de
cultivar mediante un análisis de covarianza que involucra los residuos (predictores de
los errores) de las parcelas vecinas. Supongamos que se construye una matriz D de
orden nn con elementos 0´s y 1´s, tal que en la fila i-ésima lleva ceros en las columnas
que representan parcelas que no son vecinas de la parcela i y 1 para las parcelas vecinas.
Los rendimientos ajustados de acuerdo al procedimiento de Papadakis pueden

expresarse como y  Xβ   D y  Xβˆ   e , donde  y  son estimados por mínimos

cuadrados. El rendimiento obtenido en una parcela es ajustado por la suma de los


residuos de las parcelas vecinas.

Whittle (1954), Mead (1971), Besag (1974,1977) y Ripley (1981) usan un modelo
de errores autorregresivos en ECR conducidos en un único ambiente. Estos son modelos
autorregresivos para el término de error de la parcela i-ésima condicional al resto de los
términos de error de las parcelas vecinas. Con una matriz de covarianza para el modelo
autorregresivo C =  D y un vector de parámetros fijos conteniendo g medias de
cultivar, estos modelos producen ajustes de medias de rendimiento iterando sobre la
siguiente expresión:

rμˆ = X´y - ˆX´D y - Xμˆ  . (2.48)

Las medias ajustadas por los modelos autorregresivos son muy cercanas
conceptualmente a las obtenidas por el estimador de Papadakis. Expresando las medias
ajustadas por el método de Papadakis como:

47
rμˆ  X´y  αX´D
ˆ y  Xμˆ  , (2.49)

si  fuese igual a , el estimador de Papadakis puede interpretarse como el primer paso


de la búsqueda iterativa para una solución del modelo autorregresivo para los términos
de error.

Los experimentos individuales que constituyen los ECR multiambientales


consisten de n parcelas, dispuestas generalmente en un arreglo rectangular de F filas y C
columnas (n=FC). Si las parcelas de una misma fila se consideran más parecidas que
las parcelas de distintas filas, es común que la asignación de los cultivares a las parcelas
se realice bajo un esquema de aleatorización restringida, i.e. aleatorización de cultivares
por filas. Tal es el caso del diseño en bloques completos al azar (DBCA), por esto
resulta importante contemplar las diferencias entre filas de parcelas (bloques) de manera
explícita en el ajuste. Para un ambiente, la ecuación del modelo de análisis de la
varianza para un DBCA es:

y =  + G +  + e , con i=1,...,g; j=1,...,r (2.50)


ij i j ij

donde  corresponde a la media general del rendimiento, Gi el efecto del cultivar i,  el


j
efecto del bloque j y eij es el error aleatorio asociado con la unidad experimental en el

bloque j que lleva el cultivar i. Los eij se asumen independientes con varianza constante

2, i.e. se supone que no existe variación espacial local.

Los efectos de bloques pueden ser tratados como fijos o como aleatorios. Los
efectos de bloques se consideran aleatorios cuando se supone que los bloques en el
experimento son solamente un subconjunto de un conjunto mayor de bloques sobre los
cuales se realizará la inferencia sobre medias de cultivar, es decir, se desea estimar y
comparar las medias de cultivar con niveles de precisión y de significancia estadística
que sean válidos en referencia al total de la población de bloques y no sólo sobre
aquellos bloques del experimento (Littel et al., 1996).

La estimación de una media de cultivar bajo un DBCA donde se considera el


efecto de bloque como aleatorio, i.e. bj distribuidos iid N(0,  b2 ) tiene como error

48
estándar EE   2 ( yi )   2
  b2  b ya que la media para el cultivar i es

yi.  i  b.  ei. . La estimación por intervalo de confianza de una media de rendimiento


se realizará, para un mismo nivel de confianza, con un intervalo más amplio que el

correspondiente a un DBCA con efectos fijos ( EE   2 ( yi )   2 b ). Mas allá de

estas diferencias entre ambos modelos a nivel de la estimación de una media en


particular la diferencia de dos medias, para diseños en bloques completos balanceados,
se realiza con el mismo error estándar bajo ambos modelos ya que para el DBCA con
efectos de bloques aleatorios las diferencias entre medias se estiman libres de la

variación entre bloques, i.e. EE   2 ( yi  yi '  i  i '  ei  ei ' )  2 2 b . Si bien la

estimación para la diferencia de medias es la misma, lo que ha cambiado es el espacio


de inferencia. Al incorporar los efectos aleatorios de bloques en el cálculo de la
diferencia, la inferencia se aplica a la población entera de bloques desde la cual los
efectos de bloques en el experimento fueron muestreados (inferencia amplia).

Bajo la óptica de los modelos lineales mixtos en el análisis de un DBCA de un ECR


individual con efectos de bloques aleatorios, el vector u contiene los b efectos aleatorios
de bloques, R igual a In2 es la matriz de varianzas y covarianzas de los términos de
error que se consideran independientes y G se modela como In  b2 . No obstante la
covarianza entre los rendimientos provenientes de parcelas de un mismo bloques es
igual a  b2 según se deduce de la expresión para V [Ecuación (2.3)] En el caso de un
diseño de bloques incompletos, el vector u contiene los efectos de las repeticiones y de
bloque dentro de repeticiones y el parámetro 2 es la varianza intra-bloque.

En ECR multiambientales es posible contemplar dependencia entre los errores,


debidas a variabilidad espacial, a través de la modelación de la matriz R. Si se denota al
vector de errores como e = e1' ,e'2 , ...,e's  , donde el representa los errores asociados a las

parcelas de la localidad l y s es el número de sitios o ambientes, R tendrá la forma:

49
 R1 0 . . . 0 0
0 R2 . . . 0 0 

. . . . . 
 
R  l 1 R l   .
s
. . . . 
. . . . . 
 
0 0 . . . Rs 1 0
0 Rs 
 0 . . . 0
(2.51)

Es decir, se supone que cada ECR individual tiene su propia estructura de varianzas y
covarianzas y éstas son independientes unas de otras. Cuando se asume que el vector de
errores e refleja dependencias espaciales, la matriz de varianzas y covarianzas de e se
expresa como R =  2Corr  δ  , donde Corr  δ  es la matriz de correlación espacial que

depende de las distancias entre parcelas y los parámetros contenidos en δ y 2 es la


varianza residual. La modelación de R en los ECR multiambientales puede lograrse
modelando Rl =  l2Corrl  δl  y permitiendo un modelo de variabilidad espacial

diferente para cada grupo de datos o localidad. Existen numerosas formas posibles para
modelar la matriz Corr  δ  reflejando tendencia espacial local; algunas están

implementadas en software estadísticos (SAS Institute, 2001; ASReml, 2002).

Llamaremos Corr  δ   Corrij  , donde Corrij  Corr  ei ; e j  a la correlación espacial

entre los errores asociados a las parcelas i y j y d ij a la distancia entre la parcela i y la

parcela j. La correlación entre los errores asociados a las parcelas i y j será función de
esta distancia y de un vector de parámetros desconocidos . Asumiremos que e
constituye un proceso estacionario de segundo orden, i.e., las correlaciones entre dos
parcelas dependen sólo del vector distancias. Luego, la función de correlación es la
misma para todos los pares de parcelas que se encuentran a igual distancia en un
dirección dada. Si se supone que la función de correlación no depende de la dirección,
el modelo de correlación espacial es llamado isotrópico (procesos invariantes a
rotaciones sobre el origen). Los modelos de correlación espacial se llaman anisotrópicos
cuando se asume que la función de correlación no sólo depende de la magnitud de la
distancia sino también de la dirección. Por otro lado, se dice que un proceso es
separable cuando se pueden tener funciones distintas en direcciones distintas y la

50
función de correlación resultante esta dada por el producto de la función de correlación
en cada una de las direcciones. En los casos de arreglos rectangulares de n parcelas en F
filas y C columnas (n=FC) importan generalmente sólo 2 direcciones (procesos
bidimensionales). Smith et al. (2001), cita que el supuesto de separabilidad es
computacionalmente conveniente y razonable para el proceso de tendencia espacial
bidimensional asociado a las parcelas de los ensayos a campo (Martin, 1990; Cullis y
Gleeson, 1991). Para un proceso bidimensional separable, la matriz de varianzas y
covarianzas para e en un ECR multiambiental puede ser expresada como:

 
R =  2Corr     2 Corr f  f   Corrc  c  , (2.52)

donde Corr f  f  y Corrc  c  contienen las matrices de correlación FF y CC para las

filas y columnas de cada ensayo individual respectivamente. Zimmerman y Harville


(1991) dan ejemplos usados en aplicaciones geoestadísticas que incluyen el modelo
exponencial como modelo para la función de correlación. Para una única dimensión
(modelo isotrópico) la función de correlación exponencial es exp(dij /  ) o también

comúnmente expresada como exp   dijp  , para algún p>0, siendo d ij la distancia entre

las parcelas i y j y  un parámetro desconocido. SAS versión 8.2 (SAS Institute, 2001)
lo llama modelo exponencial isotrópico, si p=1 (modelo con un único parámetro) y
modelo Gaussiano si p=2. El modelo con p=1 es de particular importancia para los
ECR.

51
CAPÍTULO III

PREDICTORES LINEALES INSESGADOS (BLUP) EN ENSAYOS


COMPARATIVOS DE RENDIMIENTO DE LÍNEAS
EXPERIMENTALES

Introducción

Las observaciones provenientes de un ECR se analizan, tradicionalmente,


mediante la técnica de análisis de la varianza asociada a un modelo de efectos fijos, a
partir de la cual se pueden contrastar hipótesis sobre efectos de interacción
genotipoambiente, efectos de genotipos y efectos de ambientes (Cruz Medina, 1992).
Bajo los modelos de efectos fijos se utilizan las medias de genotipo para elegir aquellos
que continuarán siendo evaluados en próximos ensayos. Además de las medias, los
modelos de efectos fijos proveen el marco conceptual de las medidas comúnmente
usadas para evaluar la estabilidad de los rendimientos (Becker y León, 1988;
Casanoves, 1996). Sin embargo, los modelos de efectos fijos no aprovechan toda la
información disponible en las bases de datos de los ECR (Littell et al., 1996).

Los modelos mixtos, constituyen una alternativa más eficiente para el análisis de
bases de datos de ECR porque son menos afectados por el desbalance y la falta de
información (Boca, 1999; Balzarini, 2000). Los efectos principales de localidad, sobre
todo en ECR en el que participan pocas localidades, generalmente son considerados
como efectos fijos. Los efectos de genotipos, sobre todo en ECR que involucran un gran
número de genotipos, como son aquellos de etapas tempranas de programas de
mejoramiento, son considerados como aleatorios (Hill y Rosemberg, 1985; Piepho,
1994; Balzarini, 2000). Para realizar la elección de materiales que continuarán siendo
evaluados en el marco de los modelos mixtos que consideran los efectos de genotipo
aleatorios, se recomienda usar el mejor predictor lineal insesgado (BLUP) del efecto de
genotipo, en lugar de las medias de genotipos. Los BLUPs de efectos de genotipo que se
usarán como predictores del desempeño futuro de cada genotipo pueden obtenerse a
partir de uno o más años de ensayos.

52
En el programa de mejoramiento de maní (PMM) de la EEA Manfredi-INTA
cada año se conducen distintos tipos de ECR para comparar el rendimiento en diferentes
ambientes del germoplasma en evaluación. En las etapas tempranas del programa, se
evalúa un gran número de líneas experimentales y cultivares testigos tanto de genotipos
de ciclo corto como de genotipos de ciclo largo. Para la comparación de líneas
experimentales es razonable considerar los efectos de los genotipos como variables
aleatorias. Tradicionalmente, el PMM-INTA se toma la decisión de qué líneas
experimentales evaluar al año siguiente a partir de las medias de los genotipos en un año
particular (modelo de efectos fijos). En este capítulo se analizaron, en el marco de los
modelos mixtos, los rendimientos de genotipos de ciclo corto y largo de ECR de líneas
experimentales utilizando los BLUP de efectos de genotipo como criterio de elección de
genotipos.

Los objetivos del capítulo fueron: 1) estimar la magnitud relativa de las distintas
componentes de varianza de la interacción genotipoambiente en los ECR de genotipos
de ciclo corto y de ciclo largo del PMM-INTA y 2) evaluar el uso del BLUP de los
efectos genotípicos basados en información de uno y de dos años de ECR para la
elección de genotipos a evaluar en futuros ECR. La finalidad del primer objetivo es
establecer si la elección de genotipos en etapas tempranas del programa se optimiza al
incrementar el número de localidades y/o años de ECR. El segundo objetivo se
relaciona con la búsqueda de metodologías que podrían resultar más eficientes para
decidir qué líneas deben continuar en evaluación en los años siguientes.

Material y Métodos

Base de datos.
La fuente de información utilizada comprende los ensayos comparativos de
rendimiento de genotipos de ciclo corto (ECR CC) y de ciclo largo (ECR CL) del
Programa de Mejoramiento de Maní (Arachis hypogaea L.) de la EEA-Manfredi, INTA,
Córdoba, Argentina, realizados durante ocho campañas agrícolas. Los ensayos se
realizaron en tres localidades en cada campaña: Manfredi (Lat. S. 31º41’, Long. O.
63º26’), General Cabrera (Lat. S. 32º49’, Long. O. 63º51’) y Río Tercero (Lat. S.

53
32º10’, Long. O. 64º7’) de la provincia de Córdoba, Argentina. En cada ECR se
evaluaron un promedio de 14 líneas experimentales. El conjunto de líneas evaluadas
cada año fue aproximadamente el mismo para todas las localidades, pero la lista de
genotipos intervinientes en el período de tiempo estudiado varió de campaña a campaña.
En general en cada campaña se eliminan aproximadamente la mitad de las líneas
evaluadas y se da lugar al ingreso de nuevas líneas para la campaña siguiente (Tabla
3.1). La base de datos de genotipoaño es altamente desbalanceada. Durante las ocho
campañas de referencia se evaluaron 74 genotipos entre ambos ECR. Sólo 2 cultivares
de ciclo corto y 3 cultivares de ciclo largo fueron evaluados en todas las campañas. En
todas las localidades, el diseño experimental usado cada año fue en bloques completos
al azar con cuatro repeticiones. Las parcelas experimentales fueron de dos surcos de

Tabla 3.1. Número de genotipos participantes en el programa de Mejoramiento de Maní


de la EEA-Manfredi, INTA, en ensayos comparativos de rendimiento de líneas
experimentales de ciclo corto (ECR CC) y largo (ECR CL) durante ocho campañas
agrícolas (1984/85 a 1992/93).

ECR CC ECR CL

Campaña 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8

1 15(1) 8(2) 5 3 4 2 2 2 11 8 5 2 3 2 2 2

2 12 7 4 4 2 2 2 11 7 4 5 4 4 4

3 16 10 9 7 7 7 12 6 7 5 5 5

4 17 11 8 7 6 11 10 8 7 7

5 16 12 11 9 14 9 8 8

6 16 11 9 14 12 9

7 15 11 13 10

8 11 10
Los elementos de la diagonal de los arreglos mostrados para cada ECR corresponden al número de genotipos
evaluados cada campaña y los elementos fuera de la diagonal (i,j) al número de genotipos que ingresaron en la
campaña i y aún participan en la campaña j.
(1)
Número de genotipos evaluados en la campaña 1 (campaña 1984/85) en ECR de genotipos de ciclo corto.
(2)
Número de genotipos evaluados en la campaña 1 que también fueron evaluados en la campaña 2 (campaña
1985/86)

54
10 m de longitud distanciados 70 cm uno de otro. Para la siembra se utilizaron 15
semillas por metro lineal de surco en promedio. Cada parcela se cosechó en su totalidad
en forma manual. Los valores de rendimiento analizados corresponden a kilogramos de
grano por parcela a humedad constante (8%).

Modelos estadísticos

Estimación de componentes de varianza

En una primera instancia se ajustó un modelo mixto, con los datos provenientes de
distintas campañas, para cada tipo de ECR por separado. Con este modelo se estimó la
contribución porcentual de la variación genotípica y de la variación debida a la
interacción genotipoambiente respecto a la variación total observada. La interacción
genotipoambiente fue particionada en interacción genotipolocalidad, genotipoaño y
genotipolocalidadaño. Para cada tipo de ECR, la ecuación del modelo para el
rendimiento del genotipo i en el bloque k de la localidad j, campaña o año l, fue la
siguiente:

yijkl =  + Lj + B(LC) k(jl) + Cl + Gi + GL(ij)+ GC(il) + GLC(ijl)+ijkl (3.1)

donde yijkl es el rendimiento del genotipo i, en la localidad j, bloque k en la campaña o


año l;  es la media general; Lj es el efecto de la localidad j con j=1,…,s; B(LC) k(jl) es el
efecto del bloque k dentro de la localidad j con k=1,...,n; Cl es el efecto de la campaña l
con l=1,…,a; Gi es el efecto del genotipo i con i=1,...,g; GL(ij) es el efecto de la
interacción del genotipo i con la localidad j; GC(il) es el efecto de la interacción del
genotipo i con la campaña l; GLC(ijl) es el efecto de la interacción del genotipo i, la
localidad j y la campaña l y ijkl es el término de error aleatorio asociado a la
observación yijkl. Los términos de error se supusieron distribuidos normalmente con
media cero y varianza constante. Los efectos de genotipo y de las interacciones
genotipolocalidad, genotipoaño y genotipolocalidadaño, fueron considerados
como variables aleatorias distribuidas normalmente con media cero y varianzas
constantes, denotadas por  g2 , g2l , g2a y g2la , respectivamente. Las covarianzas
entre los efectos aleatorios de los factores correspondientes fueron consideradas nulas.

55
Los efectos asociados a los factores localidad y año se consideraron fijos por contarse
con pocos niveles para cada uno de ellos para estimar componentes de varianza y
debido a que sólo fueron incluidos en el modelo para corregir la variabilidad de los
rendimientos ocasionada por el efecto de los mismos. Otros autores (Piepho, 1994;
Balzarini, 2000) han demostrado que la adición de componentes de varianza debida a
estos efectos, cuando ya se consideraron los términos de la interacción
genotipoambiente como aleatorios, no mejoran la capacidad predictiva del modelo.

Predicción de los efectos de genotipo (BLUP) basados en datos de una campaña

agrícola

Para cada campaña se ajustó un modelo mixto incluyendo todos los genotipos de
ambos ECR (ciclo corto y largo) para obtener las predicciones del desempeño futuro de
cada uno usando BLUP. El modelo ajustado para el rendimiento de un genotipo en una
determinada localidad fue el siguiente:

yijkm =  + Lj + Em+ B(LE) k(jm) + Gi + GL(ij)+ ijkm (3.2)

donde yijkm es el rendimiento del genotipo i, en la localidad j, bloque k del ECR m;  es


la media general; Lj es el efecto de la localidad j con j=1,…,s; Em es el efecto del ECR
m con m=1, 2; B(LE)k(jm) es el efecto del bloque k dentro de la localidad j del ECR m
con k=1,...,n; Gi es el efecto del genotipo i con i=1,...,g; GL(ij) es el efecto de la
interacción del genotipo i con la localidad j y ijkm es el término de error aleatorio
asociado a la observación yijkm. Los términos de error se suponen distribuidos
normalmente con media cero y varianza constante. Los efectos genotipo y la interacción
genotipolocalidad se consideraron variables aleatorias distribuidas normalmente con

media cero y varianzas constantes denotadas por  g2 y  g2l , respectivamente. Las


covarianzas entre los efectos aleatorios de genotipo y de interacción genotipolocalidad
fueron consideradas nulas.

El BLUP, para la función   Gi  GL(ij ) , usado para predecir el desempeño de un


genotipo en una determinada localidad (inferencia ambiente-específica) se obtuvo a
partir de la siguiente ecuación:

56
BLUP(   Gi  GL(ij ) ) = Y...  F G (Yi..  Y... )  F GL (Y...  Yi..  Y. j.  Yij. ) (3.3)

donde F G y F GL son conocidos como factores de corrimiento, que bajo los supuestos de
este modelo pueden expresarse como funciones de las componentes de varianzas
asociadas a los términos aleatorios:

 GL
2
 G2 
FG  s (3.4)
 e2
 
2
G
2
GL 
ns

 GL
2
F GL
 (3.5)
2
 GL
2
 e
n

Como el interés se centró en la predicción del efecto de genotipo Gi, i=1,…,g


(inferencia amplia) se obtuvo el BLUP de Gi. Las componentes de varianza que
intervienen en los factores de corrimiento fueron estimadas ya que no eran conocidas;
para estimarlas se usó el procedimiento de máxima verosimilitud restringida (Searle et
al., 1992) según su implementación en SAS (SAS Institute, 1997). Debido a que se usan
estimaciones de las componentes de varianza, los predictores de Gi. obtenidos son
BLUPs empíricos, es decir aproximaciones del mejor predictor lineal insesgado del
efecto de genotipo. Para este modelo, con suposiciones simples sobre la distribución de
los efectos aleatorios, se puede interpretar al BLUP del efecto genotipo como una
regresión de las medias de genotipo hacia la media general , con una pendiente dada
por la función F G que toma en cuenta la cantidad de información existente para cada
genotipo. Un valor grande de F G implica un corrimiento pequeño de las medias
genotípicas hacia . En otras palabras, cuando existe una mayor credibilidad en las
medias genotípicas, los BLUP de efectos de genotipos se aproximan a las medias de los
genotipos. Un valor pequeño de F G , conduce a una regresión mayor de la medias de
genotipo hacia la media general. En este último caso, la elección de los genotipos
mediante BLUP puede resultar diferente a la que se encontraría usando las medias de
los mismos bajo un modelo de efectos fijos. Este comportamiento puede disminuir el

57
riesgo de determinar como diferentes a genotipos que podrían tener el mismo mérito
genético.

El BLUP del efecto aleatorio de un genotipo obtenido a partir de los datos de una
campaña agrícola se utilizó como predictor del desempeño futuro de ese genotipo en el
próximo año. Los BLUP se interpretaron como una medida del desempeño de cada
genotipo referida a la media general de los genotipos (desviación respecto a la media
general). Como se desprende de la Ecuación (3.4), las características experimentales del
ensayo usado para obtener el BLUP sólo influyen en la predicción a través de las
componentes de varianzas. Con la finalidad de comparar las predicciones de efectos de
genotipos obtenidas desde información proveniente de distintas campañas se utilizaron
BLUP estandarizados obtenidos a partir de los BLUP empíricos, divididos por su error
de predicción. En adelante se denotará al BLUP estandarizado como BLUP-e.

Predictores (BLUP) basados en datos de dos campañas agrícolas

Los BLUPs de efecto de genotipos también fueron calculados usando información


de los ECR de dos campañas agrícolas consecutivas. Cuando el análisis fue basado en
dos años de ensayo, el modelo utilizado fue el siguiente:

yijkml =+Em+Gi+Lj+Al+LA(jl)+B(LAE)k(jlm)+GL(ij)+GA(il)+GLA(ijl)+ijkml (3.6)

donde yijkml es el rendimiento del genotipo i, en la localidad j, bloque k, ECR m y año l;


 es la media general; Em es el efecto del ECR m con m=1, 2; Gi es el efecto del
genotipo i con i=1,...,g; Lj es el efecto de la localidad j con j=1,…,s; Al es el efecto del
año l con l=1,...,a; LA(jl) es el efecto de la interacción entre la localidad j y el año l,
B(LAE) k(jlm) es el efecto del bloque k dentro de la localidad j, año l del ECR m con
k=1,...,n; GL(ij) es el efecto de la interacción del genotipo i con la localidad j; GA(il) es el
efecto de la interacción del genotipo i con el año j GLA(ijl) es el efecto de la interacción
entre el genotipo i, la localidad j y el año l, y ijkm es el término de error aleatorio
asociado a la observación yijkml. Los términos de error se supusieron distribuidos
normalmente con media cero y varianza constante.

58
Los efectos de genotipo y las interacciones genotipolocalidad, genotipoaño,
localidadaño y genotipoañolocalidad se consideraron como variables aleatorias
distribuidas normalmente con media cero y varianzas constantes denotadas por
 g2 , g2l , g2a , l2a y g2al respectivamente. Las covarianzas entre los efectos

aleatorios de genotipo y de interacciones que involucran efectos de genotipo fueron


consideradas nulas. Los BLUPs de efectos de genotipo fueron obtenidos en forma
análoga a la detallada cuando se usó una campaña agrícola. En cada análisis se
incluyeron todos los genotipos presentes en el o los años que participaron para generar
predicciones para una campaña particular. Debido a que los ECR evaluados no
presentan un gran número de genotipos y a que el número de altas y bajas de genotipos
por año es elevado, no se realizaron en este trabajo predicciones obtenidas a partir de
más de dos años de ECR.

Evaluación de las predicciones generadas


El procedimiento MIXED de SAS (SAS Institute, 1997) se utilizó para el ajuste
de todos los modelos y para obtener los BLUPs de cada genotipo con datos de una y dos
campañas. SAS/MIXED provee los errores de las predicciones generadas y un valor p
asociado al BLUP estandarizado (BLUP-e), correspondiente al cociente entre el BLUP
generado y su error de predicción. Este estadístico esta inversamente relacionado al
tamaño muestral usado para calcular el BLUP. Tales valores p se emplearon para
determinar la superioridad o inferioridad de un cultivar respecto a la media general. Un
valor p < 0.10 se interpretó como indicador de desempeño genotípico significativamente
diferente al promedio. Teniendo en cuenta el signo del BLUP-e, los genotipos se
clasificaron como de rendimiento superior (signo positivo) o inferior (signo negativo)
respecto al rendimiento medio general. La capacidad predictiva del BLUP de genotipo
se evaluó a través de la comparación recursiva de la categorización realizada para cada
genotipo en base del BLUP-e, a partir de la información disponible en una y dos
campañas, con la categorización del mismo genotipo en el año siguiente.

Además, se obtuvieron los siguientes coeficientes de correlación de Pearson: 1)


correlación entre los BLUP-e de cada genotipo con los BLUP-e de los genotipos en la
campaña inmediata posterior y 2) correlación entre los BLUP-e de cada genotipo con

59
las medias de rendimiento de genotipos en la campaña inmediata posterior a la o las
campañas incluidas en la generación de los BLUPs.

Resultados y Discusión

Estimación de componentes de varianza

En la Tabla 3.2 se presentan los porcentajes de variación respecto a la variación


total asociados a cada una de las componentes de varianza que definen el modelo
ajustado [Ecuación (3.1)] para cada tipo de ECR y considerando todos los datos
disponibles a través de las ocho campañas. Las estimaciones permiten dilucidar la
importancia relativa de la variabilidad entre genotipos respecto a la variabilidad debida
a la interacción genotipoambiente.

Tabla 3.2. Componentes de varianza para ECR de ciclo corto (ECR CC) y ciclo largo
(ECR CL) obtenidas a partir del rendimiento de ocho campañas agrícolas del Programa
de Mejoramiento de Maní de la EEA-Manfredi, INTA (porcentajes respecto a la
variabilidad total)

Fuente de Variación ECR CC ECR CL

Genotipo (  g2 ) 12.9 34.1

Interacción genotipolocalidad (  g2l ) 5.7 7.1

Interacción genotipoaño (  g2a ) 12.7 4.6

Interacción genotipolocalidadaño (  g2al ) 26.8 19.9

Residual (  Res
2
) 41.9 34.3

Los resultados sugieren que las varianzas genotípicas de las líneas experimentales
de ciclo corto, del programa de mejoramiento de maní de la EEA-Manfredi del INTA,
son relativamente pequeñas si se comparan con la variación residual. No sucede lo
mismo para los ECR CL, además, las líneas de ciclo largo parecieran también ser más

60
estables o menos dependientes de las variaciones ambientales. En los ECR CC, la
interacción genotipolocalidad fue menor que la interacción genotipoaño, sugiriendo
que sería más conveniente incrementar el número de años en los que se evalúa un
mismo material que el número de localidades en cada campaña. Una relación inversa se
encontró en los ECR de ciclo largo.

Sin embargo, es importante notar que en ambos casos la componente de varianza


para la interacción genotipolocalidad fue relativamente baja comparada con la
interacción genotipolocalidadaño. Esto sugiere variaciones de la interacción
genotipolocalidad año a año o falta de consistencia en los rankings relativos de las
líneas en diferentes localidades a través de los años. Se podría pensar que la interacción
anual genotipolocalidad podría ser aleatoria y no repetible a través de los años. Por
otra parte, el hecho de tener una interacción genotipolocalidad de baja magnitud puede
deberse a la cercanía de las localidades que intervinieron en la evaluación. La
distribución porcentual respecto a la variación total del conjunto de las fuentes de
variación analizadas sugiere que los ECR involucrando genotipos de ciclo corto
demandan mayores esfuerzos a nivel de ensayos multiambientales que aquellos que
involucran genotipos de ciclo largo para poder realizar una evaluación confiable de
líneas experimentales.

Capacidad predictiva de los BLUPs de genotipo

En la Tabla 3.3 se muestran los porcentajes de coincidencias en la clasificación de


genotipos en tres categorías (superior, promedio e inferior) realizada mediante el
BLUP-e de un año y la clasificación del genotipo mediante el BLUP-e del año
siguiente. La coincidencia general fue de 82%. De 149 líneas clasificadas como
inferiores mediante el BLUP-e en un año particular, 5 participaron en la evaluación del
año siguiente. Esas 5 líneas no habían sido identificadas por los mejoradores como
inferiores en base a las medias de rendimiento y por ello no fueron descartados de los
ensayos. Todas las líneas clasificadas como superior por el BLUP-e obtenido desde los
ECR de un año particular, mostraron rendimientos superiores o promedio al año
siguiente, pero nunca inferiores.

61
Tabla 3.3. Genotipos correctamente clasificados al comparar predicciones de
desempeños genotípicos basados en uno y dos años de ECR (BLUP-e) con el
desempeño observado de dichos genotipos al año siguiente.

Campaña Predicciones basadas Predicciones basadas

en un año de ECR en dos años de ECR

1985/86 10/14 (71) -

1986/87 11/17 (65) 13/17 (76)

1987/88 15/17 (88) 17/17 (100)

1988/89 23/25 (92) 20/24 (83)

1989/90 19/24 (79) 19/24 (79)

1990/91 25/27 (93) 15/21 (71)

1991/92 19/24 (79) -


Entre paréntesis, expresión porcentual de la proporción de clasificación correcta

La correlación entre los BLUP-e obtenidos para cada genotipo en un año en


particular, con los BLUP-e obtenidos en el año siguiente para los mismos genotipos fue
r=0.46 (p0.0001). También hubo correlación de los BLUP-e con las medias de los
genotipos observadas en el año siguiente aunque de menor magnitud (r=0.29, p<0.001).
Aunque este valor parezca bajo, es importante considerar que la correlación máxima
esperada entre los valores predichos para el mérito de un genotipo (estimados por el
BLUP) y los valores observados a campo (estimados por la media) no es 1, sino que
depende de la heredabilidad del carácter evaluado. Esto es debido a que la correlación
del mérito genético obtenido por BLUP con el desempeño fenotípico promedio, es la
raíz cuadrada de la heredabilidad en sentido amplio (Bernardo, 1999). Las estimaciones
de componentes de varianza sugieren que la heredabilidad en sentido amplio del
carácter en estudio (rendimiento) es 0.32. Luego, la correlación máxima esperada entre
los valores BLUP-e y las medias de rendimiento es (0.32)1/2=0.56. En este trabajo la
correlación entre los BLUP-e calculados con los datos de una campaña y el desempeño
de los genotipos en el año siguiente evaluado a través de las medias fue sólo de 0.29, es
decir un 50 % de la correlación máxima esperada.

62
Bernardo (1999) plantea que una correlación entre valores predichos y valores
genéticos cercana al 60 % permitiría a los mejoradores tener una confianza del 80% de
retener el mejor genotipo si eligen el 20% de los genotipos superiores en función de
dichas predicciones. En el programa de mejoramiento de maní el porcentaje de
genotipos elegidos para ser evaluados nuevamente en el próximo año es mayor al 20%
(Tabla 3.1). Por lo tanto, la correlación obtenida entre las predicciones realizadas por el
BLUP-e para el desempeño futuro de los genotipos garantizarían la elección de los
mejores genotipos. Por el contrario, no hubo correlación entre las medias de genotipo en
un año y las medias de los mismos genotipos en el año siguiente (r= 0.02, p=0.8124).
Los resultados obtenidos al evaluar la exactitud de las predicciones basadas en datos de
solo un año de ECR sugieren que la metodología es suficientemente potente para la
elección de genotipos con comportamiento distinto al promedio.

Las predicciones logradas al utilizar datos de dos años de ECR no resultaron


mejores que las logradas a partir de datos provenientes de un solo año de ECR. Los
resultados de este trabajo cuestionan la creencia de que más de dos años de ECR
producirían mejores predicciones que aquellas basadas en un año. Comparando las
columnas de la Tabla 3.3, para los distintos años, se ve que las predicciones basadas en
dos años mostraron porcentajes de coincidencias con los rendimientos observados
iguales o levemente mayores que las predicciones basadas en un año de ECR, excepto
para las campañas 1988/89 y 1990/91. Yan y Rajcan (2003) no encuentran diferencias
entre las predicciones basadas en 2 años y las basadas en más de 2 años trabajando con
datos de soja en Canadá. Concluyen que con datos de sólo un año de ensayos se tiene
suficiente potencia para identificar genotipos de alto y bajo rendimiento. Sin embargo,
recomiendan el uso de 2 años de ensayo para tener mayor precisión.

Es importante notar que el BLUP tiene la característica de realizar un mayor


corrimiento hacia la media cuando se dispone de pocos datos para un genotipo. La base
genética del programa de mejoramiento evaluado no es amplia según sugieren las
componentes de varianzas estudiadas y por lo tanto la clasificación más probable de un
genotipo es la categoría promedio respecto a la media general. Para este tipo de
programa, el uso del BLUP representa una forma de controlar el error de seleccionar
material que verdaderamente no se diferencia del material genotipo promedio.

63
Otros autores encontraron resultados similares al comparar los valores de
predicciones BLUP con medias de genotipos estimadas desde modelos de efectos fijos
en programas de mejoramiento de soja (Panter y Allen, 1995) y en caña de azúcar
(Balzarini, 2000). Bowman (1998) usa modelos mixtos y BLUPs en distintas bases de
ECR de North Carolina y evalúa las predicciones basadas en un año versus dos años de
ensayos para cebada (Hordeum vulgare L.), maíz (Zea mays L.), arroz (Avena sativa
L.), trigo (Triticum aestivum L.), soja (Glycine max (L.) Merr.) y algodón (Gossypium
hirsutum L.). Para híbridos de maíz concluye que con datos de un año se logran buenas
predicciones y que se debieran utilizar dos años para los otros cultivos.

Conclusiones

Las varianzas genotípicas de las líneas experimentales de ciclo corto, del


programa de mejoramiento de maní de la EEA-Manfredi del INTA, son relativamente
pequeñas si se comparan con la variación residual. No sucede lo mismo para los ECR
CL, además, las líneas de ciclo largo parecieran también ser más estables o menos
dependientes de las variaciones ambientales. En los ECR CC, la interacción
genotipolocalidad fue menor que la interacción genotipoaño, sugiriendo que sería
más conveniente incrementar el número de años en los que se evalúa un mismo material
que el número de localidades en cada campaña. Una relación inversa se encontró en los
ECR de ciclo largo.

La distribución porcentual respecto a la variación total del conjunto de las fuentes


de variación analizadas sugiere que los ECR involucrando genotipos de ciclo corto
demandan mayores esfuerzos a nivel de ensayos multiambientales que aquellos que
involucran genotipos de ciclo largo para poder realizar una evaluación confiable de
líneas experimentales.

Tradicionalmente los genotipos a ser evaluados en próximos ensayos se eligen


usando sus rendimientos medios. La falta de significancia entre las correlaciones de las
medias de genotipo con el desempeño futuro de los mismos sugiere que la elección de
material basada en las medias de rendimiento no es la mejor alternativa de análisis.

64
El uso de los BLUP-e, no solo tiene en cuenta los efectos de los genotipos sino
también las componentes de varianza relacionadas a la interacción con el ambiente y a
la variabilidad genética que caracteriza al programa y la cantidad de información
disponible para cada genotipo. Las predicciones realizadas con BLUP resultan más
confiables que las basadas en medias. En programas con bases genéticas más amplias se
esperan mayores diferencias entre ambas aproximaciones.

Con predicciones basadas en un solo año de ECR se obtiene suficiente potencia


para determinar qué líneas experimentales deben seguir evaluándose y cuáles
descartarse del PMM-INTA. Si se desea mayor precisión en las estimaciones las
predicciones pueden basarse en 2 años de ECR, pero no se recomienda hacer más de dos
años de ECR para detectar genotipos de rendimiento pobre.

65
CAPÍTULO IV

EVALUACIÓN DE ENSAYOS COMPARATIVOS DE RENDIMIENTO


DE CULTIVARES DE MANÍ (ARACHIS HYPOGAEA L.)

Introducción

La evaluación de germoplasma es una actividad crucial en programas de


mejoramiento vegetal (Stroup, 2000). Los ensayos comparativos de rendimiento (ECR)
multiambientales son comúnmente conducidos cada año para obtener información que
sustente la recomendación de cultivares superiores. El objetivo principal es identificar
cultivares superiores para una región objetivo y determinar si dicha región se encuentra
subdividida en diferentes mega-ambientes para orientar mejor la estrategias de
mejoramiento (Kang, 2002). Los ECR son esenciales debido a la presencia de la
interacción GA, i.e. respuestas genotípicas diferenciales en diferentes ambientes.
Conceptos importantes tales como regiones ecológicas, ecotipos, mega-ambientes,
adaptación especifica y estabilidad se originan a partir del análisis de la interacción
GA (Yan y Hunt, 2002). La identificación de mega-ambientes se asocia con la
exploración de los patrones de la interacción GA repetibles a través de los años. Para
un mega-ambiente en particular, los genotipos son evaluados a través de los
rendimientos promedios y la estabilidad (variabilidad) de los rendimientos a través de
los ambientes que lo componen.

Los ECR de maní (Arachis hypogaea L.) denominados regionales en el Programa


de Mejoramiento de maní de la EEA-Manfredi, INTA, Córdoba, Argentina, (PMM-
INTA) se conducen en diferentes ambientes (localidades y años) e incluyen un número
variable de genotipos. Los genotipos presentes en los ensayos varían de año a año
debido a que nuevos genotipos se introducen cada año y a que otros se descartan. Por
ello, las bases de datos de ECR a través de los años son incompletas (no todos los
genotipos están en todas las combinaciones de sitios por año). Las tablas de datos de
ECR incompletas pueden analizarse utilizando modelos mixtos.

66
En la modelación de los ECR realizada en este capítulo, los efectos de genotipos
fueron considerados como fijos debido a que se refieren a un conjunto de genotipos en
etapas avanzadas de selección y los efectos de ambiente como aleatorios, excepto en los
análisis de los ECR por año donde los efectos de ambiente fueron considerados como
fijos ya que podrían asociarse con diferencias predecibles entre las localidades
intervinientes (Allard y Bradshaw, 1964). Las localidades involucradas cada año
representan ambientes característicos de la zona norte, centro y sur de la región de
cultivo de maní de la Provincia de Córdoba, Argentina, que se extiende desde 32º a 33º
50’ de latitud sur y desde 63º a 64º 35’ de longitud oeste y que produce el 95% del maní
del país. Para el análisis combinado (a través de 6 campañas) de los ECR, los ambientes
fueron definidos a partir de la combinación de efectos de localidades y años y sus
efectos tratados como variables aleatorias. Luego, los efectos de interacción GA son
aleatorios y por tanto se modeló la estructura de varianza y covarianza que los
caracteriza. Este procedimiento se realizó en el contexto de la teoría de los modelos
mixtos infiriendo sobre el desempeño de los genotipos a través de los ambientes aún
cuando las tablas de GA eran incompletas. La conceptualización de medidas de
estabilidad e interacción como parámetros de un modelo mixto proveyó un marco
teórico para la selección del estadístico de estabilidad más apropiado para estas bases de
datos. Se realizó el análisis de los ECR regionales conducidos en el PMM-INTA, en un
periodo de 6 campañas agrícolas con la finalidad de identificar los cultivares superiores
para la región de influencia del programa y analizar la posible existencia de mega-
ambientes.

Material y Métodos

Base de datos
La fuente de información utilizada comprende los ensayos comparativos de
rendimiento regionales del PMM-INTA, realizados durante las campañas agrícolas
1996/97 a 2001/02, correspondientes a los 6 primeros años de evaluación
multiambiental del programa. Los ensayos se realizaron en 10 localidades, algunas de
las cuales por su proximidad y similitud edáfica y climática fueron consideradas como

67
un mismo sitio (Tabla 4.1). En total fueron evaluados 18 genotipos, 4 de ciclo corto y
14 de ciclo largo (Tabla 4.2). El conjunto de genotipos evaluados fue el mismo para
todos los sitios dentro de cada campaña, pero la lista de genotipos en el período de
tiempo estudiado varió de campaña a campaña. Los ECR denominados regionales en el
PMM-INTA, se iniciaron en 1996 con la participación de 11 genotipos permaneciendo
sin cambios estructurales (genotipos y sitios) los dos primeros años. Durante las 4
campañas siguientes se incorporaron 7 nuevos genotipos, se dejaron de evaluar 6 y se
realizaron ensayos en nuevos sitios. Florman, mf484, mf485, mf487 y mf489 fueron los
únicos participantes evaluados durante las 6 campañas. En la Tabla 4.2 se presentan la
lista de genotipos evaluados. La base de datos de genotipocampaña (GC) es
altamente desbalanceada. En todos los sitios, el diseño experimental usado cada
campaña fue en bloques completos al azar con cuatro repeticiones. Las parcelas
experimentales fueron de dos surcos de 10 m de longitud, distanciados 70 cm uno de
otro. Para la siembra se utilizaron 15 semillas por metro lineal de surco en promedio.
Cada parcela se cosechó en su totalidad en forma manual. Los valores de rendimiento
analizados corresponden a kilogramos de grano por parcela a humedad constante (8%).
En la Tabla 4.3 se presentan los principales eventos que caracterizaron las campañas
agrícolas consideradas en el análisis.

Tabla 4.1. Sitios intervinientes en el período 1997/97 a 2001/02 en los ECR de


cultivares del Programa de Mejoramiento de Maní de la EEA-Manfredi, INTA.
Sitios (localidades) Tipo de suelo Altitud Latitud Longitud
m.s.n.m Sur Oeste

Sitio 1 (General Deheza y franco- 325 32º44´ 63º45´


General Cabrera) francoarenoso
Sitio 2 (Manfredi) franco-limoso 300 31º50´ 63º44´
Sitio 3 (Santa Eufemia) franco-arenoso fino 250 33º12´ 63º17´
Sitio 4 (El sur, San Ambrosio, Las franco-arenoso fino 330 32º48´ 64º25´
Vertientes, Reducción, las
acequias)
Sitio 5 (Gigena) franco-arenoso 450 32º44´ 64º17´

68
Tabla 4.2. Genotipos presentes en los ECR de cultivares del Programa de Mejoramiento
de Maní de la EEA-Manfredi, INTA en las campañas agrícolas 1996/97 a la 2001/02.
Genotipo Ciclo 1 Parentesco 2
Manf393 C Robut 33-1 / NC Ac 2698
Mf447 C Florman / Manfredi Virginia 5
Mf478 C MGS 9 / NC Ac 2232
Mf480 C CS 9 / ICGS 5
Florman L Selección de Florunner
Mf457 L Florman / Tachimasari
Mf484 L Florman / Marc 1 
Mf485 L Florman / Marc 1 
Mf486 L Florman / Marc 1
Mf487 L Florman / Marc 1
Mf489 L Florman / Marc 1
Mf496 L Florman / (Mf321 / RCM 1451)
Mf499 L Florman *2 / Colorado Irradiado
Mf505 L Florman / F435-2-3-B-2-1-b4-B-3-b3-1-B
Mf506 L Florman / F435-2-3-B-2-1-b4-B-3-b3-1-B
Mf508 L Florman / F435-2-3-B-2-1-b4-B-3-b3-1-B
Mf510 L Florman / F435-2-3-B-2-1-b4-B-3-b3-1-B
Tegua L Selección de Florunner
1: C=ciclo corto; L=ciclo largo. 2: *=cruzamiento, / indica separación de padres, = sus pedigree trazan hasta una
misma planta F1

Tabla 4.3. Principales eventos que caracterizaron las campañas agrícolas 1996/97 a la
2001/02 en los sitios en que se condujeron los ECR del Programa de Mejoramiento de
Maní de la EEA-Manfredi, INTA.
Campaña Eventos
1996/97 Precipitación baja
1997/98 Cosecha tardía (principalmente en Manfredi). Ataque de Sclerotinia
(Sclerotinia sclerotiorum y Sclerotinia minor) en General Deheza
1998/99 Precipitación baja durante el ciclo de cultivo y alta a cosecha. Heladas
tempranas.
1999/00 Precipitación baja en etapa reproductiva. Cosecha tardía
2000/01 Precipitación baja (excepto en Manfredi). Cosecha tardía
2001/02 Precipitación baja en etapas tardías en Sta. Eufemia y Cabrera.

69
Modelación estadística

Análisis de los ECR por campaña agrícola

Considerando a los sitios como las unidades básicas de mega-ambientes y dado


que las tablas de datos de genotipo×año y sitio×año son altamente desbalanceadas, en
una primera etapa se exploró la interacción genotipositio (GS) desde los ECR anuales
(tablas de datos completas). Para cada campaña se ajustó un modelo de efectos fijos
incluyendo efectos de sitios y genotipos:

yijk =  + Sj + B(S) k(j) + Gi + GS(ij)+ ijk (4.1)

donde yijk es el rendimiento del genotipo i, en el sitio j, bloque k;  es la media general;


Sj es el efecto del sitio j con j=1,…,s; B(S)k(j) es el efecto del bloque k dentro del sitio j
con k=1,...,n; Gi es el efecto del genotipo i con i=1,...,g; GS(ij) es el efecto de la
interacción del genotipo i con el sitio j y ijk es el término de error aleatorio asociado a la
observación yijk. Se ajustó el modelo suponiendo varianzas residuales homogéneas y el
modelo de varianzas residuales heterogéneas según los distintos niveles del factor sitio.
Este último modelo fue evaluado debido a que los ensayos realizados en distintas
localidades podrían tener distinta precisión.

Para cada campaña, la comparación del desempeño de los genotipos a través de


los ambientes (inferencia amplia) se basó en las medias de los genotipos (prueba LSD).
Por considerar un modelo de efectos fijos, los errores estándares de diferencias de
medias dependieron sólo de la varianza residual. Las inferencias sobre un genotipo en
un determinado ambiente (inferencia ambiente-específica) se estimaron a través de
medias genotípicas por ambiente. Se usaron gráficos biplot simétricos (Gabriel, 1971)
para analizar patrones de interacción GS asociados al modelo de efectos principales e
interacción multiplicativa (Additive Main Effects and Multiplicative Interaction,
AMMI, Gauch, 1988) y al modelo de regresión por sitio (SREG) (Cornelius et al.,
1996). El algoritmo para la construcción de los biplot se basó en la descomposición por
valor singular de una matriz de residuos. Los biplot para el modelo AMMI se
construyeron desde la matriz de residuos del modelo aditivo, i.e. la ecuación (4.1) sin el
efecto de interacción GS. Los biplot del modelo SREG, conocidos como GGE biplot

70
(Yan et al., 2000), se construyeron a partir de la matriz de residuos correspondientes al
ajuste de la ecuación (4.1) sin G ni GS. Para los datos de cada año se obtuvieron
gráficos de dispersión de los rendimientos promedio de cada genotipo (eje X) y una
medida de estabilidad (eje Y). Como medidas de estabilidad se utilizaron
alternativamente: 1) el CV (Francis y Kannenberg, 1978) por ser el estadístico
tradicionalmente usado en el programa, 2) varianza de estabilidad de Shukla (Shukla
1972), 3) la primera componente principal (CP1) del análisis del modelo AMMI y 4) la
primera y/o segunda componente principal (CP1 y CP2) del modelo SREG.

Análisis simultáneo de los ECR de los genotipos contenidos en seis campañas

agrícolas

Para el análisis de los ECR conducidos durante las seis campañas se usó un
modelo a dos vías de clasificación, ambiente y genotipo, definiendo los distintos niveles
del efecto de ambiente en función de las combinaciones de los sitios y campañas
intervinientes. Todos los efectos de los factores usados en la modelación fueron
considerados como aleatorios excepto los de genotipo. La ecuación del modelo para la
respuesta del genotipo i en el bloque k del ambiente j fue:

yijk =  + Gi + Aj + GAij + B(A) K(j) + ijk (4.2)

donde yijk es la respuesta en el genotipo i, ambiente j y bloque k,  es la media general,


Gi es el efecto fijo del genotipo i, Aj es el efecto aleatorio del ambiente j, GAij es el
efecto aleatorio de la interacción del genotipo i con el ambiente j, B(A)k(j) es el efecto
del bloque k dentro del ambiente j, ijk es el término de error aleatorio asociado a la
observación yijk.

La estimación del efecto general de un genotipo (inferencia amplia) se basó en las


medias de genotipos, pero los errores estándares de diferencias de medias dependieron
del modelo usado para la varianza de los promedios de genotipo, el cual incluye
componentes de varianza asociadas con la interacción GA. Así, en la comparación
estadística de los genotipos, bajo el modelo mixto, no sólo se tiene en cuenta la
diferencia de rendimientos sino también la estabilidad de los rendimientos a través de
los ambientes. Las componentes de varianza involucradas en los modelos mixtos

71
ajustados fueron estimadas por máxima verosimilitud restringida (REML) usando
PROC MIXED de SAS (SAS Institute, 1997).

Se probaron distintos modelos para la matriz de varianza y covarianza de los


términos aleatorios de interacción para un ambiente dado: 1) modelo mixto tradicional
(Ecuación (4.2)) suponiendo componentes de varianza homocedásticas para los
términos aleatorios de interacción GA, 2) modelo mixto análogo a la Ecuación (4.2)
considerando independencia y varianza heteroscedástica a través de genotipos para los
términos de interacción GA y 3) modelo AMMI mixto. El modelo AMMI mixto se
m
expresó como: yijk    Gi  Aj  B( A)k ( j )   k  ik kj   ijk , donde yijk es la respuesta
k 1

del genotipo i, en el ambiente j y bloque k,  es la media general, Gi es el efecto fijo del


m
genotipo i, Aj es el efecto aleatorio del ambiente j, y  
k 1
k ik akj modeló la interacción

GA como la suma de componentes multiplicativas que explican la interacción GA en


m direcciones ortogonales. En cada dirección intervienen scores fijos de genotipo (  ik )

y aleatorios de ambiente ( akj ); k es un factor de peso asociado a cada dirección;

 ijk representa la porción de la interacción GAij no explicada por el modelo más el


término de error aleatorio asociado a yijk.

Utilizando para modelar la matriz de varianzas y covarianzas de los términos de


interacción GA dentro de cada ambiente, la estructura factor analytic homocedástica
(FA1) (Jennrich y Schluchter, 1986) los parámetros de covarianza fueron usados como
scores de genotipo (sensibilidades genotípicas) para explicar la interacción GA. En
este trabajo se ajustaron estructuras FA1 de orden 1, 2 y 3 correspondientes a modelos
AMMI con m=1, m=2 y m=3 términos multiplicativos respectivamente. La selección de
la parametrización más conveniente para modelar la interacción GA se realizó a través
de pruebas del cociente de máxima verosimilitud, el criterio de información de Akaike
(AIC) y el criterio bayesiano de Schwarz (BIC) (Litell, et al., 1996). Los gráficos
biplots asociados al análisis bajo un modelo AMMI mixto (AMMI biplot) se obtuvieron
graficando los parámetros de covarianza (estandarizados) asociados con cada genotipo

72
en cada término multiplicativo versus el BLUP empírico del efecto ambiental sobre el
mismo término usando una macro SAS (Balzarini, 2000).

Resultados y Discusión

Análisis de los ECR por campaña agrícola


El modelo con varianzas residuales heterogéneas a través de los sitios ajustó
mejor que el modelo de varianzas homogéneas en 4 de las 6 campañas analizadas. Los
criterios de información de Akaike (AIC) y de Schwarz (BIC) (expresados de manera
tal que un mayor valor implica mejor ajuste) fueron coincidentes con la prueba de
cociente de verosimilitud en identificar las campañas con diferente precisión de los
ensayos conducidos en los diferentes sitios (Tabla 4.4).

Tabla 4.4. Criterios de información para el modelo básico de ECR de efectos fijos con y
sin heterogeneidad de varianzas residual a través de los sitios.
Varianzas residuales Varianzas residuales
Campaña Mejor
homogéneas heterogéneas
modelo
(VRHo) (VRHe)

AIC BIC -2Log(verosimilitud) AIC BIC -2Log(verosimilitud)

1996/97 -96.3 -97.5 190.6 -84.1 -88.5 162.3 VRHe

1997/98 -70.0 -71.2 138.0 -68.8 -73.2 131.7 VRHe

1998/99 -129.9 -131.4 257.7 -132.4 -141.0 254.8 VRHo

1999/00 -109.7 -111.2 217.5 -104.0 -110.6 200.1 VRHe

2000/01 -60.3 -61.7 118.6 -46.6 -53.1 85.2 VRHe

2001/02 -113.4 -114.9 224.8 -115.2 -121.8 225.5 VRHo

En la Tabla 4.5 se presentan los análisis de varianza para cada año de ECR
realizados con los modelos sugeridos en la Tabla 4.4. En todas las campañas agrícolas
analizadas excepto en la campaña 1996/97, la interacción GS fue estadísticamente
significativa. Los ECR regionales del PMM-INTA, se comenzaron justamente en 1996,
campaña en la cual la varianza residual fue la más alta. Esta menor precisión de los

73
ensayos podría enmascarar la presencia de interacción GS. En la Tabla 4.5 se visualiza
la magnitud relativa de la interacción GS respecto a la variabilidad explicada por
(G+S+GS) para cada campaña. La variación debida a la interacción GS fue menor a
la variación entre genotipos en 2 de los 6 años de ECR. La variación entre sitios fue
siempre la más importante, explicando entre un 74.9% y un 96% de la variación total, lo
cual justifica la selección de los biplot basados en el modelo SREG para el análisis de
los ECR (Yan et al., 2000).

Tabla 4.5. Variabilidad de rendimientos entre genotipos (G), sitios (S) e interacción
GS para ECR de maní de la EEA-Manfredi, INTA, para las campañas 1996/97 a
2001/02.
Campaña Fuente GL SC Significancia % (G+S+GS)
1996/97 S 2 77.83 <0.0001 85.8
G 10 6.91 0.0038 7.6
GS 20 6.03 0.2340 6.6
B(S) 9 9.33 <0.0001
1997/98 S 2 112.96 <0.0001 74.9
G 10 6.35 <0.0001 4.2
GS 20 31.45 <0.0001 20.8
B(S) 9 6.29 <0.0001
1998/99 S 4 173.78 <0.0001 90.0
G 11 6.29 <0.0001 3.2
GS 44 12.83 0.0026 6.7
B(S) 14 7.23 0.0001
1999/00 S 3 269.32 <0.0001 86.7
G 11 21.71 <0.0001 7.0
GS 33 19.66 <0.0001 6.3
B(S) 12 6.52 0.0001
2000/01 S 3 191.50 <0.0001 96.0
G 11 2.10 0.0043 1.0
GS 33 5.96 0.0001 3.0
B(S) 12 5.60 <0.0001
2001/02 S 3 169.76 <0.0001 81.5
G 11 18.14 <0.0001 8.7
GS 33 20.28 <0.0001 9.8
B(S) 12 8.10 <0.0001
GL=grados de libertad; SC=suma de cuadrados; significancia=valor p.

74
Las dos primeras componentes principales (CP1 y CP2) obtenidas por la
descomposición por valor singular de los datos centrados por efectos de sitio (modelo
SREG) explicaron más del 85% del total de la variabilidad debida a (G+GS) en todas
las campañas, excepto en la 1998/99 y 2000/01, donde estos porcentajes fueron 79% y
83% respectivamente. En la Fig. 4.1 se presentan los GGE biplots obtenidos para cada
año de ECR.

En la campaña 96/97 (Fig. 4.1.A) hubo una alta correlación de la CP1 (r=0.98,
p<0.0001) y baja correlación de la CP2 (r=0.15, p<0.641) del GGE biplot con los
rendimientos. Luego, los genotipos extremos sobre el eje de la CP1, mf478 (CP1
positiva) y Florman (CP1 negativa), no muestran interacción con cambio de rango; estos
fueron aquellos genotipos de mayor y menor ranking respectivamente (Anexo 1). La
interacción GS no fue significativa y todos los sitios se comportaron como un único
mega-ambiente donde se evidenciaron alguna ventajas de los cultivares de ciclo corto
respecto a los de ciclo largo debidas posiblemente a las bajas precipitaciones registradas
durante la campaña. Los genotipos mf487 y mf489 (CP2 positiva) y el genotipo mf480
(CP2 negativa) fueron los únicos donde se evidenció una respuesta diferencial,
interacción con cambio de rango (CCR), a través de los ambientes.

En la campaña 1997/98 (Fig. 4.1.B) los rendimientos de los testigos de ciclo largo
fueron relativamente altos y homogéneos a través de los ambientes, mostrando ventajas
respecto a los otros genotipos en el Sitio 2, que fue donde se realizó la cosecha en época
más tardía. Los genotipos mf485 y mf484 mostraron alta interacción con cambio de
rango con un desempeño relativo superior en el Sitio 4 y con los menores rankings en el
Sitio 1. Un comportamiento opuesto mostraron los genotipos mf480 y mf457, con
desempeños relativamente altos en el Sitio 1, donde durante esta campaña el cultivo
estuvo sometido a fuerte estrés por ataque de Sclerotinia minor Jaegger. En esta
campaña el rendimiento no correlacionó con la CP1 (r=0.062; p=0.857). Por ello, los
genotipos con mayores proyecciones sobre la CP1 (mf485, mf484, mf457 y mf480) son
aquellos que mostraron interacción con cambio de rango, mientras que Tegua, Florman
y mf480, genotipos con mayores proyecciones positivas sobre CP2, fueron los que se
desempeñaron relativamente mejor a los restantes durante la campaña. Esta fue la única

75
A B
3.5 3.5

sitio4
sitio2

sitio1
2.0 2.0

mf487
mf487
mf489mf489 Tegua
mf480
mf485 manf393 Florman
CP 2

CP 2
0.5 0.5 manf393
mf478 mf487
mf447 mf484
mf478
Tegua
sitio4
mf484 sitio1 mf447
Florman
-1.0 mf457
mf457 mf485
-1.0 mf457 mf489
sitio2
mf480
mf480

-2.5
-2.5
-3 -2 -1 0 1 2 3
-3.0 -2.0 -1.0 0.0 1.0 2.0 3.0
CP 1
CP 1

CP1=59%, CP2=33% CP1=77%, CP2=17%


C D
3.5 3.5
sitio1

sitio2

mf484
2.0 sitio2
2.0 mf484
manf393
mf447 manf393 sitio5

sitio4
Tegua mf485
CP 2

CP 2

0.5 0.5 mf505


sitio4 mf447
mf478
Florman mf478 mf506
sitio3 mf489
mf480 mf487
mf485 mf489 mf487 mf506
-1.0 mf480
-1.0
mf505 Tegua Florman
sitio1

sitio3

-2.5
-2.5
-3.0 -2.0 -1.0 0.0 1.0 2.0 3.0
-3.0 -2.0 -1.0 0.0 1.0 2.0 3.0
CP 1
CP 1

CP1=58%, CP2=21% CP1=61%, CP2=26%


E F
3.5 3.5
sitio1 sitio1

2.0 2.0
mf484 mf484

sitio3 sitio3
mf506 sitio2 mf506 sitio2
Florman Florman
CP 2

CP 2

0.5 0.5
mf489 sitio4 mf489 sitio4
mf485 mf508 mf508
mf485
mf499 mf505 mf486 mf505 mf486
mf499
mf487 mf487
mf510 mf510
-1.0 -1.0

mf496 mf496

-2.5
-2.5
-3.0 -2.0 -1.0 0.0 1.0 2.0 3.0
-3.0 -2.0 -1.0 0.0 1.0 2.0 3.0
CP 1
CP 1

CP1=55%, CP2=28% CP1=54%, CP2=31%


Fig. 4.1. GGE biplots basados en 6 años de ECR del Programa de Mejoramiento de maní
de la EEA-Manfredi, INTA. Puntos oscuros representan genotipos y puntos claros sitios.
A, B, C, D, E y F, años 96/97, 97/98, 98/99, 99/00, 00/01, 00/02 respectivamente.

76
campaña donde la interacción GS explicó un mayor porcentaje de (G+S+GS) que G.
Si bien este resultado podría sugerir la posible existencia de diferentes mega-ambientes
en la región objetivo del PMM-INTA, es importante notar que el patrón observado no
fue consistente a través de los años y que durante la campaña hubo severos problemas
con Sclerotinia en el Sitio 1, que se evaluaron cultivares de ciclo corto y de ciclo largo,
y que la cosecha en todos los ECR principalmente en el Sitio 2 fue relativamente tardía.
Las contingencias particulares de los ECR en esta campaña, que favorecieron una
respuesta diferencial de los genotipos evaluados, estuvieron más asociadas al factor
campaña que al factor sitio.

En la campaña 1998/99 (Fig. 4.1.C) la correlación de la CP1 con el rendimiento


fue de 0.89 (p=<0.0001). Los genotipos con mayores valores de CP1 fueron mf505 y
mf484 (ciclo largo), ambos con ranking de los más altos en la mayoría de los sitios,
excepto el Sitio 2. Los cultivares de ciclo corto, mf447 y mf480 (CP1 negativa)
mostraron desempeños relativamente pobres excepto para el Sitio 2. La precipitación
fue baja durante el ciclo de cultivo y alta a cosecha, lo que podría explicar el desempeño
diferencial de los cultivares de ciclo corto. Las diferencias de las respuestas de los
genotipos a través de los ambientes fueron menores que las diferencias en las respuestas
promedios de los genotipos por lo que no se consideró que la conFig.ción observada
sugiriera la presencia de mega-ambientes. En esta campaña para el genotipo mf505, el
Sitio 4 resultó más favorable que el Sitio 2. Sin embargo, en la campaña siguiente (Fig.
4.1.D) el genotipo mf505 mostró ventajas relativas a los otros genotipos tanto en el Sitio
4 como en el 2. Los genotipos restantes se agrupan en un único mega-ambiente donde
los genotipos de ciclo corto mf447, mf480 y manf393 fueron los de peor desempeño a
través de todos los sitios.

En la campaña 2000/01 (Fig. 4.1.E) la contribución de la interacción GS fue


aproximadamente igual a la variabilidad entre genotipos y el rendimiento correlacionó
significativamente (p<0.05) tanto con la CP1 como con la CP2, lo que sugiere que las
proyecciones sobre CP2 no indican necesariamente interacción CCR. Los genotipos
extremos en sus proyecciones sobre la CP1, mf508, Florman y mf487, fueron los que
mostraron mayor interacción CCR. Los ranking de Florman y mf487 fueron
relativamente más altos en el Sitio 1 que en los restantes, comportamiento opuesto a

77
mf508. Los genotipos mf484 y mf496 con valores de CP2 opuestos respondieron
proporcionalmente a las diferencias entre sitios con ranking altos y bajos,
respectivamente.

En la campaña 2001/02 (Fig. 4.1.F) la variabilidad entre genotipos fue bastante


mayor que la interacción GS y los rendimientos correlacionaron significativamente
con CP1 (r=0.95, p<0.0001). Los genotipos mf484, mf505 y mf489 fueron los que
mejor se desempeñaron en los Sitios 2, 3 y 4, mientras que Florman y mf487 mostraron
ventajas en el Sitio 1. Los genotipos mf508 y mf496 fueron los de peor desempeño. La
separación del Sitio 1 respecto al resto, donde sólo Florman y mf487 mostraron
rendimientos relativamente altos, podría deberse a respuesta diferencial combinada a
factores tales como lluvias escasas durante el llenado de granos y desprendimiento de
frutos frente a altas precipitaciones registradas a cosecha en ese sitio. En el Sitio 3 las
precipitaciones también fueron bajas pero las diferencias entre los rendimientos de los
genotipos fue menor ya que se registró un rendimiento bajo en todos los genotipos.

En la Fig. 4.2 se compara, utilizando el GGE biplot de la campaña 1997/98, donde


la contribución de GS fue mayor que la de G, el desempeño del genotipo mf480
(genotipo de ciclo corto) respecto al genotipos mf489 (de ciclo largo) a través de los 3
sitios. La comparación se realizó conectando, a través de una línea recta, el punto que
representa el genotipo mf480 con el punto que representa al genotipo 489 y dibujando
una línea perpendicular que pasa a través del origen (Yan y Hunt, 2002). La
perpendicular separa las localidades en 2 grupos que muestran que el genotipo mf480
presentó rendimientos relativamente mayores al genotipo mf489 en el Sitio 1, mientras
que para el genotipo mf489 el sitio mas favorable fue el sitio 4 seguido por el sitio 2,
aunque en este último los rendimientos están apenas por encima del promedio. Si se
comparan de esta forma el mf480 (ciclo corto) con los genotipos mf485, mf484, mf487
y Florman (todos de ciclo largo), se llega a la conclusión de que el sito 4 y el sitio 2
favorecen a estos últimos.

78
3.5

sitio2

sitio1
2.0

mf480 Florman Tegua


CP 2

0.5 mf487
manf393
mf484

mf478 sitio4
mf447
mf485
-1.0 mf457 mf489

-2.5
-3.0 -2.0 -1.0 0.0 1.0 2.0 3.0
CP 1

Fig. 4.2. Comparación del desempeño de genotipos de ciclo


corto y largo en todas las localidades intervinientes en ECR
durante la campaña 1997/98. Puntos oscuros representan
genotipos y puntos claros sitios.

El análisis colectivo de los 6 GGE biplot más este resultado eventual observado en
la Fig. 4.2, sugiere que si bien la región manisera para la cual se prueban cultivares es
muy homogénea en característica de suelo y clima como para considerar la presencia de
mega-ambientes para el PMM-INTA, la mejora respecto a resistencia a patógenos como
Sclerotinia debiera realizarse promoviendo diferentes condiciones ambientales para
explotar la variabilidad genética del material evaluado.

En la Tabla 4.6 se presentan, para cada una de las campañas analizadas, los
rendimientos promedios de los genotipos más el CV y la CP1 del modelo AMMI como
estadísticos de estabilidad. Aunque la interpretación simultánea del CV y el rendimiento
promedio constituye la estrategia de análisis de ECR tradicionalmente utilizada en el
programa, los resultados muestran que el CV podría conducir a recomendar genotipos
con bajo desempeño. Por ejemplo, en la campaña 1996/97, el genotipo mf480 tiene un
CV bajo, y sin embargo, es un fuerte contribuyente a la interacción GS. En el Sitio 1
tuvo ranking 11 mientras que en el Sitio 4 tuvo ranking 3. Algo similar ocurre en la
campaña 1997/98 donde a pesar de que los ranking de este genotipo pasaron de 11 a 1
entre ambientes, mf480 mostró el CV más bajo.

79
Tabla 4.6. Rendimientos promedios y medidas de estabilidad para cada uno de los
genotipos participantes en los ECR del Programa de Mejoramiento de Maní de la EEA-
Manfredi, INTA para 6 campañas agrícolas.
Campaña 1996/97 Campaña 1997/98 Campaña 1998/99
Genotipo Media CV CP1 Genotipo Media CV CP1 Genotipo Media CV CP1
mf478 2.24 a 45.70 0.21 Florman 3.18 a 33.48 0.17 mf484 2.96 a 25.51 1.28

manf393 2.03 ab 54.64 1.03 Tegua 3.16 ab 34.42 -0.10 mf505 2.84 ab 38.17 3.23

mf447 1.94 ab 53.31 -0.19 mf480 2.97 abc 15.88 3.14 mf489 2.82 ab 39.95 1.44

mf457 1.88 abc 41.57 -1.21 mf487 2.90 abcd 46.98 -0.69 manf393 2.79 abc 29.07 0.29

mf484 1.87 abc 42.72 -1.09 mf484 2.86 cdef 59.20 -1.60 mf506 2.78 abc 35.46 1.41

mf480 1.85 abc 32.20 -1.89 mf457 2.69 cdef 41.39 1.87 mf478 2.67 bcd 41.35 -0.41

mf489 1.85 bc 65.18 1.73 manf393 2.68 def 37.82 -0.11 mf447 2.61 bcde 36.25 -1.97

mf487 1.76 bcd 70.35 1.74 mf478 2.68 def 27.71 1.27 Tegua 2.58 bcde 46.52 -1.96

mf485 1.66 bcd 70.71 1.65 mf485 2.65 def 73.83 -2.25 Florman 2.53 cde 48.03 -1.36

Tegua 1.51 cd 53.57 -0.62 mf447 2.57 ef 49.55 -0.46 mf487 2.49 de 42.23 -0.81

Florman 1.36 d 51.84 -1.37 mf489 2.49 f 63.71 -1.24 mf485 2.44 e 32.94 0.16

mf480 2.39 e 41.42 -1.29

LSD=0.398 LSD=0.297 LSD=0.252

Campaña 1999/00 Campaña 2000/01 Campaña 2001/02


Genotipo Media CV CP1 Genotipo Media CV CP1 Genotipo Media CV CP1
mf505 3.39 a 44.25 -0.98 mf484 2.00 a 59.22 0.13 mf484 3.53 a 42.35 0.22

mf484 3.34 ab 45.36 -2.74 mf508 1.94 ab 65.76 -2.22 mf489 3.17 b 39.64 -1.60

Florman 3.30 abc 46.04 1.01 mf506 1.93 ab 60.36 0.39 mf505 3.13 b 36.90 -2.13

mf489 3.17 abc 37.08 0.61 mf485 1.89 abc 69.43 -1.31 mf485 3.04 bc 44.23 -0.56

mf485 3.15 abc 51.43 -1.40 mf486 1.83 abcd 59.52 -1.47 Florman 2.93 bcd 40.01 2.57

Tegua 3.09 bc 45.99 1.00 mf505 1.82 abcde 61.96 -0.20 mf506 2.81 cd 37.93 -0.62

mf506 3.09 bc 51.23 0.61 mf510 1.77 bcde 58.84 0.18 mf486 2.77 cd 31.61 0.21

mf487 3.04 c 54.52 0.80 Florman 1.77 bcde 71.35 2.02 mf487 2.76 cd 31.65 1.86

mf478 3.03 c 39.21 0.00 mf489 1.76 bcde 63.96 1.01 mf499 2.72 de 45.29 0.11

manf393 2.71 d 49.24 -1.78 mf499 1.71 cde 68.33 1.37 mf510 2.69 de 35.15 1.00

mf447 2.42 e 51.60 0.17 mf487 1.69 de 68.25 1.91 mf508 2.48 ef 40.98 0.23

mf480 2.29 e 47.67 2.70 mf496 1.64 e 68.52 -1.82 mf496 2.35 f 50.32 -1.29
LSD=0.273 LSD=0.188 LSD=0.281
Letras diferentes indican diferencias en los rendimientos promedio a través de los sitios (LSD, p<0.05).

La utilización de la CP1 del modelo AMMI como medida de estabilidad permitió


identificar mejor a los cultivares con ranking diferenciales a través de los ambientes. Se
evalúan los desempeños genotípicos usando una prueba LSD para comparar los
rendimientos promedios, a través de los sitios, en cada campaña. El genotipo mf484
estuvo entre los superiores en 5 de las 6 campañas y el genotipo mf505 en 3 de las 4
campañas en las que estuvo presente.

80
Análisis simultáneo de los ECR de seis campañas agrícolas
Los ambientes (combinación de años y sitios) constituyeron la fuente de variación
más importante (90,5% de la variación total). La alta variación de los rendimientos
debida a diferencias entre ambientes es esperable en ECR conducidos a través de varias
campañas (Yan y Kang, 2003). La interacción GA fue considerablemente mayor a la
variabilidad entre genotipos y más de 50% de dicha variación se debió a la interacción
GSC (Tabla 4.7). La interacción GS sólo representa un 23,9% de la interacción
GA.

Tabla 4.7. Componentes de varianza de rendimientos para genotipos (G), ambientes (A)
e interacción GA para ECR de maní de la EEA-Manfredi, INTA. Análisis conjunto de
las campañas agrícolas 1996/97 a 2001/02.
Componente Varianza Porcentaje
Ambiente 1.1813 90.5
Genotipo 0.0137 1.0
GA 0.1100 8.5
Genotipositio 0.029 23.9
Genotipoaño 0.026 21.5
Genotipoañositio 0.066 54.6

Residual 0.1489

En la Tabla 4.8 se presentan los valores de los estadísticos que se utilizaron para
seleccionar entre los modelos mixtos de datos de ECR que se ajustaron: 1) modelo con
varianza GA homogénea, 2) modelo con varianza GA heterogénea a través de los
genotipos y 3) modelo AMMI mixto. Todos lo criterios de ajuste llevaron a seleccionar
el modelo AMMI mixto con 2 términos multiplicativos (AMMI (2)). El modelo de
componentes de varianza diferentes a través de los genotipos (varianza de estabilidad)
proveyó un mejor ajuste para los datos de ECR que aquel que modela la variabilidad
debida a la interacción GA con una única componente de varianza (modelo mixto
tradicional o interacción GA homogénea) (prueba del cociente de verosimilitud,
p<0.05).

81
Tabla 4.8. Criterios de bondad de ajuste para 3 modelos mixtos ajustados a los datos de
ECR de maní de la EEA-Manfredi, INTA. Análisis conjunto de las campañas 1996/97 a
2001/02.

Criterio de ajuste GA GA heterogénea AMMI (2)


homogénea por genotipo

AIC -802.3 -799.2 -765.1

BIC -804.3 -810.0 -787.3

-2 log(verosimilitud) 1596.1 1560.4 1452.2

# de parámetros de covarianza GA 1 18 36

Valor p (igualdad de promedios) 0.0027 0.0017 <0.0001

El biplot de la Fig. 4.3, obtenido a partir del modelo AMMI mixto, fue utilizado
para explorar la interacción GA considerando los ECR de las 6 campañas agrícolas
simultáneamente. Los genotipos mf480 y Florman fueron aquellos de mayor
contribución en la interacción GA, el primero con importantes cambios de rango entre
los ambientes 1 y 4. Florman respondió proporcionalmente a las diferencias entre ambos
ambientes en la mayoría de las campañas analizadas. La dispersión de los scores de
ambiente, si bien evidencia una alta interacción entre campañas y sitios, muestra
también que el Sitio 1 fue uno de los mayores contribuidores a la interacción GA,
especialmente en la campaña 1997/98 debido a que los genotipos mf480 y mf457 se
desempeñaron en este sitio mejor que en otros.

El patrón general de interacción GA difícilmente sea repetible ya que no se


visualizan agrupamientos entre los scores de ambientes provenientes de un mismo sitio.
Descontando aquellos ambientes donde se produjeron eventos en algunos sitios, la
interacción GS es pequeña en relación a la interacción GSC. Los restantes sitios
debieran considerarse como un único mega-ambiente a los fines del mejoramiento.

En la Fig. 4.4 se presenta un gráfico de dispersión del producto de los scores de


genotipo en la dimensión 1 y 2 del modelo AMMI (2), producto utilizado como medida

82
de estabilidad, versus los rendimientos promedios de cada genotipo. Se visualiza que los
genotipos Florman, mf480 y mf457 fueron los de menor estabilidad. Los genotipos
mf484 y mf505 tuvieron el mejor desempeño a través de todos los ambientes. En la
Tabla 4.9 se presentan los rendimientos de los genotipos para cada uno de los 23
ambientes considerados en el análisis.

2.5

02-1

2.0
mf480 00-3

1.5
mf457
00-4
Componente multiplicativo 2 (GxA)

mf508 98-4
1.0 mf447 manf393
mf478 mf496
98-1 00-1
01-1 98-2
0.5 99-3
mf486
mf510
99-1 02-2
0.0

02-4
-0.5 99-2 99-4 mf489
97-1 mf506 00-2
01-4 mf499 02-3 mf484

-1.0 mf487 99-5 mf505


Tegua 97-2 97-4
01-2 mf485

Florman
01-3
-1.5

-2.0
-3.0 -2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5
Componente multiplicativo 1 (GxA)

Fig. 4.3. Biplot basado en 6 años de ECR del Programa de Mejoramiento de Maní de la
EEA-Manfredi, INTA. Puntos oscuros representan genotipos y puntos claros ambientes
codificados según año de cosecha-sitio.

En la Tabla 4.10 se presentan los promedios de rendimientos a través de todos los


ambientes y los errores estándares utilizados para evaluar las significancia estadística de
las diferencias obtenidos a partir del modelo mixto AMMI (2). Estos errores dependen
de la cantidad de información disponible para cada genotipo a través de la colección de
ECR analizados y de la contribución de los mismos en la explicación de la interacción
GA (Balzarini, 2000). Además, se presentan el coeficiente de variación (CV) de los
rendimientos a través de los ambientes y las varianzas de estabilidad (VE) para cada
genotipo obtenidas mediante el modelo mixto con componentes de varianzas de la

83
4.00 mf480

Florman

3.00

2.00
Estabilidad de rendimientos

mf457

1.00 mf485 mf505


mf478 mf484
mf489
mf510 mf447
mf499 mf508 mf486 mf506
0.00
manf393
mf496
mf487

-1.00 Tegua

-2.00
2.00 2.25 2.50 2.75 3.00
Rendimientos promedio (kg/parcela)

Fig. 4.4. Estabilidad versus rendimientos en ECR del Programa de Mejoramiento de


Maní de la EEA-Manfredi, INTA. Medida de estabilidad=producto de los scores de
genotipo en la dimensión 1 y 2 del modelo mixto AMMI (2).

interacción heterogéneas a través de genotipos (medida de estabilidad equivalente a la


propuesta por Shukla (1972) para tablas de datos completas). Las componentes de
varianza de estabilidad de los genotipos mf480, mf457, mf484, Florman, mf447 y
manf393 fueron significativamente distintas de cero (p<0.05).

Las principales diferencias en estabilidad de los rendimientos a través de los


ambientes se observaron en los genotipos mf480 , mf457, mf484 y Florman según la
varianza de estabilidad, consistente con lo observado en los gráficos biplot mixtos. El
coeficiente de variación falla en identificar como inestables genotipos que mostraron
interacción con los ambientes relativamente grande como mf480, mf478, manf393 y
mf447, todos estos cultivares de ciclo corto. El cultivar de mejor respuesta promedio a
través de los ambientes, considerando en este juicio la variabilidad de su respuesta a
través de los mismos, fue mf484.

84
Tabla 4.9. Rendimientos (kg/parcela)  error estándar de genotipos participantes en los ECR del Programa de Mejoramiento de Maní de la EEA-
Manfredi, INTA en 23 ambientes (campañassitio)
Campaña 1996/97 Campaña 1997/98 Campaña 1998/99 Campaña 1999/00 Campaña 2000/01 Campaña 2001/02

Sitios S1 S2 S4 S1 S2 S4 S1 S2 S3 S4 S5 S1 S2 S3 S4 S1 S2 S3 S4 S1 S2 S3 S4

Florman 0.800.36 1.130.53 2.160.43 2.170.46 3.080.64 4.290.39 2.430.40 2.810.31 4.390.58 1.820.56 1.180.10 2.710.27 1.740.10 3.411.11 5.330.43 2.590.32 3.060.29 1.010.34 0.410.13 3.230.21 4.120.44 1.310.55 3.060.80

Tegua 0.960.32 1.140.60 2.440.24 2.040.80 3.220.50 4.210.22 2.580.20 2.880.52 4.400.26 1.710.34 1.320.40 2.260.07 1.730.30 3.450.25 4.930.43

manf393 1.240.25 1.550.31 3.300.97 1.570.28 2.900.37 3.550.37 2.470.31 2.960.29 4.130.40 2.160.44 2.240.43 1.770.34 2.160.26 2.220.18 4.690.44

mf447 0.950.16 1.860.32 3.011.21 1.290.43 2.590.55 3.840.21 2.340.36 3.410.14 3.790.32 1.880.30 1.630.28 1.610.16 1.440.19 2.460.51 4.160.09

mf457 1.180.41 1.740.65 2.730.45 2.390.56 1.770.21 3.930.22

mf478 1.370.13 1.980.35 3.371.01 2.150.45 2.360.30 3.530.43 2.190.20 3.200.56 4.330.17 2.090.56 1.540.29 2.150.25 2.200.21 3.090.32 4.700.69

mf480 1.410.48 1.610.68 2.530.47 3.270.25 2.430.54 3.220.18 2.190.45 2.960.36 3.720.37 1.910.26 1.150.37 2.040.14 0.950.13 2.610.57 3.570.35

mf484 1.160.46 1.710.59 2.730.42 1.080.17 3.050.34 4.450.35 2.640.43 2.910.37 4.280.80 2.530.73 2.450.46 2.140.26 2.860.31 2.810.45 5.570.18 2.550.40 3.280.32 1.630.26 0.540.20 2.880.36 5.250.71 1.820.30 4.170.29

mf485 1.120.08 0.850.38 3.000.75 0.580.21 2.900.12 4.460.69 2.240.44 2.530.53 3.770.31 1.860.41 1.780.20 1.880.14 2.130.32 3.150.81 5.430.36 2.180.76 3.530.25 1.390.25 0.440.13 2.290.48 4.410.55 1.540.41 3.900.44

mf486 2.030.33 3.130.45 1.670.43 0.490.12 2.290.23 3.850.10 1.870.26 3.090.15

mf487 0.870.34 1.240.75 3.180.73 1.520.18 2.940.73 4.240.78 2.300.37 2.730.34 4.170.47 1.710.48 1.540.01 1.720.20 1.600.36 3.840.47 4.990.41 2.420.32 2.890.24 0.980.13 0.460.14 3.010.50 3.520.42 1.500.57 3.020.50

mf489 1.110.30 1.210.30 3.250.96 0.860.22 2.570.38 4.030.31 2.200.29 2.900.34 4.750.41 2.270.49 2.000.56 2.180.77 2.290.57 3.540.39 4.670.34 2.410.36 2.930.23 1.310.15 0.400.12 2.060.56 4.490.30 2.140.94 4.010.36

mf496 1.720.40 3.110.30 1.330.20 0.400.09 1.430.34 3.510.59 1.240.43 3.220.51

mf499 2.410.47 2.930.30 1.140.17 0.370.09 2.210.21 4.010.39 1.250.56 3.390.38

mf505 2.080.31 2.700.48 4.690.35 2.700.86 2.030.13 2.260.37 2.410.34 3.390.41 5.520.76 2.190.57 3.180.23 1.340.20 0.560.40 2.090.19 3.990.42 2.190.41 4.270.25

mf506 2.320.34 2.820.77 4.440.46 2.460.51 1.870.31 2.170.44 1.600.75 3.410.24 5.170.49 2.490.43 3.200.44 1.500.30 0.530.27 2.230.24 3.740.30 1.600.62 3.680.37

mf508 2.000.49 3.650.25 1.490.47 0.610.18 1.940.51 3.720.45 1.410.43 2.830.21

mf510 2.080.21 3.070.38 1.190.36 0.720.26 2.340.44 3.980.47 1.730.37 2.720.59

Media 1.11 1.46 2.88 1.72 2.71 3.98 2.33 2.90 4.24 2.09 1.73 2.07 1.93 3.12 4.89 2.26 3.16 1.33 0.50 2.33 4.05 1.63 3.44

CV 17.77 24.75 13.66 45.12 15.54 10.24 7.27 7.92 8.04 15.90 23.76 14.42 26.54 15.75 12.07 11.70 7.31 16.72 20.77 21.19 11.97 19.68 15.65

S1= Sitio 1 (General Deheza y General Cabrera); S2=Sitio 2 (Manfredi); S3=Sitio 3 (Santa Eufemia); S4=Sitio 4 (El sur, San Ambrosio, Las Vertientes, Reducción, las acequias); S5=Sitio 5 (Gigena).

85
Tabla 4.10. Desempeño genotípico a través de 23 ambientes (CS ).
Genotipo Promedio EE VE CV
mf484 2.80 a 0.27 0.14 45.45
mf505 2.66 abc 0.27 0.07 44.67
mf478 2.61 abde 0.21 0.09 36.46
mf489 2.59 bcd 0.26 0.07 47.37
mf506 2.56 bcdf 0.25 0.01 43.98
Florman 2.53 bcdef 0.26 0.14 50.28
manf393 2.53 bcde 0.22 0.11 38.14
Tegua 2.51 bcdef 0.25 0.07 46.71
mf485 2.50 defg 0.27 0.10 52.64
mf487 2.45 bcdefg 0.25 0.07 49.06
mf486 2.43 bcdef 0.23 0.02 45.39
mf510 2.38 bcdef 0.23 0.05 46.88
mf499 2.36 egh 0.26 0.01 55.73
mf447 2.35 fh 0.21 0.12 42.22
mf508 2.33 defgh 0.23 0.09 50.05
mf457 2.29 cfgh 0.22 0.35 42.38
mf480 2.26 cfgh 0.21 0.47 36.64
mf496 2.09 h 0.24 0.05 56.79
(1) Promedios de rendimientos a través de ambientes; (2) errores estándares (EE) utilizados para evaluar las
significancia estadística de las diferencias obtenidos a partir del modelo mixto AMMI (2); (3) varianzas de
estabilidad (VE) para cada genotipo obtenidas a partir de un modelo mixto; (4) coeficiente de variación (CV) de los
rendimientos a través de los ambientes. Letras diferentes indican diferencias estadísticamente significativas en los
rendimientos promedio a través de los ambientes (p<0.05)

Conclusiones

Los análisis de ECR por campaña mostraron que la variabilidad debida a la


interacción GS en el PMM-INTA es relativamente pequeña en relación a la
variabilidad entre genotipos. Si bien los biplot GGE de los ECR por año permitieron
identificar genotipos superiores en algunos sitios, los sitios que en una campaña
particular resultaron favorables para algunos cultivares no fueron los mismos a través de
los años. En 5 de los 6 años de ECR, la CP1 del GGE biplot correlacionó
significativamente con los rendimientos promedios, evidenciando una respuesta de los
genotipos proporcional a través de los sitios, rara vez implicó cambios de ranking en el
orden de los genotipos. Utilizando la información adicional sobre contingencias
climáticas registradas en cada campaña se pudo explicar la interacción entre los
cultivares evaluados y los sitios donde se condujeron los ECR. El análisis realizado a

86
partir del biplot mixto, que fue construido con los datos de las 6 campañas agrícolas
conjuntamente, permitió confirmar los hallazgos sobre la naturaleza aleatoria y la
magnitud relativamente baja de la interacción GA en el PMM-INTA. El análisis
colectivo de los ECR anuales y el análisis de los datos de las 6 campañas
simultáneamente indican la existencia de un único mega-ambiente en el área manisera
argentina. La región objetivo del PMM-INTA es homogénea en cuanto a características
edáficas y climáticas. Los resultados de este trabajo sugieren que no existe la necesidad
de particionar la región en subregiones con el propósito de realizar recomendaciones de
cultivares y que, en lugar de incrementar el número de sitios donde se conducen ECR
sería conveniente redireccionar los recursos disponibles hacia la implementación de
diseños experimentales que pongan énfasis en la reducción de la varianza de cada
ensayo y generen presiones diferentes por estrés biótico para explotar mejor la
variabilidad genética del material experimental con fines de mejoramiento.

87
CAPÍTULO V

CORRELACIÓN ESPACIAL ENTRE PARCELAS DE ENSAYOS


COMPARATIVOS DE RENDIMIENTO MULTIAMBIENTALES

Introducción

La estimación y comparación de efectos de genotipos en ensayos comparativos de


rendimiento (ECR) conducidos en varias localidades requiere de buenas predicciones
del rendimiento promedio de cada genotipo a través de los ambientes. Comúnmente los
ECR se realizan bajo diseños experimentales con repeticiones (varias parcelas) para
cada genotipo dentro de cada ambiente. La estratificación o bloqueo de parcelas, es una
técnica usada para disminuir los efectos de variación entre las unidades experimentales.
Los bloques son grupos de unidades experimentales formados de manera tal que las
parcelas dentro de los bloques sean lo más homogéneas posible. Los diseños con
estratificación de parcelas tales como el diseño en bloques completos aleatorizados
(DBCA), los diseños en bloques incompletos y los látices, son comunes dentro de cada
ambiente en la mayoría de los ECR. Estos diseños son más eficientes que el diseño
completamente aleatorizado cuando las diferencias entre unidades experimentales que
conforman un mismo estrato son mínimas y las diferencias entre los estratos son
máximas (Gusmao, 1986). Alejamientos de esta condición pueden resultar en
imprecisiones de las estimaciones de los efectos de genotipo y/o sobrestimaciones de las
varianzas de error (Stroup et al., 1994). Los ECR involucran generalmente varios
genotipos, razón por la cual el tamaño de los bloques necesarios para lograr una
repetición del ensayo es grande y por tanto resulta difícil asegurar la homogeneidad de
las parcelas que conforman el bloque; las parcelas más próximas pueden ser más
similares que las más distantes, generando variabilidad espacial. La variabilidad
espacial se refiere a la variación entre observaciones realizadas sobre parcelas con
arreglos espaciales sobre el terreno (Mercer y Hall, 1911). La variación de parcela a
parcela dentro de un mismo bloque puede deberse a competencia entre genotipos
(Kempton y Lockwod, 1984), heterogeneidad en la fertilidad del suelo (Pearce, 1980),

88
dispersión de insectos, malezas, enfermedades del cultivo o a labores culturales (Smith
et al., 2001). Debido a la existencia de variabilidad espacial dentro de bloques, el
análisis de varianza estándar para los diseños que involucran el bloqueo de unidades
experimentales no siempre elimina los sesgos en las comparaciones de efectos de
genotipos debido a la heterogeneidad entre parcelas.

Por este motivo se han propuesto procedimientos estadísticos que contemplan la


variación espacial entre parcelas. Estos procedimientos son variados y van desde el
ajuste de medias de genotipo en función de lo observado en las parcelas vecinas más
cercanas (Papadakis, 1937; Wilkinson et al., 1983; Besag y Kempton, 1986), hasta el
uso de modelos que contemplan las correlaciones espaciales en términos aleatorios y
que también producen ajustes de medias de genotipo (Mead, 1971; Besag, 1974, 1977;
Ripley, 1981). Stroup et al. (1994) realizan una comparación de métodos y concluyen
sobre los beneficios asociados a la modelación de la variación espacial en ECR de trigo
conducidos en la zona central de USA pero dicha comparación no se realiza en el
contexto de ensayos multiambientales. En el contexto de un ECR conducido en una
localidad, Gleeson y Cullis (1987), Cullis et al. (1996) y Cullis y Gleeson (1991)
conceptualizan la variación del error como un todo y la modelan a través de su
estructura de covarianza obteniendo estimaciones más precisas de las medias de cultivar
respecto a aquellas derivadas de la estratificación de parcelas. Gilmour et al. (1997)
particionan la variabilidad espacial entre parcelas de un ensayo, en variabilidad espacial
local, global y extraña. La variabilidad espacial local hace referencia a las diferencias
entre parcelas en pequeña escala, donde se contemplan las variaciones intra-bloque. La
variación espacial global representa tendencias no estacionarias a lo largo del ensayo (a
través de todos los bloques). La variación extraña es frecuentemente asociada al manejo
de los ensayos y contempla variaciones intra e inter-bloques. Un ejemplo es el efecto de
la cosecha en forma de serpentina, donde se cosechan algunas filas en un sentido y otras
en el otro, reflejándose un consistente mayor/menor rendimiento en un sentido que en
otro. Las variaciones espaciales globales y extrañas son contempladas en la modelación
de los rendimientos en un ECR mediante la inclusión de términos apropiados tales como
factores de diseño y funciones polinómicas de las coordenadas espaciales de parcelas.
La tendencia espacial local y la heterogeneidad residual es modelada mediante la matriz
de varianza y covarianza de las observaciones. La descomposición de la variación del

89
error, realizada por Gilmour et al. (1997) provee una mejor aproximación que el análisis
espacial clásico cuando existe tal diferenciación de las fuentes de error. En ausencia de
variabilidad global y/o extraña, el aspecto crítico es la modelación de la variación
espacial local.

A través de un sistema de coordenadas bidimensionales es posible definir la


ubicación de las parcelas en el campo, por ejemplo, usando la latitud y longitud de los
centroides de parcelas. Estas coordenadas permiten calcular distancias entre parcelas
que luego pueden ser usadas para expresar la correlación entre observaciones de
distintas parcelas como función de dichas distancias. En arreglos rectangulares, como
los que se presentan en ECR, los sistemas de coordenadas bidimensionales que permiten
modelar funciones de correlación en la dirección Este-Oeste y en la dirección Norte-
Sur, resultan generalmente suficientes. La modelación de la estructura espacial de
parcelas a partir de funciones de distancia puede realizarse en el contexto de los
modelos lineales mixtos (Zimmerman y Harville, 1991; Gilmour et al., 1997; Cullis et
al., 1998) donde además de contemplar la estructura de correlación entre observaciones
provenientes de distintas parcelas es posible modelar heterogeneidad de varianza
residual entre los ensayos de los distintos ambientes. Si las funciones de correlación
sólo dependen de los vectores de distancias (magnitud y/o dirección de las distancias),
los modelos que estiman las covarianzas entre observaciones obtenidas de distintas
parcelas se denominan estacionarios. Las funciones de correlación para modelos
estacionarios pueden ser isotrópicas o anisotrópicas, las primeras son idénticas en
cualquier dirección (sólo dependen de la magnitud de las distancias) mientras que las
segundas permiten diferentes valores de sus parámetros en diferentes direcciones
(dependen también de la dirección sobre la cual se calculan las distancias). En el caso de
procesos bidimensionales separables, es usual contemplar la dependencia entre parcelas
con un modelo de correlación exponencial anisotrópico, que se expresa en general
como:

Corrij= exp  f  dijf    c  dijc  


pf pc
(5.1)
 

donde d ijf y d ijc son las distancias entre la parcela i y la parcela j en la dirección de las

filas y las columnas respectivamente, pf y pc son las potencias correspondientes,

90
mientras que  f y  c son parámetros desconocidos. El número total de parámetros para

modelar la función de correlación bajo este modelo es cuatro. Otra de las funciones de
correlación espacial comúnmente usada es la función potencia. Aplicable a un modelo
isotrópico depende de un único parámetro (  ) que elevado a la distancia entre dos
parcelas (en cualquier dirección) provee la correlación entre ambas. La función potencia
es una reparametrización de la función exponencial (con p=1) ya que la función
potencia puede expresarse como  siendo log(  ) negativo, debido a que 
dij log(  )
e
dij

pertenece al intervalo [0,1], si se llama 1/ al ln(  ) se tiene que


dij (1/  )
 e  exp(dij /  ) . También es posible trabajar con un modelo de correlación
dij

df dc
potencia anisotrópico, i.e.  f ij c ij . Este depende de dos parámetros, uno que representa

la correlación entre parcelas en la dirección de las fila (  f ) y el otro representa la

correlación de parcelas en la dirección de las columnas (  c ). La función de correlación


potencia para un modelo anisotrópico bidimensional separable también es conocida con
el nombre correlación autorregresiva de orden uno separable (AR1AR1). Los
elementos del vector de parámetros =(f, c) se denominan coeficientes autorregresivos
(Smith et al., 2002). Cullis y Gleson (1991) consideran a los modelos AR1AR1 y
AR1I (correlación autorregresiva sólo en una dirección) como aquellos más plausibles
para modelar correlación espacial en ECR.

El objetivo de este trabajo fue evaluar el efecto de diversas estrategias de


modelación espacial sobre la comparación de medias de genotipos por localidad dado
que la presencia de interacción genotipo×localidad es común en ECR. Se ajustaron
simultáneamente sobre una serie de 18 ECR multiambientales de un programa de
mejoramiento vegetal, cuya estructura de parcelas en cada ambiente respondía a un
diseño en bloques completos al azar (DBCA), los siguientes tipos de modelos: 1)
modelo clásico del análisis de varianza con efectos de bloques fijos y aleatorios, 2)
modelos mixtos que incorporan la correlación espacial a través de la identificación de
una estructura de (co)-varianza apropiada para los términos de error y 3) modelos de
covarianza asociados al método de vecinos más cercanos. La mayoría de los modelos
fueron ajustados con varianzas residuales homogéneas y heterogéneas a través de las

91
localidades intervinientes para contemplar las posibles diferencias en precisión de los
ECR conducidos en distintos ambientes. Los ajustes de medias de genotipo y la
comparación estadística entre genotipos dentro de cada ensayo fueron utilizados para
discernir sobre el comportamiento de los distintos modelos. Se discute la equivalencia
que existe entre algunos modelos espaciales en el contexto particular de los ECR
multiambientales.

Material y Métodos

Base de datos
Se utilizaron datos de nueve campañas agrícolas (1984/85 a 1992/93) de dos tipos
de ECR de líneas experimentales de maní (Arachis hypogaea L.) del Programa de
Mejoramiento de Maní de la EEA-Manfredi, INTA, Argentina. El tipo uno corresponde
a ensayos de líneas de ciclo corto y el tipo dos a ensayos donde se comparan líneas de
ciclo largo. Un total de 18 ECR multiambientales fueron utilizados en este estudio, éstos
involucran líneas que representan la diversidad del germoplasma evaluado en etapas
tempranas del programa de mejoramiento. En cada campaña los ECR se realizaron en
tres localidades del área de cultivo en la provincia de Córdoba: Manfredi (Lat. S.
31º41’, Long. O. 63º26’), General Cabrera (Lat. S. 32º49’, Long. O. 63º51’) y Río
Tercero (Lat. S. 32º10’, Long. O. 64º7’), con la excepción de las campañas 1991/92 y
1992/93 donde no participó la localidad de Río Tercero. Las características climáticas y
de suelo de las tres localidades que intervinieron en los ECR son muy similares
(Casanoves et al., 2004). En cada localidad se evaluó un promedio de 15 líneas por año
en los ensayos de ciclo corto (mín=11 y máx=17 líneas) y de 14 líneas por año en los
ensayos de ciclo largo (mín=13 y máx=17 líneas). El conjunto de líneas evaluadas, en
cada campaña, fue el mismo para cada localidad. En cada uno de las tres localidades,
tanto los ensayos correspondientes a genotipos de ciclo corto como aquellos de
genotipos de ciclo largo fueron conducidos según un DBCA con cuatro repeticiones.
Las parcelas experimentales asociadas a cada genotipo fueron de dos surcos de 10 m de
longitud distanciados 70 cm uno de otro. Para la siembra se utilizaron 15 semillas por
metro lineal de surco. Las prácticas culturales recomendadas fueron utilizadas en todos

92
los ECR. Cada parcela se cosechó en su totalidad en forma manual, luego de descontar
áreas de bordura. Se registraron valores de rendimiento en grano (kilogramos de grano
por parcela a humedad constante del 8%).

Procedimientos de análisis
Los datos de rendimiento en grano obtenidos para cada campaña bajo cada ECR
fueron analizados usando los procedimientos que se detallan a continuación. Los
primeros dos métodos se basaron en el análisis de varianza para un DBCA, donde la
variación total se particionó según el siguiente modelo:

yijk =  + Lj + B(L) k(j) + Gi + GL(ij)+ ijk (5.2)

donde yijk es el rendimiento del genotipo i, en la localidad j, bloque k;  es la media


general; Lj es el efecto de la localidad j con j=1,…,s; B(L)k(j) es el efecto del bloque k
dentro de la localidad j con k=1,...,n; Gi es el efecto del genotipo i con i=1,...,g; GL(ij) es
el efecto de la interacción del genotipo i con la localidad j y ijk es el término de error
asociado a la observación yijk. Excepto por ijk y los efectos de bloque todos los factores
del modelo fueron considerados como de efectos fijos con la finalidad de restringir la
comparación de procedimientos a la modelación de la estructura de parcelas y comparar
las aproximaciones obtenidas bajo modelos mixtos con otras técnicas de análisis
difundidas para el control de la variabilidad espacial. Los ijk se asumieron
independientes con varianza constante 2, i.e. se supone que no existe variación espacial
local y además existe homogeneidad de varianzas residuales entre localidades. Los
efectos de bloque fueron considerados fijos y aleatorios, denotando los procedimientos
como Modelo BF y Modelo BA respectivamente. Los procedimientos denotados como
Modelo BFH y Modelo BAH se basaron también en un modelo para un DBCA pero
contemplando la posibilidad de varianzas residuales heterogéneas según los distintos
niveles del factor localidad.

El quinto procedimiento consistió en ajustar para cada localidad un modelo de


correlación espacial isotrópico con función de correlación potencia (Modelo Pow) sin
declarar el efecto de bloques. La correlación entre parcelas de distintas localidades fue
considerada nula. El sexto procedimiento fue igual al anterior pero agregando un efecto

93
fijo de bloque (Modelo BFPow). También se ajustó un modelo con función de
correlación potencia pero anisotrópico sin declarar el efecto de bloque. Este modelo se
ajustó suponiendo varianzas residuales homogéneas (Modelo Powa) y heterogéneas
(Modelo PowaH) según los distintos niveles del factor localidad. Todos los modelos
anteriores se estimaron en el contexto de los modelos lineales mixtos usando PROC
MIXED, SAS, Versión 8.2 (SAS Institute, 2001). Un resumen de la sintaxis de
programación utilizada para cada uno de los modelos de análisis se presenta en la Tabla
5.1.

Con fines comparativos, también se ajustaron medias en base al procedimiento


original de Papadakis (1937) que usa los residuos adyacentes de cada parcela para
corregir las medias de genotipos por variabilidad espacial, técnica de análisis conocida
como ajuste por el vecino más cercano. Para implementar el procedimiento se siguieron
los pasos detallados en Stroup et al. (1994): 1) obtención de los residuos de las parcelas
adyacentes para un modelo sin el efecto de bloques, esto es, ekm  ykm  ykm , donde ekm

es el residuo en la latitud k-ésima y longitud m-ésima, ykm y ykm son el valor observado
y el valor promedio del genotipo que se encuentra en esa parcela; 2) cálculo de la
covariable de ajuste en la dirección Este-Oeste (EO) (derecha a izquierda del plano de
campo, independientemente de su orientación real) a partir de los residuos obtenidos en
el paso 1 como EOkm  1 2  ek ,m1  ek ,m1  ; cuando una parcela es borde de bloque, la

covariable se calculó sólo con el residuo de la parcela adyacente; 3) cálculo de la


covariable de ajuste en la dirección Norte-Sur (NS) (de arriba a abajo en el plano de
campo, independientemente de su orientación real) de manera similar al cálculo
realizado en el paso 2, es decir NSkm  1 2  ek 1,m  ek 1,m  ; 4) ajuste de tres modelos por

análisis de covarianza, uno utilizando la covariables EO, otro la covariable NS y el


tercero utilizando ambas covariables (EO-NS). De estos tres modelos se seleccionó el
de mejor ajuste para realizar el procedimiento iterativo propuesto por Wilkinson et al.
(1983), donde la primera iteración es el procedimiento original de Papadakis (1937) y
en las restantes se recalculan los residuos de parcelas usando las medias de genotipo
ajustadas en la iteración anterior. El procedimiento se repitió hasta que las diferencias
entre las medias de genotipos de dos iteraciones sucesivas fue despreciable. En este
trabajo se suspendieron las iteraciones cuando la estimación obtenida en un paso no se

94
diferenció de la obtenida en el paso anterior a nivel del segundo término decimal
(precisión original de los datos). Este procedimiento fue denotado como Modelo Pap.

Los modelos asociados a cada procedimiento fueron evaluados por los criterios de
Akaike (AIC) y de Schwarz (BIC) calculados de la siguiente forma:

AIC  2L  2d (5.3)

BIC  2L  d ln n (5.4)

donde L es el máximo valor de la función de verosimilitud restringida, d=q+p es la


dimensión del modelo, q es el número de parámetros de covarianza estimados y p es el
rango de la matriz de diseño X usando el método de estimación de máxima
verosimilitud. Usando estas expresiones de AIC y BIC, el mejor modelo resulta ser
aquel con menor valor para el criterio de ajuste. Los valores de la cantidad -2 res ln de
la máximo verosimilitud para cada uno de los procedimientos evaluados se presentan en
el Anexo 2. Para la evaluación de los procedimientos también se obtuvieron, para cada
localidad, los valores F para la prueba de hipótesis de efectos nulos de genotipos; para
ello se realizaron estimaciones de componentes de varianza por máxima verosimilitud
restringida (REML) con los grados de libertad propuestos por Kenward y Roger (1997).
Se compararon las diferencias de medias de cultivar usando la prueba LSD de Fisher y
la macro Pdmix800 (Saxton, 1988). Esta macro ordena las medias de genotipos
ajustados y asigna letras a cada una, tal que medias con igual letra no difieren
estadísticamente para el nivel de significancia fijado (=0.05). Como indicador de la
potencia de cada procedimiento en la se utilizó el valor del estadístico F para la prueba
de hipótesis de efectos nulos de genotipo en cada localidad del ECR multiambiental.
Las medias ajustadas por el procedimiento de mínimos cuadrados para cada genotipo en
cada uno de los ECR fueron correlacionadas usando el coeficiente de correlación de
Pearson. Se obtuvieron también los estimadores de los parámetros de (co)-varianza
asociados a cada modelo para facilitar la interpretación de las diferencias y similitudes
entre los procedimientos.

95
Tabla 5.1. Sintaxis resumida de comandos de Proc Mixed SAS (Versión 8.2) para
ajustar ocho aplicables a ECR multiambientales.
Modelo Sintaxis en SAS
BF class bloque geno local;
model rendim=geno local geno*local bloque(local);
BA class bloque geno local;
model rendim=geno local geno*local;
random bloque(local);

BFH class bloque geno local;


model rendim=geno local geno*local bloque(local);
repeated / group=local;
BAH class bloque geno local;
model rendim=geno local geno*local;
random bloque(local);
repeated / group=local;

Pow class geno local;


model rendim=geno local geno*local;
repeated / subject=local type=sp(pow) (lat long) ;

BFPow class bloque geno local;


model rendim=geno local geno*local bloque(local);
repeated / subject=bloque(local) type=sp(pow) (lat long) ;
Powa class geno local;
model rendim=geno local geno*local;
repeated / subject=local type=sp(powa) (lat long) ;
PowaH class geno local;
model rendim=geno local geno*local;
repeated / subject=local type=sp(powa) (lat long) group=local;

Resultados y Discusión

En todos los ECR multiambientales evaluados la interacción genotipo×localidad


fue significativa (p<0.0001). En el PMM-INTA la interacción genotipoambiente,
dentro de un mismo año agrícola es en general de naturaleza aleatoria, no
distinguiéndose dentro del área de cultivo mega-ambientes debido principalmente a la
homogeneidad en características de suelo y clima del área de cultivo de maní en la

96
provincia de Córdoba, Argentina (Casanoves et al., 2004). No obstante, los ECR de
líneas experimentales se realizan en más de una localidad del área de cultivo en cada
año con la finalidad principal de incrementar la precisión en las estimaciones del
desempeño de los genotipos que se comparan. Aún sin la existencia de mega-ambientes,
la comparación de genotipos se realizó en este trabajo dentro de cada localidad porque
el término de interacción genotipo×localidad fue significativo y debido a que los
modelos de correlación espacial de parcela podrían diferir entre localidades

Cuando se contempló el efecto de bloque dentro de localidad, este término resultó


siempre significativo (p<0.05). En las Tablas 5.2 y 5.3 se presentan los valores de AIC y
BIC asociados a cada modelo. Según BIC, el modelo con efectos de bloques aleatorios
es superior al modelo con efectos de bloques fijos. Sin embargo, los valores del criterio
de información de Akaike sugieren lo contrario. Esto ocurre debido a que con el diseño
en bloques con efectos aleatorios de bloques se modela la estructura de correlación de
parcelas con sólo un parámetro adicional, mientras que el modelo con efectos de
bloques fijos usa nueve parámetros para el mismo fin y BIC penaliza más la
sobreparametrización del modelo que AIC. Si bien para diseños balanceados el error
estándar para las diferencias de medias es el mismo para modelos con efecto de bloques
fijos que para modelos con efecto de bloques aleatorios y por tanto con ambos modelos
se logra la misma diferencia de medias (Tablas 5.5 y 5.8), con los modelos de efectos de
bloque aleatorios se amplía el espacio de inferencia en la comparación de efectos de
genotipo ya que ésta no está restringida al conjunto de parcelas usadas en el
experimento. Los métodos tradicionales basados en el bloqueo de parcelas, ya sean los
efectos de bloques tratados como fijos o aleatorios, pueden ser conceptualizados como
casos especiales de la modelación espacial que producen estimaciones de medias de
genotipo válidas cuando los supuestos del bloqueo son consistentes con dicha variación.
Debido a que los efectos de bloque están balanceados total o parcialmente respecto a los
efectos de los genotipos, los ajustes de las medias de genotipos por correlación espacial,
cuando se considera el bloqueo, serán menores que los ajustes correspondientes a
situaciones donde no se contempla el bloqueo. Al ajustar los modelos en bloques
permitiendo varianza residual heterogénea entre ambientes se obtuvieron reducciones
tanto de los valores de AIC como de BIC en la mayoría de los ECR (Tablas 5.2 y 5.3).
En diez de los 18 ECR (62%), la diferencia entre las varianzas residuales fue de

97
importancia con un cociente entre la mayor y la menor varianza residual superior a dos
(Tablas 5.4 y 5.5). Las diferencias porcentuales entre la mayor y la menor varianza
residual por localidad variaron entre 36% (Tabla 5.4, campaña 89/90) y 623% (Tabla
5.5, campaña 86/87). El modelo BF, tradicionalmente usado para el análisis de los ECR
del PMM-INTA, en ninguno de los 18 ECR fue el mejor modelo para ajustar los datos.
Las mayores diferencias se observaron en los ECR de líneas experimentales de ciclo
largo, estos ensayos permanecen más tiempo en el terreno pudiendo incurrirse en
mayores errores experimentales y en diferenciaciones entre localidades debido al
impacto de factores climáticos por un periodo de tiempo más prolongado. A excepción
de las campañas 87/88 y 92/93, en todos los ECR de ciclo largo ambos criterios de
ajuste sugieren que los modelos de análisis de varianza para un diseño en bloque
heterocedástico son más apropiados que sus versiones con varianzas residuales
homogéneas a través de las localidades (Tablas 5.2 y 5.3). Las dos campañas donde los
modelos BFH y BAH no superaron a BF y BA respectivamente fueron las únicas
campañas donde las diferencias en varianzas residuales entre localidades fueron
despreciables (Tabla 5.5). Para esas dos campañas, las diferencias entre los estadísticos
F para la prueba de hipótesis de efecto de genotipo nulo, obtenidas dentro de cada
localidad, fueron muy similares entre los modelos de diseños en bloques homogéneos y
heterogéneos. Sin embargo, en la mayoría de los ECR de ciclo largo, se encontraron
cambios importantes del estadístico F en al menos una de las tres localidades
intervinientes en cada ECR (Tabla 5.7). Considerando tanto los ECR de ciclo largo
como los de ciclo corto, el modelo BFH resultó más apropiado que el modelo BF en el
78% de los ECR analizados. Algo similar ocurrió al comparar BA con BAH, donde
según AIC, el modelo con varianza residual heterogénea resultó ser mejor en el 82% de
los casos, mientras que según BIC el segundo modelo fue superior en el 72% de los
casos. Es importante notar que a pesar de la penalización por la estimación de un mayor
número de parámetros que se realiza en BIC, los modelos con varianza residual
heterogénea resultan recomendables en ECR multiambientales.

Comparando el modelo BF respecto al modelo que incorpora, además de los


efectos de bloques fijos, una estructura de correlación espacial (función potencia)
isotrópica, ambos criterios sugieren como beneficiosa la modelación de la variabilidad
espacial dentro de bloques. A pesar de incorporar un parámetro más, según BIC el

98
modelo BFPow produjo ajuste mejores que el modelo BF. El máximo valor a través de
los ECR, del coeficiente de correlación del modelo BFPow fue 0.56 (Tabla 5.4) y
corresponde a la campaña 88/89 donde se observó la máxima diferencia de valores del
estadístico F entre ambos modelos (Tabla 5.6). El valor del coeficiente para la función
de correlación espacial fue, en todos los ECR, mayor cuando no se incluyó el efecto de
bloque en el modelo (máximo valor r=0.75). Este resultado era esperado ya que en el
modelo BFPow parte de la correlación por variabilidad espacial queda contemplada en
el termino relacionado al bloqueo de las parcelas.

Al trabajar con modelos anisotrópico la inclusión del efecto bloque pareciera


redundante. Comparando el modelo Powa con el modelo BFPow a partir de los valores
de BIC, el modelo anisotrópico supera en todos los ECR al modelo isotrópico con
efecto de bloque. Este resultado se explica en función de la cantidad de parámetros
usados en el modelo Powa respecto a BFPow. No obstante los cambios en el estadístico
F entre ambos modelos no fueron importantes (Tablas 5.7 y 5.8) ya que en ambos casos
se modela la variabilidad espacial en dos direcciones. Bajo ambos criterios el modelo
AR1×AR1 (PowaH) heterogéneo entre localidades resultó el modelo más apropiado
para la mayoría de los ECR en los que pudo ajustarse. Según AIC, resulta superior a los
restantes modelos en un 70% de los casos y según BIC en el 93% de los casos. El
modelo AR1×AR1 homogéneo (Powa) fue superior al heterogéneo (PowaH) sólo en el
ECR de líneas de ciclo corto conducido en la campaña 89/90 que corresponde al ensayo
multiambiental con menor diferencia entre las varianzas residuales de cada localidad
(Tabla 5.4). Con el modelo AR1×AR1 heterogéneo se pueden presentar problemas
computacionales, al menos con el algoritmo de estimación implementado en la versión
8.2 de Proc Mixed SAS cuando la cantidad de información disponible es insuficiente
para el ajuste de un modelo menos parsimonioso. En cinco de los 18 ECR evaluados
(18%), el modelo PowaH no convergió (Tablas 5.6 y 5.7). En estos casos el modelo
Powa surge como apropiado y éste sólo tuvo problemas de convergencia en uno de los
18 ECR evaluados.

Los resultados anteriores muestran que la modelación de las tendencias espaciales


locales mediante el análisis de varianza que incluye efecto de bloques aleatorios o
estructuras de correlación espacial en los términos de error, incrementa la capacidad de

99
identificar diferencias entre genotipos. Si bien en la estimación de las medias de
genotipo bajo los modelos mixtos, donde interviene la estructura de (co)varianzas se
pueden producir ajuste de las medias de genotipo, el mayor impacto de la modelación se
produce a nivel de los errores estándar usados en la comparación de medias. Por ello, si
bien la significancia de las diferencias de medias puede diferir entre modelos (resultados
obtenidos con la macro PDMIX800 no mostrados), las correlaciones entre las medias de
genotipo obtenidas bajo los distintos modelos de análisis de varianza fueron altamente
significativas (P<0.0001). La mínima correlación fue r=0.913 y se produjo entre las
medias derivadas del modelo BAH y las medias de genotipo obtenidas a partir del
modelo BFHPow.

Por el contrario, cuando se usa un método basado en ajustes por vecinos más
cercanos, como el implementado en Stroup et al. 1994, los ajustes repercuten
directamente sobre las estimaciones de la medias. En la Tabla 5.8 se listan las
significancias de las covariables de ajustes en sentido EO, NS y EO-NS para los mismos
ECR en donde se usó análisis de covarianza con distintas estrategias para modelar
correlación espacial. En un 40% de los ECR, en ninguno de los tres modelos de
covarianza, la significancia de las covariables sugirió necesidad de ajuste por
correlación espacial, es decir usando la covariable NS, la EO o ambas, ninguna resultó
significativa (Tabla 5.8). Para los restantes ECR generalmente resultó mejor el modelo
con la covariable EO, es decir aquel que remueve la variabilidad por correlación
espacial intra-bloque. En dos campañas de los ECR de líneas de ciclo corto, campaña
86/87 y 89/90, el mejor modelo fue aquel que consideraba covariables tanto en la
orientación EO como NS. Para esas dos campañas AIC y BIC (obtenido para el modelo
Pap según el mejor modelo de covarianza) sugieren un mejor ajuste del modelo de
covarianza respecto al modelo clásico de análisis de varianza para un DBCA, ya sean
los efectos de bloque tanto fijos como aleatorios y las correlaciones entre las medias
ajustadas por vecinos más cercanos y por modelos mixtos de correlación espacial fueron
altamente significativas (r=0.99, P<0.0001). Sin embargo, en la mayoría de los ECR los
modelos de análisis de varianza fueron superiores al método de los vecinos más
cercanos. Posiblemente existan correlaciones espaciales no lineales entre la parcelas.
Los resultados sugieren que el uso del procedimiento de ajuste por vecinos más
cercanos del tipo del propuesto por Papadakis es limitado ya que por un lado los

100
residuos de las parcelas vecinas no siempre tienen una relación lineal con el rendimiento
de la parcelas de interés (suposición esta necesaria para el análisis de covarianza) y por
otra parte, el modelo resultante es no lineal en el sentido que incorpora un producto
entre los dos parámetros a estimar por lo cual, para hacer una estimación conjunta de los
mismos, se requiere de procedimientos iterativos. Además, si el ensayo se condujo en
bloques, aún bajo el modelo de covarianza debería respetarse el proceso de
aleatorización implementado incorporando el efecto de bloques.

Tabla 5.2. Criterios de Akaike (AIC) obtenidos para 10 modelos que incorporan
correlación espacial entre parcelas ajustados para 18 ensayos comparativos de
rendimiento del PMM-INTA.
Modelos de análisis (2)
ECR(1) Campaña BF BA BFH BAH Pow BFPow BFHPow Powa PowaH Pap
1 84/85 26.6 38.6 20.4 32.7 16.3 14.2 5.5 13.7 11.6 223.4
1 85/86 60.1 75.1 61.9 77.4 57.4 54.8 58.8 56.1 59.4 154.1
1 86/87 69.4 84.8 68.8 83.7 70.9 65.4 59.9 60.6 53.9 60.9
1 87/88 51.6 68.4 42.1 59.8 61.0 50.3 33.4 63.1 282.6
1 88/89 53.7 67.7 22.1 37.6 27.2 27.2 -8.0 29.3 259.0
1 89/90 185.4 200.6 189.0 204.2 183.1 177.9 180.7 178.9 186.5 162.4
1 90/91 73.5 79.3 73.6 79.9 62.2 68.3 67.6 59.8 60.2 164.1
1 91/92 22.1 29.0 18.2 26.1 26.1 23.9 22.0 27.7 28.6 104.0
1 92/93 18.7 23.1 17.9 22.8 25.5 18.1 13.0 27.4 14.2 219.3
2 84/85 120.1 150.8 103.9 135.8 139.1 114.5 120.7 148.7 139.5 339.7
2 85/86 184.6 185.3 141.5 140.7 185.9 185.2 143.4 185.4 142.3 437.0
2 86/87 178.2 197.4 131.9 153.9 198.4 179.1 131.5 195.2 144.9 187.4
2 87/88 67.6 76.2 68.1 76.5 80.8 65.0 63.5 80.3 80.3 262.5
2 88/89 83.3 91.4 67.1 77.8 75.3 77.9 65.2 74.4 221.2
2 89/90 116.1 121.8 107.7 114.3 106.3 109.9 99.3 102.1 93.6 295.4
2 90/91 135.4 138.5 125.4 129.4 138.7 137.0 128.6 135.9 116.3 284.1
2 91/92 41.0 54.5 34.5 48.2 64.8 39.8 32.6 64.6 48.70 189.6
2 92/93 79.4 89.7 81.4 91.7 96.7 77.0 81.1 97.3 181.6
(1) 1: genotipos de ciclo corto; 2: genotipos de ciclo largo. (2) BF: bloque de efectos fijos; BA: bloques de efectos
aleatorios; BFH: bloque de efectos fijos con varianzas residuales heterogéneas; BAH: bloque de efectos aleatorios
con varianzas residuales heterogéneas; Pow: correlación espacial potencia isotrópico; BFPow: efecto fijo de bloque
con correlación espacial potencia isotrópico; BFHPow: efecto fijo de bloque con correlación espacial potencia
isotrópico y varianzas residuales heterogéneas; Powa: correlación espacial potencia anisotrópico; PowaH: correlación
espacial potencia anisotrópico y varianzas residuales heterogéneas.
Celdas vacías indican problemas de convergencia durante el proceso de estimación.

101
Tabla 5.3. Criterios de Schwarz (BIC) obtenidos para 10 modelos que incorporan
correlación espacial entre parcelas ajustados para 18 ensayos comparativos de
rendimiento del PMM-INTA.
Modelos de análisis (2)
ECR(1) Campaña BF BA BFH BAH Pow BFPow BFHPow Powa PowaH Pap
1 84/85 202.2 61.4 202.4 56.5 -26.0 41.3 34.6 -29.5 -37.0 373.4
1 85/86 196.7 93.5 204.5 96.8 23.2 77.6 83.5 21.0 18.8 267.0
1 86/87 258.3 109.0 264.2 108.9 25.8 94.0 90.5 14.6 2.5 227.0
1 87/88 254.0 94.1 251.1 86.4 13.3 80.4 65.4 14.4 458.5
1 88/89 242.7 92.0 217.6 62.8 -17.8 55.8 22.5 -16.7 425.1
1 89/90 374.4 224.8 384.5 229.4 138.0 206.5 211.2 132.9 135.1 328.5
1 90/91 249.1 102.1 255.6 103.7 19.8 95.5 96.7 16.5 11.5 317.4
1 91/92 93.9 30.9 92.5 28.1 -5.3 26.3 24.5 -4.9 -8.0 163.5
1 92/93 121.8 25.7 123.9 25.4 -16.3 21.1 16.2 -15.7 -32.8 311.3
2 84/85 269.5 170.6 259.4 156.7 102.2 138.7 144.0 116.3 101.6 449.5
2 85/86 347.0 206.6 310.2 163.0 146.2 210.9 169.6 147.5 100.1 568.2
2 86/87 367.2 221.6 327.4 179.1 153.4 207.7 160.6 152.1 96.2 340.5
2 87/88 243.2 99.0 250.1 100.3 38.4 92.2 92.5 37.0 32.5 296.7
2 88/89 285.7 117.1 276.1 104.4 27.5 108.0 97.2 25.7 400.3
2 89/90 291.7 144.6 289.7 138.0 64.0 137.1 128.4 58.9 44.9 448.7
2 90/91 284.8 158.4 281.0 150.2 101.7 161.3 154.8 98.0 74.0 376.2
2 91/92 128.2 56.7 124.4 50.5 28.2 42.5 35.5 26.7 6.9 263.6
2 92/93 166.7 92.0 171.3 94.0 60.1 79.7 84.0 59.4 255.6
(1) 1: genotipos de ciclo corto; 2: genotipos de ciclo largo. (2) BF: bloque de efectos fijos; BA: bloques de efectos
aleatorios; BFH: bloque de efectos fijos con varianzas residuales heterogéneas; BAH: bloque de efectos aleatorios
con varianzas residuales heterogéneas; Pow: correlación espacial potencia isotrópico; BFPow: efecto fijo de bloque
con correlación espacial potencia isotrópico; BFHPow: efecto fijo de bloque con correlación espacial potencia
isotrópico y varianzas residuales heterogéneas; Powa: correlación espacial potencia anisotrópico; PowaH: correlación
espacial potencia anisotrópico y varianzas residuales heterogéneas.
Celdas vacías indican problemas de convergencia durante el proceso de estimación.

102
Tabla 5.4. Estimaciones de componentes de varianza para 10 modelos que incorporan correlación espacial entre parcelas ajustados para ensayos
comparativos de rendimiento de genotipos de ciclo corto del PMM-INTA.
Modelos de análisis
Campaña BF BA BFH BAH Pow BFPow BFHPow Powa PowaH Pap
  B =0.009  GC =0.056  B =0.008  GC =0.058  =0.53  =0.49  GC =0.058  GC =0.19  la =0.88  GC =0.078  la =0.89  lo =0.45 
2 2 2 2 2 2 2 2
84/85 =0.052 =0.120
 =0.052  M =0.030  M =0.030  R =0.069  =0.060  =0.055  M =0.034  M =0.57  lo =0.50  M =0.031  la =0.86  lo =0.52
2 2 2 2 2 2 2 2

 R =0.070  R =0.076  R =0.63  =0.060  R =0.069  la =0.87  lo =0.57


2 2 2 2

  B =0.021  GC =0.058  B =0.022  GC =0.059  =0.61  =0.52  GC =0.061  GC =0.53  la =0.88  GC =0.109  la =0.83  lo =0.75 
2 2 2 2 2 2 2 2
85/86 =0.062 =0.101
 =0.068  M =0.061  M =0.060  R =0.083  =0.089  =0.076  M =0.074  M =0.61  lo =0.59  M =0.061  la =0.92  lo =0.44
2 2 2 2 2 2 2 2

 R =0.085  R =0.090  R =0.43  =0.088  R =0.084  la =0.89  lo =0.30


2 2 2 2

  B =0.016  GC =0.052  B =0.013  GC =0.052  =0.54  =0.42  GC =0.059  GC =0.59  la =0.91  GC =0.051  la =0.94  lo =0.50 
2 2 2 2 2 2 2 2
86/87 =0.065 =0.047
 =0.065  M =0.086  M =0.089  R =0.056  =0.081  =0.069  M =0.087  M =0.19  lo =0.56  M =0.136  la =0.90  lo =0.58
2 2 2 2 2 2 2 2

 R =0.057  R =0.072  R =0.66  =0.084  R =0.061  la =0.89  lo =0.54


2 2 2 2

  B =0.015  GC =0.058  B =0.015  GC =0.059  =0.52  =0.36  GC =0.061  GC =0.36  la =0.76 


2 2 2 2 2 2 2
87/88 =0.059 =0.139
 =0.058  M =0.083  M =0.082  R =0.033  =0.074  =0.061  M =0.085  M =0.18  lo =0.51
2 2 2 2 2 2 2

 R =0.033  R =0.039  R =0.67  =0.074


2 2 2

88/89  2 =0.060  B =0.012


2
 GC =0.077
2
 B =0.010  GC =0.079
2 2
 =0.60  =0.56  GC =0.089  GC =0.75
2
 la =0.81 
2
=0.133
 =0.060  M =0.083  M =0.083  R =0.019  =0.069  =0.063  M =0.086  M =0.47  lo =0.59
2 2 2 2 2 2 2

 R =0.019  R =0.018  R =0.46  =0.068


2 2 2

  B =0.028  GC =0.129  B =0.028  GC =0.130  =0.54  =0.45  GC =0.134  GC =0.23  la =0.89  GC =0.167  la =0.88  lo =0.46 
2 2 2 2 2 2 2 2
89/90 =0.119 =0.080
 =0.119  M =0.110  M =0.110  R =0.118  =0.146  =0.126  M =0.118  M =0.54  lo =0.52  M =0.139  la =0.88  lo =0.60
2 2 2 2 2 2 2 2

 R =0.119  R =0.136  R = 0.60  =0.143  R =0.125  la =0.92  lo =0.47


2 2 2 2

  B =0.005  GC =0.088  B =0.005  GC =0.086  =0.47  =0.46  GC =0.106  GC =0.59  la =0.87 


2 2 2 2 2 2 2
90/91 =0.068 =0.085
 =0.068  M =0.063  M =0.063  R =0.054  =0.074  =0.073  M =0.064  M =0.21  lo =0.49
2 2 2 2 2 2 2

 R =0.053  R =0.059  R = 0.58  =0.075


2 2 2

  B =0.009  GC =0.036  B =0.011  GC =0.037  =0.42  =0.31  GC =0.038  GC =0.29  la =0.83  GC =0.054  la =0.90  lo =0.53 
2 2 2 2 2 2 2 2
91/92 =0.057 =0.111
 =0.057  M =0.077  M =0.076  =0.066  =0.059  M =0.081  M =0.32  lo =0.41  M =0.078  la =0.75  lo =0
2 2 2 2 2 2 2

 =0.066
2

  B =0.004  GC =0.064  B =0.005  GC =0.063  =0.13  =0.16  GC =0.062  GC =0.61  la =0.75  GC =0.065  la =0.87  lo =0.38 
2 2 2 2 2 2 2 2
92/93 =0.053 =0.210
 =0.053  M =0.042  M =0.042  =0.057  =0.052  M =0.043  M =0.32  lo =0.13  M =0.054  la =0.95  lo =0.49
2 2 2 2 2 2 2

 =0.057
2

Celdas vacías indican problemas de convergencia durante el proceso de estimación

103
Tabla 5.5. Estimaciones de componentes de varianza para 10 modelos que incorporan correlación espacial entre parcelas ajustados para ensayos
comparativos de rendimiento de genotipos de ciclo largo del PMM-INTA.
Modelos de análisis
Campaña BF BA BFH BAH Pow BFPow BFHPow Powa PowaH Pap
  B =0.121  GC =0.063  B =0.116  GC =0.063  =0.75  =0.50  GC =0.068  GC =0.47  la =0.70 
2 2 2 2 2 2 2
84/85 =0.106 =0.326
 =0.106  M =0.158  M =0.160  R =0.096  =0.211  =0.117  M =0.181  M =0.57  lo =0.75
2 2 2 2 2 2 2

 R =0.097  R =0.102  R =0.41  =0.210


2 2 2

  B =0.004  GC =0.287  B =0.001  GC =0.297  =0.10  =0.02  GC =0.285  GC =0.21  la =0.84  GC =0.298  la =0.85  lo =0.05 
2 2 2 2 2 2 2 2
85/86 =0.137 =0.479
 =0.137  M =0.050  M =0.050  R =0.073  =0.141  =0.137  M =0.050  M =0.03  lo =0.09  M =0.051  la =0.67  lo =0
2 2 2 2 2 2 2 2

 R =0.073  R =0.075  R =0.23  =0.141  R =0.075  la =0.90  lo =0.24


2 2 2 2

  B =0.041  GC =0.212  B =0.039  GC =0.212  =0.53  =0.32  GC =0.216  GC =0.22  la =0.81  GC =0.250  la =0.81  lo =0.39 
2 2 2 2 2 2 2 2
86/87 =0.114 =0.095
 =0.114  M =0.094  M =0.095  R =0.035  =0.154  =0.117  M =0.102  M =0.51  lo =0.53  M =0.210  la =0.93  lo =0.80
2 2 2 2 2 2 2 2

 R =0.034  R =0.035  R =0.23  =0.154  R =0.038  la =0.78  lo =0.31


2 2 2 2

  B =0.008  GC =0.085  B =0.007  GC =0.087  =0.24  =0.04  GC =0.088  GC =0.34  la =0.86  GC =0.099  la =0.84  lo =0.44 
2 2 2 2 2 2 2 2
87/88 =0.066 =0.149
 =0.066  M =0.056  M =0.055  R =0.057  =0.074  =0.066  M =0.054  M =-0.40  lo =0.23  M =0.060  la =-0.73  lo =0
2 2 2 2 2 2 2 2

 R =0.057  R =0.057  R =0.11  =0.074  R =0.061  la =0.89  lo =0.24


2 2 2 2

88/89  2 =0.068  B =0.007


2
 GC =0.107
2
 B =0.009  GC =0.105
2 2
 =0.45  =0.42  GC =0.051  GC =0.47
2
 la =0.84  GC =0.108  la =0.90  lo =0.53
2

2
=0.102
 =0.068  M =0.035  M =0.036  R =0.062  =0.075  =0.072  M =0.093  M =0.57  lo =0.49  M =0.053  la = 0.95  lo =0.50
2 2 2 2 2 2 2 2

 R =0.062  R =0.125  R =0.24  =0.077  R =0.063  la =0.90  lo =0.21


2 2 2 2

  B =0.007  GC =0.049  B =0.007  GC =0.049  =0.43  =0.42  GC =0.051  GC =0.47  la =0.89  GC =0.063  la =0.90  lo =0.61 
2 2 2 2 2 2 2 2
89/90 =0.086 =0.177
 =0.086  M =0.088  M =0.085  R =0.124  =0.092  =0.090  M =0.936  M =0.57  lo =0.42  M =0.076  la =0.92  lo =0.40
2 2 2 2 2 2 2 2

 R =0.123  R =0.125  R = 0.24  =0.092  R =0.135  la =0.87  lo =0.30


2 2 2 2

  B =0.006  GC =0.112  B =0.006  GC =0.117  =0.20  =0.14  GC =0.125  GC =0.38  la =0.88  GC =0.119  la =0.95  lo =0.27 
2 2 2 2 2 2 2 2
90/91 =0.107 =0.167
 =0.107  M =0.150  M =0.152  R =0.053  =0.114  =0.109  M =0.147  M =0.28  lo =0.21  M =0.162  la = 0.84  lo =0
2 2 2 2 2 2 2 2

 R =0.053  R =0.054  R = 0.26  =0.114  R =0.058  la =0.92  lo =0.34


2 2 2 2

  B =0.029  GC =0.041  B =0.025  GC =0.040  =0.44  =0.04  GC =0.040  GC =0.55  la =0.88 


2 2 2 2 2 2 2
91/92 =0.066 =0.212
 =0.066  M =0.092  M =0.094  =0.094  =0.066  M =0.092  M =0.09  lo =0.40
2 2 2 2 2 2

 =0.092
2

  B =0.025  GC =0.099  B =0.026  GC =0.098  =0.34  =0.37  GC =0.096  GC =0.50 


2 2 2 2 2 2 2
92/93 =0.096 =0.196
 =0.096  M =0.093  M =0.094  =0.121  =0.095  M =0.097  M =0.31
2 2 2 2 2 2

Celdas vacías indican problemas de convergencia durante el proceso de estimación.

104
Tabla 5.6. Valores del estadístico F en la comparación de medias por localidad para nueve modelos que incorporan correlación espacial entre parcelas
ajustados para ensayos comparativos de rendimiento de genotipos de ciclo corto del PMM-INTA.
Campaña Localidad BF BA BFH BAH Pow BFPow BFHPow Powa PowaH Mejor Bajo
BIC
84/85 Cabrera 11.71 11.71 10.86 10.57 15.41 15.17 9.99 16.87 11.40 PowaH
Manfredi 8.87 8.87 15.15 15.30 11.61 11.43 20.79 11.95 21.06
Río Tercero 5.12 5.12 3.83 3.87 7.01 6.93 6.59 6.40 5.90
85/86 Cabrera 11.21 11.21 13.22 12.89 12.51 12.10 14.25 14.23 16.21 PowaH
Manfredi 6.28 6.28 6.96 7.06 5.81 5.85 5.65 6.14 7.91
Río Tercero 4.94 4.94 3.95 4.02 6.74 6.31 3.71 6.87 4.08
86/87 Cabrera 17.77 17.77 22.01 22.24 22.15 21.03 31.17 26.88 48.55 PowaH
Manfredi 5.91 5.91 4.48 4.32 6.27 6.26 4.05 7.51 4.36
Río Tercero 3.00 3.00 3.43 3.47 3.82 3.52 5.08 4.50 5.18
87/88 Cabrera 13.15 13.15 13.14 12.93 14.52 14.04 13.18 14.05 Powa
Manfredi 4.97 4.97 13.49 3.53 6.51 5.86 3.20 6.34
Río Tercero 10.09 10.09 17.53 17.59 10.39 10.32 24.40 10.19
88/89 Cabrera 1.99 1.99 1.55 1.50 2.83 2.69 3.13 2.88 Powa
Manfredi 14.78 14.78 10.62 10.72 21.78 21.29 12.88 21.82
Río Tercero 4.76 4.76 14.90 14.97 7.76 7.52 13.50 7.61
89/90 Cabrera 5.38 5.38 4.98 4.95 7.22 6.84 4.86 7.35 5.24 Powa
Manfredi 5.63 5.63 6.09 6.08 7.41 7.09 8.30 7.06 8.18
Río Tercero 3.65 3.65 3.67 3.7 3.93 3.84 4.22 3.89 4.41
90/91 Cabrera 2.34 2.34 1.82 1.84 3.18 3.13 2.63 3.60 Powa
Manfredi 3.04 3.04 3.27 3.30 3.15 3.09 2.93 3.12
Río Tercero 5.02 5.02 6.42 6.33 6.59 6.44 9.60 7.37
91/92 Cabrera 7.85 7.85 12.16 12.04 8.89 8.43 12.13 8.32 12.93 PowaH
Manfredi 8.12 8.12 6.00 6.13 8.44 8.07 5.43 8.05 5.41

92/93 Cabrera 13.27 13.27 10.95 11.10 11.95 12.40 8.40 11.29 9.30 PowaH
Manfredi 20.81 20.81 26.40 26.18 18.77 19.57 25.36 17.85 35.70

Celdas vacías indican problemas de convergencia durante el proceso de estimación

105
Tabla 5.7. Valores del estadístico F en la comparación de medias por localidad para nueve modelos que incorporan correlación espacial entre parcelas
ajustados para ensayos comparativos de rendimiento de genotipos de ciclo corto del PMM-INTA.
Campaña Localidad BF BA BFH BAH Pow BFPow BFHPow Powa PowaH Mejor Bajo BIC
84/85 Cabrera 12.64 12.64 21.21 21.25 14.86 14.28 21.25 14.44 Powa
Manfredi 18.40 18.40 12.32 12.20 20.52 19.68 13.09 20.04
Río Tercero 4.34 4.34 4.76 4.77 5.87 5.24 4.77 5.67
85/86 Cabrera 37.37 37.37 17.84 17.22 35.61 35.92 15.00 36.34 15.44 PowaH
Manfredi 7.08 7.08 19.32 19.23 6.87 6.85 15.23 6.84 17.24
Río Tercero 2.20 2.20 4.08 4.15 2.14 2.14 4.03 2.09 4.36
86/87 Cabrera 9.88 9.88 5.30 5.30 10.32 10.28 4.79 10.02 4.63 PowaH
Manfredi 15.79 15.79 19.06 18.90 15.91 16.00 21.27 15.52 30.27
Río Tercero 4.79 4.79 15.59 15.63 4.69 4.79 14.41 4.41 13.41
87/88 Cabrera 9.21 9.21 7.13 6.99 7.68 8.80 5.81 8.08 5.82 PowaH
Manfredi 9.60 9.60 11.33 11.40 9.02 9.28 10.59 8.83 9.51
Río Tercero 9.98 9.98 11.58 11.65 8.37 9.52 10.44 8.16 9.21
88/89 Cabrera 5.69 5.69 3.63 3.71 6.15 6.10 4.38 6.54 5.55 Powa
Manfredi 7.23 7.23 13.94 13.74 8.16 8.02 12.36 8.24 17.57
Río Tercero 3.57 3.57 3.91 3.95 4.53 4.44 3.76 4.24 3.46
89/90 Cabrera 4.22 4.22 7.49 7.40 5.18 5.21 9.55 4.95 10.17 PowaH
Manfredi 11.85 11.85 11.67 12.00 14.26 14.05 16.99 15.25 18.91
Río Tercero 8.67 8.67 6.10 6.03 8.88 8.89 5.48 10.95 5.86
90/91 Cabrera 3.21 3.21 2.88 2.96 2.97 3.06 2.71 3.32 5.02 PowaH
Manfredi 5.66 5.66 4.06 3.99 5.70 5.68 3.89 6.05 3.39
Río Tercero 6.90 6.90 14.02 13.93 6.90 6.86 13.52 6.82 15.56
91/92 Cabrera 14.79 14.79 24.15 24.35 12.98 8.43 21.87 13.38 20.24 PowaH
Manfredi 11.90 11.90 8.57 8.41 8.75 8.07 8.02 8.22 6.14

92/93 Cabrera 9.95 9.95 9.60 9.75 9.46 12.40 8.75 Powa
Manfredi 3.96 3.96 4.11 4.05 3.27 19.57 3.58

Celdas vacías indican problemas de convergencia durante el proceso de estimación

106
Tabla 5.8. Significancias de covariables para ajustar correlación espacial según el
método de Papadakis para tres modelos de covarianza: con covarianza EO, con
covarianza NS y con ambas covarianzas.
Tipo Campaña EO NS EO-NS Mejor Modelo
de
EO NS
ECR
1 84/85 0.0368 0.3471 0.0084 0.0617 EO
1 85/86 <0.0001 0.9601 <0.0001 0.4089 EO
1 86/87 <0.0001 0.0939 <0.0001 0.0103 EO-NS
1 87/88 0.0047 0.8188 0.0020 0.2015 EO
1 88/89 0.1085 0.5408 0.1391 0.9753 NINGUNO
1 89/90 <0.0001 <0.0001 <0.0001 0.0033 EO-NS
1 90/91 0.4905 0.7487 0.4995 0.7693 NINGUNO
1 91/92 0.0803 0.0367 0.1508 0.0672 NS
1 92/93 0.5576 0.8674 0.5521 0.8393 NINGUNO
2 84/85 0.0002 0.0485 0.0001 0.0300 EO-NS
2 85/86 0.7984 0.6078 0.7636 0.5921 NINGUNO
2 86/87 <0.0001 0.8746 <0.0001 0.8251 EO
2 87/88 0.0006 0.8542 0.0005 0.5528 EO
2 88/89 0.1209 0.9580 0.1099 0.6809 NINGUNO
2 89/90 0.2446 0.1857 0.1342 0.1044 NINGUNO
2 90/91 0.2683 0.0980 0.1933 0.0740 NINGUNO
2 91/92 0.0020 0.2136 0.0042 0.6233 EO
2 92/93 0.0416 0.2454 0.2829 0.2863 EO

Smith et al. (2001) plantean que debido a que en los experimentos a campo las
parcelas son generalmente del mismo tamaño y están dispuestas en arreglos continuos
regulares la distancia entre ellas puede ser expresada en términos de su número de fila y
de columna. Luego, es posible expresar las distancias entre parcelas como distancias
entre las filas y las columnas en las que ellas se ubican, mediante las cantidades
1, ..., F-1 y 1,..., C-1 respectivamente.

Para modelos estacionarios anisotrópicos originados a partir del modelo

 
exponencial, i.e. R =  2Corr     2 Corr f  f   Corrc  c  esta recomendación, que

sin duda simplifica la tarea del investigador a campo ya que no es necesario obtener
latitud y longitud de los centroides de parcela, no cambia la función de covarianza sino
que simplemente cambia la escala de los coeficientes  f y  c . Para explicar este

fenómeno suponga que a la distancia entre las parcelas i y j en la dirección de las filas se

107
la expresa como dijf  i f  j f d F , donde i f y j f son los números de las parcelas i y j

en la fila f, d F es una distancia entre parcelas de una misma fila (constante entre
cualquier par de parcelas debido a la regularidad de los ECR) y de igual manera se
define dijc  i c  j c dC . Los posibles valores de la distancia entre números o códigos de

parcelas a nivel de las filas, dijnf  i f  j f corresponden al intervalo [1;C-1] y los

valores de dijnc  i c  j c pertenecen al intervalo [1; F-1]. Luego, el investigador puede

expresar cada uno de los factores del modelo de correlación exponencial (p=1)
separable como  f =exp(- f dijf ) y c =exp(-  c dijc) obteniendo estas distancias a partir

de las diferencias (en metros) en latitud o longitud de los centroides de parcelas o bien
utilizando simplemente las diferencias en números de parcelas a nivel de las filas y de
las columnas. En este último caso, los factores del modelo de correlación exponencial
serán  f =exp(- *f dijnf )=exp(- *f dijf /d F ) y c =exp(- c* dijnc )=exp(- c* dijc /dC ) que

corresponde a la misma función de covarianza con un cambio de escala ya que


 *f =  f /d F y  c* =  c/d C . Si por el contrario el modelo postulado es isotrópico, el
cambio de escala afectando las distancias entre filas y las distancias entre columnas por
cantidades diferentes es imposible ya que la función tiene la forma exp( dij ) y

d   d 
c 2 2
dij  ij
f
ij . No es posible multiplicar por cantidades diferentes a los términos

dentro de la raíz cuadrada sin que cambie la función y por ello es claro que el uso de un
sistema de coordenadas bidimensionales basado en el número de fila y el número de
columna en que se ubica la parcela es incorrecto para modelos isotrópicos.

Conclusiones

El modelo de efectos de bloques fijos tradicionalmente usado para el análisis de

los ECR del PMM-INTA, en ninguno de los 18 ECR fue el mejor modelo para ajustar

los datos. Las mayores diferencias se observaron en los ECR de líneas experimentales

de ciclo largo.

108
Los modelos de análisis de varianza para un diseño en bloque permitiendo errores

heterocedásticos entre localidades son más apropiados que sus versiones con varianzas

residuales homogéneas a través de las localidades

Si bien para diseños balanceados el error estándar para las diferencias de medias

es el mismo para modelos con efecto de bloques fijos que para modelos con efecto de

bloques aleatorios y por tanto con ambos modelos se logra la misma diferencia de

medias, con los modelos de efectos de bloque aleatorios se amplía el espacio de

inferencia en la comparación de efectos de genotipo ya que ésta no está restringida al

conjunto de parcelas usadas en el experimento.

Si además de los efectos de bloques fijos se usa una estructura de correlación

espacial (función potencia) isotrópica, la modelación de la variabilidad espacial dentro

de bloques resulta beneficiosa.

Al trabajar con modelos anisotrópico la inclusión del efecto bloque resulta

redundante. El modelo anisotrópico supera en todos los ECR al modelo isotrópico con

efecto de bloque.

El modelo AR1×AR1 (función potencia anisotrópica) heterogéneo entre

localidades resultó el modelo más apropiado para la mayoría de los ECR en los que

pudo ajustarse

La modelación de las tendencias espaciales locales mediante el análisis de

varianza que incluye efecto de bloques aleatorios o estructuras de correlación espacial

en los términos de error, incrementa la capacidad de identificar diferencias entre

genotipos. Si bien en la estimación de las medias de genotipo bajo los modelos mixtos,

donde interviene la estructura de (co)varianzas se pueden producir ajuste de las medias

de genotipo, el mayor impacto de la modelación se produce a nivel de los errores

estándar usados en la comparación de medias.

109
CAPÍTULO VI

CONCLUSIONES GENERALES

Las varianzas genotípicas de las líneas experimentales de ciclo corto, del programa de
mejoramiento de maní de la EEA-Manfredi del INTA, son relativamente pequeñas si se
comparan con la variación residual. No sucede lo mismo para los ECR CL, además, las
líneas de ciclo largo parecieran también ser más estables o menos dependientes de las
variaciones ambientales. En los ECR CC, la interacción genotipolocalidad fue menor
que la interacción genotipoaño, sugiriendo que sería más conveniente incrementar el
número de años en los que se evalúa un mismo material que el número de localidades en
cada campaña. Una relación inversa se encontró en los ECR de ciclo largo.

La distribución porcentual respecto a la variación total del conjunto de las fuentes


de variación analizadas sugiere que los ECR involucrando genotipos de ciclo corto
demandan mayores esfuerzos a nivel de ensayos multiambientales que aquellos que
involucran genotipos de ciclo largo para poder realizar una evaluación confiable de
líneas experimentales.

Tradicionalmente los genotipos a ser evaluados en próximos ensayos se eligen


usando sus rendimientos medios. La falta de significancia entre las correlaciones de las
medias de genotipo con el desempeño futuro de los mismos sugiere que la elección de
material basada en las medias de rendimiento no es la mejor alternativa de análisis.

El uso de los BLUP-e, no solo tiene en cuenta los efectos de los genotipos sino
también las componentes de varianza relacionadas a la interacción con el ambiente y a
la variabilidad genética que caracteriza al programa y la cantidad de información
disponible para cada genotipo. Las predicciones realizadas con BLUP resultan más
confiables que las basadas en medias. En programas con bases genéticas más amplias se
esperan mayores diferencias entre ambas aproximaciones.

Con predicciones basadas en un solo año de ECR se obtiene suficiente potencia


para determinar qué líneas experimentales deben seguir evaluándose y cuáles
descartarse del PMM-INTA. Si se desea mayor precisión en las estimaciones las

110
predicciones pueden basarse en 2 años de ECR, pero no se recomienda hacer más de dos
años de ECR para detectar genotipos de rendimiento pobre.

Los análisis de ECR por campaña mostraron que la variabilidad debida a la


interacción GS en el PMM-INTA es relativamente pequeña en relación a la
variabilidad entre genotipos. Si bien los biplot GGE de los ECR por año permitieron
identificar genotipos superiores en algunos sitios, los sitios que en una campaña
particular resultaron favorables para algunos cultivares no fueron los mismos a través de
los años. En 5 de los 6 años de ECR, la CP1 del GGE biplot correlacionó
significativamente con los rendimientos promedios, evidenciando una respuesta de los
genotipos proporcional a través de los sitios, rara vez implicó cambios de ranking en el
orden de los genotipos. Utilizando la información adicional sobre contingencias
climáticas registradas en cada campaña se pudo explicar la interacción entre los
cultivares evaluados y los sitios donde se condujeron los ECR. El análisis realizado a
partir del biplot mixto, que fue construido con los datos de las 6 campañas agrícolas
conjuntamente, permitió confirmar los hallazgos sobre la naturaleza aleatoria y la
magnitud relativamente baja de la interacción GA en el PMM-INTA. El análisis
colectivo de los ECR anuales y el análisis de los datos de las 6 campañas
simultáneamente indican la existencia de un único mega-ambiente en el área manisera
argentina. La región objetivo del PMM-INTA es homogénea en cuanto a características
edáficas y climáticas. Los resultados de este trabajo sugieren que no existe la necesidad
de particionar la región en subregiones con el propósito de realizar recomendaciones de
cultivares y que, en lugar de incrementar el número de sitios donde se conducen ECR
sería conveniente redireccionar los recursos disponibles hacia la implementación de
diseños experimentales que pongan énfasis en la reducción de la varianza de cada
ensayo y generen presiones diferentes por estrés biótico para explotar mejor la
variabilidad genética del material experimental con fines de mejoramiento.

El modelo de efectos de bloques fijos tradicionalmente usado para el análisis de

los ECR del PMM-INTA, en ninguno de los 18 ECR fue el mejor modelo para ajustar

los datos. Las mayores diferencias se observaron en los ECR de líneas experimentales

de ciclo largo.

111
Los modelos de análisis de varianza para un diseño en bloque permitiendo errores

heterocedásticos entre localidades son más apropiados que sus versiones con varianzas

residuales homogéneas a través de las localidades

Si bien para diseños balanceados el error estándar para las diferencias de medias

es el mismo para modelos con efecto de bloques fijos que para modelos con efecto de

bloques aleatorios y por tanto con ambos modelos se logra la misma diferencia de

medias, con los modelos de efectos de bloque aleatorios se amplía el espacio de

inferencia en la comparación de efectos de genotipo ya que ésta no está restringida al

conjunto de parcelas usadas en el experimento. Si además de los efectos de bloques fijos

se usa una estructura de correlación espacial (función potencia) isotrópica, la

modelación de la variabilidad espacial dentro de bloques resulta beneficiosa.

Al trabajar con modelos anisotrópico la inclusión del efecto bloque resulta

redundante. El modelo anisotrópico supera en todos los ECR al modelo isotrópico con

efecto de bloque. El modelo AR1×AR1 (función potencia anisotrópica) heterogéneo

entre localidades resultó el modelo más apropiado para la mayoría de los ECR en los

que pudo ajustarse

La modelación de las tendencias espaciales locales mediante el análisis de

varianza que incluye efecto de bloques aleatorios o estructuras de correlación espacial

en los términos de error, incrementa la capacidad de identificar diferencias entre

genotipos. Si bien en la estimación de las medias de genotipo bajo los modelos mixtos,

donde interviene la estructura de (co)varianzas se pueden producir ajuste de las medias

de genotipo, el mayor impacto de la modelación se produce a nivel de los errores

estándar usados en la comparación de medias.

112
BIBLIOGRAFÍA CITADA

Allard R.W. and Bradshaw A.D. 1964. Implications of genotype-environmental


interactions in applied plant breeding. Crop Sci. 4: 503-508.
Annicchiarico P. and Perezin M. 1994. Adaptation patterns and definition of macro-
environments for selection and recommendation of common wheat genotypes in
Italy. Plant Breed. 113: 197-205.
Aastveit H. and Martens H. 1986. ANOVA interactions by partial least squares
regression. Biometrics 42: 829-844.
ASReml. 2002. ASReml, Release 1.0. VSN International Ltd. UK
Balzarini M. 2000. Biometrical Models for Predicting Future Performance in Plant
Breeding. Thesis Ph.D. Louisiana State University, Baton Rouge, LA, USA, 268
pp.
Balzarini M. 2002. Applications of Mixed Models in Plant Breeding. In: Quantitative
Genetics, Genomics, and Plant Breeding. Kang, M.S. (ed.) CABI Publishing, New
York, pp: 353-361.
Becker H.C. and León J. 1988. Stability Analysis in Plant Breeding. Plant Breed. 101:
1-23.
Besag J.E. 1974. Spatial interaction and the statistical analysis of lattice systems. J. R.
Stat. Soc. Ser. B 36: 192-225.
Besag J.E. 1977. Errors-in-variables estimation for Gaussian lattice schemes. J. R. Stat.
Soc. Ser. B 39: 73-78.
Besag J.E. and Kempton R.A. 1986. Statistical analysis of field experiments using
neighboring plots. Biometrics 42: 231-251.
Becker H.C. 1981. Correlations among some statistical measures of phenotypic
stability. Euphytica 30: 835-840.
Bernardo R. 1994. Prediction of maize single-cross performance using RFLPs and
information from related hybrids. Crop Sci. 34: 25-30.
Bernardo R. 1996a. Best linear unbiased prediction of maize single-cross performance.
Crop Sci. 36: 50-56.
Bernardo R. 1996b. Best linear unbiased prediction of the performance of crosses
between untested maize inbreeds. Crop Sci. 36: 872-876.
Bernardo R. 1999. Best linear unbiased predictor analysis. In: The genetics and
explication of heterosys in Crops. American Society of Agronomy, Crop Science

113
Society of America, Soil Science Society of America, Madison, Wisconsin, pp:
269-276.
Boca T. 1999. Evaluación de Genotipos de Soja y Maíz Aplicando Modelos Lineales
Mixtos. Tesis de Maestría. Facultad de Agronomía, Universidad de Buenos Aires,
190 pp.
Bowman D.T. 1998. Using crop performance data to select hybrids and varieties. J.
Prod. Agric. 11: 256-259.
Breese E.L. 1969. The measurement and significance of genotype-environment
interactions in grasses. Heredity 24: 27-44.
Bridges Jr. W.C. 1989. Analysis of a plant breeding experiment with heterogeneous
variances using mixed model equations. In: Applications of Mixed Models in
Agriculture and Related Disciplines. Southern Coop. Series Bull. No. 343.
Louisiana Agric. Exp. Stn., Baton Rouge, Louisiana, pp: 145-154.
Calinski T., Czajka S. and Kaczmarek Z. 1987. A model for the analysis of a serie of
experiments repeated at several places over a period of years: I. Theor. Biul. Oc.
Odmian 12: 7-33.
Casanoves F. 1996. Interacción Genotipo-ambiente. Evaluación simultanea de modelos
usados para la evaluación de genotipos. Tesis de Maestría. Facultad de
Agronomía, UBA. 120 pp.
Casanoves F., Baldessari, J. and Balzarini M. 2004. Evaluation of Multi-environmental
Trials of Peanut (Arachis hypogaea L.) Cultivars. Crop Sci. (in press).
Casler M.D. 1999. Spatial variation affects precision of perennial cool-season forage
grass trials. Agron. J. 91: 75-81.
Chang Y.S. and Milligan S.B. 1992. Estimating the potential of sugarcane families to
produce elite genotype using bivariate cross prediction methods. Theor. Appl.
Genet. 84: 633-639.
Cochran W.G. and Cox G.M. 1957. Experimental designs. John Wiley & Sons, Inc.
London.
Cornelius P.L. 1993. Statistical test and retention of terms in the additive main effects
and multiplicative interaction models for cultivar trials. Crop Sci. 33: 1186-1193.
Cornelius P.L , Seyedsadr, M. and Crossa, J. 1992. Using the shifted multiplicative
model to search for `separability´ in crop cultivar trials. Theor. Appl. Genet. 84:
161-172.
Cornelius P.L., Crossa J. and Seyedsadr M.S. 1996. Statistical test and estimates of
multivariate models for GE interaction. In: Genotype-by-Environment Interaction.
Kang, M.S. y Gauch, H.G., Jr (eds). CRC Press, Boca Raton, Florida, pp: 199-
234.
Cornelius P.L, Van Sanford, D. A. and Seyedsardr, M. 1993. Clustering cultivars into
groups without rank-change interactions. Crop Sci. 33, 1193-1200.

114
Crossa J. 1988. A comparison of result obtained with two methods for assessing yield
stability. Theor. Appl. Genet. 75: 460-467.
Crossa J. 1990. Statistical analyses of multilocation trials. Advances in Agronomy 44:
55-85.
Crossa J., Gauch H.G. and Zobel R.W. 1990. Additive main effects and multiplicative
interaction analysis of two international maize cultivar trials. Crop Sci. 30: 493-
500.
Crossa J. and Cornellius P.L. 1993. Recent developments in multiplicative models for
cultivar trials. In: Buxton D.R., Shibles R., Forsberg R.A., Blad B.L., Asay K.H.,
Paulsen, G.M., and Wilson R.F. (eds.). International Crop Sciences I. Crop
Science Society of America, Madison, Wisconsin, pp: 199-234.
Crossa J. and Cornellius P.L. 1997. Sites regression and shifted multiplicative model
clustering of cultivar trial sites under heterogeneity of error variance. Crop Sci. 37:
405-415.
Crossa J. and Cornellius P.L. 2002. Linear-bilinear models for the analysis of genotype-
environment interaction. In: Quantitative Genetics, Genomics, and Plant Breeding.
Kang, M.S. (ed.) CABI Publishing, New York, pp: 305-322.
Crossa J., Cornellius P.L., Sayre K. and Ortiz Monasterio I.J. 1995. A shifted
multiplicative model fusion method for grouping environments without cultivar
rank change. Crop Sci. 35: 54-62.
Cruz Medina R. 1992. Some exact conditional tests for the multiplicative models to
explain genotype-environment interaction. Heredity 69: 128-132.
Cullis B.R., Gogel B.J., Verbyla A.P. and Thompson R. 1998. Spatial analysis of multi-
environment early generation trials. Biometrics 54: 1-18.
Cullis B.R. and Gleeson A.C. 1991. Spatial analysis of field experiments-an extension
to two dimensions. Biometrics 47: 1449-1460.
Cullis B.R., Thompson F.M., Fisher J.A., Gilmour A.R. and Thompson R. 1996. The
analysis of the NSW wheat variety database. II. Variance component estimation.
Theor. Appl. Genet. 92: 28-39.
Denis J-B. 1988. Two-way analysis using covariates. Statistics 19:123-132.
Draper N.R. and Smith H. 1998. Applied regression analysis. 3rd. edition. John Wiley
& Sons, New York. 706p.
Eberhart S.A. and Russell W.A. 1966. Stability parameters for comparing varieties.
Crop Sci. 6: 36-40.
Federer W.T. 1957. Variance and covariance analysis for unbalanced classifications.
Biometrics 13: 333-362.
Finlay K.W. and Wilkinson G.N. 1963. The analysis of adaptation in a plant breeding
program. Aust. J. Agric. Res. 14: 742-754.

115
Francis T.R. and Kannenberg L.W. 1978. Yield stability studies in short season maize:
I. Descriptive method for grouping genotypes. Can. J. Plant Sci. 58: 1029-1034.
Gabriel K.R. 1971. Biplot display of multivariate matrices with application to principal
components analysis. Biometrika 58: 453-467.
Gauch H.G. Jr. 1988. Model selection and validation for yield trials with interaction.
Biometrics 44: 705-715.
Gianola D. and Hammond K. 1990. Advances in Statistical Methods for Genetic
Improvement of Livestock. Gianola D. and Hammond K. (Eds.). Springer-verlag.
534 pp.
Gilmour A.R., Cullis BR, Welham S.J. and Thompson R. 1999. ASREML Reference
manual. Biometric Bulletin Nº 3, NSW Agriculture, Orange, New South Wales.
Gilmour A.R., Thompson R, Cullis B.R. and Verbyla A.P. 1997. Accounting for natural
and extraneous variation in the analysis of field experiments. J. Agric. Biol. Env.
Stat. 2: 269:273.
Gleeson A.C. and Cullis B.R. 1987. Residual Maximum Likelihood (REML) estimation
of a neighbor model for field experiments. Biometrics 43: 277-288.
Gollob H.F. (1968) A statistical model which combines features of factor analytic and
analysis of variance. Psycometrika 33: 73-115.
Gleeson A.C. and Cullis, B.R. 1987. Residual maximum likelihood (REML) estimation
of a neighbor model for field experiment. Biometrics 43: 277-288.
Gusmao L. 1886. Inadequacy of blocking in cultivar yield trials. Theor. Appl. Genet.
72:98-104.
Hanson W.D. 1970. Genotypic stability. Theor. Appl. Genet. 40: 226-231.
Harville D.A. 1990. BLUP: best linear unbiased prediction and beyond. In: Advances in
statistical methods for genetic improvement of livestock. Gianola D. y Hammond
K. (eds). Spinger Verlag, New York, pp: 239-276.
Hastie T.J. and Tibshirani R.J. 1990. Generalized Additive Models. Chapman and Hall.
New York.
Henderson C.R. 1973. Sire evaluation and genetic trends. In: Proceedings Animal
Breeding and Genetics Symposium in Honor of Dr. Jay L. Lush. American
Society of Animal Science, and American Dairy Science association, Champaign,
Illinois, pp: 10-41.
Henderson C.R. 1974. General flexibility of linear model techniques for sire evaluation.
J. Dairy Sci. 57: 963-973.
Henderson C.R. 1975. Best linear unbiased estimation and prediction under the
selection model. Biometrics 31: 423-447.
Henderson C.R. 1984. Applications of linear models in animal breeding. University of
Guelph, Ontario, Canada.

116
Hühn M. 1979. Beitrage zur erfassung der phanotypishen stabilitat I. Vorschlage einiger
auf ranginformationen beruhenden stabilitatsparameter. EDP Med. Biol. 10: 112-
117.
Hühn M. 1990. Nonparametric measures of phenotypic stability. Part 1: Theory and Part
2: Applications. Euphytica 39: 123-130.
Hill Jr. R.R. and Rosenberg J.L. 1985. Models for combining data from germplasm
evaluation trials. Crop Sci. 25: 467-470.
Info-Gen. 2003. Info-Gen, Versión 1. Facultad de Ciencias Agropecuarias, Universidad
Nacional de Córdoba, Argentina.
Jennrich R.L. and Schluchter M.D. 1986. Unbalanced repeated measures models with
structured covariance matrices. Biometrics 42: 805-820.
Kang M.S. 1990. Understanding and utilization of genotype-by-environment interaction
in plant breeding. In. Genotype-by-environment interaction in plant breeding.
Kang, M.S (ed.), pp: 52-68.
Kang M.S. 1998. Using genotype-by-environment interaction for crop cultivar
development. Adv. Agron. 62: 199-252.
Kang M.S. 2002. Genotype-environment interaction: Progress and prospects. Kang
M.S. (ed.) CABI Publishing, New York.
Kang M.S. 1990. Genotype-by-Environment Interaction and Plant Breeding. Louisiana
State University Agricultural Center, Baton Rouge, Louisiana.
Kang M.S. and Magari R. 1996. New developments in selecting for phenotypic stability
in crop breeding. In: Genotype-by-environment interaction. Kang M.S. y Gauch Jr
H.G. (eds.). CRC Press, Boca Raton, FL.
Kang M.S. and Gauch Jr H.G. 1996. Genotype by environment interaction. Kang M.S.
and Gauch Jr H.G. (eds.). CRC Press, Boca Raton, Fl.
Kempton R.A. and Lockwood G. 1984. Inter-plot competition in variety trials of field
beans (Vicia fava L.). J. Agric. Sci., Camb. 98: 599-611.
Kenward M.G. and Roger J.H. 1997. Small sample inference for fixed effects from
restricted maximum likelihood. Biometrics 53: 983-997.
Khuri A.I. Mathew T. and Sinha B.K. 1998. Statistical tests for mixed linear Models.
Wiley series in Probability and Statistics. John Wiley & Sons, Inc. New York.
352pp.
Lin C.S. Binns M.R. and Lefkovitch L.P. 1986. Stability analysis: Where do we stand?.
Crop Sci. 26: 894-900.
Lin C.S. and Binns M.R. 1988. A superiority measure of cultivar performance for
cultivarlocation data. Can. J. Plant Sci. 68:193-198.
Lin C.S. and Binns M.R. 1994. Concepts and methods for analyzing regional trial data
for cultivar and location selection. Plant Breed. Rev. 12: 271-297.

117
Littell R.C. Milliken G.A. Stroup W.W. and Wolfinger R.D. 1996. SAS System for
Mixed Models. Cary, N.C.:SAS Institute Inc. 633p.
Liu G. and Cornelius P. L. 2001. Simulations and decimal approximations of the
characteristic roots of a Wishart matrix. Com. Stat. B. 23: 145-175.
McLean R.A., Sanders W.L. and Stroup W.W. 1991. A unified approach to mixed
linear models. Am. Stat. 45: 54-64.
Macchiavelli R. and Beaver J. 1999. Analysis of genotype-by-environment interaction
with AMMI models using SAS Proc Mixed. Appl. Stat. Agric. 11: 171-183.
Martin, R.J. 1990. The use of time-series models and method in the analysis of
agricultural field trials. Com. Stat. A 19: 55-81.
Mead R. 1971. Models for interplant competition in irregularly spaced population. In:
Statistical Ecology, Patil G.P., Pielou E.C. and Waters W.E. (Eds.). Pensilvania
State University Press, College Town, Pa, pp: 13-22.
Mercer W.B. and Hall A.D. 1911. The experimental error of field trials. J. Agric. Sci.,
Camb. 4: 107-132.
Milligan S.B. 1994. Test site allocation within and among selection stages of a
sugarcane breeding program. Crop Sci. 34: 1184-1190.
Mood A.M. 1950. Introduction to the theory of statistics. Mc Graw Hill, New York.
Mrode R.A. 1996. Linear Models for the Prediction of Animal Breeding Values. CAB
International, Chippenham, Wilts, UK.
Nassar R. and Hühn M. 1987. Studies on estimation of phenotypic stability: Test of
significance for nonparametric measures of phenotypic stability. Biometrics 43:
45-53.
Osten D.W. 1988. Selection of optimal regression models via cross-validation. J.
Chemometrics 2: 39-48.
Panter D.M. and Allen F.L. 1995. Using best linear unbiased predictions to enhance
breeding for yield in soybean: I. Choosing parents. Crop Sci. 35: 397-405.
Papadakis J.S. 1937. Methode statistique pour des experiencessur champ. Institut
d’Amelioration des Plantes a Thessaloniki.
Patterson H.D. Solvey V. Talbot M. and Weatherup S.T.C. 1977. Variability of yield of
cereals varieties in UK trials. J. Agric. Sci. 89: 238-245.
Perkins J.M. and Jinks J.L. 1968. Environmental and genotype-environmental
components of variability. III. Multiple lines and crosses. Heredity 23: 339-356.
Pearce S.C. 1980. Randomized blocks and some alternatives: A study in tropical
conditions. Trop. Agric. (Trinidad) 57: 1-10.

118
Piepho H.P. 1994. Best linear unbiased prediction (BLUP) for regional yield trials: a
comparison to additive main effects multiplicative interaction (AMMI) analysis.
Theor. Appl. Genet. 89: 647-654.
Piepho H.P. 1997. Analyzing genotype-environment data by mixed models with
multiplicative effects. Biometrics 53: 761-766.
Piepho H.P. 1998. Empirical best linear unbiased prediction in cultivar trials using
factor-analytic variance-covariance structures. Theor. Appl. Genet. 97: 195-201.
Pinthus M.J. 1973. Estimate of genotypic value: A proposed method. Euphytica 22:
121-123.
Plaisted R.L. 1960. A shorter method for evaluating the ability of selections to yield
consistently over locations. Am. Potato J. 37: 166-172.
Plaisted R.L. and Peterson L.C. 1959. A technique for evaluating the ability of
selections to yield consistently in different locations or seasons. Am. Potato J. 36:
381-385.
Quinn G.P and Keough M.J. 2002. Experimental Design and Data Analysis for
Biologists. Cambridge University press, UK.
Rao C.R. 1973. Linear statistical inference and its applications. Second Edition. New
York: John Wiley and Sons.
Ripley B.D. 1981. Spatial Statistics. Wiley, New York.
Robinson G.K. 1991. That BLUP is a good thing: The estimation of random effects.
Statistical Sciences 6: 15-21.
Roemer T. 1917. Sind die ertragsreichen sorten ertragssicherer? Mitt. DLG 32: 87-89.
SAS Institute. 1997. SAS/STAT software: changes and enhancements through release
6.12. SAS Inst., Cary, NC.
SAS Institute. 2001. SAS/STAT release 8.2. SAS Inst., Cary, NC.
Saxton A.M. 1998. A macro for converting mean separation output to letter groupings
in Proc Mixed. In Proc. 23rd SAS Users Group Intl., SAS Institute, Cary, NC, pp:
1243-1246. Nashville, TN, March 22-25.
Searle S.R. 1971. Linear Models. John Wiley & Sons, New York.
Searle S.R. 1987. Linear Models for Unbalanced Data. John Wiley & Sons, New York.
Searle S.R., Casella G. and McCulloch C.E. 1992. Variance Components. John Wiley &
Sons, New York.
Seyedsadr M. and Cornelius P.L. 1992. Shifted multiplicative models for nonadditive
two-way tables. Com. Stat. Ser. B 21: 807-832.
Shukla G.K. 1972. Some statistical aspects of partitioning genotype-environmental
components of variability. Heredity 29: 237-245

119
Skroppa T. 1984. A critical evaluation of methods available to estimate the genotype-
environment interaction. Stud. For. Suec. 166: 3-14.
Smith A.B., Cullis B.R. and Thompson R. 2001. Analyzing variety by environment data
using multiplicative mixed models and adjustments for special field trend.
Biometrics 57: 1138-1147.
Smith A., Cullis B. and Thompson R. 2002a. Exploring variety-environment data using
random efects AMMI models with adjusment for spatial field trend: Part 1:
Theory. In: Quantitative Genetics, Genomics, and Plant Breeding. Kang, M.S.
(ed.) CABI Publishing, New York, pp: 323-335.
Smith A., Cullis B. Luckett D., Hollamby G. and Thompson R. 2002b. Exploring
variety-environment data using random efects AMMI models with adjustment for
spatial field trend: Part 2: Applications. In: Quantitative Genetics, Genomics, and
Plant Breeding. Kang M.S. (ed.) CABI Publishing, New York, pp: 337-351.
Stone M. 1974. Cross-validatory choice and assessment of statistical predictions. J. R.
Stat. Soc. B 36: 111-147.
Stroup W.W. 1989. Why mixed models?. In: Applications of Mixed Models in
Agriculture and Related Disciplines. Southern Coop Series Bulletin No. 343.
Louisiana Agric. Exp. Stn., Baton Rouge, Louisiana, pp. 104-112.
Stroup W.W. Baenziger P.S. and Mulitze D.K. 1994. Removing spatial variation from
wheat yield trials: A comparison of methods. Crop Sci. 34: 62-66.
Stroup W.W. 2000. Mixed models issues in the analysis of multi-location trials. In: The
XXth International Biometrics Conference, Vol. II. University of California,
Berkeley, pp. 135-142.
Van Eeuwijk F.A., Denis J-B. and Kang M.S. 1996. Incorporating additional
information on genetics and environments in models for two-way genotype by
environment interaction tables. In: Genotype-by-environment interaction. Kang
M.S. y Gauch Jr. H.G. (Eds), CRC Press, Boca Raton, FL, pp. 15-49.
Vargas M., Crossa, J., Sayre, K., Reynolds M., Ramírez, M.E. and Talbot, M. 1998.
Interpreting genptype×environment interaction in wheat using partial least squares
regression. Crop Sci. 38: 679-689.
Vargas M., Crossa J., Van Eeuwijk F.A, Sayre K.D. and Reynolds M.P. 2001.
Interpreting treatmentenvironment interaction in agronomy trials. Agron. J. 93:
949-960.
Vargas M., Crossa J., Van Eeuwijk F.A, Ramírez M.E. and Sayre K.D. 1999. Using
partial least-square regression, factorial regression, and AMMI models for
interpreting genotypeenvironment interaction. Crop Sci. 39: 955-957.
Verbek G. and Molenberghs G. 1997. Linear Mixed Models in Practice. Springer-
Verlag, Inc., New York.
Wilkinson, G.N., Eckert, S.R., Hncock, T.W. and Mayo, O. 1983. Nearest neighbor
analysis whit field experiments. J. R. Stat. Soc. Ser. B 45: 151-178.

120
White T.L., Hodge G.R. and Delorenzo M.A. 1986. Best linear prediction of breeding
values in forest tree improvement. In: Workshop of the Genetics and Breeding of
Southern Forest Trees, Southern Region Information Exchange Group 40,
Gainesville, Florida, pp. 99-122.
Whittle, P. 1954. On stationary processes in the plane. Biometrika, 41: 434-449.
Wolfinger R.D. 1993. Covariance structure selection in general mixed linear models.
Com. Stat. A 22: 1079-1106.
Wricke G. 1962. Übereine Methodezur Erfassung der ökologischen Streubreite in
Feldversuchen. Z. Pflanzenzuecht 47: 92-96.
Yan W., Hunt L. A., Sheng Q. and Szlavnics Z. 2000. Cultivar evaluation and mega-
environment investigation based on GGE Biplot. Crop Sci. 40: 597-605.
Yan W. and Hunt L.A. 2001. Genetic and environmental causes of genotype by
environment interaction for winter wheat yield in Ontario. Crop Sci. 41: 19-25.
Yan W. and Hunt L.A. 2002. Biplot analysis of multi-environment trial data. In:
Quantitative genetics, genomics and plant breeding, Kang M.S. (Ed.) CABI
Publishing, New York, pp: 289-303.
Yan W. and Kang M.S. 2003. GGE biplot analysis: A graphical tool for breeders,
geneticists and agronomists. CRC Press, Boca Raton, FL.
Yan W. and Rajcan I. 2003. Prediction of cultivar performance based on single versus
multiple-year test in soybean. Crop Sci. 43: 549-555.
Zeger S.L., Liang K.Y. and Albert P.S. 1988. Model for longitudinal data: a generalized
estimating equation approach. Biometrics 44: 1049-1060.
Zimmerman, D.L. and Harville, D.A. 1991. A random field approach to the analysis of
field plot experiments and other spatial experiments. Biometrics 47: 223-239.
Zobel W.R., Wright M.J. and Gauch H.G. 1988. Statistical analysis of a yield trial.
Agron. J. 80: 388-393.

121
ANEXO 1

RANGOS DE LOS RENDIMIENTOS DE GENOTIPOS AVANZADOS


PARTICIPANTES EN LOS ECR DEL PROGRAMA DE
MEJORAMIENTO DE MANÍ DE LA EEA-MANFREDI, INTA EN 23
AMBIENTES (CAMPAÑASSITIO)

122
Campaña 1996/97 Campaña 1997/98 Campaña 1998/99 Campaña 1999/00 Campaña 2000/01 Campaña 2001/02

Sitios S1 S2 S4 S1 S2 S4 S1 S2 S3 S4 S5 S1 S2 S3 S4 S1 S2 S3 S4 S1 S2 S3 S4
Florman 1 2 1 9 10 9 9 4 8 3 2 12 6 8 9 12 4 2 4 12 9 3 4
Tegua 4 3 2 7 11 7 11 6 9 2 3 10 5 10 6
manf393 9 6 10 6 7 3 10 10 4 8 11 3 8 1 4
mf447 3 10 7 4 5 4 8 12 3 5 6 1 2 2 2
mf457 8 9 4 10 1 5
mf478 10 11 11 8 2 2 2 11 7 7 5 7 9 5 5
mf480 11 7 3 11 3 1 3 9 1 6 1 5 1 3 1
mf484 7 8 5 3 9 10 12 8 6 11 12 6 12 4 12 11 10 11 9 10 12 9 11
mf485 6 1 6 1 6 11 5 1 2 4 7 4 7 6 10 5 11 8 5 8 10 6 9
mf486 3 7 12 7 7 5 10 5
mf487 2 5 8 5 8 8 6 3 5 2 5 2 4 12 7 9 1 1 6 11 2 5 3
mf489 5 4 9 2 4 6 4 7 12 9 9 9 10 11 3 7 2 5 3 3 11 11 10
mf496 1 6 6 2 1 1 1 6
mf499 8 3 3 1 5 8 2 7
mf505 1 2 11 12 10 11 11 7 11 6 8 7 10 4 7 12 12
mf506 7 5 10 10 8 8 3 9 8 10 9 10 8 6 4 7 8
mf508 2 12 9 11 2 3 4 2
mf510 4 5 4 12 9 6 8 1

123
ANEXO 2

VALORES DE MÁXIMA VEROSIMILITUD (-2 RES LOG


LIKELIHOOD) PARA 10 MODELOS DE RENDIMIENTOS DE
GENOTIPOS PARTICIPANTES EN LOS ECR DEL PROGRAMA DE
MEJORAMIENTO DE MANÍ DE LA EEA-MANFREDI

124
ECR Campaña BF BA BFH BAH Pow BFPow BFHPow Powa PowaH Pap
1 84/85 -83.40 -55.40 -93.60 -65.30 -77.70 -97.80 -114.50 -82.30 -96.40 129.40
1 85/86 -31.90 -0.90 -34.10 -2.60 -18.60 -39.20 -43.20 -21.90 -30.60 78.10
1 86/87 -46.60 -15.20 -51.20 -20.30 -29.10 -52.60 -66.10 -41.40 -60.10 -41.10
1 87/88 -70.40 -37.60 -83.90 -50.20 -45.00 -73.70 -98.60 -44.90 176.60
1 88/89 -62.30 -32.30 -97.90 -66.40 -72.80 -90.80 -134.00 -72.70 157.00
1 89/90 69.40 100.60 69.00 100.20 83.10 59.90 54.70 76.90 72.50 60.40
1 90/91 -36.50 -14.70 -40.40 -18.10 -31.80 -43.70 -52.40 -36.20 -47.80 68.10
1 91/92 -35.90 -19.00 -41.80 -23.90 -21.90 -36.10 -42.00 -22.30 -27.40 56.00
1 92/93 -55.30 -40.90 -58.10 -43.20 -38.50 -57.90 -67.00 38.60 -57.80 153.30
2 84/85 22.10 68.80 1.90 49.80 57.10 14.50 24.70 76.70 55.50 267.70
2 85/86 80.60 97.30 33.50 48.70 97.90 79.20 35.40 101.40 48.30 353.00
2 86/87 62.20 97.40 11.90 49.90 98.40 61.10 11.50 99.20 36.90 93.40
2 87/88 -42.40 -17.80 -45.90 -21.50 -13.20 -47.00 -56.50 -15.70 -25.70 168.50
2 88/89 -38.70 -14.60 -58.90 -32.20 -30.70 -46.10 -66.80 -33.60 113.20
2 89/90 6.10 27.80 -6.30 16.30 12.30 -2.10 -20.70 6.10 -14.40 199.40
2 90/91 37.40 56.50 23.40 43.40 56.70 37.00 20.60 51.90 22.30 164.10
2 91/92 -25.00 -1.50 -33.50 -9.80 8.80 -28.20 -39.40 6.60 -15.30 133.60
2 92/93 13.40 33.70 13.40 33.70 40.70 9.00 9.10 39.30 125.60

125

You might also like