You are on page 1of 73

Diseo y Anlisis de Experimentos en el SPSS

EJEMPLO 1. Los siguientes datos muestran las medidas de hemoglobina (gramos por 100 ml) en la sangre de 40 ejemplares de una especie de truchas marrones. Las truchas se haban dividido al azar en cuatro grupos de 10 y cada grupo se haba asignado, tambin al azar, a una de cuatro diferentes dependencias de una piscifactora. En cada criadero se aada a la dieta de los peces una cantidad distinta de sulfamerazina por cada cien libras de comida. En concreto: 0, 5, 10 y 15 gramos (codificados del 1 al 4). Las mediciones de hemoglobina se tomaron dependencia despus de 35 das.

Dependencia 1 2 3 4 6,7 9,9 10,4 9,9

Hemoglobina en sangre (gramos por 100 ml) 7,8 5,5 8,4 7,0 7,8 9,1 8,6 7,1 8,8 8,7 7,4 6,4 8,1 8,6 5,8 7,8 9,3 7,0 8,0 7,2 8,4 10,4 8,1 10,6 9,3 7,2 9,3 10,7 11,9 8,7 10,7 7,8 9,3 10,2 8,6 10,6

1.1. Entrada de datos. Una columna contendr siempre los valores de la variable dependiente o respuesta (Y), variable cuantitativa cuyos promedios en los diferentes grupos del diseo se desean comparar. Cada factor tratamiento (y anlogamente cada factor de bloqueo) tendr su propia columna en la que se registrarn sus niveles o tratamientos, preferiblemente codificados. De este modo cada fila de la hoja de datos representar los valores para una unidad experimental: en una columna figurar la respuesta y en cada una de las otras los niveles de los factores en los que se obtuvo esa respuesta. En el ejemplo hemos denominado respuest a la columna con los valores de hemoglobina en sangre (variable dependiente) y tratam a la columna con los niveles del factor tratamiento (cantidad de sulfamerazina). Estos niveles se han codificado: 0 grs.= 1, 5 grs.= 2, 10 grs.= 3 y 15 grs.= 4. En el caso de un diseo aleatorizado es conveniente crear una columna a mayores donde registrar el orden de cada caso.

1.2. Anlisis de la varianza para un nico factor tratamiento. 1.2.1. ANOVA de un factor: Especificaciones por defecto. Cuando se trata de un nico factor tratamiento, el Anlisis de la Varianza (ANOVA) se puede realizar en (ver Figura 1.1): Analizar > Comparar medias > ANOVA de un factor En el cuadro de dilogo ANOVA de un factor se introducir la variable respuest en el campo Dependientes: y tratam en el campo Factor: (ver Figura 1.2). En el supuesto de introducir ms de una variable en el campo Dependientes: se obtendra un anlisis de la varianza para cada una de las variables introducidas.

Diseo y Anlisis de Experimentos

Figura 1. 1

Figura 1.2

Por defecto, esto es ejecutando Aceptar sin modificar ninguna otra opcin., el SPSS proporcionar el ANOVA tal y como se muestra en la Tabla 1.1.

Tabla 1.1
ANOVA Hemoglobina (grs por 100 ml) Suma de cuadrados 26,803 56,471 83,274 gl 3 36 39 Media cuadrtica 8,934 1,569 F 5,696 Sig. ,003

Inter-grupos Intra-grupos Total

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS

La primera columna se refiere a las fuentes de variacin. Por Inter-grupos se entender variabilidad entre grupos o explicada por el modelo de una va (en este caso diferencias en las cantidades promedio de hemoglobina achacables a las 4 diferentes cantidades de sulfamerazina empleadas). Por Intra-grupos se entender variabilidad residual o no explicada por el modelo. Por Total variabilidad respecto de la media total computada con todos los datos con independencia del nivel del factor tratamiento. El cociente F ha resultado en este ejemplo 5,696 que, en una F con 3 y 36 grados de libertad, deja a su derecha una cola de probabilidad 0,003 (nivel crtico o p-valor del contraste ANOVA). Resulta por tanto un contraste significativo a niveles de significacin habituales (0,01, 0,05 o 0,10) y se rechaza la hiptesis de igualdad en los niveles medios de hemoglobina en sangre con las cuatro cantidades de sulfamerazina estudiadas.

Cuestin 1: Cunto vale el coeficiente de determinacin del modelo? Te parece alto o bajo? Genera una interpretacin contradictoria con la conclusin de rechazo del F-test?

1.2.2. ANOVA de un factor: Ms herramientas. El cuadro de dilogo de ANOVA de un factor (Figura 1.2) permite comprobar la existencia de has tres botones con ms herramientas de anlisis: Contrastes, Post hoc y Opciones. ANOVA de un factor > Opciones

Conduce al subcuadro de dilogo que se muestra en la Figura 1.3, donde ya han sido marcados los campos que incluyen herramientas tratadas en la asignatura.
Figura 1.3

A continuacin se describen brevemente los diferentes campos del subcuadro: Descriptivos. Proporciona estadsticos descriptivos bsicos e intervalos de confianza para las medias de las respuestas obtenidas con cada nivel del factor tratamiento y en global.

Diseo y Anlisis de Experimentos Efectos aleatorios y fijos. Al marcar este campo, el SPSS proporcionar estadsticos de inters para dos supuestos diferentes: que los niveles del factor sean de efectos fijos o de efectos aleatorios. Si se trata de efectos fijos es de inters, una vez estimadas las medias de cada grupo, conocer el error estndar del modelo estimado. Obviamente este valor coincide con la raz cuadrada de la suma de cuadrados residual promediada (intra-grupos). El SPSS proporciona este valor y adems el intervalo de confianza para la media global construido con este error estndar. Si se trata de efectos aleatorios entonces las medias estimadas para cada grupo son irrelevantes pero sigue siendo de inters conocer el error estndar del modelo estimado (de hecho esto es siempre de inters en cualquier procedimiento de modelizacin estadstica). En este caso, la varianza del modelo es la suma de dos componentes: la varianza residual y la varianza de la poblacin estadstica formada por los niveles del factor. El SPSS proporciona, igual que para efectos fijos, el error estndar de la respuesta y un intervalo de confianza para la media del modelo construido con este error estndar y, adems, una estimacin de la varianza de la poblacin de niveles del factor tratamiento. La Tabla 1.2 muestra la salida del SPSS cuando se han marcado estos dos campos.

Tabla 1.2
Descriptivos Hemoglobina (grs por 100 ml) Intervalo de confianza para la media al 95% Desv. tpica 1,0187 1,7166 1,1353 1,0005 1,4612 1,2525 Error tpico ,3221 ,5428 ,3590 ,3164 ,2310 ,1980 ,4726 Lmite inferior 6,471 8,102 8,218 7,974 8,095 8,161 7,058 Lmite superior 7,929 10,558 9,842 9,406 9,030 8,964 10,067 Varianza entre componentes

0 grs 5 grs 10 grs 15 grs Total Modelo

N 10 10 10 10 40 Efectos fijos Efectos aleatorios

Media 7,200 9,330 9,030 8,690 8,563

Mn. 5,5 6,4 7,8 7,2 5,5

Mx. 8,6 11,9 10,7 10,2 11,9

,7366

Cuestin 2: Supuesto un modelos de efectos fijos, qu diferentes caminos ha seguido el SPSS para arrojar dos estimaciones distintas de la desviacin tpica del modelo: 1,4612 y 1,2525? Cul es la estimacin ms fiable y bajo qu premisas? Cuestin 3: Por qu ha crecido el error tpico de la media global en el modelo de efectos aleatorios con respecto al modelo de efectos fijos? Cuestin 4: Tiene sentido proporcionar en el modelo de efectos aleatorios un intervalo de confianza para la media global de las respuestas?

Prueba de homogeneidad de la varianza. Se realiza la prueba de Levene al objeto de contrastar la hiptesis nula de varianzas iguales en todos los grupos (test de homoscedasticidad). Prueba importante especialmente en el supuesto de diseos no aleatorizados y no balanceados.

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS

En el ejemplo la prueba de homoscedasticidad conduce a un resultado no significativo al 5% segn se muestra en la Tabla 1.3:
Tabla 1.3
Prueba de homogeneidad de varianzas Hemoglobina (grs por 100 ml) Estadstico de Levene 1,635 gl1 3 gl2 36 Sig. ,198

Los estadsticos de Brown-Forsythe y de Welch suponen alternativas robustas al F-test para el caso en que se rechaza la hiptesis de homoscedasticidad. En ambos casos la distribucin (bajo la nula de igualdad de medias) es una F pero con grados de libertad adecuadamente corregidos. Grfico de las medias. Grfico de lneas que ubica en abscisas los cdigos de los niveles del factor tratamiento y en ordenadas los valores de los promedios observados para cada nivel (ver Figura 1.4).

Figura 1.4.

El grfico de medias sugiere un fuerte crecimiento del contenido medio de hemoglobina en sangre al pasar de 0 grs. a 5 grs. de sulfamerazina. Cantidades superiores de sulfamerazina conducen a un efecto contrario, mostrando el grfico un perfil de suave descenso (significativo?). Dos cuestiones parecen de inters: (i) diferencias no significativas para niveles altos de sulfamerazina?, (ii) relacin cuadrtica entre los niveles medios de hemoglobina respecto a la cantidad de sulfamerazina? Para profundizar en ellas exploraremos el resto de herramientas.

Diseo y Anlisis de Experimentos ANOVA de un factor > Contrastes

Permite realizar inferencia sobre contrastes personalizados, entendiendo por contraste el valor desconocido de una combinacin lineal especfica de los efectos de los niveles del factor tratamiento, donde los coeficientes de dicha combinacin suman 0:

= i i con
i

i
i

=0

Como ya ha sido descrito en las sesiones de teora, estos contrastes engloban los contrastes dos a dos (pairwise), los contrastes ortogonales de tendencia polinmica, los contrastes frente a un control, los contrastes de interaccin, El cuadro de dilogo emergente al presionar el botn Contrastes es el que se muestra en la Figura 1.5.
Figura 1.5

Existen ahora hasta dos opciones: Seleccionar un contraste de tendencia polinmica (lineal, cuadrtico, cbico, ) que, en cualquier caso, ser de orden igual o inferior a I-1 (grados de libertad de la suma de cuadrados intra-grupos), siendo I el nmero de niveles del factor tratamiento. Esta opcin slo tiene sentido cuando el factor tratamiento es cuantitativo y sus niveles representan valores concretos del mismo (generalmente equiespaciados aunque el SPSS tiene en cuenta esto para construir los contrastes). Si los grupos no tienen el mismo tamao el SPSS presenta una solucin ponderada (para conseguir pruebas ortogonales) con correcciones apropiadas sobre los tamaos muestrales. Seleccionar contrastes personalizados mediante la introduccin de los valores de los coeficientes ( 1 , 2 ,..., I ) deseados. El orden en que se introducen los coeficientes se corresponde con el orden ascendente de los cdigos de los niveles del factor tratamiento (el primer coeficiente corresponde al nivel con el cdigo menor). Es posible definir hasta 10 contrastes diferentes con un mximo de 50 coeficientes por contraste. El procedimiento es elemental. Para introducir el primer contraste: 1. Introducir el primer coeficiente en el cuadro de texto Coeficientes y a continuacin pulsar Aadir (se trasladar a la lista de la parte inferior). 2. Repetir el paso anterior para todos los coeficientes (siempre un nmero igual al de tratamientos, aadiendo ceros si es preciso). 3. Utilizar Cambiar y Borrar para modificar y eliminar los coeficientes introducidos. Para introducir un nuevo contraste pulsar Siguiente en Contraste 1 de 1.

A modo de ejemplo, la Figura 1.6 muestra como solicitar un contraste polinmico de grado 2 en el problema de las truchas y la correspondiente salida en el Visor de Resultados se muestra en la Tabla 1.4. Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS


Figura 1.6

Tabla 1.4
ANOVA Hemoglobina (grs por 100 ml) Suma de cuadrados 26,803 8,694 18,108 15,252 2,856 56,471 83,274 gl 3 1 2 1 1 36 39 Media cuadrtica 8,934 8,694 9,054 15,252 2,856 1,569 F 5,696 5,543 5,772 9,723 1,821 Sig. ,003 ,024 ,007 ,004 ,186

Inter-grupos

(Combinados) Trmino lineal

Contraste Desviacin Contraste Desviacin

Trmino cuadrtico Intra-grupos Total

Si se analiza la Tabla 1.4 obviando los bloques intermedios (Trmino lineal y Trmino cuadrtico), se observa el cuadro ANOVA para el problema inicial (comparar con Tabla 1.1). Las diferencias entre medias explican una variabilidad igual a 26,803 (de un total de 83,274) con tres (I-1) grados de libertad. Esa variabilidad se puede descomponer en la suma de tres contrastes ortogonales (independientes), cada uno de ellos con un grado de libertad: el contraste de tendencia lineal, el de tendencia cuadrtica y el de tendencia cbica. La Tabla 1.4 nos muestra que parte es explicada por cada uno de ellos y simultneamente nos informa de cules son significativos. En este caso no aparece el cbico porque no se ha solicitado. As, el bloque denominado Trmino lineal se refiere al resultado de contrastar la linealidad de las medias de hemoglobina en sangre respecto a la cantidad de sulfamerazina en la dieta. Se observa que explica un total de 8,694 (sobre 26,803 que explican los niveles en total). El resto, 18,108 (Desviacin) es achacable a los contrastes cuadrtico y cbico (cada uno de ellos tambin con un grado de libertad). De hecho, el contraste cuadrtico (Trmino cuadrtico) explica un total de 15,252. Ambos son significativos a un 5% si bien el nivel crtico ms pequeo corresponde al contraste cuadrtico tal y como se intua del grfico de medias. Cuestin 5: Tiene sentido que ambos contrastes (lineal y cuadrtico) resulten significativos?

Si interesase testar que la cantidad de hemoglobina en sangre difiere cuando se introduce sulfamerazina en la dieta, cabra plantear el contraste:

H 0 : 1 1 / 3( 2 + 3 + 4 ) = 0 frente a H 1 : 1 1 / 3( 2 + 3 + 4 ) 0
que indicaramos al SPSS como se muestra en la Figura 1.7.

Diseo y Anlisis de Experimentos

Figura 1. 7

La correspondiente salida en el Visor de Resultados se reproduce en la Tabla 1.5.


Tabla 1.5
ANOVA Hemoglobina (grs por 100 ml) Suma de cuadrados 26,803 56,471 83,274 gl 3 36 39 Media cuadrtica 8,934 1,569 F 5,696 Sig. ,003

Inter-grupos Intra-grupos Total

Coeficientes de los contrastes Niveles del factor:Cantidad de sulfamerazina 0 grs 5 grs 10 grs 15 grs 3 -1 -1 -1

Contraste 1

Pruebas para los contrastes Valor del Contraste contraste Error tpico Hemoglobina Asumiendo igualdad 1 -5,450 1,3720 (grs por 100 ml) de varianzas No asumiendo i ld d d i 1 -5,450 1,2073 t -3,972 -4,514 gl 36 19,398 Sig. (bilateral) ,000 ,000

Ntese que el primer cuadro reproduce de nuevo el ANOVA, el segundo recuerda los coeficientes del contraste (con objeto de corroborar que no se han introducido errneamente) y el tercero muestra los resultados del contraste de hiptesis de inters bajo los dos supuestos de varianzas iguales y varianzas diferentes. En ambos casos existe significacin de modo que introducir sulfamerazina genera promedios de hemoglobina en sangre significativamente superiores (obsrvese el valor negativo del contraste). Cuestin 6: Obsrvese que los coeficientes introducidos al SPSS no han sido 1, -1/3, -1/3 y -1/3 sino 3, -1, -1 y -1. Es importante? Por qu o por qu no? Cuestin 7: Por qu ahora el contraste se ha resuelto con una t de Student y no con una F como los polinmicos? Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS ANOVA de un factor > Post hoc

Si la hiptesis nula de igualdad de medias result rechazada con el F-test, interesar realizar contrastes de rango mltiple que permitan identificar las medias que difieren significativamente controlando una tasa de error global para todas las comparaciones simultneamente. El cuadro de dilogo de este epgrafe proporciona un amplio abanico de diferentes procedimientos de rango mltiple (asumiendo varianzas iguales y distintas) como se muestra en la Figura 1.8. Ntese que en particular se incluyen todos los procedimientos introducidos en las sesiones tericas.
Figura 1. 8

A modo de ejemplo se solicitan las pruebas de rango mltiple de Scheffe y de Tukey (marcar los consiguientes campos y pulsar Continuar). En el Visor de Resultados se muestran entonces las salidas reproducidas en las tablas 1.6 y 1.7. La Tabla 1.6 muestra los resultados de cada contraste individual de medias dos a dos (diferencia de medias muestrales, su error tpico, nivel crtico para el criterio seleccionado e intervalo de confianza construido para la diferencia de medias tericas tambin con el criterio seleccionado). Cuando el test particular resulta significativo la correspondiente diferencia de medias muestrales se enfatiza con un asterisco. En este ejemplo ambos criterios encuentran diferencias significativas al 5% en dos nicas comparaciones: las medias de hemoglobina en sangre con 0 grs. y 5 grs. y con 0 grs. y 10 grs. En ocasiones el detalle pormenorizado (comparacin a comparacin) puede resultar complejo de interpretar y por ello resulta ms cmoda de interpretar la salida de la Tabla 1.7, donde se obtiene un cuadro resumen de los subgrupos de medias homogneos. Las medias que figuran en una misma columna del cuadro forman un subconjunto homogneo, esto es, cualquier par de ellas non son significativamente diferentes. De hecho, la significacin que aparece a pie de columna reproduce el menor nivel crtico encontrado entre todas las comparaciones a pares de medias del subgrupo. En el ejemplo, las medias de hemoglobina para 0 y 15 grs. de sulfamerazina forman un subgrupo homogneo (el nivel crtico del test de comparacin entre ambas result 0,054 con Tukey) y las medias para 5, 10 y 15 grs. tambin forman un subgrupo homogneo (en las 3 posibles comparaciones dos a dos, el menor nivel crtico fue 0,666 con Tukey). Conviene advertir que este cuadro resumen de subconjuntos homogneos no se proporciona para todos los procedimientos.

10 Diseo y Anlisis de Experimentos


Tabla 1.6
Comparaciones mltiples Variable dependiente: Hemoglobina (grs por 100 ml) (I) Niveles del factor:Cantidad de sulfamerazina 0 grs (J) Niveles del factor:Cantidad de sulfamerazina 5 grs 10 grs 15 grs 0 grs 10 grs 15 grs 0 grs 5 grs 15 grs 0 grs 5 grs 10 grs 5 grs 10 grs 15 grs 0 grs 10 grs 15 grs 0 grs 5 grs 15 grs 0 grs 5 grs 10 grs Intervalo de confianza al 95% Lmite superior Lmite inferior -3,639 -,621 -3,339 -,321 -2,999 ,019 ,621 3,639 -1,209 1,809 -,869 2,149 ,321 3,339 -1,809 1,209 -1,169 1,849 -,019 2,999 -2,149 ,869 -1,849 1,169 -3,772 -,488 -3,472 -,188 -3,132 ,152 ,488 3,772 -1,342 1,942 -1,002 2,282 ,188 3,472 -1,942 1,342 -1,302 1,982 -,152 3,132 -2,282 1,002 -1,982 1,302

HSD de Tukey

5 grs

10 grs

15 grs

Scheff

0 grs

5 grs

10 grs

15 grs

Diferencia de medias (I-J) Error tpico -2,1300* ,5601 -1,8300* ,5601 -1,4900 ,5601 2,1300* ,5601 ,3000 ,5601 ,6400 ,5601 1,8300* ,5601 -,3000 ,5601 ,3400 ,5601 1,4900 ,5601 -,6400 ,5601 -,3400 ,5601 -2,1300* ,5601 -1,8300* ,5601 -1,4900 ,5601 2,1300* ,5601 ,3000 ,5601 ,6400 ,5601 1,8300* ,5601 -,3000 ,5601 ,3400 ,5601 1,4900 ,5601 -,6400 ,5601 -,3400 ,5601

Sig. ,003 ,012 ,054 ,003 ,950 ,666 ,012 ,950 ,929 ,054 ,666 ,929 ,006 ,024 ,088 ,006 ,962 ,729 ,024 ,962 ,946 ,088 ,729 ,946

*. La diferencia entre las medias es significativa al nivel .05.

Tabla 1.7
Hemoglobina (grs por 100 ml) Niveles del factor:Cantidad de sulfamerazina 0 grs 15 grs 10 grs 5 grs Sig. 0 grs 15 grs 10 grs 5 grs Sig. Subconjunto para alfa = .05 1 2 7,200 8,690 8,690 9,030 9,330 ,054 ,666 7,200 8,690 8,690 9,030 9,330 ,088 ,729

N 10 10 10 10 10 10 10 10

a HSD de Tukey

Scheffa

Se muestran las medias para los grupos en los subconjuntos homogneos. a. Usa el tamao muestral de la media armnica = 10,000.

Cuestin 8: Cmo es posible que la media de hemoglobina en sangre con 15 grs. pertenezca a dos subgrupos homogneos de medias diferentes?

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 11 EJEMPLO 2. Se planifica un experimento para estudiar el efecto del nivel del agua sobre la longitud global del tallo de dos tipos de plantas de guisantes. Se utilizaron tres niveles de agua y los datos se recogen en la siguiente tabla (en rojo figura el orden temporal de la toma de datos).

Nivel de agua
Nivel 1 Nivel 2 107,5 96,1 103,6 100,7 102,3 88,1 85,8 86,0 87,5 81,0 (02) (08) (18) (21) (26) (06) (10) (17) (25) (29) Nivel 3 123,1 125,2 125,7 121,0 122,9 109,0 101,1 103,2 109,7 106,1 (11) (16) (19) (20) (30) (03) (09) (12) (14) (28)

Tipo de planta

Tipo 1

Tipo 2

71,3 75,1 69,0 73,2 74,4 70,4 73,2 71,1 71,2 69,2

(01) (04) (05) (07) (22) (13) (15) (23) (24) (27)

2.1. Descripcin del plan experimental, modelo y estimacin puntual. Existen 2 factores tratamiento: Nivel de agua (con tres niveles de efectos fijos) y Tipo de planta (con dos niveles de efectos fijos). Los niveles se cruzan formando un total de 6 tratamientos o condiciones experimentales distintas. Para cada tratamiento se obtienen 5 respuestas de la variable Crecimiento de la longitud del tallo de otras tantas unidades experimentales. Se crea as un diseo balanceado (equirreplicado de 5 rplicas), aleatorizado y de tamao 30. Al disponer de rplicas es posible contrastar la existencia de interaccin entre los niveles de los dos factores tratamiento, de modo que el modelo matemtico es el propio de un diseo completo de dos vas:

yijt = ij + ijt ,
donde:

y ijt denota el crecimiento observado para la t-sima planta (t=1,,5) del i-simo tipo (i=1,2) y
tratada con el j-simo nivel de agua (j=1,2,3), ij denota el crecimiento promedio para las plantas del tipo i (i=1,2) que son tratadas con el nivel de agua j (j=1,2,3), ijt denota la parte de la respuesta yijt no explicada por el modelo. Se asume que los ijt son todos ellos independientes e idnticamente distribuidos segn una N (0, ) .

Equivalentemente, haciendo ij = + ij , se tiene:

y ijt = + ij + ijt
donde:

denota el crecimiento promedio con independencia de las condiciones experimentales, ij = ij denota el efecto en el crecimiento respecto del promedio para las plantas del tipo i
(i=1,2) que son tratadas con el nivel de agua j (j=1,2,3).

12 Diseo y Anlisis de Experimentos En el modelo completo de dos vas, el efecto celda se descompone ij = i + j + ( )ij , de modo que el modelo toma la forma:

yijt = + i + j + ( )ij + ijt

donde: i denota el efecto en el crecimiento respecto a la media propio de las plantas del i-simo tipo (i=1,2) y con independencia del nivel de agua empleado, j denota el efecto en el crecimiento respecto a la media propio de las plantas tratadas con el j-simo nivel de agua (j=1,2,3), con independencia del tipo de planta, ( )ij denota el efecto de la interaccin entre el i-simo tipo de planta y el j-simo nivel de agua.

Todas las representaciones anteriores del modelo son equivalentes. La estimacin mnimo-cuadrtica de ij = y ij. . ij es nica: la media de las respuestas en la celda (ij ) , esto es: La estimacin de la constante (llamada en el SPSS Interseccin) y de los efectos no es nica, siendo necesario imponer restricciones. En los modelos anteriores, de acuerdo a la interpretacin dada (los efectos se

= i = computan respecto al promedio global ), las restricciones han sido j


i j i j

( )

ij

= 0,

resultando los estimadores:

= y... ij = y ij. y... , para todo i, j , ij = i = y i.. y... , para todo i ,

( )

= y y , para todo j , j . j. ...


ij

= y y ( y y ) y y = y y y + y , para todo i, j i = ij j ij . ... i.. ... . j. ... ij . i.. . j. ...

En el SPSS se plantea el mismo modelo pero los efectos se computan con las restricciones

= I = J

( ) = ( )
Ij

iJ

= 0, para todo i, j , siendo I y J los ltimos cdigos de los niveles de cada

factor tratamiento. En el ejemplo, la ltima condicin experimental es: tipo 2 de planta ( I = 2 ) y nivel de agua 3 ( J = 3 ), por lo tanto, las restricciones son:

= 2 = 3

( ) = ( )
21

22

( ) = ( ) = ( )
23 13

23

= 0.

Ntese que con este criterio tanto los estimadores de los efectos como su interpretacin como difieren de los obtenidos con el primer criterio. Los efectos en el SPSS se estiman como sigue:

= y IJ . ij IJ = yij. y IJ . , ij = i = yi.. y I ..

( )

=y y , j . j. .J .
ij

= y y (y y ) y y = y y y + y I = ij J ij . IJ . i.. I .. . j. .J . ij . i.. . j. ...

de modo que los parmetros deben interpretarse como sigue: ij es el efecto en el crecimiento de las plantas del tipo i (i=1,2) tratadas con el nivel de agua j (j=1,2,3) respecto al crecimiento promedio de las plantas de tipo 2 tratadas con nivel de agua 3. i denota el efecto en el crecimiento de las plantas del i-simo tipo (i=1,2) respecto de las plantas del tipo 2, con independencia del nivel de agua empleado, Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 13

j denota el efecto en el crecimiento de las plantas tratadas con el j-simo nivel de agua (j=1,2,3),
respecto a las tratadas con el nivel de agua 3, con independencia del tipo de planta, ( )ij denota el efecto de la interaccin entre el i-simo tipo de planta y el j-simo nivel de agua.

Con este criterio para los efectos es sencillo escribir el modelo matemtico utilizando variables dummy como sigue:

yijt = IJ + i X i + j Z j + ( )ij X i Z j + ijt ,


i =1 j =1 i =1 j =1

I 1

J 1

I 1 J 1

siendo X i la variable que toma el valor 1 cuando la respuesta tuvo lugar en el nivel i del primer factor tratamiento y 0 en otro caso, y Z j la variable que toma el valor 1 si la respuesta se tom en el nivel j del segundo factor tratamiento y 0 en otro caso. 2.2 Entrada de datos. Se crean 4 columnas: nivel (con valores 1, 2 y 3 y etiquetas de valor Nivel, Nivel 2 y Nivel 3, respectivamente), tipo (con valores 1 y 2 y etiquetas de valor Tipo 1 y Tipo 2, respectivamente), orden (recogiendo los dgitos en rojo de la tabla de datos) y crecimiento (recogiendo las respuestas adecuadamente en consonancia con orden, tipo y nivel adecuados). El editor de datos quedara como se muestra en la Figura 2.1 (etiquetas de valor activado).
Figura 2.1

14 Diseo y Anlisis de Experimentos

2.3 Anlisis de la varianza para varios factores tratamiento. 2.3.1 Cuadro de dilogo principal: Solucin por defecto. Como se muestra en la Figura 2.2, seleccionar la opcin Analizar > Modelo lineal general > Univariante
Figura 2.2

Aparecer el cuadro de dilogo que se muestra en la Figura 2.3.


Figura 2.3

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 15 Se solicita cubrir los siguientes campos: Dependiente Introducir la variable respuesta (necesariamente cuantitativa y unidimensional). En el ejemplo se introducir la variable crecimiento. Factores fijos: Introducir las variables conteniendo los niveles de los factores tratamiento con efectos fijos (niveles especficamente seleccionados ya que sus efectos sobre la respuesta desean ser comparados y son el objeto de la investigacin). Introducir tantas variables como factores tratamiento. En el ejemplo dos variables: tipo y nivel. Factores aleatorios: Introducir las variables conteniendo los niveles de los factores tratamiento con efectos aleatorios (los niveles son una muestra aleatoria de una poblacin mayor y por ello no son el objetivo de la investigacin ya que la inferencia se realiza sobre la poblacin y no sobre la muestra). Introducir tantas variables como factores tratamiento. En el ejemplo ninguna variable es de efectos aleatorios por lo que este campo quedar vaco. Covariables: Introducir las covariables (factor de control en el modelo no categrico sino ccontinuo). En el ejemplo no hay covariables por lo que este campo quedar vaco. Ponderacin MCP: Variable de pesos para computar los estimadores mnimo cuadrticos de manera ponderada. De utilidad cuando no se tiene homoscedasticidad. Entrando las variables como se ha especificado y pulsando Aceptar se obtiene la salida por defecto que se muestra en la Tabla 2.1.
Tabla 2.1

Factores inter-sujetos Etiqueta del valor Tipo 1 Tipo 2 Nivel 1 Nivel 2 Nivel 3 N 15 15 10 10 10

Tipo de planta Nivel de agua

1 2 1 2 3

Pruebas de los efectos inter-sujetos Variable dependiente: Crecimiento longitud del tallo Suma de cuadrados tipo III 10664,110a 262024,456 1062,075 9200,201 401,834 202,424 272890,990 10866,534 Media cuadrtica 2132,822 262024,456 1062,075 4600,100 200,917 8,434

Fuente Modelo corregido Interseccin tipo nivel tipo * nivel Error Total Total corregida

gl 5 1 1 2 2 24 30 29

F 252,874 31066,410 125,923 545,402 23,821

Significacin ,000 ,000 ,000 ,000 ,000

a. R cuadrado = ,981 (R cuadrado corregida = ,977)

16 Diseo y Anlisis de Experimentos El cuadro Factores inter-sujetos proporciona un resumen de las etiquetas de valor de cada nivel y el nmero de observaciones de cada nivel. El cuadro Prueba de los efectos inter-sujetos proporciona el cuadro ANOVA. Lo proporciona para dos posibles descomposiciones de la suma de cuadrados global segn que en el modelo la respuesta aparezca en bruto (Suma de Cuadrados Total) o con la constante sustrada (Suma de Cuadrados Corregida). En efecto, el modelo en bruto es:

yijt = + i + j + ( )ij + ijt

y corregido sustrayendo la constante:

y ijt = i + j + ( )ij + ijt

En el primer caso la descomposicin de la suma de cuadrados es:


2 2 2 yijt = y... + ( yi.. y... ) + y. j. y...
i =1 j =1 t =1 i =1 j =1 t =1 I J T i =1 j =1 t =1 i =1 j =1 t =1 T I J T I J T I J T I J T

)2 +

+ yij. yi.. y. j. + y...


i =1 j =1 t =1

)2 + (yij. y... )2
I J i =1 j =1 t =1

que de acuerdo a la notacin del problema en el SPSS equivale a: SC Total = SC Interseccin + SC tipo + SC nivel + SC tipo*nivel + SC Error En el modelo corregido:

(yijt y... )
I J T i =1 j =1 t =1

= ( yi.. y... )2 + y. j.. y...


i =1 j =1 t =1 I J T i =1 j =1 t =1

)2 +

+ yij. yi.. y. j. + y...


i =1 j =1 t =1

)2 + (yij. y... )2
I J T i =1 j =1 t =1

que, en trminos de la notacin del SPSS es: SC Total corregida = SC tipo + SC nivel + SC tipo*nivel + SC Error Aclarada la procedencia de las sumas de cuadrados, se describe a continuacin la utilidad del cuadro ANOVA: En primer lugar nos centramos en la fila del Error: SC Error =

(yij. y... )
2 3 5
i =1 j =1 t =1

= 202,424

2 = 202,424/24 = 8,434. Este Los grados de libertad son 24 y por tanto la SCM Error es
valor es la estimacin insesgada de la varianza del error ( Var ijt = 2 ). Ser el denominador para todas las pruebas F del cuadro ANOVA. La fila de la fuente de variacin denominada Interseccin proporciona el resultado del contraste H 0 : = 0 frente a H 1 : 0 1. Para ello se evala primero el valor de: SC Interseccin = y... = 262024,456 SCM Interseccin = 262024,456
2 2 3 5

( )

i =1 j =1 t =1

En el cuadro ANOVA, por Interseccin el SPSS entiende el valor de la media terica global. Sin embargo, en el apartado de Estimacin de los parmetros, por Interseccin el SPSS entiende el valor de la media de la combinacin de niveles con los ltimos cdigos.
1

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 17 A continuacin, el cociente: SCM Interseccin / SCM Error = 262024,456/8,434=31066,41

que, en una F1, 24 , conduce a un p valor igual a 0. Por tanto se rechaza la nula y se concluye que el crecimiento promedio de las plantas, con independencia de tipo de planta y de nivel de agua, es significativamente mayor que cero. El resultado es desde luego el esperado en nuestro ejemplo pero, de hecho, ser lo habitual. En general suele carecer de inters testar si la constante del modelo es significativamente distinta de cero o no y por ello es frecuente ver el cuadro ANOVA asociado al modelo lineal corregido. Las filas de las fuentes de variacin denominadas tipo, nivel, tipo*error y Error son las ya estudiadas relativas a efectos marginales y efectos interaccin. Primero se contrasta la hiptesis nula de no existencia de efecto interaccin H 0 : ( )ij = cte, i, j , calculando: SC tipo*nivel =

(yij. yi.. y. j. + y... )


2 3 5

= 401,834

i =1 j =1 t =1

SCM tipo*nivel = 401,834 / 2 = 200,917 El cociente: SCM tipo*nivel / SCM Error = 200,917 / 8,434=23,821 que, en una F2, 24 , conduce a un p valor igual a 0. Se rechaza la nula concluyendo que existe interaccin significativa. El crecimiento promedio depende de la combinacin concreta tipo de planta y nivel de agua empleado, de tal modo que no es posible comparar niveles de agua sin considerar el tipo de planta ni comparar tipos de planta sin considera los niveles de agua. Al no poder testar los efectos marginales las filas tipo y nivel del cuadro carecen de inters. La fila de la fuente de variacin denominada Modelo corregido se refiere a la suma de cuadrados explicada por la totalidad del modelo una vez sustrada la media global, esto es: SC Modelo corregido = SC tipo + SC nivel + SC tipo*nivel Coincide claramente con la SC Inter-grupos de un modelo de una va cuyos niveles son: tipo*nivel de agua. Por tanto, su significacin estadstica debe interpretarse en la lnea de afirmar que existen diferencias en el crecimiento segn que combinacin de tipo de planta y nivel de agua se considere. En resumen, el modelo apropiado es: y ijt = + ij + ijt , no debiendo considerar la

descomposicin ij = i + j + ( )ij .

La estimacin de Var ijt = 2 es 8,434 y la estimacin de los efectos debe ser encontrada en un ANOVA de una va. A pie de cuadro se proporciona el Coeficiente de determinacin o R cuadrado que se obtiene dividiendo SC Modelo corregido entre SC Total corregida. En este caso arroja un valor igual a 0,981, muy alto que incide en la alta capacidad predictiva del modelo yijt = + ij + ijt .

( )

18 Diseo y Anlisis de Experimentos Cuestin 9: Cmo seran las frmulas de las sumas de cuadrados en un modelo factorial completo balanceado de tres factores? Cuestin 10: Repetir el ejercicio como si hubiese un nico factor tratamiento con seis niveles: 1 (tipo 1 nivel de agua 1), 2 (tipo 1 nivel de agua 2), 3 (tipo 1 nivel de agua 3), 4 (tipo 2 nivel de agua 1), 5 (tipo 2 nivel de agua 2) y 6 (tipo 2 nivel de agua 3). Comprobar que no se modifica la varianza residual ni el coeficiente de determinacin. Prueba esto que se trata del mismo modelo? En qu estriban entonces las diferencias?

2.3.2 Herramientas: Seleccin del modelo Analizar > Modelo lineal general > Univariante > Modelo
Figura 2.4

En este cuadro es posible construir el modelo de inters introduciendo los factores tratamiento y sus interacciones a nuestro antojo. Por defecto est el modelo Factorial completo (que incluye a todos los factores tratamiento introducidos previamente y a todas sus interacciones). Si se desea un modelo alternativo, por ejemplo un modelo de dos vas principales (esto es, sin interaccin) entonces: 1. Marcar Personalizado. Se activan los campos que le siguen. 2. En Construir trminos seleccionar Efectos principales, marcar tipo (F) en el campo Factores y covariables y pulsar la flecha en Construir trminos. El factor tipo (F) ya formar parte del modelo al aparecer en el campo Modelo. 3. Hacer lo propio con el factor nivel (F). Dejar por defecto Suma de cuadrados Tipo III. Es el procedimiento ms utilizado. Proporciona la descomposicin de las sumas de cuadrados tal y como se ha visto en las sesiones de teora. La suma de cuadrados Tipo III explicada por un factor A es igual a la diferencia entre la suma de cuadrados residual del modelo completo (con todos los factores) sin el factor A y la suma de cuadrados residual del modelo completo. Es independiente del orden de introduccin de los factores tratamiento y produce una descomposicin ortogonal de modo que las sumas de cuadrados suman la suma de cuadrados total.

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 19 En ocasiones tambin es de utilidad la Suma de cuadrados Tipo I. Se conoce como el mtodo de descomposicin jerrquica de la suma de cuadrados. La suma de cuadrados Tipo I explicada por un factor A es igual a la diferencia entre la suma de cuadrados residual del modelo construido con los factores incluidos hasta ese momento menos el factor A y la suma de cuadrados residual del modelo con A incluido. Cuando el diseo es balanceado la descomposicin en suma de cuadrados Tipo III coincide con la descomposicin en suma de cuadrados Tipo I.

2.3.3 Herramientas: Contrastes personalizados Analizar > Modelo lineal general > Univariante > Contrastes
Figura 2.5

En este epgrafe es posible realizar inferencia sobre contrastes ( = i i


i

con

i
i

= 0)

personalizados. De entrada se proporcionan en este cuadro de dilogo una serie de contrastes que pueden resultar de inters sobre los efectos marginales. El procedimiento es: 1. Elegir en el cuadro Factores: el factor tratamiento sobre cuyos niveles se ejecutarn los contrastes. Por ejemplo, marcar nivel(Ninguno). 2. Ir a Contraste:, abrir la persiana del subcuadro y seleccionar la familia de contrastes de inters. Pulsar entonces el botn Cambiar. Por ejemplo, si se selecciona Desviacin, al pulsar Cambiar aparecer el contenido del subcuadro Factores: ese modificar y aparecer nivel(Desviacin). 3. Para algunos contrastes es posible modificar la categora o nivel de referencia. Las familias de contrastes posibles son: Contrastes Desviacin Familia de I 1 contrastes comparando el efecto de cada nivel del factor (menos el de referencia) con el efecto promedio global. Esto es: para 1 i I 1 si la categora de referencia es la ltima o para 2 i I si la categora de referencia es la primera.
(i ) H0 : i = 0 frente a H 1(i ) : i 0 ,

20 Diseo y Anlisis de Experimentos Contrastes Simples Familia de I 1 contrastes comparando el efecto de cada nivel del factor con el efecto del nivel elegido como referencia. Esto es: para 2 i I si la categora de referencia es la primera o bien para 1 i I 1 si la categora de referencia es la ltima. Contrastes Diferencia Familia de I 1 contrastes comparando el efecto de cada nivel del factor (menos el primero) con el efecto promedio de las niveles anteriores. Esto es:
(1) H0 : 2 1 = 0 frente H 1(1) : 2 1 0 , 1 1 ( 2) H0 : 3 ( 1 + 2 ) = 0 frente H 1( 2) : 3 ( 1 + 2 ) 0 , , 2 2 1 ( I 1) ( 1 + 2 + ... + I 1 ) = 0 frente H 1( I 1) : I 1 ( 1 + 2 + ... + I 1 ) 0 H0 : I I 1 I 1 (i ) H0 : i 1 = 0 frente H 1(i ) : i 1 0 ,

(i ) H0 : i I = 0 frente H 1(i ) : i I 0 ,

Contrastes Helmert Familia de I 1 contrastes comparando el efecto de cada nivel del factor (menos el ltimo) con el efecto promedio de las niveles subsiguientes. Esto es:

1 ( 2 + 3 + ... + I ) = 0 frente H 1(1) : 1 1 ( 2 + 3 + ... + I ) 0 I 1 I 1 1 ( 2) ( 3 + 4 + ... + I ) = 0 frente H 1( 2) : 2 1 ( 3 + 4 + ... + I ) 0 , , H0 : 2 I 2 I 2 ( I 1) ( I 1) H0 : I 1 I = 0 frente H 1 : I 1 I 0


(1) H0 :1

Contrastes Repetidos Familia de I 1 contrastes comparando efectos de pares de niveles adyacentes: cada uno (excepto el primero) con el que le precede. Esto es: (1) H0 : 2 1 = 0 frente H 1(1) : 2 1 0 ,
( 2) H0 : 3 2 = 0 frente H 1( 2) : 3 2 0 , ,
( I 1) H0 : I I 1 = 0 frente H 1( I 1) : I I 1 0

Contrastes Polinmicos Familia de I 1 contrastes ortogonales de tendencia polinmica (lineal, cuadrtico, cbico, , hasta grado I 1 ).

Cuestin 11: De todas las familias de contrastes incluidas en este apartado del SPSS y asumiendo que se trata de un diseo balanceado, cules estn formadas por contrastes ortogonales? En presencia de interaccin los contrastes deben realizarse sobre los niveles combinados y no sobre los efectos marginales. En otros trminos, no es informativo ejecutar este procedimiento con interaccin significativa. Este es el caso del problema que se est a resolver, sin embargo, slo a los efectos de ejemplificar y mostrar la salida que genera esta herramienta, supongamos que se desea realizar los contrastes de Helmert para los efectos del factor tratamiento nivel de agua. La salida en el Visor de resultados sera la que se muestra en la Tabla 2.2.

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 21


Tabla 2.2
Resultados del contraste (matriz K) Variable dependiente Crecimiento longitud del tallo -32,470 0 -32,470 1,125 ,000 -34,791 -30,149 -20,840 0 -20,840 1,299 ,000 -23,521 -18,159

Nivel de agua contraste de Helmert Nivel 1 - Anterior

Estimacin del contraste Valor hipotetizado Diferencia (Estimado - Hipotetizado) Error tp. Significacin Intervalo de confianza al 95 % para diferencia

Lmite inferior Lmite superior

Nivel 2 - Nivel 3

Estimacin del contraste Valor hipotetizado Diferencia (Estimado - Hipotetizado) Error tp. Significacin Intervalo de confianza al 95 % para diferencia

Lmite inferior Lmite superior

Resultados de la prueba Variable dependiente: Crecimiento longitud del tallo Fuente Contraste Error Suma de cuadrados 9200,201 202,424 gl 2 24 Media cuadrtica 4600,100 8,434 F 545,402 Significacin ,000

Los contrastes de Helmert son 2 en este caso:


(1) H0 : 1

1 ( 2 + 3 ) = 0 frente H 1(1) : 1 1 ( 2 + 3 ) 0 2 2

( 2) H0 : 2 3 = 0 frente H 1( 2) : 2 3 0

siendo i el efecto marginal del nivel de agua i -simo. La resolucin particular de cada uno de ellos se realiza, bajo el supuesto de independencia y normalidad, mediante la t de Student con un nmero de grados de libertad igual al empleado para estimar el error. En general: Rechazar H 0 : i i = 0 (con
i

i
i

= 0 ) al nivel de significacin si:

ii
i

SCMR
i

i2
ni

t g .l .( SCMR ),

i la media muestral de las ni observaciones en el i -simo nivel y SCMR la suma de cuadrados siendo media residual.

22 Diseo y Anlisis de Experimentos Como el cuadrado de una t de Student con g.l. grados de libertad es igual en distribucin a una F de Fisher2 Snecdecor con 1 y g.l. grados de libertad ( t g .l . = F1, g .l . ), el criterio de rechazo anterior puede escribirse

(elevando al cuadrado) como: Rechazar H 0 : i i = 0 (con


i

i
i

= 0 ) al nivel de significacin si:

2 ii i i i ni SCMR
El valor de ii i
CONTRASTE

F 1, g .l .( SCMR ),

i2

i i .
i

se denomina SUMA DE CUADRADOS EXPLICADA POR EL ni

La Tabla 2.2 proporciona la resolucin de los dos contrastes de Helmert en base a la t (cuadro titulado Resultados del contraste (matriz K)) y adems facilita la suma de cuadrados de los dos contrastes para el test F (cuadro titulado Resultados de la prueba). La interpretacin de cada uno de los subcuadros del cuadro Resultados del contraste (matriz K) en la Tabla 2.2 es la que sigue: a) El valor estimado para 1

1 ( 2 + 3 ) es -32,470 (el efecto estimado del primer nivel de agua 2

sobre el crecimiento fue inferior al efecto promedio de los otros dos niveles), con un error tpico igual a 1,125. Esta diferencia estimada (-32,470) dividida de su error tpico estimado (1,125) conducen a un valor extremo en la cola izquierda de una t de Student con 24 grados de libertad (los mismos con los que se estim el error del modelo), arrojando un nivel crtico (Significacin en terminologa del SPSS) igual a cero y por tanto se rechaza H 0 : 1
(1)

1 ( 2 + 3 ) = 0 . El intervalo de confianza al 95% 2

1 ( 2 + 3 ) es ( -23,521 , -18,159 ). 2 b) El valor estimado para 2 3 ,es -20,840 (el efecto estimado del segundo nivel de agua sobre el
para 1 crecimiento fue inferior al efecto del tercer nivel), con un error tpico igual a 1,299. Estas estimaciones
( 2) conducen de nuevo a un nivel crtico igual a cero y por tanto se rechaza H 0 : 2 3 = 0 . El

intervalo de confianza al 95% para 2 3 es ( -34,791 , -30,149 ). El segundo cuadro (Resultados de la prueba) proporciona la suma de cuadrados explicada por los dos contrastes Helmert y el correspondiente F -test con dos (un grado de libertad por contraste) y 24 grados de libertad que muestra la significacin estadstica conjunta de ambos contrastes.

Cuestin 12: Cmo se obtiene el error tpico de la estimacin de 1

1 ( 2 + 3 ) ? 2

Cuestin 13: Por qu la suma de cuadrados de los dos contrastes Helmert (9200,201) coincide con la suma de cuadrados explicada por diferencias entre niveles de agua del cuadro ANOVA (ver Tabla 2.1)? Cuestin 14: Qu parte de 9200,201 es achacable al primer contraste Helmert y qu parte al segundo?

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 23 Adems de los contrastes descritos, es posible realizar tambin inferencia sobre contrastes concretos que puedan ser de inters. Para ello sin embargo es preciso acudir al editor de sintaxis y utilizar las instrucciones: CONTRAST primero y SPECIAL despus. Supngase por ejemplo que se desea resolver uno de los contrastes anteriores:
(1) H0 : 1

1 ( 2 + 3 ) = 0 frente H 1(1) : 1 1 ( 2 + 3 ) 0 2 2

empleando el editor de sintaxis. La manera ms sencilla de emplear ocasionalmente en editor de sintaxis es a travs del botn Pegar de los cuadros de dilogo. Una vez seleccionadas las opciones del cuadro de dilogo, al pulsar Pegar se abre una ventana conteniendo la sintaxis de las instrucciones indicadas. Si, por ejemplo, en el cuadro de dilogo Analizar > Modelo lineal general > Univariante (ver Figura 2.3) se introducen nicamente las variables tipo y nivel en el campo Factores fijos: y crecimiento en el campo Dependiente: y, a continuacin, se pulsa en Pegar, entonces se abrir la ventana de sintaxis que se muestra en la Figura 2.6.
Figura 2.6

Sintaxis que viene a indicar que se ejecutar un procedimiento ANOVA de una va (comando UNIANOVA), con variable respuesta crecimiento y factores tipo y nivel (comnado BY), con suma de cuadrados de tipo III (lnea de comandos /SSTYPE(3)=SSTYPE(3)), Si sobre esa sintaxis quitamos el ltimo punto (que indica el final del conjunto de instrucciones) y aadimos la lnea: /CONTRAST(nivel) = SPECIAL(1 -0.5 -0.5) .

daremos al SPSS la instruccin precisa para resolver el contraste planteado. Bastar entonces, desde esa misma ventan de sintaxis, pulsar el botn Ejecutar y luego Todo.

24 Diseo y Anlisis de Experimentos 2.3.4 Herramientas: Contrastes post hoc Analizar > Modelo lineal general > Univariante > Post hoc Ofrece la posibilidad de realizar contrastes de rango mltiple con los niveles de aquellos factores tratamiento que se desee. Como en el epgrafe de contraste personalizados, las comparaciones post hoc para los efectos marginales slo deben realizarse en el supuesto de no interaccin. Es preciso introducir los factores de inters y luego marcar los criterios de rango mltiple deseados. En la Figura 2.7se describe el cuadro de dilogo para solicitar los procedimientos de Tukey y Bonferroni para los niveles del factor tratamiento Nivel de Agua y ninguno para el otro factor.
Figura 2.7

2.3.5 Herramientas: Grficos de perfil Analizar > Modelo lineal general > Univariante > Grficos
Figura 2.8

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 25 Genera grficos de las medias muestrales unidas por segmentos. Procedimiento: Para obtener un grfico de las tres medias estimadas para los niveles del factor Nivel de Agua (Figura 2.9) 1. Marcar nivel en el campo Factores:. 2. Pulsar el botn de la flecha de entrada al campo Eje horizontal. 3. Pulsar el botn Aadir, en el campo Grficos:. El factor nivel se incorporar al campo Grficos: .
Figura 2.9

Medias marginales estimadas de Crecimiento longitud del tallo

120,00

Medias marginales estimadas

110,00

100,00

90,00

80,00

70,00 Nivel 1 Nivel 2 Nivel 3

Nivel de agua

Repetir el procedimiento marcando inicialmente el factor tipo para obtener un grfico de las medias estimadas para los dos niveles del factor tratamiento tipo de planta. (Figura 2.10)
Figura 2.10

Medias marginales estimadas de Crecimiento longitud del tallo

100,00

Medias marginales estimadas

97,50

95,00

92,50

90,00

87,50 Tipo 1 Tipo 2

Tipo de planta

26 Diseo y Anlisis de Experimentos Para visualizar el denominado grfico de interaccin entre los dos factores tratamiento (Figura 2.11), proceder como sigue: 1. 2. 3. 4. 5. Marcar nivel en el campo Factores:. Pulsar el botn de la flecha de entrada al campo Eje horizontal. Marcar tipo en el campo Factores:. Pulsar el botn de la flecha de entrada al campo Lneas distintas. Pulsar el botn Aadir, en el campo Grficos:. En el campo nivel*tipo, que se refiere al grfico de interaccin.

Grficos: aparecer

Figura 2.11

Medias marginales estimadas de Crecimiento longitud del tallo

130,00

Tipo de planta
Tipo 1 Tipo 2

Medias marginales estimadas

120,00

110,00

100,00

90,00

80,00

70,00 Nivel 1 Nivel 2 Nivel 3

Nivel de agua

Se observa en la Figura 2.11 que aparentemente no existe interaccin entre tipos de planta y los dos ltimos niveles de agua: el crecimiento del tipo 1 ha sido superior en igual longitud promedio tanto con el nivel 2 como con el 3 de agua y, anlogamente, el nivel 3 de agua fue igual de mejor para el crecimiento con independencia del tipo de planta. Este comportamiento no se ha mantenido sin embargo con el nivel 1 de agua y aqu est la posible interaccin. Probablemente el nivel 1 de agua sea el menos exitoso pero es especialmente malo su comportamiento para el tipo 1 de plantas.

Cuestin 15: Se propone el siguiente ejercicio. Resolver el mismo ejemplo tratado en la presente seccin pero seleccionando un modelo de dos vas de efectos principales (esto es, sin interaccin entre los dos factores tratamiento). Pedir en cualquier caso la realizacin del grfico de interaccin. Observars que no es el mismo que en el caso del modelo completo (ver Figura 2.11). De hecho ahora las lneas son exactamente paralelas. Cmo es ello posible si se trabaja con los mismos datos? Qu conclusin obtienes de este ejercicio?

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 27 2.3.6 Herramientas: Opciones Analizar > Modelo lineal general > Univariante > Opciones La sentencia anterior nos sita en el cuadro de dilogo que se muestra en la Figura 2.12.
Figura 2.12

En el campo Medias marginales estimadas se podr indicar al SPSS que nos proporcione estimaciones de las medias de todos los niveles de una fuente de variacin de inters (o sea de factores incluidos en el diseo o interaccin de factores, sean estas interacciones incluidas o no en el diseo). Para ello, se trasladarn las fuentes de inters desde la lista Factores e interacciones de los factores a la lista Mostrar las medias para:. OJO! No se obtendrn necesariamente las medias muestrales de los correspondientes niveles sino las construidas a partir de los parmetros estimados para el modelo propuesto. Por ejemplo, el cuadro de medias estimadas para los niveles de la interaccin tipo*nivel no es el mismo para un modelo completo que para un modelo de efectos principales (corroborando as lo apuntado para los grficos de interaccin en la Cuestin 15). Comparar los efectos principales Al marcar esta opcin el SPSS realizar las comparaciones de medias dos a dos (pairwise comparisons) de todos los niveles de los efectos principales con tres posibles criterios que se seleccinarn en la lista desplegable de Ajuste del intervalo de confianza. El criterio MDS (Mnima Diferencia Significativa) consiste simplemente en utilizar el criterio de la t de Student para comparar dos muestras independientes y por tanto no se controla la tasa de error de tipo I global. Las otras dos opciones Bonferroni y Sidak suponen diferentes correcciones para controlar esa tasa de error global y son recomendables cuando haya que realizar un nmero muy grande de comparaciones dos a dos. Volviendo al ejemplo, en un modelo factorial completo, un cuadro de dilogo como el de la Figura 2.13 dar lugar en el Visor de Resultados a una salida como la que se muestra en las Tabla 2.3, 2.4 y 2.5.

28 Diseo y Anlisis de Experimentos


Figura 2.13

Tabla 2.3

1. Tipo de planta
Estimaciones Variable dependiente: Crecimiento longitud del tallo Intervalo de confianza al 95%. Lmite Lmite inferior superior 97,859 100,954 85,959 89,054

Tipo de planta Tipo 1 Tipo 2

Media 99,407 87,507

Error tp. ,750 ,750

Comparaciones por pares Variable dependiente: Crecimiento longitud del tallo Intervalo de confianza al 95 a % para diferencia Lmite Lmite inferior superior 9,711 14,089 -14,089 -9,711

(I) Tipo de planta Tipo 1 Tipo 2

(J) Tipo de planta Tipo 2 Tipo 1

Diferencia entre medias (I-J) 11,900* -11,900*

Error tp. 1,060 1,060

Significacin ,000 ,000

Basadas en las medias marginales estimadas. *. La diferencia de las medias es significativa al nivel ,05. a. Ajuste para comparaciones mltiples: Diferencia menos significativa (equivalente a la ausencia de ajuste).

Contrastes univariados Variable dependiente: Crecimiento longitud del tallo Suma de cuadrados 1062,075 202,424 gl 1 24 Media cuadrtica 1062,075 8,434 F 125,923 Significacin ,000

Contraste Error

Cada prueba F contrasta el efecto simple de Tipo de planta en cada combinacin de niveles del resto de los efectos mostrados. Estos contrastes se basan en las comparaciones por pares, linealmente independientes, entre las medias marginales estimadas.

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 29


Tabla 2.4

2. Nivel de agua
Estimaciones Variable dependiente: Crecimiento longitud del tallo Intervalo de confianza al 95%. Lmite superior Lmite inferior 69,915 73,705 91,965 95,755 112,805 116,595

Nivel de agua Nivel 1 Nivel 2 Nivel 3

Media 71,810 93,860 114,700

Error tp. ,918 ,918 ,918

Comparaciones por pares Variable dependiente: Crecimiento longitud del tallo Intervalo de confianza al 95 a % para diferencia Lmite superior Lmite inferior -24,731 -19,369 -45,571 -40,209 19,369 24,731 -23,521 -18,159 40,209 45,571 18,159 23,521

(I) Nivel de agua Nivel 1 Nivel 2 Nivel 3

(J) Nivel de agua Nivel 2 Nivel 3 Nivel 1 Nivel 3 Nivel 1 Nivel 2

Diferencia entre medias (I-J) -22,050* -42,890* 22,050* -20,840* 42,890* 20,840*

Error tp. 1,299 1,299 1,299 1,299 1,299 1,299

Significacin ,000 ,000 ,000 ,000 ,000 ,000

Basadas en las medias marginales estimadas. *. La diferencia de las medias es significativa al nivel ,05. a. Ajuste para comparaciones mltiples: Diferencia menos significativa (equivalente a la ausencia de ajuste).

Contrastes univariados Variable dependiente: Crecimiento longitud del tallo Suma de cuadrados 9200,201 202,424 gl 2 24 Media cuadrtica 4600,100 8,434 F 545,402 Significacin ,000

Contraste Error

Cada prueba F contrasta el efecto simple de Nivel de agua en cada combinacin de niveles del resto de los efectos mostrados. Estos contrastes se basan en las comparaciones por pares, linealmente independientes, entre las medias marginales estimadas.

Tabla 2.5
3. Tipo de planta * Nivel de agua Variable dependiente: Crecimiento longitud del tallo Intervalo de confianza al 95%. Lmite superior Lmite inferior 69,919 75,281 99,359 104,721 120,899 126,261 68,339 73,701 82,999 88,361 103,139 108,501

Tipo de planta Tipo 1

Tipo 2

Nivel de agua Nivel 1 Nivel 2 Nivel 3 Nivel 1 Nivel 2 Nivel 3

Media 72,600 102,040 123,580 71,020 85,680 105,820

Error tp. 1,299 1,299 1,299 1,299 1,299 1,299

30 Diseo y Anlisis de Experimentos Observar que, por ejemplo y de acuerdo con la Tabla 2.5, el crecimiento medio estimado del tallo de las plantas de tipo 1 tratadas con el nivel de agua 1 es 72,60. En el modelo factorial completo este crecimiento medio se obtiene mediante:

+ 11 = + 1 + 1 + ( )11

luego su estimador se calcula a travs de las estimaciones mnimo-cuadrticas de sus parmetros que son (ver Seccin 2.1):

+ ( ) = y + ( y y ) + ( y y ) + ( y y y + y ) = y = 72,60 1 + + 1 ... 1.. ... .1. ... 11. 1.. .1. ... 11. 11
concluyendo que, para este modelo, la estimacin coincide con la media muestral de los crecimientos alcanzados con las plantas de tipo 1 tratadas con nivel de agua 1. Sin embargo, en un modelo de efectos principales (sin interaccin), el crecimiento medio del tallo de las plantas de tipo 1 tratadas con el nivel de agua 1 responde a la expresin paramtrica:

+ 11 = + 1 + 1
que se estima como:

= y + ( y y ) + ( y y ) = y + y y = 99,407 + 71,81 93,457 = 77,76 1 + + 1 ... 1.. ... .1. ... 1.. .1. ...
es decir, crecimiento medio con las plantas de tipo 1 ms crecimiento medio de las plantas tratadas con nivel de agua 1 menos crecimiento medio global. El resultado ahora no coincide por tanto con la media muestral de las observaciones del nivel estudiado. Para un modelo de efectos principales, el cuadro anlogo al mostrado por la Tabla 2.5 para un modelo factorial completo puede verse en la Tabla 2.6 y se puede comprobar que aparece la estimacin 77,76.
Tabla 2.6
3. Tipo de planta * Nivel de agua Variable dependiente: Crecimiento longitud del tallo Intervalo de confianza al 95%. Lmite Lmite inferior superior 74,142 81,378 96,192 103,428 117,032 124,268 62,242 69,478 84,292 91,528 105,132 112,368

Tipo de planta Tipo 1

Tipo 2

Nivel de agua Nivel 1 Nivel 2 Nivel 3 Nivel 1 Nivel 2 Nivel 3

Media 77,760 99,810 120,650 65,860 87,910 108,750

Error tp. 1,760 1,760 1,760 1,760 1,760 1,760

En el campo Mostrar se puede marcar diferentes opciones: Estadsticos descriptivos Proporciona la media muestral, la desviacin tpica muestral y el tamao para cada nivel y combinacin de niveles (ver Tabla 2.7). Estimaciones del tamao del efecto Marcando esta opcin se aade al cuadro ANOVA el coeficiente 2 para cada fuente de variacin includa en el modelo. Este coeficiente se define para una fuente de variacin FV como:

2 (FV ) =

SC (FV ) SC (FV ) + SC (Error )

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 31


Tabla 2.7
Estadsticos descriptivos Variable dependiente: Crecimiento longitud del tallo Tipo de planta Tipo 1 Nivel de agua Nivel 1 Nivel 2 Nivel 3 Total Nivel 1 Nivel 2 Nivel 3 Total Nivel 1 Nivel 2 Nivel 3 Total Media 72,6000 102,0400 123,5800 99,4067 71,0200 85,6800 105,8200 87,5067 71,8100 93,8600 114,7000 93,4567 Desv. tp. 2,47487 4,16509 1,90184 21,80722 1,45671 2,79231 3,68741 14,99212 2,08777 9,24785 9,76046 19,35738 N 5 5 5 15 5 5 5 15 10 10 10 30

Tipo 2

Total

es por tanto una estimacin de la proporcin de varianza explicada por diferencias entre los niveles de la fuente de variacin FV una vez eliminado el efecto de las otras fuentes de variacin includas en el modelo. Cuestin 16: Reflexionar sobre la similitud y las diferencias entre los coeficientes 2 (FV ) y R 2 (FV ) (coeficiente de determinacin parcial para la fuente de variacin FV ). Potencia observada Marcando esta opcin se aade al cuadro ANOVA una nueva columna con el valor de la potencia del F -test para cada fuente de variacin includa en el modelo. El valor de la potencia se entender como la capacidad de la prueba de hiptesis para, con un nivel de significacin igual al prefijado, detectar una diferencia real (poblacional) entre los niveles de la fuente de variacin igual a la diferencia observada en las muestras. Si en nuestro ejemplo se marcan las casillas Estimaciones del tamao del efecto y Potencia observada, entonces el cuadro ANOVA en el Visor de Resultados ser el que se muestra en la Tabla 2.8.
Tabla 2.8
Pruebas de los efectos inter-sujetos Variable dependiente: Crecimiento longitud del tallo Suma de cuadrados Fuente tipo III Modelo corregido 10664,110b Interseccin 262024,456 tipo 1062,075 nivel 9200,201 tipo * nivel 401,834 Error 202,424 Total 272890,990 Total corregida 10866,534 a. Calculado con alfa = ,05 b. R cuadrado = ,981 (R cuadrado corregida = ,977) Eta al Media cuadrado Parmetro de Potencia a F Significacin parcial no centralidad observada cuadrtica 2132,822 252,874 ,000 ,981 1264,369 1,000 262024,456 31066,410 ,000 ,999 31066,410 1,000 1062,075 125,923 ,000 ,840 125,923 1,000 4600,100 545,402 ,000 ,978 1090,804 1,000 200,917 23,821 ,000 ,665 47,643 1,000 8,434

gl 5 1 1 2 2 24 30 29

32 Diseo y Anlisis de Experimentos Se observan coeficientes 2 altos para todas las fuentes de variacin, siendo el menor el correspondiente a la interaccin (0,665). En todos los casos la potencia es igual a 1, lo que sugiere una alta capacidad del test para rechazar la nula con diferencias reales iguales a las observadas. Estimaciones de los parmetros Marcando esta opcin se obtendr un cuadro con las estimaciones de los parmetros del modelo. La salida en el Visor para los datos del ejemplo se muestra en la Tabla 2.9.
Tabla 2.9
Estimaciones de los parmetros Variable dependiente: Crecimiento longitud del tallo

Parmetro Interseccin [tipo=1] [tipo=2] [nivel=1] [nivel=2] [nivel=3] [tipo=1] * [nivel=1] [tipo=1] * [nivel=2] [tipo=1] * [nivel=3] [tipo=2] * [nivel=1] [tipo=2] * [nivel=2] [tipo=2] * [nivel=3]

B 105,820 17,760 0b -34,800 -20,140 0b -16,180 -1,400 0b 0b 0b 0b

Error tp. 1,299 1,837 . 1,837 1,837 . 2,598 2,598 . . . .

t 81,476 9,669 . -18,946 -10,965 . -6,229 -,539 . . . .

Signif. ,000 ,000 . ,000 ,000 . ,000 ,595 . . . .

Intervalo de confianza al 95%. Lmite Lmite inferior superior 103,139 108,501 13,969 21,551 . . -38,591 -31,009 -23,931 -16,349 . . -21,541 -10,819 -6,761 3,961 . . . . . . . .

Eta al cuadrado parcial ,996 ,796 . ,937 ,834 . ,618 ,012 . . . .

Parmetro de no centralida d 81,476 9,669 . 18,946 10,965 . 6,229 ,539 . . . .

Potencia a observada 1,000 1,000 . 1,000 1,000 . 1,000 ,081 . . . .

a. Calculado con alfa = ,05 b. Al parmetro se le ha asignado el valor cero porque es redundante.

Atendiendo a la interpretacin de los parmetros estimados por el SPSS expuesta en la ltima parte de Seccin 2.1, la informacin de la Tabla 2.9 puede esquematizarse como sigue: 1. Los parmetros que se igualan a 0 por redundantes son: 2. Los dems se estiman y resulta: = y 23. = 105,820 a.

2 = 3 = ( )21 = ( )22 = ( )23 = ( )13 = ( )23 = 0

1 = y1.. y 2.. = 17,760 b.


c.

= y y = 34,800 , = y y = 20,140 1 .1. .3. 2 .2. .3. d. ( )11 = y11. y1.. y.1. + y... = 16,180 , ( )12 = y 21. y1.. y 21. + y... = 1,400

3. El modelo estimado se resume (empleando variables dummy) como: siendo:

y = 105,82 + 17,760 X 1 34,800 Z1 20,140 Z 2 16,180 X 1 Z1 1,400 X 1 Z 2 + ,

4. Excepto para ( )12 , en todos los dems casos los parmetros son significativamente distintos de cero y por tanto tienen peso significativo en el modelo estimado. Master Oficial en Tcnicas Estadsticas

X 1 = 1 si la respuesta se toma a una planta de tipo 1 y X 1 = 0 en otro caso, Z1 = 1 si la respuesta se toma a una planta tratada con el nivel 1 de agua y Z1 = 0 en otro caso, Z 2 = 1 si la respuesta se toma a una planta tratada con el nivel 2 de agua y Z 2 = 0 en otro caso.

Diseo y Anlisis de Experimentos en el SPSS 33 5. Es habitual describir el modelo estimado poniendo debajo de los coeficientes su error tpico o el nivel crtico del correspondiente contraste:

y = 105,82 + 17,760 X 1 34,800 Z1 20,140 Z 2 16,180 X 1 Z1 1,400 X 1 Z 2 + , ( 1,299) ( 1,837 ) ( 1,837 ) ( 1,837 ) ( 2,598) ( 2,598) ( 2,904) ( p = 0) ( p = 0) ( p = 0) ( p = 0) ( p = 0) ( p = 0,595)
6. La Tabla 2.9 proporciona adems los intervalos de confianza para cada parmetro y los coeficientes

2 y potencia observada para cada contraste de los parmetros.


Pruebas de homogeneidad Ofrece los resultados de la prueba de Levene para testar la hiptesis nula de igualdad de varianzas de la variable respuesta en todas las poblaciones definidas por combinaciones de los niveles de los factores (ver Tabla 2.10).
Tabla 2.10
Contraste de Levene sobre la igualdad de las varianzas error Variable dependiente: Crecimiento longitud del tallo F 1,130 gl1 5 gl2 24 Significacin ,372
a

Contrasta la hiptesis nula de que la varianza error de la variable dependiente es igual a lo largo de todos los grupos. a. Diseo: Intercept+tipo+nivel+tipo * nivel

La Prueba de Levene en la Tabla 2.10 conduce a un estadstico igual a 1,130 que en una F5, 24 deja a su derecha una cola de probabilidad 0,372. Se concluye no rechazar la hiptesis nula de homogeneidad de varianzas de la variable crecimiento del tallo en las 6 poblaciones definidas por cada combinacin de tipo de planta y nivel de agua considerados, validando as una de las hiptesis estructurales del modelo propuesto. Diagramas de dispersin x nivel Complementa el epgrafe anterior aportando informacin grfica sobre la homogeneidad de varianza. El diagrama consiste en un grfico de puntos: cada punto representa una poblacin (combinacin de niveles) de modo que su abscisa es la media y su ordenada la desviacin tpica (Figura 2.14) o la varianza (Figura 2.15). El objetivo es detectar si la varianza depende de la media (es frecuente comprobar que la respuesta crezca cuando lo hace la media: Var ( y ) = k y s ) lo cul se pondra de manifiesto en este grfico.
Figura 2.14
Diagramas de dispersin por nivel de Crecimiento longitud del tallo

Figura 2.15
Diagramas de dispersin por nivel de Crecimiento longitud del tallo

Dispersin (Desviacin tpica)

4
15

Dispersin (Varianza)
70,00 80,00 90,00 100,00 110,00 120,00 130,00

10

1
70,00 80,00 90,00 100,00 110,00 120,00 130,00

Nivel (Media)
Grupos: tipo * nivel

Nivel (Media)
Grupos: tipo * nivel

34 Diseo y Anlisis de Experimentos Las figuras 2.14 y 2.15 no muestran tendencias claras. Se observa que los niveles con mayor y menor crecimiento medio conducen a desviaciones tpicas muy semejantes y, aparentemente, no parece claro que la dispersin de ambos grficos pueda achacarse a una relacin determinista, lo que concuerda con el hecho de que la prueba de Levene no encontrara significacin estadstica. Grfico de los residuos Grfico matricial de puntos enfrentando: Valores Observados de la variable respuesta. Valores Pronosticados por el modelo estimado para la variable respuesta. Residuos (valores observados menos valores pronosticados por el modelo estimado). Para ser precisos, los residuos se muestran tipificados (esto es divididos por la raz cuadrada del error cuadrtico medio estimado). Este grfico matricial da una idea de si se verifican los supuestos de independencia, homogeneidad de varianzas y falta de ajuste. En efecto: Si existe independencia, el grfico de dispersin Residuos-Observados no debera mostrar pauta de variacin sistemtica (lnea, curva, ). Si existe homoscedasticidad, el grfico de dispersin Residuos-Pronosticados es tambin de inters ya que la dispersin de los residuos debe ser similar para todos los valores pronosticados. Si el modelo utilizado ofrece un buen ajuste a los datos, entonces la nube de puntos Pronosticados-Observados debiera mostrar un perfil cercano a la linealidad (cuanto ms lineal mejor ajuste). Para el ejemplo del crecimiento de las plantas, el grfico de residuos asociado al modelo factorial completo es el que se muestra en la Figura 2.16.
Figura 2.16

Variable dependiente: Crecimiento longitud del tallo

Residuo tp.

Pronosticado

Observado

Observado

Pronosticado

Residuo tp.

Modelo\: Interseccin + tipo + nivel + tipo * nivel

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 35 Se observa que la nube Residuos-Observados (grfico de coordenadas (1,3) o (3,1) en la matriz) se dispersa formando un crculo, lo que redunda en su aleatoriedad y por tanto en corroborar la hiptesis de independencia. La nube Residuos-Pronosticados (grfico de coordenadas (2,3) o (3,2) en la matriz) muestra una dispersin semejante para cada valor pronosticado. Algo mayor para las medias pronosticadas en lugar 4 y 5 en orden creciente (tal y como se apreciaba en los diagramas de dispersin de las figuras 2.14 y 2.15) pero sin relevancia aparente. Por ltimo, la nube Pronosticados-Observados (grfico de coordenadas (1,2) o (2,1) en la matriz) se ajusta a una relacin lineal, probando as el buen nivel de ajuste del modelo estimado.

Cuestin 17: Construir el grfico de residuos para este mismo ejemplo pero ajustando un modelo de efectos principales (sin interaccin). Compararlo con el de la Figura 2.16. Qu modelo presenta un mejor grado de ajuste? Existe homoscedasticidad en este caso? E independencia? Cuestin 18: Supngase que para un determinado experimento con dos factores tratamiento el modelo de efectos principales M1 es ms adecuado que un modelo factorial completo M2. Entonces, presenta necesariamente M1 un mejor nivel de ajuste a las observaciones que M2?

36 Diseo y Anlisis de Experimentos EJEMPLO 3. Se realiza una investigacin para comparar la concentracin de mercurio en el encfalo, la musculatura y los tejidos oculares de truchas expuestas a dosis subletales (0,30 unidades txicas) de metilo de mercurio. Diez truchas seleccionadas aleatoriamente arrojaron las siguientes concentraciones (en microgramos de mercurio por gramo de tejido): Tejido Nmero de trucha 1 2 3 4 5 6 7 8 9 10 Encfalo 1,65 1,37 1,48 1,40 1,61 1,59 1,22 1,66 1,49 1,67 Musculatura 0,98 1,17 1,05 1,45 0,96 1,00 1,24 1,01 0,86 1,13 Ojo 0,49 0,40 0,44 0,55 0,43 0,39 0,43 0,57 0,87 0,52

3.1. Descripcin del plan experimental, modelo y estimacin puntual. Las fuentes de variacin controladas en este experimento son: Un factor tratamiento: Tejido, con tres niveles de efectos fijos: Encfalo, Musculatura y Ojo. Un factor de bloqueo: Trucha, del que se han tomado de modo aleatorio 10 bloques o niveles de bloqueo (10 ejemplares). Se trata de bloques completos (de tamao 3, igual al nmero de niveles del factor tratamiento) pero no aleatorizados. La variable respuesta o dependiente es Concentracin de mercurio (en microgramos por gramo de tejido). Al tratarse de bloques completos de tamao igual al nmero de niveles del factor tratamiento no es posible testar la existencia de interaccin entre el factor tratamiento y el factor de bloqueo, de modo que el modelo matemtico es anlogo al de un diseo de dos vas de efectos principales con una sola rplica:

y ih = + i + h + ih ,
donde:

y ih denota la concentracin de mercurio evaluada en el tejido i-simo ( i = 1,2,3 ) de la h -sima trucha ( h = 1,2,...,9,10 ).

denota la concentracin media de mercurio, i denota el efecto diferencial (respecto a la media ) en la concentracin de mercurio del tejido i-

ellos independientes e idnticamente distribuidos segn una N (0, ) .

simo, h denota el efecto diferencial (respecto a la media ) en la concentracin de mercurio de la h sima trucha, ih denota la parte de la respuesta yih no explicada por el modelo. Se asume que los ih son todos

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 37 Como en la seccin anterior, los estimadores por mnimos cuadrados de ih = + i + h son nicos,

ih = y i. + y.h y.. . Sin embargo existen infinitas soluciones para estimar los resultando en este caso:
parmetros , i y h , siendo necesario imponer restricciones. De acuerdo a la interpretacin anterior, es

= 0 , resultando los estimadores: i = habitual imponer las restricciones: h


= y.. i = yi. y.. , para todo i , = y y , para todo h ,


h
.h ..

= 0, I = En el SPSS se plantea el mismo modelo pero los efectos se computan con las restricciones H siendo I y H los ltimos cdigos de los niveles del factor tratamiento y del factor bloque respectivamente. En el ejemplo, la ltima condicin experimental es: tejido 3 ( I = 3 ) y trucha 10 ( H = 10 ), por lo tanto, las restricciones son:
= 0. 3 = 10
Con este criterio los efectos en el SPSS se estiman como sigue:

= y I . + y.H y IH , i = y i. y I . , para todo i ,

h = y.h y.H , para todo h .

Y su interpretacin es:

denota la concentracin de mercurio en el tejido codificado con el 3 de la dcima trucha, i denota la diferencia entre la concentracin media de mercurio del tejido i-simo y la
concentracin media de mercurio del tejido 3, h denota la diferencia entre la concentracin media de mercurio para la j-sima trucha y la concentracin media de mercurio de la trucha 10.

El modelo matemtico utilizando variables dummy es:

yih = IH + i X i +
i =1

I 1

H 1 h =1

h Z h + ih ,

siendo X i la variable que toma el valor 1 cuando la concentracin de mercurio se tom en el tejido i y 0 en otro caso, y Z h la variable que toma el valor 1 si la concentracin de mercurio se tom a la h -sima trucha y 0 en otro caso.

3.2 Entrada de datos. Se crean 3 columnas: tejido (con valores 1, 2 y 3 y etiquetas de valor Encfalo, Musculatura y Ojo, respectivamente), trucha (con valores numricos de 1 a 10 y etiquetas de valor Trucha 1,, Trucha 10, respectivamente), y mercurio (recogiendo las respuestas adecuadamente en consonancia con orden, tipo y nivel adecuados).

38 Diseo y Anlisis de Experimentos

El editor de datos quedara como se muestra en la Figura 3.1 (etiquetas de valor activadas).
Figura 3.1

3.3 Anlisis de un diseo bloqueado. En el SPSS el anlisis de la varianza de un diseo en bloques se realiza como si los factores de bloqueo fuesen factores tratamiento. Es procedente sin embargo obviar en el cuadro ANOVA resultante la informacin relativa a la prueba F de igualdad de efectos bloque ya que, en general, carece de sentido esta prueba. Para tener una idea de la conveniencia o no del bloqueo es habitual inspeccionar el coeficiente de determinacin parcial asociado al factor de bloqueo. Las instrucciones para el SPSS son por tanto las que se resumen a continuacin.

3.3.1 Instrucciones para desarrollar el anlisis. 1. En Analizar > Modelo lineal general > Univariante cubrir los campos como se indica en la Figura 3.2. Es irrelevante introducir el factor de bloqueo (trucha) como de efectos fijos o de efectos aleatorios ya que no interesa realizar contraste alguno sobre sus niveles. 2. Pulsar el botn Modelo y cubrir el cuadro de dilogo emergente como se muestra en la Figura 3.3. Pulsar Continuar. 3. Dejaremos el botn Contrastes sin activar ya que no se pide un contraste personalizado de inters sobre los efectos del factor tejido. Obviamente no se realizarn contrastes sobre los efectos de los bloques. Pulsar Continuar. 4. Pulsar el botn Grficos y solicitar los grficos de perfil para el factor tratamiento (tejido) y el factor de bloqueo (trucha) siguiendo los pasos explicitados en la seccin 2.3.5. Pulsar Continuar. Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 39


Figura 3.2

Figura 3.3

5. Pulsar el botn Post hoc para realizar las comparaciones dos a dos de las medias de concentracin de mercurio en los tres tipos de tejido analizados atendiendo a controlar la tasa de error de tipo I global. De nuevo incidir en que no se solicitarn comparaciones post hoc para los bloques. En este caso, al tratarse de slo 3 niveles de tejido podra tener sentido el criterio de Bonferroni. Seleccionaremos Bonferroni, Scheff, Duncan y Tukey (ver Figura 3.4). Pulsar Continuar. 6. Pulsar el botn Opciones y marcar las herramientas detalladas en la seccin 2.3.6 (ver Figura 3.5). Pulsar Continuar. 7. Por ltimo pulsar el botn Aceptar y en el cuadro de dilogo principal Univariante.

40 Diseo y Anlisis de Experimentos


Figura 3.4

Figura 3.5

3.3.2 Resultados del anlisis. Las rdenes introducidas dan lugar a la salida de resultados que figura en forma de rbol en el panel de la izquierda del Visor de Resultados (ver Figura 3.6) y que se detallan en el panel de la derecha. En lo que sigue se interpretan los resultados siguiendo el esquema de rbol de la Figura 3.6.

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 41


Figura 3.6

Advertencia. Se informa que los diagramas de dispersin de algunas combinaciones de niveles de

factores no se pueden construir por tener menos de dos observaciones. Obviamente se refiere en este caso a cualquier combinacin [nivel de tejido bloque (trucha)] ya que se tiene un nico dato y en consecuencia dispersin 0.
Estadsticos descriptivos. Por defecto se muestran las medias y desviacin tpica para cada

combinacin [nivel de tejido trucha] que, al estar formadas por una nica observacin, son la propia observacin y 0 respectivamente. Es por ello preferible manipular la tabla pivote para una presentacin de los estadsticos de mayor inters. Por ejemplo: Situar el cursor sobre la tabla, pulsar el botn derecho y pulsar la opcin Paneles de pivotado. En el nuevo cuadro emergente situar el cursos sobre la segunda roseta del campo Filas, presionar y mantener presionado entonces el botn izquierdo del ratn para comprobar que se trata de la roseta relativa a Nmero de trucha y, si es as, arrastrar esta roseta al campo denominado Capa. 3. Si en el nuevo formato de tabla se selecciona la opcin Total en el men desplegable Nmero de trucha, la apariencia de la tabla ser entonces la mostrada en la Tabla 3.1, que proporciona informacin sobre medias, desviaciones tpicas y tamaos muestrales para cada nivel del factor tratamiento (tejido). 4. Si esta misma operacin se realiza arrastrando la primera roseta (relativa a Tejido) y no la segunda como antes, entonces resulta la Tabla3.2, que proporciona informacin sobre medias, desviaciones tpicas y tamaos muestrales para cada bloque (trucha).
1. 2.

42 Diseo y Anlisis de Experimentos


Tabla 3.1
Estadsticos descriptivos Variable dependiente: Concentracin de mercurio Nmero de trucha: Total Tejido Encfalo Musculatura Ojo Total Media 1,5140 1,0850 ,5090 1,0360 Desv. tp. ,14946 ,16926 ,14122 ,44429 N 10 10 10 30

Tabla 3.2
Estadsticos descriptivos Variable dependiente: Concentracin de mercurio Tejido: Total Nmero de trucha Trucha 1 Trucha 2 Trucha 3 Trucha 4 Trucha 5 Trucha 6 Trucha 7 Trucha 8 Trucha 9 Truchas 10 Total Media 1,0400 ,9800 ,9900 1,1333 1,0000 ,9933 ,9633 1,0800 1,0733 1,1067 1,0360 Desv. tp. ,58232 ,51215 ,52259 ,50580 ,59102 ,60003 ,46199 ,54836 ,36088 ,57535 ,44429 N 3 3 3 3 3 3 3 3 3 3 30

Contraste de Levene sobre la igualdad de las varianzas error. Este contraste no

puede realizarse en este caso porque tiene en cuenta siempre tantos grupos como combinaciones de factores existan. Al ser as y disponer tan slo de una observacin por grupo no quedan grados de libertad suficientes para estimar el error y no puede realizarse la prueba F del cuadro ANOVA. De ah el resultado que se muestra en la Tabla 3.3, donde las celdas para el estadstico F y para el nivel crtico (Significacin) aparecen vacas y los grados de libertad del denominador (gl2) son iguales a 0.
Tabla 3.3
Contraste de Levene sobre la igualdad de las varianzas error(a) Variable dependiente: Concentracin de mercurio gl1 gl2 Significacin . 29 0 . Contrasta la hiptesis nula de que la varianza error de la variable dependiente es igual a lo largo de todos los grupos. a Diseo: Intercept+tejido+trucha F

Pruebas de los efectos inter-sujetos. Proporciona el cuadro ANOVA que se muestra en la

Tabla 3.4. Al objeto no tener en consideracin la prueba F para los efectos bloque (trucha) es recomendable vaciar de contenido las celdas relativas a la misma y visualizar el ANOVA como se muestra en la Tabla 3.5.

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 43


Tabla 3.4
Pruebas de los efectos inter-sujetos Variable dependiente: Concentracin de mercurio Suma de cuadrados tipo III 5,181b 32,199 5,086 ,094 ,544 37,923 5,725 Media cuadrtica ,471 32,199 2,543 ,010 ,030 Eta al cuadrado parcial ,905 ,983 ,903 ,148 Parmetro de no centralidad 171,417 1065,417 168,293 3,123 Potencia a observada 1,000 1,000 1,000 ,130

Fuente Modelo corregido Interseccin tejido trucha Error Total Total corregida

gl 11 1 2 9 18 30 29

F 15,583 1065,417 84,147 ,347

Sig. ,000 ,000 ,000 ,946

a. Calculado con alfa = ,05 b. R cuadrado = ,905 (R cuadrado corregida = ,847)

Tabla 3.5
Pruebas de los efectos inter-sujetos Variable dependiente: Concentracin de mercurio Suma de cuadrados tipo III 5,181b 32,199 5,086 ,094 ,544 37,923 5,725 Media cuadrtica ,471 32,199 2,543 ,030 Eta al cuadrado parcial ,905 ,983 ,903 Parmetro de no centralidad 171,417 1065,417 168,293 Potencia a observada 1,000 1,000 1,000

Fuente Modelo corregido Interseccin tejido trucha Error Total Total corregida

gl 11 1 2 9 18 30 29

F 15,583 1065,417 84,147

Sig. ,000 ,000 ,000

a. Calculado con alfa = ,05 b. R cuadrado = ,905 (R cuadrado corregida = ,847)

En este caso, la descomposicin de la suma de cuadrados para el modelo en bruto ( y ih = + i + h + ih ) es:


2 2 = y.. + ( y i. y.. ) + ( y.h y.. ) yih 2 i =1 h =1 i =1 h =1 i =1 h =1 i =1 h =1 I H I H I H I H 2

+ y ih y i. y. j + y..
i =1 h =1

)2

que, de acuerdo a la notacin del SPSS, equivale a: SC Total = SC Interseccin + SC Tejido + SC Trucha + SC Error 37,923 = 32,199 + 5,086 + 0,094 + 0,544

Para el modelo corregido ( y ih = i + h + ih ):

( yih y.. )
i =1 h =1

= ( yi. y.. )2 + ( y.h y.. )2 + y ih y i. y. j + y..


i =1 h =1 i =1 h =1 i =1 h =1

)2

que, en trminos de la notacin del SPSS, equivale a: SC Total corregida = SC Tejido + SC Trucha + SC Error 5,725 = 5,086 + 0,094 + 0,544

44 Diseo y Anlisis de Experimentos Las conclusiones seran:


1.

La estimacin insesgada de la varianza del error ( Var ( ih ) = 2 ) es la SC Error dividida por sus grados de libertad. Por tanto:

2 = 0,544/18 = 0,030 SCM Error =


2.

La hiptesis nula de que no hay diferencias entre las concentraciones medias de mercurio de los tres tejidos considerados H 0 : 1 = 2 = 3 = cte, se contrasta a travs del cociente: SCM tejido / SCM Error = 2,543 / 0,030 = 84,147 que, en una F2,18 , conduce a un p valor igual a 0. Se rechaza la nula concluyendo que existen diferencias en las concentraciones medias de mercurio observadas en al menos dos de los tejidos considerados. Dividiendo la expresin SC Total corregida = SC Tejido + SC Trucha + SC Error por SC Total corregida obtendremos los coeficientes de determinacin parciales o, equivalentemente, el porcentaje de variabilidad atribuible a cada fuente de variacin contemplada en el modelo propuesto. Se tiene: SC Total corregida = SC Tejido + SC Trucha + SC Error 5,725 = 5,086 + 0,094 + 0,544

3.

1=

5,086 0,094 0,544 + + = 0,8889 + 0,0164 + 0,0950 = R 2 (tejido ) + R 2 (trucha ) + R 2 (error ) 5,725 5,725 5,725

Por tanto: a. Variabilidad de la concentracin de mercurio explicada por diferencias entre tejidos: 88,89 % b. Variabilidad de la concentracin de mercurio explicada por diferencias entre truchas: 1,64 % c. Variabilidad de la concentracin de mercurio explicada por el modelo formulado: 90,53 % d. Variabilidad de la concentracin de mercurio no explicada por el modelo formulado: 9,50 % Se concluye que no ha sido eficiente bloquear dado que las diferencias entre los bloques (truchas) explican tan slo el 1,64% de la variabilidad de la respuesta, porcentaje a todas luces irrelevante. Sin embargo ha tenido un coste para el procedimiento dado que se han invertido (sin necesidad) 9 grados de libertad en estimar los efectos bloque.

Cuestin 19: Por qu crees que se ha calificado a las truchas como bloques? Podran haber sido consideradas como una muestra de niveles de un factor tratamiento con efectos aleatorios (ntese que han sido seleccionadas al azar)? Cuestin 20: Se ha aplicado el principio de aleatorizacin en la ejecucin de este experimento? Cuestin 21: Supngase que los datos fuesen fruto de un experimento piloto. A la luz del cuadro ANOVA resultante, cmo propondras planificar el experimento definitivo? Cuestin 22: Supngase que en realidad el experimento no se hubiese bloqueado y en realidad los datos procediesen de 30 truchas diferentes. Cambiara la estimacin de la varianza del error? Aumentara el coeficiente de determinacin del modelo?
Estimaciones de los parmetros. La tabla generada en este epgrafe (que se reproduce en la

Tabla 3.6) proporciona las estimaciones para los parmetros del modelo, sus errores tpicos, intervalos de confianza y cantidades de inters para contrastar la hiptesis nula de que estos parmetros sean iguales a 0 (estadstico t , nivel crtico, potencia observada, coeficiente 2 ). Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 45


Tabla 3.6
Estimaciones de los parmetros Variable dependiente: Concentracin de mercurio Intervalo de confianza al 95%. Lmite Lmite inferior superior ,349 ,811 ,842 1,168 ,413 ,739 . . -,365 ,232 -,425 ,172 -,415 ,182 -,272 ,325 -,405 ,192 -,412 ,185 -,442 ,155 -,325 ,272 -,332 ,265 . .

Parmetro Interseccin [tejido=1] [tejido=2] [tejido=3] [trucha=1] [trucha=2] [trucha=3] [trucha=4] [trucha=5] [trucha=6] [trucha=7] [trucha=8] [trucha=9] [trucha=10]

B ,580 1,005 ,576 0b -,067 -,127 -,117 ,027 -,107 -,113 -,143 -,027 -,033 0b

Error tp. ,110 ,078 ,078 . ,142 ,142 ,142 ,142 ,142 ,142 ,142 ,142 ,142 .

t 5,272 12,927 7,409 . -,470 -,892 -,822 ,188 -,751 -,798 -1,010 -,188 -,235 .

Sig. ,000 ,000 ,000 . ,644 ,384 ,422 ,853 ,462 ,435 ,326 ,853 ,817 .

Eta al cuadrado parcial ,607 ,903 ,753 . ,012 ,042 ,036 ,002 ,030 ,034 ,054 ,002 ,003 .

Parmetro de no centralidad 5,272 12,927 7,409 . ,470 ,892 ,822 ,188 ,751 ,798 1,010 ,188 ,235 .

Potencia a observada ,999 1,000 1,000 . ,073 ,135 ,122 ,054 ,110 ,118 ,160 ,054 ,056 .

a. Calculado con alfa = ,05 b. Al parmetro se le ha asignado el valor cero porque es redundante.

Segn la Tabla 3.6, el modelo puede escribirse como:

y = 0,580 + 1,005 X 1 + 0,576 X 2 0,067 Z1 0,127 Z 2 0,117 Z 3 + 0,027 Z 4 0,107 Z 5 0,113 Z 6 0,143 Z 7 0,027 Z 8 0,033 Z 9 +
Siendo:

X 1 = 1 si la concentracin de mercurio se tom en el tejido 1 y X 1 = 0 en otro caso, X 2 = 1 si la concentracin de mercurio se tom en el tejido 2 y X 2 = 0 en otro caso y Z h = 1, h = 1,...,9, si la concentracin de mercurio se tom en la h -sima trucha y Z h = 0, h = 1,...,9,
en otro caso. Ntese que todos los niveles crticos asociados a los contrastes sobre efectos bloque (trucha) son superiores a 0,32 y pro tanto no se puede rechazar que los mismos sean iguale a 0 y por ello sobren del modelo (corroborando as la ineficiencia del bloqueo).

Cuestin 23: Si siempre se usa el valor de la SCM Error como estimacin de la varianza del error, por qu no son siempre iguales los errores tpicos de los estimadores de los efectos en la Tabla 3.6? por qu en cambio son iguales para los efectos del factor tratamiento y para los efectos bloque?. Cuestin 24: Qu valor de concentracin de mercurio pronosticara el modelo estimado para el tejido 3 de la trucha 7? Coincide con el valor observado? Sabras plantear un modelo tal que los valores pronosticados coincidiesen con los realmente observados? Cul sera su estimacin?
Los epgrafes Medias marginales estimadas y Pruebas post hoc merecen pocos

comentarios en este caso. En ambos se pone de manifiesto que todas las pruebas comparando las concentraciones medias de mercurio de dos tejidos cualesquiera resultan significativas. A modo de ejemplo se reproduce en la Tabla 3.7 el cuadro de Subconjuntos homogneos generado a partir de las pruebas de Tukey, Duncan y Scheffe.

46 Diseo y Anlisis de Experimentos


Tabla 3.7
Concentracin de mercurio Subconjunto 2 1,0850 1,000 ,5090 1,000 1,0850 1,000 ,5090 1,000 1,0850 1,000 1,000 1,5140 1,000 1,5140 1,000 1,5140 1,000

a,b DHS de Tukey

Duncana,b

Scheffea,b

Tejido Ojo Musculatura Encfalo Significacin Ojo Musculatura Encfalo Significacin Ojo Musculatura Encfalo Significacin

N 10 10 10 10 10 10 10 10 10

1 ,5090

Se muestran las medias para los grupos en subconjuntos homogneos. Basado en la suma de cuadrados tipo III El trmino error es la Media cuadrtica (Error) = ,030. a. Usa el tamao muestral de la media armnica = 10,000 b. Alfa = ,05.

Cuestin 25: En el cuadro de comparaciones mltiples del Visor de Resultados se proporcionan intervalos de confianza para la diferencia de medias de concentracin de mercurio en dos tejidos. Para un mismo par de medias los intervalos son diferentes ya que su construccin depende del mtodo de comparacin empleado. Cmo se construyen? Cuestin 26: Los intervalos para la diferencia de medias de concentracin de mercurio en Encfalo y Musculatura son: Mtodo Extremo Inferior Extremo Superior Tukey 0,2306 0,6274 Scheffe 0,2217 0,6363 Bonferroni 0,2238 0,6342 A la luz de estos intervalos, qu mtodo es preferible? por qu? Grficos de perfil. El grfico de perfil para los tejidos (ver Figura 3.7) incide en las diferencias apuntadas previamente. Para tomar idea del la importancia de la distancia que separa los puntos en la Figura 3.7 advirtase que el error tpico estimado para estas medias es 0,055 (ver cuadro Medias marginales estimadas > Tejidos > Estimaciones en el Visor de Resultados). El grfico de perfil para los bloques ha sido reescalado para tener la misma escala que el de los tejidos. Con esta escala se puede ver en la Figura 3.8. Claramente aqu las diferencias son irrelevantes. Observado*Pronosticado*Residuos tpicos. Este grfico de dispersin matricial (ver Figura 3.9) permite intuir que las hiptesis de homogeneidad de varianzas, independencia y bondad de ajuste estn presentes y valida en cierto modo el anlisis desarrollado.

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 47


Figura 3.7

Medias marginales estimadas de Concentracin de mercurio

1,60

Medias marginales estimadas

1,40

1,20

1,00

0,80

0,60

0,40 Encfalo Musculatura Ojo

Tejido

Figura 3.8

Medias marginales estimadas de Concentracin de mercurio

1,60

Medias marginales estimadas

1,40

1,20

1,00

0,80

0,60

0,40 Trucha 1 Trucha 2 Trucha 3 Trucha 4 Trucha 5 Trucha 6 Trucha 7 Trucha 8 Trucha 9 Truchas 10

Nmero de trucha

48 Diseo y Anlisis de Experimentos


Figura 3.9

Variable dependiente: Concentracin de mercurio

Residuo tp.

Pronosticado

Observado

Observado

Pronosticado

Residuo tp.

Modelo\: Interseccin + tejido + trucha

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 49

EJEMPLO 4. Se realiz un estudio sobre cartuchos para filtrado de partculas de alta energa. Interesaba comparar los filtros de dos fabricantes. Cada fabricante comercializa tres filtros que son muy empleados en respiradores comerciales para proteccin contra partculas de materia. Se realizaron tres rplicas de prueba independientes con cada filtro. La medida evaluada fue el porcentaje de penetracin, que fue obtenida a travs de una prueba estndar de aerosol.

Fabricante 1 Filtro Porcentaje de penetracin 1 2 3 1,12 0,16 0,15 1,10 0,11 0,12 1,12 0,26 0,12

Fabricante 2 4 5 6 0,91 0,66 2,17 0,83 0,83 1,52 0,95 0,61 1,58

4.1. Descripcin del plan experimental, modelo y estimacin puntual. Las fuentes de variacin controladas en este experimento son dos factores tratamiento: El Fabricante, con dos niveles de efectos fijos: Fabricante 1 y Fabricante 2. El Tipo de filtro con seis niveles Filtro 1, , Filtro 6.

Los niveles del factor Tipo de filtro estn anidados en los niveles del factor Fabricante. En Fabricante 1 se ubican los niveles Filtro 1, Filtro 2 y Filtro 3 y en Fabricante 2 se ubican los niveles Filtro 4, Filtro 5 y Filtro 6. Se trata por tanto de un diseo jerarquizado o anidado en dos etapas. La variable respuesta o dependiente es Porcentaje de penetracin. El modelo matemtico asociado es:

y ijt = + i + j (i ) + (ij )t ,
donde:

y ijt denota el porcentaje de penetracin en la t -sima observacin ( t = 1,2,3 ) del j -simo filtro ( j = 1,2,3 ) del i -simo fabricante ( i = 1,2 ),

denota el porcentaje medio de penetracin, i denota el efecto diferencial respecto a la media de los filtros del i -simo fabricante ( i = 1,2 ), j (i ) denota el efecto diferencial respecto a la media del i -simo fabricante ( i = 1,2 ) del j -simo

filtro ( j = 1,2,3 ) del i -simo fabricante ( i = 1,2 ),

(ij )t denota la parte de la respuesta yijt no explicada por el modelo. Se asume que los (ij )t son todos ellos independientes e idnticamente distribuidos segn una N (0, ) .

j (i ) = y ij. . Sin embargo Los estimadores por mnimos cuadrados de j (i ) = + i + j (i ) son nicos y son
existen infinitas soluciones para estimar los parmetros , i y j (i ) , siendo necesario imponer restricciones.

i = 0 y De acuerdo a la interpretacin anterior, es habitual imponer las restricciones:


i

j ( i ) = 0 , para
j

todo i , resultando los estimadores:

50 Diseo y Anlisis de Experimentos

= y.. i = yi. y.. , para todo i ,

= 0,7956 ) (en el ejemplo:


1 = 0,3223, 2 = 0,3223 ) (en el ejemplo:

= y y , para todo i, j , j (i ) ij . i.. = 0,6400, (en el ejemplo: 1(1) 2 (1) = 0,2966, 3(1) = 0,3433 , 1( 2 ) = 0,2211, 2 ( 2 ) = 0,4178, 3( 2 ) = 0,6389 ).

I = 0 y En el SPSS se plantea el mismo modelo pero los efectos se computan con las restricciones

J ( i ) = 0 , para todo i , siendo I y J los ltimos cdigos de los niveles del factor tratamiento y del factor
tratamiento anidado respectivamente. En el ejemplo, I = 2 y J = 3 de modo que las restricciones son:

= 2 = 3(1) 3( 2 ) = 0 .
Con este criterio los efectos en el SPSS se estiman como sigue:

= y IJ . = y 23. = 1,757 ) (en el ejemplo: i = yiJ . y IJ . , para todo i , (en el ejemplo: 1 = y13. y 23. = 1,627, 2 = 0 ) = y y , para todo j , para cada i , j (i ) ij . iJ . = y y = 0,983, (en el ejemplo: 1(1) 11. 13. 2 (1) = y12. y13. = 0,047, 3(1) = 0 , 1( 2 ) = y 21. y 23. = 0,860, 2 ( 2 ) = y 22. y 23. = 1,057, 3( 2 ) = 0 ).

que se deben interpretar de la siguiente forma:

denota el porcentaje de penetracin medio con el ltimo (tercer) filtro del ltimo (segundo) fabricante, i denota la diferencia entre los porcentajes de penetracin medios con los ltimos (terceros) filtros del segundo y primer fabricante, para el i -simo fabricante, j (i ) denota la diferencia entre los porcentajes de penetracin medios con
sus filtros j -simo y ltimo (tercero).

El modelo matemtico utilizando variables dummy es:


J 1 I 1 J 1 Xi + , y = + j(I ) Z j + + Z i j ( i ) j j =1 i =1 j =1

siendo X i la variable que toma el valor 1 cuando el porcentaje de penetracin se mide en un filtro del i -simo fabricante y 0 en otro caso, y Z j la variable que toma el valor 1 si se trata del j -simo filtro y 0 en otro caso. 4.2 Entrada de datos. Se crean 3 columnas: fabricante (con valores 1 y 2 y etiquetas de valor Fabricante 1 y Fabricante 2, respectivamente), filtro (con valores de 1 a 6 y etiquetas de valor Filtro 1 de fabricante 1, Filtro 2 de fabricante 1, Filtro 3 de fabricante 1, Filtro 1 de fabricante 2, Filtro 2 de fabricante 2, v Filtro 3 de fabricante 2, respectivamente), y penetracin (recogiendo las observaciones de porcentaje de penetracin observado en consonancia con filtro y fabricante adecuados). Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 51 El editor de datos quedara como se muestra en la Figura 4.1 (etiquetas de valor activadas).
Figura 4.1

4.3 Anlisis de un diseo jerarquizado. Es necesario utilizar el editor de sintaxis para informar al SPSS que se trata de un diseo jerarquizado. Las instrucciones para desarrollar el anlisis se ejecutan en mismo cuadro de dilogo que en diseos cruzados (Analizar > Modelo lineal general > Univariante) pero ser necesario incluir una orden precisa en la sintaxis del procedimiento dado que en el epgrafe dedicado a la seleccin del modelo no aparece esa posibilidad. Cuando uno de los factores (B) tiene sus niveles anidados en los de otro (A), no es obviamente posible contrastar la existencia de interaccin. La modelizacin empleada para un diseo jerarquizado permite sin embargo contrastar la existencia de efectos principales. Sin embargo, de manera anloga al caso de la interaccin en diseos cruzados, se tendr presente que si el contraste sobre igualdad de efectos de los niveles
B ( A) del factor anidado B ( H 0 : 1(i ) = ... = J (i ) , i = 1,..., I ) es significativo, entonces no debiera tenerse en A : 1 = ... = I ). En cuenta el resultado del contraste sobre igualdad de efectos del factor no anidado A ( H 0 trminos del ejemplo tratado, si el porcentaje de penetracin vara para los filtros de un mismo fabricante, difcilmente son comparables los fabricantes sin considerar los filtros.

4.3.1 Instrucciones para desarrollar el anlisis. 1. En Analizar > Modelo lineal general > Univariante se cubrirn los campos exactamente igual a como se hara si se tratase de un diseo cruzado (ver Figura 4.2).

52 Diseo y Anlisis de Experimentos


Figura 4.2

2. Pulsar el botn Modelo y marcar la opcin Personalizado. 3. Seleccionar la variable que define el factor no anidado (fabricante) dentro de la lista Factores y covariables. 4. Seleccionar Efectos principales dentro del men desplegable Construir trminos y pulsar el botn flecha para trasladar la variable fabricante a la lista Modelo. 5. Completar la seleccin de los procedimientos a ejecutar en el resto de botones del cuadro de dilogo Univariante. 6. Antes de pulsar el botn Aceptar del cuadro de dilogo Univariante, pulsar el botn Pegar. Se abrir el editor de sintaxis y mostrar la sintaxis con las rdenes especificadas. Por ejemplo, una ventana como la que se muestra en la Figura 4.3 (a). La ltima fila necesariamente incluir la sentencia /DESIGN = fabricante. Para informar del anidamiento del factor filtro en fabricante se completar la sentencia como: /DESIGN = fabricante filtro(fabricante) tal y como se muestra en la Figura 4.3 (b). 7. Pulsar el botn Ejecutar en el men principal del editor de sintaxis tal y como se muestra en la Figura 4.4.

4.3.2 Resultados del anlisis. Se analizan ahora los aspectos ms relevantes de la salida en el Visor de Resultados. El cuadro de Estadsticos descriptivos (Tabla 4.1) muestra una razonable homogeneidad en la dispersin de cada uno de los seis grupos (fabricante*filtro(fabricante)) con excepcin del filtro 3 del fabricante 2, para el que se ha obtenido una desviacin tpica considerablemente ms importante. La construccin de un grfico de dispersin de las respuestas (ver rdenes precisas en la Figura 4.5(a) y resultado en la Figura 4.5(b)) ilustra este hecho. Ms an, la Figura 4.5 muestra como el filtro 1 del fabricante 1 proporciona resultados sustancialmente ms elevados que los otros filtros de este fabricante y al nivel de los resultados promedio de los filtros del fabricante 2. Resulta obvio advertir que el tamao muestral (tres datos por grupo) es excesivamente pequeo. Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 53


Figura 4.3 (a) (b)

Figura 4.4

Tabla 4.1
Estadsticos descriptivos Variable dependiente: Porcentaje de penetracin Fabricante 1 Filtro Filtro 1 del fabricante 1 Filtro 2 del fabricante 1 Filtro 3 del fabricante 1 Total Filtro 1 del fabricante 2 Filtro 2 del fabricante 2 Filtro 3 del fabricante 2 Total Media 1,1133 ,1767 ,1300 ,4733 ,8967 ,7000 1,7567 1,1178 Desv. tp. ,01155 ,07638 ,01732 ,48205 ,06110 ,11533 ,35921 ,52285 N 3 3 3 9 3 3 3 9

Fabricante 2

54 Diseo y Anlisis de Experimentos


Figura 4.5 (a)
2,50

(b)
Fabricante
Fabricante 1 Fabricante 2

2,00

Porcentaje de penetracin

1,50

1,00

0,50

0,00

Filtro

En consonancia con los comentarios anteriores no es sorprendente que la prueba de Levene rechace la hiptesis nula de homoscedasticidad (Tabla 4.2).
Tabla 4.2
Contraste de Levene sobre la igualdad de las varianzas errora Variable dependiente: Porcentaje de penetracin F 9,312 gl1 5 gl2 12 Significacin ,001

Contrasta la hiptesis nula de que la varianza error de la variable dependiente es igual a lo largo de todos los grupos. a. Diseo: Intercept+fabricante+filtro(fabricante)

En Pruebas de los efectos inter-sujetos est el cuadro ANOVA que se muestra en la Tabla 4.3.
Tabla 4.3
Pruebas de los efectos inter-sujetos Variable dependiente: Porcentaje de penetracin Suma de cuadrados tipo III 5,610b 11,392 1,869 3,741 ,305 17,307 5,915 Media cuadrtica 1,122 11,392 1,869 ,935 ,025 Eta al cuadrado parcial ,948 ,974 ,860 ,925 Parmetro de no centralidad 220,970 448,714 73,611 147,359 Potencia a observada 1,000 1,000 1,000 1,000

Fuente Modelo corregido Interseccin fabricante filtro(fabricante) Error Total Total corregida

gl 5 1 1 4 12 18 17

F 44,194 448,714 73,611 36,840

Sig. ,000 ,000 ,000 ,000

a. Calculado con alfa = ,05 b. R cuadrado = ,948 (R cuadrado corregida = ,927)

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 55 La descomposicin de la suma de cuadrados para el modelo en bruto ( y ijt = + i + j (i ) + ijt ) es:
2 2 = y... + ( yi.. y... ) yijt i =1 j =1 t =1 i =1 j =1 t =1 i =1 j =1 t =1 I J T I J T I J T 2

+ y ij. yi..
i =1 j =1 t =1

)2 + (yijt yij. )2
I J T i =1 j =1 t =1

que, de acuerdo a la notacin del SPSS, equivale a: SC Total = SC Interseccin + SC Fabricante + SC Filtro(Fabricante) + SC Error 17,307 = 11,392 + 1,869 + 3,741 + 0,305

Para el modelo corregido ( y ijt = i + j (i ) + ijt ):


2 2 2 2 (yijt y... ) = ( yi.. y... ) + (yij. yi.. ) + (yijt yij. ) I J T I J T I J T I J T i =1 j =1 t =1 i =1 j =1 t =1 i =1 j =1 t =1 i =1 j =1 t =1

que, en trminos de la notacin del SPSS, equivale a: SC Total corregida = SC Fabricante + SC Filtro(Fabricante) + SC Error 5,915 Las conclusiones seran:
1.

1,869

3,741

0,305

La estimacin insesgada de la varianza del error ( Var ijt = 2 ) es la SC Error dividida por sus grados de libertad (12). Por tanto:

( )

2 = 0,305 / 12 = 0,025 SCM Error =


2.

La hiptesis nula de que no hay diferencias en la respuesta debido a los efectos filtro para cada fabricante:

H 0filtro ( fabricante ) : 1(1) = 2(1) = 3(1) = cte1 y 1( 2) = 2( 2) = 3( 2) = cte2


se contrasta a travs del cociente: SCM Filtro(Fabricante) / SCM Error = 0,935 / 0,025 = 36,840 que, en una F4,12 , conduce a un p valor igual a 0. Se rechaza la nula concluyendo que, para al menos un fabricante, existen diferencias significativas en los porcentajes de penetracin debido al filtro empleado.
3.

Como consecuencia de la conclusin previa, carece de sentido valorar los resultados del ANOVA para la
fabricante : 1 = 2 = cte ). fuente de variacin fabricante, (orientados a testar que se refieren a testar H 0

4.

Las dos fuentes de variacin consideradas tienen un alto poder explicativo de la dispersin de la respuesta ya que el coeficiente de determinacin del modelo es alto: 0,948. En consecuencia el modelo planteado tiene una alta capacidad para predecir la respuesta.

Precisamente el epgrafe Estimaciones de los parmetros (ver Tabla 4.4) nos proporciona el modelo estimado: y = 1,757 0,860 Z1 1,057 Z 2 + ( 1,627 + 0,983 Z1 + 0,047 Z 2 ) X 1 + , siendo X 1 la variable que toma el valor 1 cuando el porcentaje de penetracin se mide en un filtro del primer fabricante y 0 en otro caso, y Z j la variable que toma el valor 1 si se trata del j -simo filtro y 0 en otro caso.

56 Diseo y Anlisis de Experimentos


Tabla 4.4
Estimaciones de los parmetros Variable dependiente: Porcentaje de penetracin Intervalo de confianza al 95%. Error tp. ,092 ,130 . ,130 ,130 . ,130 ,130 . Lmite inferior 1,556 -1,910 . ,700 -,237 . -1,143 -1,340 . Lmite superior 1,957 -1,343 . 1,267 ,330 . -,577 -,773 . Eta al cuadrado parcial ,968 ,929 . ,826 ,011 . ,785 ,846 . Parmetro de no centralidad 19,095 12,503 . 7,558 ,359 . 6,610 8,122 . Potencia observad a a 1,000 1,000 . 1,000 ,063 . 1,000 1,000 .

Parmetro Interseccin [fabricante=1] [fabricante=2] [filtro=1]([fabricante=1]) [filtro=2]([fabricante=1]) [filtro=3]([fabricante=1]) [filtro=4]([fabricante=2]) [filtro=5]([fabricante=2]) [filtro=6]([fabricante=2])

B 1,757 -1,627 0b ,983 ,047 0b -,860 -1,057 0b

t 19,095 -12,503 . 7,558 ,359 . -6,610 -8,122 .

Sig. ,000 ,000 . ,000 ,726 . ,000 ,000 .

a. Calculado con alfa = ,05 b. Al parmetro se le ha asignado el valor cero porque es redundante.

El nico coeficiente que podra ser eliminado del modelo por no ser significativamente distinto de 0 es 2(1) ( p -valor igual a 0,726). En otros trminos, los porcentajes de penetracin medios con los filtros 2 y 3 del primer fabricante no difieren significativamente. El grfico para el anlisis de residuos (Figura 4.6) confirma la presencia de una observacin atpica con el tercer filtro del segundo fabricante. Esta observacin estropea la homoscedasticidad pero el resto de diagramas de puntos muestran un buen ajuste del modelo y la aleatoriedad de loas residuos.
Figura 4.6

Variable dependiente: Porcentaje de penetracin

Residuo tp.

Pronosticado

Observado

Observado

Pronosticado

Residuo tp.

Modelo\: Interseccin + fabricante + filtro ( penetracion)

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 57 El grfico de perfil para la combinacin de niveles (Figura 4.7) es tambin interesante.
Figura 4.7

Medias marginales estimadas de Porcentaje de penetracin

2,00

Fabricante
Fabricante 1 Fabricante 2

Medias marginales estimadas

1,50

1,00

0,50

0,00 Filtro 1 del Filtro 2 del Filtro 3 del Filtro 1 del Filtro 2 del Filtro 3 del fabricante fabricante fabricante fabricante fabricante fabricante 1 1 1 2 2 2

Filtro
Las medias no estimables no se representan

Cuestin 27: Sabras explicar el origen de los grados de libertad para las distintas fuentes de variacin del cuadro ANOVA de la Tabla 4.3?

58 Diseo y Anlisis de Experimentos EJEMPLO 5. Se realiza un experimento para evaluar los efectos de cuatro complementos vitamnicos en el aumento de peso de animales de laboratorio. Se planific un diseo completamente aleatorizado, con cinco animales, en jaulas separadas, para cada tratamiento. Adems de medir el aumento de peso (variable y en gramos), se midi el consumo de caloras (variable x en caloras/10) ya que esta variable difiere entre los animales e influye en el aumento de peso. Dieta 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 48 67 78 69 53 65 49 37 73 63 79 52 63 65 67 59 50 59 42 34 35 44 44 51 47 40 45 37 53 42 51 41 47 47 48 53 52 52 51 43

y x

5.1. Descripcin del plan experimental, modelo y estimacin puntual. Fuentes de variacin evaluadas: Un factor tratamiento, la Dieta, con cuatro niveles de efectos fijos: Dieta 1, Dieta 2, Dieta 3 y Dieta 4. Una covariable, x = Consumo de caloras (cal/10).

Se trata por tanto de un diseo de una va completamente aleatorizado y con una covariable. La variable respuesta o dependiente es y = Aumento de peso (gramos). El modelo matemtico asociado es:

y it = + i + xit + it ,
donde:

y it denota el aumento de peso del t -simo animal ( t = 1,2,3,4,5 ) alimentado con la i -sima dieta ( i = 1,2,3,4 ), denota el aumento medio de peso para un consumo de caloras x = 0 , con independencia de la
dieta, i denota el efecto diferencial respecto a del aumento medio de peso de los animales tratados con la i -sima dieta ( i = 1,2,3,4 ) cuando x = 0 (por tanto + i es el aumento medio de peso para un consumo de caloras x = 0 de los animales tratados con la i -sima dieta), denota la tasa de aumento de peso por unidad de incremento en el consumo de caloras (que se supone es la misma para todas las dietas), xit denota el consumo de caloras del t -simo animal ( t = 1,2,3,4,5 ) alimentado con la i -sima dieta ( i = 1,2,3,4 ),

it denota la parte de la respuesta yit no explicada por el modelo. Se asume que los it son todos ellos independientes e idnticamente distribuidos segn una N (0, ) .

Una forma alternativa de escribir el modelo (que no es ms que una sencilla reparametrizacin de la relacin lineal) es:

y it = * + i + ( xit x.. ) + it , con * = + x..


donde ahora: Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 59

denota el aumento medio de peso para un consumo de caloras x = x.. , con independencia de la
*

dieta, y * + i es el aumento medio de peso, para un consumo de caloras x = x.. , de los animales tratados con la i -sima dieta.

Los estimadores por mnimos cuadrados son: El estimador de es:

sp * xy sc * xx

* , con sp * xy = ( xit xi. )( y it y i. ) y sc xx = ( xit xi . )

= 1,635 . En el ejemplo
El estimador de * + i es:

(x x ) * + i = y i. i. ..

( x x ) . De ah que a los estimadores + i se les denomine ajustada restndole la cantidad i. .. medias ajustadas. En el ejemplo, las medias ajustadas resultan: ( x x ) = 63,0 1,635 (44,20 46,15) = 66,189 * + 1 = y1. 1. ..

Obsrvese que el estimador de * + i es la media de las respuestas con la i -sima dieta, yi. ,

( x x ) = 65,2 1,635 (46,8 46,15) = 64,137 * + 3 = y 3. 3. ..

( x x ) = 57,4 1,635 (43,4 46,15) = 61,897 * + 2 = y 2. 2. .. (x x ) = 48,8 1,635 (58,2 46,15) = 42,177 * + 4 = y 4. 4. ..

Cuestin 28: Qu aproxima entonces el valor de yi. ? En trminos ms precisos, cul es el valor esperado de yi. ?

(x x ) ? Cuestin 29: Qu implica ajustar la media yi. restndole i. ..


Si, como en modelos precedentes, se desea estimar por separado los parmetros * y i , es necesario

i = 0 resultando: imponer restricciones. Para mantener la interpretacin anterior, es preciso imponer:


i

= y..
*

= 58,60 . En el ejemplo:

( x x ) y , para todo i (diferencia entre la i -sima media ajustada y la media i = yi. i. .. ..


global). En el ejemplo:

( x x ) y = 66,189 58,60 = 7,589 1 = y1. 1. .. ..


2.

2 3 4

( = (y = (y = (y

3. 4.

(x 2. (x
3.

(x 4.

) x )) y x )) y x )) y
..

..

= 61,897 58,60 = 3,297 = 64,137 58,60 = 5,537 = 42,177 58,60 = 16,423

..

.. ..

..

60 Diseo y Anlisis de Experimentos Y el modelo matemtico estimado para una predecir el aumento de peso de un animal tratado con la i -sima dieta que ha presentado un consumo de caloras igual a x sera:

y ij = 58,60 + i + 1,635 xij 46,15 ,


i , i = 1,2,3,4 , los computados anteriormente. siendo
I = 0 siendo I el ltimo cdigo de los niveles del En el SPSS los efectos se computan con la restriccin 4 = 0 , resultando: factor tratamiento. En el ejemplo I = 4 y por tanto la restriccin es

( x x ) , o sea, la media ajustada del ltimo nivel del factor tratamiento. * = y 4. 4. ..

* = 42,177 . En el ejemplo:

(x x ) y ( x x ) , para todo i , o sea, el efecto del tratamiento i se i = y i. i. .. 4. 4. ..


entiende ahora como la diferencia entre la i -sima media ajustada y la media justada del ltimo nivel del factor tratamiento.

) (

1 = 24,013, 2 = 19,721, 3 = 21,960 y 4 = 0 . En el ejemplo:


En el SPSS sin embargo se presenta el modelo en su formato y it = + i + xit + it en lugar de

x . En el ejemplo = * y it = * + i + ( xit x.. ) + it . Por tanto se tendr en cuenta que .. = 33,278 y el modelo estimado por el SPSS (empleando variables dummy) para predecir el aumento de

peso de un animal tratado con alguna de las 4 dietas consideradas y que ha presentado un consumo de caloras igual a x sera:

y = 33,278 + 24,013 X 1 + 19,721X 2 + 21,960 X 3 + 1,635 x


siendo X i la variable que toma el valor 1 cuando el animal fue tratado con la i -sima dieta y 0 en otro caso. En este modelo: = 33,278 denota el aumento medio de peso para la dieta 4 con un consumo de caloras igual a 0.

1 = 24,013, 2 = 19,721, 3 = 21,960 y 4 = 0 , denotan las diferencias de los aumentos medios


de peso de cada dieta con respecto al de la dieta 4, para un consumo de caloras igual a 0.

5.2 Entrada de datos. Se crean 3 columnas: dieta (con valores 1, 2, 3 y 4 y etiquetas de valor Dieta 1, Dieta 2, Dieta 3 y Dieta 4, respectivamente), consumo (recogiendo los valores de la covariable, x = Consumo de caloras (cal/10) en consonancia con el nmero de animal y la dieta adecuados), y aumento (recogiendo los valores de la variable respuesta y = Aumento de peso (gramos) en consonancia con el nmero de animal y la dieta adecuados).

El editor de datos quedara como se muestra en la Figura 5.1 (etiquetas de valor activadas).

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 61


Figura 5.1

5.3

Anlisis de un diseo con una covariable.

En Analizar > Modelo lineal general > Univariante se entrar la covariable en el campo con el mismo nombre. Ver Figura 5.2 donde se reproduce como solicitar el anlisis del ejemplo 5.
Figura 5.2

62 Diseo y Anlisis de Experimentos Las herramientas de Analizar > Modelo lineal general > Univariante pueden ser utilizadas como hasta ahora. Tan slo aparece no operativo el botn Post hoc. Ntese que los contrastes = i i ,

= y ( x x ) y, salvo que x = x para todo i , las con i = 0 , se estiman mediante i i. i. .. i. .. ..


i

medias justadas no son independientes. Por tal motivo la mayora de las pruebas post hoc no pueden ser aplicadas. Entre las presentadas en las sesiones de teora son aplicables las de Scheffe y Bonferroni, aunque el SPSS no nos da esa opcin.

La razn radica en los siguientes argumentos: 1. Considrese un contraste cualquiera de inters = i i con
i

i
i

= 0.

= = ( ( x x ) = y x . i ) = i y i. 2. Se estima por medio de i i i + i. i i. i. ..


i i i i

i2 2 3. Se prueba que Var = Var i i = n i i i

()

2 + sc * xx

i xi . , que se estima mediante: i


2

2 i xi . i2 i + SCM Error * sc xx i ni

4. Para una prueba de hiptesis se tendr en cuenta que:

ii i i
i i 2 i xi . i2 SCM Error + i * sc xx i ni

t g .l .(SCM Error )

5. Un intervalo de confianza al 100(1 ) % para = i i es:


i

2 i xi. i2 i i i i i t g .l.(SCM Error ), / 2 SCM Error n + * sc xx i i i i

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 63 Las salidas del programa seran:

Estadsticos descriptivos Variable dependiente: Aumento de peso Dieta Dieta 1 Dieta 2 Dieta 3 Dieta 4 Total Media 63,00 57,40 65,20 48,80 58,60 Desv. tp. 12,268 14,311 9,654 10,895 12,713 N 5 5 5 5 20

a Contraste de Levene sobre la igualdad de las varianzas error

Variable dependiente: Aumento de peso F 1,597 gl1 3 gl2 16 Significacin ,229

Contrasta la hiptesis nula de que la varianza error de la variable dependiente es igual a lo largo de todos los grupos. a. Diseo: Intercept+consumo+dieta

Pruebas de los efectos inter-sujetos Variable dependiente: Aumento de peso Suma de cuadrados tipo III 1892,176b 53,981 1090,176 1501,046 1178,624 71750,000 3070,800 Media cuadrtica 473,044 53,981 1090,176 500,349 78,575 Eta al cuadrado parcial ,616 ,044 ,481 ,560 Parmetro de no centralidad 24,081 ,687 13,874 19,103 Potencia a observada ,936 ,121 ,935 ,910

Fuente Modelo corregido Interseccin consumo dieta Error Total Total corregida

gl 4 1 1 3 15 20 19

F 6,020 ,687 13,874 6,368

Sig. ,004 ,420 ,002 ,005

a. Calculado con alfa = ,05 b. R cuadrado = ,616 (R cuadrado corregida = ,514)

64 Diseo y Anlisis de Experimentos


Estimaciones de los parmetros Variable dependiente: Aumento de peso Intervalo de confianza al 95%. Lmite Lmite inferior superior -81,031 14,434 ,700 2,571 10,810 37,215 6,183 33,259 9,595 34,326 . .

Parmetro Interseccin consumo [dieta=1] [dieta=2] [dieta=3] [dieta=4]

B Error tp. -33,298 22,395 1,635 ,439 24,013 6,194 19,721 6,352 21,960 5,802 0b .

t -1,487 3,725 3,877 3,105 3,785 .

Sig. ,158 ,002 ,001 ,007 ,002 .

Eta al cuadrado parcial ,128 ,481 ,500 ,391 ,489 .

Parmetro de no centralidad 1,487 3,725 3,877 3,105 3,785 .

Potencia a observada ,286 ,935 ,951 ,827 ,942 .

a. Calculado con alfa = ,05 b. Al parmetro se le ha asignado el valor cero porque es redundante.

1. Media global Variable dependiente: Aumento de peso Intervalo de confianza al 95%. Lmite superior Lmite inferior 54,375 62,825

Media 58,600a

Error tp. 1,982

a. Las covariables que aparecen en el modelo se evalan en los siguiente valores: Consumo de calorias = 46,15.

Estimaciones Variable dependiente: Aumento de peso Intervalo de confianza al 95%. Lmite Lmite inferior superior 57,545 74,833 53,065 70,730 55,666 72,608 32,916 51,437

Dieta Dieta 1 Dieta 2 Dieta 3 Dieta 4 a.

Media 66,189a 61,897a 64,137a 42,177a

Error tp. 4,056 4,144 3,974 4,345

Las covariables que aparecen en el modelo se evalan en los siguiente valores: Consumo de calorias = 46,15.

Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 65

Medias marginales estimadas de Aumento de peso

70

Medias marginales estimadas

65

60

55

50

45

40 Dieta 1 Dieta 2 Dieta 3 Dieta 4

Dieta

Variable dependiente: Aumento de peso

Residuo tp.

Pronosticado

Observado

Observado

Pronosticado

Residuo tp.

Modelo\: Interseccin + consumo + dieta

66 Diseo y Anlisis de Experimentos EJEMPLO 6. Considrese de nuevo el experimento del Ejemplo 2 y supngase que en realidad tanto la variedad de planta como los niveles de agua son en realidad seleccionados aletoriamente. Cmo cambia el anlisis?

6.1. Descripcin del plan experimental, modelo y estimacin puntual. Existen 2 factores tratamiento: Nivel de agua (con tres niveles de efectos aleatorios) y Tipo de planta (con dos niveles de efectos aleatorios). El modelo matemtico es el propio de un diseo completo de dos vas de efectos aleatorios:

y ijt = + Ai + B j + ( AB )ij + ijt


donde:

y ijt denota el crecimiento observado para la t-sima planta (t=1,,5) del i-simo tipo (i=1,2) y
tratada con el j-simo nivel de agua (j=1,2,3), denota el crecimiento promedio con independencia de las condiciones experimentales,

Ai es la variable aleatoria: efecto sobre el crecimiento del tallo respecto a la media achacable al isimo tipo (i=1,2) de planta muestreado y con independencia del nivel de agua empleado, B j es la variable aleatoria: efecto sobre el crecimiento del tallo respecto a la media achacable al jsimo nivel de agua (j=1,2,3) muestreado, con independencia del tipo de planta, ( AB )ij es la variable aleatoria: efecto sobre el crecimiento del tallo respecto a la media achacable a interaccin entre el i-simo tipo de planta muestreado y el j-simo nivel de agua muestreado. ijt denota la parte de la respuesta yijt no explicada por el modelo. Se asume que: ijt ; i = 1,2; j = 1,2,3; t = 1,2,3,4,5

{A1 , A2 } es una muestra aleatoria simple de una poblacin A N (0, A ) . {B1 , B2 , B3 } es una muestra aleatoria simple de una poblacin B N (0, B ) . {( AB )11 , ( AB )12 , ( AB )13 , ( AB )21 , ( AB )22 , ( AB )23 } es una muestra aleatoria simple de una poblacin ( AB ) N (0, AB ) . Las muestras {A1 , A2 } , {B1 , B2 , B3 }, {( AB )11 , ( AB )12 , ( AB )13 , ( AB )21 , ( AB )22 , ( AB )23 } y

N (0, ) .

es una muestra aleatoria simple de una poblacin

{ ijt ; i = 1,2; j = 1,2,3; t = 1,2,3,4,5} son estadsticamente independientes.

Es importante enfatizar que: Con efectos fijos, i = i es un parmetro (un nmero) cuyo valor es desconocido y se estima

i = y i.. y... . Ello es as porque i es la media del crecimiento de una variedad de planta mediante concreta y de inters para el experimentador.
Con efectos aleatorios, Ai NO es un nmero desconocido. Es una variable aleatoria que, en nuestro muestreo tomar un valor ai = i correspondiente a la variedad de planta seleccionada al azar en i-simo lugar pero que, en una hipottica rplica del experimento, tomar otro valor. Los valores que Ai puede tomar siguen una ley N (0, A ) y, por ello, lo realmente importante es estimar A para conocer el rango de variacin de esos valores. Valoraciones anlogas son vlidas para el resto de variables aleatorias en el modelo. Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 67 Bajo las hiptesis asumidas para las variables aleatorias del modelo se tiene que:
2 2 2 Var y ijt = Var ( Ai ) + Var B j + Var ( AB )ij + Var ijt = A +B + AB + 2 2 2 2 de modo que A , B , AB y 2 reciben el nombre de componentes de la varianza y junto son los parmetros de inters en un modelo de efectos aleatorios.

( )

( )

( )

Construyendo las sumas de cuadrados igual que en un modelo de efectos fijos, esto es: SC Total corregida = SC tipo = SC nivel =
I J T

(yijt y... )
I J T i =1 j =1 t =1

( yi.. y... )
i =1 j =1 t =1 I J T i =1 j =1 t =1

.
2

(y. j.. y... )


I J T i =1 j =1 t =1

.
2

SC tipo*nivel = SC Error =
I J

(yij. yi.. y. j. + y... )


T

(yij. y... )
i =1 j =1 t =1

se verifica que: E( SCM Error ) E( SCM nivel ) E( SCM tipo ) = 2.


2 2 = 2 + 5 AB + 10 B . 2 = 2 + 5 AB 2 + 15 A .

2 E( SCM tipo*nivel ) = 2 + 5 AB .

6.2 Anlisis en el SPSS. 1. El fichero de datos se crea como si se tratase de efectos fijos. 2. Existen dos opciones para tratar con un diseo de efectos aleatorios: a. Analizar > Modelo lineal general > Univariante. Donde se tendrn las mismas herramientas de anlisis que para un diseo de efectos fijos. b. Analizar > Modelo lineal general > Componentes de la varianza. Apartado que proporciona la estimacin de las componentes de la varianza (segn distintos criteriors). 3. En Analizar > Modelo lineal general > Componentes de la varianza aparecer un cuadro de dilogo semejante al de Univariante (ver por ejemplo Figura 2.3). Se cubrirn los campos con los factores indicando si se trata de factores con efectos aleatorios o con efectos fijos (podra haberse planteado un modelo mixto). Para nuestro ejemplo los campos quedaran como se muestra en la Figura 6.1. 4. Las herramientas de anlisis se recogen en los botones de la parte inferior del cuadro: a. Modelo. Permite seleccionar el modelo matemtico. Es exactamente igual que el cuadro con el mismo nombre de Univariante y ya ha sido descrito pormenorizadamente en los ejemplos previos.

68 Diseo y Anlisis de Experimentos


Figura 6.1

b. Opciones. Permite seleccionar el mtodo de estimacin de las componentes. Se emplear el criterio ANOVA (ANOVA en el cuadro de dilogo) basado en las esperanzas de las sumas de cuadrados (Suma de cuadrados > Tipo III en el cuadro de dilogo), lo cul se indicar al SPSS tal y como se muestra en la Figura 6.2. Ntese que se ha pide tambin que se muestren las Suma de cuadrados y las Medias cuadrticas esperadas.
Figura 6.2

El criterio ANOVA consiste en estimar las componentes basndose en las esperanzas de las sumas de cuadrados medias. Entonces, de modo recursivo se procede como sigue: E( SCM Error ) = 2 , entonces tomar:

2 = SCM Error
Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 69


2 y E( SCM Error) = 2 , entonces tomar: E(SCM tipo*nivel) = 2 + 5 AB 2 AB =

SCM tipo * nivel - SCM Error 5

2 2 2 + 15 A E( SCM tipo)= 2 + 5 AB y E( SCM tipo*nivel) = 2 + 5 AB , entonces tomar: 2 A =

SCM tipo - SCM tipo * nivel 15

2 2 2 + 10 B y E(SCM tipo*nivel) = 2 + 5 AB , entonces E(SCM nivel) = 2 + 5 AB tomar: 2 A =

SCM nivel - SCM tipo * nivel 10

Las salidas del SPSS se muestran en las Tablas 6.1, 6.2 y 6.3.

Tabla 6.1
ANOVA Suma de cuadrados tipo III 10664,110 262024,456 1062,075 9200,201 401,834 202,424 272890,990 10866,534 Media cuadrtica 2132,822 262024,456 1062,075 4600,100 200,917 8,434

Fuente Modelo corregido Interseccin tipo nivel tipo * nivel Error Total Total corregido

gl 5 1 1 2 2 24 30 29

Variable dependiente: crecimiento

Tabla 6.2
Medias cuadrticas esperadas Componente de la varianza Fuente Interseccin tipo nivel tipo * nivel Error Var(tipo) 15,000 15,000 ,000 ,000 ,000 Var(nivel) 10,000 ,000 10,000 ,000 ,000 Var(tipo * nivel) 5,000 5,000 5,000 5,000 ,000 Var(Error) 1,000 1,000 1,000 1,000 1,000 Trmino cuadrtico Interseccin

Variable dependiente: crecimiento Las medias cuadrticas esperadas se basan en en la suma de cuadrados de tipo III. Para cada fuente, la media cuadrtica esperada es igual a la suma de los coeficientes de las casillas por los componentes de la varianza, ms un trmino cuadrtico relacionado con los efectos de la casilla Trmino cuadrtico.

70 Diseo y Anlisis de Experimentos


Tabla 6.3
Estimaciones de la varianza Componente Var(tipo) Var(nivel) Var(tipo * nivel) Var(Error) Estimacin 57,411 439,918 38,497 8,434

Variable dependiente: crecimiento Mtodo: ANOVA (Tipo III Suma de cuadrados)

Se puede comprobar que las sumas de cuadrados y los grados de libertad mostrados en la Tabla 6.1 son los mismos que en el caso de efectos fijos (comparar con Tabla 2.8). La Tabla 6.2 es simplemente una forma alternativa de explicar mediante una tabla cuanto valen las esperanzas de las sumas de cuadrados medias de las fuentes de variacin implicadas en el modelo. Por ejemplo la fila correspondiente a tipo en la Tabla 6.3:
Medias cuadrticas esperadas

Fuente Var(tipo) 15,000

Componente de la varianza Var(nivel) ,000 Var(tipo * nivel) 5,000 Var(Error) 1,000 Trmino cuadrtico

tipo

2 2 2 se leer: E(SCM tipo) = 15 A + 0 B + 5 AB + 1 2 .

Finalmente, la Tabla 6.2 6.3 proporciona los resultados de las estimaciones. Por ejemplo, de la Fila es simplemente una forma alternativa de explicar mediante una tabla cuanto valen las esperanzas de las sumas de cuadrados medias de las fuentes de variacin implicadas en el modelo. Por ejemplo, la
2 estimacin de la componente Var (tipo) = A se calcula mediante (ver pgina anterior): 2 A =

SCM tipo - SCM tipo * nivel 1062,075 - 200,917 = = 57,411 15 15

Se observa que la fuente de variacin mayor corresponde a la variabilidad entre niveles de agua y, tambin, que cualquiera de las fuentes de variacin controladas conduce a una variabilidad mayor que la que resta por explicar (error). A la espera de constatar su significacin estadstica, se intuye que tanto el nivel de agua como la variedad de planta son relevantes a la hora de constatar un crecimiento del tallo dado. Ntese que en este epgrafe no se generan los resultados de los contrastes de hiptesis de inters asociados al cuadro ANOVA. c. Guardar. Es factible guardar las estimaciones resultantes de las componentes.

5. Para realizar los contrastes de inters sobre la importancia de las fuentes de variacin es necesario acudir al procedimiento Univariante, ya explicado para efectos fijos. Obviamente ahora se incorporarn las variables tipo y nivel al campo Factores Aleatorios. Las dems opciones (Modelo, Contrastes, Grficos, Post hoc, Guardar y Opciones) se cubrirn como siempre, si bien se tendr en cuenta que algunas de las salidas carecen ahora de sentido. Por ejemplo, es absurdo plantearse testar hiptesis sobre contrastes del tipo H 0 : i i = 0 , con i = 0 , ya que ahora los efectos son
i i

realizaciones de variables aleatorias y no parmetros. Tal es as que, por ejemplo, si se pulsa el botn Post hoc, no aparece variable alguna en la lista de Factores, a pesar de existir dos, tipo y nivel. Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 71 El motivo es que se trata de efectos aleatorios. Anlogamente y por el mismo motivo carece de relevancia el modelo matemtico estimado (salida de Estimaciones de los parmetros). Los parmetros aqu son las componentes de la varianza. Nos centramos por tanto en la salida del cuadro ANOVA que corresponde como siempre al epgrafe: Opciones> Estimaciones de los efectos inter-sujetos y que se reproduce en la Tabla 6.4.

Tabla 6.4
Pruebas de los efectos inter-sujetos Variable dependiente: Crecimiento longitud del tallo Suma de cuadrados tipo III 262024,456 13887,695 1062,075 401,834 9200,201 401,834 401,834 202,424 Media cuadrtica 262024,46 5461,258b 1062,075 200,917c 4600,100 200,917c 200,917 8,434d Eta al cuadrado parcial ,950 ,726 ,958 ,665 Parmetro de no centralidad 47,979 5,286 45,791 47,643 Potencia a observada ,974 ,266 ,698 1,000

Fuente Interseccin tipo nivel tipo * nivel

gl 1 2,543 1 2 2 2 2 24

Hiptesis Error Hiptesis Error Hiptesis Error Hiptesis Error

F 47,979 5,286 22,896 23,821

Sig. ,010 ,148 ,042 ,000

a. Calculado con alfa = ,05 b. MS(tipo) + MS(nivel) - MS(tipo * nivel) c. MS(tipo * nivel) d. MS(Error)

Tngase en cuenta lo que sigue: El formato no es el mismo que con efectos fijos ya que para testar el peso de cada fuente de variacin el denominador del cociente F no siempre es el mismo, tal y como ocurra con efectos fijos (el denominador era siempre la SCM Error). En este sentido recordar que ahora el F -test de cada fila del ANOVA contrasta la hiptesis nula de si
2 es 0. Por ejemplo, la fila relativa a nivel la varianza de la fuente de variacin de esa fila, digamos *

contrasta:

2 nivel H0 : B =0

frente

2 H 1nivel : B > 0 . En efectos fijos el contraste era

nivel nivel H0 :2 : i, j tales que i j . j = cte, j , frente a H 1

A pesar de que los grados de libertad de cada suma de cuadrados son los mismos que en efectos fijos,
* 2 * 2 :* = 0 frente a H 1 los grados de libertad del denominador del cociente F para testar H 0 :* >0 podran variar ahora. La explicacin es sencilla:

con efectos fijos el cociente F era siempre del tipo la nula era siempre una Fgl ( SCM

SCM Fuente* , por tanto, la distribucin bajo SCM Error

Fuente* ), gl ( SCM Error ) ,

72 Diseo y Anlisis de Experimentos con efectos aleatorios el cociente F es de la forma

SCM Fuente* , donde ctei SCM Fuentei


i

U = ctei SCM Fuentei es una combinacin lineal adecuada de sumas de cuadrados medios
2 tal que E (SCM Fuente* U ) = cte* * . Por consiguiente, la distribucin bajo la nula es ahora i

del tipo Fgl ( SCM

Fuente* ), gl (U )

. En general, los grados de libertad de U no son sencillos de calcular y

existen frmulas relativamente sencillas para aproximarlos cuando se trata de diseos balanceados. Como en efectos fijos, carece de sentido resolver los contrastes obre la varianza de los efectos principales cuando ha resultado significativo el contraste sobre la varianza de los efectos interaccin.

Analizando la Tabla 6.4 se concluye entonces:


tipo*nivel 2 2 1. Se realiza en primer lugar el contraste: H 0 : AB = 0 frente a H 1tipo*nivel : AB > 0 . La informacin de inters sobre este contraste se encuentra en la fila siguiente de la Tabla 6.4:

Fuente tipo * nivel

Hiptesis Error

Suma de cuadrados tipo III 401,834 202,424

gl 2 24

Media cuadrti ca 200,917 8,434(d)

F 23,821

Sig. ,000

Eta al cuadrado parcial ,665

Potencia observada (a) 1,000

En este caso:
2 5 AB = E (SCM tipo * nivel SCM Error ) F =

tipo*nivel El nivel crtico es p = P F2, 24 > 23,821 = 0 y por tanto se rechaza H 0 y se concluye que se

SCM tipo * nivel 200,917 = = 23,821 8,434 SCM Error

dan diferentes crecimientos medios del tallo en las plantas de guisantes segn la combinacin variedad de planta y nivel de agua con que se trata. No se afirma que existen diferencias entres las combinaciones empleadas en el experimento sino en general. 2. Al haber rechazado la hiptesis nula de no interaccin entre las dos fuentes de variacin consideradas, no tiene sentido testar los efectos principales. 3. A los efectos tan slo de ilustrar como se procedera en el caso de que no se hubiese rechazado
tipo*nivel H0 , indicar que el siguiente paso sera resolver los contrastes:

tipo 2 2 H0 : A = 0 frente a H 1tipo : A >0

y
nivel H0 2 : B 2 = 0 frente a H 1nivel : B >0

tipo 2 2 El primero, H 0 : A = 0 frente a H 1tipo : A > 0 , se basara en la fila del cuadro para tipo:

Fuente Tipo

Hiptesis Error

Suma de cuadrados tipo III 1062,075 401,834

gl 1 2

Media cuadrtica 1062,075 200,917(c)

F 5,286

Sig. ,148

Eta al cuadrado parcial ,726

Potencia observada(a) ,266

que tiene su justificacin en que: Master Oficial en Tcnicas Estadsticas

Diseo y Anlisis de Experimentos en el SPSS 73


2 15 A = E (SCM tipo SCM tipo * nivel ) F =

SCM tipo 1062,075 = = 5,286 SCM tipo * nivel 200,917

obsrvese que ahora, al contrario que con efectos fijos, el denominador no es la SCM Error sino la suma de cuadrados medios de la interaccin (aunque el SPSS le llama Error). Aqu, el nivel crtico es p = P F1, 2 > 5,286 = 0,148 , del que no se concluira significacin estadstica. Con el otro

contraste se razonara anlogamente.

Cuestin 30: Desde un punto de vista de la planificacin experimental, qu diferencias habra entre un diseo de efectos fijos y un diseo de efectos aleatorios? Cuestin 31: Supngase que una fuente de variacin es un factor de bloqueo, que los bloques han sido seleccionados al azar y que no se contempla en el modelo la interaccin entre el factor de bloqueo y los factores tratamiento, sera el factor de bloqueo un factor de efectos fijos o de efectos aleatorios? Existira algn matiz a tu respuesta si el diseo incluyese la interaccin? Cuestin 32: Podra ocurrir que alguna estimacin de una componente de la varianza fuese negativa. Por qu? Cmo lo interpretaras? Cuestin 33: Considrese un modelo de efectos aleatorios balanceado dado por:

y ijkt = + Ai + B j + C k + ( AB )ij + (BC ) jk + ijkt


2 con i = 1,..., a; j = 1,..., b; k = 1,..., c; t = 1,..., n. Sabras dar la expresin que estima B ? Y la del 2 B 2 cociente F para resolver el contraste H 0 : B = 0 frente a H 1B : B > 0?