Professional Documents
Culture Documents
3.1 Un Ejemplo
Contenido
de Algodn Nmero de Muestra
(%)
15 1 2 3 4 5
20 6 7 8 9 10
25 11 12 13 14 15
30 16 17 18 19 20
35 21 22 23 24 25
1 8 20
2 18 30
3 10 20
4 23 35
5 17 30
6 5 15
7 14 25
8 6 20
9 15 25
10 20 30
11 9 20
12 4 15
13 12 25
14 7 20
15 1 15
16 24 35
17 21 35
17 11 25
19 2 15
20 13 25
21 22 35
22 16 30
23 25 35
24 19 30
25 3 15
1 2 3 4 5 total media
15 7 7 15 11 9 49 9.8
20 12 17 12 18 18 77 15.4
25 14 18 18 19 19 88 17.6
30 19 25 22 19 23 108 21.6
35 7 10 11 15 11 54 10.08
376 15.04
Tabla 3.3 Resultados del Experimento con Cinco Niveles de Contenido de Algodn
Tal solucin sera incorrecta. Existen 10 posibles pares los que, examinados a un nivel de
confianza del 95 % cada uno (1 0. 95), arrojaran en conjunto un nivel de significacin del
(0. 95)10 0. 60 . Es decir, existira un substancial incremento del error del tipo I. El
procedimiento apropiado para examinar la igualdad de varias medias es el Anlisis de Varianza.
Tratamiento
(nivel) Observaciones
. . . ... . . . .
. . . ... . . . .
i 1,2,...... a
y ij i ij
j 1,2,...... n
(3.1)
donde
y ij es la i - esima, j - esima observacin
A este modelo se le llama " Anlisis de Varianza de Factor Simple" pues se investiga un slo
factor. Con respecto a los tratamientos o niveles, la Eq. 3.1 describe dos situaciones diferentes:
1. Los niveles o tratamientos ha sido escogidos por el investigador. Este modelo se conoce
como "Modelo de Efectos Fijos".
2. Los niveles o tratamientos ha sido escogidos al azar. Este modelo se conoce con el nombre
de "Modelo de Efectos Aleatorios" o "Modelo de Varianza de Componentes".
En este modelo, los efectos de tratamientos i , se definen como desviaciones de la media total,
es decir que se cumple:
a
i 1
i 0
(3.2)
Ahora, considrense las siguientes definiciones:
n
Yi y ij y i Yi / n i 1,2,......., a
j 1
a n
Y y ij Y Y /N
i 1 j 1
(3.3)
donde N = an , es el numero total de observaciones.
Ei ( yij ) i i i 1, 2,......., a
(3.4)
La Eq. 3.4 indica que la media del tratamiento i es la suma de la media global y del efecto de
dicho tratamiento.
Ho : 1 2 3 ........... a
H1: i j para al menos un par i , j
(3.5)
Ho : 1 2 3 ........... a
H1: i j para al menos un par i , j
(3.6)
De la Eq. 3.6 se concluye que se puede probar la igualdad de medias mediante el examen de la
igualdad de los efectos de tratamiento. El procedimiento apropiado para probar " igualdad de
efectos de tratamiento " es el Anlisis de Varianza.
(3.7)
y Y [( yi Y ) ( yij yi )]2
a n a n
2
ij
i 1 j 1 i 1 j 1
ordenando:
a n a a n
( yij Y ) 2 n ( yi Y ) 2 ( yij yi ) 2
i 1 j 1 i 1 i 1 j 1
(3.8)
La Eq. 3.8 indica que la variabilidad total de los datos es igual a la suma de los cuadrados de las
diferencias entre las medias de los tratamientos y la media total; mas la suma de los cuadrados
de las diferencias entre las observaciones y las medias de cada tratamiento. La Eq. 3.8 se puede
escribir como:
donde SCt es la suma de cuadrados debido a los tratamientos (niveles) y SCe es la suma de
cuadrados debido al error.
a n a n
SCe ( y ij y i ) 2 ( y ij yi ) 2
i 1 j 1 i 1 j 1
(3.9)
De esta manera, se ve que el trmino dentro de los parntesis cuadrados dividido entre n-1, es la
varianza muestral del tratamiento i . Es decir:
(y
j 1
ij yi ) 2
S i2 i 1,2,......., a
n 1
1Esto es razonable pues, se se divide SCT entre el nmero de grados de libertad, an - 1 = N - 1 ,se estara en presencia de la
varianza muestral misma que es una medida estndar de variabilidad.
a
n i
E (CM e ) 2 y E (CM t ) 2 i 1
a 1
(3.12)
Como se dijo antes, los cuadrados medios son estimaciones de la varianza poblacional y por
tanto, si no existen diferencias entre las medias de los tratamientos ( i2 0) , entonces los
valores esperados de ambos estimadores sern idnticos e iguales a la varianza poblacional.
En virtud del Teorema de Cochran , si el termino SCT es una suma de cuadrados de variables
aleatorias normales y la hiptesis nula Ho : i 0 es verdadera, entonces se cumple lo siguiente:
Ejemplo
Contenido
de Algodn Observaciones
(%) (en kg/cm2)
1 2 3 4 5 totales medias
Yi yi
15 7 7 15 11 9 49 9.8
20 12 17 12 18 18 77 15.4
25 14 18 18 19 19 88 17.6
30 19 25 22 19 23 108 21.6
35 7 10 11 15 11 54 10.08
Y =376 Y = 15.04
5 5
Y2
SCT y 636.96
2
ij
i 1 j 1 N
5
Yi 2 Y 2
SCt 475.76
i 1 n N
En esta seccin se desarrollaran estimadores de los parmetros del Modelo de Factor Simple
(Eq. 3.1) empleando el mtodo de mnimos cuadrados. Cuando se estiman y i mediante
mnimos cuadrados, ya no es necesario asumir que los errores ij son independientes y que se
distribuyen normalmente. Para encontrar los estimadores mnimos cuadrados de y i se
desarrolla la suma de los cuadrados de los errores .....
(3.13)
....y se eligen valores y i , estimadores de y i , que minimicen L. Es decir, se resuelve
el sistema de ecuaciones que se origina de:
L
, i 0
L
, i 0
i
El sistema es:
N n1 n2 ... na Y
n n1 Y1
n n2 Y2
. . .
n na Ya
(3.14)
Las a+1 ecuaciones arriba expresadas se llaman ecuaciones normales de mnimos cuadrados
mismas que no son linealmente independientes y por tanto no tienen un sola solucin. Esta
problema puede solucionarse mediante la Eq. 3.2 que establece que los efectos de los
tratamientos son desviaciones de la media. Con dicha condicin, las soluciones a la Eq. 3.14
son:
Y
i yi Y i 1,2,..... a
(3.15)
Esta solucin establece que la media global es estimada por la media total de las observaciones
y que cualquier efecto de tratamiento es la diferencia entre la media del tratamiento y la media
total de las observaciones.
Puede demostrarse que un intervalo de confianza de la media de un tratamiento esta dado por:
yi t / 2, N a CM e / n
yi y j t / 2, N a 2CM e / n
Supngase que al llevar a cabo un anlisis de varianza en el modelo de efectos fijos se rechaza
la hiptesis nula lo que implica la existencia de diferencias entre las medias de tratamientos. En
estas circunstancias, otras comparaciones entre grupos de medias de tratamientos suelen ser
muy tiles. Comparaciones entre medias de tratamientos son hechas en trminos de totales de
Tratamientos, Y i , o medias de tratamientos, yi .Los procedimientos para llevar a cabo estas
comparaciones se denominan "Mtodos de Comparacin Mltiple".
Supngase que el factor de inters tiene a niveles (tratamientos) y que por tanto existen a
( y1 , y2 , y3 ,.... ya ) medias de tratamiento. Si se conociera , cualquier media de tratamiento
tendra un desviacin estndar igual a / n . En consecuencia, si todas la medias de los
distintos niveles fuesen idnticas, las media muestrales observadas, yi , se comportaran como si
fuesen un grupo de observaciones extrado al azar de una distribucin normal con media Y y
desviacin / n . Si no se conoce , se la puede reemplazar por su estimador expresado en la
Eq. 3.12, es decir por CMe , siendo por tanto la desviacin estndar (factor de escala) igual a
CMe / n y "t" la distribucin a emplearse. El procedimiento consiste en multiplicar valores de
la absisa (factor en estudio) por el factor de escala y reconstruir la curva "t" con dichos valores
de absisa (valores de ordenadas puede extraerse de Box, Hunter y Hunter. 1978). Luego, en la
"nueva" absisa, se localizan los valores medios observados y se observa si dichas medias se
comportan como tpicas observaciones tomadas al azar de la poblacin. Es decir, si las
ordenadas de las medias estn dentro de la grfica, estn prximas y no muestran una secuencia
definida.