Professional Documents
Culture Documents
EXPERIMENTOS CON
UN SOLO
UN SOLO FACTOR:
FACTOR:
EL ANLISIS
EL ANLISIS DE
DE
VARIANZA
VARIANZA
CAPITULO 3
Diseo y Anlisis de Experimentos
Montgomery
NDICE
Experimentos con un solo factor: anlisis de
variancia.
Estimacin de los parmetros del modelo.
Comparacin de Medias de Tratamientos
Individuales
Comparacin de Parejas de Medias de
Tratamientos
Efecto de Modelos Aleatorios
UN EJEMPLO
Ejemplo 3.1 Pag. 70 - Peso porcentual del algodn
Un ingeniero de desarrollo de producto tiene inters en investigar la resistencia
a la tensin de la fibra sinttica nueva que se usar para hacer tela de camisas
para caballero. El ingeniero sabe por experiencia previa que la resistencia a la
tensin se afecta por el peso porcentual del algodn utilizado en la mezcla de
materiales de la fibra. Adems, sospecha que al aumentar el contenido de
algodn se incrementar la resistencia. Sabe asimismo que el contenido de
algodn deber variar entre 10 y 40 por ciento para que el producto final tenga
otras caractersticas de calidad que se desean (como la capacidad de ser
sometido a un tratamiento de planchado permanente). El ingeniero decide
probar ejemplares en cinco niveles del peso porcentual del algodn: 15, 20, 25,
30 y 35 por ciento. Tambin decide probar cinco ejemplares en cada nivel del
contenido de algodn.
39
Peso porcentual del algodn (continuacin)
Peso porcentual del algodn
(continuacin)
Secuencia de prueba Nmero de corrida Porcentaje de algodn
1 8 20
2 18 30
3 10 20
4 23 35
5 17 30
6 5 15
7 14 25
8 6 20
9 15 25
10 20 30
11 9 20
12 4 15
13 12 25
14 7 20
15 1 15
16 24 35
17 21 35
18 11 25
19 2 15
20 13 25
21 22 35
22 16 30
23 25 35
24 19 30
25 3 15
Resultados del Experimento
Peso porcentual del algodn (continuacin)
Figura 3-1
Peso porcentual del algodn (continuacin)
Observaciones Individuales
Promedio de la resistencia a la Tensin
Figura 3-2
EL ANALISIS DE VARIANZA
MODELO PARA LOS DATOS
Es til describir las observaciones mediante el modelo
estadstico lineal
yij = i + ij , donde i = 1, 2, ... , a; j = 1, 2, ... n (3.1)
yij es la observacin ij-sima.
i es la media del nivel del factor o tratamiento i-simo.
ij es un componente del error aleatorio que incorpora todas las
dems fuentes de variabilidad del experimento
A la ecuacin (3.1) se le llama modelo de medias. Una forma
alternativa de describir un modelo de los datos es definiendo
i = + i , i = 1, 2, , a
De tal modo que la ecuacin (3.1) se convierte en
yij = + i + ij , donde i = 1, 2, ... , a; j = 1, 2, ... n (3.2)
es la media global
i es el efecto del tratamiento i-simo
A la ecuacin (3.2) se le llama el modelo de los efectos.
ANALIS DEL MODELO CON
EFECTOS FIJOS
Anlisis del Modelo con Efectos Fijos
n
i 1
i 0
n _
yi. yij , , , , , y i. y i. / n, _ donde _ i 1,2,..., a.
j 1
(3.3)
a n
y.. yij , , , , y.. y.. / N
i 1 j 1
Donde N = an es el nmero total de observaciones.
El subndice punto implica la operacin suma sobre el
subndice que reemplaza.
i 1 j1
n
y y ij ..
yij y..
i 1 j1
2
a n
i 1 j1
( y y ) ( y y )
i. .. ij i.
2
(3.4)
a
n
y y
ij ..
2
n
a
yi. y..
2
a n
y y ij i.
2
2
a n
yi. y.. yij yi. (3.5)
y y y n y y n yi. / n 0
i 1 j1 i 1 i 1 j1 i 1 j1
n
Sin embargo :
ij i. i. i. i.
y y y y
j 1
yi. y..
a n 2 a 2 a n 2
ij .. n ij i.
(3.6)
i 1 j1 i 1 i 1 j1
16 SS T
SS Tratamient os SS E
DESCOMPOSICION DE LA SUMA DE
CUADRADOS TOTAL (continuacin)
Es til examinar los dos trminos del lado derecho de la identidad
fundamental del ANOVA.
E
a n
SS y ij y i. y ij y i.
i 1 j 1
2 a
i 1
n
j 1
2
S , , , , , para :, , , , i 1,2,..., a
2 j 1
i
n 1
Si se combinan las a varianzas muestrales se obtiene una sola
estimacin de la varianza poblacional
n 1 S n 1 S
2
... n 1 S y ij y i.
2 2
a n
2
SS
1 2
a i 1 j 1 E
(n 1) (n 1) ... (n 1) n 1
a
N a
i 1
DESCOMPOSICION DE LA SUMA DE
CUADRADOS TOTAL (continuacin)
La relacin NSS a es una estimacin combinada
E
SS
a
n yi. y.. 2
Tratamient os
i 1
a 1 a 1
Z Q Q ... Q
2
i 1 2 S
i 1
SS / N a
0
E MS E
SS y
2 ..
T
N
ij
i 1 j 1
2
1 y a
y
2
SS
..
Tratamient os
n N
i.
i 1
SS SS SS
E T Tratamient os
Experimentos
Comparativos Simples
ESTIMACIN DE LOS PARMETROS DEL MODELO
yij i ij
i es el efecto del tratamiento i-simo
y ..
i y y , , , , , , , i 1,2,..., a
i. ..
ESTIMACIN DE LOS PARMETROS DEL MODELO (continuacin)
y t / 2, N a MS E
y t / 2, N a MS E
i. n i i. n
De la misma manera para una diferencia de medias, digamos
i j, sera:
y y t / 2, N a 2MS E
y y t / 2, N a 2MS E
i. j. n i j i. j. n
Ejemplo 3.3 Pag. 75: Siguiendo el ejemplo 3-1 pueden
encontrarse las estimaciones de la media global y de los
y t / 2, N a MS E
y t / 2, N a MS E
i. n i i. n
Con un intervalo de confianza del 95% para la media del
tratamiento 4 (30% de algodn), obtenemos: 21.60 +- 2.651,
por lo que el intervalo quedara de la siguiente manera:
8.06 8.06
21.60 2.086 21.60 2.086
5 4 5
21.60 2.65 21.60 2.65
4
18.95 4 25.25
DATOS NO BALANCEADOS
En algunos experimentos de un solo factor, el nmero de
observaciones recolectadas en cada tratamiento pueden ser
diferentes, cuando esto ocurre, se dice que el diseo est
desequilibrado, es no balanceado.
Sigue siendo posible aplicar el anlisis de varianza
anteriormente establecido para datos no balanceados, pero
deben hacerse ligeras modificaciones en las frmulas de las
sumas de cuadrados.
Hay dos ventajas al elegir un diseo equilibrado:
Primera con muestras del mismo tamao, la estadstica
de la prueba es relativamente insensible a pequeas
desviaciones de la suposicin de la igualdad de las
varianzas en los tratamientos.
Segunda, el poder de la prueba se maximiza cuando las
muestras tienen el mismo tamao.
DATOS NO BALANCEADOS (continuacin)
Sea que se hagan ni observaciones bajo el tratamiento
i (i = 1, 2, , a) y que N a
i 1 n
i
No se requieren ms cambios.
Ejercicio en clase (datos no balanceados)
Se estn investigando cuatro catalizadores que
pueden afectar la concentracin de un componente en
una mezcla lquida de tres componentes. Se obtienen
las siguientes concentraciones:
pj = (( j 0.5) / N) * 100
Secuencia Residual
Normal
1 -3.8 2
2 -3.6 6
3 -3.4 10
4 -3.4 14
5 -2.8 18
6 -2.8 22
7 -2.6 26
8 -2.6 30
9 -0.8 34
10 -0.8 38
11 0.2 42
12 0.2 46
13 0.4 50
14 0.4 54
15 0.4 58
16 1.2 62
17 1.4 66
18 1.4 70
19 1.4 74
20 1.6 78
21 2.6 82
22 2.6 86
23 3.4 90
24 4.2 94
25 5.2 98
EL SUPUESTO DE NORMALIDAD (continuacin)
pj = (( j 0.5) / N) * 100
Grfica de Probabilidad Normal de los Residuales
120
100
% de Probabilidad Normal
(Pj = (( j - 0.5)/N)100)
80
60
40
20
0
-6 -4 -2 0 2 4 6
Residual (eij = yij - ybi.)
GRAFICA DE LOS RESIDUALES EN
SECUENCIA EN EL TIEMPO
GRAFICA DE LOS RESIDUALES CONTRA
LOS VALORES AJUSTADOS
GRAFICA DE LOS RESIDUALES
VS. LOS NIVELES
PRUEBAS ESTADISTICAS PARA
IGUALDAD DE VARIANZA
Aun cuando es frecuente el uso de las grficas residuales para
diagnosticar la desigualdad de varianzas, se han propuesto tambin
varias pruebas estadsticas.
Estas pruebas pueden considerarse como pruebas formales de las
hiptesis H0: 21 = 22 = ... = 2a
H1: 2i 2j Para al menos un par (i, j)
Un procedimiento muy til es la prueba de Barlett.
La igualdad de varianza se conoce como homocedasticidad.
q
0
2 a
2. 3026 log10 S p ni log10 S i
2 2
donde q ( N a ) ( 1)
c i 1
Si es la varianza
2 c 1
1 a
3 a 1 i 1
ni 1 N a
1
1
muestral de la
n 1 S
a
poblacin i-sima 2
i i
2
S p
i 1
N a
PRUEBAS ESTADISTICAS PARA
IGUALDAD DE VARIANZA (continuacin)
La cantidad q es grande cuando la diferencia entre las
varianzas muestrales Si2 es considerablemente grande, y es
igual a cero cuando todas las Si2 son iguales.
H0 deber rechazarse para los valores de 02 que sean muy
grandes; es decir, se rechaza H0 slo cuando
20 > ,a-1
Donde ,a-1 es el punto porcentual superior a la
distribucin ji-cuadrada con a - 1 grados de libertad.
La prueba de Barlett es muy sensible al supuesto de
normalidad. Por consiguiente, cuando la validez de este
supuesto est en duda, no deber usarse la prueba de
Barlett.
Ejemplo 3.4 Pag. 82
Ya que el supuesto de normalidad no est entre dicho en
este ejemplo, se puede usar la prueba de Barlett.
Se calculan primero las varianzas muestrales de cada
tratamiento y se encuentra que: S21=11.2, S22=9.8, S23=4.3,
S24=6.8, S25=8.2. Entonces
10 10 10 10 10
q 20 log (8.06) 4 log 11 .2 log 9.8 log 4.3 log 6.8 log 8.2 0.45
10
1 5 1
c 1 1.10
3(4) 4 20
0.45
Y el estadstico de prueba es 0 2.3026 1.10 0.93
2
dij = I yij - yi I
0.10
0.00
-0.40 -0.20 0.00 0.20 0.40 0.60 0.80 1.00 1.20 1.40
-0.10
-0.20
-0.30
log yi barra
Ejemplo 3.5 Pag. 83 (continuacin)
La tabla de los datos transformados, se muestra a
continuacin:
Mtodo de
Observaciones Transformadas
Estimacin
1 0.58 0.35 1.11 0.84 1.32 0.35
2 0.95 1.71 1.46 1.54 1.69 2.13
3 2.51 2.89 3.12 2.47 3.13 2.69
4 4.14 3.44 3.31 4.15 3.79 4.10
Total 35.3726 22
Ejemplo 3.5 Pag. 83 (continuacin)
La grfica residual muestra una mejora sensible
en comparacin con la anterior.
INTERPRETACION
PRCTICA DE LOS
RESULTADOS
INTERPRETACION PRCTICA
DE LOS RESULTADOS
Un Modelo de Regresin
.
Un Modelo de Regresin (continuacin)
20 20
Serie3 Serie3
15 Serie4 15 Serie4
10 Serie5 10 Serie5
5 Serie6 5 Serie6
Polinmica Polinmica
0 0
(Serie6) (Serie6)
0 20 40 0 20 40
Un Modelo de Regresin (continuacin)
Comparacin Grfica de Medias
Es muy sencillo desarrollar un procedimiento grfico para la comparacin
de las medias despus de un ANOVA. _ _ _
Suponga que el factor de inters tiene a niveles y que y1. , y2. ... ya . son
los promedios de los tratamientos. Si se conoce , el promedio de
cualquier tratamiento tendr una desviacin estndar / n .
_ los niveles del factor son idnticas, las
Entonces, si todas las medias de
medias muestrales observadas y i . se comportaran como un conjunto de_
observaciones tomadas al azar de una distribucin normal con media y..
y desviacin estndar/ n .
Visualice una distribucin normal con la_ capacidad
_ _ de ser deslizada sobre
un eje abajo del cual estn graficadas y1. , y2. ... ya . . Si todas las medias
de las tratamientos son iguales, deber haber una_ posicin de esta
distribucin que haga evidente que los valores y i . se sacaron de la misma
distribucin. _
Si no es este el caso, los valores yi. que no parecen haberse sacado de
esta distribucin se asocian con los niveles del factor que producen
respuestas medias diferentes.
Comparacin Grfica de Medias (continuacin)
Punto dbil: se desconoce , en este caso se sustituye con MS E
del anlisis de varianza y usar una distribucin t con factor de escala
MS E / n en lugar de la distribucin normal.
Ejemplo: Para trazar la distribucin t, simplemente se multiplica el valor de
la abscisa t por el factor de escala MS E 8.06 1.27 y se grafica
contra la ordenada de t en este punto. n 5
En la figura se ve que no hay ninguna posicin de la distribucin tal que
los cinco promedios puedan considerarse como observaciones tpicas
seleccionadas al azar de la distribucin.
Esto implica que las cinco medias no son iguales; por lo tanto, la figura es
una representacin grfica de los resultados del anlisis de varianza.
La figura indica que el 30% de algodn produce resistencia a la tensin
mucho ms alta que 20 25 por ciento de algodn y que 15 35 por
ciento de algodn producirn resistencias aun ms bajas.
15 35 20 25 30 Niveles (% Algodn)
5 10 15 20 25 Media (Res.Ten.)
Resistencia a la tensin promedio (lb/pulg )
2
Contrastes
Muchos mtodos de comparacin mltiple utilizan el concepto de
contrastes.
Puesto que se rechaz la hiptesis nula en el caso de la resistencia del
algodn, se sabe que algunos pesos porcentuales del algodn
producen resistencia a la tensin diferente de otros, pero, cules son
los que causan en realidad esta diferencia?
Al principio podra sospecharse que los niveles 4 y 5 (30% y 35%)
producen la misma resistencia a la tensin, lo que implica que la
hiptesis a probar sera H0: 4 = 5
Hi: 4 5 (3.23)
a (3.25)
H : c
1
i 1
i i
0
La varianza de C es V (C ) n c
2 2
i (3.26) cuando los
i 1
t
0
i 1
a (3.27)
para probar la hiptesis de la ecuacin
n MS E 3.25. La
2
c i
H0 se rechaza
i 1 si It I excede
0 ta/2, N-a
Contrastes (continuacin)
En el segundo enfoque se utiliza la prueba F. Entonces, el cuadrado
de una variable aleatoria t con v grados de libertad es una variable
aleatoria F con un grado de libertad en el numerador y v grados de
libertad en el denominador. Por lo tanto puede obtenerse
a
c y
2
i i.
Como un estadstico F para probar la
F t
2 i 1
0 0 a (3.28) ecuacin 3.25. La hiptesis nula se
n MS c
2
E
i 1
i rechazara si F0>Fa,1,N-a
Este estadstico de prueba de la ecuacin 3.28 puede escribirse como
MS SS /1
F C
C
MS
0
E MS E
c y
Donde la suma de cuadrados de los contrastes con un solo grado de
2
libertad es a
i i.
SS C i 1
a (3.29)
n c 2
i
62
i 1
Intervalos de Confianza para un Contraste
En lugar de probar hiptesis acerca de un contraste, puede ser ms
til construir un intervalo de confianza. Entonces el contraste suele
expresarse en trmino de los promedios de los atratamientos yi.
Suponga que el contraste de inters es: c
i i
i 1
V (C )
2 a
c
2
n i 1
i
cuando los tamaos de las muestras son iguales. Si se usa MSE para
estimar 2, el intervalo de confianza de 100(1-a) por ciento para el
contraste i 1 ci i es
a
c y t MS y
a
2
a a
MS a
2
E
c c c t c E
i 1
i i. 2
, N a
n i 1
i
i 1
i i
i 1
i i. 2
, N a
n i 1
i
(3.30)
Evidentemente, si este intervalo de confianza incluye al cero, no
podra rechazarse la hiptesis nula en la ecuacin 3.25.
Contraste Estandarizado
Cuando hay inters en ms de un contraste, con frecuencia es
til evaluarlos en la misma escala. Una forma de hacer esto es
estandarizando el contraste para que su varianza sea 2.
c
a
Si el contraste i 1 i i
se expresa en trminos de los
totales de los tratamientos como i 1 ci y
a
al dividirlo por
i .
ni 1 ci
a 2
se obtendr un contraste estandarizado con
varianza 2. Entonces el contraste estandarizado es en
cy
a *
realidad
i 1 i i.
* c
donde c i
a
i
n c
2
i
i 1
Tamao de las Muestras Desiguales
Cuando los tamaos de las muestras de cada tratamiento son
diferentes, se introducen modificaciones menores en los resultados
anteriores. Primero, observe que la definicin de un contraste
nc
a
requiere ahora que 0
i 1 i i
t
0
i 1
a
MS ni c
2
E i
i 1
c y
2
i i.
SS C
i 1
a
ni c
2
i
i 1
Contrastes Ortogonales ( caso especial )
Dos contrastes con coeficientes { ci } y { di } son
a
ortogonales, si: ci d i 0
i 1
c y
a
i i.
2
Remplazando: SS C
i 1
a
n c 2
i
i 1
C4 = 9 SSc4 = ( 9 )2 / (5 * ( 20 )) = 0.81
Ejemplo 3.6 (continuacin)
ANOVA - Resistencia a la Tensin del Peso porcentual del algodn
Grados Cuadra
Suma
de do
Fuente de Variacion Cuadrados Fo F0.05,4,20 P value
libertad Medio
(SS)
(Dof) (MS)
Peso porcentual del algodn 475.76 4 118.94 14.76 2.87 0.00000913
Contrastes ortogonales
C1 = -y 4. + y 5. 291.6 1 291.6 36.18 4.35 0.00000701
C2 = y 1. + y 3. - y 4. - y 5. 31.25 1 31.25 3.88 4.35 0.06295952
C3 = y 1. - y 3. 152.1 1 152.1 18.87 4.35 0.00031474
C4 = -y 1. + 4y 2. - y 3. - y 4. - y 5. 0.81 1 0.81 0.10 4.35 0.75452031
c
a
MS
2
El error estndar de este contraste es: Scu E iu
/ ni (3.33
i 1
i j
. A la cantidad
(1 / n )
i 1
i
(3.43)
y 4.
21.6
El error estndar de cada promedio es
S y 8.06 / 5 1.27 . En el conjunto de R r
2 0.05
2,20 S y i.
(2.95)(1.27) 3.75
i.
Telares 1 2 3 4 Yi
1 98 97 99 96 390
2 91 90 93 92 366
3 96 95 97 95 383
4 95 96 99 98 388