You are on page 1of 46

Profesor: Augusto N.

Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Six Sigma
Excelencia en el
Negocio
08 Anlisis de
Varianza ANOVA

Reconocer Definir Medir Analizar Mejorar Controlar

Sobre este Mdulo

La Significacin Estadstica se puede


evaluar por medio de las tcnicas One-
Way ANOVA o la N-Way ANOVA (para
ms de un factor).

Six Sigma: La bsqueda de la Perfeccin


en los Procesos; Cmo Conseguir
Objetivos y luchar contra la variacin?

2
Response

\Datafile\Azalea.mtw
\DataFile\aov.mtw
\DataFile\PntWear.mtw
1 \DataFile\PntWear1.mtw
\DataFile\dataentr.mtw
\Datafiles\Exh_aov.mtw

0
4

5
1

Factor

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -1-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Qu vamos a aprender

1. ANalysis of VAriance (ANOVA) [Anlisis de Varianza]

2. Variacin y Suma de Cuadrados

3. Construccin de la tabla ANOVA

4. Suposiciones Estadsticas

5. La distribucin F

6. Tcnicas Grficas, Estadsticas y de Diagnstico

7. Ajustes y Residuales

8. Epsilon Cuadrado

9. Tamao de la Muestra y Potencia del Ensayo

10. ANalysis of Means (ANOM) [Anlisis de Medias]

Definir Medir Analizar Mejorar Controlar

Escenarios del Mundo Real

Diseo:
Un productor de flores necesita saber qu semana dentro del ciclo de
crecimiento de la azalea presenta la mayor tasa de crecimiento.
- Cmo debera este productor plantear y analizar el experimento?

Fabricacin:
Un ingeniero de proceso necesita determinar el efecto de tres tiempos de
proceso y tres valores de tensin en la densidad de un tipo de plstico.
- Cmo debera el ingeniero plantear y analizar el experimento?

Administracin:
Un equipo administrativo tiene asignado el proyecto de reducir el tiempo
para la introduccin de la informacin en los acuerdos de licencia . El
equipo ha elaborado cuatro tipos diferentes de formulario.
- Cmo debera el equipo plantear y analizar el experimento?

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -2-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Anlisis de Varianza (ANOVA)

El anlisis de varianza es una generalizacin de la Prueba t


para las medias de 2 muestras, y nos permite comprobar la
significacin estadstica de las diferencias entre las medias de
k (k>2) diferentes muestras.

La tcnica del anlisis de varianza emplea informacin de las


muestras para determinar si dos o ms factores muestran
resultados diferentes.

Un punto importante es que el anlisis de varianza -


literalmente una tcnica que analiza o comprueba varianzas-
es una herramienta que nos permite comprobar la significacin
de las diferencias entre medias.

Excerpts from Statistical Analysis for Decision Making by Morris Hamburg & Peg Young

Definir Medir Analizar Mejorar Controlar

One-Way ANOVA

Se usa para comprobar la hiptesis nula que las


medias de diferentes poblaciones son iguales:
Ho: 1 = 2 = 3 = 4
Ha: Al menos una k es differente

ANOVA determina si las medias son diferentes,


pero no cules de ellas lo son.

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -3-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Variacin y Suma de Cuadrados

One-Way ANOVA

Una comparacin de la variacin entre parejas de factores y


de la propia variacin dentro de cada uno de esos factores
proporciona informacin de la variacin total.

Suma de Cuadrados = media cuadrtica = Varianza


Grados de Libertad

Definir Medir Analizar Mejorar Controlar

Suma de Cuadrados
Comprendiendo los Fundamentos

2 xj - Media del Grupo: la media del factor j


Response

xij - Valores individuales: la muestra i del factor j


1
x - Media Global del experimento
i = representa al Grupo n
0 j = representa un valor dentro del grupo g
g = N total de grupos (1 a j)
4
1

5
2

n = nmero de datos en cada grupo


Factor

Capacidad Exactitud Precision


g n g g n
2 2
(x x)
j =1 i =1
ij = n (x
j =1
j x )2 + (x
j =1 i =1
ij xj)

SSTotal = SSFactor + SSError

Total: SSTotal = Suma Total de Cuadrados del Experimento (Valores individuales - Media Global )
Entre Factores: SSFactor = Suma de Cuadrados del Factor (Media del Grupo - Media Global )
Dentro de cada factor: SSError = Suma de Cuadrados en el Grupo (Valores individuales - Media del Grupo )

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -4-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Trminos

Grados de Libertad (DF): el nmero de conclusiones


independientes que se pueden extraer de los datos.
SSFactor: Mide la variacin entre la media de cada grupo y la
media total que comprende a todos los grupos.
SSError: Mide la variacin de cada observacin dentro de cada
factor en relacin con la media del factor.
Error Cuadrtico Medio (MSE): Es el SSerror dividido por el
nmero de grados de libertad (DF) del error.
F: la relacin de la varianza entre factores a la varianza dentro
de cada factor = MS/MSE. Si F es prximo a 0 las medias de
los factores no son diferenes (el valor P es grande).
P: la probabilidad que la diferencia observada se deba al azar
(error de muestreo). Un valor de P pequeo ( <0.05) indica una
diferencia y Ho debe rechazarse.
Definir Medir Analizar Mejorar Controlar

Tabla ANOVA
Fuente Suma de Grados de Media F = MS Valor P basado
Cuadrados Libertad Cuadrtica factor/MS en F y DF
(Varianza) error
Entre SSFactor g-1 SSFactor / MSfactor /MSerror P(F)
(between) (g-1)

Dentro SSError g(n-1) SSError /


(within) g(n-1)

Total SSTotal ng-1

DFTotal =DFBetween +DFWithin g = # de Grupos


DFTotal =N-1and
y N=ng n = # n en el Grupo
N = # en la Poblacin = n*g
DFBetween = g-1
DFWithin = (N-1)-(g-1) = (ng-1)-(g-1) = g(n-1)

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -5-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Tabla ANOVA (Cont)

Ensayo de Hiptesis:
Ho: 1 = 2 = 3 = 4
Ha: Al menos una de las k es diferente

Para determinar si podemos aceptar o no la hiptesis nula


debemos calcular el estadstico del ensayo (relacin F)
utilizando el anlisis de varianza como se muestra en la tabla
siguiente
FUENTE SS df MS (=SS/df) F {=MS(Factor)/MS(Error)}
ENTRE SSFactor g-1 SSFactor/(g - 1) MSFactor / MSError
DENTRO SSError g(n -1) SSError/g(n - 1)
TOTAL SSTotal gn - 1
Varianza total (Pooled) del error

Por qu se llama a la fuente dentro la suma de cuadrados error o


ruido?
En trminos prcticos, qu nos dice en realidad la relacin F?
Definir Medir Analizar Mejorar Controlar

La prueba F y la Distribucin F

F = Variacin entre factores = SSFactor/(g-1)


Variacin dentro del factor SSError/g(n-1)

Si F > Fcrit entonces, al menos una de las medias es diferente.

Distribucin F para 4 y 45 Grados de Libertad


0.8

0.7 La Distribucin F es
Fcrit para el punto 10%
0.6 una familia de
0.5 curvas
Fcrit para el punto 5%
Prob

0.4 dependientes del


0.3 nmero de grados
Fcrit para el punto 1%
0.2 de libertad.*
0.1
Si el valor F
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 observado
F-Value es > 5, el
valor P = 0

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -6-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Suposiciones Estadsticas

Normalidad: Las muestras se extraen de distribuciones normales.


Nota: Las distribuciones dentro de cada subgrupo deben ser normales. No se
supone que la distribucin completa bajo estudio es normal.
Independencia: Las muestras son independientes.
Minitab: Stat>Basic Statistics>Correlation
Homogeneidad de Varianzas: La poblaciones tienen varianzas
iguales.
Minitab: Stat>ANOVA>Test for Equal Variances (usar datos apilados)

Definir Medir Analizar Mejorar Controlar

Las Suposiciones en Forma Grfica

La poblacin no est normalmente distribuda, sin embargo cada


subgupo s lo est. Los subgrupos son independientes y tienen
varianzas con intervalos de confianza que se solapan, por lo que
se cumplen las suposiciones del ensayo ANOVA.

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -7-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Ejemplo de Entrada de Datos


Con el fin de reducir el tiempo invertido en la introduccin de los datos de
entrada necesarios en los acuerdos de licencia, un equipo de trabajo ha
definido cuatro nuevos tipos de formulario. Se han seleccionado al azar un
cierto nmero de personas para que introduzcan los datos necesarios
utilizando los nuevos formularios.

Es algn formulario mejor que los antiguos (requiere menos


tiempo)?
(Nota: La sigma histrica es de aproximadamente 2
5 segundos se considera significativa)

Primero fijararemos el tamao de muestra que nos permita determinar si


existe una diferencia significativa entre las medias de los tiempos de
cualquier formulario.
Seguidamente comprobaremos las suposiciones del ANOVA
Entonces utilizaremos ANOVA para determinar si existe una diferencia entre
esas medias.
\DataFile\Dataentr.mtw
Definir Medir Analizar Mejorar Controlar

Determinando la Potencia
y el Tamao de la Muestra
Stat>Power and Sample Size>One-Way ANOVA
4 formularios Power and Sample Size

implica 4 niveles One-way ANOVA


Sigma = 2 Alpha = 0.05
Ya que 5 seg. esNumber of Levels = 4

significativo, SS Sample Target Actual Max


Means Size Power Power Diff
utilice valores 8.0 7 0.8000 0.8361 4
Utilice niveles de prximos a 5 8.0 9 0.9000 0.9326 4
8.0 10 0.9500 0.9582 4
Potencia del 80 al 99% 8.0 13 0.9900 0.9910 4
12.5 5 0.8000 0.8466 5
12.5 6 0.9000 0.9235 5
12.5 7 0.9500 0.9639 5
12.5 9 0.9900 0.9929 5
18.0 4 0.8000 0.8678 6
Sabemos que, 18.0 5 0.9000 0.9536 6
18.0 5 0.9500 0.9536 6
histricamente 18.0 7 0.9900 0.9957 6
sigma = 2
Emplee un tamao de
muestra
Definir Medir Analizar Mejorar
de 6
Controlar
para = 10%

Instituto para la Calidad


Pontificia Universidad Catlica del Per -8-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Comprobando las suposiciones

Compruebe las 4 variables (A-D) \DataFile\Dataentr.mtw

Stat>Basic Statistics>Graphical Summary

Definir Medir Analizar Mejorar Controlar

Prueba de Normalidad

Summary for Stack ed Data Summary for Stacked Data


S ubscripts = A
Anderson-Darling Normality Test
A-Squared 0.46
S ubscripts = B
Anderson-Darling Normality Test
A-Squared 0.29
Se cumplen las
suposiciones de
P-Value 0.162 P-Value 0.493

Mean 61.000 Mean 66.000


StDev 1.897 StDev 2.828
Variance 3.600 Variance 8.000
Skewness
Kurtosis
N
0.00000
-2.68519
6
Skewness
Kurtosis
N
1.19324
1.66875
6
normalidad!
Minimum 59.000 Minimum 63.000
1st Quartile 59.000 1st Quartile 63.750
55.0 57.5 60.0 62.5 65.0 67.5 70.0 72.5 Median 61.000 55.0 57.5 60.0 62.5 65.0 67.5 70.0 72.5 Median 65.500
3rd Quartile 63.000 3rd Quartile 68.000
Maximum 63.000 Maximum 71.000
95% Confidence Interval for Mean 95% Confidence Interval for Mean
59.009 62.991 63.032 68.968
95% Confidence Interval for Median 95% Confidence Interval for Median
95% Confidence Intervals 95% Confidence Intervals
59.000 63.000 63.357 69.571
Mean Mean
95% Confidence Interval for StDev 95% Confidence Interval for StDev
Median 1.184 4.654 Median 1.766 6.937

60.0 61.5 63.0 65.0 67.5 70.0

Worksheet: Dataentry .M TW Worksheet: Dataentry .M TW

Summary for Stack ed Data Summary for Stacked Data


S ubscripts = C S ubscripts = D
Anderson-Darling Normality Test Anderson-Darling Normality Test
A-Squared 0.49 A-Squared 0.29
P-Value 0.129 P-Value 0.493

Mean 68.000 Mean 61.000


StDev 1.673 StDev 2.828
Variance 2.800 Variance 8.000
Skewness 1.15254 Skewness -1.19324
Kurtosis 2.50000 Kurtosis 1.66875
N 6 N 6

Minimum 66.000 Minimum 56.000


1st Quartile 66.750 1st Quartile 59.000
55.0 57.5 60.0 62.5 65.0 67.5 70.0 72.5 Median 68.000 55.0 57.5 60.0 62.5 65.0 67.5 70.0 72.5 Median 61.500
3rd Quartile 68.750 3rd Quartile 63.250
Maximum 71.000 Maximum 64.000
95% Confidence Interval for Mean 95% Confidence Interval for Mean
66.244 69.756 58.032 63.968

95% Confidence Intervals 95% Confidence Interval for Median 95% Confidence Intervals 95% Confidence Interval for Median
66.357 69.929 57.429 63.643
Mean Mean
95% Confidence Interval for StDev 95% Confidence Interval for StDev
Median 1.044 4.104 Median 1.766 6.937

66 68 70 57 60 63

Worksheet: Dataentry .M TW Worksheet: Dataentry .M TW

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -9-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Prueba de Independencia

Stat>Basic Statistics>Correlation
Variable: A-D

Correlaciones: A, B, C, D
A B C
B 0.298
0.566 Ninguno de los valores P
C 0.630 0.634 son < 0.05; en virtud de
0.180 0.177 ello, podemos asumir
independencia.
D -0.373 0.225 -0.211
0.467 0.668 0.688
Cell Contents: Pearson correlation
P-Value

Definir Medir Analizar Mejorar Controlar

Prueba de Igualdad de Variancias


Stat>ANOVA>Test for Equal Variances
Variable: Stacked Data
Factors: Subscripts
Las varianzas tienen intervalos de confianza que se solapan, y los valores P
>0.05; entronces se cumple la suposicin de igualdad de varianzas.
Test for Equal Variances for Stacked Data

Bartlett's Test
A Test Statistic 1.95
P-Value
Levene's Test
0.584
Se cumplen
Test Statistic
P-Value
0.60
0.622
todas las
B
suposiciones!
Subscripts

0 1 2 3 4 5 6 7 8 9
95% Bonferroni Confidence Intervals for StDevs
Worksheet: Dataentry.MTW

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -10-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Ejecutar el ANOVA

Definir Medir Analizar Mejorar Controlar

Ejecutar el ANOVA
Stat>ANOVA>One-Way ANOVA O Stat>ANOVA>One-Way ANOVA (Unstacked)
Response: Stacked Data Response: A-D
Factor: Subscripts >Graphs: Dot Plot
>Graphs: Dot Plot
One-way ANOVA: Stacked Data versus Subscripts

Analysis of Variance for Stacked


Source DF SS MS F P
Subscrip 3 228.00 76.00 13.57 0.000
Error 20 112.00 5.60
Total 23 340.00
Individual 95% CIs For Mean
Based on Pooled StDev
Level N Mean StDev ----+---------+---------+---------+--
A 6 61.000 1.897 (-----*------)
B 6 66.000 2.828 (------*------)
C 6 68.000 1.673 (------*-----)
D 6 61.000 2.828 (-----*------)
----+---------+---------+---------+--
Pooled StDev = 2.366 60.0 63.0 66.0 69.0

El valor P es menor que 0.05, por lo que rechazamos Ho y


aseguramos que al menos una de las es diferente.
Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -11-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Qu ms podemos aprender?

Individual Value Plot of Stacked Data vs Subscripts


72.5

70.0

67.5
Stacked Data

65.0

62.5

60.0

57.5

55.0
A B C D
Subscripts
Boxplot of Stacked Data by Subscripts
Worksheet: Dataentry.MTW
72.5

70.0

67.5
Los formularios A y D

Stacked Data
65.0

parecen necesitar menos 62.5

tiempo. Determinemos si 60.0

las diferencias son 57.5

estadsticamente 55.0
A B C D

significativas. Worksheet: Dataentry.MTW


Subscripts

Definir Medir Analizar Mejorar Controlar

Prueba t para dos muestras


Stat>Basic Statistics>2-Sample t
Samples in different columns
First: A Second: D Nota: vea la prxima
Two-Sample T-Test and CI: A, D transparencia para
Two-sample T for A vs D una mejor
N Mean StDev SE Mean aproximacin
A 6 61.00 1.90 0.77 estadstica
D 6 61.00 2.83 1.2
Difference = mu A - mu D No podemos conclur
Estimate for difference: 0.00 que A y D son diferentes!
95% CI for difference: (-3.21, 3.21)
T-Test of difference = 0 (vs not =): T-Value = 0.00 P-Value = 1.000 DF = 8

Two-Sample T-Test and CI: A, B


Two-sample T for A vs B
N Mean StDev SE Mean
A 6 61.00 1.90 0.77
B 6 66.00 2.83 1.2 Podemos concluir
Difference = mu A - mu B que A y B son diferentes!
Estimate for difference: -5.00
95% CI for difference: (-8.21, -1.79)
T-Test of difference = 0 (vs not =): T-Value = -3.60 P-Value = 0.007 DF = 8

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -12-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Comparaciones Mltiples

Stat>ANOVA>ONE WAY ANOVA

Definir Medir Analizar Mejorar Controlar

Comparaciones Mltiples (Pruebas de


Tukey)
Subscripts = A subtracted from:
Subscripts Lower Center Upper --------+---------+---------+---------+-
Intervalos de
B 1.174 5.000 8.826 (-----*------) confianza
C 3.174 7.000 10.826 (------*-----) que
D -3.826 0.000 3.826 (-----*-----) contienen al
--------+---------+---------+---------+- cero significa
Lo mismo -6.0 0.0 6.0 12.0 que no hay
Subscripts = B ocurre
subtracted from:con A
diferencia
yD
Subscripts Lower Center Upper --------+---------+---------+---------+-
Este I.C.
C -1.826 2.000 5.826 (-----*------)
contiene al
D -8.826 -5.000 -1.174 (------*-----)
cero, lo que
--------+---------+---------+---------+-
indica que no
-6.0 0.0 6.0 12.0
existe
Subscripts = C subtracted from:
diferencia
entre B y C.
Subscripts Lower Center Upper --------+---------+---------+---------+-
D -10.826 -7.000 -3.174 (-----*------)
--------+---------+---------+---------+-
-6.0 0.0 6.0 12.0
Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -13-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Las Grficas de Intervalos


tambin son tiles
Stat>ANOVA>Interval plot (data must be stacked)
Y variable: Stacked Data
Group Variable: Subscripts
>Confidence Interval: 95%

68

Stacked Data

63

58

A B C D
Subscripts
Definir Medir Analizar Mejorar Controlar

Adecuacin del Modelo


Stat>ANOVA>One-Way ANOVA Stat>Regression>Residual Plots
>Fits >Residuals Use columns Fits 1 and Resi 1
Residual Plots for Stacked Data
Normal Probability Plot Residuals Versus the Fitted Values
99
N 24 5
90
AD
P-Value
0.301
0.552
Los Residuos
Residual

y los Ajustes
Percent

50 0

10
parecen estar
1
-5 bien (sin
-5.0 -2.5 0.0 2.5 5.0 60 62 64 66 68
Residual Fitted Value patrones, y
Histogram of the Residuals Residuals Versus the Order of the Data normalidad de
4.5
5 residuos)
Vamos a
Frequency

Residual

3.0
0
trabajar
1.5
mucho ms
-5
0.0
-4 -2 0 2 4 2 4 6 8 10 12 14 16 18 20 22 24 con Residuos
Residual Observation Order
ms adelante.
Worksheet: Dataentry.MTW

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -14-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Cul ha sido la verdadera Potencia


de la Prueba?
Extracto de laTabla ANOVA... Stat>Power and Sample Size>One-Way ANOVA
Level N Mean StDev
A 6 61.000 1.897
4
B 6 66.000 2.828
C 6 68.000 1.673
D 6 61.000 2.828
Pooled StDev = 2.366

Desviacin tpica
global (Pooled) de Las diferencias
la tabla ANOVA reales entre las medias
son 2, 5 y 7
Power and Sample Size
One-way ANOVA
Sigma = 2.366 Alpha = 0.05 Number of Levels = 4
Sample Maximum Para una diferencia
SS Means Size Power Difference de 2, = 83%!
2.0 6 0.1743 2
Para una de 7, = 2%
12.5 6 0.8039 5
24.5 6 0.9828 7 = 1 - Potencia del ensayo
Definir Medir Analizar Mejorar Controlar

Conclusiones

Tenemos una confianza del 95% de que los formularios A y


D efectivamente requieren menos tiempo que los B y C.
(riesgo )

Existe un riesgo de slo el 20% de que la diferencia no sea


de una magnitud tal como la deseada de 5 seg. (riesgo )

Para poder decir cul es la diferencia entre los formularios


A y D, deberamos efectuar algunas pruebas adicionales.

De momento, podramos utilizar tanto el formulario A


como el D y estar seguros que el proceso ha mejorado!
Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -15-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Ejemplo de la Azalea

Un productor de flores est midiendo el ritmo de crecimiento de las azaleas en un


invernadero, con el fin de determinar el mejor momento de transplantar las flores.
El productor mide el ritmo de crecimiento cada semana durante 5 semanas, desea
comparar los resultados semanales para determinar si el ritmo de crecimiento vara
y en qu semanas es ms lento y ms rpido.
Los datos para este experimento estn en el archivo:
\Datafiles\ Azalea.mtw*
Nota: Utilice slo los datos A-Week1 y A-Week-5.
Compruebe las suposiciones estadsticas para ANOVA
Realice un anlisis ANOVA y extraiga conclusiones de l.
Lleve a cabo una Comparacin Mltiple mediante el ensayo de Tukey.
Pinte una grfica de puntos y otra de intervalos, y compare los resultados
Genere una grfica de efectos principales y comprela con la de intervalos
Qu semana(s) tiene el mayor ritmo de crecimiento?
Qu semana(s) tiene el menor ritmo de crecimiento?
Es adecuado el modelo?
Cul es la significacin prctica del modelo (SSFactor/SSTotal)?
Cul es su confianza en los resultados? (Idea: Potencia y Tamao de muestra)
*This data file is owned by Minitab, Inc., and is used with permission.
Definir Medir Analizar Mejorar Controlar

Suposiciones estadsticas

Normalidad: Las muestras se extraen de distribuciones normales.


Minitab: Stat>Basic Statistics>Normality Test
- Compruebe la normalidad de los datos para el ejemplo de la azalea.
- Qu pasa con los datos de la semana 4?
- Apile los datos de las semanas 1-5: Manip>Stack/Unstack>Stack
Guarde estos datos en Growth, guarde los ndices en Week
Desactive Use variable names in Subscript column para tener los nmeros
en lugar de las etiquetas en la columna Subscript.
- Son estos datos apilados normales?
Independencia: las muestras son independientes.
Minitab: Stat>Basic Statistics>Correlation
- Compruebe la independencia de los datos para el ejemplo de la azalea
- Son independientes los datos?
Igualdad de Varianzas: Las poblaciones tienen varianzas iguales.
Minitab: Stat>ANOVA>Test for Equal Variances (use stacked data)
- Compruebe la homogeneidad de varianza para el ejemplo de la azalea
- Tiene la misma varianza cada semana?
Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -16-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Suposiciones estadsticas

Summary for Growth Summary for Growth


Week = WE E K-1 Week = WE E K-2
Anderson-Darling Normality Test Anderson-Darling Normality Test
A-Squared 0.32 A-Squared 0.46
P-Value 0.475 P-Value 0.198

Mean 1.7810 Mean 0.50900


StDev 0.3328 StDev 0.43511
Variance 0.1108 Variance 0.18932
Skewness -0.01804 Skewness 0.05394
Kurtosis -1.47032 Kurtosis -1.73424
N 10 N 10

Minimum 1.2800 Minimum 0.00000


1st Quartile 1.5125 1st Quartile 0.00000
0.0 0.4 0.8 1.2 1.6 2.0 2.4 2.8 Median 1.7750 0.0 0.4 0.8 1.2 1.6 2.0 2.4 2.8 Median 0.46000
3rd Quartile 2.0800 3rd Quartile 0.93250
Maximum 2.2300 Maximum 1.09000
95% Confidence Interval for Mean 95% Confidence Interval for Mean
1.5429 2.0191 0.19774 0.82026
95% Confidence Interval for Median 95% Confidence Interval for Median
95% Confidence Int ervals 95% Confidence Int ervals
1.5023 2.0948 0.00000 0.94450
Mean Mean
95% Confidence Interval for StDev 95% Confidence Interval for StDev
Median 0.2289 0.6077 Median 0.29928 0.79434

1.50 1.75 2.00 0.0 0.5 1.0

Worksheet: A zalea.M TW Worksheet: A zalea.M TW

Summary for Growth Summary for Growth


Week = WE E K-3 Week = WE E K-4
Anderson-Darling Normality Test Anderson-Darling Normality Test
A-Squared 0.40 A-Squared 0.84
P-Value 0.296 P-Value 0.019

Mean 0.29300 Mean 2.1170


StDev 0.24806 StDev 0.4935
Variance 0.06153 Variance 0.2435
Skewness 0.30140 Skewness -1.19809
Kurtosis -1.54597 Kurtosis 0.03349
N 10 N 10

Minimum 0.00000 Minimum 1.2000


1st Quartile 0.05250 1st Quartile 1.7200
0.0 0.4 0.8 1.2 1.6 2.0 2.4 2.8 Median 0.23000 0.0 0.4 0.8 1.2 1.6 2.0 2.4 2.8 Median 2.3150
3rd Quartile 0.57750 3rd Quartile 2.4775
Maximum 0.63000 Maximum 2.5700
95% Confidence Interval for Mean 95% Confidence Interval for Mean
0.11555 0.47045 1.7640 2.4700

95% Confidence Int ervals 95% Confidence Interval for Median 95% Confidence Int ervals 95% Confidence Interval for Median
0.04604 0.58396 1.6720 2.4803
Mean Mean
95% Confidence Interval for StDev 95% Confidence Interval for StDev
Median 0.17063 0.45286 Median 0.3394 0.9009

0.00 0.25 0.50 1.6 2.0 2.4

Worksheet: A zalea.M TW Worksheet: A zalea.M TW

Datos de semanas 1, 2, 3 y 5 son normales. En la semana 4, no lo son.


Definir Medir Analizar Mejorar Controlar

Suposiciones estadsticas

Correlations: WEEK-1, WEEK-2, WEEK-3, WEEK-4, WEEK-5

WEEK-1 WEEK-2 WEEK-3 WEEK-4


WEEK-2 -0.279
0.435
Stat>Basic Stat>Correlation
WEEK-3 0.515 -0.307
Datos independientes
0.127 0.388

WEEK-4 -0.304 -0.157 -0.172


0.393 0.665 0.634

WEEK-5 0.120 -0.105 -0.496 0.504


0.741 0.773 0.145 0.138

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -17-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Test for Equal Variances for Growth

Bartlett's Test
WEEK-1 Test Statistic 13.25
P-Value 0.010
Levene's Test
WEEK-2 Test Statistic 2.13
P-Value 0.092
Week

WEEK-3

WEEK-4

WEEK-5

0.0 0.2 0.4 0.6 0.8 1.0 1.2


95% Bonferroni Confidence Intervals for StDevs
Worksheet: Azalea.MTW

Hya que usar Levenes test puesto que los datos no son normales.
No hay suficiente evidencia para rechazar la hipotesis nula de que las
diferencias en las varianzas no sean estadsticamente significativas.
Definir Medir Analizar Mejorar Controlar

Robustez

ANOVA es una prueba muy robusta!

Los datos para la semana 4 no son completamente


normales, y las varianzas puede que tampoco lo sean;
pero de todos modos podemos utilizar la herramienta
para comprobar si los datos de cada semana tienen la
misma media!

Tambin podremos obtener slidos resultados aunque los


datos presenten alguna correlacin entre s (falta de
independencia).

En caso de duda, consulte con un estadstico o con un


Master Black Belt!
Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -18-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Solucin ANOVA para el


ejemplo de la Azalea
\Datafile\Azalea.mtw
Stat>ANOVA>One-Way

Definir Medir Analizar Mejorar Controlar

Anlisis de la Tabla ANOVA para el


ejemplo de la Azalea
Suma de Cuadrados
de los Factores
One-way ANOVA: Growth versus Week
Varianza Probabilidad
Analysis of Variance for Growth
Source DF SS MS F P
Week 4 33.133 8.283 66.14 0.000
Error 45 5.636 0.125 Si P< 0.05 Al
Total 49 38.769 Estadstico F
menos una de
Individual 95% CIs For Mean
Based on Pooled StDev
las medias es
Level N Mean StDev --+---------+---------+---------+---- diferente!
1 10 1.7810 0.3328 (--*---)
2 10 0.5090 0.4351 (--*--)
3 10 0.2930 0.2481 (--*--)
4 10 2.1170 0.4935 (--*--)
5 10 0.1520 0.1451 (--*--)
--+---------+---------+---------+----
Pooled StDev = 0.3539 0.00 0.70 1.40 2.10

Clculo de los grados de libertad:


Factores: Como hay 5 grupos de datos, DF = 5-1 = 4
Error: Como hay 5 grupos de datos, y 10 datos dentro de cada grupo,
DF = g(n-1) = 5(10-1) = 45
Total: gn-1 = DFFactor + DFError = 49

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -19-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Comparacin Mltiple para el


ejemplo de la Azalea
All Pairwise Comparisons among Levels of Week
Las diferencias aparecen
Individual confidence level = 99.33%
indicadas cuando el
intervalo de confianza no
Week = WEEK-1 subtracted from: contiene al cero
Week Lower Center Upper ------+---------+---------+---------+---
WEEK-2 -1.7219 -1.2720 -0.8221 (--*--)
WEEK-3 -1.9379 -1.4880 -1.0381 (--*--)
WEEK-4 -0.1139 0.3360 0.7859 (--*--)
WEEK-5 -2.0789 -1.6290 -1.1791 (--*--)
------+---------+---------+---------+---
-1.5 0.0 1.5 3.0
Week = WEEK-2 subtracted from:
Week Lower Center Upper ------+---------+---------+---------+---
WEEK-3 -0.6659 -0.2160 0.2339 (--*--)
WEEK-4 1.1581 1.6080 2.0579 (--*--)
WEEK-5 -0.8069 -0.3570 0.0929 (--*--)
------+---------+---------+---------+---
-1.5 0.0 1.5 3.0

Definir Medir Analizar Mejorar Controlar

Week = WEEK-3 subtracted from:


Week Lower Center Upper ------+---------+---------+---------+---
WEEK-4 1.3741 1.8240 2.2739 (--*--)
WEEK-5 -0.5909 -0.1410 0.3089 (--*--)
------+---------+---------+---------+---
-1.5 0.0 1.5 3.0
Week = WEEK-4 subtracted from:
Week Lower Center Upper ------+---------+---------+---------+---
WEEK-5 -2.4149 -1.9650 -1.5151 (--*--)
------+---------+---------+---------+---
-1.5 0.0 1.5 3.0

Si el intevalo de confianza contiene al 0, no hay diferencia en las


medias. Por lo tanto:
Week 1 es diferente de 2, 3 y 5
Week 2 es diferente de 4 y
Week 4 es dieferente de 5

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -20-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Anlisis Grfico - Grficos de Intervalos

Stat>ANOVA>Interval Plot

Definir Medir Analizar Mejorar Controlar

Anlisis Grfico - Grficos de Intervalos

Interval Plot of Growth vs Week


95% CI for the Mean

2.5

2.0

1.5
Growth

1.0

0.5

0.0
WEEK-1 WEEK-2 WEEK-3 WEEK-4 WEEK-5
Week
Worksheet: Azalea.MTW

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -21-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Anlisis Grfico - Grficas de Efectos


Principales
Construya un Diagrama de Efectos Principales (utilice datos apilados):
Minitab: Stat>ANOVA -->Main Effects Plot
Qu nos dice la grfica?
Main Effects Plot (data means) for Growth

2.0

1.5
Mean of Growth

1.0

0.5

0.0
WEEK-1 WEEK-2 WEEK-3 WEEK-4 WEEK-5
Week
Worksheet: Azalea.MTW

Definir Medir Analizar Mejorar Controlar

Anlisis de Diagnstico

ANOVA supone que los errores se distribuyen normalmente, con un


valor medio de cero y una dispersin constante. Esta suposicin se
puede comprobar examinando Residuals (la diferencia entre cada
resultado y la media de la muestra).
Minitab: Stat>ANOVA>Oneway

Haga Click en Store Residuals y


Store Fits
Haga Click en Graphs y seleccione:
Normal Plot
Residuals versus fits
Residuals versus order
En la caja Residuals versus the
variable introduzca la columna
con los datos apilados (Growth)
Haga Click en OK
Haga Click en OK
Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -22-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Anlisis de Diagnstico : Ajustes y


Residuos 1
Growth Week RESI1 FITS1
1.58 1 -0.201 1.781
1.62 1 -0.161 1.781
2.04 1 0.259 1.781
1.28 1 -0.501 1.781
1.43 1 -0.351 1.781
1.93 1 0.149 1.781
El ajuste es el valor 2.20 1 0.419 1.781
obtenido a partir de 1.96 1 0.179 1.781
la ecuacin de 2.23 1 0.449 1.781
1.54 1 -0.241 1.781
prediccin. 1.09 2 0.581 0.509
1.03 2 0.521 0.509
El residuo es la 0.00 2 -0.509 0.509
0.46 2 -0.049 0.509
diferencia entre el 0.46 2 -0.049 0.509
valor predicho y el 0.85 2 0.341 0.509
0.30 2 -0.209 0.509
observado 0.90 2 0.391 0.509
0.00 2 -0.509 0.509
0.00 2 -0.509 0.509
0.00 3 -0.293 0.293
0.00 3 -0.293 0.293
0.07 3 -0.223 0.293
0.18 3 -0.113 0.293
0.40 3 0.107 0.293
Definir Medir Analizar Mejorar Controlar

Anlisis de Diagnstico: Ajustes y


residuos 2
Residual Plots for Growth
Normal Probability Plot Residuals Versus the Fitted Values
99
N 50
0.5
AD 0.415
90
P-Value 0.323 La grfica Residuos vs.
Residual
Percent

0.0
50 Orden de los Datos
10
-0.5 muestra el
-1.0
comportamiento de los
1
-1.0 -0.5 0.0 0.5 1.0 0.0 0.5 1.0 1.5 2.0 residuos a lo largo del
Residual Fitted Value
experimento.
Histogram of the Residuals Residuals Versus the Order of the Data Probablemente sea la
12
0.5 grfica ms importante,
puesto que muestra si
Frequency

Residual

8 0.0
algo fuera del
4 -0.5 experimento est
0 -1.0
teniendo lugar.
-0.8 -0.4 0.0
Residual
0.4 1 5 10 15 20 25 30 35
Observation Order
40 45 50 Cualquier Patrn no
aleatorio es un aviso!.
Worksheet: Azalea.MTW

Los residuos estn normalmente distribuidos alrededor del 0 y tiene una


varianza constante respecto a los distintos nivels de los ajustes. Por lo tanto
no hay razn para rechazar el modelo.
Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -23-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Ajustes y Residuos 3

La grfica Residuos vs. Factores


investiga el comportamiento de los
residuos para los diferentes niveles de
cada factor. Esta grfica nos ayuda a
observar el ajuste del modelo para los
diferentes niveles de cada factor.
Residuals Versus Week
(response is Growth)

0.5
Residual

0.0

-0.5

-1.0
1 2 3 4 5
Week

Definir Medir Analizar Mejorar Controlar

Epsilon cuadrado: Significacin Prctica

Epsilon-Cuadrado o Contribucin Porcentual


Para ver la significacin prctica de los factores estadsticamente
significativos, use la Epsilon-cuadrado (2).

2 provee una medida de qu parte del total de la variacin se puede


explicar mediante el factor de inters.

2 se calcula dividiendo la Suma de Cuadrados para cada factor por la


suma de cuadrados total.

Algunas veces este estadstico permite eliminar un factor que de


otro modo se considerara significativo!
El 85.4% de la variacin en el caso de la SS Factor 33.133
2 = = = 85.4%
Azalea viene dada por el factor Week! SSTotal 38.769

Fuente SS 2
Week 33.133 33.133/38.769 85.4%
Error 5.636 5.636/38.769 14.5%
Total 38.769
Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -24-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Epsilon cuadrado: Significacin Prctica

Copiar los datos que se muestran y pegarlos en la hoja de clcuo de


Minitab
Source DF SS MS F P
Week 4 33.133 8.283 66.14 0.000
Error 45 5.636 0.125

Dicha hoja debera quedar as:

Crear un Pie Chart

Definir Medir Analizar Mejorar Controlar

Epsilon cuadrado: Significacin Prctica

Pie Chart of SS vs Source


Category
W eek
Error Error
14.5%

W eek
85.5%

Worksheet: Azalea.MTW

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -25-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Tamao de Muestra
Calculemos la potencia del ensayo empleado en el caso de la Azalea:
Stat>Power and Sample Size>
One-Way ANOVA

Level N Mean

}
1 10 1.7810
2 10 0.5090
3 10 0.2930
4 10 2.1170
5 10 0.1520
Pooled StDev = 0.3539
Sigma = 0.3539 Alpha = 0.05
Number of Levels = 5
El tamao de muestra de 10 Sample Maximum
empleado en el experimento SS Means Size Power Difference
de la Azalea tiene una 0.80899 10 1.0000 1.272
potencia (1-)% para decirnos 0.05645 10 0.3250 0.336
que al menos una de las
0.02333 10 0.1495 0.216
medias es diferente!
1.93061 10 1.0000 1.965
Definir Medir Analizar Mejorar Controlar

Ejercicio 1

Objetivo: Investigar cmo opera la prueba F cuando sabemos


que la Hiptesis Nula es cierta.

Generar 50 Nmeros Aleatorios en una columna vaca en la


hoja de datos del caso Azalea.
Calc>Random Data>Normal media de 1.7 desviacin tpica de
0.35.

Utilizando lo que ha aprendido, analice el experimento de un


nico factor (la respuesta son sus nmeros aleatorios y los
factores son su columna Week o equivalente).
Determine qu tamao de muestra es necesario para un Alfa =
0.05 y un Beta = 0.10
Preprese para explicar sus resultados, comenzando son sus
hiptesis nula y alternativa.

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -26-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Discusin del Ejercicio - Tabla ANOVA

Stat>ANOVA>One-Way ANOVA
Factor Week Responmse - Random
El valor del
estadstico F es
One-way Analysis of Variance pequeo (0.42)
El valor P
Analysis of Variance for Random es grande
Source DF SS MS F P (0.793)
Week 4 0.172 0.043 0.42 0.793
Error 45 4.606 0.102
Total 49 4.778
Individual 95% CIs For Mean
Based on Pooled StDev
Level N Mean StDev --+---------+---------+---------+----
1 10 1.7942 0.3531 (------------*------------)
2 10 1.6808 0.2897 (------------*------------)
3 10 1.6262 0.3505 (------------*-----------)
4 10 1.7387 0.2382 (------------*-----------)
5 10 1.7526 0.3514 (------------*-----------)
--+---------+---------+---------+----
Pooled StDev = 0.3199 1.44 1.60 1.76 1.92

Todos los intervalos de confianza se solapan,


indicando que las medias son iguales.
Definir Medir Analizar Mejorar Controlar

Discusin del Ejercicio - Anlisis Grfico

Stat>ANOVA> Interval Plots Main Effects Plot - Data Means for Random
Stat>ANOVA>Main Effects Plots 1.80

1.75
Random

Cules son sus conclusiones? 1.70

Cambias estas conclusiones 1.65

cuando se analiza la tabla ANOVA? 1 2 3 4 5

Standard Error - Interval Plot Week


95% Confidence - Interval Plot

1.9

2.0
1.8
1.9
Random

Random

1.8
1.7
1.7

1.6 1.6

1.5

1.4
1 2 3 4 5
Week 1 2 3 4 5
Week
Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -27-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Discusin del Ejercicio - Anlisis de Residuos


Los Residuos
tienen la misma
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values varianza en los
(res ponse is Random ) (response is Random) diferentes grupos

2
Los Residuos 0.5

pasan la prueba
1
de normalidad
Normal Score

Residual
0 0.0

-1

-0.5
-2

1.65 1.70 1.75 1.80


-0.5 0.0 0.5

Residual
Fitted Value El modelo
La grfica matemtico ajusta
Residuos vs. Residuals Versus the Order of the Data Residuals Versus Week correctamente los
Orden de los (response is Random) (response is Random)
valores extremos
datos parece 1.0
aleatoria0.5

0.5

Residual
Residual

0.0
0.0

-0.5 -0.5

5 10 15 20 25 30 35 40 45 50 1 2 3 4 5

Observation Order Week

Definir Medir Analizar Mejorar Controlar

Ejercicio-Prueba de Igualdad de Varianzas

Stat>ANOVA>Test for Equal Variances No hay evidencia


Factor = Week Response = Random que justifique
Test for Equal Variances for Random considerar diferentes
95% Confidence Intervals for Sigmas Factor Levels
varianzas!

Bartlett's Test

Test Statistic: 4.202


2
P-Value : 0.379

Levene's Test

4 Test Statistic: 0.739


P-Value : 0.570

0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -28-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Ejercicio-Tamao de la Muestra

Stat>Power and Sample Size>One-Way ANOVA


Levels 5 Power levels .8.9 .95 .99
Potencia y Tamao de la Muestra
One-way ANOVA
Sigma = 0.3199 Alpha = 0.05 Number of Levels = 5

Sample Target Actual Maximum


SS Means Size Power Power Difference
1.41E-02 88 0.8000 0.8026 0.168
1.41E-02 113 0.9000 0.9010 0.168
1.41E-02 136 0.9500 0.9506 0.168
1.41E-02 185 0.9900 0.9903 0.168
9.66E-05 12645 0.8000 0.8000 0.0139
9.66E-05 16320 0.9000 0.9000 0.0139
9.66E-05 19675 0.9500 0.9500 0.0139
9.66E-05 26742 0.9900 0.9900 0.0139

Por qu son tan grandes los tamaos de muestra?

Definir Medir Analizar Mejorar Controlar

Desgaste de Pintura

El departamento de transporte de Pennsylvania


quiere determinar el tipo de pintura a comprar para
su utilizacin en la sealizacin de autopistas.
Se han seleccionado cuatro tipos distintos de
pintura y se las ha sometido a pruebas de desgaste
en cuatro diferentes ciudades.
A usted se le ha encomendado que analice los
datos y recomiende qu pintura comprar.

\DataFiles\ pntwear.mtw

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -29-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Ejemplo del Desgaste de Pintura

Stat>ANOVA>One Way

Muestra que no
One-way ANOVA: PntWear versus Paint hay diferencia
detectable
Analysis of Variance for PntWear
Source DF SS MS F P
Paint 3 30.69 10.23 2.44 0.115
Error 12 50.25 4.19
Total 15 80.94
Individual 95% CIs For Mean
Based on Pooled StDev
Level N Mean StDev ------+---------+---------+---------+
Y-0242 4 14.250 1.893 (--------*--------)
Y-0314 4 12.250 2.872 (--------*--------)
Y-1424 4 11.000 1.633 (--------*--------)
Y-1723 4 10.750 1.500 (--------*--------)
------+---------+---------+---------+
Pooled StDev = 2.046 10.0 12.5 15.0 17.5

Definir Medir Analizar Mejorar Controlar

Two Way ANOVA

\DataFile\pntwear.mtw
Stat>ANOVA>Two Way

Seleccione

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -30-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Two Way ANOVA (Cont)

Two-way ANOVA: PntWear versus Paint, Location

Source DF SS MS F P
Paint 3 30.6875 10.2292 7.96 0.007
Location 3 38.6875 12.8958 10.04 0.003
Error 9 11.5625 1.2847
Total 15 80.9375

S = 1.133 R-Sq = 85.71% R-Sq(adj) = 76.19%

Cuando la localizacin se tiene en cuenta, tanto sta como la pintura


son significativas.
Grafique efectos principales e interacciones.

Definir Medir Analizar Mejorar Controlar

Efectos Principales

Command ANOVA>Main Effects Plot

Main Effects Plot (data means) for PntWear


Location Paint

14
Mean of PntWear

13

12

11

10

Harrisburg Philadelphia Pittsburgh Scranton Y-0242 Y-0314 Y-1424 Y-1723

Worksheet: Pntwear.MTW

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -31-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Interacciones

Interaction Plot (data means) for PntWear


Paint
17
Y-0242
Y-0314
16
Y-1424
15 Y-1723

14

13
Mean

12

11

10

Harrisburg Philadelphia Pittsburgh Scranton


Location
Worksheet: Pntwear.MTW

Elegir pintura Y-1723 para minimizar wear de la pintura en todo en estado.


Definir Medir Analizar Mejorar Controlar

Anlisis de Ajustes y Residuos

Residual Plots for PntWear


Normal Probability Plot Residuals Versus the Fitted Values
99
N 16 1
AD 0.352
90
P-Value 0.423
Residual
Percent

0
50
-1
10

1 -2
-2 -1 0 1 2 8 10 12 14 16
Residual Fitted Value

Histogram of the Residuals Residuals Versus the Order of the Data


4.5
1
Frequency

Residual

3.0 0

1.5 -1

0.0 -2
-2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Residual Observation Order

Worksheet: Pntwear.MTW

Los residuos estn normalmente distribuidos con media 0 y la varianza


es constante, luego no hay razn para rechazar el modelo.
Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -32-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Ejercicio 2

\Datafile\ANOVA Exercise.MTW
Realice un anlisis de los datos mediante mtodos ANOVA, Grficos,
Estadsticos y de Diagnstico Prctico.
Conteste a las siguiente preguntas:
1) Se cumplen todas las suposiciones estadsticas?
2) Qu riesgos alfa y beta se han asumido?
3) Se puede emplear un One-Way ANOVA par analizar estos datos?
4) Existen diferencias?
5) Demuestran los ajustes y residuos la solidez del anlisis?
6) Cul ha sido la potencia del ensayo?
7) Qu tamao de muestra debera haber utilizado en este anlisis para
el riesgo beta asumido?
Preprese para presentar su anlisis y extraer conclusiones.

Definir Medir Analizar Mejorar Controlar

Comprobar las suposiciones

1. Todos los subconjuntos de datos son normales.


2. Las diferencias entre las varianzas de los subconjuntos no son
significativas.
3. La Y est correlacionada (no es independiente de) ambos
factores.

Se cumplen, luego podemos cooontinuar


usando el ANOVA.

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -33-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

ANOVA

Stat>ANOVA>Two-way ANOVA or
Stat>ANOVA>General Linear Model

La exclamacin le dice a
Minitab que incluya todas
las interacciones

Definir Medir Analizar Mejorar Controlar

Tabla de Two-way ANOVA

Analysis of Variance for Y, using Adjusted SS for Tests

Source DF Seq SS Adj SS Adj MS F P


FactorA 2 497.48 497.48 248.74 18.80 0.000
FactorB 3 269.30 269.30 89.77 6.79 0.006
FactorA*FactorB 6 113.79 113.79 18.97 1.43 0.280
Error 12 158.75 158.75 13.23
Total 23 1039.32
El trmino de la
interaccin no es
significatico
S = 3.63719 R-Sq = 84.73% R-Sq(adj) = 70.72%
estaddticamente y
se quitar del
modelo

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -34-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Model Reducido

Definir Medir Analizar Mejorar Controlar

Modelo Reducido

Analysis of Variance for Y, using Adjusted SS for Tests

Source DF Seq SS Adj SS Adj MS F P


FactorA 2 497.48 497.48 248.74 16.43 0.000
FactorB 3 269.30 269.30 89.77 5.93 0.005
Error 18 272.54 272.54 15.14
Total 23 1039.32

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -35-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Epislon Cuadrado

Pie Chart of SeqSS vs Source

Error
26.2%

FactorA
47.9%

FactorB
25.9%

Worksheet: ANOVA Exercise.MTW

Hay una parte considerable de error inexplicado por el modelo

Definir Medir Analizar Mejorar Controlar

Model Adequacy

Residual Plots for Y


Normal Probability Plot Residuals Versus the Fitted Values
99 10
N 24
AD 0.159
90
P-Value 0.941 5
Residual
Percent

50
0

10
-5
1
-10 -5 0 5 10 200 205 210 215 220
Residual Fitted Value

Histogram of the Residuals Residuals Versus the Order of the Data


6 10

5
Frequency

Residual

0
2

-5
0
-6 -4 -2 0 2 4 6 8 2 4 6 8 10 12 14 16 18 20 22 24
Residual Observation Order

Worksheet: ANOVA Exercise.MTW

Los residuos estn normalmente distribuidos con media 0 y la varianza


es constante, luego no hay razn para rechazar el modelo.
Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -36-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Conclusin del General Linear Model

1. General Linear Model (GLM) es un super set de las otras


rutinas de ANOVA.
2. Los modelos GLM deben ser jerrquicos, o sea, las
interacciones 3-way no pueden ser analizadas a menos que
todas las interacciones 2-ways hayan sido especificadas.
3. GLM permite mayor control del modelo.

Definir Medir Analizar Mejorar Controlar

Vuelta atrs al Escenerio del Mundo Real

Diseo:
Un productor de flores necesita saber qu semana dentro del ciclo de
crecimiento de la azalea presenta la mayor tasa de crecimiento
- Cmo debera el productor plantear y analizar el experimento?{One
way ANOVA}

Fabricacin:
Un ingeniero de proceso necesita determinar el efecto de tres tiempos de
proceso y tres valores de tensin en la densidad de un tipo de plstico.
- Cmo debera el ingeniero plantear y analizar el experimento?
{Two Way ANOVA, ANOVA Balanceado o Modelo Lineal General}

Administracin:
Un equipo administrativo tiene asignado el proyecto de reducir el tiempo
para la entrada de la informacin en los acuerdos de licencia . El equipo
ha elaborado cuatro tipos diferentes de formulario.
- Cmo debera el equipo plantear y analizar el experimento?
{One-Way ANOVA}
Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -37-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Qu hemos aprendido

1. Comprobar la hiptesis nula en poblaciones mltiples utilizando


ANOVA; esto no nos dir qu poblacin es diferente.

2. La tabla ANOVA se genera a partir de los diversos componentes de la


Suma de Cuadrados.

3. La relacin F se emplea para calcular el estadstico del ensayo.

4. La tcnicas Grficas, Estadsticas y de Diagnstico se deben utilizar para


el completo anlisis de los datos

5. Los Residuos deben presentar una distribucin normal para que se


puedan realizar las inferencias estadsticas correctas a partir de los
resultados.

6. La Epsilon Cuadrado aproxima la contribucin de cada factor a la


variacin total del experimeinto.

7. Utilice el Anlisis de Medias para datos Normales y Binomiales

Definir Medir Analizar Mejorar Controlar

Ejercicio 2

\Datafile\Exh_aov.mtw, Columns 23, 24 and 25

Realice un anlisis de los datos mediante mtodos ANOVA, Grficos,


Estadsticos y de Diagnstico Prctico.
Conteste a las siguiente preguntas:
1) Se cumplen todas las suposiciones estadsticas?
2) Qu riesgos alfa y beta se han asumido?
3) Se puede emplear un One-Way ANOVA par analizar estos datos?
4) Existen diferencias?
5) Demuestran los ajustes y residuos la solidez del anlisis?
6) Cul ha sido la potencia del ensayo?
7) Qu tamao de muestra debera haber utilizado en este anlisis para
el riesgo beta asumido?
Preprese para presentar su anlisis y extraer conclusiones.

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -38-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Two-way ANOVA
Igual al One-way ANOVA solo que se analizan 2 factores.
Stat>ANOVA>Two-way ANOVA
Factor A (el 1 factor) va en Row factor
Factor B (el 2 factor) va en Column factor
Se sugiere ir a un Balanced ANOVA o a un General Linear Model con 2
ms factores (se discute despus).

Muestra los Intervalos


de Confianza individuales
para cada media

Definir Medir Analizar Mejorar Controlar

Tabla para el Ensayo Two-way ANOVA


Two-way ANOVA: Y versus FactorA, FactorB Los Factores A y B
Analysis of Variance for Y ambos son estadsticamente
Source DF SS MS F P
significativos!
FactorA 2 497.5 248.7 18.80 0.000
FactorB 3 269.3 89.8 6.79 0.006
Interaction 6 113.8 19.0 1.43 0.280 Como trabajamos con
Error 12 158.8 13.2 2 factores existen
Total 23 1039.3
interacciones
Individual 95% CI
FactorA Mean -+---------+---------+---------+---------+
1 206.8 (------*------) Pero la interaccin
2 212.8 (------*------)
3 217.9 (------*------)
no es estadsticamente
-+---------+---------+---------+---------+ significativa!
204.0 208.0 212.0 216.0 220.0

Individual 95% CI Con la casilla


FactorB Mean -------+---------+---------+---------+---- Display Means
1 217.4 (-------*-------) activada, se muestran
2 213.7 (-------*-------)
3 210.4 (-------*-------) los intervalos
4 208.6 (-------*--------) de confianza
-------+---------+---------+---------+----
208.0 212.0 216.0 220.0

La adecuacin del modelo se comprueba de la


misma forma que en el One-Way ANOVA
Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -39-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Ensayo ANOVA Balanceado

Stat>ANOVA>Balanced ANOVA
| indica que todas
las interacciones
se calculan

Da el mismo resultado que el


Ensayo Two-Way cuando se
trabaja con slo dos factores!
Definir Medir Analizar Mejorar Controlar

Modelo Lineal General

Stat>ANOVA>General Linear Model

* usado para especificar


las interacciones de inters

Da el mismo resultado que el


Ensayo Two-Way o el
ANOVA Balanceado cuando se
trabaja con solo dos factores!
Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -40-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Anlisis de Medias (ANOM)

El Anlisis de Medias (ANOM) es grficamente anlogo al ANOVA


Para comprobar la igualdad de las medias de las poblaciones
Desarrollado para comprobar los efectos principales a partir de un
experimento diseado en el que todos los factores estn fijados

Una grfica ANOM se puede describir de dos maneras:


Apariencia: Similar a una grfica de control tipo Shewhart
Funcin: Similar a un ANOVA para detectar diferencias en las medias
poblacionales

Diferencias entre las hiptesis para ANOM y ANOVA


ANOVA comprueba si las medias son distintas entre s
ANOM comprueba si las medias son distintas a la media global

Utilice ANOM si:


La respuesta sigue una normal y el diseo es one-way o two-way
La respuesta sigue una distribucin binomial o de Poisson.

Definir Medir Analizar Mejorar Controlar

Ejemplo de ANOM

Se ha realizado un experimento para determinar el efecto


de tres diferentes niveles de tiempo y tres diferentes
niveles de tensin en la densidad final.

Utilice el anlisis de medias (ANOM) para datos normales


y un diseo two-way para identificar cualquier
interaccin significativa de los efectos principales.

\Datafiles\exh_aov.mtw* Columnas 6, 7 y 8
Stat > ANOVA > Analysis of Means
Active la opcin include summary table
Response = Density
Active la opcin Normal
Factor 1 = Minutes, Factor 2 = Strength
Est preparado para presentar sus conclusiones.
*This data file is owned by Minitab, Inc., and is used with
permission.
Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -41-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Solucin ANOM

Two-way ANOM for Density by Minutes, Strength Observe primero


Interaction Effects
2 2.21088 los efectos de
1 interaccin
Effect

0 0

-1 Analysis of Means
-2 -2.21088 Summary Table
Strength 1 2 3 1 2 3 1 2 3 Contents: number of nonmissing data
Minutes 1 2 3 cell mean
cell standard deviation
Main Effects Minutes Strength
Rows: Minutes Columns: Strength
Level Value Level Value
9
1 10 1 1
8 1 2 3 All
2 15 2 2
Mean

7 7.14481
6.22222 3 18 3 3
6 10 4 4 4 12
5 5.29963
2.7500 5.5000 8.0000 5.4167
4 2.2174 1.2910 1.4142 2.7122
3

Minutes 1
15 4 4 4 12
2 3
9 Los puntos fuera 2.5000
1.2910
7.0000
0.8165
8.7500
1.5000
6.0833
2.9683
8
de los lmites de
Mean

7 7.14481
6.22222
18 4 4 4 12
6
5.29963 3.7500 8.0000 9.7500 7.1667
5
4 control muestran 1.2583 2.1602 1.7078 3.0699
3

Strength 1 2 3
valores diferentes All 12
3.0000
12
6.8333
12
8.8333
36
6.2222
de la media global 1.5954 1.7495 1.5859 2.9288
Cell Contents --
Density:N
Mean
StDev
Definir Medir Analizar Mejorar Controlar

Interpretacin de las grficas ANOM

Observe primero los efectos de interaccin:


Valores claramente dentro de los lmites de control significan falta
de evidencia de la interaccin.
A continuacin observe los efectos principales.
Las dos grficas inferiores muestran las medias para los niveles
de los factores.
El efecto principal es la diferencia entre la media y la lnea central.
Los asteriscos en rojo indican una diferencia significativa respecto
de la media global para un alfa () de 0.05.
Investige los puntos prximos o que sobrepasen los lmites de
control.
Tabla Resumen:
Tamao de muestra
Medias
Desviacin tpica
Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -42-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Ejemplo ANOM para la Distribucin Binomial

El nmero de facturas rechazadas se contabiliza en


muestras de 80, con el fin de determinar las muestras
cuya proporcin de rechazos es diferente del resto.

Puesto que los datos son de naturaleza binomial (dos


posibles resultados, una proporcin constante para
cada suceso, y muestras independientes), utilice el
anlisis de las muestras para datos binomieles.
\DataFile\ex-aov.mtw*
Stat > ANOVA > Analysis of Means.
Response = BoM Rejects
Active la casilla Binomial
Sample Size = 80
Est preparado para presentar sus conclusiones.
*This data file is owned by Minitab, Inc., and is used with permission.
Definir Medir Analizar Mejorar Controlar

Anlisis de Medias

Stat > ANOVA > Analysis of Means

\DataFile\ex_aov.mtw
Columnas 5 y 6
Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -43-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Solucin del Ejemplo Binomial de ANOM

Anlisis Binomial One-Way


de las Medias para BoM

Summary Table
0.154673
Proportion Defective

0.15
Sample Defects Proportion

0.10
1 3.00000 0.0375
0.075 2 6.00000 0.0750

0.05 3 8.00000 0.1000


4 14.0000 0.1750
5 6.00000 0.0750
0.00 0.000000 6 1.00000 0.0125
7 8.00000 0.1000
2 4 6 8 10
8 1.00000 0.0125
Sample Number
9 8.00000 0.1000
10 10.0000 0.1250
11 1.00000 0.0125

Definir Medir Analizar Mejorar Controlar

ANOM Binomial: Anlisis Grfico

Grfica de Proporcin de Defectos :


La lnea central representa la proporcin media
Las lneas rojas representan los lmites superior e inferior de
decisin.
Un punto fuera de los lmites de control es evidencia de que la
media de la muestra es diferente del promedio
Tabla Resumen:
Listas por muestra:
Defectos
Proporcin de defectuosos

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -44-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Ejercicio de ANOVA/ANOM

Ahora es su turno!

1. En cuatro diferentes puntosde las carretras para el caso


de Pennsylvania se prueban otros tantos tipos de pintura con
el fin de estudiar su duracin.
Con la ayuda de las herramientas estudiadas en este mdulo,
determine si existen diferencias entre las pinturas:
ANOVA One-Way
ANOVA Two-Way

Cul es la causa de las diferencias en los resultados obtenidos


con los dos mtodos?
Por qu no funciona el anlisis ANOM en este caso?

Definir Medir Analizar Mejorar Controlar

Utilizando ANOM para el Problema


de la Duracin de la Pintura

2. El fabricante de la pintura del problema anterior


desea utilizar el anlisis ANOM para determinar si
existen diferencias en los valores medios de desgaste
de las pinturas. Entonces, tomaron una serie de
diferentes muestras en las mismas ciudades...

\DataFiles\PntWear1.mtw

Con ayuda de esta informacin, realice un


anlisis ANOM y discuta los resultados.

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -45-
Profesor: Augusto N. Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA

Anlisis ANOM para el Problema


de la Duracin de la Pintura
Two-way ANOM para el desgaste de la pintura, segn el punto de medida
Effectos de Interaccin
2 2.17794

1
Effect

0 0

-1

-2 -2.17794

Paint 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
Location 1 2 3 4

Efectos Principales Location


Level Value
Paint
Level Value
15.2
1 Harrisburg 1 Y-0242
14.2
2 Philadelphia 2 Y-0314
Mean

13.2 13.4723 3 Pittsburgh 3 Y-1424


12.6875 4 Scranton 4 Y-1723
12.2
11.9027
11.2
10.2

Location 1 2 3 4
15.2 Qu diferencias se observan
14.2
utilizando este tipo de anlisis?
Mean

13.2 13.4723
12.6875
12.2
11.9027
11.2
10.2 Cul es mejor?
Paint 1 2 3 4

Definir Medir Analizar Mejorar Controlar

Bibliografa

Statistical Analysis for Decision Making, 1993, Hamburg &


Young, publicado por The Dryden Press, Captulo 8

Statistics for Experimenters, Box, Hunter & Hunter, 1978,


publicado por John Wiley and Sons, Captulo 7.

Design and Analysis of Experiments, 3rd Edition 1991,


Montgomery, publicado por John Wiley and Sons, Captulo 5.

Definir Medir Analizar Mejorar Controlar

Instituto para la Calidad


Pontificia Universidad Catlica del Per -46-

You might also like