Professional Documents
Culture Documents
Ayesta Castro
Mdulo 2
Tema: 08 Anlisis de Varianza ANOVA
Six Sigma
Excelencia en el
Negocio
08 Anlisis de
Varianza ANOVA
2
Response
\Datafile\Azalea.mtw
\DataFile\aov.mtw
\DataFile\PntWear.mtw
1 \DataFile\PntWear1.mtw
\DataFile\dataentr.mtw
\Datafiles\Exh_aov.mtw
0
4
5
1
Factor
Qu vamos a aprender
4. Suposiciones Estadsticas
5. La distribucin F
7. Ajustes y Residuales
8. Epsilon Cuadrado
Diseo:
Un productor de flores necesita saber qu semana dentro del ciclo de
crecimiento de la azalea presenta la mayor tasa de crecimiento.
- Cmo debera este productor plantear y analizar el experimento?
Fabricacin:
Un ingeniero de proceso necesita determinar el efecto de tres tiempos de
proceso y tres valores de tensin en la densidad de un tipo de plstico.
- Cmo debera el ingeniero plantear y analizar el experimento?
Administracin:
Un equipo administrativo tiene asignado el proyecto de reducir el tiempo
para la introduccin de la informacin en los acuerdos de licencia . El
equipo ha elaborado cuatro tipos diferentes de formulario.
- Cmo debera el equipo plantear y analizar el experimento?
Excerpts from Statistical Analysis for Decision Making by Morris Hamburg & Peg Young
One-Way ANOVA
One-Way ANOVA
Suma de Cuadrados
Comprendiendo los Fundamentos
5
2
Total: SSTotal = Suma Total de Cuadrados del Experimento (Valores individuales - Media Global )
Entre Factores: SSFactor = Suma de Cuadrados del Factor (Media del Grupo - Media Global )
Dentro de cada factor: SSError = Suma de Cuadrados en el Grupo (Valores individuales - Media del Grupo )
Trminos
Tabla ANOVA
Fuente Suma de Grados de Media F = MS Valor P basado
Cuadrados Libertad Cuadrtica factor/MS en F y DF
(Varianza) error
Entre SSFactor g-1 SSFactor / MSfactor /MSerror P(F)
(between) (g-1)
Ensayo de Hiptesis:
Ho: 1 = 2 = 3 = 4
Ha: Al menos una de las k es diferente
La prueba F y la Distribucin F
0.7 La Distribucin F es
Fcrit para el punto 10%
0.6 una familia de
0.5 curvas
Fcrit para el punto 5%
Prob
Suposiciones Estadsticas
Determinando la Potencia
y el Tamao de la Muestra
Stat>Power and Sample Size>One-Way ANOVA
4 formularios Power and Sample Size
Prueba de Normalidad
95% Confidence Intervals 95% Confidence Interval for Median 95% Confidence Intervals 95% Confidence Interval for Median
66.357 69.929 57.429 63.643
Mean Mean
95% Confidence Interval for StDev 95% Confidence Interval for StDev
Median 1.044 4.104 Median 1.766 6.937
66 68 70 57 60 63
Prueba de Independencia
Stat>Basic Statistics>Correlation
Variable: A-D
Correlaciones: A, B, C, D
A B C
B 0.298
0.566 Ninguno de los valores P
C 0.630 0.634 son < 0.05; en virtud de
0.180 0.177 ello, podemos asumir
independencia.
D -0.373 0.225 -0.211
0.467 0.668 0.688
Cell Contents: Pearson correlation
P-Value
Bartlett's Test
A Test Statistic 1.95
P-Value
Levene's Test
0.584
Se cumplen
Test Statistic
P-Value
0.60
0.622
todas las
B
suposiciones!
Subscripts
0 1 2 3 4 5 6 7 8 9
95% Bonferroni Confidence Intervals for StDevs
Worksheet: Dataentry.MTW
Ejecutar el ANOVA
Ejecutar el ANOVA
Stat>ANOVA>One-Way ANOVA O Stat>ANOVA>One-Way ANOVA (Unstacked)
Response: Stacked Data Response: A-D
Factor: Subscripts >Graphs: Dot Plot
>Graphs: Dot Plot
One-way ANOVA: Stacked Data versus Subscripts
Qu ms podemos aprender?
70.0
67.5
Stacked Data
65.0
62.5
60.0
57.5
55.0
A B C D
Subscripts
Boxplot of Stacked Data by Subscripts
Worksheet: Dataentry.MTW
72.5
70.0
67.5
Los formularios A y D
Stacked Data
65.0
estadsticamente 55.0
A B C D
Comparaciones Mltiples
68
Stacked Data
63
58
A B C D
Subscripts
Definir Medir Analizar Mejorar Controlar
y los Ajustes
Percent
50 0
10
parecen estar
1
-5 bien (sin
-5.0 -2.5 0.0 2.5 5.0 60 62 64 66 68
Residual Fitted Value patrones, y
Histogram of the Residuals Residuals Versus the Order of the Data normalidad de
4.5
5 residuos)
Vamos a
Frequency
Residual
3.0
0
trabajar
1.5
mucho ms
-5
0.0
-4 -2 0 2 4 2 4 6 8 10 12 14 16 18 20 22 24 con Residuos
Residual Observation Order
ms adelante.
Worksheet: Dataentry.MTW
Desviacin tpica
global (Pooled) de Las diferencias
la tabla ANOVA reales entre las medias
son 2, 5 y 7
Power and Sample Size
One-way ANOVA
Sigma = 2.366 Alpha = 0.05 Number of Levels = 4
Sample Maximum Para una diferencia
SS Means Size Power Difference de 2, = 83%!
2.0 6 0.1743 2
Para una de 7, = 2%
12.5 6 0.8039 5
24.5 6 0.9828 7 = 1 - Potencia del ensayo
Definir Medir Analizar Mejorar Controlar
Conclusiones
Ejemplo de la Azalea
Suposiciones estadsticas
Suposiciones estadsticas
95% Confidence Int ervals 95% Confidence Interval for Median 95% Confidence Int ervals 95% Confidence Interval for Median
0.04604 0.58396 1.6720 2.4803
Mean Mean
95% Confidence Interval for StDev 95% Confidence Interval for StDev
Median 0.17063 0.45286 Median 0.3394 0.9009
Suposiciones estadsticas
Bartlett's Test
WEEK-1 Test Statistic 13.25
P-Value 0.010
Levene's Test
WEEK-2 Test Statistic 2.13
P-Value 0.092
Week
WEEK-3
WEEK-4
WEEK-5
Hya que usar Levenes test puesto que los datos no son normales.
No hay suficiente evidencia para rechazar la hipotesis nula de que las
diferencias en las varianzas no sean estadsticamente significativas.
Definir Medir Analizar Mejorar Controlar
Robustez
Stat>ANOVA>Interval Plot
2.5
2.0
1.5
Growth
1.0
0.5
0.0
WEEK-1 WEEK-2 WEEK-3 WEEK-4 WEEK-5
Week
Worksheet: Azalea.MTW
2.0
1.5
Mean of Growth
1.0
0.5
0.0
WEEK-1 WEEK-2 WEEK-3 WEEK-4 WEEK-5
Week
Worksheet: Azalea.MTW
Anlisis de Diagnstico
0.0
50 Orden de los Datos
10
-0.5 muestra el
-1.0
comportamiento de los
1
-1.0 -0.5 0.0 0.5 1.0 0.0 0.5 1.0 1.5 2.0 residuos a lo largo del
Residual Fitted Value
experimento.
Histogram of the Residuals Residuals Versus the Order of the Data Probablemente sea la
12
0.5 grfica ms importante,
puesto que muestra si
Frequency
Residual
8 0.0
algo fuera del
4 -0.5 experimento est
0 -1.0
teniendo lugar.
-0.8 -0.4 0.0
Residual
0.4 1 5 10 15 20 25 30 35
Observation Order
40 45 50 Cualquier Patrn no
aleatorio es un aviso!.
Worksheet: Azalea.MTW
Ajustes y Residuos 3
0.5
Residual
0.0
-0.5
-1.0
1 2 3 4 5
Week
Fuente SS 2
Week 33.133 33.133/38.769 85.4%
Error 5.636 5.636/38.769 14.5%
Total 38.769
Definir Medir Analizar Mejorar Controlar
W eek
85.5%
Worksheet: Azalea.MTW
Tamao de Muestra
Calculemos la potencia del ensayo empleado en el caso de la Azalea:
Stat>Power and Sample Size>
One-Way ANOVA
Level N Mean
}
1 10 1.7810
2 10 0.5090
3 10 0.2930
4 10 2.1170
5 10 0.1520
Pooled StDev = 0.3539
Sigma = 0.3539 Alpha = 0.05
Number of Levels = 5
El tamao de muestra de 10 Sample Maximum
empleado en el experimento SS Means Size Power Difference
de la Azalea tiene una 0.80899 10 1.0000 1.272
potencia (1-)% para decirnos 0.05645 10 0.3250 0.336
que al menos una de las
0.02333 10 0.1495 0.216
medias es diferente!
1.93061 10 1.0000 1.965
Definir Medir Analizar Mejorar Controlar
Ejercicio 1
Stat>ANOVA>One-Way ANOVA
Factor Week Responmse - Random
El valor del
estadstico F es
One-way Analysis of Variance pequeo (0.42)
El valor P
Analysis of Variance for Random es grande
Source DF SS MS F P (0.793)
Week 4 0.172 0.043 0.42 0.793
Error 45 4.606 0.102
Total 49 4.778
Individual 95% CIs For Mean
Based on Pooled StDev
Level N Mean StDev --+---------+---------+---------+----
1 10 1.7942 0.3531 (------------*------------)
2 10 1.6808 0.2897 (------------*------------)
3 10 1.6262 0.3505 (------------*-----------)
4 10 1.7387 0.2382 (------------*-----------)
5 10 1.7526 0.3514 (------------*-----------)
--+---------+---------+---------+----
Pooled StDev = 0.3199 1.44 1.60 1.76 1.92
Stat>ANOVA> Interval Plots Main Effects Plot - Data Means for Random
Stat>ANOVA>Main Effects Plots 1.80
1.75
Random
1.9
2.0
1.8
1.9
Random
Random
1.8
1.7
1.7
1.6 1.6
1.5
1.4
1 2 3 4 5
Week 1 2 3 4 5
Week
Definir Medir Analizar Mejorar Controlar
2
Los Residuos 0.5
pasan la prueba
1
de normalidad
Normal Score
Residual
0 0.0
-1
-0.5
-2
Residual
Fitted Value El modelo
La grfica matemtico ajusta
Residuos vs. Residuals Versus the Order of the Data Residuals Versus Week correctamente los
Orden de los (response is Random) (response is Random)
valores extremos
datos parece 1.0
aleatoria0.5
0.5
Residual
Residual
0.0
0.0
-0.5 -0.5
5 10 15 20 25 30 35 40 45 50 1 2 3 4 5
Bartlett's Test
Levene's Test
0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1
Ejercicio-Tamao de la Muestra
Desgaste de Pintura
\DataFiles\ pntwear.mtw
Stat>ANOVA>One Way
Muestra que no
One-way ANOVA: PntWear versus Paint hay diferencia
detectable
Analysis of Variance for PntWear
Source DF SS MS F P
Paint 3 30.69 10.23 2.44 0.115
Error 12 50.25 4.19
Total 15 80.94
Individual 95% CIs For Mean
Based on Pooled StDev
Level N Mean StDev ------+---------+---------+---------+
Y-0242 4 14.250 1.893 (--------*--------)
Y-0314 4 12.250 2.872 (--------*--------)
Y-1424 4 11.000 1.633 (--------*--------)
Y-1723 4 10.750 1.500 (--------*--------)
------+---------+---------+---------+
Pooled StDev = 2.046 10.0 12.5 15.0 17.5
\DataFile\pntwear.mtw
Stat>ANOVA>Two Way
Seleccione
Source DF SS MS F P
Paint 3 30.6875 10.2292 7.96 0.007
Location 3 38.6875 12.8958 10.04 0.003
Error 9 11.5625 1.2847
Total 15 80.9375
Efectos Principales
14
Mean of PntWear
13
12
11
10
Worksheet: Pntwear.MTW
Interacciones
14
13
Mean
12
11
10
0
50
-1
10
1 -2
-2 -1 0 1 2 8 10 12 14 16
Residual Fitted Value
Residual
3.0 0
1.5 -1
0.0 -2
-2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Residual Observation Order
Worksheet: Pntwear.MTW
Ejercicio 2
\Datafile\ANOVA Exercise.MTW
Realice un anlisis de los datos mediante mtodos ANOVA, Grficos,
Estadsticos y de Diagnstico Prctico.
Conteste a las siguiente preguntas:
1) Se cumplen todas las suposiciones estadsticas?
2) Qu riesgos alfa y beta se han asumido?
3) Se puede emplear un One-Way ANOVA par analizar estos datos?
4) Existen diferencias?
5) Demuestran los ajustes y residuos la solidez del anlisis?
6) Cul ha sido la potencia del ensayo?
7) Qu tamao de muestra debera haber utilizado en este anlisis para
el riesgo beta asumido?
Preprese para presentar su anlisis y extraer conclusiones.
ANOVA
Stat>ANOVA>Two-way ANOVA or
Stat>ANOVA>General Linear Model
La exclamacin le dice a
Minitab que incluya todas
las interacciones
Model Reducido
Modelo Reducido
Epislon Cuadrado
Error
26.2%
FactorA
47.9%
FactorB
25.9%
Model Adequacy
50
0
10
-5
1
-10 -5 0 5 10 200 205 210 215 220
Residual Fitted Value
5
Frequency
Residual
0
2
-5
0
-6 -4 -2 0 2 4 6 8 2 4 6 8 10 12 14 16 18 20 22 24
Residual Observation Order
Diseo:
Un productor de flores necesita saber qu semana dentro del ciclo de
crecimiento de la azalea presenta la mayor tasa de crecimiento
- Cmo debera el productor plantear y analizar el experimento?{One
way ANOVA}
Fabricacin:
Un ingeniero de proceso necesita determinar el efecto de tres tiempos de
proceso y tres valores de tensin en la densidad de un tipo de plstico.
- Cmo debera el ingeniero plantear y analizar el experimento?
{Two Way ANOVA, ANOVA Balanceado o Modelo Lineal General}
Administracin:
Un equipo administrativo tiene asignado el proyecto de reducir el tiempo
para la entrada de la informacin en los acuerdos de licencia . El equipo
ha elaborado cuatro tipos diferentes de formulario.
- Cmo debera el equipo plantear y analizar el experimento?
{One-Way ANOVA}
Definir Medir Analizar Mejorar Controlar
Qu hemos aprendido
Ejercicio 2
Two-way ANOVA
Igual al One-way ANOVA solo que se analizan 2 factores.
Stat>ANOVA>Two-way ANOVA
Factor A (el 1 factor) va en Row factor
Factor B (el 2 factor) va en Column factor
Se sugiere ir a un Balanced ANOVA o a un General Linear Model con 2
ms factores (se discute despus).
Stat>ANOVA>Balanced ANOVA
| indica que todas
las interacciones
se calculan
Ejemplo de ANOM
\Datafiles\exh_aov.mtw* Columnas 6, 7 y 8
Stat > ANOVA > Analysis of Means
Active la opcin include summary table
Response = Density
Active la opcin Normal
Factor 1 = Minutes, Factor 2 = Strength
Est preparado para presentar sus conclusiones.
*This data file is owned by Minitab, Inc., and is used with
permission.
Definir Medir Analizar Mejorar Controlar
Solucin ANOM
0 0
-1 Analysis of Means
-2 -2.21088 Summary Table
Strength 1 2 3 1 2 3 1 2 3 Contents: number of nonmissing data
Minutes 1 2 3 cell mean
cell standard deviation
Main Effects Minutes Strength
Rows: Minutes Columns: Strength
Level Value Level Value
9
1 10 1 1
8 1 2 3 All
2 15 2 2
Mean
7 7.14481
6.22222 3 18 3 3
6 10 4 4 4 12
5 5.29963
2.7500 5.5000 8.0000 5.4167
4 2.2174 1.2910 1.4142 2.7122
3
Minutes 1
15 4 4 4 12
2 3
9 Los puntos fuera 2.5000
1.2910
7.0000
0.8165
8.7500
1.5000
6.0833
2.9683
8
de los lmites de
Mean
7 7.14481
6.22222
18 4 4 4 12
6
5.29963 3.7500 8.0000 9.7500 7.1667
5
4 control muestran 1.2583 2.1602 1.7078 3.0699
3
Strength 1 2 3
valores diferentes All 12
3.0000
12
6.8333
12
8.8333
36
6.2222
de la media global 1.5954 1.7495 1.5859 2.9288
Cell Contents --
Density:N
Mean
StDev
Definir Medir Analizar Mejorar Controlar
Anlisis de Medias
\DataFile\ex_aov.mtw
Columnas 5 y 6
Definir Medir Analizar Mejorar Controlar
Summary Table
0.154673
Proportion Defective
0.15
Sample Defects Proportion
0.10
1 3.00000 0.0375
0.075 2 6.00000 0.0750
Ejercicio de ANOVA/ANOM
Ahora es su turno!
\DataFiles\PntWear1.mtw
1
Effect
0 0
-1
-2 -2.17794
Paint 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
Location 1 2 3 4
Location 1 2 3 4
15.2 Qu diferencias se observan
14.2
utilizando este tipo de anlisis?
Mean
13.2 13.4723
12.6875
12.2
11.9027
11.2
10.2 Cul es mejor?
Paint 1 2 3 4
Bibliografa