You are on page 1of 6

13/6/2018

Introducción al ANOVA
ANALISIS DE LA VARIANZA
(ANOVA)  Fue desarrollada alrededor de 1930 por Fisher
 Es una de las herramientas mas valiosas y utilizada
de la inferencia estadística
DISEÑO DE  La idea básica consiste en descomponer la
EXPERIMENTOS variabilidad total observada en unos datos en una
serie de términos asociado a los efectos de cada
factor estudiado y a su posibles interacciones, mas
una parte residual.
 Luego se compara los resultados obtenidos para
investigar su posible significancia estadística.

ANOVA. Ejemplo intuitivo. ANOVA. Ejemplo intuitivo.


 Se desea estudiar los efectos que la variedad de un cultivo y la dosis  Se desea investigar:
abonada tiene sobre el rendimiento del mismo. Se compara 2
variedades (A y B) y 3 dosis de abonado (10, 20 y 30 kg de producto  El promedio para las 3 dosis estudiadas
por Ha). Se dispone de 12 parcelas similares, y se decide plantar 2 - Hay diferencias entre los rendimientos medios?
parcelas con c/u de las combinaciones posibles de variedad y dosis.
- Hay efecto de la variedad sobre la media de la respuesta?
 Variable respuesta: rendimiento del cultivo y es V.A.
 El promedio para las 2 variedades estudiadas:
 Los efectos sobre la V.A. son dos factores:
- Variedad del Cultivo(Factor Cualitativo) - Varia el rendimiento al variar las dosis?
- Dosis de Abono (Factor Cuantitativo) - Existe un efecto de la variedad sobre el rendimiento?
- Hay 6 tratamientos posibles, obtenido al combinar los 2 factores  Existe una interacción entre los dos factores?
- A cada tratamiento le corresponde una población
- Las 2 parcelas asignada a cada tratamiento es una muestra
- Las 12 muestras constituyen los datos disponibles para el estudio

Ejemplo Intuitivo(Caso A) Ejemplo Intuitivo(Caso B)


Abonado Abonado
1 2 3 1 2 3
A 20 20 20 20 20 20 A 20 20 20 20 20 20
Variedad Variedad
B 20 20 20 20 20 20 B 30 30 30 30 30 30

Rendimiento Medio 𝑥=20


ҧ Rendimiento Medio 𝑥=25
ҧ

SCT=σ(𝑥𝑖𝑗 − 𝑥)ҧ 2 = (20 − 25)2 +(20 − 25)2 + ⋯ + (30 − 25)2 =300


SCT=σ(𝑥𝑖𝑗 − 𝑥)ҧ 2 = (20 − 20)2 +(20 − 20)2 + ⋯ + (20 − 20)2 =0
SCT=300 tenemos variabilidad
La variabilidad se debe solo a efecto de la Variedad
SCT=0 , nada influye sobre mis observaciones
El factor Variedad influye sobre 𝑥ҧ
SCT=SCV

1
13/6/2018

Ejemplo Intuitivo(Caso C) Ejemplo Intuitivo(Caso C)


Abonado Abonado
1 2 3 1 2 3
A 20 20 25 25 30 30 A 19 21 27 24 28 32
Variedad Variedad
B 30 30 35 35 40 40 B 30 31 36 33 47 51

Rendimiento Medio 𝑥=30


ҧ Rendimiento Medio 𝑥=31,6
ҧ
2 2 2 2
SCT=σ(𝑥𝑖𝑗 − 𝑥)ҧ = (20 − 25) +(20 − 25) + ⋯ + (30 − 25) =500 SCT=σ(𝑥𝑖𝑗 − 𝑥)ҧ 2 = (19 − 31,6)2 +(21 − 31,6)2 + ⋯ + (51 − 31,6)2 =1001

SCT=500 tenemos variabilidad SCT=1001 tenemos variabilidad


La variabilidad se debe al efecto de la Variedad y al efecto de la La variabilidad se debe al efecto de la Variedad , al efecto de la dosis de
dosis de Abonado Abonado, al efecto de Interacción y otros factores no controlados
Los factores Variedad y Abonado influyen en 𝑥ҧ Los factores que influyen en 𝑥ҧ
SCT=SCV+SCA SCT=SCV+SCA+SCI+SCR

ANOVA de un Factor ANOVA de un Factor

 Se tiene 𝒂 tratamientos o niveles diferentes de un Modelo para los Datos


solo factor.
𝑦𝑖𝑗 =𝜇𝑖 +𝜀𝑖𝑗 , 𝑖 = 1 … 𝑎 , 𝑗 = 1 … 𝑛
 La respuesta de cada uno de los 𝒂 tratamientos es
 Si escribimos 𝜇𝑖 = 𝜇 + 𝜏𝑖 , 𝑖 = 1 … 𝑎 podemos escribir:
una V.A.
Tratamientos Observaciones Totales Promedios 𝑦𝑖𝑗 = μ + 𝜏𝑖 +𝜀𝑖𝑗 , 𝑖 = 1 … 𝑎 , 𝑗 = 1 … 𝑛
(a)  Este es un modelo estadístico lineal, 𝑦𝑖𝑗 es una función lineal
1 𝑦11 𝑦12 … 𝑦1𝑛 𝑌1 𝑌ത1 de los parámetros del modelo, donde 𝜇 es la media global 𝜏𝑖
2 𝑦12 𝑦22 … 𝑦2𝑛 𝑌2 𝑌ത2
. . . … . .
es el efecto del tratamiento iésimo, 𝜀𝑖𝑗 error aleatorio.
. . . … . .
 Si los 𝜀𝑖𝑗 ~𝑁, las 𝜎 2 constantes y las observaciones
. . . … . . .
a 𝑦𝑎1 𝑦𝑎2 … 𝑦𝑎𝑛 𝑌𝑎 𝑌ത𝑎 independientes entonces
𝑌𝑇 𝑌ത𝑇 𝑦𝑖𝑗 ~𝑁(𝜇 + 𝜏𝑖 , 𝜎 2 )

ANOVA de un Factor ANOVA de un Factor

Análisis del Modelo Tabla de ANOVA


σ 𝑦𝑖𝑗
𝑌ത𝑖 = , i=1, … , a
𝑛
σ 𝑦𝑖𝑗 Fuente de Suma de Grados de Cuadrado 𝑭𝟎
𝑌ത𝑇 = , ∀𝑖, 𝑗, N = a ∗ n Variación Cuadrados Libertad Medios
𝑁
Queremos probar 𝐸 𝑦𝑖𝑗 = 𝜇 , luego planteamos Entre los SCF=n σ(𝑦𝑖. − 𝑌ത𝑇 )2 𝑎−1 𝑀𝑆𝑇 𝑀𝑆𝑇
𝐹0 =
 𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑎 Tratamientos 𝑀𝑆𝐸
 𝐻1 : 𝜇𝑖 ≠ 𝜇𝑗 para algún i, j
Luego analizamos la variabilidad de los datos para ello analizamos: Error dentro de SCE=SCT-SCF 𝑁−𝑎 𝑀𝑆𝐸
𝑆𝐶𝑇 = 𝑆𝐶𝐹 + 𝑆𝐶𝐸 los
Tratamientos
෍(𝑦𝑖𝑗 − 𝑌ത𝑇 )2 = 𝑛 ෍(𝑦𝑖. − 𝑌ത𝑇 )2 + ෍(𝑦𝑖𝑗 − 𝑌ത𝑖 )2 TOTAL SCT=σ(𝑦𝑖𝑗 − 𝑌ത𝑇 )2 𝑁−1

De esta identidad nos proporcionan dos estimaciones para 𝜎 2 que serian


𝑆𝐶𝐹 𝑆𝐶𝐸
𝑀𝑆𝑇 = 𝑎−1 𝑦 𝑀𝑆𝐸 = 𝑁−𝑎
Luego se interpreta el valor 𝐹0 y se elige rechazar o no rechazar 𝐻0

2
13/6/2018

Ejemplo de ANOVA
Ejemplo de ANOVA

En un estudio se proceso el Fosfato Tricálcico (TCP) de dos manera  Hacemos un estudio Exploratorio de los datos
posible a nivel Microscópico(Micro) y a nivel Nanoscópico (Nano) y cada
proceso se le efectuó distintos tratamientos; sin ultrasonido (SUS), con
ultrasonido al final de su proceso (US1), con ultrasonido a lo largo de todo
el proceso (US2). Luego de repetir el experimento se obtuvo el lote de
datos y se procede a estudiar los efectos de los tratamientos en el tamaño De los datos podemos inferir
de partículas a nivel Macro y Nano. que existirá diferencias en el
tamaño media de partículas y el
tratamiento con menor media
es US2

Ejemplo de ANOVA Ejemplo de ANOVA

 Previo al ANOVA veamos si se cumplen los supuestos de


NORMALIDAD- INDEPENDENCIA-
HOMOCEDASTICIDAD
 NORMALIDAD Se carga los datos en una hoja de
Planteamos la siguiente prueba de Hipótesis: calculo (Se puede importar los
 𝐻0:las observaciones de cada tratamiento proceden de una población con datos de EXCEL). Luego se
distribución normal procede a la pestaña Estadísticas y
 𝐻1:las observaciones de cada tratamiento NO proceden de una población con se selecciona ANOVA
distribución normal
Después de cargar los datos con INFOSTAT, al implementar
ANOVA, pedimos al programa guardar los residuos de los
datos(RDUO Tamaño)así como también los valores predichos
(PRED Tamaño) y los valores absolutos de los residuos (RABS
Tamaño).
Utilizamos la prueba de SHAPIRO-WILKS modificado sobre
RDUO Tamaño

Ejemplo de ANOVA Ejemplo de ANOVA

Debemos seleccionar las


columnas y clasificarlas como  Luego seleccionamos guardar las opciones (RDUO
variables Dependientes e Tamaño) (PRED Tamaño) y (RABS Tamaño).
Independientes

Esto aparecerá al minimizar


tabla de ANOVA

3
13/6/2018

Ejemplo de ANOVA Ejemplo de ANOVA

Luego en la ventana
emergente clasificamos la
variable RDUO y damos
enter y nos arrojara el
resultado

Seleccionar Prueba de
Normalidad

Ejemplo de ANOVA
Ejemplo de ANOVA

CONCLUSION: Como 𝑝 > 𝛼 , esto es 0.7870 > 0.05 no rechazo 𝑯𝟎 , entonces


podemos suponer que los datos provienen de una población normal.
También corroboramos lo anterior realizando un gráfico de Q-Q Plot

Ejemplo de ANOVA Ejemplo de ANOVA


 INDEPENDENCIA
La independencia una vez realizado el experimento no se puede corregir
una forma de verificar la independencia es realizar un grafico de
En el gráfico se puede observar una dispersión de los datos en función del orden de las observaciones (tiempo)
fuerte correlación r = 0;976 entre los
valor de los RDUO Tamaño y la
recta predicha para los cuantiles
normales con lo cual nuestra prueba de
normalidad queda evidente.

4
13/6/2018

Ejemplo de ANOVA Ejemplo de ANOVA


 HOMOCEDASTICIDAD
 𝐻0 :las observaciones de las subpoblaciones son
Homogéneas
CONCLUSION: El grafico parece
 𝐻1:las observaciones de las subpoblaciones NO son
ser aleatorio con lo cual nos Homogéneas
garantiza la independencia.
Recordemos que cada unidad
Utilizamos la prueba de análisis de la varianza sobre RABS
muestral solo fue tratada con un obtenemos
tratamiento.

Ejemplo de ANOVA Ejemplo de ANOVA


Finalmente al cumplirse las hipótesis necesarias para el
ANOVA procedemos a plantear la misma y realizamos una
prueba post-hoc o contraste no planeado en este caso
elegimos la prueba de TUKEY.
 Objetivos: Determinar si el tamaño promedio de las partículas de TCP-
Micro sometidas a distintos tratamientos son diferentes.
 Tratamientos o Factores: Son los diferentes procedimiento (SUS, US1,
US2) para obtener TCP.
 Supuestos: Los supuestos de Normalidad, Independencia y
Homocedasticidad de los datos se cumplen
Hipótesis:
 𝐻0 : El tamaña promedio de las partículas sometida a los diferentes
CONCLUSION: Como 𝑝>𝛼 , esto es 0.4749 > 0.05 no rechazo 𝐻0 , entonces los tratamientos son igual
datos no evidencias diferencias significativas para la NO Homocedasticidad.
 𝐻1 :El tamaño promedio de las partículas sometida a diferentes
Esta prueba es conocida como la prueba de LEVENE. tratamientos son distintas
 Nivel de confianza: 𝟏 − 𝜶 % = 𝟗𝟓% con una significancia 𝛼 = 5%

 Contraste(Post-Hoc): Prueba de TUKEY.

Ejemplo de ANOVA Ejemplo de ANOVA

En comparaciones seleccionar
significancia y prueba de
contraste de TUKEY. Luego
aceptar

5
13/6/2018

Ejemplo de ANOVA

CONCLUSIONES TCP MICRO


 Como el valor 𝑝 < 𝛼 , de la tabla 0.0055 < 0.05 por lo tanto Rechazamos
la 𝐻0 a favor de la 𝐻1 . Con lo cual diríamos que el tamaño promedio de
partículas de TCP-Micro tienen diferencias significativas debido al
tratamiento empleado al obtener las mismas.
 Si bien el diseño de ANOVA es desbalanceado, ya que no se cuenta con la
misma cantidad de unidades muestrales para cada proceso, el diseño
empleado es lo suficientemente robusto como para que este desbalanceo
afecte al rechazo o aceptación de la hipótesis
 De las pruebas de contraste podemos inferir que se obtiene diferencias
significativas al emplear el proceso SUS y US2 en el tamaño promedio de
las partículas e ACP a nivel microscópico .
 Se observan que no hay diferencias estadísticas significativas al emplear el
proceso US1 versus US2 y entre US1 versus SUS en el tamaño Promedio de
las partículas de TCP a nivel microscópico.
 Si el objetivo final es conseguir disminuir el tamaño promedio de partículas
de TCP es recomendable usar el proceso US2, cuyo tamaño promedio
obtenido es de 𝑥ҧ = 3,95 .

You might also like