You are on page 1of 7

ANOVA

EJEMPLOS Y EJERCICIOS.

ANOVA DE UNA VÍA (UN FACTOR)

Las fórmulas que se utilizan en ANOVA son:

! ! ! !!
𝑆𝑆𝑇 = !!! !!! 𝑦!" − !"

! !
!!! !! !!
𝑆𝑆𝐴 = !
− !"

𝑆𝑆𝐸 = 𝑆𝑆𝑇 − 𝑆𝑆𝐴

Dónde:
n = tamaño de la muestra de cada uno de los tratamientos
k= total de tratamientos
T= el total de todas las muestras
SST= variación total (suma total de cuadrados)
SSA= variación entre muestras (suma de cuadrados de los tratamientos)
SSE= variación dentro de la muestra (suma de cuadrados de los errores).

Los cálculos en un problema de análisis de varianza se resumen generalmente en una
tabla como la siguiente:
F
Fuente de Suma de Grados de Cuadrado F
Valor
variación cuadrados libertad medio calculada
crítico
Tratamiento SSA k-1 𝑆𝑆𝐴 2
𝛿1 Se toma de
𝛿!! = tablas de la
𝑘−1
𝛿2 distribución F
Error SSE k(n-1) !
𝑆𝑆𝐸 con k-1 y k(n-
𝛿 = 1) grados de
𝑘(𝑛 − 1)
libertad. Excel
lo arroja en
automático.
Total SST nk-1

Esta tabla se obtiene directamente en Excel (Ver vídeo “ANOVA de un factor aplicado en
Excel” que se encuentra en Contenidos semanales)

EJEMPLO 1:
En una auditoría los auditores tienen que dar opiniones acerca de diversos aspectos con
base en sus propias experiencias directas, indirectas o en una combinación de ambas. En
un estudio se pidió a auditores que dieran su opinión acerca de la frecuencia con que se
presentan errores en una auditoría. Suponga que se obtuvieron los resultados que se
presentan a continuación; valores bajos indican opiniones más acertadas. Use α = 0.05

1



para determinar si el tipo de experiencia en que se basa la opinión afecta la calidad de la
misma.


DIRECTA INDIRECTA COMBINACIÓN
17 16,6 25,2
18,5 22,2 24
15,8 20,5 21,5
18,2 18,3 26,8
20,2 24,2 27,5
16 27,5 25,8
13,3 16 24,2

La hipótesis que se quiere probar es:
𝐻! = 𝜇! = 𝜇! = 𝜇!
𝐻! : Al menos dos de las medias no son iguales.
Haciendo los cálculos en Excel, la tabla queda con los siguientes resultados:

ANÁLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de los F Probabilidad Valor crítico
variaciones cuadrados libertad cuadrados para F
Entre grupos 224,28 2 112,14 12,65 0,00037 3,55
Dentro de los 159,54 18 8,86
grupos

Total 383,81 20

Recordar que la hipótesis nula 𝐻! es rechazada al nivel de significancia α cuando es
verdadero que:
𝑓 > 𝑓! 𝑘 − 1, 𝑘(𝑛 − 1)

Es la F en la tabla ANOVA Es el valor crítico para
F en la tabla ANOVA

Comparando:

12,65 > 3,55 Verdadero

Decisión: Se rechaza 𝐻! y se concluye que las medias de los grupos son diferentes, por
tanto, el tipo de experiencia si es significativa.

Ejemplo 2.

2



Cuatro grupos de un mismo curso de Estadística inferencial fueron impartidos por cuatro
maestros. Las calificaciones finales se registraron como sigue:

MAESTRO
A B C D
73 88 68 15
89 78 79 96
82 48 56 80
43 91 91 56
80 51 71 56
73 85 71 70
66 74 87 70
60 77 41 80
45 31 59 87
93 78 68 45
36 62 53 92
77 76 79 91
¿Existe alguna diferencia significativa en el promedio de calificaciones dadas por los
cuatro maestros? Utilice un nivel de significancia de 0.01.

La hipótesis que se quiere probar es:


𝐻! = 𝜇! = 𝜇! = 𝜇! = 𝜇!
𝐻! : Al menos dos de las medias no son iguales.
Haciendo los cálculos en Excel, la tabla queda con los siguientes resultados:

ANÁLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de los F Probabilidad Valor crítico
variaciones cuadrados libertad cuadrados para F
Entre grupos 30,062 3,000 10,021 0,028 0,994 4,261
Dentro de los 15888,417 44,000 361,100
grupos

Total 15918,479 47

Comparando queda:
0,028 > 4,261 Falso

Decisión: Se acepta Ho y se concluye que la diferencia no es significativa y que las medias


son iguales para los cuatro maestros.

EJERCICIO PROPUESTO.

Se investigó el efecto de la altura de los supermercados en las ventas de comida enlatada


para perros. Se realizó un experimento durante 8 días acerca de las ventas de una marca

3



de comida para perros, en el cual se incluían tres niveles e altura de los estantes: nivel de
la rodilla, nivel de la cintura y nivel de los ojos. Durante cada día se varió aleatoriamente
en tres ocasiones la altura de los estantes de la comida. Las ventas diarias en cientos de
pesos, de la comida para perros para las tres alturas de los estantes se muestran a
continuación:

ALTURA DEL ESTANTE


Nivel de la Nivel de la Nivel de los
rodilla cintura ojos
77 88 85
82 94 85
86 93 87
78 90 81
81 91 80
86 94 79
77 90 87
81 87 93
¿Existe alguna diferencia significativa en el promedio diario de ventas de esta comida para
perros, basada en la altura de los estantes? Utilice un nivel de significancia de 0.01.

ANOVA DE DOS VÍAS (DOS FACTORES).

Las fórmulas consideran el caso de n réplicas de las combinaciones de tratamientos


determinadas por a niveles del factor A y b niveles del factor B. Las observaciones pueden
ser clasificadas por medio de un arreglo rectangular, en el cual los renglones representan
los niveles del factor A y las columnas representan los niveles del factor B.
Para probar la hipótesis de H’o de que los efectos de los factores A son todos igual
!!!
a cero, se calcula: 𝑓! = la cual es un valor de la variable aleatoria 𝐹! que tiene la
!!
distribución F. Se rechaza la H’o con un nivel de significancia α cuando:

𝑓! > 𝑓! 𝑎 − 1, 𝑎𝑏(𝑛 − 1)

Asimismo, para probar la hipótesis H’’o, de que los efectos del factor B son todos
!!!
iguales a cero, se calcula: 𝑓! = la cual es un valor de la variable aleatoria 𝐹! que
!!
tiene la distribución F. Se rechaza la H’’o con un nivel de significancia α cuando:

𝑓! > 𝑓! 𝑏 − 1, 𝑎𝑏(𝑛 − 1)

Por último, para probar la hipótesis H’’’o, de que los efectos de interacción son
!!
todos iguales a cero, se calcula: 𝑓! = !!! la cual es un valor de la variable aleatoria 𝐹! que
tiene la distribución F. Se concluye que hay interacción cuando:

4




𝑓! > 𝑓! (𝑎 − 1)(𝑏 − 1), 𝑎𝑏(𝑛 − 1)

Los datos se presentan en una tabla como la siguiente:

Fuente de Suma de Grados de Cuadrado medio F F Valor
variación cuadrados libertad calculada crítico
Efecto
principal Se toma de
!!" !!
A SSA a-1 𝛿!! = 𝑓! = !! tablas de la
!!! !
distribución
B SSB b-1 𝑆𝑆𝐵 !! F con k-1 y
𝛿!! = 𝑓! = !!
𝑏−1 ! k(n-1)

Interacción de
grados de

dos factores 𝑆𝑆(𝐴𝐵) !!! libertad.
AB SS(AB) (a-1)(b-1) 𝛿!! = 𝑓! = !! Excel lo
(𝑎 − 1)(𝑏 − 1)
arroja en
automático.
Error SSE ab(n-1) 𝑆𝑆𝐸
𝛿! =
𝑎𝑏(𝑛 − 1)

Total SST abn-1

EJEMPLO 1.

Una empresa de venta por catálogo diseñó un experimento factorial para probar el
efecto de tamaño y diseño de los anuncios publicitarios, en el catálogo, sobre el número
de solicitudes de catálogos recibidas (los datos están dados en miles). Se pusieron a
consideración tres diseños publicitarios y cuatro tamaños. Los datos obtenidos se
presentan a continuación.
Tamaño del anuncio
b1 b2 b3 b4
a1 8 12 9 13
12 8 13 9
Diseño
a2 22 26 20 24
14 30 17 32
a3 10 18 12 16
18 14 14 17

Emplee el ANOVA para un diseño factorial para probar si hay efectos significativos
debidos al tipo de diseño, al tamaño o a la interacción. Use α = 0.01.

SOLUCIÓN.
1. Plantear las hipótesis nulas.
H’o: 𝛼! = 𝛼! = 𝛼! = 0

5



H’’o: 𝛽! = 𝛽! = 𝛽! = 𝛽! = 0
H’’’o: (𝛼𝛽)!! = (𝛼𝛽)!" = … . . = (𝛼𝛽)!" = 0
2. Plantear las hipótesis alternativas.
𝐻′! : al menos una de las α’s no es igual a cero
𝐻′′! : al menos una de las β’s no es igual a cero
𝐻′′′! : al menos una de las (αβ)’s no es igual a cero
3. Nivel de significancia: α=0.01
4. Cálculos, se presentan en la siguiente tabla:



ANÁLISIS DE VARIANZA DE DOS FACTORES
Promedio de Valor
Origen de las Suma de Grados de F
los Probabilidad crítico
variaciones cuadrados libertad calculada
cuadrados para F
Diseño 657,58 2 328,79 26,13 4,24E-05 6,93
Tamaño del
105 3 35 2,78 8,66E-02 5,95
anuncio
Interacción 103,75 6 17,29 1,37 3,00E-01 4,82
Dentro del grupo 151 12 12,58


Total 1017,33 23


5. Decisión:
Se comparan las F calculadas con las del valor crítico para F.
Recuerda que se rechaza la hipótesis nula si las F calculadas son mayores que las F de
valor crítico.
a) 26,13 > 6,93 Verdadero
Se rechaza H’o y se concluye que diferentes diseños dan como resultado diferentes medias de los
promedios de número de solicitudes de catálogos recibidas.
b) 2,78 > 5,95 Falso
Se acepta H’’o y se concluye las medias de los promedios de número de solicitudes de
catálogos recibidas son las mismas para los cuatro tamaños del anuncio.
c) 1,37 > 4,82 Falso
Se acepta H’’’o y concluir que no hay interacción entre los diferentes tipos de diseño y los
diferentes tipos de tamaños del anuncio.

NOTA: Para ver como se ingresan los datos para aplicar ANOVA de dos factores en Excel,
consultar el siguiente vídeo: https://www.youtube.com/watch?v=kQFyBcQSLX8


EJERCICIO PROPUESTO.
Un parque de diversión estudió los métodos para disminuir el tiempo de espera (en
minutos) al bajar y subir a los pasajeros a los diversos juegos. Se propusieron dos métodos

6



para subir y bajar a los pasajeros de los juegos. Para tomar en cuenta las diferencias
debidas al tipo de juego y a la interacción que puede haber entre el tipo de juego y el
método de subir y bajar a los pasajeros, se diseñó un experimento factorial. Use los datos
siguientes para hacer una prueba sobre cualquier efecto significante debido al método
para subir y bajar a los pasajeros, al tipo de juego y a la interacción. Use α = 0.05.

Tipo de juego
Montaña rusa Rueda de la fortuna Tobogán
Método 1 41 52 50
43 44 46
Método 2 49 50 48
51 46 44