You are on page 1of 6

1

Programa para la inmersión a la Educación Superior - PIES

Departamento de Ciencias Básicas


Área: Estadı́stica
Guı́a # 16
Programas: Ingenierı́a de alimentos, Ingenierı́a de Automatización, Ingenierı́a Ambiental
y sanitaria, Ingenierı́a Eléctrica, Ingenierı́a Civil, Ingenierı́a Quı́mica, Administración de
Empresas, Contadurı́a Pública, Urbanismo, Biologı́a, Economı́a, Finanzas y comercio inter-
nacional, Negocios y Relaciones Internacionales, Trabajo Social, Optometrı́a, Veterinaria,
Zootecnia y Administración de Agronegocios.

Elaborado por: Edgar Palacios Segura

Fecha de elaboración: Mayo 18 de 2018

Tema: Analisis de Varianza

INTENCIONALIDAD

Habilidades que se pretenden desarrollar.


Identificar cuándo la prueba de igualdad de varias medias es útil para comprender unos datos.
Saber reconocer que la significación estadı́stica de diferencias entre medias muestrales depende del tamaño
de las muestras y de la variación existente dentro de éstas.
Identificar cuándo se puede utilizar de forma segura el ANOVA para comparar medias.

DESARROLLO DEL CONCEPTO:

Analisis de Varianza de un factor


En esta guı́a aprenderemos a someter a prueba la igualdad de tres o más medias poblacionales utilizando el
método del análisis de varianza de un factor (ANOVA).
El término un factor (o tratamiento) se utiliza porque los datos muestrales se separan en grupos de acuerdo
con una caracterı́stica. El método del análisis de varianza de un factor, se utiliza para someter a prueba las
hipótesis de que k medias poblacionales son iguales,

H0 : µ1 = µ2 = µ3 = ... = µk

La hipótesis alternativa plantea que existe alguna diferencia entre las medias, que no todas la medias
poblacionales son iguales:
Ha : Hay alguna media diferente
El análisis de varianza compara la variación debida a unas determinadas fuentes con la variación existente
entre individuos que deberı́an ser similares. En particular, la prueba ANOVA contrasta si varias poblaciones
tienen la misma media, comparando lo separadas que están entre sı́ las medias muestrales en relación con
la variación existente dentro de la muestras.
Requisitos para hacer una prueba de hipótesis
Las poblaciones tienen distribuciones que son aproximadamente normales.
Las poblaciones tienen la misma varianza σ 2 (o desviación estándar σ).
2

Las muestras son aleatorias simples de datos cuantitativos.


Las muestras son independientes entre sı́ (es decir, no están pareadas o asociadas de ninguna forma).
Las diferentes muestras provienen de poblaciones que están categorizadas de una sola forma.
Procedimiento para hacer una prueba ANOVA
Utilice un programa estadı́stico (como R) para obtener los resultados.
Identifique el valor P en los resultados.
Plantee una conclusión con base en estos criterios: Si el valor P es menor que el nivel de significancia
alfa rechace la hipótesis nula de medias iguales y concluya que al menos una de las medias poblacionales
es diferente de las otras. Si el valor P mayor o igual que el nivel de significancia alfa, no rechace la
hipótesis nula de medias iguales.
Distribución F
Los métodos del análisis de varianza (ANOVA) requieren de la distribución F, recuerde que la distribución
F tiene las siguientes propiedades:
La distribución no es simétrica
Los valores de F no son negativos
La forma exacta de la distribución F depende de dos clases de grados de libertad
El valor del estadı́stico de prueba F del ANOVA
El valor del estadı́stico de prueba F del análisis de la varianza para contrastar la igualdad de varias muestras
tiene la forma:
Varianza entre muestras
F =
Varianza dentro de muestras
Componentes más importantes del método ANOVA.
Sumas de cuadrados
La SCT o suma total de cuadrados es una medida de la variación total (alrededor de x̄ ¯) en todos los datos
muestrales combinados. donde x̄ ¯ es la media de global de todas las muestras.
n
X
SCT = ¯)2
(xi − x̄
i=1

La SC(del tratamiento), también llamada SC(del factor), SC(entre grupos) o SC(entre muestras), es una
medida de la variación entre las medias muestrales.
k
X
SCT R = ¯ )2
ni (x̄i − x̄
i=1

La SC(del error), también conocida como SC(dentro de grupos) o SC(dentro de muestras), es una suma de
cuadrados que representa la variación que se supone común a todas las poblaciones consideradas.
k
X
SCE = (ni − 1)s2i
i=1

Dadas las expresiones anteriores para SC(total), SC(del tratamiento) y SC(del error), siempre deben man-
tenerse la siguiente relación.
SCT = SCT R + SCE
3

Cuadrados medios
Si dividimos cada una de los cuadrados entre su número correspondiente de grados de libertad, obtenemos
los cuadrados medios. Cuadrado medio del tratamiento se obtiene

SCT R
CM T R =
k−1
Cuadrado medio del error se obtiene

SCE
CM E =
n−k
Cuadrado medio total se obtiene

SCT
CM T =
n−1
Al probar la hipótesis nula
H0 : µ1 = µ2 = µ3 = ... = µk
contra la hipótesis alterna
Ha : Hay alguna media diferente
el estadı́stico de prueba
CM T R
F =
CM E
Tiene una distribución F con (k − 1) grados de libertad del numerador y (n − k) grados de libertad del
denominador.
Una manera adecuada de representar los cálculos anteriores se usa una tabla conocida como tabla ANOVA

Fuente SC gl CM F Valor P
Tratamientos SCT R k−1 CM T R = SCT R/(k − 1) CM T R/CM E
Error SCE n−k CM E = SCE/(n − k)
Total SCT n−1

EJEMPLOS

Ejemplo 1.
Una empresa fabrica en sus tres fabricas situadas en tres ciudades diferentes impresora y computadoras. Con
el fin de medir los conocimientos que tienen los empleados de estas tres plantas acerca de la administración
de la calidad, se toma una muestra aleatoria de 6 empleados de cada fabrica y se les aplica un examen acerca
de su conocimiento de la calidad. Obteniendo las siguientes puntuaciones

Fabrica 1 85 75 82 76 71 85
Fabrica 2 71 75 73 74 69 82
Fabrica 3 59 64 62 69 75 67

El administrador de la empresa quiere usar estos datos para probar la hipótesis de que la media de las
puntuaciones de los exámenes es la misma de las tres fabricas.
Hagamos el supuesto de que cumple los requisitos para hacer un análisis de varianza. Solución:
Usando el programa R nos proporciona tabla ANOVA del problema.
4

Como el valor P es menor que el nivel de significancia del 5 %, rechazamos la hipótesis nula de que las
medias de la puntuación en los exámenes acerca del conocimiento de la calidad son diferentes, o almenos
hay una media diferente.

EJERCICIOS PROPUESTOS

Para resolver cada uno de los problemas haga uso del programa R (o R studio).

1. En una auditoria los auditores tienen que dar opiniones acerca de diversos aspectos con base en sus
propias experiencias directas, indirectas o en en una combinación de ambas. En estudio se pidió a los
auditores que dieran su opinión acerca de la frecuencia con que se presentan errores en una auditoria.
Suponga que se obtuvieron los resultados que se presentan a continuación: valores bajos indican
opiniones más acertadas.

Directa Indirecta Combinación


17.0 16.6 25.2
18.5 22.2 24.0
15.8 20.5 21.5
18.2 18.3 26.8
20.2 24.2 27.5
16.0 19.8 25.8
13.3 21.2 24.2

Use α = 0,05 para determinar si el tipo de experiencia en que se basa la opinión afecta la calidad de
la misma.

2. En publicidad de cuatro pinturas se dice que tienen el mismo tiempo de secado. Para verificar esto,
se prueban cinco muestras de cada una de las pinturas. se registra el tiempo en minutos necesario
para que el secado sea suficiente para la aplicación de una segunda mano. Los datos obtenidos son los
siguientes.

Pintura 1 Pintura 2 Pintura 3 Pintura 4


128 144 133 150
137 133 143 142
125 142 137 135
124 143 136 140
141 130 131 153

Con α = 0,05 como nivel de significancia, realice una prueba para demostrar si la media de los
tiempos de secado es la misma en todas las pinturas.
5

3. Jeff Parent es un profesor de estadı́stica que participa en triatlones. A continuación se presentan


los tiempos (en minutos y segundos) que registró en una prueba de bicicleta (que comprendió cinco
vueltas) a lo largo de cada milla, en un circuito de 3 millas. Utilice un nivel de significancia de 0.05
para someter a prueba la afirmación de que el profesor tarda el mismo tiempo en recorrer cada milla.
¿Parece que alguna de las millas tiene una pendiente de subida?

Milla 1 3:15 3:24 3:23 3:22 :3:21


Milla 2 3:19 3:22 3:21 3:17 3:19
Milla 3 3:34 3:31 3:29 3:31 3:29

USANDO R

Instrucciones en R que permiten obtener los valores del análisis de varianza.


Caracterı́sticas del modelo del análisis de varianza
Resultados del programa R para el ejemplo dado

BIBLIOGRAFÍA

1. Moore, David S. The Basic Practice of Statistics. Fifth Edition. New York WH Freeman and Company
(2010).
2. Triola Mario F. ESTADISTICA. Decimoprimera Edición. Pearson Educación 2013.
3. Devore Jay l. PROBABILIDAD Y ESTADÍSTICA para ingenierı́a y ciencias. Octava edición . Cengage
Learnig 2010
4. Canavos George C. PROBABILIDAD Y ESTADÍSTICA, Aplicaciones y Métodos. Primera edición en
español, Mc Graw Hill 1987.
5. Levin Richard I. y Rubı́n David S. ESTADÍSTICA para ADMINISTRADORES. Sexta edición, Pren-
tice Hall.
6. Anderson David R. Sweeney Dennis J. Williams Thomas A. ESTADÍSTICA PARA ADMINISTRA-
CION Y ECONOMIA. Décima edición, Cengage Learnig.
6

7. Paul Newold, William L. Carlson y Betty Thorne. Estadı́stica para administración y economı́a. Sexta
edición. Prencice Hall.

You might also like