You are on page 1of 7

ANLISIS DE LA VARIANZA CON UN FACTOR (ANOVA)

El anlisis de la varianza permite contrastar la hiptesis nula de que las medias de K


poblaciones (K >2) son iguales, frente a la hiptesis alternativa de que por lo menos
una de las poblaciones difiere de las dems en cuanto a su valor esperado. Este
contraste es fundamental en el anlisis de resultados experimentales, en los que
nteresa comparar los resultados de K 'tratamientos' o 'factores' con respecto a la
variable dependiente o de inters.

El Anova requiere el cumplimiento de los siguientes supuestos:


Las poblaciones (distribuciones de probabilidad de la variable dependiente
correspondiente a cada factor) son normales.
Las K muestras sobre las que se aplican los tratamientos son independientes.
Las poblaciones tienen todas igual varianza (homocedasticidad).

El ANOVA se basa en la descomposicin de la variacin total de los datos con respecto


a la media global (SCT), que bajo el supuesto de que H0 es cierta es una estimacin
de 2 obtenida a partir de toda la informacin muestral, en dos partes:
Variacin dentro de las muestras (SCD) o Intra-grupos, cuantifica la dispersin
de los valores de cada muestra con respecto a sus correspondientes medias.
Variacin entre muestras (SCE) o Inter-grupos, cuantifica la dispersin de las
medias de las muestras con respecto a la media global.

Las expresiones para el clculo de los elementos que intervienen en el Anova son las
siguientes:

Media

Global:

Variacin Total:

Variacin Intra-grupos:

Variacin Inter-grupos:

Siendo xij el i-simo valor de la muestra j-sima; nj el tamao de dicha muestra y


su media.

Cuando la hiptesis nula es cierta SCE/K-1 y SCD/n-K son dos estimadores


nsesgados de la varianza poblacional y el cociente entre ambos se distribuye segn
una F de Snedecor con K-1 grados de libertad en el numerador y N-K grados de
ibertad en el denominador. Por lo tanto, si H0 es cierta es de esperar que el cociente
entre ambas estimaciones ser aproximadamente igual a 1, de forma que se
echazar H0 si dicho cociente difiere significativamente de 1.

La secuencia para realizar un ANOVA es:

Analizar

Comparar medias

ANOVA de un factor

Se abre el siguiente cuadro de dilogo:

Se selecciona la variable que se considera Dependiente y la variable Factor y con el

botn Opciones se activan Estadsticos Descriptivos y Homogeneidad de varianzas.

Al aceptar en el visor de resultados aparecen los siguientes cuadros:


Descriptivos. Recoge la media, la desviacin tpica, el intervalo de confianza del
95% (por defecto) para la media correspondientes a la variable dependiente
para cada uno de los grupos definidos por el factor.
Prueba de homogeneidad de varianzas. Contiene el valor del estadstico de
Levene del contraste de la hiptesis de homocedasticidad con el nivel de
significacin crtico.
ANOVA. Contiene las sumas de cuadrados inter-grupos, intra-grupos y total, sus
correspondientes grados de libertad y el valor del estadstico de prueba F junto
con el nivel de significacin crtico.

Como complemento grfico de este anlisis, para obtener una primera aproximacin
acerca de si es razonable o no la hiptesis nula, se selecciona Grficos > Barras de
error y se activa la opcin Simple. Con el botn Definir se abre el siguiente cuadro de
dilogo:

Se selecciona en Variable la variable dependiente del ANOVA y en el Eje de


categoras la
variable
factor.
El
intervalo
de
confianza
para la media se calcula por defecto al 95% de confianza. Al aceptar aparece en el
visor de resultados los puntos que representan a la media de cada grupo junto con
os lmites del correspondiente intervalo de confianza para la media poblacional. Si los
puntos que representan las medias estn desigualmente distribuidos en el grfico se
iene un indicio de que a nivel poblacional no puede sostenerse la hiptesis de
gualdad de medias; es decir, por lo menos uno de los niveles del factor influye
significativamente sobre la variable dependiente.

EJEMPLOS
Con los datos de la encuesta sobre transporte, Enctrans.sav, razonar si puede
aceptarse que el tipo de transporte utilizado, Trans, influye sobre la variable tiempo.

Con la opcin de men Grficos > Barras de error > Simple y con el botn Definir se
selecciona como Variable Tiempo y en Eje de categoras la variable Trans; al aceptar
se obtiene la siguiente representacin grfica:

Como puede observarse, los puntos que representan a las medias de cada grupo
aparecen dispersos a diferentes niveles; sobre todo la media del grupo definido por el
actor Tren. El intervalo de confianza para la media correspondiente al grupo definido
por el factor Metro est contenido dentro del intervalo correspondiente al grupo
definido por el factor Bus, as como, el intervalo correspondiente al factor Coche est
contenido dentro de los intervalos correspondientes definidos por los factores Metro y
Otros. El grfico, por tanto, parece sugerir no una nica poblacin sino tres
poblaciones con distintas medias.

Para realizar el anlisis de la varianza propiamente dicho la secuencia es Analizar >


Comparar medias > ANOVA de un factor. En el cuadro de dilogo se selecciona
Tiempo como variable Dependiente y Trans como Factor. Para contrastar la hiptesis
de igualdad de varianzas se abre con el botn correspondiente el cuadro de
dilogo ANOVA de un factor: Opciones y se activa Homogeneidad de varianzas. Si se
desea un anlisis descriptivo del comportamiento de la variable dependiente dentro
de cada grupo se activa tambin la opcin Descriptivos. Al aceptar se obtienen los
siguientes cuadros de resultados:

Este cuadro contiene un anlisis descriptivo de la variable dependiente por grupos, as


como, los lmites superior e inferior para la media de cada grupo al 95% de confianza.

El estadstico de Levene toma un valor lo suficientemente pequeo para no rechazar


a hiptesis de homocedasticidad a los niveles de significacin habituales.

En el cuadro de resultados del ANOVA, el valor del estadstico de prueba, F=6,450, es


significativamente distinto de 1 para cualquier nivel de significacin y, por lo tanto, se
echaza la hiptesis nula de igualdad de medias y queda confirmada la primera
mpresin proporcionada por el grfico de barras de error.

You might also like