You are on page 1of 6

ANOVA

Qué es?
La técnica de técnicas denominada Análisis de la varianza (ANOVA), del acrónimo Analysis
of variance: ANalysis Of VAriance, tiene como objetivo básico la comparación de las medias
de más de dos poblaciones.
El nombre de Análisis de la varianza, sin embargo, no es muy afortunado. En el ANOVA se
comparan siempre las medias de varias poblaciones y se hace a través de un contraste de
hipótesis donde se analiza la varianza, es cierto; pero no sólo eso, porque también se analizan
las diferencias de medias que hay entre las muestras, y también, por supuesto, como siempre
en Estadística, se analiza el tamaño de muestra.
Compresión de su aplicación
Un factor en ANOVA es una variable cualitativa que genera o que contempla una serie de
poblaciones a comparar. A estos grupos o poblaciones que un factor delimita se les denomina
“niveles del factor”. Pe: Imaginemos que estamos comparando el peso de un tipo de insecto
en tres localidades distintas: diríamos que trabajamos con el factor localidad y que ese factor
tiene tres niveles: las tres localidades concretas. Veamos unos datos posibles y cómo estarían
estructurados:

Un factor puede ser fijo o aleatorio. Fijo es cuando los niveles que se estudian son los únicos
niveles que interesan. Aleatorio es cuando los niveles que se estudian es una muestra de
niveles. Lo que interesa, realmente, es decir cosas de una población de niveles, no de la
muestra de niveles que hemos seleccionado para el estudio.
Supongamos el siguiente ejemplo: Estamos estudiando la calidad del producto fabricado por
operarios en una empresa. Tenemos 50 operarios trabajando en la manufactura del producto
que comercializa nuestra empresa.
Supongamos que queremos comparar al operario A, que es de nuestra confianza, es una
referencia para nosotros, con los operarios B y C, que son operarios que queremos evaluar
expresamente porque creemos que no elaboran el producto con la calidad deseada. Para ello
se toma una muestra de cuatro productos fabricados por cada uno de estos tres operarios.
Estamos en un caso de un factor fijo (el factor operario), con tres niveles. El ANOVA a
utilizar sería, en este caso, un ANOVA de un factor a efectos fijos.
Supongamos que ahora lo que queremos es ver si entre los 50 operarios hay diferencias en
cuanto a la calidad del producto elaborado y no podemos estudiar producto de los 50
operarios. Entonces seleccionamos tres operarios al azar y tomamos una muestra de cuatro
productos fabricados por cada uno de esos tres operarios. Estamos ahora ante un caso de un
factor aleatorio (el factor operario), de donde hemos tomado una muestra de tres operarios al
azar. El ANOVA a utilizar sería, en este caso, un ANOVA de un factor a efectos aleatorios.
Pero aunque detrás tengamos una finalidad diferente, la estructura de los datos será la misma,
algo así como lo siguiente:

El ANOVA puede tener uno, dos, tres, cuatro, etc., factores. Sin embargo, lo más habitual es
tratar con un número reducido de factores. Y cada uno de esos factores puede ser fijo o
aleatorio.
La hipótesis
Recordemos que la hipótesis alternativa en el análisis de cada uno de los factores es “la no
igualdad de niveles”.
28. Pero esta “no igualdad” puede ser por motivos muy diferentes. La igualdad de la H0 es
sólo una, pero la desigualdad de la H1 puede tener paisajes muy diferentes. Supongamos, por
ejemplo, un factor con cuatro niveles. La aceptación de H1 puede ser porque los cuatro
niveles son diferentes o porque dos son iguales, los otros dos también y las diferencias se dan
entre esos dos grupos de niveles, etc.
En las técnicas de comparaciones existen diversos métodos a razón y elección del tipo de
comparación: LSD de Fisher, Bonferroni, HSD de Tuckey, Duncan, Newman-
Keuls, Scheffé (Ver Herbario de técnicas para ver en qué consisten cada una de ellas). Estas
son las más usadas y las más prestigiosas. Todas hacen lo mismo pero con distinto nivel de
conservadurismo. Unas ven antes que otras diferencias entre niveles. Sin embargo, cuando las
cosas son claras todas esas técnicas trazan el mismo dibujo de la hipótesis alternativa. Sólo
cuando hay dudas, cuando las diferencias no son muy claras, pueden aparecer diferencias.
Importante
El ANOVA necesita que se cumplan unas suposiciones. Básicamente tres: 1) Normalidad de
los datos. 2) Igualdad de varianzas. 3) Independencia de los datos. En la sección Herbario de
técnicas podrán verse las técnicas más usuales para comprobar estas suposiciones. El Test de
la ji-cuadrado de ajuste a una distribución, el Test de Kolmogorov de ajuste a la distribución
normal o el Test de Shapiro-Wilk, para la normalidad; el Test de Bartlett para la igualdad de
varianzas o el Test de Durbin-Watson para la independencia.

Tabla ANOVA

Suposiciones ANOVA
La variable respuesta sigue una distribución normal Normalidad
La varianza de la variable respuesta es la misma de todas las poblaciones homoceasticidad
Las observaciones deben ser independientes
Aleatorización: el procedimiento por el cual se asignan al azar los tratamientos a las unidades
experimentales.
Conceptos de la tabla ANOVA
SST: suma de cuadrados totales
SSttos: suma de cuadrados de tratamientos
SSE: suma de cuadrados del error

Para que se puede aplicar?


En ANOVA, como técnica de comparación que es, el objetivo es contrastar la Hipótesis nula
de igualdad de niveles de un factor versus la Hipótesis alternativa de no igualdad de esos
niveles. Esto se hace para cada factor contemplado en el ANOVA.

Explicación de ecuaciones y ejercicios de aplicación


Diseños balanceados

Ejercicios de aplicación

You might also like