You are on page 1of 45

ANALISIS DE

VARIANZA
(ANOVA)
MG.ING.ESTAD.VILLENA ZAPATA, LUIGI

DEFINICIONES
Factor:
Es la caracterstica que diferencia a los
tratamientos o poblaciones entre s.
Niveles:
Los diferentes tratamientos o poblaciones.

DEFINICIONES

CUALITATIVO
FACTOR
CUANTITATIVO

Los niveles corresponden


a posibles categoras del
factor.
Los niveles identifican
diferentes ajustes del
factor.

DISEO DE EXPERIMENTOS
Consiste en el estudio del efecto que
distintas situaciones experimentales tienen
sobre ciertas respuestas cuantitativas de
unidades experimentales en observacin.

DISEO DE EXPERIMENTOS
1.- Un experimento para estudiar los efectos
de cinco marcas de gasolina en el
desempeo de un motor de automvil
(mpg).
Factor: Marcas de gasolina.
Tipo: Cualitativo
Niveles: Cinco marcas de gasolina.
Variable respuesta: Desempeo de un
motor (mpg)

DISEO DE EXPERIMENTOS
2.- Un experimento para estudiar los efectos de
la presencia de cuatro soluciones azucaradas
(glucosas, sacarosa, fructuosa y una mezcla de
las tres) en el desarrollo bacteriano.
Factor: Soluciones azucaradas.
Tipo: Cualitativo
Niveles: Glucosa, Sacarosa, Fructuosa y una
mezcla de las tres).
Variable respuesta: El desarrollo bacteriano.

DISEO DE EXPERIMENTOS
3.- Un experimento para investigar si la
concentracin de madera dura en la
pulpa (5%, 10%, 15% y 20%) tiene un efecto
en la resistencia a la tensin de bolsas
hechas de pulpa.
Factor: Concentracin de madera dura.
Tipo: Cuantitativo
Niveles: 5%, 15%, 10% y 20%.
Variable respuesta: Resistencia a la tensin.

DISEO DE EXPERIMENTOS DE
UN FACTOR
Los que deseamos probar es si la media de
cada
nivel
del
factor
(de
cada
tratamiento) es igual para todos, o bien, si
el efecto de cada nivel del factor es nulo
sobre la verdadera media poblacional, es
decir:

H 0 : 1 2 ... k
H 0 : 1 2 ... k 0

DISEO DE EXPERIMENTOS DE
UN FACTOR
La hiptesis alternativa es que al menos
una de las verdaderas medias de los
tratamientos difiere de las dems.

H1:Por lo menos dos de las i son diferentes, i j ,i j


H1:Al menos un i ,no es igual a cero, i 0

DISEO DE EXPERIMENTOS DE
UN FACTOR
Entonces la pregunta natural es: Por qu
el procedimiento se llama Anlisis de
varianza y no anlisis de medias, si
hacemos inferencia sobre las medias?

MUESTRAS CON GRAN


VARIACIN DENTRO

MUESTRAS CON PEQUEA


VARIACIN DENTRO

IMPORTANTE
Para

determinar si las medias difieren


entre si nos basamos en su dispersin o
VARIANZA.
Las medias difieren entre si, cuando la
dispersin entre los tratamientos es mayor
que la dispersin dentro de cada grupo.

DISEO DE EXPERIMENTO DE
UN FACTOR
Modelo estadstico lineal:

Yij i eij
Tambin puede escribirse:

i 1,2,..., k
j 1,2,..., n
n n1 n2 ... nk

Yij i eij

i i , es el efecto en Y que produce el i-simo tratamiento.

DISEO DE EXPERIMENTO DE
UN FACTOR
Los
efectos
de
los
tratamientos
corresponden a desviaciones respecto a la
media global . Luego:
k

i 1

Entonces la prueba de
definida por:

hiptesis est

H 0 : 1 2 ... k 0
H1 : i 0 al menos para una i

DISEO DE EXPERIMENTO DE
UN FACTOR
H 0 : 1 2 ... k 0
H1 : i 0 al menos para una i

DISEO DE EXPERIMENTO DE
UN FACTOR
Tambin puede escribirse:

Yij i eij

Requisitos del modelo


1.- Normalidad en cada nivel de factor.
2.- Homocedasticidad (igual varianza en
cada nivel de factor)
3.- Independencia de las observaciones:
residuos aleatorios.
H0: 1= 2= = n
H1: alguna i es distinta

Tipos de experimentos
completamente aleatorizados
T.E.C.A

MODELO A
EFECTOS
FIJOS
Las conclusiones obtenidas no
pueden
extenderse
a
tratamientos similares que no
fueron considerados en el
experimento. (Los tratamientos
no constituyen una muestra
aleatoria)

MODELO A
EFECTOS
ALEATORIOS
Las conclusiones obtenidas
pueden
extenderse
a
tratamientos similares que no
fueron considerados en el
experimento. (Los tratamientos
constituyen
una
muestra
aleatoria)

VARIABLIDAD TOTAL
DE LOS DATOS

VARIABILIDAD DEBIDO
AL TRATAMIENTO
(VARIABILIDAD ENTRE)

VARIABILIDAD
INHERENTE DE LOS
DATOS (VARIABILIDAD
DENTRO)

SCT SCA SCE

DISEO DE EXPERIMENTO DE
UN FACTOR
Las sumas de cuadrados del total, de los
tratamientos y del error se calculan aplicando
las siguientes equivalencias:
k

SCT Y

2
ij

i 1 j 1
k

Yi.

i 1

ni

SCA

Y..

ni

Y..

SCE SCT SCA

SCT, es denominada
tambin suma de
cuadrados corregida.

TABLA ANOVA
Fuente de
Suma de
Variacin Cuadrados
Tratamientos
SCA
o Factor

Grados de
Medias
Libertad Cuadrticas

Razn F
calculada

k-1

MCA

MCA
SCA
Fcal
MCE
k 1

MCE

SCE
nk

Error

SCE

n-k

Total

SCT

n-1

RC Fcal c, c F1- ,k-1,n-k

Ejemplo
La siguiente tabla presenta los resultados de un
experimento ANOVA unifactorial que implica
I=4 tipos de cajas (incluye las medias y
desviaciones estndar).

Establezca las hiptesis.


Realice un grfico de caja y comente los
resultados.

Ejemplo
H 0 : 1 2 3 4
H1 : i j ; i j
i denotamos la resistencia a la
Con
comprensin promedio de las cajas de tipo i
(1,2,3,4).

Ejemplo

La grfica de caja comparativa para las cuatro muestras, muestra


que existe una cantidad sustancial de traslape entre las
observaciones de las tres primeras cajas, pero las resistencias a la
compresin del cuarto tipo parecen considerablemente ms
pequeas que para los dems tipos. Esto sugiere que Ho es falsa.

Ejemplo
Un ingeniero va a decidir la compra de una de
4 mquinas de marcas diferentes para su uso
en una produccin especfica. Por esto, utiliz
cada mquina al azar para procesar 6
unidades del producto registrando los tiempos
por unidad, en segundos, resultando as el
experimento completamente aleatorio. Los
datos
observados
de
las
4
muestras
independientes se listan en la siguiente tabla:

Ejemplo

Ejemplo
1.- Identifique el factor, tipo, niveles y variables
respuesta.
2.- Establezca las respectivas hiptesis.
3.- Establezca el modelo del ANOVA.
4.- Realice un anlisis descriptivo de las muestras
utilizando una grfica de lneas de las medias de las
muestras as como un grfico de caja, con el
objetivo de ver si existen indicios de medias
poblacionales distintas.
5.- Con un nivel de significacin de 0.05 pruebe la
hiptesis que las mquinas utilizan la misma
velocidad media para procesar el producto.

Use el anlisis de varianza (ANOVA) para determinar si existe un


efecto de la concentracin de madera dura en la resistencia del
papel.

ANLISIS DE VARIANZA DE UN FACTOR:


DISEO POR BLOQUES ALEATORIZADOS
En el diseo de un experimento estadstico
aleatorizado por bloques, el objetivo es
comparar los efectos de k niveles de un
factor A (tratamientos) en la variabilidad
de la variable dependiente Y cuando se
cree que existe una fuente extraa no
evitable de variabilidad adicional de r
bloques.

ANLISIS DE VARIANZA DE UN FACTOR:


DISEO POR BLOQUES ALEATORIZADOS
Es decir, se trata de determinar si existen
diferencias significativas en el valor medio
de la variable dependiente Y bajo los k
tratamientos del factor A, pero controlando
mediantes bloques la fuente extraa de
variabilidad.
Los
bloques
no
son
considerados como otro factor.

ANLISIS DE VARIANZA DE UN FACTOR:


DISEO POR BLOQUES ALEATORIZADOS
Los k tratamientos se asignan al azar a las
unidades experimentales dentro de cada
bloque asignndose un tratamiento a una
unidad experimental.

ANLISIS DE VARIANZA DE UN FACTOR:


DISEO POR BLOQUES ALEATORIZADOS
Un ejemplo tpico del diseo aleatorizado
por bloques, utilizando tres tratamientos T1,
T2, T3, asignados al azar a cuatro bloques,
es como sigue:
Bloque 1

Bloque 2

Bloque 3

Bloque 4

T3
T2
T1

T2
T1
T3

T1
T3
T2

T3
T1
T2

ANLISIS DE VARIANZA DE UN FACTOR:


DISEO POR BLOQUES ALEATORIZADOS
Los datos
Si se denota por Y a la variable
dependiente
en
estudio,
una
vez
terminado el experimento, los datos se
registran en un arreglo 4*3 como se indica
en el cuadro siguiente:
Donde, Y11 denota
el resultado que se
obtiene utilizando
el tratamiento 1 en
el bloque 1.

ANLISIS DE VARIANZA DE UN FACTOR:


DISEO POR BLOQUES ALEATORIZADOS
El modelo del anlisis de un factor por
bloques es la ecuacin lineal:

Yij i j ij
Media total

i Efecto del i-simo tratamiento A sobre Y.


j Efecto del j-simo bloque B sobre Y.

eij Error aleatorio, se sup one eij independientes y normales N 0 , 2

ANLISIS DE VARIANZA DE UN FACTOR:


DISEO POR BLOQUES ALEATORIZADOS
Se realiz un estudio para comparar el
rendimiento de cinco variedades de arroz (A1,
A2, A3, A y A5). Para el experimento, se
disponan de cuatro lugares de siembra de
igual tamao y fertilidad en San Martn. Cada
lugar fue dividido en cinco parcelas iguales y se
sembr las 5 variedades de arroz en las cinco
parcelas
de
cada
lugar,
asignado
aleatoriamente, una variedad a una parcela,
consiguiendo as, un diseo experimental
aleatorizado por bloques.

ANLISIS DE VARIANZA DE UN FACTOR:


DISEO POR BLOQUES ALEATORIZADOS
Se registraron los siguientes rendimientos en
cientos de kilogramos:

ANLISIS DE VARIANZA DE UN FACTOR:


DISEO POR BLOQUES ALEATORIZADOS
a)

b)

Es vlida la conclusin de que no


existen diferencias significativas en los
rendimientos de las cinco variedades de
arroz? Use el nivel de significacin
alfa=0.05.
Fue este diseo por bloques el
adecuado para la experimentacin?

ANLISIS DE VARIANZA DE UN FACTOR:


DISEO POR BLOQUES ALEATORIZADOS
c) Si existen diferencias significativas en los
rendimientos de las 5 variedades de
arroz, cul variedad rinde ms?, cul
variedad rinde menos? Use tanto la
prueba de rangos de Duncan con alfa
0.05.

ANLISIS DE VARIANZA DE UN FACTOR:


DISEO POR BLOQUES ALEATORIZADOS
Antes de contestar las preguntas identifica
los siguiente:
La variable dependiente:
Yij=_______________________________________
El factor:
__________________________________________
Los bloques:
__________________________________________

ANLISIS DE VARIANZA DE UN FACTOR:


DISEO POR BLOQUES ALEATORIZADOS
El modelo de este diseo de experimentos:
__________________________________________
Donde:

i
j

i 1,
j 1,

ANLISIS DE VARIANZA DE UN FACTOR:


DISEO POR BLOQUES ALEATORIZADOS
Completa el siguiente cuadro de doble
entrada:
Variedades de arroz
Bloques
(Lugares)
1
2
3
4
Yij

A1

A2

A3

A4

A5