You are on page 1of 23

i, j

Grficas de residuos
Contrastes de igualdad de varianzas

eij = y ij y ij = y ij i = y ij y i

VERIFICACION DE LAS HIPOTESIS


ESTIMADORES DE LAS PERTURBACIONES: LOS RESIDUOS

Independientes estre si E u ij u rk = 0 i r o j k
Distribucin sea Normal: u ij Distribucin Normal

La media sea cero: E u ij = 0 i, j


La varianza sea constante: Var u ij = 2

9Comprobar si las hiptesis bsicas del modelo estn o no en contradiccin con los
datos observados
HIPOTESIS DEL MODELO

DIAGNOSIS Y VALIDACION DEL MODELO

18

HOMOCEDASTICIDAD (VARIANZA CONSTANTE)

NORMALIDAD DE LOS RESIDUOS

INDEPENDENCIA DE LOS RESIDUOS

Si el modelo es apropiado para los datos, los residuos observados eij reflejarn las
propiedades exigidas a las perturbaciones ui j

DETECTAR GRAVES DESVIACIONES DE LAS HIPOTESIS SUPUESTAS EN EL MODELO

LOS MODELOS ANOVA SON RAZONABLEMENTE ROBUSTOS FRENTE A LIGERAS


DESVIACIONES DEL MODELO. POR LO TANTO EL PRINCIPAL OBJETIVO ES:

3) Si el modelo es el adecuado se realiza el anlisis estadstico de los datos y se evala el


grado de ajuste del modelo

2) Examinar la adecuacin del modelo planteado. Si el modelo no es el adecuado, tomar


medidas correctoras, como transformaciones de los datos, o modificar el modelo

1) Plantear un modelo que explique los datos

ESTUDIO DE UN EXPERIMENTO: PASOS A SEGUIR

19

TEST DE DURBIN-WATSON

Representacin de los residuos frente al orden en el que se recopilaron los datos y


buscar rachas de residuos de igual signo, as como cualquier tendencia creciente o
decreciente en los mismos, lo cual sera un claro indicio de correlacin entre los
trminos de error y el tiempo. Esto implica que la suposicin de independencia de los
residuos ha sido violada

GRFICO DE RESIDUOS EN FUNCIN DEL TIEMPO

INDEPENDENCIA DE LOS RESIDUOS

9 Si las hiptesis relativas al modelo son ciertas, los residuos variarn aleatoriamente.
Si, por el contrario, descubrimos que los residuos presentan tendencias sistemticas
inexplicadas, tendremos que sospechar de la validez del modelo

20

Representacin de la funcin de distribucin de una variable aleatoria X, N( m; s),


en una escala transformada apropiada de forma que la grfica quede linealizada. De
esta manera, si se disponen de datos extraidos aleatoriamente de esa distribucin, la
representacin en la escala transformada de la funcin de distribucin muestral no
debe separarse grficamente de la linea recta terica

GRFICO PROBABILSTICO NORMAL (Q-Q-PLOT)

anmalos (outliers)

9 Discrepancias: valores muy distanciado de los dems. Suelen corresponder a datos

Los residuos deben tener la apariencia de una distribucin normal centrada en cero

HISTOGRAMA

NORMALIDAD DE LOS RESIDUOS

21

Esta grfica, como la anterior, no es slo til para comprobar si los residuos son
independientes de estas variables de inters, sino tambin para examinar si la varianza
de los trminos de error es constante

INTERS

GRFICO DE LOS RESIDUOS EN FUNCIN DE CIERTAS VARIABLES DE

Viola la hiptesis si, por ejemplo, este grfico tiene forma de embudo, que pone de
manifiesto un aumento o disminucin de los errores en funcin de los niveles del
factor. El modelo no es el adecuado

GRFICO DE LOS RESIDUOS FRENTE A LOS VALORES AJUSTADOS

HOMOCEDASTICIDAD (VARIANZA CONSTANTE)

22

Para a lg n par ( i, j )

TEST DE BARLETT

Tamaos de muestras cualesquiera

TEST DE HARTLEY

TEST DE COCHRAN

Tamaos de muestras iguales

H1 = i j

H 0 = 1 = 2 = .... = I

CONTRASTES DE IGUALDAD DE VARIANZAS

23

I
s i2
i =1

max s i2

(
)
H=
min ( s i2 )

C=

( )

max s i2

Si H exp > H 1 ; I Se rechaza H 0

Si H exp H 1 ; I Se acepta H 0

TEST DE HARTLEY

Si C exp > C1 ; I Se rechaza H 0

Si C exp C1 ; I Se acepta H 0

TEST DE COCHRAN

24

I
1
1
1
n

I
(
)
(
)
i =1 i

Si Bexp > 2 ; I 1 Se rechaza H 0

Si Bexp 2 ; I 1 Se acepta H 0

1
C = 1+
3 ( I 1)

I ( n 1) s 2

1
i
i
I
B = ( N I ) ln i =1
( ni 1) ln s i2
i =1

C
N I

TEST DE BARLETT

I21

25

6
5
5
4
6
26

1
2
3
4
5

50
57
48
47
45

yi
0.80
3.00
13.5
4.67
2.80

s i2
1/5
1/4
1/4
1/3
1/5
37/30

( ni 1) 1

26

1
[ 21 ln ( 4.67 ) 23.45] = 8.11
1.099

-1.11
4.39
10.41
4.62
5.14
23.45

( ni 1) ln s i2

Bexp = 8.11 < 0.05;4 = 9.49

Bexp =

4
12
54
14
14
98

( ni 1) s i2

No se rechaza la hiptesis nula e


Se acepta que las varianzas de los cinco telares son iguales

2
= 0.05 0.05;4
= 9.49

1 37 1
C = 1+
= 1.099

3 ( 4 ) 30 21

ni

Telares

Ejemplo
Consideramos el ejemplo de la compaa textil.

METODO DE DUNNETT

METODO DE SCHEFFE

METODO DE NEWMAN-KEULS

METODO DE RANGOS MULTIPLES DE DUNCAN

METODO DE TUKEY O METODO HSD

METODO DE BONFERRONI

METODO DE LA DIFERENCIA MINIMA SIGNIFICATIVA (LSD)

PROCEDIMIENTOS ANALITICOS

PROCEDIMIENTOS GRAFICOS

9 OBJETIVO FUNDAMENTAL: Comparar entre s medias de tratamientos o grupos


de ellas

Tcnicas cuyo objetivo es identificar qu tratamientos son estadsticamente diferentes


entre s (Modelo de efectos fijos)

COMPARACIONES MULTIPLES

27

BASADAS EN LA DISTRIBUCION t DE STUDENT

t=

. .

1
2 1

SR +
n n
j
i

yi y j

t N I

ni y nj: N de observaciones
N - I : Gr.de libertad de la varianza residual

Si el intervalo no contiene al cero, rechazamos H0

( ( y i. y j.) LSD ; ( yi. y j.) + LSD )

Intervalos de Confianza para Diferencias de Medias

1
2 1

LSD = t 2; N I S R
+
n n
j
i

Las medias mi y mj son estadsticamente diferentes si: y i y j > LSD

Estadstico de contraste :

Se basa en la construccin de test de hiptesis para la diferencia de cualquier par de medias

METODO LSD (MINIMA DIFERENCIA SIGNIFICATIVA)

COMPARACIONES

28

LSD = 2.08 4.67 1 6 + 1 4 = 2.898

2) Comparamos las medias 2 y 3, etc

Tambin hay diferencia entre la 1 y la 4 y entre la 1 y la 5

y 5 y 3 = 45 48 = 3 > LSD Hay diferencia significativa entre ellas

LSD = 2.08 4.67 1 6 + 1 5 = 2.718

Comparamos las medias 1 y 3

y 5 y 4 = 45 47 = 2 < LSD No hay diferencia significativa entre ellas

S R2 = 4.67 con 21 G.L.

= 0.05, t 0.025;21 = 2.08

1) Comparamos las medias 1 y 2

n1 = n5 = 6; n 2 = n3 = 5; n 4 = 4,

y 5 = 45; y 4 = 47; y 3 = 48; y1 = 50; y 2 = 57;

Ejemplo

29

() ()

1 1

BSD = t 0.025 10; 21 4.67 + = ( 3.135 )(1.394 ) = 4.37


6 4

y 5 y 4 = 45 47 = 2 < BSD No hay diferencia significativa entre ellas

Ejemplo. Comparamos las medias 5 y 4


y 5 = 45; y 4 = 47; n5 = 6; n 4 = 4; M = I = 5 = 5 4 2 = 10
2
2

BSD = t 2 M

y i y j > BSD

1
2 1

SR +
n n
j
i

Se rechaza H 0 : i j = 0 si :

= M ; M = 2I nmero de comparaciones posibles

()

En este procedimiento se fija un nivel de significacin  que se reparte entre


cada una de las comparaciones consideradas

METODO DE BONFERRONI

30

.
HSD = q ; I , N I

nh

2
S R

Modelo no equilibrado : n h =

Modelo equilibrado : n h = n

2 1
i =1 n
i

q ; I , N I es el punto crtico del rango estudentizado


Los valores crti cos estn tabulados

y i y j > HSD,

Se rechaza H 0 : i j = 0 si

METODO DE TUKEY O METODO HSD

BASADAS EN EL RANGO ESTUDENTIZADO:


TESTS DE RANGOS MULTIPLES

COMPARACIONES

31

( )

Con esta prueba se obtienen los mismos resultados que con el procedimiento de Bonferroni

No hay diferencia significativa entre ellas

2 1
i =1 n
i

y 5 y 4 = 45 47 = 2 < HSD

Comparamos las medias 5 y 4

nh

= 0.05, q 0.05;5,21 = 4.22

Modelo no equilibrado : n h =

4.67 1 1
HSD = 4.22
+
= 4.161
2 6 4

HSD = q ; I , N I

2
S R

n1 = n5 = 6; n 2 = n3 = 5; n 4 = 4,

y 5 = 45; y 4 = 47; y 3 = 48; y1 = 50; y 2 = 57

Ejemplo

32

R p = q ; p, N I
p

nh

p = 2,3,...I

media mayor y la menor de p medias. Los valores crticos para p = 2,3,...,I, estn
tabulados
p es el nivel de significacin conjunto relativo a p medias consecutivas; es decir, es la
probabilidad de rechazar errneamente al menos una de las p - 1 comparaciones
independientes asociadas a las medias consideradas. p = 1 (1 ) p 1

q ; p, N I es el punto crtico del rango estudentizado basado en la comparacin de la


p

y sern consideradas iguales tambin todas las medias comprendidas entre ellas

yi y j R p ,

SR

La aplicacin es secuencial, en el sentido de no utilizar un nico valor crtico para


todas las diferencias de medias, como el de Tukey, sino un valor crtico que depende
del nmero de medias comprendido entre las dos medias que se comparan, habiendo
ordenado previamente las medias en orden creciente
Se acepta que no hay diferencia significativa entre la media mayor y la media menor de
p medias, si se verifica
2

METODO DE RANGOS MULTIPLES DE DUNCAN

33

= 0.10

= 0.142

q = q ( 0.05; 5, 21) = 3.24

= q ( 0.05; 4, 21) = 3.17

q = q ( 0.05; 3, 21) = 3.09

= 0.1855

= q ( 0.05; 2, 21) = 2.94

5 = 1 1 0.05

Si comparamos parejas de medias separadas por tres media, el nivel de significacin


conjunto es
(
) 51

4 = 1 1 0.05

Si comparamos parejas de medias separadas por dos media, el nivel de significacin


conjunto es
(
) 41

3 = 1 1 0.05

Si comparamos parejas de medias separadas por una media, el nivel de significacin


conjunto es
(
) 31

2 = 1 (1 0.05 ) 21 = 0.05

Si comparamos parejas de medias adyacentes, el nivel de significacin conjunto es

y 5 = 45; y 4 = 47; y 3 = 48; y1 = 50; y 2 = 57; S R2 = 4.67 con 21 G.L.


n1 = n5 = 6; n 2 = n3 = 5; n 4 = 4, = 0.05

Ejemplo

34

1 1
5 vs 1: q 4 2.33 + = 2.793
6 6

1 1
5 vs 3: q 3 2.33 + = 2.856
6 5

1 1
5 vs 4 : q 2 2.33 + = 2.896
6 4

1 1
4 vs 2 : q 4 2.33 + = 3.245
4 5

y 4 y 2 = 10 > 3.245 ( )

y 5 y 4 = 2 < 2.896

y 5 y 3 = 3 > 2.856 ( )

y 5 y1 = 5 > 2.793 ( )

y 5 y 2 = 12 > 2.994 ( )

1 1
5 vs 2 : q 5 2.33 + = 2.994
6 5

35

.
K p = q ; p, N I
nh

p = 2,3,...I

media mayor y la menor de p medias. Los valores crticos para p = 2,3,...,I, estn
tabulados

q ; p, N I es el punto crtico del rango estudentizado basado en la comparacin de la

yi y j K p ,

2
S R

Se acepta que no hay diferencia significativa entre la media mayor y la media menor
de p medias, si se verifica

Al igual que el contraste de Duncan, es un procedimiento iterativo y, desde el punto


de vista operacional, es similar a dicho mtodo

METODO DE NEWMAN-KEULS

36

i ai = 0

C > S C ( I 1) F ; I 1, N I ;

S C =

no contiene al cero, es decir, si

I a2
2
i
S R
n
i =1 i

I = C S C ( I 1) F ; I 1, N I ; C + S C ( I 1) F ; I 1, N I

C = ai i ;
i

Rechazamos H0 si el intervalo de confianza

H1 : C 0

H0 :C = 0

Objetivo: Realizar el contraste

Mtodo para realizar cualquier contraste entre medias de tratamientos

METODO DE SCHEFFE

37

S C =

= 0.05,

F0.05; 4, 21 = 2.84

5 a2
1 1 1 1
2

i
SR
= 4.67 + + + = 1.912
n
6 5 4 6
i =1 i

No es significativamente distinto de cero

C = 1 + 3 4 5

4 2.84 ;6 + 1.912 4 2.84 ) = ( 0.44; 12.44 )

El intervalo contiene al cero e

( 6 1.912

I = C S C ( I 1) F ; I 1, N I ; C + S C ( I 1) F ; I 1, N I

C = y1 + y 3 y 4 y 5 = 50 + 48 47 45 = 6

C = 1 + 3 4 5

Ejemplo

)=

38

i = 1, 2,..., I 1

. .

1
2 1
y i y I > d ; I 1, N I S R +

n
n
I
i

La pareja de medias mi y mj se consideran diferentes, a un nivel de significacin


conjunto  asociado a las I -1 comparaciones, si

H 0 : i = I
H1 : i I

Si el control es el tratamiento I, se desean probar las hiptesis

Uno de los tratamientos es un control y el experimentador puede estar interesado en


comparar los restantes tratamientos con este control

METODO DE DUNNETT

COMPARACIONES DE TRATAMIENTOS CON UN CONTROL

39

1 1
3 vs 1: 2.64 4.67 + = 3.454
5 6

Asi se continua con 4 vs 1 y 5 vs 1. Resultando que las parejas de medias 2 vs 1 y


5 vs 1 resultan significativamente diferentes

y 3 y1 = 2 < 3.454

d 0.05; 4, 21 = 2.64

y 2 y1 = 7 > 3.454

= 0.05,

1 1
2 vs 1: 2.64 4.67 + = 3.454
5 6

1
2 1
d ; I 1, N I S R +

ni n I

Supongamos que el control es el tratamiento 1

y 5 = 45; y 4 = 47; y 3 = 48; y1 = 50; y 2 = 57


n1 = n5 = 6; n 2 = n3 = 5; n 4 = 4

Ejemplo

40