Professional Documents
Culture Documents
TEMA
:
HOMOGENEIDAD DE VARIANZAS
ASIGNATURA :
Anlisis y diseos experimentales I
DOCENTE
:
Dr. Cosme Correa Becerra
INTEGRANTES :
Arechaga Floreano, Luis David
Montalbn Quispe, Iris Susana.
.
CICLO
:
VIII
HOMOGENEIDAD DE VARIANZAS
Introduccin:
Uno de los supuestos que ms se requieren en aplicaciones estadsticas
populares, tales como el anlisis de varianza, el anlisis de regresin, etc., es
el de la homogeneidad de varianzas. Este supuesto es crucial para garantizar
la calidad de los procedimientos estadsticos utilizados tanto en pruebas de
hiptesis como en la construccin de intervalos de confianza.
Existen muchas pruebas para verificar si el supuesto de homogeneidad es
plausible o no, pero, dada la complejidad del problema, no es posible realizar
estudios comparativos entre ellas que sean exhaustivos, ni de su
comportamiento para muestras pequeas, ya que muchas de ellas son de
carcter asinttico. En este trabajo estudiamos el nivel real de significancia, el
cual es la verdadera probabilidad de rechazar la hiptesis nula cuando es cierta
y que en pruebas no exactas es diferente del nivel nominal, o terico, de
significancia, determinado por el usuario, usualmente a niveles del 5% u otros
valores pequeos. Adems, se estudia la potencia de las pruebas bajo algunas
alternativas abajo enunciadas.
En esta simulacin se quiere comparar la prueba de Bartlett, la prueba de
Levene (Brown & Forsythe 1974), la prueba de Hartley (1950), la prueba de
Cochran (1941), la prueba de Fligner & Killeen (1976), la prueba basada en la
teora de la informacin, la prueba de Layard y algunas de sus variaciones, por
medio de la potencia que cada prueba tenga con respecto a diferentes
hiptesis alternas.
Los datos con los que se trabajaran las diferentes pruebas son:
55
60
64
42
46
58
62
45
45
68
51
52
73
58
57
44
Notacin
La notacin utilizada en el presente artculo ser la siguiente:
k = Nmero de muestras
50
63
65
42
63
52
68
56
H 0= 21= 22 == 2k
H 0= 21 22 2k
1.
PRUEBA DE LEVENE
El estadstico de prueba de Levene se define como:
k
( Nk ) n ( Z i . Z .. )
i=1
W=
ni
(k1) ( Z ij Z i . )
i=1 j=1
Donde
Zij=|X ij X i .|
Donde
X i .
Z .. , es la media global de
subgrupo de los
y Zi .
, es la media del
i -simo
Z ij
NK
de la distribucin
grados de libertad en el
Tratamiento
s
X i . )
T1
55
46
45
73
50
63
T2
60
58
68
58
63
52
T3
64
62
51
57
65
68
T4
42
45
52
44
42
56
Para
cada
2. Ahora
calculamos
Zij=|X ij X i .|
Z ..
Z ij
0.33
33
0.16
67
2.83
33
4.83
33
9.33
33
1.83
33
0.83
33
1.83
33
Z ij
variable tambin
Z ij
Z ij
Z i .
5.33
33
3.16
67
3.83
33
4.83
33
7.66
67
7.83
33
6.83
33
9.16
67
8.44
44
3.83
33
4.77
78
4.77
78
Z ij
55.333
3
59.833
3
61.166
7
46.833
3
Z ..
( Z i. Z ..)
2
n ( Z i . Z ..)
,
T1
T2
T3
T4
10.33
33
8.166
7
10.16
67
5.166
7
17.66
67
1.833
3
4.166
7
2.833
3
5.45
83
5.45
83
5.45
83
5.45
83
8.9169
48.6712
2.6406
14.4134
0.4632
2.5281
0.4632
2.5281
68.1407
TOTAL
Zij
k
cuadrado se obtiene
le restamos
ni
( Z ij Z i . ) =
i=1 j=1
Z i .
307.8889.
2
( Nk ) n ( Z i . Z .. )
W=
i=1
ni
2
(k1) ( Z ij Z i . )
i=1 j=1
W=
2068.1407
3307.8889 .
y elevamos al
W =1.4754
5.
F0.05,3,20 =3.0984
Buscamos en la tabla
W < F 0.05,3,20
2.
PRUEBA DE HARTLEY
Fmx
Fue propuesta por Hartley (19401950). Asume que las poblaciones son
normales e independientes y los tamaos de las muestras son iguales.
El estadstico de prueba es:
Fmx =
mx { s^ 2i }
mn {s^ 2i }
Fmx
MQUINA
60
58
68
64
62
51
42
45
52
VARS
73
50
63
118.66666
7
58
63
52
28.966666
7
57
65
68
38.166666
7
44
42
56
33.766666
7
118.66666
7
4.0966628
3
5
Mnimo
28.966666
7
5.192167
77
3.
PRUEBA DE COCHRAN
El estadstico de prueba viene dado por:
2
g=
max ( s i )
k
s 2i
i=1
mayor de los ni puede usarse en lugar de n para determinar los grados de libertad. La
prueba de Cochran es en particular til para detectar si una varianza es mucho ms
grande que las otras.
1 Calcular las varianza por mquina
VARS
55
46
45
73
50
63
118.666667
MQUINA
60
58
68
58
63
52
28.9666667
64
62
51
57
65
68
38.1666667
42
45
52
44
42
56
33.7666667
118.666667
0.54045848
SUMA(VAR-S)
219.566667
4.
xi|
|x ij ~
ni observaciones de la poblacin i.
~
x i es la
2 Defina
1
N ,i=
( 12 + 2( Ni+ 1) )
a
Donde
Para i=1,, N
a z
3 Sea
a i=
j Gi
Donde
aN , j
ni
i=1, , k .
Entonces:
N
a =
j=1
aN , j
aN , j
N j G ni
i
ni ( a ia )2
i =1
x=
( a N , J a )2 /(n1)
j=1
H0
se distribuye aproximadamente
x k1
52.5
59
63
44.5
2.5
0.5
7.5
0.5
2.5
11.5
ORDENAMIENTO
5
5
20
5
13
17
5
5
23
15
8
14
10.5
1.5
18.5
1.5
10.5
22
0.2533471
0.2533471
0.55338472
0.91536509
0.2533471
0.2533471
0.07526986
1.12639113
1.28155157
1.75068607
1.12639113
2.05374891
0.2533471
0.84162123
0.07526986
0.55338472
0.70630256
0.41246313
0.55338472
1.40507156
0.99445788
0.77219321
1.55477359
1.1012243
5
0.6237255
5
0.7139429
8
0.6564123
1
VAR
SPC
0.6431369
2
0.1351814
FK=
CHI2K-1
PVALUE
0.0215160
7
0.0827162
6
0.7738263
0.2974122
3
0.8825506
6
2.96743231
7.8147279
0.39667378
5.
PRUEBA DE LAYARD
Layard sugiri la prueba basada en kurtosis. Asume que las poblaciones
normales.
Como requiere un estimador para la curtosis comn de las poblaciones, .
Por ejemplo, para probar la hiptesis nula de homogeneidad de las
varianzas, Layard propone el siguiente estimador agrupado de la curtosis
comn:
2
( X ij x i )
ni
i=1 j=1
ni
( X ij xi ) 4
^ = i=1
j=1
( ni1 ) ln ( s )
2
i
2
i
( ni 1 )
i=1
/t 2
media
VAR-S
55
46
45
73
50
63
55.3333333
118.666667
MQUINA
60
58
68
58
63
52
59.8333333
28.9666667
64
62
51
57
65
68
61.1666667
38.1666667
42
45
52
44
42
56
46.8333333
33.7666667
sum^
2
28.444444
4
58.777777
8
593.33333
3
2
3 Calculamos y, t
media
VAR-S
ni
55
46
45
73
50
63
55.333333
3
118.66666
7
6
10.027777
8
61.361111
1
144.83333
3
14.694444
4
46.694444
4
190.83333
3
23.361111
1
84.027777 SUMA^2
8
168.83333 1205238.0
3
3
y S
MQUINA
60
64
58
62
68
51
58
57
63
65
52
68
59.833333 61.166666
3
7
28.966666 38.166666
7
7
6
6
42
45
52
44
42
56
46.833333
3
33.766666
7
6
SUMA(ni1)
20
^4
t(i)
SUMA=T
6.211994
89
SUMA^2
1205238.
03
0.014645
72
Aplicando la frmula:
( ni1 ) ln ( s )
S'
2
i
2
i
( ni 1 )
i=1
/t 2
3.087158
42
7.814727
9
Dado que el estadstico de prueba S es menor que Chi-tabular (Chi 2(0.05,k1)) es decir 3.087<7.81473 concluimos que no existe evidencia suficiente para
rechazar la hipotesis de homogeneidad de varianzas.