You are on page 1of 13

AO DE LA DIVERSIFICACIN PRODUCTIVA Y

DEL FORTALECIMIENTO DE LA EDUCACIN


UNIVERSIDAD NACIONAL DE PIURA
FACULTAD: Ciencias / ESPECIALIDAD: Estadstica

TEMA

:
HOMOGENEIDAD DE VARIANZAS

ASIGNATURA :
Anlisis y diseos experimentales I

DOCENTE

:
Dr. Cosme Correa Becerra

INTEGRANTES :
Arechaga Floreano, Luis David
Montalbn Quispe, Iris Susana.
.

CICLO

:
VIII

HOMOGENEIDAD DE VARIANZAS
Introduccin:
Uno de los supuestos que ms se requieren en aplicaciones estadsticas
populares, tales como el anlisis de varianza, el anlisis de regresin, etc., es
el de la homogeneidad de varianzas. Este supuesto es crucial para garantizar
la calidad de los procedimientos estadsticos utilizados tanto en pruebas de
hiptesis como en la construccin de intervalos de confianza.
Existen muchas pruebas para verificar si el supuesto de homogeneidad es
plausible o no, pero, dada la complejidad del problema, no es posible realizar
estudios comparativos entre ellas que sean exhaustivos, ni de su
comportamiento para muestras pequeas, ya que muchas de ellas son de
carcter asinttico. En este trabajo estudiamos el nivel real de significancia, el
cual es la verdadera probabilidad de rechazar la hiptesis nula cuando es cierta
y que en pruebas no exactas es diferente del nivel nominal, o terico, de
significancia, determinado por el usuario, usualmente a niveles del 5% u otros
valores pequeos. Adems, se estudia la potencia de las pruebas bajo algunas
alternativas abajo enunciadas.
En esta simulacin se quiere comparar la prueba de Bartlett, la prueba de
Levene (Brown & Forsythe 1974), la prueba de Hartley (1950), la prueba de
Cochran (1941), la prueba de Fligner & Killeen (1976), la prueba basada en la
teora de la informacin, la prueba de Layard y algunas de sus variaciones, por
medio de la potencia que cada prueba tenga con respecto a diferentes
hiptesis alternas.
Los datos con los que se trabajaran las diferentes pruebas son:

Tiempo en producir 6 artculos en cada


maquina
T1
T2
T3
T4

55
60
64
42

46
58
62
45

45
68
51
52

73
58
57
44

Notacin
La notacin utilizada en el presente artculo ser la siguiente:

k = Nmero de muestras

= Tamao de la i -sima muestra

50
63
65
42

63
52
68
56

i -sima poblacin a partir de una muestra de

s i = Varianza estimada para la


tamao

N=n1+n 2+. . .+nk


s 2 = Varianza total estimada
Las Hiptesis que se quiere probar es:

H 0= 21= 22 == 2k
H 0= 21 22 2k
1.

PRUEBA DE LEVENE
El estadstico de prueba de Levene se define como:
k

( Nk ) n ( Z i . Z .. )
i=1

W=

ni

(k1) ( Z ij Z i . )

i=1 j=1

Donde

Zij puede tiene la siguiente definicin:

Zij=|X ij X i .|

Donde

X i .

Z .. , es la media global de
subgrupo de los

es la media del i -simo subgrupo.


Z ij

y Zi .

, es la media del

i -simo

Z ij

La prueba de Levene rechaza la hiptesis de que las varianzas son iguales


,
con
un
nivel
de
significancia
si W > F ,k1, Nk donde F ,k1, Nk es el valor crtico superior
con

grados de libertad en el numerador y

denominador a un nivel de significancia

NK

de la distribucin

grados de libertad en el

La prueba de Levene ofrece una alternativa ms robusta que el procedimiento


de Bartlett, ya que es poco sensible a la desviacin de la normalidad. Eso
significa que ser menos probable que rechace una verdadera hiptesis de
igualdad de varianzas slo porque las distribuciones de las poblaciones
muestreadas no son normales.

APLICANDO A NUESTROS DATOS:


1. Calculamos la media a cada uno de las tratamientos o mquinas:
Media(

Tratamiento
s

X i . )

T1

55

46

45

73

50

63

T2

60

58

68

58

63

52

T3

64

62

51

57

65

68

T4

42

45

52

44

42

56

Para

cada

2. Ahora

calculamos

Zij=|X ij X i .|
Z ..

calculamos la media global


Z ij

Z ij

0.33
33
0.16
67
2.83
33
4.83
33

9.33
33
1.83
33
0.83
33
1.83
33

Z ij

variable tambin

y la media por tratamiento Z i .

Z ij

Z ij

Z i .

5.33
33
3.16
67
3.83
33
4.83
33

7.66
67
7.83
33
6.83
33
9.16
67

8.44
44
3.83
33
4.77
78
4.77
78

Z ij

55.333
3
59.833
3
61.166
7
46.833
3

Z ..

( Z i. Z ..)

2
n ( Z i . Z ..)

,
T1
T2
T3
T4

10.33
33
8.166
7
10.16
67
5.166
7

17.66
67
1.833
3
4.166
7
2.833
3

5.45
83
5.45
83
5.45
83
5.45
83

8.9169

48.6712

2.6406

14.4134

0.4632

2.5281

0.4632

2.5281
68.1407

TOTAL

3. Ahora a cada termino

Zij
k

cuadrado se obtiene

le restamos
ni

( Z ij Z i . ) =
i=1 j=1

Z i .

307.8889.

4. Reemplazamos en el estadstico de prueba


k

2
( Nk ) n ( Z i . Z .. )

W=

i=1

ni

2
(k1) ( Z ij Z i . )
i=1 j=1

W=

2068.1407
3307.8889 .

y elevamos al

W =1.4754
5.

F0.05,3,20 =3.0984

Buscamos en la tabla

W < F 0.05,3,20

CONCLUSIN: Dado que

, Se acepta H 0 es decir se acepta

la hiptesis de que la varianzas de las mquinas son iguales. Los datos


cumplen el supuesto de homogeneidad de varianzas.

2.

PRUEBA DE HARTLEY

Fmx

Fue propuesta por Hartley (19401950). Asume que las poblaciones son
normales e independientes y los tamaos de las muestras son iguales.
El estadstico de prueba es:

Fmx =

mx { s^ 2i }
mn {s^ 2i }

Si la hiptesis nula es cierta y los tamaos de las muestras son iguales

n1=n2 =n k , la distribucin muestral del estadstico

Fmx

(asumiendo independencia de las muestras aleatorias tomadas de las


poblaciones normales) es

F MX con k grados de libertad en el numerador

y v = n 1 grados de libertad en el denominador.

1 Calcular las varianzas muestrales por columna (mquina).


55
46
45

MQUINA
60
58
68

64
62
51

42
45
52

VARS

73
50
63
118.66666
7

58
63
52
28.966666
7

57
65
68
38.166666
7

44
42
56
33.766666
7

2 Hallar el F-calculado que viene dado por la divisin de la mxima varianza


con la mnima. K representa los grados de libertad en la F (es la cantidad de
mquinas o columnas) y v es igual a n-1 grados de libertad (el segundo
trmino).
Mximo
F-cal
V gl=n-1

118.66666
7
4.0966628
3
5

Mnimo

28.966666
7

3 Comparar el F-calculado con el valor F-tabulado con alfa=0.05, k nmero de


mquinas y v= n-1 grados de libertad.
F-tab

5.192167
77

Dado que el Fcal<Ftab no hay razn suficiente para rechazar la hiptesis


nula de homogeneidad.

3.

PRUEBA DE COCHRAN
El estadstico de prueba viene dado por:
2

g=

max ( s i )
k

s 2i
i=1

Cuando las muestras son de igual tamao n= n1 = n2 = nk , la hiptesis acerca

de la igualdad de varianzas es rechazada si

g> g( a ,n , k ) . Cuando el nmero de

observaciones en cada tratamiento no sea igual pero se a relativamente cercano, el

mayor de los ni puede usarse en lugar de n para determinar los grados de libertad. La
prueba de Cochran es en particular til para detectar si una varianza es mucho ms
grande que las otras.
1 Calcular las varianza por mquina

VARS

55
46
45
73
50
63
118.666667

MQUINA
60
58
68
58
63
52
28.9666667

64
62
51
57
65
68
38.1666667

42
45
52
44
42
56
33.7666667

2 Calcular el estadstico de prueba g que viene dado por el cociente entre la


mxima varianza maestral y la suma de varianzas muestrales.
MAX(VAR-S)
g

118.666667
0.54045848

SUMA(VAR-S)

219.566667

3 Encontrar el valor tabular de Cochran con alfa 0.05


G (0.05, 6, 4)=0.5895
4 Conclusin
Dado que g<G-tab (0.5405<0.5895) concluimos que no hay razn suficiente
para rechazar la hiptesis de homogeneidad de varianzas.

4.

PRUEBA DE FLIGNER Y KILLIEN


La prueba Fligner-Killeen (mediana) se ha determinado en un estudio de
simulacin como una de las muchas pruebas de homogeneidad de las
varianzas que es ms robusto frente a desviaciones de la normalidad.
Consiste en:
1 Ordene las variables
mediana de las

xi|
|x ij ~

de menor a mayor, donde

ni observaciones de la poblacin i.

~
x i es la

2 Defina
1

N ,i=

( 12 + 2( Ni+ 1) )
a

Donde

Para i=1,, N

a z

(z) es la distribucin acumulada N(0, 1) de

3 Sea
a i=

j Gi

Donde

aN , j
ni

Gi denota la muestra de la poblacin

i=1, , k .

Entonces:
N

a =
j=1

aN , j
aN , j

N j G ni
i

Y el estadstico de prueba es:


k

ni ( a ia )2
i =1

x=

( a N , J a )2 /(n1)
j=1

Este estadstico bajo

H0

se distribuye aproximadamente

x k1

1 Calcular la mediana por mquina.


mediana

52.5

59

63

44.5

2 Calcular el valor absoluto de la diferencia de cada productos y su mediana.


DIFERENCIA ABSOLUTA=|Xij-MED (Xi.)|
2.5
1
1
6.5
1
1
7.5
9
12
20.5
1
6
2.5
4
2
10.5
7
5

2.5
0.5
7.5
0.5
2.5
11.5

3 Ordenar todas las unidades producidas de menor a mayor.


10.5
16
18.5
24
10.5
21

ORDENAMIENTO
5
5
20
5
13
17

5
5
23
15
8
14

10.5
1.5
18.5
1.5
10.5
22

4 Calcular la normal estndar inversa de cada unidad producida.


NORMAL INVERSA
0.55338472

0.2533471

0.2533471

0.55338472

0.91536509

0.2533471

0.2533471

0.07526986

1.12639113

1.28155157

1.75068607

1.12639113

2.05374891

0.2533471

0.84162123

0.07526986

0.55338472

0.70630256

0.41246313

0.55338472

1.40507156

0.99445788

0.77219321

1.55477359

5 Calcular la varianza muestral, el promedio y la suma de cuadrados


ponderados de los inversos normales.
MEDIA

1.1012243
5

0.6237255
5

0.7139429
8

0.6564123
1

VAR
SPC

0.6431369
2

0.1351814

FK=
CHI2K-1
PVALUE

0.0215160
7

0.0827162
6

0.7738263
0.2974122
3
0.8825506
6

2.96743231
7.8147279
0.39667378

Como p-valor = 0,39667378> 0,05 = , no podemos rechazar la hiptesis nula


de que las varianzas de grupo son iguales.

5.

PRUEBA DE LAYARD
Layard sugiri la prueba basada en kurtosis. Asume que las poblaciones
normales.
Como requiere un estimador para la curtosis comn de las poblaciones, .
Por ejemplo, para probar la hiptesis nula de homogeneidad de las
varianzas, Layard propone el siguiente estimador agrupado de la curtosis
comn:
2

( X ij x i )
ni


i=1 j=1

ni

( X ij xi ) 4

^ = i=1

j=1

Para probar la hiptesis nula de igualdad de varianzas, Layard realiza una


transformacin ortogonal del vector cuyos componentes

Z i= ( ni1 )1 /2ln ( S 2i )/t


se distribuyen asintticamente como la distribucin normal estndar bajo la
hiptesis nula.
Siendo el estadstico de prueba:

( ni1 ) ln ( s )

S '= ( ni1 ) ln ( s ) i=1


i =1

2
i

2
i

( ni 1 )
i=1

/t 2

Utiliza la propiedad de preservacin de la distancia de las transformaciones


ortogonales para mostrar que el estadstico de prueba (especificado
arriba) se distribuye asintticamente como una distribucin de chi-cuadrado
con - 1 grados de libertad bajo la hiptesis nula de igualdad de varianzas.

1 Calculamos media y varianza muestral del tratamiento.

media
VAR-S

55
46
45
73
50
63
55.3333333
118.666667

MQUINA
60
58
68
58
63
52
59.8333333
28.9666667

64
62
51
57
65
68
61.1666667
38.1666667

42
45
52
44
42
56
46.8333333
33.7666667

2 Calculamos la suma de las diferencias a la cuarta y al cuadrado de la


diferencia de las observaciones con la respectiva media del tratamiento.
DIFERENCIA A LA CUARTA DEL VALOR OBSERVADO Y SU MEDIA DEL
TRATAMIENTO
0.01234568
0.0007716
64.445216 545.741512
7588.34568 11.2970679 0.48225309 11.2970679
11401.4938 4448.14892 10683.5193 712.593364
97413.3457 11.2970679 301.408179
64.445216
809.08642 100.556327 215.926698 545.741512
3454.82716 3765.18596 2180.37114 7060.66744 SUMA^4
sum^4
120667.111 8336.48611 13446.1528 8940.48611 151390.236

DIFERENCIA AL CUADRADO DEL VALOR OBSERVADO Y SU MEDIA


DEL TRATAMIENTO
0.11111111 0.0277777 8.0277777 23.361111
8
8
1
87.111111 3.3611111 0.6944444 3.3611111
1
1
4
1
106.77777 66.694444 103.36111 26.694444
8
4
1
4
312.11111 3.3611111 17.361111 8.0277777
1
1
1
8

sum^
2

28.444444
4
58.777777
8
593.33333
3

2
3 Calculamos y, t

media
VAR-S
ni

55
46
45
73
50
63
55.333333
3
118.66666
7
6

10.027777
8
61.361111
1
144.83333
3

14.694444
4
46.694444
4
190.83333
3

23.361111
1
84.027777 SUMA^2
8
168.83333 1205238.0
3
3

y S
MQUINA
60
64
58
62
68
51
58
57
63
65
52
68
59.833333 61.166666
3
7
28.966666 38.166666
7
7
6
6

42
45
52
44
42
56
46.833333
3
33.766666
7
6

SUMA(ni1)
20

DIFERENCIA DEL VALOR OBSERVADO Y SU MEDIA DEL


TRATAMIENTO A LA CUARTA
0.0123456 0.0007716 64.445216 545.74151
8
2
7588.3456 11.297067 0.4822530 11.297067
8
9
9
9
11401.493 4448.1489 10683.519 712.59336
8
2
3
4
97413.345 11.297067 301.40817 64.445216
7
9
9
809.08642 100.55632 215.92669 545.74151
7
8
2
3454.8271 3765.1859 2180.3711 7060.6674 SUMA^4
6
6
4
4
sum
120667.11 8336.4861 13446.152 8940.4861 151390.236

^4

4.515761 1.057215 0.169303 0.469714


29
69
33
58

t(i)

(n-1)VAR- 593.3333 144.8333 190.8333 168.8333


S
33
33
33
33

SUMA=T
6.211994
89
SUMA^2
1205238.
03

0.014645
72

Aplicando la frmula:

( ni1 ) ln ( s )

S '= ( ni1 ) ln ( s ) i=1


i =1

S'

2
i

2
i

( ni 1 )
i=1

/t 2

3.087158
42

4 Comparar el estadstico de prueba con el Chi tabular


CHI2-tab

7.814727
9

Dado que el estadstico de prueba S es menor que Chi-tabular (Chi 2(0.05,k1)) es decir 3.087<7.81473 concluimos que no existe evidencia suficiente para
rechazar la hipotesis de homogeneidad de varianzas.

You might also like