You are on page 1of 11

DEPARTAMENTO DE ESTADISTICA INFERENCIA M.V.

COMPARACION DE VARIAS MEDIAS POBLACIONALES ANALISIS DE VARIANZA DE UN FACTOR Hasta el momento hemos tratado el problema de comparar las medias de dos poblaciones. La idea ahora es generalizar la comparacin de medias de k poblaciones. Supongamos entonces que disponemos de k muestras aleatorias independientes, cada una de tamao ni , para i=1,...,k y hemos calculado las distintas medias muestrales para cada una de ellas: x 1, k. x 2 ,...,x Cuando varias muestras exhiben promedios diferentes, los investigadores tienen inters en explorar si todas estas muestras provienen de poblaciones con la misma media, esto es : .1 = .2 = ....=.k , o si cada una de las k muestras se obtiene de poblaciones con medias que no son todas iguales. As, se desea resolver el problema de hiptesis: H0 : .1 = .2 = ....=.k vs. H1 : algn .i distinto.

Si el anlisis estadstico permite aceptar el primer caso, entonces las diferencias observadas entre las medias muestrales, se deben slo a fluctuaciones del muestreo y, por lo tanto, no son significativas. En cambio, si el anlisis no permite aceptar igualdad de medias, las diferencias entre las diversas medias muestrales son significativas, esto es se rechaza la hiptesis que .1 =.....=.k . El procedimiento usado para probar igualdad de medias de varias poblaciones normales se denomina Anlisis de Varianza (nombre que parece errado ya que queremos probar igualdad de medias). Este procedimiento involucra una separacin de una varianza total en piezas o partes: varianza intra (dentro) y varianza inter (entre) y luego decide
1

DEPARTAMENTO DE ESTADISTICA INFERENCIA M.V.H

aceptar o rechazar la igualdad de medias basndose en la magnitud relativa de estas partes. Supongamos que disponemos de k muestras aleatorias independientes, cada una de tamao ni i=1,2,..,k .Para poder llevar a cabo la prueba de igualdad de medias necesitamos que se satisfagan los dos supuestos siguientes: 1) Cada una de las muestras se obtienen de una poblacin con distribucin normal y , 2) Las k poblaciones tienen la misma varianza, esto es 2 2 2 51 = 52 = ......= 5k . Sea : H0 : .1 = .2 = ....=.k vs. H1 : algn .i distinto. La decisin de rechazar o no H! se har con el estadstico F= Varianza inter-muestras Varianza intra-muestras

donde la varianza inter y la varianza intra son dos estimaciones de la varianza comn 5 # Si la disparidad entre estas dos estimaciones es considerable, la hiptesis nula es rechazada y las diferencias entre las diversas medias muestrales son consideradas significativas. Si la hiptesis nula es verdadera, esperamos que las dos estimaciones para la varianza poblacional estn razonablemente cercanas y por lo tanto se espera que la razn F sea cercana a 1, en cambio, si las k medias son diferentes, la varianza inter-muestras ser mayor que la varianza
2

DEPARTAMENTO DE ESTADISTICA INFERENCIA M.V.H

intra-muestras. Esto debido a que la varianza intra-muestras es una estimacin insesgada de la varianza poblacional sin importar si H0 es verdadero o no, en cambio el valor esperado de la varianza intermuestras consiste de la varianza poblacional ms una varianza adicional que refleja la diferencia entre las k poblaciones. Esto es, los valores esperados de las dos estimaciones de la varianza 5 2 son: E[Varianza intra-muestras] = 5 2
k

E[Varianza inter-muestras] = 5 + " ni


2 i=1

(.i -.)2 k"

As, cuando las k poblaciones difieren en lo que respecta a su media, se espera que la razn F sea mayor que 1; adems, mientras mayor sea la diferencia entre las diversas muestras, mayor ser la razn F. Por lo tanto, con un nivel de significacin !, se rechazar H0 : .1 = .2 = ....=.k si F >F1-! (r1 , r2 ).

Frmulas k= N de poblaciones en estudio (N de muestras)


k

ni = Tamao de la muestra i, i=1,2,...,k ; ! !Xij Estimador de la media : . s=


i=1 j =1 k ni

" ni = n .
i=1

!ni
i=1

...................................(1)

DEPARTAMENTO DE ESTADISTICA INFERENCIA M.V.H

!!(Xij . s )2 Estimador de la varianza total: 5 s2 =


k i=1 j=1

k ni

!ni 1
i=1

..............(2)

Si ni = n , a i=1, ..,k, entonces "ni = nk y las frmulas (1) y (2) pasan a


i=1

ser respectivamente n !Xi . s=


i=1 k

!X i =
i=1

!!(Xij . s )2 , 5 s2 =
i=1 j=1

k n

nk

nk 1

Notemos que, el numerador de 5 s 2 corresponde a una suma de cuadrados totales que puede descomponerse en: ""(Xij . s ) ="" [(Xij X i )+(X i . s )]2
2 i=1 j=1 i=1 j=1 k ni k ni

y como los dobles productos son 0 = "" (Xij X i )2 +"" (X i . s )2


i=1 j=1 i=1 j=1 k ni k ni

..........(3)

Suma cuadrado total=Suma cuadrado dentro de muestras+ Suma cuadrado entre muestras Notemos que (3) se puede escribir como:
k ni 2 k

""(Xij . s)
i=1 j=1

= " n i
i=1

"Si2 +

"ni (X s )2 i .
i=1

DEPARTAMENTO DE ESTADISTICA INFERENCIA M.V.H

SCT

SCW

SCB

(W=Whithin=dentro, B=Between=entre) Como . s es combinacin lineal de variables normales, ella es normal. Adems, X i . s se distribuye normal por ser combinacin lineal de normales. Cov ( . s , Xi . s )=0 para cada i, y Cov( X i . s , Xij X i )=0 para cada i, j. As: . s es independiente de X i . s, !ni "S2 i . s es independiente de S2 c = y
i=1 k

n. k

Xi . s es independiente de S2 c .

Dividiendo la expresin (3) por 5 2 tenemos: SCT SCW 2 ; (n . 1), ;2 (n. k), 2 2 5 5 SCB ;2 (k 1), 2 5

Dada la independencia de las variables involucradas obtenemos que


k !ni (X s )2 i. i=1

SCB 5 2 (k 1) F= SCW 5 2 (n. k)

k1 !ni "S2 i
i=1 k

F( k 1, n. k) ......(5)

n. k Si ni = n para todo i = 1, ...,k (5) toma la forma :

DEPARTAMENTO DE ESTADISTICA INFERENCIA M.V.H

k ! n (X i . s )2 i=1

F=

k1 !S2 i
i=1 k

2 nS X

!S2 i
i=1

F( k 1, k(n 1)).

Lo anterior se puede resumir en una tabla conocida como la TABLA ANOVA ANOVA Fuente de Variacin Entre pobl. Dentro de las k pobl. Total g.l. k1 n. k n. 1 SC SCB SCW SCT CP SCB/(k 1) SCW/(n. k) Razn F Fc =
SCB (k1) SCW (n.k)

v-p P(F Fc )

Observacin. Podemos obtener frmulas alternativas para la SCT y SCB, estas son: !! Xij 2
i=1 j=1 k ni

SCT = !! X2 ij
i=1 j=1 n"

k ni

n ! X#j 2
n#

! X"j 2 SCB= y
j=1

n"

j=1

! Xkj 2 .....+
j=1

nk

!! Xij 2
i=1 j=1

k ni

n2

nk

SCW = SCT SCB

DEPARTAMENTO DE ESTADISTICA INFERENCIA M.V.H

Ejercicio. Como parte de la investigacin del derrumbe del techo de un edificio, un laboratorio prueba todos los pernos disponibles que conectaban la estructura de acero en tres posiciones distintas del techo. Las fuerzas requeridas para "cortar" cada uno de los pernos (valores codificados) son los siguientes: Posicin 1: 90 82 79 98 83 91 Posicin 2: 105 89 93 104 89 95 86 Posicin 3: 83 89 80 94 Realice un anlisis de varianza para probar, con un nivel de significacin de 0.05, si las diferencias entre las medias muestrales en las 3 posiciones son significativas. Solucin Realizamos la prueba de hiptesis: H0 : .1 =.2 =.3 (las fuerzas promedios es la misma para las tres posiciones) H1 : Algn .i es distinto. Bajo los supuestos de normalidad en las fuerzas requeridas, independencia e igualdad de varianza para las 3 posiciones obtenemos: (De acuerdo a la observacin anterior recogemos las distintas sumas para cada una de las posiciones)

ni ! Xij
j=1 ni

Posicin 1 6 523

Posicin 2 7 661

Posicin 3 4 346

Total n. =17 !! Xij =1530


i=1 j=1 k ni

As
7

DEPARTAMENTO DE ESTADISTICA INFERENCIA M.V.H

ni

SCT="" X2 ij
i=1 j=1

(1530)# (1530)# = 138638 =938 17 17

523# 661# 346# (1530)# SCB = #$% 6 7 4 17 y SCW=938 234=704. De donde el estadstico es Fc =
234 2 704 14

117 =2.33 50.3

Para !=0.05 tenemos F0.95 (2,14)=3.74 Dado que Fc =2.33 F0.95 (2,14) no podemos rechazar H0 . Las diferencias entre las medias muestrales no son significativas al nivel 0.05. Z +69< : P(F(2,14) 2.33) = 0.13381807 no significativo. Los clculos los podemos resumir en la siguiente tabla ANOVA

Fuente de variacin SCB (Tratamientos) SCW (Error) SCT

g.l. 2 14 16

SC 234 704 938

SCP 117 50.3

Fc 2.33

F1! (k-1, n -k) 3.74

v-p 0.1338

Esta misma tabla la podemos obtener de la planilla Excell en la opcin "Anlisis de Varianza de un Factor" en "Anlisis", todo dentro del cono "Datos"

DEPARTAMENTO DE ESTADISTICA INFERENCIA M.V.H

Ejercicio 1. Como parte de la investigacin del derrumbre del techo de un edificio, un laboratorio prueba todos los pernos disponibles que conectaban la estructura de acero en tres posiciones distintas del techo. Las fuerzas requeridas para "cortar" cada uno de los pernos (valores codificados ) son los siguientes:

Posicin 2 105 89 93 104 89 95 86 Anlisis de varianza de un factor RESUMEN Grupos Posicin 1 Posicin 2 Posicin 3

Posicin 1 90 82 79 98 83 91

Posicin 3 83 89 80 94

N Observaciones 6 7 4

Suma 523 661 346

Promedio Varianza 87,1666667 50,1666667 94,4285714 55,952381 86,5 39

ANLISIS DE VARIANZA O. de las variaciones Entre grupos Dentro de los grupos Total

S.C. 234,452381 703,547619 938

G. de l. 2 14 16

C.M F Prob (v-p) V. crtico para F 117,22619 2,33270161 0,133547147 3,738891832 50,2534014

DEPARTAMENTO DE ESTADISTICA INFERENCIA M.V.H

Ejercicio. -Se pretende impartir un curso de capacitacin a ejecutivos de una empresa. Con anterioridad se les pide llenar un cuestionario para calificar su habilidad tcnica, clasificndolos en tres grupos: (A) Tcnico bajo, (B) medio o (C) alto en conocimientos computacionales. A continuacin se presenta una tabla de Anlisis de Varianza de la comparacin entre los grupos.

Fuente de variabilidad Entre muestras (tratamientos) Dentro de muestras (error) Total

Grados de libertad

Suma de cuadrados

Cuadrados medios 3816,8

Estadstico

15

3181,6

a) Complete la tabla ANOVA b) Hay evidencia suficiente para llegar a la conclusin de que el promedio de calificaciones es distinto para los tres grupos?. Use !=0.05 8) Cuatro pinturas marinas diferentes fueron comparadas respecto de la proteccin contra un ambiente salino. Se emple un total de 16 tarros, obtenidose los siguientes resultados despus de 6 meses de uso. Pintura 1 108 69 72 85 Pintura 2 79 70 100 91 Pintura 3 95 80 80 92 Pintura 4 108 119 116 106 A mayor valor mejor. Aceptara la hiptesis que las pinturas son igualmente efectivas? .

10

DEPARTAMENTO DE ESTADISTICA INFERENCIA M.V.H

9) Para determinar la mejor disposicin de los instrumentos sobre un tablero de control de un aeroplano, se prueban tres distintos arreglos simulando una situacin de emergencia y observando el tiempo de reaccin requerido para corregir la avera. Los tiempos de reaccin (en dcimas de segundo) de 28 pilotos (aleatoriamente asignados a los diversos arreglos) son los siguientes: Disposicin 1: 14, 13, 9, 15, 11, 13, 14, 11 Disposicin 2: 10, 12, 9, 7, 11, 8, 12, 9, 10, 13, 9, 10 Disposicin 3: 11, 5, 9, 10, 6, 8, 8, 7 Con un nivel de significacin !=0.01 prubese si podemos rechazar la hiptesis nula de que las diferencias entre las disposiciones no tuvieron efecto alguno.

7) El contenido de aflatoxina de algunas muestras de crema de man se prueba y se consiguen los siguientes resultados: Contenido de aflatoxina (ppb) Marca A 0.5 0.0 3.2 1.4 0.0 8.6 2.9 Marca B 4.7 6.2 0.0 10.5 2.1 0.8 a) Emplee el anlisis de varianza para probar si las dos marcas difieren en el contenido de aflatoxina b) Pruebe la misma hiptesis usando una prueba t. c) Pruebe que el estadstico T con / grados de libertad y el estadstico F con 1 y / grados de libertad estn relacionados por la frmula F(1,/ ) = T# / Con este resultado pruebe que los mtodos de anlisis de varianza y la prueba t son equivalentes en este caso. d) Realice un test no paramtrico para probar si las dos marcas difieren en el contenido de aflatoxina

11

You might also like