Professional Documents
Culture Documents
Considere el lanzamiento de un dado. Se formula la hiptesis de que el dado no esta cargad, lo cual es equivalente a probar la hiptesis de que la distribucin de resultados es la distribucin uniforme discreta: 1 f(x) = , x= 1, 2, , 6
6
Supngase que el dado se lanza 120 veces y se registra cada uno de los resultados. Tericamente, si el dado no esta cargado, se esperara que cada lado cayera 20 veces. Al comparar las frecuencias observadas con las correspondientes frecuencias esperadas, se debe decidir si estas discrepancias tienen posibilidad de ocurrir como resultado de las fluctuaciones muestrales de que el dado no esta cargado y de que la distribucin de resultados no es uniforme.
Cara 1 Observada Esperada 20 20 2 22 20 3 17 20 4 18 20 5 19 20 6 24 20
Es de practica comn referirse a cada resultado posible de un experimento como una celda. En el ejemplo se tienen 6 celdas. El estadstico apropiado sobre el cual se basa el criterio de decisin para un experimento que involucra k celdas se define en el siguiente teorema
Ejemplo 8.3
Supngase que el dado se lanza 120 veces y se registra cada uno de los resultados. Tericamente, si el dado no esta cargado, se esperara que cada lado cayera 20 veces. Los resultados se dan en la tabla. Al comparar las frecuencias observadas con las correspondientes esperadas, se debe decidir si estas discrepancias tienen posibilidad de ocurrir como resultado de las fluctuaciones mustrales, de que el dado no esta cargado y de que la distribucin de resultados no es uniforme.
Caras 1 2 3 4 5 6 Observada 20 22 17 18 19 24 Esperada 20 20 20 20 20 20
Prueba de Bondad
Una prueba de bondad entre frecuencias observadas y esperadas se basa en la siguiente formula:
Dado que 1.7 es menor que el valor crtico no se rechaza Ho, se concluye que no hay evidencia suficiente de que el dado este cargado.
1.7 > 11.070
i 2 1 4 15 10 5 3
7
10.5
Prubese la hiptesis de que la distribucin de frecuencia de las duraciones de las bateras pueden aproximarse por una distribucin normal con media =3.5 y una desviacin estndar de =0.7. la frecuencia esperada para las 7 clases (celdas), que se enlistan en la tabla (anterior), se obtienen calculando las reas bajo la curva normal hipottica que caen entre varios limites de clase.
= -0.79
3.453.5 0.7
= 0.07
Se encuentra que el rea entre =-0.79 y =-0.007 es: rea = P(-0.79 -0.07) =P(-0.07)-P(-0.79) =0.4721-0.2148 =0.2573 De aqu la frecuencia esperada para la cuarta clase es: =(0.2573)(40)=10.3 Se acostumbra redondear estas frecuencias a un decimal
La frecuencia esperada para el primer intervalo de clase se obtiene utilizando el rea total bajo la curva normal a la izquierda del limite 1.95 Para el ultimo intervalo de clase, se utiliza el rea total a la derecha del limite 4.45. Todas las frecuencias esperadas se determinan por el mtodo descrito para la cuarta clase. Se han combinado clases adyacentes, en la tabla, donde las frecuencias esperadas son menores que 5. El numero total se reduce de 7 a 4, lo que resulta en v= 3 grados de libertad. El valor de x2 es entonces:
Dado que el valor calculado de X2 f es menor que X2.05 = 7.815 para 3 grados de libertad, no hay razn para rechazar la hiptesis nula y se concluye que la distribucin normal con = 3.5 y = 0.7 proporciona un buen ajuste de las duraciones de las bateras. La prueba de bondad de ji cuadrada es una herramienta muy importante debido sobre todo a que muchos procedimientos estadsticos dependen en un sentido terico de la suposicin de normalidad con objeto de proporcional un fundamento terico para ciertas pruebas e intervalos de confianza.
Existen pruebas mas poderosas que la de ji cuadrada para probar la normalidad. Una es Prueba de Geary. Esta se basa en la razn de dos estimadores de la desviacin estndar poblacional . Supngase que una muestra aleatoria X1, X2, , Xn , se toma de una distribucin normal, N (, ). Considrese:
El denominador es estimador razonable de si la distribucin es normal, pero puede sobrestimar o subestimar cuando hay desviaciones de la normalidad. Los valores de U que difieren considerablemente de 1.0 representan la seal de que debe rechazarse la hiptesis de normalidad.
Para muestras grandes, una prueba razonable se basa en normalidad aproximada de U. El estadstico de prueba es entonces una estandarizacin de U. Esto esta dado por:
= 1 .26661
El procedimiento de prueba involucra la regin critica de dos lados. Se calcula un valor de z de los datos y no se rechaza la hiptesis de normalidad cuando: < <
2 2