You are on page 1of 17

Probabilidad y Estadstica 1 Distribuciones Ji Cuadrada y Weibull

JI-CUADRADA

Consideremos la siguiente situacin: se ha diseado un dispositivo como el de la figura, y se quiere investigar si al dejar caer unas bolitas desde el punto A, estas tienen igual probabilidad de salir por cualquiera de los canales C1, C2, C3 y C4. Las frecuencias observadas (Oi ) despus de haber lanzado 100 bolitas fueron las siguientes: O1 =22, O2 =27, O3 =31 y O4 =20

Oi es la frecuencia correspondiente al canal Ci, i=1, 2, 3, 4. Los datos prueban que con este dispositivo existe igual probabilidad de salida por cualquiera de los 4 canales? Idealmente las frecuencias esperadas (i), al realizar la experiencia, debieron haber sido 1=25, 2=25, 3=25 y 4=25. Sin embargo, eso no fue lo que sucedi en la prctica. Para probar si las diferencias (Oi - i ) se debe solo al azar o si, por el contrario, obedecen a que el dispositivo no es equiprobable en sus salidas, se tiene que construir una prueba mediante ji-cuadrada. Se demuestra que el estadstico: X2 = (
( )

); k: nmero de categoras o clases sigue una ley de probabilidad llamada ji

cuadrado con v= (k-r-1) grados de libertad; donde r: nmero de parmetros estimados con los datos experimentales

PROPIEDADES.
Una variable aleatoria Y(y=X2) sigue una ley de probabilidad ji-cuadrada con v grados de libertad, si su funcin de densidad viene dada por: f(y)= Ay(v/2)-1 -y/2 , y>0 La constante A permite que el grfico que est por debajo de la curva sea igual a 1. Si Z1, Z2 Zk son variables aleatorias independientes, distribuidas en forma normal estndar N(0,1), entonces y= (Z1)2+( Z2 )2+(Zk)2 sigue una distribucin de ji-cuadrada con k grados de libertad.

Universidad de El Salvador, F.M.Occ.

Probabilidad y Estadstica 2 Distribuciones Ji Cuadrada y Weibull Existe una distribucin particular de X2, para un determinado valor v de grados de libertad.

Los puntos porcentuales de la distribucin se leen en una tabla de X2 para un nivel de probabilidad y grados de libertad. Por ejemplo: P(X2>x2(0.05,10)= P(X2>18.307)=0.05()

La distribucin tiene una media: =v Y una varianza: 2=2v

El estadstico X 2 = (
( )

Sigue una ley X2 con v=k-r-1 grados de libertad.

Ejemplo 1. Utilizando X2, elabora una prueba de hiptesis respecto a la equiprobabilidad de las salidas del dispositivo, lo cual tratamos al inicio de esta seccin. Considera las frecuencias observadas O 1 =22, O2 =27, O3 =31 y O4 =20 y un nivel de significacin =0.05. Solucin. Universidad de El Salvador, F.M.Occ.

Probabilidad y Estadstica 3 Distribuciones Ji Cuadrada y Weibull H0: El dispositivo tiene igual probabilidad en sus salidas, en otras palabras, no existen diferencias significativas entre las frecuencias observadas y las esperadas. HA: Existen diferencias en algunas de las salidas. El valor X2 (, v) para =0.05 y v=k-r-1=4-0-1=3 grados de libertad, define las reas de aceptacin o rechazo de H0. X2, (0.05, 3)=7.815 ()

El estadstico que se va a contrastar se calcula mediante: (X2)C = (


( )

)=

+ +

= 2.96

En conclusin no se rechaza H0 ya que (X2) C= 2.96 < X2,(0.05, 3)=7.815 cae en la regin de aceptacin de H0. El dispositivo tiene iguales probabilidades de salida por cada uno de los canales.

PRUEBAS DE BONDAD DE AJUSTE.


La prueba que acabamos de realizar es un ejemplo de bondad de prueba de ajuste, pues pretende determinar si un conjunto de datos observados se ajusta a un conjunto de valores esperado. Las frecuencias esperadas en cada categroria no tienen que ser iguales, como se muestra en el siguiente ejemplo. Ejemplo 2. Un producto de consumo popular se fabrica en 3 presentaciones A, B Y C. Las preferencias de los clientes por cada tipo de presentacin han estado tradicionalmente en la proporcin 5: 3: 2. Es decir, por cada 10 clientes, cinco prefieren la presentacin de A; tres, la de B; y dos, la de C. Para

Universidad de El Salvador, F.M.Occ.

Probabilidad y Estadstica 4 Distribuciones Ji Cuadrada y Weibull comprobar si estas proporciones se han modificado, se toma una muestra aleatoria de 60 clientes y se les preguntas u preferencia. Los datos encontrados fueron los siguientes: Presentacin Frecuencias observadas Oi A 36 B 14 C 10

Para = 0.10, comprobar si las preferencias de los clientes se ajustan an a la proporcin 5:3:2. Solucin. H0: Las preferencias se mantienen en la proporcin 5:3:2 HA: Las proporciones se han modificado El valor lmite de aceptacin o rechazo de H0 es < X2,(0.10, 2)=4.605 Para calcular el estadstico de contraste, es necesario obtener los valores esperados de acuerdo con la hiptesis H0:5:3:2. Estos son: Presentacin A Frecuencias esperadas 1=60 x i B C

=30

2=60 x

=18

3=60 x

=12

Total: 30+18+12=60 El valor de (X2) C resultante es: (X2) C=


( )

= 2.42

La conclusin es no rechazar H0 ya que (X2) C = 2.42 cae en la regin de aceptacin de esa hiptesis:
(X2) C = 2.42 < X2,(0.10, 2)=4.605 Esto significa que las preferencias de los clientes se mantienen. Las pruebas de bondad de ajuste se extienden ms all de la aplicacin de datos categricos, ya que la tcnica puede utilizarse para comprobar si un conjunto de datos se ha extrado de una poblacin que sigue una determinada ley de probabilidad; esto es, si los datos se comportan o se ajustan a una distribucin binomial, Poisson, normal, exponencial, etc., Sin embargo, en las pruebas mediante X2 deben considerarse algunas limitaciones. Por ejemplo, si la frecuencia esperada en una determinada clase o celda es muy pequea (menos de cinco observaciones), la Universidad de El Salvador, F.M.Occ.

Probabilidad y Estadstica 5 Distribuciones Ji Cuadrada y Weibull divisin entre un nmero muy pequeo produce un cociente muy grande, lo cual podra provocar un error tipo 1, es decir, rechazara H0 cuando H0 sea, en realidad, verdadera. Lo que se recomienda es reunir las clases contiguas en una sola, de manera que la frecuencia esperada sea mayor o igual a cinco observaciones. Ejemplo 3. La distribucin de la variable aleatoria x: Nmero de defectos encontrados en la produccin, en los ltimos 100 controles realizados, se muestra en el siguiente cuadro: Nmero de defectos (Xi) 0 1 2 3 Nmero de controles con ese 5 14 20 25 nmero de defectos (Oi) Para =0.05, comprueba si los datos siguen la ley de Poisson. Solucin. Para calcular las frecuencias esperadas i, segn la ley de Poisson, es necesario determinar el parmetro de la distribucin. Ya que la media de una variable tipo Poisson es E(x)= , por lo tanto =

4 16

5 12

6 6

7 2

es el mejor estimador que podemos tener para .

La hiptesis se plantea como sigue: H0: La variable X, nmero de defectos, se ajusta a la Ley de Poisson con un parmetro de =3 HA: La variable X, nmero de defectos, no se ajusta a la Ley de Poisson con un parmetro de =3 El valor lmite de proporcionado por las tablas para X2 =0.05 v=k-1-1=6, es
(, v)

proporcionado por las tablas para

X2 (0.05, 6)=12.592 (r=1, debido a que se estim el parmetro ) El cuadro que aparece a continuacin muestra los clculos necesarios para obtener X2. Los valores P(x) son las probabilidades correspondientes a las variable x, de acuerdo con la hiptesis que sigue la Ley de Poisson P(x)= .

Las frecuencias esperadas se calculan mediante i=nP (Xi) La frecuencia esperada en la ltima celda fue una valor menor que 5 (=3.4); por tanto, se unen las dos ltimas clases en una sola (O=8, =8.4). En consecuencia, se reduce el nmero de celdas o clases a k=7 y tambin los grados de libertad disminuyen una unidad. El valor X2 (, v) se modifica a X2 (0.05, 5)=11.070. Universidad de El Salvador, F.M.Occ.

Probabilidad y Estadstica 6 Distribuciones Ji Cuadrada y Weibull

x 0 1 2 3 4 5 6 7

Oi 5 14 20 25 16 12 , n=100

P(Xi) 0.04979 0.14936 0.22404 0.22404 0.16803 0.10082 0.05041 0.03351 1.0

i=nP (Xi) 5.0 14.9 22.4 22.4 16.8 10.1 , 100.0 0 0.054 0.257 0.302 0.038 0.357 0.019 (X2) C= 1.027 En conclusin, se acepta H0, ya que (X2)C= 1.027 es definitivamente menor que el valor frontera X2 (0.05, 5)=11.070. La variable X, nmero de defectos encontrados en la produccin, en los ltimos cien controles, sigue la Ley de Poisson con un parmetro =3

PRUEBAS DE INDEPENDENCIA. En el anlisis de encuestas por muestreo es interesante determinar si algunas de las variables en estudio guardan alguna relacin de dependencia entre s, o si, por el contrario, son independientes. Al procedimiento se le conoce de manera popular como cruce de variables y se utiliza ampliamente en muchas investigaciones y en diferentes reas del quehacer cientfico. Las clases o categoras de la variable X se organizan en filas y las que corresponden a la variable Y, en columnas. El recuento de las observaciones se realiza en cada intercepcin entre fila y columna (celda), de tal forma que se obtiene un arreglo matricial de frecuencias observadas Oij donde i es el ndice de la fila y j, el ndice de la columna. Si se tiene m modalidades de la variable X (criterio de fila) y n modalidades de la variable Y (criterio de la columna), se tendrn, en consecuencia, mxn valores de frecuencia observadas, localizadas en igual nmero de celdas.

X/Y
X1 X2 Xi Xm

Y1
O11 O21 Om1 C1

Y2
O12 O22 Om2 C2

Yj
Oij Omj Cj

Yn
O1n Oin Omn Cn F1 F2 Fi Fm N

Fi: suma de las observaciones de la fila i. Cj: suma de las observaciones de la columna j. N: total de observaciones. La hiptesis de trabajo en todo estudio de este tipo es la hiptesis de independencia; es decir, que las observaciones son independientes, en los criterios de clasificacin por fila y columna. Consideremos los siguientes ejemplos antes de proceder a definir la metodologa de prueba.

Ejemplo 4: Disctanse las siguientes conjeturas sobre diferentes situaciones que requieren de investigacin.

Universidad de El Salvador, F.M.Occ.

Probabilidad y Estadstica 7 Distribuciones Ji Cuadrada y Weibull a) El salario mensual de un trabajador de una industria es independiente del gnero. Tanto mujeres como hombres ganan lo mismo. b) Los aos de educacin formal que posee una persona determinan la opinin que sta tiene sobre una situacin especfica (implantacin de la pena de muerte, legalizacin del aborto, inclinacin poltica, etc.) O, por el contrario, su opinin es independiente del nivel educativo. c) Una compaa mantiene en funcionamiento 4 mquinas en 3 turnos diarios. Asimismo se tienen registros del nmero de interrupciones observadas en el proceso de produccin por mquina y por turno. Las interrupciones son independientes de la mquina y del turno de trabajo? d) Una afeccin bronquial en un paciente tiene relacin con el hecho de que fume o no? e) Estar a favor o en contra de una determinada ordenanza municipal, gurda estrecha relacin con el nivel de ingreso del individuo? De acuerdo con la definicin de sucesos independientes que estudiamos en el Captulo 2, dos sucesos, A y B, son independientes si la probabilidad condicional del suceso A, dado el suceso B, es igual a la probabilidad del suceso A, es decir si P(A/B)=P (A); y simtricamente si P(B/A)=P(B). A partir de esta definicin llegamos a la condicin de independencia en la que: dos sucesos, A y B, son independientes si y solo si (P(AB)=P(A).P(B). Si en el cuadro de doble entrada, que elaboramos antes, calculamos la probabilidad asociada a una celda, bajo la hiptesis de independencia de los factores por fila y columna, obtenemos: Probabilidad de la realizacin conjunta de los sucesos

Xi y Yj=P(xiyj)=P(xi).P(yj) =( )( )

Esta probabilidad constituye la proporcin de observaciones que se esperara en la celda ij, de acuerdo con la hiptesis de independencia. Por lo tanto, la frecuencia esperada en la celda ij es: ij=( )( )N= La expresin resultante constituye una regla prctica para calcular

las frecuencias esperadas de las celdas: ij= Una vez obtenidas las frecuencias esperadas por todas las celdas, se procede a calcular el estadstico
(X2) C=
( )

el cual sigue una distribucin X2 con (m-1)(n-1) grados de libertad.

Universidad de El Salvador, F.M.Occ.

Probabilidad y Estadstica 8 Distribuciones Ji Cuadrada y Weibull Ejemplo 5. Una muestra aleatoria de 1,000 accidentes automovilsticos, tomados de los archivos de la Direccin de Trnsito, se clasifico de acuerdo con el tipo de seguridad utilizado por los ocupantes y la gravedad de las lesiones sufridas. En seguida se presenta el cuadro de doble entrada. Magnitud de lesin Menor o ninguna Mayor 235 (227.5) 175 (162.5) 240 (260) 650 100 (105) 65 (75) 135 (120) 300

Tipo de seguridad Cinturn slo en el asiento Cinturn en el asiento y correa transversal Ninguna Total

Muerte 15 (17.5) 10 (12.5) 25 (20) 50

Para =0.05, comprobar si existe alguna asociacin entre el tipo de seguridad utilizado y la magnitud de la lesin sufrida (Nota: los nmeros entre parntesis son las estimaciones de las frecuencias esperadas.) Solucin.
H0: Existe independencia (no hay asociacin) entre el tipo de seguridad y la magnitud de la lesin. HA: Hay asociacin. Los grados de libertad son v= (3-1) (3-1)=4. Nota: debido a que existen marginales de fila y columna que se deben respetar, solo 4 valores de las frecuencias esperadas se pueden asignar libremente, los dems son obligatorios. x x x x X2 (, v) = x2 (0.05, 4)=9.488

Los valores esperados de la primera fila son:

11=

12=

13= 350-(227.5+105)=17.5

El valor del estadstico es:

Universidad de El Salvador, F.M.Occ.

Probabilidad y Estadstica 9 Distribuciones Ji Cuadrada y Weibull

Debemos concluir que para este nivel de significacin, =0.05, no existe asociacin porque (X2 )c=8.3 < X2 (, v) = 9.488. Si aumentramos la probabilidad de cometer un error tipo 1 y utilizramos =0.10, la conclusin sera lo contrario.
PRUEBAS DE HOMOGENEIDAD. Las pruebas de homogeneidad son matemticamente equivalentes a las pruebas de independencia. La diferencia estriba en que las pruebas de independencia, la muestra aleatoria se ha extrado de la misma poblacin, y los totales marginales por fila y columna, respecto a los criterios de clasificacin, son aleatorios, no prefijados. En la prueba de homogeneidad, el investigador obtiene las muestras aleatorias, de manera independiente, de diferentes poblaciones y fija los totales marginales de acuerdo a un criterio de clasificacin. El otro criterio es el que se aplica las muestras, y tiene un carcter aleatorio. Se trata de probar si las muestras provienen de poblaciones homogneas respecto a este ltimo criterio. Consideremos el siguiente ejemplo: Un criador de pavos navideos alimenta, con diferentes raciones a tres grupos de 100 pavos pequeos. Lo que se pretende es determinar si hay alguna asociacin entre la mortalidad de cada grupo y la cantidad de racin que recibe. (Si no existe asociacin, las proporciones de mortalidad entre los grupos deberan ser iguales). Probar para =0.05. Raciones A B C Total Vivos 84 97 93 274 Muertos 16 3 7 26 Total 100 100 100 300

Solucin: H0: las proporciones de mortalidad son iguales (hay homogeneidad en el suceso). HA: las proporciones de mortalidad no son iguales. =0.05, v=(3-1)(2-1)=2, 2(,v)=5.991 2c=(84-91.33)2/91.33+(16-8.67)2/8.67+(97-91.33)2/91.33+(3-8.67)2/8.67+ (93-91.34)2/91.34+(7-8.66)2/8.66

=0.59+6.2+0.35+3.71+0.03+0.32= 11.2

Universidad de El Salvador, F.M.Occ.

Probabilidad y Estadstica 10 Distribuciones Ji Cuadrada y Weibull La conclusin es que las proporciones no son homogneas, es decir, existe relacin entre la mortalidad de cada grupo y la cantidad de racin que recibe. Todo parece indicar que las raciones A y B, en comportamientos contrarios, son las que definen asociacin.

Universidad de El Salvador, F.M.Occ.

Probabilidad y Estadstica 11 Distribuciones Ji Cuadrada y Weibull

Universidad de El Salvador, F.M.Occ.

Probabilidad y Estadstica 12 Distribuciones Ji Cuadrada y Weibull

Weibull
La distribucin de Weibull fue establecida por el fsico suizo del mismo nombre, quien demostr, con base en una experiencia emprica, que el esfuerzo al que se someten los materiales que puede modelarse de manera adecuada mediante el empleo de esta distribucin. En los ltimos 25 aos esta distribucin se emple como modelo para situaciones de tipo tiempo-falla y con el objetivo de lograr una amplia variedad de componentes mecnicos y elctricos. Definicin. Se dice que una variable aleatoria X tiene una distribucin de Weibull si su funcin de densidad de probabilidad est dada por: { x>0 : ,>0 para cualquier otro valor. La distribucin de Weibull es una familia de distribuciones que dependen de dos parmetros: el de forma y el de escala . Se puede introducir un parmetro adicional al reemplazar la variable aleatoria de Weibull de X por x-a, en donde a es un parmetro de localizacin que representa un valor umbral o un tiempo de garanta. En las grficas del distribucin de Weibull tienen diferentes perfiles dependiendo del valor de . Por ejemplo, si <1, tiene una forma de J transpuesta. Y si >1, la funcin de la densidad de Weibull presenta un pico nico. ( ) +

Grafica de la funcin de las densidades de Weibull para distintos valores de ,

La funcin de distribucin acumulativa de Weibull Puede obtenerse en forma cerrada mediante la evaluacin completa de la integral: Universidad de El Salvador, F.M.Occ.

Probabilidad y Estadstica 13 Distribuciones Ji Cuadrada y Weibull ( Esto es: ( ) ( ) exp [-(t/)+dt ) exp [-(t/)+dt

1 - exp [-(x/ ) +, x0 Del cual el valor cuantil xq es: 1 - exp [-(x/ ) ] xq - *In (1-q) ] 1/ * ( )+ 1/

En particular, la mediana de una variable aleatoria de Weibull es:


( )]

Los momentos y los valores de una variable aleatoria de Weibull se encuentran primero al terminar el r simo momento central alrededor del cero: ( ) Donde: =( ( ( ) ( ) ( ) ]

) ; entonces x=1/ y dx=(/)1/-1 d. El resultado es: ) ( ) ( )

Siendo la media de X: ( ) ( ),

Y la varianza de X es el resultado de evaluar: ( ) [ ( ) ( ]

Universidad de El Salvador, F.M.Occ.

Probabilidad y Estadstica 14 Distribuciones Ji Cuadrada y Weibull Mediante el uso del mismo proceso pueden determinarse el coeficiente de asimetra y la curtosis relativa. Estos se encuentran en la tabla A (En ella se encuentran resumidas las propiedades de la distribucin de Weibull). Los factores de forma pueden graficarse como funciones del parmetro de la forma de la distribucin de Weibull. Estas graficas revelan lo siguiente: La distribucin de Weibull es simtrica solo si =3.6, si >3.6 la distribucin tiene un sesgo negativo y si <3.6 se encuentra sesgada positivamente. La curtosis negativa se encuentra cercana a la distribucin normal que es de tres cuando tiene un valor cercano a 2.25 o a 5.83.

Tabla A: propiedades de la distribucin de Weibull En la tabla B se proporciona una comparacin entre las funciones de distribucin de Weibull y la distribucin normal, con un correspondiente a 2.25, 3.6 y 5.83 y con un factor de escala de =10. La concordancia parece ser relativamente buena tanto en los valores extremos como en el centro, especialmente para = 3.6 y 5.83. DE esta forma, la distribucin de Weibull puede aproximarse, de manera adecuada, por una distribucin normal cada vez que el factor se encuentre cercano a estos valores

Universidad de El Salvador, F.M.Occ.

Probabilidad y Estadstica 15 Distribuciones Ji Cuadrada y Weibull

Tabla B: Comparaciones entre las funciones de distribucin acumulativa de Weibull y las distribuciones nomales. Existen dos casos especiales en la distribucin de Weibull que merecen mencin especial. Cuando el parmetro de la forma es igual a 1, la distribucin de Weibull (al igual que la gama), se reduce a la distribucin exponencial negativa. Cuando =2 y el parmetro de la escala se remplaza por ( la funcin de densidad de Weibull se reduce a: ) ( ) X>0

Que es la funcin de densidad de probabilidad de los que se conoce como distribucin de Rayleigh. Ejemplo: Un fabricante de lavadoras garantiza su producto contra cualquier defecto durante el primer ao de uso normal. El fabricante ha estimado un costo por reparacin de $75 durante el periodo de garanta. Con base a la experiencia, se sabe que el tiempo en que ocurre la primera falla es una variable aleatoria de Weibull con parmetros de forma y escala iguales a 2 y 40, respectivamente. Si el fabricante espera vender 100 mil unidades y si, para una misma unidad, se descuenta el valor de las reparaciones, se determina el costo esperado de la garanta para el fabricante.

Universidad de El Salvador, F.M.Occ.

Probabilidad y Estadstica 16 Distribuciones Ji Cuadrada y Weibull Sea x la variable aleatoria que representa el tiempo hasta que se presenta la primera descompostura Por hiptesis, la funcin de densidad de la probabilidad de x es: ( ) * ( ) +, x>0

La probabilidad de que la primera descompostura ocurra en el periodo de garanta es igual a la probabilidad de que x sea menos o igual a 12. Mediante la evaluacin en la integral, esta probabilidad es: ( ) * ( ) += 0.0861

Por lo tanto, si se supone que la operacin d elas lavadoras en independiente entre si, se puede esperar (100000 ) (0.0861) = 8610 de fallas durante el tiempo de garanta con un costo total de $645750.

Universidad de El Salvador, F.M.Occ.

Probabilidad y Estadstica 17 Distribuciones Ji Cuadrada y Weibull

BIBLIOGRAFA Hernndez Salguero, Jos Alberto/ Elementos de Probabilidad y Estadstica 1 Edicin./ UCA Editores.

George C. Cannavos/ Probabilidad y Estadstica, Aplicaciones y mtodos/ Virginia Commonwealth University.

Universidad de El Salvador, F.M.Occ.

You might also like