Professional Documents
Culture Documents
La distribución chi cuadrada es una de las distribuciones más empleadas en todos los
campos. Su uso más común es cuando se quiere probar si unas mediciones que se hayan
efectuado siguen una distribución esperada, por ejemplo, la normal o cualquier otra. Otro
de sus usos es en intervalos de confianza y pruebas de hipótesis para las varianzas o
desviaciones estándar.
(𝑛 − 1)𝑠²
𝜎²
Tiene una distribución muestral que es una distribución chi-cuadrada con gl=n-1 grados
de libertad y se denota X² (X es la minúscula de la letra griega chi). El estadístico chi-
cuadrada esta dado por:
(𝑛 − 1)𝑠²
𝑋2 =
𝜎²
donde n es el tamaño de la muestra, s² la varianza muestral y 𝜎 2 la varianza de la población
de donde se extrajo la muestra. El estadístico ji-cuadrada también se puede dar con la
siguiente expresión:
𝛴(𝑥 − 𝑥)²
𝑋2 =
𝜎²
Ejemplo 1:
Suponga que los tiempos requeridos por un cierto autobús para alcanzar un de sus destinos
en una ciudad grande forman una distribución normal con una desviación estándar σ=1
minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que
la varianza muestral sea mayor que 2.
Ejemplo 2:
INTERVALO DE CONFIANZA
A todo intervalo de confianza, calculado a partir de los datos de una muestra aleatoria, se
le fija un nivel de confianza que mide la probabilidad de que el intervalo contenga el
verdadero valor del parámetro.
Ejemplo 3:
(𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎 − 𝑡𝑒ó𝑟𝑖𝑐𝑎)²
𝑋2 = ∑
𝑡𝑒ó𝑟𝑖𝑐𝑎
ⅈ
Cuanto mayor sea el valor de 𝑋 2 , menos verosímil es que la hipótesis nula sea correcta.
De la misma forma, cuanto más se aproxima a cero el valor de chi-cuadrado, más
ajustadas están ambas distribuciones.
𝑔𝑙 = (𝑟 − 1)(𝑘 − 1)
TABLAS DE CONTINGENCIA
Una tabla de contingencia es una de las formas más comunes de resumir datos
categóricos. En general, el interés se centra en estudiar si existe alguna asociación entre
una variable fila y otra variable columna o calcular la intensidad de dicha asociación.
Una tabla de doble entrada para las variables X e Y con p filas y k columnas:
donde nij expresa la frecuencia absoluta observada en las modalidades Xi e Yj refleja la
distribución conjunta de X e Y.
La misma tabla puede expresarse en frecuencias relativas o proporciones sin más que
dividir cada casilla nij por el total N.