You are on page 1of 5

DISTRIBUCIÓN CHI CUADRADA (X²)

La distribución chi cuadrada es una de las distribuciones más empleadas en todos los
campos. Su uso más común es cuando se quiere probar si unas mediciones que se hayan
efectuado siguen una distribución esperada, por ejemplo, la normal o cualquier otra. Otro
de sus usos es en intervalos de confianza y pruebas de hipótesis para las varianzas o
desviaciones estándar.

En realidad, la distribución ji-cuadrada es la distribución muestral de s². O sea que si se


extraen todas las muestras posibles de una población normal y a cada muestra se le calcula
su varianza, se obtendrá la distribución muestral de varianzas.

Para estimar la varianza poblacional o la desviación estándar, se necesita conocer el


estadístico X². Si se elige una muestra de tamaño n de una población normal con varianza
σ², el estadístico:

(𝑛 − 1)𝑠²
𝜎²

Tiene una distribución muestral que es una distribución chi-cuadrada con gl=n-1 grados
de libertad y se denota X² (X es la minúscula de la letra griega chi). El estadístico chi-
cuadrada esta dado por:

(𝑛 − 1)𝑠²
𝑋2 =
𝜎²
donde n es el tamaño de la muestra, s² la varianza muestral y 𝜎 2 la varianza de la población
de donde se extrajo la muestra. El estadístico ji-cuadrada también se puede dar con la
siguiente expresión:

𝛴(𝑥 − 𝑥)²
𝑋2 =
𝜎²
Ejemplo 1:

Suponga que los tiempos requeridos por un cierto autobús para alcanzar un de sus destinos
en una ciudad grande forman una distribución normal con una desviación estándar σ=1
minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que
la varianza muestral sea mayor que 2.
Ejemplo 2:

Encuentre la probabilidad de que una muestra aleatoria de 35 observaciones, de una


población normal con varianza σ²=6 tenga una varianza muestra:

a. Mayor que 9.1

b. Entre 3.462 y 10.745


Propiedades

1. Los valores de X² son mayores o iguales que 0.

2. La forma de una distribución X² depende del gl=n-1. En consecuencia, hay un


número infinito de distribuciones X².

3. El área bajo una curva chi-cuadrada y sobre el eje horizontal es 1.

4. Las distribuciones X² no son simétricas. Tienen colas estrechas que se extienden


a la derecha; esto es, están sesgadas a la derecha.

5. Cuando n>2, la media de una distribución X² es n-1 y la varianza es 2(n-1).

6. El valor modal de una distribución X² se da en el valor (n-3).

INTERVALO DE CONFIANZA

Si no se conoce el valor de un parámetro poblacional, el mismo se puede estimar a partir


de un intervalo de confianza para dicho parámetro.

A todo intervalo de confianza, calculado a partir de los datos de una muestra aleatoria, se
le fija un nivel de confianza que mide la probabilidad de que el intervalo contenga el
verdadero valor del parámetro.

Ejemplo 3:

La varianza de la resistencia a la rotura de 30 cables probados fue e 32000 lbs². Halle un


intervalo de confianza del 90 por ciento, para la varianza de la resistencia de todos los
cables de esta marca.
FRECUENCIAS ESPERADAS

Las frecuencias esperadas de X² mide la discrepancia entre una distribución observada y


otra teórica (bondad de ajuste), indicando en qué medida las diferencias existentes entre
ambas, de haberlas, se deben al azar en el contraste de hipótesis. También se utiliza para
probar la independencia de dos variables entre sí, mediante la presentación de los datos
en tablas de contingencia.

La fórmula que da el estadístico es la siguiente:

(𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎 − 𝑡𝑒ó𝑟𝑖𝑐𝑎)²
𝑋2 = ∑
𝑡𝑒ó𝑟𝑖𝑐𝑎

Cuanto mayor sea el valor de 𝑋 2 , menos verosímil es que la hipótesis nula sea correcta.
De la misma forma, cuanto más se aproxima a cero el valor de chi-cuadrado, más
ajustadas están ambas distribuciones.

Los grados de libertad gl vienen dados por:

𝑔𝑙 = (𝑟 − 1)(𝑘 − 1)

TABLAS DE CONTINGENCIA

Una tabla de contingencia es una de las formas más comunes de resumir datos
categóricos. En general, el interés se centra en estudiar si existe alguna asociación entre
una variable fila y otra variable columna o calcular la intensidad de dicha asociación.

La tabla bidimensional recibe el nombre de tabla de contingencia cuando las


características en estudio no son cuantitativas.

Una tabla de doble entrada para las variables X e Y con p filas y k columnas:
donde nij expresa la frecuencia absoluta observada en las modalidades Xi e Yj refleja la
distribución conjunta de X e Y.

La misma tabla puede expresarse en frecuencias relativas o proporciones sin más que
dividir cada casilla nij por el total N.

You might also like