You are on page 1of 6

Chi- cuadrado como prueba de asociacin de variables

I. La lgica que sigue la prueba

Supongamos que un investigador est interesado en evaluar la asociacin entre uso de


cinturn de seguridad en vehculos particulares y el nivel socioeconmico del conductor
del vehculo. Con este objeto se toma una muestra de conductores a quienes se clasifica
en una tabla de asociacin, encontrando los siguientes resultados:
Uso de cinturn

SI

NO

TOTAL

Nivel
socioeconmico
bajo
Nivel
socioeconmico
medio
Nivel
socioeconmico
alto
TOTAL

13

21

15

16

31

28

14

42

51

43

94

Tabla I. Tabla de asociacin, valores observados.

Permiten estos datos afirmar que el uso del cinturn de seguridad depende del nivel
socioeconmico? Usaremos un nivel de significacin alfa=0,05.
Los pasos del anlisis estadstico en este caso son los siguientes:
1. En primer lugar se debe plantear las hiptesis que someteremos a prueba
H0: El uso de cinturn de seguridad es independiente del nivel socioeconmico.
H1: El uso de cinturn de seguridad depende del nivel socioeconmico.
En esta prueba estadstica siempre la hiptesis nula plantea que las variables analizadas
son independientes.
2. En segundo lugar, obtener (calcular) las frecuencias esperadas
Estas son las frecuencias que debieran darse si las variables fueran independientes, es
decir, si fuera cierta la hiptesis nula.
Las frecuencias esperadas se obtendrn de la distribucin de frecuencias del total de los
casos, 51 personas de un total de 94 usan el cinturn y 43 de 94 no lo usan. Esa misma
proporcin se debera dar al interior de los tres grupos de nivel socioeconmico, de
manera que el clculo responde al siguiente razonamiento: si de 94 personas 51 usan
cinturn; de 21 personas, cuntas debieran usarlo?

Tomado de Quevedo F. The chi-square. Medwave 2011 Dic;11(12):e5266 doi:


10.5867/medwave.2011.12.5266

La respuesta a esta pregunta se obtiene aplicando la regla de tres y es 11,4. Este


procedimiento debe repetirse con todas las frecuencias del interior de la tabla.
El detalle de los clculos es el siguiente:
Nivel bajo: (21 x 51 / 94) = 11,4 y (21 x 43 / 94) = 9,6
Nivel medio: (31 x 51 / 94) = 16,8 y ( 31 x 43 / 94)= 14,2
Nivel alto: (42 x 51 / 94) = 22,8 y (42 x 43 / 94) = 19,2
Estas son las frecuencias que debieran presentarse si la hiptesis nula fuera verdadera y,
por consiguiente, las variables fueran independientes.
Estos valores los anotamos en una tabla con las mismas celdas que la anterior; as
tendremos una tabla con los valores observados y una tabla con los valores esperados,
que anotaremos en cursiva, para identificarlos bien.
Uso de cinturn

SI

NO

TOTAL

Nivel
socioeconmico
bajo
Nivel
socioeconmico
medio
Nivel
socioeconmico
alto
TOTAL

11,4

9,6

21

16,8

14,2

31

22,8

19,2

42

51

43

94

Tabla II. Tabla de asociacin, valores esperados.

3. En tercer lugar se debe calcular el estadstico de prueba


En este caso, el estadstico de prueba es Chi-cuadrado que, como dijimos al comienzo,
compara las frecuencias que entregan los datos de la muestra (frecuencias observadas)
con las frecuencias esperadas, y tiene la siguiente frmula clculo:

donde oi representa a cada frecuencia observada y ei representa a cada frecuencia


esperada.
De este modo el valor del estadstico de prueba para este problema ser:

Entonces,
. Este es el valor de nuestro estadstico de prueba que ahora,
siguiendo el procedimiento de problemas anteriores (paso 4), debemos comparar con un
valor de la tabla de probabilidades para chi-cuadrado (x2). Esta tabla es muy parecida a
la tabla t de Student, pero tiene slo valores positivos porque chi-cuadrado slo da
2

resultados positivos. Vase grfico 1, que muestra la forma de la curva, con valores
desde 0 hasta infinito.

Grfico 1.

Dado que el estadstico chi cuadrado slo toma valores positivos, la zona de rechazo de
la hiptesis nula siempre estar del lado derecho de la curva.
Uso de tabla chi-cuadrado
La tabla de chi-cuadrado tiene en la primera columna los grados de libertad y en la
primera fila la probabilidad asociada a valores mayores a un determinado valor del
estadstico (vase grfico de la tabla III).
Los grados de libertad dependen del nmero de celdas que tiene la tabla de asociacin
donde estn los datos del problema y su frmula de clculo es muy sencilla:
Grados de libertad (gl)=(n de filas1)x(n de columnas1)
As, en nuestro ejemplo, en que hay 2 filas y 3 columnas, los grados de libertad sern:
gl=(2-1)x(3-1)=2
Ntese que no se consideran la fila ni la columna de los totales.
Al comienzo elegimos un nivel de significacin alfa=0,05. Entonces un valor de tabla
para x2 asociado a 2 grados de libertad y alfa 0,05 es 5,99.
Por lo tanto, como en el grfico 2 vemos que 5,23 se encuentra a la izquierda de 5,99, la
probabilidad asociada a valores superiores a 5,23 es mayor que alfa (0,05).

Grfico 2.

Segn esto, debemos aceptar la hiptesis nula que plantea que las variables uso de
cinturn de seguridad y nivel socioeconmico son independientes. Limitacin: como
norma general, se exige que el 80% de las celdas en una tabla de asociacin tengan
valores esperados mayores de 5.

Tabla III. Tabla de chi-cuadrado.

II. Usando un programa de anlisis estadstico


Los programas estadsticos hacen el engorroso clculo, y nos ofrecen outputs que
incluyen el valor del chi2 (es decir, el resultado del clculo detallado en la seccin
anterior) y el valor de probabilidad o grado de determinacin correspondiente.
De ellos, vamos a considerar si el valor del chi2 es menor al valor de tabla (recordar
que era 5.99):
Si no lo es, no se puede sostener que haya asociacin entre las variables (o lo
que es lo mismo, no puede refutarse la hiptesis nula de independencia entre
ellas).
Si lo es, podemos pensar que existe una asociacin (es decir, refutamos la
hiptesis nula)
O, lo que vendra a ser lo mismo, analizamos el valor de probabilidad; si se trabaja con
un nivel de confianza del 95%, que se corresponde con un nivel de significacin del
0.05 (), tenemos que ver si el valor de probabilidad es menor al que se toma por
referencia.
En el ejemplo, 0.073 > 0.05, por lo que no puede afirmarse que exista asociacin (no se
puede rechazar la hiptesis nula.
Vamos a ver, sobre el ejemplo visto arriba, cmo los distintos programas muestran los
resultados del procesamiento. Algunos dan tambin las respectivas tablas de
contingencia.
SPSS:
Tabla de contingencia Uso de cinturn * Nivel Socioeconmico
Recuento
Nivel Socioeconmico
Uso de
cinturn

NO
S

NSE Bajo
13

NSE Medio
16

NSE Alto
14

15

28

51

21

31

42

94

Total

Total
43

Pruebas de chi-cuadrado

Chi-cuadrado de Pearson
Razn de verosimilitud
Asociacin lineal por lineal
N de casos vlidos

Valor
5,247(a)
5,310
5,064

gl
2
2
1

Sig. asinttica
(bilateral)
,073
,070
,024

94

(a) 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 9,61.

InfoStat:

EpiInfo:

NSE
NSE Alto
Row %
Col %
NSE Bajo
Row %
Col %
NSE Medio
Row %
Col %
TOTAL
Row %
Col %

Uso del cinturn


NO
S
14
28
33,3
66,7
32,6
54,9
13
8
61,9
38,1
30,2
15,7
16
15
51,6
48,4
37,2
29,4
43
51
45,7
54,3
100
100

TOTAL
42
100
44,7
21
100
22,3
31
100
33
94
100
100

Single Table Analysis


Chi-square
5,2466

df
2

Probability
0,0726

You might also like