Professional Documents
Culture Documents
9/14/2006
Tabulacin Cruzada
El procedimiento de Tabulacin Cruzada esta diseado para resumir dos columnas de datos.
Esta construye una tabla de dos-caminos mostrando las frecuencias de ocurrencia de cada uno de
los pares formados de las dos columnas. Estadsticas son construidas para cuantificar el grado de
asociacin entre las columnas, y pruebas son corridas para determinar si hay dependencia
estadsticamente significante entre las columnas o no. Las frecuencias son mostradas en forma
tabular y graficadas como un grafico de barras, grafico mosaico o grafico tridimensional.
Model
(Modelo)
Integra
Legend
90
100
535i
Century
LeSabre
Roadmaster
Riviera
DeVille
Seville
Cavalier
Type
(Tipo)
Small
Midsize
Compact
Midsize
Midsize
Midsize
Large
Large
Midsize
Large
Midsize
Compact
Passengers
(Pasajeros)
5
5
5
6
4
6
6
6
5
6
5
5
Una tabulacin cruzada ser realizada entre el tipo de vehculo y el nmero de pasajeros que
transporta.
Tabulacin Cruzada - 1
Entrada de Datos
La caja de dialogo de entrada especifica las columnas que contienen los datos que sern
tabulados
Variable Rengln: Columna numrica o no numrica que contiene el atributo usado para
definir los renglones de la tabla.
Variable Columna: Columna numrica o no numrica que contiene el atributo usado para
definir las columnas de la tabla.
Tabulacin Cruzada - 2
Tabla de Frecuencias
La Tabla de Frecuencias muestra la frecuencia de ocurrencia de cada par de valores en las
variables filas y columnas, junto con otra informacin como se defini en la caja de dialogo
Opciones del Panel.
Tabla de Frecuencias para Type por Passengers
2
4
5
6
Compact
0
1
13 2
Large
0
0
0
11
Midsize
0
2
15 5
Small
0
8
13 0
Sporty
2
12 0
0
Van
0
0
0
0
Total por Columna
2
23 41 18
Contenido de las celdas:
Frecuencia Observada
7
0
0
0
0
0
8
8
8
0
0
0
0
0
1
1
Ri = Oij
(1)
j =1
Total de Columnas: El rengln de hasta abajo contiene el total de las columnas Cj:
r
C j = Oij
(2)
i =1
n = Oij
(3)
i =1 j =1
Por ejemplo, 14 de los 93 carros fueron clasificados como Sporty. De estos, 2 son para 2
pasajeros mientras que el resto es para 4 pasajeros.
Tabulacin Cruzada - 3
Oij
Ri
Oij
Cj
(4)
(5)
(6)
Frecuencia Esperada: Eij, el numero esperado de veces que el rengln i habra aparecido
junto con la columna j en le archivo de datos si las clasificaciones del rengln y la columna
fueron independientes:
Eij =
100
Oij
Ri C j
(7)
Oij Eij
(8)
Tabulacin Cruzada - 4
(O
ij
Eij )
(9)
Eij
ij =
(O
ij
Eij )
(10)
(1 Ri ) (1 C j )
Eij
n
n
6
0
0.00%
0.00%
0.00%
2.71
-2.71
2.71
-1.99
18
19.35%
7
0
0.00%
0.00%
0.00%
1.20
-1.20
1.20
-1.25
8
8.60%
8
0
0.00%
0.00%
0.00%
0.15
-0.15
0.15
-0.42
1
1.08%
Row Total
14
15.05%
93
100.00%
Los 12 carros Sporty en los datos del ejemplo de dos pasajeros representan:
12.90% del total de n = 93 carros
85.71% de los 14 carros Sporty
52.17% de los 23 carros de 4 pasajeros
El rengln y la columna fueron clasificaciones independientes, el nmero esperado de carros que
deberan ser Sporty y de 4 pasajeros es 3.46, con una desviacin de 8.54. En los clculos de
estadstica Chi-cuadrada, descrita mas abajo, esta celda adhiere un total de 21.05 a esta
estadstica. Los residuos ajustados indican que los nmeros observados de carros en esta celda es
5.74 desviaciones estndar sobre su valor esperado.
Tabulacin Cruzada - 5
Diagrama de Barras
Una manera comn para mostrar los datos es usando un diagrama de barras mltiple.
Diagrama de Barras para Type segn Passengers
15
Passengers
2
4
5
6
7
8
frecuencia
12
9
6
3
0
Compact
Large
Midsize
Small
Type
Sporty
Van
La altura de cada barra en la grafica anterior representa el nmero de carros de cada tipo que
acarrean cada nmero de pasajeros.
Opciones del panel
Tipo de Grafico: Las barras pueden estar conglomeradas como se muestra en el ejemplo o
apiladas una sobre otra.
Escala: Si la escala del eje muestra las frecuencias Oij o el porcentaje dado por
Tabulacin Cruzada - 6
Oij
n
(11)
Compact
Type
Large
Midsize
Small
Sporty
Van
0
12
frecuencia
16
20
24
Grafico de Mosaico
Una interesante variacin del diagrama de barras es si lo ancho y la altura de cada barra son
escalados para representar las frecuencias de las celdas correspondientes en la tabla.
Grfico de Mosaico para Type segnPassengers
Compact
Large
Midsize
Passengers
2
4
5
6
7
8
Small
Sporty
Van
En este grafico el tamao de cada rengln es proporcional a su total de rengln Ri. el ancho de
cada barra dentro de cada rengln es proporcional a la frecuencia de cada celda dentro de ese
2005 por StatPoint, Inc.
Tabulacin Cruzada - 7
Diagrama Tridimensional
Todas las celdas de frecuencias pueden tambin ser representadas usando barras verticales.
15
12
9
6
3
0
8
7
2
Van
Sporty
4
Small
Midsize
Large
6
5 Passengers
Compact
frecuencia
Type
Tabulacin Cruzada - 8
Pruebas de Independencia
Una pregunta comn acerca de los datos en una tabla es si los renglones y columnas son o no
independientes, es decir el hecho que un objeto caiga en un rengln particular no afecta la
probabilidad de que caiga en una columna dada. En el ejemplo actual. Independencia implicara
que el tipo de vehculo no tiene relacin con el nmero de pasajeros que transportan.
Prueba Chi-cuadrada
La prueba mas comn para independencia es la prueba chi-cuadrada. Esta prueba compara las
frecuencias esperadas y observadas calculando:
r
=
2
i =1 j =1
(O
ij
Eij )
(12)
Eij
Tabulacin Cruzada - 9
Resumen Estadstico
Varias estadsticas pueden tambin ser calculadas midiendo los grados de asociacin entre
renglones y columnas.
Resmen Estadstico
Estadstico
Lambda
Coef. de Incertidumbre
Somer's D
Eta
Simtrico
0.4715
0.5303
-0.2022
Estadstico
Coef. De Contingencia
Cramer's V
Gamma Condicional
Pearson's R
Kendall's Tau b
Kendall's Tau c
Valor
0.8246
0.6519
-0.2428
0.0001
-0.2028
-0.1840
Con Filas
Dependientes
0.3803
0.4730
-0.2193
0.0001
Con Columnas
Dependientes
0.5962
0.6034
-0.1876
0.8810
Valor-P
Gl
0.0001
0.0174
91
Como un ejemplo, V de Cramer es una estadstica que mide el grado de asociacin entre los
valores de las variables rengln y columna en una escala de 0 a 1, es basada en la prueba
estadstica usual chi-cuadrada. A diferencia de la estadstica coeficiente de contingencia, esta
puede alcanzar el valor 1 para todas las tablas.
Detalles sobre estas pruebas estn contenidos en la documentacin del procedimiento Tablas de
Contingencia.
Razn de Momios
El panel Razn de Momios provee informacin especial sobre casos donde hay exactamente 2
renglones y 2 columnas. Para un ejemplo sobre esto, ver la documentacin del procedimiento
Tablas de Contingencia
Grabar Resultados
Los siguientes resultados pueden ser guardados en una hoja de datos:
1. Celda de Frecuencias (una columna) Las frecuencias de celdas Oij en una sola
columna, un rengln despus de otro.
2. Etiquetas de las Filas Los identificadores para cada rengln de la tabla.
3. Etiquetas de las Columnas Los identificadores para cada columna de la tabla.
4. Frecuencias de Celdas (matriz) - Las frecuencias de celdas Oij en mltiples columnas,
paralelas al formato de la tabla.
2005 por StatPoint, Inc.
Tabulacin Cruzada - 10