Professional Documents
Culture Documents
ISSN 1870-557X
Concepto
En las investigaciones, existe un inters en conocer si existe asociacinn de algn tipo ya sea
positiva o negativa entre variables bajo el estudio. La tcnica de correlacin se encarga a
determinar este grado de asociacin o correlacin (Badii et al, 2007, 2009). Fue Pearson
(Pearson, 1929) quien descubri la ecuacin de correlacin paramtrica y tambin fue l que
determin la ecuacin del coeficiente de correlacin el cual mide el grado de correlacin entre
dos variables X y Y. El coeficiente de correlacin flucta de -1 indicando una correlacin
negativa perfecta de 100%, hasta +1 que a su vez indica una correlacin de 100% pero en este
caso positiva. Cabe indicar que en el caso de correlacin negativa, un aumento en una variable
se asocia con un decremento en otra variable, y en el caso a la correlacin positiva ocurre
contrario a lo mencionado anteriormente. Correlacin paramtrica se aplica para casos en
donde la distribucin de los datos sigue una curva Gausiana o normal. Sin embargo, los datos
conseguidos en las ciencias naturales y ciencias sociales, raramente se ajustan a la curva
normal, y por esto cuando se tarat de estudiar el grado de correlacin en estas ciencias uno
debe utilizar tcnicas de correlacin no-paramtrica, las cuales son libre de distribucin, es
decir, no existe la necesidad de que los datos tengan una distribucin normal. En este trabajo
se desciben y discuten con ejemplos en forma detallada y paso por paso el uso y la aplicacin
de las tcnicas de correlacin no-paramtricas (Spearman, 1904, kendall, 1938, Zar, 1973).
CORRELACIN DE SPEARMAN
Cuando las dos variables bajo del estudio de correlacin no tienen distribucin normal se
proceder con los rangos de mediciones para cada variable. Hay dos mtodos de rango de
correlacin, uno de Spearman (1904) y otro de kendall (Kendall, 1938, Kendall & BabingtonSmith, 1939).
En caso de rango de correlacin de Spearman, despus de dar los rangos a cada medicin de la
variable se usar la ecuacin siguiente para proceder con la operacin.
31
Daena: International Journal of Good Conscience. 9(2)31-40. Agosto 2014. ISSN 1870-557X
Rango de
Yi
Di
(Xi Yi)
di2
7
1
2
8
3
9
6
10
5
4
-4
0
5
0
-1
-4
3
0
-1
2
16
0
25
9
1
16
9
0
1
4
n = 10
di2 = 72
rs = 1 [6 di2 / (n3 n)] = 1 [6(72) / (103 - 10)] = 1 0.436 = 0.564
Ho: rs = 0
Ha: rs 0
(rs)0.05(2), 10 = 0.648
El valor 0.648 viene de la Tabla de Spearman con n = 10 y = 0.05 para prueba bilateral.
Valor calculado (0.564) es menor que valor tabulado (0.648), y por tanto Ho se acepta a nivel
de = 0.05, es decir con 95% de confianza se dictamina que no hay correlacin entre las
calificaciones de dos materias.
Ejemplo. Prueba de Rango de Spearman con empates.
Los datos siguientes (Tabla 2) representan la longitud de ala (Xi) y de cola (Yi) de 12 aves.
32
Daena: International Journal of Good Conscience. 9(2)31-40. Agosto 2014. ISSN 1870-557X
Rango de Yi
5.0
7.0
11.0
2.5
5.0
1.0
5.0
2.5
9.5
8.0
9.5
12.0
di
-1.0
1.5
-1.0
-1.0
-2.0
0.5
2.0
2.5
-1.0
3.0
-3.5
0.0
di2
1.00
2.25
1.00
1.00
4.00
0.25
4.00
6.25
1.00
9.00
12.25
0.00
n = 12
di2 = 42
rs = 1 [6 di2 / (n3 n)] = 1 [6(42) / (123 -12)] = 1 -0.147 = 0.853
Ho: rs = 0
Ha: rs 0
(rs)0.05(2),12 = 0.587 este valor viene de la Tabla de Spearman con n = 12 y = 0.05 para prueba
bilateral.
Valor calculado (0.853) es mayor que valor tabulado (0.583), y por tanto Ho se Rechaza a
nivel de = 0.05, es decir, con 95% de confianza s existe una correlacin positiva entre las
mediciones o valores de Xi y Yi.
COEFICIENTE TAU () DE KENDALL
El coeficiente tau () de kendall est basada ms en los intervalos jerarquizados de las
observaciones que los propios datos, esto hace que la distribucin de sea independiente de la
que presentan las variables X y Y, siempre y cuando que los datos representados por estas 2
variables sean (1) independientes y (2) continuas. Este coeficiente es ms preferida por
algunos investigadores que el de Spearman, pero es ms difcil de calcular, pero con una
ventaja de que el tiende ms rpido a la distribucin normal que el de Spearman,
especialmente, en el caso de la certeza de Ho.
Ecuacin.
= (Sa Sb) / [n(n -1) / 2]
Donde,
= Estadstica de Kendall
n = # de casos en el ejemplo
Sa = Sumatoria de rangos ms altos
Sb = Sumatoria de rangos ms bajos
Ejemplo. En una evaluacin de los jugadores delanteros de futbol en de un pas, hay 9 de
ellos catalogados como ms intensos para marcar goles. Para analizar esta intensidad durante
un periodo de una temporada se registro sistemticamente el grado de intensidad de cada uno
33
Daena: International Journal of Good Conscience. 9(2)31-40. Agosto 2014. ISSN 1870-557X
de estos delanteros tanto en juegos a nivel nacional (NP = puntajes nacional), como a nivel
internacional (IP = puntajes en juegos internacionales). Adems, se registraron los rangos a
nivel nacional (NR = rangos a nivel nacional) y en a nivel internacional (IR = rango a nivel
internacional). Los datos se presentan en la Tabla 3. Los rangos se ordenan de mxima a
mnima hacia abajo en cada columna de rango.
Tabla 3. Datos de grado de agresividad en la guardera y el hogar.
Jugador
NP
IP
84
60
1
80
64
2
78
71
3
76
61
4
70
58
5
64
57
6
62
54
7
50
55
8
47
52
9
NR
1
2
3
4
5
6
7
8
9
IR
4
2
1
3
5
6
8
7
9
Procedimiento.
Paso 1.
Se considera el IR como referencia y comienza a contabilizar a partir del primer rango, es
decir, el rango con el valor de 4 y cuenta el nmero de los rangos menores que 4 (hacia debajo
de 4): en este caso los tres nmeros de 2, 1, y 3, es decir tenemos 3 valores menores que el
valor 4. Luego cuentan los rangos mayores de 4 a partir e incluyendo el nmero 5, as tenemos
los valores 5, 6, 8, 7, y 9, es decir, hay 5 rangos mayores que el valor 4. Se contina as
contabilizar los rangos menores y mayores para los siguientes valores de la columna de IR, es
decir, a partir del valor 2 en adelante. De esta manera se generan los valores de las 2 columnas
de Sa (sumatoria de rangos ms altos) y Sb (sumatoria de rangos ms bajos, Tabla 4).
Tabla 4. Datos de grado de agresividad en la guardera y el hogar y los de Sa y Sb*.
Jugador
NP
IP
NR
IR
Sa = 31
84
60
1
4
5
1
80
64
2
2
6
2
78
71
3
1
6
3
76
61
4
3
5
4
70
58
5
5
4
5
64
57
6
6
3
6
62
54
7
8
1
7
50
55
8
7
1
8
47
52
9
9
0
9
*: Sa = sumatoria de rangos ms altos, Sb = sumatoria de rangos ms bajos.
Sb = 5
3
1
0
0
0
0
1
0
0
Ahora substituir en la ecuacin de Kendall resulta: = (Sa Sb) / [n(n -1) / 2] = (31 5) /
[9(9 1)/2] = 26 / 36 = 0.72, hay una asociacin de 72%.
COEFICIENTE DE CONCORDANCIA () DE KENDALL
34
Daena: International Journal of Good Conscience. 9(2)31-40. Agosto 2014. ISSN 1870-557X
Procedimiento.
1. Sumar los rangos por cada objeto, es decir, arrojar finalmente, R = 60.
35
Daena: International Journal of Good Conscience. 9(2)31-40. Agosto 2014. ISSN 1870-557X
5
3
1
2
4
4
3
2
1
5
5
2
1
3
4
5
3
2
1
4
19
11
6
7
17
total = 60
7
1
6
5
5
D2
49
1
36
25
25
=136
R = [mn(n + 1)] / 2
60 = 4*5*6 / 2
60 = 120 / 2 = 60
COEFICIENTE DE CORRELACIN (RBS) BI-SERIAL DE PUNTOS
Este coeficiente es una medida de asociacin entre 2 variables continuas, en donde una de
ellas es dicotmica. La variable dicotomizada se supone discreta o discontinua cuando trata de
relacionarse con la que permanece continua.
Ecuacin
rbs = n(fcX) nc(fX) / {(nc)(fi) [n((fX)2 (fX)2]}1/2
Donde,
36
Daena: International Journal of Good Conscience. 9(2)31-40. Agosto 2014. ISSN 1870-557X
Tabla 7. Resultados del examen de 40 preguntas (X) y sus frecuencias (f) (n = 100).
X
f
40
2
38
4
37
6
36
12
32
12
31
10
30
12
28
10
27
10
25
4
24
4
22
3
20
3
18
3
16
2
12
2
10
1
Durante la realizacin del examen se enfatiz la pregunta # 23, es decir, el criterio para
evaluar era correcto o incorrecto. Se calcul el coeficiente rbp va puntuaciones obtenidas por
100 alumnos en la prueba X y tambin la respuesta a la pregunta # 23 lo cual se dicotomiz
como incorrecto-correcto.
Procedimiento
Se calculan los valores de fc y fi (Tabla 8).
37
Daena: International Journal of Good Conscience. 9(2)31-40. Agosto 2014. ISSN 1870-557X
Daena: International Journal of Good Conscience. 9(2)31-40. Agosto 2014. ISSN 1870-557X
Total
2
1
3
0
2
1
15
2
21
13
16
28
26
20
16
GT = 90
Daena: International Journal of Good Conscience. 9(2)31-40. Agosto 2014. ISSN 1870-557X
Kendall, M.G. 1938. A new measure of rank correlation. Biometrika, 30: 81-93.
Kendall, M.G. & B. Babington-Smith. 1939. The problem of m rankings. Ann. Math. Statist.
18: 495-513. 1939.
Pearson, K. 1920. Notes on the history of correlation. Biometrika, 25-45.
Prez Tejada, H.E. 2008. Estadstica para las Ciencias Sociales, del Comportamiento y de la
Salud. Cengae Learninig. Auatralia.
Spearman, C. 1904. The proof and measurement of association between two things. Am. J.
Psychol. 15: 72-101.
Zar, J.H. 1973. Significance testing of the Spearman Rank Correlation Coefficient. J. Amer.
Statist. Assoc. 67: 578-580.
40