You are on page 1of 3

La correlacin lineal (Pearson)

Propsito
La correlacin es una medida de la relacin entre dos o ms variables. Las escalas de
medicin utilizados deben ser al menos escalas de intervalo, pero otros coeficientes
de correlacin estn disponibles para manejar otros tipos de datos. Los coeficientes de
correlacin pueden variar -1,00 a 1,00. El valor de -1.00 representa una correlacin
negativa perfecta, mientras que un valor de 1,00 representa una correlacin positiva
perfecta. un valor de 0,00 representa una falta de correlacin.
El tipo de coeficiente de correlacin ms ampliamente utilizado es r de Pearson,
tambin llamada correlacin producto-momento lineal o.
Resultados
Uno de los resultados es matriz de coeficientes de correlacin (r) en el archivo
EXCEL.
El tipo ms ampliamente utilizado de coeficiente de correlacin de Pearson es r
(Pearson, 1896), tambin llamado correlacin producto-momento (el trmino
correlacin fue utilizado por primera vez por Galton, 1888) o lineal. El uso de un
lenguaje no tcnico, se puede decir que la correlacin . coeficiente determina el grado
en que los valores de dos variables son "proporcionales" entre s el valor de la
correlacin (es decir, el coeficiente de correlacin) no depende de las unidades de
medida especficos utilizados, por ejemplo, la correlacin entre la altura y el peso ser
idntica independientemente de si pulgadas y libras o centmetros y kilogramos se
utilizan como unidades de medida proporcional significa linealmente relacionada; .. es
decir, la correlacin es alta si puede ser aproximada por una lnea recta (inclinada
hacia arriba o hacia abajo) Esta lnea se llama la lnea de regresin o menos lnea de
cuadrados, porque se determina de tal manera que la suma de las distancias al
cuadrado de todos los puntos de datos de la lnea es el ms bajo posible. correlacin
de Pearson asume que las dos variables se miden en escalas de al menos de intervalo.
Ho: muestra aceptada o rechazada hiptesis nula (hiptesis acerca de la no existencia
de una diferencia entre las muestras de la poblacin). La hiptesis nula se rechaza si
las estadsticas de prueba es el valor crtico bruto o igual. Es decir, si dice acpetada,
quiere decir que tienen las mismas medias.
Valor crtico - valor crtico estadsticas, se puede construir usando la distribucin t de
Student con n - 2 grados de libertad.

Cmo interpretar el valor de las correlaciones.


Como se ha mencionado antes, el coeficiente de correlacin (r) representa la relacin
lineal entre dos variables. Si se eleva al cuadrado del coeficiente de correlacin,
entonces el valor resultante (r, el coeficiente de determinacin) representar la
proporcin de variacin comn en las dos variables (es decir, la "fuerza" o "magnitud"
de la relacin). con el fin de evaluar la correlacin entre las variables, es importante
saber esto "magnitud" o "fuerza", as como la importancia de la correlacin.
Importancia de correlaciones.
El nivel de significacin calculado para cada correlacin es una fuente primaria de
informacin sobre la fiabilidad de la correlacin. Como se explic antes (ver conceptos
elementales), la importancia de un coeficiente de correlacin de una magnitud
particular, cambiar dependiendo del tamao de la muestra de la que se calcula. la
prueba de significacin se basa en la suposicin de que la distribucin de los valores
residuales (es decir, las desviaciones de la lnea de regresin) para la variable
dependiente y sigue la distribucin normal, y que la variabilidad de la el valor residual
es el mismo para todos los valores de la variable independiente x. sin embargo, los
estudios de Monte Carlo sugieren que la satisfaccin de esas suposiciones
estrechamente no es absolutamente crucial si el tamao de la muestra no es muy
grande. es imposible formular recomendaciones precisas sobre la base de los Monte
Carlo resultados, pero muchos investigadores siguen una regla de oro que si el tamao
de la muestra es de 50 o ms, entonces es poco probable que los sesgos graves, y si el
tamao de la muestra es de ms de 100, entonces debera no estar preocupado en
absoluto con los supuestos de normalidad.
Los valores atpicos. Los valores atpicos son atpicos (por definicin), observaciones
poco frecuentes. Debido a la forma en que se determina la lnea de regresin
(especialmente el hecho de que se basa en la minimizacin no la suma de las
distancias simples pero la suma de los cuadrados de las distancias de los puntos de
datos de la lnea), valores atpicos tienen una profunda influencia en la pendiente de la
lnea de regresin y en consecuencia sobre el valor del coeficiente de correlacin. un
nico valor atpico es capaz de cambiar considerablemente la pendiente de la lnea de
regresin y, en consecuencia, el valor de la correlacin . Tenga en cuenta, que como se
muestra en esta ilustracin, slo un valor atpico puede ser el nico responsable de un
alto valor de la correlacin que de otro modo (sin el valor atpico) sera cercano a
cero. no es necesario decir, uno nunca debe basar conclusiones importantes sobre el
valor del coeficiente de correlacin sola (es decir, el examen de la respectiva diagrama
de dispersin se recomienda siempre).
Enfoque Cuantitativo sobre valores atpicos. Algunos investigadores utilizan mtodos
cuantitativos para excluir valores atpicos. Por ejemplo, se excluyen las observaciones
que estn fuera del rango de 2 desviaciones estndar (o incluso 1.5 SD) en torno a
la celda de grupo o diseo significar. En algunas reas de investigacin , como
"limpieza" de los datos es absolutamente necesario. Por ejemplo, en la investigacin

de la psicologa cognitiva en los tiempos de reaccin, aunque casi todos los puntajes
de un experimento estn en el rango de 300 a 700 milisegundos, a pocos "reacciones
distrados" de 10 -15 segundos van a cambiar por completo el panorama general.
Lamentablemente, la definicin de un valor atpico es subjetiva (como debe ser), y las
decisiones relativas a cmo identificarlos deben hacerse sobre una base individual
(teniendo en cuenta los paradigmas experimentales especficas y / o "la prctica
aceptada "y la experiencia general de la investigacin en el rea respectiva). tambin
hay que sealar que en algunos casos raros, la frecuencia relativa de los valores
atpicos a travs de una serie de grupos o clulas de un diseo puede ser sometido a
anlisis y proporcionar resultados interpretables. para ejemplo, datos anmalos
puede ser indicativa de la ocurrencia de un fenmeno que es cualitativamente
diferente que el patrn tpico observado o esperado en la muestra, por lo tanto la
frecuencia relativa de los valores atpicos podra proporcionar evidencia de una
frecuencia relativa de salida del proceso o fenmeno que es tpico para la mayora de
los casos en un grupo.
Relaciones lineales entre las variables
Otra fuente potencial de problemas con el lineal (Pearson r) de correlacin es la forma
de la relacin Como se mencion anteriormente, las medidas de r de Pearson una
relacin entre dos variables slo en la medida en que es lineal; desviaciones de la
linealidad aumentar la suma total de las distancias al cuadrado de la recta de
regresin, incluso si representan una relacin "verdadera" y muy cerca entre dos
variables. la posibilidad de este tipo de relaciones no lineales es otra razn por el
examen de los diagramas de dispersin es un paso necesario en la evaluacin de cada
correlacin .

You might also like