You are on page 1of 41

Anlisis de correlacin y regresin

lineal

Introduccin
Durante

el tema de pruebas de
hiptesis
,
nicamente
se
hicieron inferencias o hiptesis
sobre una media poblacional o
proporcin poblacional.

Anlisis de correlacin y regresin lineal


M.A. Jos Antonio Velzquez Jurez

Sin

embargo, esto se hizo


solamente utilizando una sola
variable como la ganancia por la
venta de un activo fijo, el ingreso
de los empleados de una
empresa o el nmero de alumnos
aceptados cada semestre en una
universidad.
Anlisis de correlacin y regresin
lineal M.A. Jos Antonio Velzquez
Jurez

La

importancia de este tema


radica en conocer la relacin
entre 2 variables, las cuales
proporcionen informacin sobre
la tendencia que suelen seguir.

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

Anlisis de correlacin

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

Definicin
Es

un grupo de tcnicas que sirve


para medir la asociacin entre
dos variables (Lind, 2008)
El primer paso para iniciar el
anlisis es realizar un diagrama
de dispersin.

Anlisis de correlacin y regresin


lineal simple
M.A. Jos Antonio Velzquez Jurez

Diagramas de dispersin con


correlacin negativa perfecta y
correlacin positiva perfecta

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

Caractersticas del coeficiente de


correlacin
Medida

del nivel de relacin


lineal entre dos variables
Se expresa con la letra minscula
r
Indica la direccin y fuerza de la
recta entre dos variables en una
escala de intervalo
Vara de -1 a +1 inclusive
Anlisis de correlacin y regresin
lineal M.A. Jos Antonio Velzquez
Jurez

Variables dependiente e
independiente
Variable

independiente
(X)
proporciona la base para la
estimacin, es decir es la variable
predictora.
Variable dependiente (Y) es la
variable que se desea predecir o
estimar, la cual muestra que para
cada valor dado a X, puede haber
diversos resultados en la variable
Y
Anlisis de correlacin y regresin
lineal M.A. Jos Antonio Velzquez
Jurez

La

siguiente tabla muestra el


nmero de llamadas hechas por
10 empleados de un call center
bancario y la cantidad de tarjetas
de crditos vendidas en un mes.

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

Cmo se emplea el coeficiente


de correlacin?
Empleado

X
Llamadas

1
2
3
4
5
6
7
8
9
10
Media

Y
Tarjetas de
Crdito
vendidas
20
40
20
30
10
10
20
20
20
30

30
60
40
60
30
40
40
50
30
70

22

45

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

Elaborar un diagrama de
dispersin entre x=22
XyY
#REF!
80
70
60

y=45

50
Tarjetas de crdito vendidas

40

#REF!

30
20
10
0
18

20

22

24

26

28

30

32

Llamadas de ventas
Anlisis de correlacin y regresin
lineal M.A. Jos Antonio Velzquez
Jurez

Relacin positiva de las


variables
En

esta situacin, las dos


variables presentan una relacin
positiva, ya que las variables x y
y se encuentran por encima de la
media.

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

Relacin nula de las


variables
En

el supuesto de que no hubiera


una relacin lineal entre las dos
variables, los puntos en el
diagrama
de
dispersin
aparecern
en
los
cuatro
cuadrantes.
Los productos negativos de (X-)*(Y-)
equilibran
los
productos
positivos, por lo cual la suma es
cero
Anlisis de correlacin y regresin
lineal M.A. Jos Antonio Velzquez
Jurez

Relacin negativa de las


variables
Si

las dos variables tienen una


relacin inversa, una variable
estar arriba y la otra debajo de
la media.
En este caso, la mayora de los
puntos se ubican en los
cuadrantes superior izquierdo e
inferior derecho, es decir, en los
cuadrantes II y IV.
Anlisis de correlacin y regresin
lineal M.A. Jos Antonio Velzquez
Jurez

Clculo de las desviaciones de la


media y sus productos

Media

X-

Y-

(X-)*(Y-)

20
40

30

20-22=-2

30-45= -15

-2*-15= 30

60

40-22=18

60-45=15

18*15=270

20

40

20-22= -2

-5

10

30

60

15

120

10

30

-12

-15

180

10

40

-12

-5

60

20

40

-2

-5

10

20

50

-2

-10

20

30

-2

-15

30

30

70

25

200

220/10=
22

450/10=45

Sumatoria:
Anlisis de correlacin y regresin
900
lineal M.A. Jos Antonio Velzquez
Jurez

Clculo de Coeficiente de
correlacin
Creado

por Karl Pearson en 1900


Describe el nivel de relacin
entre dos conjuntos de variables
en escala de intervalo o de razn.
Se designa con la letra r y con
frecuencia se le conoce como r
de Pearson
Puede adoptar cualquier valor de
-1.00 a +1.00
Anlisis de correlacin y regresin
lineal M.A. Jos Antonio Velzquez
Jurez

Diagrama sobre la fuerza y la


direccin del coeficiente de
correlacin

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

Interpretacin del coeficiente de


correlacin.
Valor
Significado
-1
Correlacin negativa grande y perfecta
-0,9 a -0,99
Correlacin negativa muy alta
-0,7 a -0,89
Correlacin negativa alta
-0,4 a -0,69
Correlacin negativa moderada
-0,2 a -0,39
Correlacin negativa baja
-0,01 a -0,19
Correlacin negativa muy baja
0
Correlacin nula
0,01 a 0,19
Correlacin positiva muy baja
0,2 a 0,39
Correlacin positiva baja
0,4 a 0,69
Correlacin positiva moderada
0,7 a 0,89
Correlacin positiva alta
0,9 a 0,99
Correlacin positiva muy alta
1
Correlacin positiva grande y perfecta
Anlisis de correlacin y regresin
lineal M.A. Jos Antonio Velzquez
Jurez

Frmula Coeficiente de
Pearson
R=
Ejemplo
==0.759

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

Interpretacin del
resultado
La correlacin obtenida de 0.759
tiene una relacin positiva, ya que
se observa un impacto directo de
la variable X (Llamadas hechas)
sobre la variable Y (Tarjetas de
Crdito vendidas), lo cual confirma
el razonamiento basado en el
diagrama de dispersin, que el
valor 0.759 est cercano a 1,
mostrando una correlacin positiva
alta.
Anlisis de correlacin y regresin
lineal M.A. Jos Antonio Velzquez
Jurez

Consideraciones al interpretar el
resultado
El

coeficiente de Pearson solo


muestra si
existe o no una
relacin o asociacin entre las
variables X y Y.
El resultado no indica en ningn
momento que un cambio en una
variable
provoque
una
modificacin sobre la otra.
Anlisis de correlacin y regresin
lineal M.A. Jos Antonio Velzquez
Jurez

Prueba de la importancia del


coeficiente de correlacin
Sirve

para saber si la correlacin


entre la poblacin elegida para
obtener la muestra es 0.
Funciona
principalmente para
saber si el resultado obtenido de
la correlacin es verdadero y no
es producto de la casualidad o
azar.
Anlisis de correlacin y regresin
lineal M.A. Jos Antonio Velzquez
Jurez

Planteamiento de
hiptesis

Ho:
(La correlacin entre la
poblacin es cero)
H1: p 0 (La correlacin entre la
poblacin es diferente de cero)

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

Frmula para calcular la prueba de


importancia del coeficiente de correlacin.

t=
Con n-2 grados de libertad
r=Valor de la correlacin
n= muestra

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

A partir de un nivel de significancia


de 5%, la regla de decisin indica
en este caso si el valor calculado
de t est entre +2.306 y
-2.306.
Para ubicar el valor crtico de
2.306, es necesario revisar la tabla
t para gl=n-2=10-2=8
Anlisis de correlacin y regresin
lineal M.A. Jos Antonio Velzquez
Jurez

Regla de decisin con 5% de


nivel de significancia y 8 gl

t==3.297

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

El valor t calculado se encuentra


en la zona de rechazo.
Por ello, Ho se rechaza con un
nivel de significancia de 0.05 y
esto significa que la correlacin
entre la poblacin no es cero

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

Regresin Lineal Simple

El objetivo principal es utilizar los


datos para trazar una lnea, la
cual, exprese de mejor forma la
relacin entre las dos variables.
Para ello se requiere un diagrama
de dispersin para visualizar la
posicin de la lnea

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

A diferencia del anlisis de


correlacin, para este tema, se
buscar plantear una ecuacin
para expresar la relacin lineal
entre dos variables.

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

Tambin se buscar estimar el


valor de la variable dependiente Y
con base en un valor seleccionado
de la variable independiente Y

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

La ecuacin de la recta para


estimar Y con base en x se
denomina ecuacin de regresin.

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

Para

este caso, es preferible


utilizar un mtodo que muestre
en una sola y mejor lnea de
regresin.
Se denomina principio de los
mnimos cuadrados.

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

Determina

una ecuacin de
regresin al minimizar la suma de
los cuadrados de las distancias
verticales entre los valores reales
de Y y los pronosticados de Y

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

Forma general de la ecuacin de


regresin lineal.

=a+bX
Se lee Y prima y es el valor de la estimacin de la variable Y
para un valor X seleccionado
a es el valor estimado de Y donde la recta de regresin cruza
el eje Y cuando X es cero
b es la pendiente de la recta o el cambio promedio en Y prima
por cada cambio de unidad (sea aumento o reduccin) de la
variable independiente X.
X es cualquier valor de la variable independiente que se
seleccione.

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

Pendiente de la recta de regresin

b=r
r: Es el coeficiente de correlacin
Sy: Es la desviacin estndar de Y (la variable
dependiente)
Sx: Es la desviacin estndar de X (Variable
dependiente.)
b=759(14.337/9.189)
b=1.1842

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

Interseccin con el eje Y


- b
a=

= es la media de X (Variable
independiente)
a= 45-1.1842(22)=18.9476

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

Ecuacin de regresin

=a+bX

=18.9476+1.1842X
El

valor de b de 1.1842 significa que por


cada llamada de ventas adicional, el
vendedor deber aumentar el nmero de
copias vendidas en aproximadamente 1.2
El valor de a de 18.9476 representa que
si no se hicieran llamadas o que X=0 solo
se venderan 19 tarjetas de crdito, pero
como 0 est fuera del rango solo se
incluye un rango entre 10 y 40 tarjetas.
Anlisis de correlacin y regresin
lineal M.A. Jos Antonio Velzquez
Jurez

Por

lo tanto la ecuacin de
regreesin pasar por el punto
X=22 y Y=45

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

Valor residual
Es

la diferencia entre el valor real


de Y contra el valor real de Y*
Muestra la cantidad del valor
estimado de Y* que est fuera del
valor de Y

Anlisis de correlacin y regresin


lineal M.A. Jos Antonio Velzquez
Jurez

You might also like