You are on page 1of 31

CORRELACIN Y

REGRESIN LINEAL SIMPLE


Docente: M.Sc. SELENE YENGLE DEL CASTILLO

UNIVERSIDAD PRIVADA ANTENOR


ORREGO
ESCUELA DE INGENIERIA CIVIL
TEMA IV

CORRELACION Y REGRESIN LINEAL SIMPLE

Correlacin Lineal simple


Regresin Lineal simple

CORRELACION LINEAL
Anlisis
de correlacin simple
SIMPLE

Conjunto de tcnicas estadsticas empleado para medir la


intensidad de la relacin entre dos variables
Variable dependiente
La variable que se va a predecir o estimar.
Variable independiente
Una variable que proporciona las bases para el clculo.

Diagrama de dispersin
Diagrama que refleja la relacin entre dos variables
Si X y Y denotan las dos variables, entonces un diagrama
de dispersin muestra la localizacin de los puntos (x, y)
en un sistema de coordenadas rectangulares.

Coeficiente de correlacin
Medida de la intensidad de la relacin entre dos
variables

n xy x y

n x x n y
2

Propiedades de r

Es adimensional
Slo toma valores en [-1,1]
Si no existe relacin lineal r=0
Relacin lineal perfecta entre dos variables r=+1 o r=-1
Excluimos los casos de puntos alineados horiz. o verticalmente.

Cuanto ms cerca est r de +1 o -1 mejor ser el grado de


relacin lineal.
Siempre que no existan observaciones anmalas.
Relacin
inversa
perfecta
Variables
incorreladas

-1

Relacin
directa
casi
perfecta

+1
Regresin y Correlacin

correlaciones negativas

Regresin y Correlacin

correlaciones positivas

Regresin y Correlacin

casi perfectas y positivas

Regresin y Correlacin

Animacin: Residuos del modelo


de regresin

Regresin y Correlacin

Cmo reconocer relacin directa e inversa.


330
280
230
180
130
80
30
140

150

160

170

180

190

200

Para valores de X por encima de la media tenemos


valores de Y por encima y por debajo en cantidades
similares. No existe relacin

Para los valores de X mayores que la media le


corresponden valores de Y mayores tambin.
Para los valores de X menores que la media le
corresponden valores de Y menores tambin.
Esto se llama relacin directa o creciente entre X e Y.

Para los valores de X mayores que la media le


corresponden valores de Y menores. Esto es
relacin inversa o decreciente.

Regresin y Correlacin

Coeficiente de Determinacin: R2
Nos indica la porcin de la variacin total de la
variable dependiente Y que se explica o se debe a la
variacin en la variable independiente X.

Variacin total - Variacin no explicada


r
Variacin total
2

Coeficiente de No Determinacin: 1- R2
es la proporcin de la variacin total
en la variable dependiente (Y), que no se debe
a la variacin en la variable independiente (X)

RECTA DE LOS MINIMOS CUADRADOS:

y = a + bx,
donde a y b se calculan por las siguientes formulas:

2
y
x
x xy

n x x
2

n xy x y
n x x
2

y = a + b x,
Donde b es la pendiente de la lnea de
regresin y nos indica el aumento (si es
positiva) o disminucin (si es negativa) en
la variable dependiente Y por cada unidad
en la variable independiente X.

ERROR ESTNDAR DE ESTIMACIN:

Mide la dispersin con respecto a una


recta promedio, denominada Recta de
Regresin de Mnimos Cuadrados, mide
la dispersin de los valores observados,
con respecto a la recta de Regresin.

S yx

Y b XY
n2

EJEMPLO:
El director de personal de una empresa que
tiene un importante grupo de vendedores,
debe entrevistar y seleccionar nuevo
personal. Ha diseado una prueba que
ayuda a seleccionar los mejores aspirantes
para su personal de ventas. A fin de
verificar la valides de una prueba como
instrumento de prediccin de las ventas
semanales, eligi al azar cinco vendedores
experimentados y aplic la prueba a cada
uno. (Desde luego, en la prctica real, para
determinar la valides de la prueba se deba
haber seleccionado un grupo mucho
mayor.) La puntuacin que cada vendedor
obtuvo en la prueba despus se emparej
con las ventas semanales:

Los datos fueron los


siguientes
Vendedor
Puntuacin
Ventas
en la
prueba
(X)

semanales en
miles de $
(Y)

Sr. J. A. Amber

Sr. B. N. Archer

12

Sra. G. D. Smith

Sr. A. B. Malcolm

Sra. A. Goodwin

10

11

Construya un diagrama de dispersin

Calcule el coeficiente de correlacin.


Comente.
5

x2
16

y2
25

xy
20

12

49

144

84

16

12

36

64

48

10

11

100

121

110

x = 30

y= 40

x2 = 210

y2 =370

xy =274

Sustituyendo en la formula los valores encontrados y


realizando los clculos obtenemos:

n x

n xy x y
2

x n y y
2

5(274) (30)(40)

5(210) (30) 5(370) (40)


2

170
150 250

0.88

El coeficiente de correlacin de 0.88 indica una


relacin muy intensa entre las puntuaciones
de prueba y las ventas semanales.

Calcule e interprete los coeficientes


de determinacin y no determinacin.
Coeficiente de Determinacin:
R2 = (0.88)2 = 0.77
77% de la variacin en las ventas fue debido
a la variacin en los puntajes de la prueba.
Coeficiente de No Determinacin:
1- R2 = 1-0.77 = 0.23
23% de la variacin en las
ventas semanales no fue
debido a la variacin en los
puntajes de la prueba.

Regresin

El anlisis de regresin sirve para predecir


una medida en funcin de otra medida (o
varias).
Y = Variable dependiente
predicha
explicada

X = Variable independiente
predictora
explicativa
Regresin y Correlacin

Mtodos de Estimacin
a
b

Existen dos mtodos para hallar los estimadores de


y que dan los mismos resultados.

Mtodo de Mxima Verosimilitud


n

Mtodo de los Mnimos Cuadrados

2 n 2
( yi yi ) ei mnimo
i 1

y a b. x i

i 1

2 n
( yi yi ) [ yi (a b. xi )]2
i 1

Regresin y Correlacin

i 1

Interpretacin de los coeficientes


a = ordenada al origen cuando x=0 ; y=a
b= pendiente de la recta
b>0 :existe una relacin lineal directa entre las
variables
b<0: existe una relacin lineal inversa entre las variables
b=0 no existe relacin lineal entre las variables .
Regresin y Correlacin

Determine la ecuacin de la recta de regresin


de mnimos cuadrados y trace en el diagrama de
dispersin.
a

2
y
x
x xy

n x x
2

(40)(210) (30)(274)

150

(40)(210) (30)(274)
1.2

150

n xy x y
n x x
2

170
1.133
150

Sustituyendo los valores de a y b el la


ecuacin de la recta obtenemos
y = 1.2 +1.133x
Donde X: Puntuacin en la prueba
Y: Ventas semanales en miles de $
Por cada puntuacin en la
prueba las ventas semanales
del vendedor aumentan
en $1133.

Para graficar la recta de regresin de mnimos cuadrados en el


diagrama de dispersin demos dos valores cuales quiera a x y
calculamos la y, sustituyendo en la ecuacin y = 1.2 +1.133x
X

5.7

Calculamos el Error Estndar de Estimacin

S yx
S yx

Y b XY
n2

370 1.2(40) 1.133(274)


1.963(miles de dlares)
5 2
Si un vendedor obtuvo una nota de 4 en
la prueba, se espera que vende $5700, y
si obtiene una nota de 6 puntos sus ventas
esperadas sern aproximadamente de
$8000 con un error estndar de $1963

Problema propuesto
I
Una
empresa
comercial
tiene
establecimientos en varias grandes reas
metropolitanas. La gerente general de ventas
planea lanzar al aire un anuncio comercial por
televisin en las estaciones locales al menos
dos veces antes de una venta gigante que
empezar el sbado y terminar el domingo.
Planea tener las cifras de las ventas de videocaseteras del sbado y el domingo en sus
diferentes locales y parearlas con el nmero de
veces que apareci el comercial en la televisin.
El objetivo fundamental de la investigacin es
determinar si existe relacin entre el nmero de
veces que se transmiti el anuncio y las ventas
de sus productos. Los pares de datos son:

Localizacin de
televisora

Nmero de
Ventas de sbado
transmisiones
y domingo
de anuncios
(en miles de
dlares)

Buffalo

15

Albano

Erie

21

Syracuse

24

Rochester

17

CALCULE E INTERPRETE LAS SIGUIENTES


MEDIDAS:
Realice el Diagrama de Dispersion.
Calcule el Coeficiente de Correlacion.
Calcule el Coeficiente de Determinacion.
Calcule el Coeficiente de No Determinacion.
Encuentre la ecuacion de regresion lineal simple,
hallando los valores de a y b.
Haciendo uso de la ecuacion encontrada en el item
anterior reemplace para los valores de x=8 y x=14.
Ubique
los
valores
de
y
encontrados
anteriormente en el diagrama de dispersion y
grafique la recta de la ecuacion de regresion lineal
simple.

You might also like