Professional Documents
Culture Documents
CORRELACION LINEAL
Anlisis
de correlacin simple
SIMPLE
Diagrama de dispersin
Diagrama que refleja la relacin entre dos variables
Si X y Y denotan las dos variables, entonces un diagrama
de dispersin muestra la localizacin de los puntos (x, y)
en un sistema de coordenadas rectangulares.
Coeficiente de correlacin
Medida de la intensidad de la relacin entre dos
variables
n xy x y
n x x n y
2
Propiedades de r
Es adimensional
Slo toma valores en [-1,1]
Si no existe relacin lineal r=0
Relacin lineal perfecta entre dos variables r=+1 o r=-1
Excluimos los casos de puntos alineados horiz. o verticalmente.
-1
Relacin
directa
casi
perfecta
+1
Regresin y Correlacin
correlaciones negativas
Regresin y Correlacin
correlaciones positivas
Regresin y Correlacin
Regresin y Correlacin
Regresin y Correlacin
150
160
170
180
190
200
Regresin y Correlacin
Coeficiente de Determinacin: R2
Nos indica la porcin de la variacin total de la
variable dependiente Y que se explica o se debe a la
variacin en la variable independiente X.
Coeficiente de No Determinacin: 1- R2
es la proporcin de la variacin total
en la variable dependiente (Y), que no se debe
a la variacin en la variable independiente (X)
y = a + bx,
donde a y b se calculan por las siguientes formulas:
2
y
x
x xy
n x x
2
n xy x y
n x x
2
y = a + b x,
Donde b es la pendiente de la lnea de
regresin y nos indica el aumento (si es
positiva) o disminucin (si es negativa) en
la variable dependiente Y por cada unidad
en la variable independiente X.
S yx
Y b XY
n2
EJEMPLO:
El director de personal de una empresa que
tiene un importante grupo de vendedores,
debe entrevistar y seleccionar nuevo
personal. Ha diseado una prueba que
ayuda a seleccionar los mejores aspirantes
para su personal de ventas. A fin de
verificar la valides de una prueba como
instrumento de prediccin de las ventas
semanales, eligi al azar cinco vendedores
experimentados y aplic la prueba a cada
uno. (Desde luego, en la prctica real, para
determinar la valides de la prueba se deba
haber seleccionado un grupo mucho
mayor.) La puntuacin que cada vendedor
obtuvo en la prueba despus se emparej
con las ventas semanales:
semanales en
miles de $
(Y)
Sr. J. A. Amber
Sr. B. N. Archer
12
Sra. G. D. Smith
Sr. A. B. Malcolm
Sra. A. Goodwin
10
11
x2
16
y2
25
xy
20
12
49
144
84
16
12
36
64
48
10
11
100
121
110
x = 30
y= 40
x2 = 210
y2 =370
xy =274
n x
n xy x y
2
x n y y
2
5(274) (30)(40)
170
150 250
0.88
Regresin
X = Variable independiente
predictora
explicativa
Regresin y Correlacin
Mtodos de Estimacin
a
b
2 n 2
( yi yi ) ei mnimo
i 1
y a b. x i
i 1
2 n
( yi yi ) [ yi (a b. xi )]2
i 1
Regresin y Correlacin
i 1
2
y
x
x xy
n x x
2
(40)(210) (30)(274)
150
(40)(210) (30)(274)
1.2
150
n xy x y
n x x
2
170
1.133
150
5.7
S yx
S yx
Y b XY
n2
Problema propuesto
I
Una
empresa
comercial
tiene
establecimientos en varias grandes reas
metropolitanas. La gerente general de ventas
planea lanzar al aire un anuncio comercial por
televisin en las estaciones locales al menos
dos veces antes de una venta gigante que
empezar el sbado y terminar el domingo.
Planea tener las cifras de las ventas de videocaseteras del sbado y el domingo en sus
diferentes locales y parearlas con el nmero de
veces que apareci el comercial en la televisin.
El objetivo fundamental de la investigacin es
determinar si existe relacin entre el nmero de
veces que se transmiti el anuncio y las ventas
de sus productos. Los pares de datos son:
Localizacin de
televisora
Nmero de
Ventas de sbado
transmisiones
y domingo
de anuncios
(en miles de
dlares)
Buffalo
15
Albano
Erie
21
Syracuse
24
Rochester
17