You are on page 1of 66

USAP

Estadstica Administrativa II
2016-1

1
Regresin lineal
simple
Conjunto de tcnicas para hacer anlisis
de la relacin entre dos variables

2
Regresin lineal simple

Diagrama de dispersin
Anlisis de correlacin
Anlisis de regresin

3
Diagrama de
dispersin
Tcnica emprica para observar el comportamiento
relacionado de dos variables.

4
Diagrama de dispersin
Es la presentacin grfica que muestra la
relacin de dos variables. Al estar
involucradas dos variables, una de ellas se
considera la independiente y la otra la
dependiente.
Y

X
5
Ejemplo . . .
La Empresa MOTORSI da
mantenimiento preventivo a
vehculos turismo. Se tom una
muestra para evaluar si el valor
del pago tiene alguna relacin
con la antigedad de los
clientes. Se tom una muestra
de 9 clientes que visitaron
MOTORSI la semana pasada y
a travs de un diagrama de
dispersin evaluar su
comportamiento
6
. . .Ejemplo

7
Comando en Excel

8
Anlisis de correlacin
Es el estudio de la relacin entre variables
numricas. Es la presentacin numrica del
diagrama de dispersin

9
Fases

Coeficiente de correlacin
Coeficiente de determinacin
Prueba de la importancia del
coeficiente de correlacin

10

Coeficiente de
correlacin
Medida de la fuerza de la relacin lineal entre
dos variables. (Lind |Marchal |Wathen, 2008,
p.462).
11
Caractersticas
1 , 1

=1 Correlacin perfecta positiva


= 1 Correlacin perfecta negativa
=0 No hay correlacin
<0 Correlacin negativa
>0

12
Tendencia

Correlacin positiva Correlacin negativa

13
Fortaleza de la relacin entre
variables

14
Coeficiente de correlacin


=
1

: Cada observacin de la variable independiente.


: Cada observacin de la variable dependiente
: Media aritmtica muestral de variable independiente
: Media aritmtica muestral de variable dependiente
: Desviacin estndar de variable independiente
: Desviacin estndar de variable dependiente
: Tamao de la muestra
15
Ejemplo . . .

En la empresa Sara se venden unidades de aire


acondicionado; se ha observado que a mayor
cantidad de llamadas de los vendedores durante
el mes, mayor cantidad de compra de unidades de
aire acondicionado.
Se tom una muestra de las ventas realizadas por
6 de los vendedores de planta y se quiere
comparar la cantidad de llamadas realizadas
durante el mes y las ventas facturadas.

16
. . . Ejemplo

UNIDADES
AGENTE LLAMADAS VENDIDAS
Toms Garca 20 30 1. Trazar el diagrama de
Jos Girn 40 60 dispersin
Gregorio Figueroa 30 60 2. Calcular el coeficiente
Carlos Ramrez 10 40 de correlacin
Miguel Godoy 20 50 3. Interpretar el resultado
Marcos Reyes 20 30

17
. . . Ejemplo
Diagrama de dispersin
UNIDADES
AGENTE LLAMADAS VENDIDAS
Toms Garca 20 30
Jos Girn 40 60
Gregorio Figueroa 30 60
Carlos Ramrez 10 40
Miguel Godoy 20 50
Marcos Reyes 20 30
(20,30) est 2 veces

18
. . . Ejemplo
Coeficiente de correlacin (r)
Media aritmtica
UNIDADES
AGENTE LLAMADAS VENDIDAS
140
Toms Garca 20 30 = = 23.0
Jos Girn 40 60 6
Gregorio Figueroa 30 60
270
Carlos Ramrez 10 40
= = 45.0
Miguel Godoy 20 50 6
Marcos Reyes 20 30
140 270

19
. . . Ejemplo = 23
= 45
Coeficiente de correlacin (r)
Desviacin estndar - variacin
UNIDADES
AGENTE LLAMADAS
VENDIDAS
Toms Garca 20 30 (20 - 23) = -3 (30 - 45) = -15
Jos Girn 40 60 (40 - 23) = 17 (60 - 45) = 15
Gregorio Figueroa 30 60 (30 - 23) = 7 (60 - 45) = 15
Carlos Ramrez 10 40 (10 - 23) = -13 (40 - 45) = -5
Miguel Godoy 20 50 (20 - 23) = -3 (50 - 45) = 5
Marcos Reyes 20 30 (20 - 23) = -3 (30 - 45) = -15

20
. . . Ejemplo
Coeficiente de correlacin (r)
Desviacin estndar variacin cuadrada



(20 - 23) = -3 (30 - 45) = -15 45 9 225
(40 - 23) = 17 (60 - 45) = 15 255 289 225
(30 - 23) = 7 (60 - 45) = 15 105 49 225
(10 - 23) = -13 (40 - 45) = -5 65 169 25
(20 - 23) = -3 (50 - 45) = 5 -15 9 25
(20 - 23) = -3 (30 - 45) = -15 45 9 225
500 534 950

21
. . . Ejemplo = 534

= 950
Coeficiente de correlacin (r)
Desviacin estndar

534
= = 106.7 = 10.3
61

950
= = 190.0 = 13.8
61

22
. . . Ejemplo = 10.3
= 13.8
Coeficiente de correlacin (r) =6


=
1
500
=
6 1 10.3 13.8
500
=
712.25

= 0.702
23
. . . Ejemplo
Coeficiente de correlacin (r)
= 0.702
Correlacin negativa No hay relacin Correlacin positiva
Perfecta entre las variables Perfecta
Correlacin negativa Correlacin positiva
Moderada Moderada

Correlacin Correlacin Correlacin Correlacin


negativa fuerte negativa Dbil positiva Dbil positiva Fuerte
-1 -0.5 0 0.5 1

0.702

La correlacin entre ambas variables es positiva y fuerte.


El hacer llamadas telefnicas a los posibles clientes nos llev
a un incremento en las ventas. 24
Coeficiente de
determinacin
Proporcin de la variacin total en la variable
dependiente Y que se explica, o contabiliza, por
la variacin en la variable independiente X.
(Lind |Marchal |Wathen, 2008, p.465).
25
Coeficiente de determinacin

Resultado de elevar al cuadrado el


coeficiente de correlacin.
Resultado interpretado en base a 100%.


26
Ejemplo . . .
Calcular el coeficiente de determinacin de
una muestra de dos variables, cuyos
coeficiente de correlacin es 0.702
= 0.702

= 0.702
= 0.4928

Existe una correlacin del 49% entre


ambas variables 27
,
Prueba de la importancia
del coeficiente de
correlacin
Aunque un coeficiente de determinacin sea alto, el
resultado hace referencia a una muestra; para inferir
sobre los resultados de la poblacin, se recurre a la
prueba de hiptesis; es decir, se somete el coeficiente
de correlacin a una prueba con el estadstico t
28
Estadstico de prueba
t-student

2
=
1


29
Objetivo
Concluir que el coeficiente de correlacin
de la poblacin es 0.
0 : = 0
: 0
Con n-2 grados de libertad

30
Ejemplo . . .
En la empresa Sara se venden unidades de aire
acondicionado; se ha observado que a mayor
cantidad de llamadas de los vendedores durante
el mes, mayor cantidad de compra de unidades de
aire acondicionado.
Se tom una muestra de las ventas realizadas por
6 de los vendedores de planta y se quiere
comparar la cantidad de llamadas realizadas
durante el mes y las ventas facturadas.
El coeficiente de correlacin obtenido fue de
0.702. Se va a probar si existe relacin entre las
variables con un nivel de confianza del 95%. 31
UNIDADES
. . . Ejemplo LLAMADAS VENDIDAS
20 30
PASO 1: Hiptesis nula y alternativa 40 60
30 60
0 : = 0
10 40
: 0
20 50
PASO 2: Nivel de significancia 20 30
= 0.05

PASO 3: Estadstico de prueba

2
=
1 32
. . . Ejemplo
PASO 4: Regla de decisin
0 : = 0
2
= 0.05
=6
= 6 2 = 4

= 2.776
33
= 2.776
. . . Ejemplo
PASO 5: Toma de decisin
= 0.702
=6
2
=
1
0.702 6 2
=
1 0.702
2.81 La hiptesis nula se rechaza
= La correlacin de la poblacin no es 0
0.71
S existe relacin entre las variables
= 3.96
34
Prcticas
Correlacin

35
El departamento de produccin de Celltronics International
desea explorar la relacin entre el nmero de empleados que
trabajan en una lnea de ensamble parcial y el nmero de
unidades producido. Como experimento, se asign a dos
empleados al ensamble parcial. Su desempeo fue de 15
productos durante un periodo de una hora. Despus, cuatro
36 empleados hicieron los ensambles y su nmero fue de 25
durante un periodo de una hora. El conjunto completo de
observaciones pareadas se muestra a continuacin.
Produccin
Nmero de
en una hora 1. Trazar diagrama de dispersin
ensambladores
(unidades) 2. Calcular coeficiente de correlacin
2 15 3. Calcular coeficiente de determinacin
4 25 4. Probar la importancia del coeficiente
1 10 de correlacin. Nivel de confianza de
5 40
95%
3 30
Desarrollo prctica # 1
1. Diagrama de dispersin

37
Desarrollo prctica # 1
2. Coeficiente de correlacin

=
1
- Determinar las variables involucradas en el proceso
Nmero de Produccin en
ensambladores una hora
(X) (unidades)(Y)
2 15
4 25
1 10
5 40
3 30
38
Desarrollo prctica # 1
Coeficiente de correlacin

=
1
- Calcular las medias aritmticas (n=5)
Nmero de Produccin en
ensambladores una hora 15
(X) (unidades)(Y) = =3
5
2 15
4 25
120
1 10 = = 24
5 40 5
3 30
39
15 120
Desarrollo prctica # 1
Coeficiente de correlacin
= 3
= = 24
1
- Calcular las variaciones
Nmero de Produccin en
ensambladores una hora
(X) (unidades)(Y)
2 15 (2 - 3) = -1 (15 - 24) = -9
4 25 (4 - 3) = 1 (25 - 24) = 1
1 10 (1 - 3) = -2 (10 - 24) = -14
5 40 (5 - 3) = 2 (40 - 24) = 16
3 30 (3 - 3) = 0 (30 - 24) = 6
40
Desarrollo prctica # 1
Coeficiente de correlacin
= 3
= = 24
1
- Calcular las variaciones cuadradas d2
Nmero de
Produccin en
ensambladores
una hora (Y)
(X)

2 15 -1 -9 9
4 25 1 1 1
1 10 -2 -14 28
5 40 2 16 32
3 30 0 6 - 41
Desarrollo prctica # 1
Coeficiente de correlacin
= 3
= = 24
1
- Calcular las variaciones cuadradas d2
Nmero de
Produccin en
ensambladores
una hora (Y)
(X)

2 15 -1 -9 1
4 25 1 1 1
1 10 -2 -14 4
5 40 2 16 4
3 30 0 6 - 42
Desarrollo prctica # 1
Coeficiente de correlacin
= 3
= = 24
1
- Calcular las variaciones cuadradas d2
Nmero de
ensambladores
Produccin en

una hora (Y)
(X)

2 15 -1 -9 81
4 25 1 1 1
1 10 -2 -14 196
5 40 2 16 256
3 30 0 6 36 43
Desarrollo prctica # 1
Coeficiente de correlacin
= 3
= = 24
1
- Calcular las variaciones cuadradas d2
Nmero de
Produccin en
ensambladores
(X)
una hora (Y)
2 15 9 1 81
4 25 1 1 1
1 10 28 4 196
5 40 32 4 256
3 30 0 0 36
70 10 570 44
Desarrollo prctica # 1
Coeficiente de correlacin

=
1
- Calcular las desviaciones estndar (s)

3 24 = 70

3 10
= = = 1.6
1 4

24 570
= = = 11.9
1 4
45
Desarrollo prctica # 1
Coeficiente de correlacin
3 24 = 70
= 1.6
=
1 = 11.9
70
= n=5
5 1 1.6 11.9
= 0.9272

Hay una correlacin positiva


fuerte entre ambas variables 46
Desarrollo prctica # 1
3. Coeficiente de Determinacin (r2)

= 0.9272
= 0.8597
Parece que existe una correlacin del
86% entre ambas variables

47
Desarrollo prctica # 1
4. Probar la importancia del coeficiente de
correlacin. Nivel de confianza de 95%
Paso 1. Hiptesis nula y alternativa
0 : = 0
: 0
Paso 2. Nivel de significancia
= 0.05
Paso 3: Estadstico de prueba
2
=
1 48
Desarrollo prctica # 1
Paso 4: Regla de decisin
0 : = 0
2
= 0.05
=5
= 5 2 = 3

= 3.182
49
= 2.776
Desarrollo prctica # 1
PASO 5: Toma de decisin
= 0.9272
=5
2
=
1
0.9272 5 2
=
1 0.9272
3.6359 La hiptesis nula se rechaza
= La correlacin de la poblacin no es 0
0.3746
S existe relacin entre las variables
= 9.705
50
Un economista del Banco Central est preparando un
estudio sobre el comportamiento del consumidor. Recolect
datos para determinar si existe una relacin entre el ingreso
del consumidor y sus niveles de consumo. Los resultados
fueron los siguientes:
INGRESO CONSUMO 1. Trazar diagrama de dispersin
51
(000 Lps) (000 Lps) 2. Calcular coeficiente de correlacin
24.3 16.0 3. Calcular coeficiente de
12.5 8.5 determinacin
31.2 15.0 4. Probar la importancia del
28.0 17.0 coeficiente de correlacin. Nivel de
35.1 24.2 confianza de 95%
10.5 11.2
23.2 15.0
10.0 7.1
8.5 3.5
15.9 11.5
Desarrollo prctica # 2
1. Diagrama de dispersin

52
Desarrollo prctica # 2
2. Coeficiente de correlacin
INGRESO CONSUMO

= (X) (Y)
1
24.3 16.0
12.5 8.5
31.2 15.0
Determinar las variables 28.0 17.0
involucradas en el proceso 35.1 24.2
10.5 11.2
23.2 15.0
10.0 7.1
8.5 3.5
15.9 11.5 53
Desarrollo prctica # 2
Coeficiente de correlacin
Calcular las medias aritmticas
=
INGRESO CONSUMO 1
(X) (Y)
24.3 16.0
12.5 8.5
199.2
31.2 15.0 = = 19.9 = 20
28.0 17.0 10
35.1 24.2
10.5 11.2 129
23.2 15.0 = = 12.9 = 13
10.0 7.1
10
8.5 3.5
15.9 11.5 54
199.2 129.0
Desarrollo prctica # 2
= 20
Coeficiente de correlacin = 13
- Calcular las variaciones
INGRESO CONSUMO
(X) (Y)
24.3 16.0 (24.3 - 20) = 4.3 (16.0 - 13) = 3.0
12.5 8.5 (12.5 - 20) = -7.5 (8.5 - 13) = -4.5
31.2 15.0 (31.2 - 20) = 11.2 (15.0 - 13) = 2.0
28.0 17.0 (28.0 - 20) = 8.0 (17.0 - 13) = 4.0
35.1 24.2 (31.5 - 20) = 15.1 (24.2 - 13) = 11.2
10.5 11.2 (10.5 - 20) = -9.5 (11.2 - 13) = -1.8
23.2 15.0 (23.2 - 20) = 3.2 (15.0 - 13) = 2.0
10.0 7.1 (10.0 - 20) = -10.0 (7.1 - 13) = -5.9
8.5 3.5 (8.5 - 20) = -11.5 (3.5 - 13) = -9.5
15.9 11.5 (15.9 - 20) = -4.1 (11.5 - 13) = -1.5
Desarrollo prctica # 2
Coeficiente de correlacin
- Calcular las variaciones cuadradas d2
INGRESO CONSUMO

(X) (Y)
24.3 16.0 4.3 18.5 12.9
12.5 8.5 -7.5 56.3 33.8
31.2 15.0 11.2 125.4 22.4
28.0 17.0 8.0 64.0 32.0
35.1 24.2 15.1 228.0 169.1
10.5 11.2 -9.5 90.3 17.1
23.2 15.0 3.2 10.2 6.4
10.0 7.1 -10.0 100.0 59.0
8.5 3.5 -11.5 132.3 109.3
15.9 11.5 -4.1 16.8 6.2
56
Desarrollo prctica # 2
Coeficiente de correlacin
- Calcular las variaciones cuadradas d2
INGRESO CONSUMO
(X) (Y)
24.3 16.0 4.3 18.5 18.5
12.5 8.5 -7.5 56.3 56.3
31.2 15.0 11.2 125.4 125.4
28.0 17.0 8.0 64.0 64.0
35.1 24.2 15.1 228.0 228.0
10.5 11.2 -9.5 90.3 90.3
23.2 15.0 3.2 10.2 10.2
10.0 7.1 -10.0 100.0 100.0
8.5 3.5 -11.5 132.3 132.3
15.9 11.5 -4.1 16.8 16.8
57
Desarrollo prctica # 2
Coeficiente de correlacin
- Calcular las variaciones cuadradas d2
INGRESO CONSUMO
(X) (Y)
24.3 16.0 4.3 18.5 9.0
12.5 8.5 -7.5 56.3 20.3
31.2 15.0 11.2 125.4 4.0
28.0 17.0 8.0 64.0 16.0
35.1 24.2 15.1 228.0 125.4
10.5 11.2 -9.5 90.3 3.2
23.2 15.0 3.2 10.2 4.0
10.0 7.1 -10.0 100.0 34.8
8.5 3.5 -11.5 132.3 90.3
15.9 11.5 -4.1 16.8 2.3
58
Desarrollo prctica # 2
Coeficiente de correlacin
- Resumen de variaciones cuadradas d2
INGRESO CONSUMO


(X) (Y)
24.3 16.0 12.9 18.5 9.0
12.5 8.5 33.8 56.3 20.3
31.2 15.0 22.4 125.4 4.0
28.0 17.0 32.0 64.0 16.0
35.1 24.2 169.1 228.0 125.4
10.5 11.2 17.1 90.3 3.2
23.2 15.0 6.4 10.2 4.0
10.0 7.1 59.0 100.0 34.8
8.5 3.5 109.3 132.3 90.3
15.9 11.5 6.2 16.8 2.3
468.1 841.7 309.2 59
Desarrollo prctica # 2
Coeficiente de correlacin
= 20
= = 13
1
- Calcular las desviaciones estndar (s)

20 13 = 468.1

20 841.7
= = = 9.7
1 9

13 309.2
= = = 5.9
1 9
60
Desarrollo prctica # 2
Coeficiente de correlacin
20 13 = 468.1
= 9.7
=
1 = 5.9
468.1
= n = 10
10 1 9.7 5.9
= 0.9174

Hay una correlacin positiva


fuerte entre ambas variables 61
Desarrollo prctica # 2
3. Coeficiente de Determinacin (r2)

= 0.9174
= 0.8417

Parece que existe una correlacin del


84% entre ambas variables

62
Desarrollo prctica # 2
4. Probar la importancia del coeficiente de
correlacin. Nivel de confianza de 95%
Paso 1. Hiptesis nula y alternativa
0 : = 0
: 0
Paso 2. Nivel de significancia
= 0.05
Paso 3: Estadstico de prueba
2
=
1 63
Desarrollo prctica # 2
Paso 4: Regla de decisin
0 : = 0
2
= 0.05
= 10
= 10 2 = 8

= 2.306
64
Desarrollo prctica # 2
= 2.306
Paso 5: Toma de decisin
= 0.9174
= 10
2
=
1
0.9174 10 2
=
1 0.9174
7.33946 La hiptesis nula se rechaza
= La correlacin de la poblacin no es 0
0.39789
S existe relacin entre las variables
= 18.446
65
Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadstica Aplicada a los
Negocios y la Economa. Mxico: McGrawHill

David M. Levine, Timothy C. Krehbiel, Mark L. Berenson. 2006. Estadstica para 66


Administracin. (4 edicin). Naucalpan de Jurez, Mxico.: Pearson Prentice Hall

You might also like