Professional Documents
Culture Documents
Estadstica Administrativa II
2016-1
1
Regresin lineal
simple
Conjunto de tcnicas para hacer anlisis
de la relacin entre dos variables
2
Regresin lineal simple
Diagrama de dispersin
Anlisis de correlacin
Anlisis de regresin
3
Diagrama de
dispersin
Tcnica emprica para observar el comportamiento
relacionado de dos variables.
4
Diagrama de dispersin
Es la presentacin grfica que muestra la
relacin de dos variables. Al estar
involucradas dos variables, una de ellas se
considera la independiente y la otra la
dependiente.
Y
X
5
Ejemplo . . .
La Empresa MOTORSI da
mantenimiento preventivo a
vehculos turismo. Se tom una
muestra para evaluar si el valor
del pago tiene alguna relacin
con la antigedad de los
clientes. Se tom una muestra
de 9 clientes que visitaron
MOTORSI la semana pasada y
a travs de un diagrama de
dispersin evaluar su
comportamiento
6
. . .Ejemplo
7
Comando en Excel
8
Anlisis de correlacin
Es el estudio de la relacin entre variables
numricas. Es la presentacin numrica del
diagrama de dispersin
9
Fases
Coeficiente de correlacin
Coeficiente de determinacin
Prueba de la importancia del
coeficiente de correlacin
10
Coeficiente de
correlacin
Medida de la fuerza de la relacin lineal entre
dos variables. (Lind |Marchal |Wathen, 2008,
p.462).
11
Caractersticas
1 , 1
12
Tendencia
13
Fortaleza de la relacin entre
variables
14
Coeficiente de correlacin
=
1
16
. . . Ejemplo
UNIDADES
AGENTE LLAMADAS VENDIDAS
Toms Garca 20 30 1. Trazar el diagrama de
Jos Girn 40 60 dispersin
Gregorio Figueroa 30 60 2. Calcular el coeficiente
Carlos Ramrez 10 40 de correlacin
Miguel Godoy 20 50 3. Interpretar el resultado
Marcos Reyes 20 30
17
. . . Ejemplo
Diagrama de dispersin
UNIDADES
AGENTE LLAMADAS VENDIDAS
Toms Garca 20 30
Jos Girn 40 60
Gregorio Figueroa 30 60
Carlos Ramrez 10 40
Miguel Godoy 20 50
Marcos Reyes 20 30
(20,30) est 2 veces
18
. . . Ejemplo
Coeficiente de correlacin (r)
Media aritmtica
UNIDADES
AGENTE LLAMADAS VENDIDAS
140
Toms Garca 20 30 = = 23.0
Jos Girn 40 60 6
Gregorio Figueroa 30 60
270
Carlos Ramrez 10 40
= = 45.0
Miguel Godoy 20 50 6
Marcos Reyes 20 30
140 270
19
. . . Ejemplo = 23
= 45
Coeficiente de correlacin (r)
Desviacin estndar - variacin
UNIDADES
AGENTE LLAMADAS
VENDIDAS
Toms Garca 20 30 (20 - 23) = -3 (30 - 45) = -15
Jos Girn 40 60 (40 - 23) = 17 (60 - 45) = 15
Gregorio Figueroa 30 60 (30 - 23) = 7 (60 - 45) = 15
Carlos Ramrez 10 40 (10 - 23) = -13 (40 - 45) = -5
Miguel Godoy 20 50 (20 - 23) = -3 (50 - 45) = 5
Marcos Reyes 20 30 (20 - 23) = -3 (30 - 45) = -15
20
. . . Ejemplo
Coeficiente de correlacin (r)
Desviacin estndar variacin cuadrada
(20 - 23) = -3 (30 - 45) = -15 45 9 225
(40 - 23) = 17 (60 - 45) = 15 255 289 225
(30 - 23) = 7 (60 - 45) = 15 105 49 225
(10 - 23) = -13 (40 - 45) = -5 65 169 25
(20 - 23) = -3 (50 - 45) = 5 -15 9 25
(20 - 23) = -3 (30 - 45) = -15 45 9 225
500 534 950
21
. . . Ejemplo = 534
= 950
Coeficiente de correlacin (r)
Desviacin estndar
534
= = 106.7 = 10.3
61
950
= = 190.0 = 13.8
61
22
. . . Ejemplo = 10.3
= 13.8
Coeficiente de correlacin (r) =6
=
1
500
=
6 1 10.3 13.8
500
=
712.25
= 0.702
23
. . . Ejemplo
Coeficiente de correlacin (r)
= 0.702
Correlacin negativa No hay relacin Correlacin positiva
Perfecta entre las variables Perfecta
Correlacin negativa Correlacin positiva
Moderada Moderada
0.702
26
Ejemplo . . .
Calcular el coeficiente de determinacin de
una muestra de dos variables, cuyos
coeficiente de correlacin es 0.702
= 0.702
= 0.702
= 0.4928
2
=
1
29
Objetivo
Concluir que el coeficiente de correlacin
de la poblacin es 0.
0 : = 0
: 0
Con n-2 grados de libertad
30
Ejemplo . . .
En la empresa Sara se venden unidades de aire
acondicionado; se ha observado que a mayor
cantidad de llamadas de los vendedores durante
el mes, mayor cantidad de compra de unidades de
aire acondicionado.
Se tom una muestra de las ventas realizadas por
6 de los vendedores de planta y se quiere
comparar la cantidad de llamadas realizadas
durante el mes y las ventas facturadas.
El coeficiente de correlacin obtenido fue de
0.702. Se va a probar si existe relacin entre las
variables con un nivel de confianza del 95%. 31
UNIDADES
. . . Ejemplo LLAMADAS VENDIDAS
20 30
PASO 1: Hiptesis nula y alternativa 40 60
30 60
0 : = 0
10 40
: 0
20 50
PASO 2: Nivel de significancia 20 30
= 0.05
2
=
1 32
. . . Ejemplo
PASO 4: Regla de decisin
0 : = 0
2
= 0.05
=6
= 6 2 = 4
= 2.776
33
= 2.776
. . . Ejemplo
PASO 5: Toma de decisin
= 0.702
=6
2
=
1
0.702 6 2
=
1 0.702
2.81 La hiptesis nula se rechaza
= La correlacin de la poblacin no es 0
0.71
S existe relacin entre las variables
= 3.96
34
Prcticas
Correlacin
35
El departamento de produccin de Celltronics International
desea explorar la relacin entre el nmero de empleados que
trabajan en una lnea de ensamble parcial y el nmero de
unidades producido. Como experimento, se asign a dos
empleados al ensamble parcial. Su desempeo fue de 15
productos durante un periodo de una hora. Despus, cuatro
36 empleados hicieron los ensambles y su nmero fue de 25
durante un periodo de una hora. El conjunto completo de
observaciones pareadas se muestra a continuacin.
Produccin
Nmero de
en una hora 1. Trazar diagrama de dispersin
ensambladores
(unidades) 2. Calcular coeficiente de correlacin
2 15 3. Calcular coeficiente de determinacin
4 25 4. Probar la importancia del coeficiente
1 10 de correlacin. Nivel de confianza de
5 40
95%
3 30
Desarrollo prctica # 1
1. Diagrama de dispersin
37
Desarrollo prctica # 1
2. Coeficiente de correlacin
=
1
- Determinar las variables involucradas en el proceso
Nmero de Produccin en
ensambladores una hora
(X) (unidades)(Y)
2 15
4 25
1 10
5 40
3 30
38
Desarrollo prctica # 1
Coeficiente de correlacin
=
1
- Calcular las medias aritmticas (n=5)
Nmero de Produccin en
ensambladores una hora 15
(X) (unidades)(Y) = =3
5
2 15
4 25
120
1 10 = = 24
5 40 5
3 30
39
15 120
Desarrollo prctica # 1
Coeficiente de correlacin
= 3
= = 24
1
- Calcular las variaciones
Nmero de Produccin en
ensambladores una hora
(X) (unidades)(Y)
2 15 (2 - 3) = -1 (15 - 24) = -9
4 25 (4 - 3) = 1 (25 - 24) = 1
1 10 (1 - 3) = -2 (10 - 24) = -14
5 40 (5 - 3) = 2 (40 - 24) = 16
3 30 (3 - 3) = 0 (30 - 24) = 6
40
Desarrollo prctica # 1
Coeficiente de correlacin
= 3
= = 24
1
- Calcular las variaciones cuadradas d2
Nmero de
Produccin en
ensambladores
una hora (Y)
(X)
2 15 -1 -9 9
4 25 1 1 1
1 10 -2 -14 28
5 40 2 16 32
3 30 0 6 - 41
Desarrollo prctica # 1
Coeficiente de correlacin
= 3
= = 24
1
- Calcular las variaciones cuadradas d2
Nmero de
Produccin en
ensambladores
una hora (Y)
(X)
2 15 -1 -9 1
4 25 1 1 1
1 10 -2 -14 4
5 40 2 16 4
3 30 0 6 - 42
Desarrollo prctica # 1
Coeficiente de correlacin
= 3
= = 24
1
- Calcular las variaciones cuadradas d2
Nmero de
ensambladores
Produccin en
una hora (Y)
(X)
2 15 -1 -9 81
4 25 1 1 1
1 10 -2 -14 196
5 40 2 16 256
3 30 0 6 36 43
Desarrollo prctica # 1
Coeficiente de correlacin
= 3
= = 24
1
- Calcular las variaciones cuadradas d2
Nmero de
Produccin en
ensambladores
(X)
una hora (Y)
2 15 9 1 81
4 25 1 1 1
1 10 28 4 196
5 40 32 4 256
3 30 0 0 36
70 10 570 44
Desarrollo prctica # 1
Coeficiente de correlacin
=
1
- Calcular las desviaciones estndar (s)
3 24 = 70
3 10
= = = 1.6
1 4
24 570
= = = 11.9
1 4
45
Desarrollo prctica # 1
Coeficiente de correlacin
3 24 = 70
= 1.6
=
1 = 11.9
70
= n=5
5 1 1.6 11.9
= 0.9272
= 0.9272
= 0.8597
Parece que existe una correlacin del
86% entre ambas variables
47
Desarrollo prctica # 1
4. Probar la importancia del coeficiente de
correlacin. Nivel de confianza de 95%
Paso 1. Hiptesis nula y alternativa
0 : = 0
: 0
Paso 2. Nivel de significancia
= 0.05
Paso 3: Estadstico de prueba
2
=
1 48
Desarrollo prctica # 1
Paso 4: Regla de decisin
0 : = 0
2
= 0.05
=5
= 5 2 = 3
= 3.182
49
= 2.776
Desarrollo prctica # 1
PASO 5: Toma de decisin
= 0.9272
=5
2
=
1
0.9272 5 2
=
1 0.9272
3.6359 La hiptesis nula se rechaza
= La correlacin de la poblacin no es 0
0.3746
S existe relacin entre las variables
= 9.705
50
Un economista del Banco Central est preparando un
estudio sobre el comportamiento del consumidor. Recolect
datos para determinar si existe una relacin entre el ingreso
del consumidor y sus niveles de consumo. Los resultados
fueron los siguientes:
INGRESO CONSUMO 1. Trazar diagrama de dispersin
51
(000 Lps) (000 Lps) 2. Calcular coeficiente de correlacin
24.3 16.0 3. Calcular coeficiente de
12.5 8.5 determinacin
31.2 15.0 4. Probar la importancia del
28.0 17.0 coeficiente de correlacin. Nivel de
35.1 24.2 confianza de 95%
10.5 11.2
23.2 15.0
10.0 7.1
8.5 3.5
15.9 11.5
Desarrollo prctica # 2
1. Diagrama de dispersin
52
Desarrollo prctica # 2
2. Coeficiente de correlacin
INGRESO CONSUMO
= (X) (Y)
1
24.3 16.0
12.5 8.5
31.2 15.0
Determinar las variables 28.0 17.0
involucradas en el proceso 35.1 24.2
10.5 11.2
23.2 15.0
10.0 7.1
8.5 3.5
15.9 11.5 53
Desarrollo prctica # 2
Coeficiente de correlacin
Calcular las medias aritmticas
=
INGRESO CONSUMO 1
(X) (Y)
24.3 16.0
12.5 8.5
199.2
31.2 15.0 = = 19.9 = 20
28.0 17.0 10
35.1 24.2
10.5 11.2 129
23.2 15.0 = = 12.9 = 13
10.0 7.1
10
8.5 3.5
15.9 11.5 54
199.2 129.0
Desarrollo prctica # 2
= 20
Coeficiente de correlacin = 13
- Calcular las variaciones
INGRESO CONSUMO
(X) (Y)
24.3 16.0 (24.3 - 20) = 4.3 (16.0 - 13) = 3.0
12.5 8.5 (12.5 - 20) = -7.5 (8.5 - 13) = -4.5
31.2 15.0 (31.2 - 20) = 11.2 (15.0 - 13) = 2.0
28.0 17.0 (28.0 - 20) = 8.0 (17.0 - 13) = 4.0
35.1 24.2 (31.5 - 20) = 15.1 (24.2 - 13) = 11.2
10.5 11.2 (10.5 - 20) = -9.5 (11.2 - 13) = -1.8
23.2 15.0 (23.2 - 20) = 3.2 (15.0 - 13) = 2.0
10.0 7.1 (10.0 - 20) = -10.0 (7.1 - 13) = -5.9
8.5 3.5 (8.5 - 20) = -11.5 (3.5 - 13) = -9.5
15.9 11.5 (15.9 - 20) = -4.1 (11.5 - 13) = -1.5
Desarrollo prctica # 2
Coeficiente de correlacin
- Calcular las variaciones cuadradas d2
INGRESO CONSUMO
(X) (Y)
24.3 16.0 4.3 18.5 12.9
12.5 8.5 -7.5 56.3 33.8
31.2 15.0 11.2 125.4 22.4
28.0 17.0 8.0 64.0 32.0
35.1 24.2 15.1 228.0 169.1
10.5 11.2 -9.5 90.3 17.1
23.2 15.0 3.2 10.2 6.4
10.0 7.1 -10.0 100.0 59.0
8.5 3.5 -11.5 132.3 109.3
15.9 11.5 -4.1 16.8 6.2
56
Desarrollo prctica # 2
Coeficiente de correlacin
- Calcular las variaciones cuadradas d2
INGRESO CONSUMO
(X) (Y)
24.3 16.0 4.3 18.5 18.5
12.5 8.5 -7.5 56.3 56.3
31.2 15.0 11.2 125.4 125.4
28.0 17.0 8.0 64.0 64.0
35.1 24.2 15.1 228.0 228.0
10.5 11.2 -9.5 90.3 90.3
23.2 15.0 3.2 10.2 10.2
10.0 7.1 -10.0 100.0 100.0
8.5 3.5 -11.5 132.3 132.3
15.9 11.5 -4.1 16.8 16.8
57
Desarrollo prctica # 2
Coeficiente de correlacin
- Calcular las variaciones cuadradas d2
INGRESO CONSUMO
(X) (Y)
24.3 16.0 4.3 18.5 9.0
12.5 8.5 -7.5 56.3 20.3
31.2 15.0 11.2 125.4 4.0
28.0 17.0 8.0 64.0 16.0
35.1 24.2 15.1 228.0 125.4
10.5 11.2 -9.5 90.3 3.2
23.2 15.0 3.2 10.2 4.0
10.0 7.1 -10.0 100.0 34.8
8.5 3.5 -11.5 132.3 90.3
15.9 11.5 -4.1 16.8 2.3
58
Desarrollo prctica # 2
Coeficiente de correlacin
- Resumen de variaciones cuadradas d2
INGRESO CONSUMO
(X) (Y)
24.3 16.0 12.9 18.5 9.0
12.5 8.5 33.8 56.3 20.3
31.2 15.0 22.4 125.4 4.0
28.0 17.0 32.0 64.0 16.0
35.1 24.2 169.1 228.0 125.4
10.5 11.2 17.1 90.3 3.2
23.2 15.0 6.4 10.2 4.0
10.0 7.1 59.0 100.0 34.8
8.5 3.5 109.3 132.3 90.3
15.9 11.5 6.2 16.8 2.3
468.1 841.7 309.2 59
Desarrollo prctica # 2
Coeficiente de correlacin
= 20
= = 13
1
- Calcular las desviaciones estndar (s)
20 13 = 468.1
20 841.7
= = = 9.7
1 9
13 309.2
= = = 5.9
1 9
60
Desarrollo prctica # 2
Coeficiente de correlacin
20 13 = 468.1
= 9.7
=
1 = 5.9
468.1
= n = 10
10 1 9.7 5.9
= 0.9174
= 0.9174
= 0.8417
62
Desarrollo prctica # 2
4. Probar la importancia del coeficiente de
correlacin. Nivel de confianza de 95%
Paso 1. Hiptesis nula y alternativa
0 : = 0
: 0
Paso 2. Nivel de significancia
= 0.05
Paso 3: Estadstico de prueba
2
=
1 63
Desarrollo prctica # 2
Paso 4: Regla de decisin
0 : = 0
2
= 0.05
= 10
= 10 2 = 8
= 2.306
64
Desarrollo prctica # 2
= 2.306
Paso 5: Toma de decisin
= 0.9174
= 10
2
=
1
0.9174 10 2
=
1 0.9174
7.33946 La hiptesis nula se rechaza
= La correlacin de la poblacin no es 0
0.39789
S existe relacin entre las variables
= 18.446
65
Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadstica Aplicada a los
Negocios y la Economa. Mxico: McGrawHill