Professional Documents
Culture Documents
Y
CORRELACIÓN LINEAL
ANTECEDENTES HISTÓRICOS
El término regresión fue introducido por Galton en su libro “Natural
inheritance” (1869) refiriéndose a la “ley de la regresión universal”:
100
90
Pesa 76 kg.
80
70
60
Pesa
40 50 kg.
30
140 150 160 170 180 190 200
Mide 161 cm.
Relación entre variables.
Tenemos las alturas y los pesos de 30 individuos representados en un grafico
de dispersión.
100
90
80
70
60
50
40
30
140 150 160 170 180 190 200
Predicción de una variable en función de la otra.
Aparentemente el peso aumenta 10Kg por cada 10 cm de altura... o sea,
el peso aumenta en una unidad por cada unidad de altura.
100
90
80
70
60
10 kg.
50
40
30
140 150 160 170 180 190 200
10 cm.
Cómo reconocer relación directa e inversa.
330 100
280 Incorrelación 90 Fuerte relación
80 directa.
230
70
180
60
130 50
80 40
30
30
140 150 160 170 180 190 200
140 150 160 170 180 190 200
230
o80 directa.
70 o
180
60
130
o 50 o
80 40
30 o30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Relación
inversa Relación
perfecta directa
Variables no
casi
correlacionadas
perfecta
-1 0 +1
Correlaciones positivas
330 130
120
280 110
230 100
90
180 80
70
130 60
50
80 r=0,1 40
r=0,4
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
110 100
100 90
90 80
80
70
70
60
60
50 50
40 r=0,6 40 r=0,8
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Correlaciones casi perfectas y positivas
100 100
90 90
80 80
70 70
60 60
50 50
40 r=0,9 40 r=0,99
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
100
90
80
70
60
50
40 r=1
30
140 150 160 170 180 190 200
Regresión
• El análisis de regresión sirve para predecir una
medida en función de otra medida (o varias).
– Y = Variable dependiente
• predicha
• explicada
– X = Variable independiente
• predictora
• explicativa
– ¿Es posible descubrir una relación?
• Y = f(X) + error
– f es una función de un tipo determinado
– el error es aleatorio, pequeño, y no depende de X
Regresión
• Interpretación de la pendiente : ˆ
Indica el cambio promedio en la variable de respuesta Y cuando X se
incrementa en una unidad.
También se le conoce como: COEFICIENTE ANGULAR DE LA REGRESIÓN.
Resumen sobre bondad de un ajuste
• La bondad de un ajuste de un modelo de regresión se mide usando el coeficiente
de determinación R2
¿recta o cúbica?
16
y = 18.307e-0.2484x
14 12
Y
8
Y
6
15 25 35 45
X
Regresión cuadrática
22
y = -17.715 + 9.526 Ln(x)
18
24
14
Y
20
y = 19.362x -0.9126
16
10
12
Y
8
6
4
15 25 35 45
0
0 2 4 6 8 10 X
X
Potencia Logarítmico
Linealización de modelos
Nombre del modelo Ecuación Transformación Modelo
linealizado
Exponencial y = ex Z= ln(y) x=x Z = ln + x
Día 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Velocidad 4.2 1.4 6.6 4.7 2.6 5.8 1.8 5.8 7.3 7.1 6.4 4.6 1.6 2.3 4.2
Corriente 1.9 0.7 2.2 2.1 1.1 2.6 0.3 2.3 2.6 2.7 2.4 2.2 1.1 1.5 1.6
El modelo que se obtendrá será de
la forma:
Y = bo + b1X1
Grafico de dispersión
Corriente en funcion de la velocidad
2.5
2
Corriete
1.5
0.5
0
0 1 2 3 4 5 6 7 8
Velocidad
Ecuación de la recta de
regresión simple:
Y = 0.35 + 0.33X1
Ejemplo de regresión múltiple
Los datos de la siguiente tabla constan de las
mediciones de producción de 20 operaciones de
una reacción química. Las cantidades cambia con
la temperatura en °C, la concentración del
reactivo fundamental en porcentaje y la duración
de la reacción en horas. La variable dependiente
es la fracción convertida al producto deseado.
Datos para regresión múltiple
Fraccion del
Medición Temperatura Concentración Duración producto
1 50 20 4.1 28.194
2 90 38 8.1 46.946
3 70 28 6.5 37.461
4 70 25 6.4 38.440
5 60 24 4.9 33.776
6 70 29 6.1 37.570
7 60 23 5.1 31.307
8 70 28 5.8 37.863
9 80 36 7.2 41.109
10 70 33 7.7 32.831
11 70 32 7.9 32.794
12 70 30 7.7 33.489
13 60 22 5.1 31.381
14 60 25 5.3 32.289
15 70 35 7.3 31.278
16 70 37 7.4 32.172
17 60 23 5.2 33.234
18 60 23 5.5 31.535
19 60 24 6.1 31.031
20 60 24 4.9 33.474
La ecuación del modelo se expresa
como: