You are on page 1of 24

REGRESIÓN Y CORRELACIÓN

INTRODUCCIÓN
MUCHAS VECES LAS DECISIONES SE
BASAN EN LA RELACIÓN ENTRE DOS
O MÁS VARIABLES.EJEMPLOS
• Dosis de fertilizantes aplicadas y rendimiento del cultivo.

• La relación entre la radiación que reciben los sensores con


la que se predicen los rendimientos por parcelas con los
rendimientos reales observados en dichas parcelas.

• Relación entre tamaño de un lote de producción y horas –


hombres utilizadas para realizarlo.

Distinguiremos entre relaciones funcionales y relaciones


estadísticas
RELACIÓN FUNCIONAL ENTRE
DOS VARIABLES
•Una relación funcional se expresa mediante
una función matemática.
•Si X es la variable independiente e Y es la variable
dependiente, una relación funcional tiene la forma:
• Y=f(X)
•Ejemplo 1 Parcel Dosis Rend.
a (kg/h)
1 75 150
2 25 50
3 130 260
Relación funcional perfecta entre dosis y
rendimientos

Dosis

Nota: Las observaciones caen exactamente sobre la línea de


relación funcional
RELACIÓN ESTADÍSTICA ENTRE DOS
VARIABLES
A diferencia de la relación funcional, no es una relación
perfecta, las observaciones no caen exactamente sobre la
curva de relación entre las variables
Ejemplo 2
Lote de Tamaño del lote Horas
prod. hombre
1 30 73
2 20 50
3 60 128
4 80 170
5 40 87
Relación estadística entre tamaño del lote y
horas hombre

Nota: La mayor parte de los punto no caen directamente sobre


la línea de relación estadística.
Esta dispersión de punto alrededor de la línea representa la
variación aleatoria.
CONCEPTOS
BÁSICOS

• Análisis de Regresión: Es un procedimiento estadístico que


estudia la relación funcional entre variables. Con el objeto
de predecir una en función de la/s otra/s.
• Análisis de Correlación: Un grupo de técnicas estadísticas
usadas para medir la intensidad de la relación entre dos
variables
• Diagrama de Dispersión: Es un gráfico que muestra la
intensidad y el sentido de la relación entre dos variables de
interés.
• Variable dependiente (respuesta, predicha, endógena):
es la variable que se desea predecir o estimar
•Variables independientes (predictoras, explicativas
exógenas). Son las variables que proveen las bases para
estimar.
•Regresión simple: interviene una sola variable independiente
•Regresión múltiple: intervienen dos o más variables
independientes.
•Regresión lineal: la función es una combinación lineal
de los parámetros.
•Regresión no lineal: la función que relaciona los
parámetros no es una combinación lineal
GRÁFICO DE DISPERSIÓN
Los diagramas de dispersión no sólo muestran la relación
existente entre variables, sino también resaltan las
observaciones individuales que se desvían de la relación
general. Estas observaciones son conocidas como outliers o
valores inusitados, que son puntos de los datos que aparecen
separados del resto.
COEFICIENTE DE CORRELACIÓN
LINEAL
El Coeficiente de Correlación (r)
requiere variables medidas en escala de
intervalos o de proporciones
– Varía entre -1 y 1.
– Valores de -1 ó 1 indican correlación perfecta.
– Valor igual a 0 indica ausencia de correlación.
– Valores negativos indican una relación lineal inversa y
valores positivos indican una relación lineal directa
CORRELACIÓN NEGATIVA
PERFECTA
10
9
8
7
6
Y 5
4
3
2
1
0

0 1 2 3 4 5 6 7 8 9 10
X
CORRELACIÓN POSITIVA
PERFECTA
10
9
8
7
6
Y 5
4
3
2
1
0

0 1 2 3 4 5 6 7 8 9 10
X
AUSENCIA DE
CORRELACIÓN
10
9
8
7
6
Y 5
4
3
2
1
0

0 1 2 3 4 5 6 7 8 9 10
X
CORRELACIÓN FUERTE Y
POSITIVA
10
9
8
7
6
Y 5
4
3
2
1
0

0 1 2 3 4 5 6 7 8 9 10
X
Fórmula para el coeficente de
correlación (r) Pearson

n(ΣXY)
r=
(ΣX)(ΣY) (ΣY) 2

[n(ΣX ) (ΣX) ][n(ΣY ) ]


2 2 2
MODELOS DE REGRESIÓN

Un modelo de regresión, es una manera de


expresar dos ingredientes esenciales de
una relación estadística:
Una tendencia de la variable dependiente Y a
variar conjuntamente con la variación de la
o las X de una manera sistemática
Una dispersión de las observaciones alrededor
de la curva de relación estadística
MODELOS DE REGRESIÓN

Estas dos características están implícitas en un


modelo de regresión, postulando que:
En la población de observaciones asociadas con el
proceso que fue muestreado, hay una
distribución de probabilidades de Y para cada
nivel de X.
Las medias de estas distribuciones varían de manera
sistemática al variar X.
ANÁLISIS DE
REGRESIÓN

Objetivo: determinar la ecuación de regresión para


predecir los valores de la variable dependiente (Y)
en base a la o las variables independientes (X).
Procedimiento: seleccionar una muestra a partir de
la población, listar pares de datos para cada
observación; dibujar un diagrama de puntos para
dar una imagen visual de la relación; determinar la
ecuación de regresión.
ESTIMACIÓN DE LA ECUACIÓN DE
REGRESIÓN SIMPLE
Y’= a + bX, donde:
Y’ es el valor estimado de Y para distintos X.
a es la intersección o el valor estimado de Y
cuando X=0 b es la pendiente de la línea, o el cambio
promedio de Y’
para cada cambio en una unidad de X
el principio de mínimos cuadrados es usado para obtener
n(XY )  (  X )(Y )
b 
a n (  X 2
)  (  X ) 2

y b:
 Y  X
a   b n
n
COEFICIENTE DE
DETERMINACIÓN
Coeficiente de Determinación, R 2 - es la
proporción de la variación total en la
variable dependiente Y que es explicada o
contabilizada por la variación en la variable
independiente X.
– El coeficiente de determinación es el
cuadrado del coeficiente de correlación, y
varia entre 0 y 1.
Cálculo del R2 a través de
la siguiente fórmula
Los problemas de regresión y de correlación lineales se
parecen pero difieren

En la finalidad
En las variables

REGRESION CORRELACION
x variable NO hay distinción entre
independiente fija variable dependiente e
independiente
y variable x e y son variables
dependiente aleatoria aleatorias
EJEMPLO

• El tiempo que requería un escritor para poder terminar sus


libros fueron los siguientes:
Número de libros 100 200 300 400 490
Tiempo (en meses) 237 350 419 465 507

• Con la variable N° de libros vs Tiempo (en meses), encuentre


el coeficiente de correlación de Pearson, luego responda:
• ¿La relación entre las dos variables es positiva o negativa?
Interprétela.
• ¿Qué tan fuerte es la relación entre las dos variables, según
el coeficiente de correlación de Pearson?
• Dé una conclusión usando el coeficiente de
determinación.
• Encuentre la recta de regresión de tendencia y dibújela
dentro del diagrama de dispersión
• Haga predicciones con el modelo de recta de regresión
encontrado:
• Si el numero de libros es 620, ¿Cuál es el tiempo (en
meses)?
• Si el tiempo (en meses) es 150, ¿Cuál es el numero de
libros?

You might also like