You are on page 1of 8

ANLISIS DE REGRESIN Y CORRELACIN MULTIPLE

CONCEPTO Anlisis de Correlacin: El anlisis de correlacin es el conjunto de tcnicas estadsticas empleado para medir la intensidad de la asociacin entre dos variables. El principal objetivo del anlisis de correlacin consiste en determinar qu tan intensa es la relacin entre dos variables, estas pueden ser. * Variable Dependiente: es la variable que se predice o calcula. Cuya representacin es "Y" * Variable Independiente: es las variables que proporcionan las bases para el clculo. Cuya representacin es: X. Esta o estas variables suelen ocurrir antes en el tiempo que la variable dependiente. Anlisis de Regresin: El anlisis de regresin mltiple es una tcnica de anlisis multi-variable en el que se establece una relacin funcional entre una variable dependiente o a explicar y una serie de variables independientes o explicativas, en la que se estiman los coeficientes de regresin que determinan el efecto que las variaciones de las variables independientes tienen sobre el comportamiento de la variable dependiente.

Modelo de Regresin Mltiple Lineal: La regresin lineal nos permite trabajar con una variable a nivel de intervalo o razn, as tambin se puede comprender la relacin de dos o ms variables y nos permitir relacionar mediante ecuaciones, una variable en relacin a otras variables . La regresin lineal mltiple estima los coeficientes de la ecuacin lineal, con una o ms variables independientes, que mejor prediga el valor de la variable dependiente. La regresin mltiple comprende tres o ms variables. Existe solo una variable dependiente, pero hay dos o ms tipo independiente. Esta operacin al desarrollo de una ecuacin que se puede utilizar para predecir valore de y, respecto a valores dados de la diferencia variables independientes adicionales es incrementar la capacidad predicativa sobre la de la regresin lineal simple

Modelo de Regresin Mltiple No Lineal: La hiptesis de linealidad entre dos o ms variables es una hiptesis muy fuerte que a menudo no se cumple. En estas circunstancias existen otro tipo de funciones de tipo no lineal que podran ajustarse a los datos Es un problema de inferencia para un modelo tipo ( )

Basado en datos multidimensionales x, y donde f es alguna funcin no lineal respecto a algunos parmetros desconocidos. Como mnimo se pretende obtener los valores de los parmetros asociados con la mejor curva de ajuste. CONCEPTOS QUE INVOLUCRA

Multicolinealidad= El problema de la multicolinealidad hace referencia, en concreto, a


la existencia de relaciones aproximadamente lineales entre los regresores del modelo, cuando los estimadores obtenidos y la precisin de stos se ven seriamente afectados. Para analizar este problema, vamos a examinar la varianza de un estimador.

Homocedasticidad(http://www.google.co.ve/url?sa=t&rct=j&q=homocedasticidad&so
urce=web&cd=7&cad=rja&ved=0CGAQtwIwBg&url=http%3A%2F%2Fwww.youtube.com%2Fwatch %3Fv%3D73M6FaDj3ik&ei=RqQjUYebCqnJ0QHssIHgCw&usg=AFQjCNFQh2iXoN0gRfL47wg9HShHh TpXAw&bvm=bv.42553238,d.b2U ) <VIDEO=

la varianza de los residuos es constante y no vara en los diferentes niveles del factor. La falta de homocedasticidad se denomina heterocedasticidad.
Consecuencias de la falta de homocedasticidad

Se ha demostrado que si el diseo es balanceado (n = m, i = 1,...,I) los niveles de significacin de los pruebas de hiptesis y los niveles de confianza de los intervalos apenas se ven afectados por la existencia de heterocedasticidad, a no ser que la varianza de la respuesta para algn tratamiento particular sea considerablemente mayor que para otros.
i

Para tamaos muestrales de los grupos similares, la heterocedasticidad no afecta al F-test ni a los distintos mtodos de comparaciones mltiples siempre que:

Si los tamaos muestrales son muy distintos, se verifica que: - Si los tratamientos con tamaos muestrales pequeos tienen mayor varianza la probabilidad de cometer un error de tipo I en las pruebas de hiptesis ser menor de lo que se obtiene y los niveles de confianza de los intervalos sern inferiores a lo que se cree; - Si los tratamientos con tamaos muestrales grandes tienen mayor varianza, entonces se tendr el efecto contrario y las pruebas sern conservadoras. Para estudiar si se verifica la homocedasticidad de modelo se pueden hacer los siguientes anlisis descriptivos y grficos: Clculo de la varianza (o desviacin tpica) de los residuos segn los niveles del factor. El grfico de cajas mltiple proporciona una idea de la distribucin de los residuos segn los niveles del factor. El grfico de los residuos (e ) frente a las predicciones ( ) es interesante porque, en muchas situaciones, la varianza de los residuos por niveles aumenta con las predicciones. Esto se puede observar en la Figura 4.6.
ij i.

Figura 4.6. Digrama de dispersin de residuos frente a predicciones.

Existen contrastes para detectar heterocedasticidad:


El contraste de Cochran, se utiliza si todos los tamaos muestrales son

iguales y es til si la varianza de un tratamiento es mucho mayor que en los otros.


El contraste de Bartlett o el Contraste de Hartley son ms generales y ms

utilizados. Estos contrastes son muy conservadores y muy sensibles a la ausencia de normalidad.
El contraste de Levene es muy utilizado, en esencia, consiste en efectuar un

anlisis de la varianza sobre las diferencias en valor absoluto entre las observaciones y la mediana (u otra medida de tendencia central) manteniendo el diseo original.
El contraste de Romero y Znica, se basa en una idea anloga, se realiza un

anlisis de la varianza sobre los cuadrados de los residuos del modelo ajustado con el mismo factor en estudio. Ahora la hiptesis bsica a contrastar es que la varianza en todos los grupos es la misma. Un modelo muy usual de heterocedasticidad es el siguiente modelo multiplicativo (4.2) donde los son variables aleatorias de media 1 y varianza constante. En este modelo los grupos con mayor media tienen mayor variabilidad. Para corregir este problema se toman logaritmos en el modelo (4.2) y se obtiene el siguiente modelo aditivo que si es homocedstico.
ij

(4.3) Muchas veces la heterocedasticidad responde al modelo: (4.4) as el modelo multiplicativo (4.2) sigue una heterocedasticidad del tipo (4.4) con q = 1. Para este tipo de heterocedasticidad es posible transformar los datos para obtener homocedasticidad (en otro caso puede resultar imposible encontrar transformaciones adecuadas). Adems la heterocedasticidad del modelo suele ir unida a la falta de normalidad (la distribucin de es asimtrica) y la
ij

transformacin de los datos corrige simultaneamente ambos problemas. Como una primera aproximacin, la transformacin tomar logaritmos puede proporcionar buenos resultados y es un caso particular de la familia de transformaciones de Box-Cox que es ampliamente utilizada y que se describe en la siguiente seccin.

Regresin=

es la tendencia de una medicin extrema a presentarse ms cercana a la

media en una segunda medicin. La regresin se utiliza para predecir una medida basndonos en el conocimiento de otra.

Correlacin=
OBJETIVOS DEL MODELO

FUNCIONES DEL MODELO

CARACTERISTICAS DEL MODELO

UTILIDAD Y USOS DEL MODELO

PROCEDIMIENTOS PARA LA REALIZACION Y DESCRIPCION DEL MODELO Tamao adecuado de la muestra: se recomienda n= 20 x n de variables predictoras. Las variables X1 , X2 , ... X k son deterministas (no son variables aleatorias) ya que sus valores vienen de la muestra tomada. Las variables X1 , X2 , ... X k son linealmente independientes (no se puede poner a una de ellas como combinacin lineal de las otras). Esta es la hiptesis de independencia y cuando no se cumple se dice que el modelo presenta multicolinealidad. O sea: Ninguna v. Independiente da un R2 = 1 con las otras variables independientes Linealidad de las relaciones: la v. Independiente presenta relacin lineal con cada una de las dependientes. Se comprueba con los grficos de regresin parcial. Su incumplimiento se arregla mediante transformaciones de los datos Los residuos siguen una distribucin Normal N(0, 2) , no estn correlacionados con ninguna de la variables independientes, ni estn autocorrelacionados. Hay homocedasticidad : la varianza del error es constante para los distintos valores de las variables independientes.

PASOS: 1. 2. 3. 4. 5. 6. 7. 8. Identificar Xi, Y Construir diagrama de dispersin Estimar los parmetros del modelo. Probar la significancia Determinar la fuerza de la asociacin Verificar la exactitud de la prediccin Anlisis de residuales Validacin cruzada del modelo

ENFOQUE MATRICIAL Al ajustar un modelo de regresin lineal mltiple, en particular cuando el nmero de variables pasa de dos, el conocimiento de la teora matricial puede facilitar las manipulaciones matemticas de forma considerable. Suponga que el experimentador tiene k variables independientes x1, x2, . . . xk y n observaciones y1,y2,.. yn, cada una de las cuales se pueden expresar por la ecuacin

Este modelo en esencia representa n ecuaciones que describen como se genera los valores de respuesta en el proceso cientfico. Con el uso de la notacin matricial, podemos escribir la ecuacin:

Dnde:

[ ]

] [ ]

ESTIMACIN DE MINIMOS CUADRADOS

COMO SE RESENTA LA ECUACIN

Hiperplano Cuando hay dos regresores k= 2: Plano

COMO SE REPRESENTA GRAFICAMENTE LA ECUACIN

QUE ES LA CORRELACIN MULTIPLE Relacin entre varias variables independientes con una dependiente. COMO SE CONSTRUYE UN MODELO PREDICITVO

http://www.uam.es/personal_pdi/ciencias/abaillo/AmbEst/Tema4.pdf http://www.slideshare.net/jjgibaja/regresin-lineal-mltiple http://dm.udc.es/asignaturas/estadistica2/sec8_1.html http://www.uam.es/personal_pdi/ciencias/ajustel/docencia/estadisccaa/trREGRESION_MULTIPLE.pdf http://accensum.files.wordpress.com/2011/05/texto_de_ejercicios_regresion_lineal_multiple.pdf http://ocw.upm.es/estadistica-e-investigacion-operativa/introduccion-a-la-estadistica-basica-eldiseno-de-experimentos-y-la-regresion-lineal/contenidos/Material-de-clase/Regresion-linealmultiple.pdf

You might also like