You are on page 1of 5

Regresin lineal mltiple

El modelo lineal general tiene la forma:

Yi ! F 0  F1 X i1  F 2 X i 2  ....  F n X ik  I i , i ! 1,2,...n. p
Donde Yi es la i-sima observacin como respuesta de valores fijos X ik , I i es el error aleatorio de dicha observacin y existen m=k+1 parmetros lineales desconocidos. Matricialmente se puede escribir como:

Y ! XF  I
Donde:

En general, la tabla ANOVA del modelo ser la siguiente:

I Verificacin de los parmetros del modelo lineal Ejemplo: Suponga usted est analizando el rendimiento fsico de 20 nios, de los cuales se conoce su peso, altura (pulgadas) y edad. Los datos son los siguientes:
Nio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Puntaje 58 54 55 74 86 98 96 70 40 67 41 41 47 45 92 50 98 42 64 70 Edad 7 7 9 7 9 8 9 7 7 9 6 7 8 8 9 7 9 8 8 8 Altura 47,5 45 52,5 48 55 51 53 46 48 50,5 45 48,5 50,5 49 51,5 46,5 53,5 45 52,5 51,5 Peso 53 50 85 52 76 64 75 75 68 74 40 66 65 70 70 60 77 65 65 67

1.- Analizar los parmetros, si son iguales o no en el modelo. 2.- Interpretar los parmetros. 3.-Interpretar coeficiente de correlacin mltiple. 4.-Indicar el modelo lineal del problema. 5.-Calcular los valores de el modelo obtenido.

1.- Hay que formular una hiptesis de acuerdo al problema, y ser que existe 1 o ms parmetros que sean igual (es) a 0. Es decir, que peso, altura o edad, uno de ellos o el conjunto no serviran para predecir el rendimiento. . Para esto, construiremos una tabla ANOVA, la que es la siguiente:
ANLISIS DE VARIANZA Grados de libertad 3 16 19 Suma de cuadrados Promedio de los cuadrados 3772,979594 1257,659865 4189,820406 261,8637754 7962,8 F 4,80273 Valor crtico de F 0,014294331

Regresin Residuos Total

Se puede ver, que el F de entregado (que sera el calculado) es 4,80273. Un F de tabla, con probabilidad =0,95, con 1 g.l. de numerador y 16 g.l. en denominador es de 3.24 Por lo tanto F calculado > F tabla, lo que lleva a rechazar la Hiptesis nula. Esto adems se puede apreciar con que el valor crtico de F es de 0,0142 es decir, refuerza la idea de rechazar H. nula. Se concluye que los parmetros son distintos y no son cero. 2.- Lo siguiente es averiguar el valor de esos parmetros. Los obtenidos, son los siguientes:
Intercepcin Edad Altura Peso Coeficientes -136,5395663 9,52981725 3,342909802 -0,597472046

Es decir, segn el modelo habra un intercepto de -136, 5395663. El parmetro de la edad 9,52981725, altura 3,342909802 y peso -0,597472046. La forma de interpretar cada parmetro es la siguiente: Por ejemplo, si la edad de algn nio x vara en 1 unidad y el resto de las variables se mantiene constante, entonces el rendimiento de ese nio aumentar en 9,52981725. Y ahora, si el peso vara en una unidad y el resto de las variables se mantiene constante, el rendimiento disminuye en 0,597472046 unidades. Es decir, cada parmetro puede interpretarse como la razn de cambio del rendimiento en relacin a esa variable.

3.- La tabla de las estadsticas descriptivas es la siguiente:


Estadsticas de la regresin Coeficiente de correlacin mltiple Coeficiente de determinacin R^2 R^2 ajustado Error tpico Observaciones 0,688350012 0,473825739 0,375168065 16,18220552 20

El coeficiente de correlacin mltiple es de 0,68835.. lo cual quiere decir que cerca del 68,835% de los datos son bien explicados con las tras variables altura, peso y edad. 4.- Por lo tanto, el modelo sera el siguiente: Rendimiento= -136,5395663 +9,52981725*edad +3,342909802*altura -0,597472046*peso
-136,5395663+9,52981725*  -0,597472046*

5.- Con el modelo indicado, los valores del rendimiento esperados son: 57,2913515 50,7264932 73,9464296 59,5602785 87,6809525 71,9491606 81,5926049 39,1326018 50,0007257 73,8328025 47,1713964 52,8671247 69,6802336 61,6785087 79,5656004 49,7661374 82,0691157 51,2942297 76,3660532 71,8281993

Y la diferencia entre valor real (muestreado) y estimado es


0,708648472 3,273506837 -18,94642956 14,43972152 -1,680952477 26,05083942 14,40739508 30,86739819 -10,00072574 -6,832802462 -6,171396375 -11,86712473 -22,68023363 -16,67850869 12,43439955 0,233862597 15,93088427 -9,29422972 -12,36605323 -1,828199338

sta diferencia es el error aleatorio que cada elemento posee al ser extrada la muestra aleatoria. Grficamente, ahora la relacin entre Y estimado e Y muestreado es:
100 90 80 70 60 50 Series1 40 30 20 10 0 0 20 40 60 80 100 120

Se puede apreciar que los datos presentan una buena correlacin, con el 68,8% dicho anteriormente.

You might also like