You are on page 1of 22

Modelo

de regresin
lineal mltiple:
especificacin, estimacin y contraste
Toms del Barrio Castro
Miquel Clar Lpez
Jordi Suriach Caralt
PO1/85014/00170

FUOC P01/85014/00170

ndice

Introduccin .............................................................................................. 5
Objetivos...................................................................................................... 7
1. Introduccin a la econometra........................................................ 9
1.1. Qu es la econometra? ................................................................... 9
1.2. Variables, relaciones y parmetros.................................................... 10
1.3. La modelizacin economtrica. Fases de la investigacin
economtrica..................................................................................... 12
1.4. Objetivos de la modelizacin economtrica .................................... 14
2. El modelo de regresin lineal mltiple estndar ....................... 16
2.1. Especificacin.................................................................................... 16
2.2. Hiptesis bsicas del modelo de regresin lineal
mltiple estndar .............................................................................. 19
2.2.1. Hiptesis generales del modelo .............................................. 19
2.2.2. Hiptesis sobre el trmino de perturbacin ........................... 20
2.2.3. Hiptesis sobre las variables explicativas del modelo............ 23
2.2.4. Hiptesis sobre los parmetros del modelo............................ 23
2.3. Estimacin para mnimos cuadrados ordinarios (MCO) ................. 23
2.3.1. Descripcin del mtodo de estimacin .................................. 24
2.3.2. Propiedades de los estimadores MCO de los j ...................... 28
2.4. Anlisis de los residuos y estimacin de u2 ..................................... 32
2.4.1. Propiedades de los residuos .................................................... 33
2.4.2. Estimacin de la varianza del trmino de perturbacin........ 35
2.5. Estimacin por mxima verosimilitud ............................................. 38
2.6. Medidas de la bondad del ajuste ...................................................... 40
2.7. Significacin de los parmetros del modelo .................................... 43
2.7.1 Significacin econmica.......................................................... 44
2.7.2 Significacin estadstica........................................................... 45
2.8. El modelo de regresin lineal mltiple en desviaciones
respecto a la media ........................................................................... 48
2.9. Prediccin.......................................................................................... 49
2.9.1. Prediccin puntual.................................................................. 50
2.9.2. Prediccin por intervalo ......................................................... 50
3. El modelo de regresin con restricciones lineales...................... 53
3.1. Contrastacin de restricciones lineales ............................................ 53
3.1.1. Formulacin matricial de las restricciones lineales................ 54
3.1.2. Metodologa para contrastar restricciones lineales:
estadstico de prueba .............................................................. 55
3.1.3. Un mtodo alternativo para contrastar restricciones
lineales .................................................................................... 58

Modelo de regresin lineal mltiple

FUOC P01/85014/00170

Modelo de regresin lineal mltiple

3.2. Estimacin restringida por mnimos cuadrados (MCR)................... 63


3.2.1. El estimador de mnimos cuadrados restringidos .................. 63
3.2.2. Propiedades del estimador restringido ................................... 64
3.2.3. Un ejemplo aclaratorio ........................................................... 65
3.3. Anlisis de la permanencia estructural. Contraste de Chow ........... 70
3.3.1. Introduccin ........................................................................... 70
3.2.2. Contraste de Chow de permanencia estructural.................... 71
3.3.3. Un caso particular: tamao insuficiente de una
de las submuestras .................................................................. 73
3.3.4. Limitaciones del contraste de Chow ...................................... 73
Glosario ....................................................................................................... 77
Bibliografa ................................................................................................ 79

UW01/85014/00174

WEB

Encontraris otras actividades,


los ejercicios de
autoevaluacin y el
solucionario en la web de esta
asignatura.

FUOC P01/85014/00170

Modelo de regresin lineal mltiple

Introduccin

Este mdulo didctico est formado por los tres apartados siguientes:
1) El primero es una introduccin que nos permitir ponernos en contacto
con los aspectos relacionados con la econometra. En concreto, veremos cules son los fundamentos de la econometra, sus objetivos, qu tipo de problemas nos permite solucionar, y pondremos de manifiesto las relaciones que
tiene con otros mbitos de la economa.
2) En el segundo apartado introduciremos el modelo de regresin mltiple
(MRLM), que ser la base de todos los aspectos que trataremos a lo largo de esta
asignatura y de su continuacin. En concreto, veremos los contenidos siguientes:
a) La formulacin del MRLM.
b) Las hiptesis bsicas relativas al comportamiento de las diferentes partes
que lo integran: las variables (endgena y explicativas), los parmetros y el
trmino de perturbacin.
c) La estimacin de los parmetros desconocidos del modelo por los mtodos de mnimos cuadrados ordinarios (MCO) y mxima verosimilitud (MV).
d) Las propiedades de los estimadores cuando se cumplen las hiptesis bsicas.
e) Las medidas que nos permitirn cuantificar la bondad del ajuste y evaluar
el modelo.
f) La manera de obtener predicciones una vez que el modelo ya se ha formulado, estimado y validado.
3) El tercer y ltimo apartado de este mdulo lo dedicaremos a estudiar los
aspectos relacionados con la contrastacin de restricciones lineales. Es en
este apartado, pues, donde presentaremos las herramientas que necesitaremos para contrastar hiptesis que se puedan formular sobre el comportamiento de los parmetros. En concreto, veremos los puntos siguientes:
a) Los tipos de restricciones lineales que podremos contrastar.
b) La manera de formularlos matricialmente.
c) Los estadsticos de prueba adecuados para comprobar si las hiptesis formuladas sobre los parmetros de la poblacin en forma de restricciones lineales se pueden considerar ciertas en el mbito de la poblacin o no.

Veris aspectos avanzados de


los contenidos de esta introduccin
en la asignatura Econometra.

FUOC P01/85014/00170

d) Los contrastes de significacin individual y global de parmetros que se


estudian en el segundo apartado, que no son ms que casos particulares de
los contrastes de restricciones lineales.
e) Los estimadores restringidos (aquellos que hacemos que cumplan las restricciones lineales planteadas) y sus propiedades.
f) La manera de contrastar la permanencia estructural del modelo.

Modelo de regresin lineal mltiple

FUOC P01/85014/00170

Objetivos

Una vez trabajados los contenidos de este mdulo didctico, los estudiantes
tenis que ser capaces de:
1. Conocer las hiptesis bsicas que debe cumplir el modelo de regresin
mltiple que denominaremos modelo estndar.
2. Obtener los estimadores de mnimos cuadrados ordinarios y de mxima
verosimilitud de los parmetros desconocidos del modelo de regresin
mltiple, y conocer las propiedades que tienen cuando se cumplen las
hiptesis bsicas.
3. Cuantificar la bondad del ajuste del modelo.
4. Determinar cul de las variables exgenas contribuye ms a explicar el
comportamiento de la variable endgena, y contrastar la significacin
individual de un parmetro y la global del modelo.
5. Obtener la prediccin puntual y por intervalo de la variable endgena.
6. Expresar restricciones lineales matricialmente.
7. Poder contrastar cualquier restriccin lineal homognea de igualdad mediante mtodos distintos.
8. Obtener los estimadores restringidos y conocer sus propiedades tanto si
partimos de la hiptesis de que las restricciones lineales planteadas son
ciertas como si partimos de que no lo son.
9. Saber cmo contrastar la permanencia estructural de los parmetros del
modelo.

Modelo de regresin lineal mltiple

FUOC P01/85014/00170

Modelo de regresin lineal mltiple

1. Introduccin a la econometra

El objetivo de este apartado es presentar las bases sobre las cuales se asienta la
metodologa economtrica. Por ello, en primer lugar, despus de una pequea
introduccin sobre cuestiones como, por ejemplo, el origen de la econometra y
qu es la econometra, presentamos toda una serie de conceptos bsicos y, cuando nos hayamos familiarizado con ellos, abordaremos el cuerpo central del
mdulo: la modelizacin economtrica. Con esta finalidad, explicamos las diferentes etapas que hay que seguir en todo estudio economtrico. Para acabar, presentamos los objetivos que se pueden alcanzar con un estudio de este tipo.

1.1. Qu es la econometra?
El nacimiento de la econometra, del mismo modo que otras disciplinas del
mbito de la ciencia econmica, se produce ante la necesidad de resolver toda
una serie de problemas con la informacin econmica existente. Esta aparicin se basa en el desarrollo de determinadas tcnicas que facilitan el anlisis
cuantificado de las relaciones econmicas.

El objetivo que persigue la econometra es encontrar y cuantificar las


relaciones econmicas empleando tcnicas basadas en los mtodos
inferenciales de la estadstica.

En concreto, en el nacimiento de la econometra confluyeron muchos factores, entre los cuales destaca el planteamiento distinto que exista, durante las
dcadas de los aos veinte y treinta, del estudio de los ciclos econmicos. En
estos aos apareci un grupo de economistas preocupados por la colaboracin entre matemticos, estadsticos y economistas. Crean que la introduccin de los mtodos matemticos en la investigacin, en las ciencias sociales
en general y en la economa en particular, permitira avanzar en su desarrollo. Adems, criticaban la no-consideracin de la teora econmica en los
modelos explicativos de los ciclos econmicos. Las aportaciones de estos
autores constituyeron el antecedente del anlisis econmico propuesto por la
Comisin Cowles y por T. Haavelmo (1944), basado en el enfoque probabilstico que hay en las interrelaciones econmicas.
En la literatura podemos encontrar definiciones distintas de la econometra.
Entre ellas, podemos destacar las dos siguientes:
1) Anlisis cuantitativo de los fenmenos econmicos reales, basado en el desarrollo
simultneo de la teora y la observacin que se relacionan mediante los mtodos de inferencia adecuados.
P.A. Samuelson; T.C. Koopmans; M.H. Stone (1954).

Algunos
de los economistas
preocupados por la
colaboracin entre
matemticos, estadsticos y
economistas eran personajes
como R. Frisch, J. Tinbergen,
K. Pearson y J. Slutskij, entre
otros.

Cmo se puede definir


la econometra?

FUOC P01/85014/00170

10

Modelo de regresin lineal mltiple

2) Rama de la economa relacionada con la estimacin emprica de las relaciones


econmicas. Emplea la teora econmica, incorporada en un modelo economtrico,
hechos, resumidos en datos, y estadstica terica, adecuada por las tcnicas economtricas para medir y contrastar empricamente determinadas relaciones entre variables econmicas, dando contenido emprico al razonamiento econmico.
M.D. Intrilligator (1978).

Atendiendo a todo lo que hemos dicho con anterioridad, podemos


sealar que los rasgos ms relevantes que caracterizan la econometra
son los siguientes:

T.C. Koopmans, autor del manual


Econometric Theory (1992)

a) La econometra es la rama de la ciencia econmica que se ocupa del


anlisis cuantitativo de los fenmenos econmicos.
b) La econometra est relacionada con otras disciplinas como, por
ejemplo, la teora econmica, la estadstica y las matemticas.
c) La econometra se basa en un enfoque probabilstico de la realidad.

1.2. Variables, relaciones y parmetros


En todo modelo se distinguen dos tipos de variables: la variable endgena
(tambin llamada variable dependiente o variable que se debe explicar) y las variables explicativas (o variables independientes o variables exgenas).

La variable endgena es aquella cuyo comportamiento queremos


conocer y explicar. Las variables explicativas son aquellas que, de
acuerdo con los postulados de la teora econmica, permiten explicar
el comportamiento de la variable endgena. Dependiendo del nmero de variables explicativas que se introducen, una o ms, el modelo se
denominar modelo simple o modelo mltiple.

As, por ejemplo, siguiendo el modelo keynesiano consumo-renta, el consumo de los individuos depende de (se explica por) la renta de cada uno de
ellos. Por tanto, en este modelo, la variable endgena (aquello que queremos
conocer y explicar) es el consumo de los individuos, y la variable explicativa
(aquello que permite explicarlo) es la renta de los individuos. Se trata, pues,
de un modelo simple. Si partimos de la hiptesis de que, adems de la renta
de los individuos, el nmero de hijos tambin permite explicar las pautas de
comportamiento del consumo, tendremos dos variables explicativas y, por
tanto, estaremos ante un modelo mltiple.

Consultad el modelo keynesiano


consumo-renta en la asignatura
Macroeconoma.

11

FUOC P01/85014/00170

Modelo de regresin lineal mltiple

Ejemplo ilustrativo de un modelo simple y de un modelo mltiple


Con el fin de ilustrar un modelo simple utilizaremos la funcin keynesiana de consumo.
sta estipula que el consumo Ci de las unidades domsticas depende de su renta Yi.
Supongamos que en nuestro modelo simple la dependencia es lineal:
Ci 5 1 Yi .

La funcin anterior, tal y como se puede ver, es determinista. Nos dice, por ejemplo,
que para un nivel de renta Y1 el consumo ser C1 y que para un nivel de renta Y2 el
consumo ser C2.
Si tenemos en cuenta que el nmero de hijos Ni tambin permite explicar el consumo, entonces tendremos un modelo mltiple, que puede ser el siguiente:
Ci 5 1 Yi 1 Ni .

Entre la variable endgena y las variables explicativas* existe, de acuerdo


con lo que hemos comentado en el prrafo anterior, una relacin de cau-

* De ahora en adelante
supondremos que trabajamos
con un modelo mltiple.

salidad que se caracteriza por el hecho de ser unidireccional: los comportamientos de las variables explicativas causan (determinan, explican) el de
la variable endgena. Precisamente la existencia de esta relacin de causalidad es la que permite formular un modelo. No obstante, esta relacin que
se establece entre las variables del modelo puede ser de muchos tipos: lineal, cuadrtica, exponencial, logartmica, etc. En consecuencia, en el momento de especificar el modelo hay que determinar (tambin de acuerdo con los
postulados de la teora econmica) la forma funcional que adopta la relacin entre la variable endgena y las explicativas. De todos modos, en el
mbito del modelo que estudiaremos supondremos que la relacin es lineal y que, si no lo es, se puede linealizar mediante una transformacin adecuada.

Adicionalmente, en todo modelo aparecen lo que denominaremos parmetros. Los parmetros, que estn asociados a cada variable explicativa, cuantifican la relacin existente entre la variable endgena y cada una de las
variables explicativas. Son, por tanto, lo que se desconoce y se debe estimar.

La relacin entre
la variable endgena y las
variables explicativas no es
lineal o linealizable en todos
los casos. A veces, nos
encontraremos ante modelos
no lineales, que tambin se
podran estudiar, pero que
quedan fuera de los objetivos
de este material didctico.

FUOC P01/85014/00170

12

Modelo de regresin lineal mltiple

1.3. La modelizacin economtrica.


Fases de la investigacin economtrica

La econometra es la rama de la economa que tiene que ver con la estimacin emprica, con la cuantificacin de las relaciones econmicas:
a partir de los postulados que establece la teora econmica se especifica un modelo economtrico, el cual, a partir de un conjunto de informacin estadstica (datos), se estima empleando tcnicas estadsticas y
economtricas con el fin de medir y contrastar empricamente determinadas relaciones entre variables econmicas.

En el cuadro siguiente presentamos grficamente en qu consiste el enfoque


economtrico. Como podemos observar, de acuerdo con lo que hemos dicho
anteriormente, hay dos pilares bsicos que constituyen las materias primas en
cualquier estudio economtrico: la teora y los hechos.

Fuente: M.D. Intrilligator (1978, pg. 3)

1) El primer pilar, la teora, permite derivar un modelo (el modelo econmico), que sintetiza la incgnita relevante sobre el fenmeno (la variable endgena) objeto de anlisis y del cual deriva el modelo economtrico que permite medirlo y contrastarlo empricamente.

La modelizacin economtrica
presenta tres fases: la especificacin, la
estimacin y el contraste.

Las tcnicas
economtricas
no slo estn limitadas
al mundo economicoempresarial. Por el contrario, tambin son susceptibles de aplicacin no slo a otros campos
de las ciencias sociales (como
la sociologa, la historia, etc.),
sino tambin
a otros mbitos (como la
educacin, la sanidad,
el medio ambiente, etc.).

13

FUOC P01/85014/00170

Modelo de regresin lineal mltiple

Ejemplo de modelo econmico


Un ejemplo de aplicacin de un modelo sera tener el objetivo de explicar el comportamiento de la variable endgena cantidad demandada de un producto, Qi. La teora
econmica propondra el conjunto de variables que la explican a partir de las hiptesis
de competencia perfecta, oligopolio, etc. A partir, pues, de la teora econmica se podra
proponer un modelo econmico concreto que sintetizara la teora:
Q i 5 (Pi ,Pi ),
donde Pi sera el precio del bien y Pi , el precio de los productos sustitutivos. A partir de
este modelo se podra especificar un modelo economtrico.

2) El otro pilar bsico, los hechos (sucesos del mundo real referidos al fenmeno que se investiga), se concreta en una serie de datos que pueden ser de
corte transversal, si hacen referencia a distintos individuos en el mismo instante de tiempo, o de serie temporal, si se observan durante un periodo de
tiempo determinado.
Para garantizar la calidad de los datos es necesario, a veces, someterlos a un
tratamiento previo (deflacin, enlace, interpolacin de datos ausentes, obtencin de la tendencia de la serie, etc.). Saber de qu informacin estadstica se
dispone (de qu variables se tiene informacin) tambin condiciona el mode-

Consultad cmo se puede especificar


un modelo economtrico en el
subapartado 2.1 de este mdulo didctico.

Ejemplos de tipos
de datos
Las observaciones (datos)
correspondientes a las ventas
de un conjunto de empresas
referidas a un mismo periodo
(ao, trimestre, etc.)
constituyen un conjunto
de datos de corte transversal.
Por otro lado, las ventas de
una empresa realizadas, por
ejemplo, desde 1960 hasta
1997 constituyen una serie
temporal.

lo que se pueda proponer como idneo.


Una vez que se especifica el modelo y se dispone de la informacin estadstica convenientemente tratada, se llega a la etapa siguiente del trabajo economtrico: la etapa de estimacin. En esta etapa se requiere utilizar toda una
serie de tcnicas economtricas que, en general, puede decirse que son extensiones de los mtodos clsicos de estimacin empleados en cursos bsicos de
estadstica. El output de esta etapa de estimacin permite medir y contrastar
las relaciones sugeridas por la teora econmica.

Recordad las estimaciones del modelo


de regresin simple, que se han estudiado
en la asignatura Estadstica I.

1.4. Objetivos de la modelizacin economtrica


En la literatura economtrica existe un consenso bastante generalizado en
fijar como objetivos de la modelizacin economtrica el anlisis estructural,
la prediccin y la evaluacin de polticas. De todos modos, hay que tener presente que estos tres objetivos no son excluyentes entre s; por el contrario, un
estudio economtrico puede tener uno o dos de ellos o incluso los tres. Observad en qu consiste cada uno de estos objetivos:

1) El anlisis estructural consiste en medir cuantitativamente las relaciones


econmicas entre las variables incluidas en el modelo. Asimismo, facilita la
comparacin de teoras rivales sobre un mismo fenmeno.
2) La prediccin no es ms que obtener los valores que determinadas variables tomarn fuera de la muestra. As pues, las predicciones son (pueden ser)
de gran utilidad para emprender determinadas acciones.

Consultad los objetivos de


la modelizacin economtrica
en el cuadro del subapartado 1.3
de este mdulo didctico.

FUOC P01/85014/00170

14

3) La evaluacin de polticas es el uso de los modelos economtricos para


seleccionar entre polticas alternativas. En concreto, una posibilidad a menudo empleada por los policymakers (directores de la poltica econmica de una
empresa, de un estado, etc.) consiste en simular polticas alternativas y hacer
predicciones condicionadas a futuros valores de las variables explicativas relevantes en cada alternativa.
Por ltimo, no queremos finalizar este apartado sin poner de manifiesto la
potencialidad del uso de los mtodos economtricos en el mundo empresarial. Esto se debe a que los empresarios tienen que tomar sus decisiones en un
entorno de incertidumbre. Sin duda, cualquier mtodo que permita reducirla
favorecer esta tarea o, como mnimo, permitir llevarla a trmino con ms
elementos de juicio.
Pensad, por ejemplo, en un empresario que tiene dos alternativas: aumentar
su produccin en el prximo ejercicio o mantenerla en los niveles actuales.
Evidentemente, su experiencia puede resultar un elemento que se debe considerar, pero basar su decisin final nicamente en este factor puede ser insuficiente. Por lo tanto, si realiza un anlisis que le permita conocer el comportamiento de su variable de inters (las ventas), podr tomar una decisin con
ms argumentos. Para hacerlo, puede especificar un modelo y plantear distintas hiptesis sobre el comportamiento que experimentarn las ventas de su
producto en el prximo ejercicio.

Modelo de regresin lineal mltiple

15

FUOC P01/85014/00170

Modelo de regresin lineal mltiple

2. El modelo de regresin lineal mltiple estndar

En este apartado estudiaremos la especificacin de un modelo de regresin


lineal mltiple* estndar. Presentaremos las hiptesis bsicas y, a partir de

* A partir de aqu abreviaremos


modelo de regresin lineal mltiple
usando la sigla MRLM.

stas, analizaremos los mtodos adecuados de estimacin de los parmetros


del modelo. A continuacin, se realizarn los contrastes estadsticos de significacin de los parmetros y, finalmente, se estudiar la manera de llevar a
cabo predicciones una vez que ya se ha estimado el modelo.

2.1. Especificacin
En este apartado analizaremos un modelo de regresin que, tal como indica
el ttulo, presenta dos caractersticas importantes:

1) Se trata de un modelo de regresin mltiple, lo cual supone que el comportamiento de una determinada variable, que denominaremos variable endgena, variable dependiente o variable que se debe explicar y que representaremos
con la letra Y, es causado y, por tanto, puede ser explicado adecuadamente, por
un conjunto de k variables que denominaremos explicativas (independientes o
exgenas) y que, en general, representaremos mediante la letra X. Es decir:
Y 5 (X1,X2,X3, ... ,Xk ).

(2.1)

Es importante destacar que existe una relacin de causalidad unidireccional


entre las variables explicativas y la endgena, y no al revs; es decir, la variable Y es una funcin de las variables X1, , Xk.
Y 5 (X1,X2,X3, ... ,Xk ).

(2.2)

2) La segunda caracterstica del modelo de regresin que estudiaremos se refiere a la linealidad. Esto quiere decir que la relacin que hipotticamente existe
entre la variable endgena y las k explicativas es de tipo lineal; por lo tanto,
podemos expresar la variable dependiente como combinacin lineal de las
variables explicativas. Aunque no es estrictamente necesario, normalmente
especificaremos el MRLM incluyendo en las variables explicativas un trmino
independiente. As, a menudo se considera que la variable X1 es una constante
igual a la unidad:
X1 5 1.

Como norma general


supondremos siempre que X1 5 1.

Por lo tanto, el MRLM queda del modo siguiente:


Y 5 1 1 2X2 1 3X3 1 ... 1 k Xk,

(2.3)

16

FUOC P01/85014/00170

Modelo de regresin lineal mltiple

donde 1, 2, ..., k son los parmetros que supondremos constantes para el


conjunto de la muestra de datos analizada. Estos parmetros nos permitirn
medir la intensidad que tienen de media los efectos de las variaciones de las
variables explicativas sobre la variable endgena. Esta interpretacin de los
parmetros j, j 5 1, ..., k es inmediata si se toman derivadas parciales de la
variable endgena respecto a cada una de las variables explicativas:
Y
5 j
Xj

;j 5 2, ..., k.

(2.4)

La relacin entre la variable endgena Y y las variables explicativas X, tal


como ya se ha visto hasta ahora, es determinista, es decir, no es aleatoria. No

Observad la linealidad en los ejemplos


de modelo simple y modelo mltiple
en el subapartado 1.2 de este mdulo
didctico.

obstante, en la realidad, no se cumple casi nunca que las relaciones entre las
variables econmicas sean de este tipo, sino que las relaciones de dependencia tienen un cierto grado de aleatoriedad. Recordemos la funcin keynesiana de consumo, que estipula que el consumo de las unidades domsticas
depende de su renta:
Ci 5 1 Yi.
La funcin anterior es determinista, pero si preguntsemos a un conjunto
de agentes econmicos sobre sus niveles de renta y los recursos que destinan al consumo, nos hallaramos con una situacin como la del grfico
siguiente:
Relacin funcional real
renta-consumo
El grfico nos dice que hay
otros condicionantes en la
decisin de consumo de los
agentes econmicos que no
quedan reflejados en la renta.
Esto se ve en el hecho de
que los puntos tienen una
determinada incertidumbre:
no se encuentran
exactamente sobre la recta,
sino que se sitan en algn
punto ms o menos prximo
a la recta.

En consecuencia, es necesario incluir algn trmino en el modelo de regresin que capte esta aleatoriedad, ya que un modelo determinista no puede
explicar totalmente el comportamiento de la variable endgena. As, en un
modelo de regresin se introduce el trmino de perturbacin para recoger:
a) Todas las dems variables que explican el comportamiento de la variable
endgena pero que no han quedado explicitadas como regresores*. Muchas

* Los regresores son las variables


explicativas que se utilizan para
especificar el modelo.

17

FUOC P01/85014/00170

Modelo de regresin lineal mltiple

de estas variables pueden ser pequeos factores de los cuales no se dispone de


datos, y se supone que su efecto conjunto sobre la variable endgena es nulo.
b) Un segundo factor contenido en el trmino de perturbacin es el mismo
comportamiento aleatorio que hay en la conducta humana en particular, y
en las relaciones econmicas y sociales en general.
c) El tercer factor lo constituyen los errores de medida en las variables incluidas en el modelo y los errores en la ecuacin*.

* Los errores en la ecuacin


se pueden deber a una mala
especificacin del modelo.

Pues bien, este trmino que incorporaremos se conoce con el nombre de trmino de perturbacin y lo representaremos con la letra u.
Por lo tanto, cuando introducimos este trmino, el MRLM queda de la manera siguiente:
Y 5 1 1 2X2 1 3X3 1 ... 1 k Xk 1 u.
(2.5)
Parte determinista

Parte aleatoria

Como ya hemos explicado, el trmino de perturbacin incorpora el efecto


conjunto de otras variables o comportamientos no explicitados en el modelo, para los cuales su efecto individual no resulta relevante. Por tanto, el trmino de perturbacin no es realmente observable*, por lo cual tendremos que
establecer una serie de hiptesis sobre su comportamiento.

Nuestro objetivo es asignar valores numricos a los parmetros 1, 2, 3, ...,


k. Es decir, pretendemos estimar el modelo de manera que, al combinar los
valores de las estimaciones de los parmetros y los valores observados de las
variables explicativas, obtengamos unos valores de la variable endgena tan
cercanos a los valores reales observados de Y como sea posible.
Para poder hacer la estimacin, se debe disponer de un conjunto de observaciones para cada una de las variables observables implicadas en el modelo, es
decir, para la variable endgena Y y para las k variables explicativas. Denominaremos a las observaciones valores muestrales. Cuando trabajamos con
datos de corte transversal, empleamos el subndice i, mientras que, cuando
trabajamos con datos de serie temporal, utilizamos el subndice t. As pues,
podemos expresar el modelo del modo siguiente:
Corte transversal:
Yi 5 1 1 2X2i 1 3 X3i 1 ... 1 k Xki 1 ui

i 5 1, 2, 3, ..., N.
(2.6)

Serie temporal:
Yi 5 1 1 2X2t 1 3X3t 1 ... 1 k Xkt 1 ut

t 5 1, 2, 3, ..., T.

* Si el trmino de perturbacin
fuese observable, se tratara
como una variable explicativa
del modelo.

18

FUOC P01/85014/00170

Modelo de regresin lineal mltiple

Las ecuaciones anteriores expresan la relacin de dependencia entre la variable


endgena y las variables explicativas para la i-sima y la t-sima observaciones,
respectivamente. Si no se dice lo contrario, a lo largo de este mdulo supondremos que, por defecto, estamos trabajando con datos de corte transversal. Si
desarrollamos esta ecuacin para los N individuos de la muestra, tendremos:
Y1 5 1 1 2X21
Y2 5 1 1 2X22
Y3 5 1 1 2X23
A
A
A
Yi 5 1 1 2X 2i
A
A
A
YN 5 1 1 2X2N

1 3X31
1 3X32
1 3X33
A
1 3X 3i
A
1 3X3N

1 ... 1 j Xj1
1 ... 1 j Xj2
1 ... 1 j Xj3
A
1 ... 1 j X ji
A
1 ... 1 j XjN

1 ... 1 k Xk1
1 ... 1 k Xk2
1 ... 1 k Xk3
A
1 ... 1 k X ki
A
1 ... 1 k XkN

1
1
1
A
1
A
1

u1
u2
u3
ui

(2.7)

uN

donde, por ejemplo, Y1 representa el valor de la variable endgena para la primera observacin; Y2, el valor de la variable endgena para la segunda observacin, etc. Por lo tanto, en general, Yi es el valor de la variable endgena para
la i-sima observacin.
Xji representa el valor de la variable j-sima (j = 2, 3, , k) para la observacin
i-sima (i =1, 2, 3, , N). As, por ejemplo, X21 es el valor de la segunda variable explicativa en la primera observacin, X46 es el valor que toma la cuarta
variable explicativa para la sexta observacin, etc.
Puesto que trabajar con el sistema anterior es bastante pesado, ya que tenemos tantas ecuaciones como observaciones, lo expresaremos habitualmente
de manera matricial. Por lo tanto, la expresin 2.7 puede escribirse de la
manera siguiente:
Y = XB + U,

(2.8)

donde Y es un vector de dimensin N, que contiene las observaciones de la


variable endgena:
Y1
Y2
Y3
Y5 A
Yi
A
YN

1. observacin
2. observacin
3. observacin
(2.9)
i-sima observacin
N-sima observacin.

X es una matriz de dimensin N k que contiene los N valores que se han


observado para las k variables explicativas:
1
1
1
X5 A
1
A
1

X21
X22
X23
A
X2i
A
X2N

X31
X32
X33
A
X3i
A
X3N

... Xj1
... Xj2
... Xj3
A
... Xji
A
... XjN

... Xk1
... Xk2
... Xk3
A .
... Xki
A
... XkN

(2.10)

19

FUOC P01/85014/00170

Modelo de regresin lineal mltiple

En la matriz anterior tenemos en cada columna las observaciones de la variable explicativa correspondiente. Por ejemplo, en la primera columna est el

Observad que las dimensiones


de las matrices son las adecuadas
para realizar las operaciones.

trmino independiente; en la segunda columna, los valores de la variable X2,


etc. Por filas, tenemos las observaciones de cada individuo, correspondientes
a las k variables explicativas.
B es un vector de dimensin k, que contiene los k parmetros del modelo de
regresin:

B5

1
2
3
A
j
A
k

1.er parmetro
2. parmetro
3.er parmetro
A
j-simo parmetro
A
k-simo parmetro.

(2.11)

U es un vector de dimensin N, que contiene los N trminos de perturbacin,


asociados a cada una de las ecuaciones:
u1
u2
u3
U5 A
ui
A
uN

1. observacin
2. observacin
3. observacin
A
i-sima observacin
A
N-sima observacin.

(2.12)

Hasta ahora, hemos especificado o formulado el modelo. A continuacin,


estudiaremos las hiptesis bsicas del MRLM.

2.2. Hiptesis bsicas del modelo de regresin lineal


mltiple estndar
En el MRLM que ya hemos formulado, es necesario que hagamos un conjunto de hiptesis bsicas para poder determinar las propiedades de los estima-

Consultad la formulacin del MRLM


en el subapartado 2.1 de este mdulo
didctico.

dores surgidos como resultado de la aplicacin de mtodos distintos de estimacin y el tipo de contraste que hay que realizar para saber la significacin
de los parmetros. Estudiaremos los cuatro grupos de hiptesis siguientes: las
hiptesis generales del MRLM, las hiptesis sobre el trmino de perturbacin,
las hiptesis sobre las variables explicativas del modelo, y las hiptesis sobre
los parmetros del modelo.

2.2.1. Hiptesis generales del modelo


Este conjunto de hiptesis se refiere al conjunto del modelo y, de hecho, ya
se ha mencionado. Lo vemos a continuacin:
1) El MRLM es estocstico, y la relacin de dependencia entre la variable endgena y las variables explicativas es lineal. Estas hiptesis pueden parecernos cier-

Consultad la introduccin de las hiptesis


generales del modelo en el subapartado
2.1 de este mdulo didctico.

20

FUOC P01/85014/00170

Modelo de regresin lineal mltiple

tamente restrictivas, pero, como veremos a continuacin, no lo son. Hay numerosas relaciones no lineales entre variables que se pueden transformar, sin excesiva dificultad, en lineales. Simplemente hay que aplicar unas transformaciones
sencillas a las variables implicadas en el modelo. Como ejemplo podemos considerar la funcin de produccin de Cobb-Douglas, en la cual slo hay que
tomar logaritmos neperianos para obtener una expresin lineal:
Q i 5 ALi1K i2 R ln(Q i ) 5 ln(A) 1 1ln(L i ) 1 2ln(K i ).
2) Supondremos que disponemos de informacin estadstica suficientemen-

El modelo
de Cobb-Douglas
es intrnsecamente lineal,
ya que se ha podido
linealizar. Otros modelos
no lineales son, adems,
intrnsecamente no lineales si
no se pueden linealizar. Un
ejemplo es yi 5 1 1e2xi.
Puesto que presentan un
mayor grado de complejidad,
este tipo de modelos queda
fuera del anlisis de este
mdulo didctico.

te amplia sobre el conjunto de variables del modelo. Es un requisito mnimo


que el nmero de observaciones sea mayor o igual que el nmero de parmetros que hay que estimar. Es decir, los grados de libertad del modelo deben
ser iguales a cero o mayores (N 2 k $ 0). Sin embargo, tal como veremos ms
adelante, es deseable que se pueda tener un nmero relativamente elevado de
observaciones, con el fin de poder disponer de los grados de libertad suficientes para garantizar la fiabilidad de los resultados obtenidos en los procesos de estimacin y de contraste estadstico.

Consultad en el subapartado 2.3.2


una razn para la conveniencia de
tener un nmero relativamente elevado
de observaciones.

2.2.2. Hiptesis sobre el trmino de perturbacin


El conjunto de hiptesis que formularemos a continuacin hace referencia al
comportamiento del trmino de perturbacin, que, como ya hemos dicho antes,

Consultad el trmino de perturbacin


en el subapartado 2.1 de este mdulo
didctico.

es la fuente de aleatoriedad del modelo y el trmino que incluye todas aquellas


variables o aspectos que puntualmente han tenido influencia en el comportamiento de la variable endgena. De todas maneras, este trmino por s solo no
tiene ningn poder explicativo sobre la evolucin de la variable endgena.
A continuacin, presentamos las hiptesis sobre el trmino de perturbacin:
1) Supondremos que la esperanza matemtica de los trminos de perturbacin es cero, es decir:

E[ui] 5 0

;i 5 1, ..., N,

o, en notacin matricial:

E[U ] 5

u1
u2
u3
A 5
ui
A
uN

E[u1]
E[u2]
E[u3]
5
A
E[ui]
A
E[uN]

0
0
0
A
0
A
0

5 0 N 1.

(2.13)

Recordad los conceptos de esperanza


matemtica y de varianza de una variable
aleatoria, tratados en el subapartado
1.2 del modulo Clculo de probabilidades
y ampliaciones de la asignatura
Estadstica II.

21

FUOC P01/85014/00170

Modelo de regresin lineal mltiple

Lo que se supone con esta hiptesis es que, por trmino medio, el efecto conjunto de los factores incluidos en el trmino de perturbacin es nulo. Es decir,
que los efectos puntuales de las variables que no se consideran relevantes se
compensan entre s.
Como veremos ms adelante, la hiptesis anterior se cumplir siempre que el
modelo est especificado correctamente, en el sentido de que todas las variables relevantes, a la hora de explicar el comportamiento de la variable end-

Con referencia a la correccin


del modelo, consultad las hiptesis
sobre las variables explicativas en el
subapartado 2.2.3 de este mdulo
didctico.

gena, se han incorporado a la matriz X.


2) Supondremos que el trmino de perturbacin tiene varianza constante
para todas las observaciones. Esta propiedad se llama homoscedasticidad.

VAR[ui] 5 u2

;i 5 1, ..., N.

(2.14)

El incumplimiento de esta hiptesis, es decir, el hecho de que no todos los

Nota

trminos de perturbacin tengan la misma varianza, se conoce con el nombre de heteroscedasticidad.


3) Adems de las hiptesis que hemos hecho sobre la esperanza y la varianza, tambin se establecen hiptesis sobre la covarianza entre cada dos trminos de perturbacin. Recordemos que, segn el concepto de covarianza, tenemos lo siguiente:
COV[ui,uj] 5 E[(ui 2 E[ui])(uj 2 E[uj])].
Por lo tanto, dado que hemos supuesto que la esperanza matemtica del trmino de perturbacin es E[u] = 0, a partir de la expresin anterior obtenemos
la expresin de la covarianza e imponemos que valga cero:

COV[ui,uj] 5 E[uiuj] 5 0

;i,j 5 1, ..., N.

As pues, se supone que no hay autocorrelacin entre los distintos trminos


de perturbacin, es decir, se da por supuesto que los trminos de perturbacin
son independientes entre s.
COV[ui,uj] 5 0

;i,j 5 1, ..., N.

(2.15)

Si el trmino de perturbacin del modelo cumple las propiedades de homoscedasticidad y de ausencia de autocorrelacin, se dice que es esfrico. Cuando el trmino de perturbacin presenta heteroscedasticidad o est autorrelacionado, o ambas cosas a la vez, se dice que es no esfrico.

Para que exista


heteroscedasticidad basta
con que uno de los trminos
de perturbacin tenga una
varianza distinta de la del
resto.

22

FUOC P01/85014/00170

Modelo de regresin lineal mltiple

Por otro lado, cuando el trmino de perturbacin del modelo cumple las propiedades de homoscedasticidad y de ausencia de autocorrelacin, decimos
que su matriz de varianzas y covarianzas es escalar. La forma general de la
matriz de varianzas y covarianzas es la siguiente:

VAR[u1] COV[u1,u2] COV[u1,u3]


COV[u2,u1] VAR[u2] COV[u2,u3]
VAR[U ] 5 COV[u3,u1] COV[u3,u2] VAR[u3]
A
A
A
COV[uN,u1] COV[uN,u2] COV[uN,u3]

... COV[u1,uN]
... COV[u2,uN]
... COV[u3,uN] .
A
VAR[uN]
...

Y, teniendo en cuenta las frmulas 2.14 y 2.15, obtenemos la matriz de


varianzas y covarianzas siguiente:
u2 0 0
0 u2 0
VAR[U ] 5 0 0 2
u
A
A A
0 0 0

...
...
...
...

0
0
0
A
u2

5 u2

1
0
0
A
0

0
1
0
A
0

0
0
1
A
0

...
...
...
...

0
0
0
A
1

5 u2 IN,

donde IN indica la matriz identidad de dimensin N N.


Matriz de varianzas y covarianzas
La matriz de varianzas y covarianzas del trmino de perturbacin tiene una serie de
caractersticas que son comunes a todas las matrices de varianzas y covarianzas:
a) Se trata de una matriz cuadrada, en nuestro caso de dimensin N N.
b) Es simtrica, ya que COV[ui,uj] 5 COV[uj,ui].
c) Es una matriz definida positiva, ya que los valores de los elementos de su diagonal
son varianzas (y, por tanto, positivos) y se puede comprobar que los menores de la
matriz tambin son definidos positivos.

Una manera alternativa de resumir las propiedades de homoscedasticidad y


de ausencia de autocorrelacin del trmino de perturbacin es la siguiente:
E[ui uj] 5

u2 ;i 5 j
0 ;i j

i,j 5 1, ..., N.
i,j 5 1, ..., N.

(2.16)

4) La ltima hiptesis que formularemos respecto al comportamiento del trmino de perturbacin es que cada uno de los componentes se distribuyen
segn una ley normal.

Para finalizar con las hiptesis relativas al trmino de perturbacin,


podemos ver que todas son susceptibles de ser resumidas en notacin
matricial en la expresin siguiente:
U , N(0N1,u2 IN),
y para cada componente del vector del trmino de perturbacin:
ui , N(0,u2 )

;i 5 1, ..., N.

Ley de distribucin
normal
Recordad la representacin
grfica de la funcin de
densidad de una distribucin
normal con esperanza 0
y varianza 2, N(0,2).

You might also like