Professional Documents
Culture Documents
de regresin
lineal mltiple:
especificacin, estimacin y contraste
Toms del Barrio Castro
Miquel Clar Lpez
Jordi Suriach Caralt
PO1/85014/00170
FUOC P01/85014/00170
ndice
Introduccin .............................................................................................. 5
Objetivos...................................................................................................... 7
1. Introduccin a la econometra........................................................ 9
1.1. Qu es la econometra? ................................................................... 9
1.2. Variables, relaciones y parmetros.................................................... 10
1.3. La modelizacin economtrica. Fases de la investigacin
economtrica..................................................................................... 12
1.4. Objetivos de la modelizacin economtrica .................................... 14
2. El modelo de regresin lineal mltiple estndar ....................... 16
2.1. Especificacin.................................................................................... 16
2.2. Hiptesis bsicas del modelo de regresin lineal
mltiple estndar .............................................................................. 19
2.2.1. Hiptesis generales del modelo .............................................. 19
2.2.2. Hiptesis sobre el trmino de perturbacin ........................... 20
2.2.3. Hiptesis sobre las variables explicativas del modelo............ 23
2.2.4. Hiptesis sobre los parmetros del modelo............................ 23
2.3. Estimacin para mnimos cuadrados ordinarios (MCO) ................. 23
2.3.1. Descripcin del mtodo de estimacin .................................. 24
2.3.2. Propiedades de los estimadores MCO de los j ...................... 28
2.4. Anlisis de los residuos y estimacin de u2 ..................................... 32
2.4.1. Propiedades de los residuos .................................................... 33
2.4.2. Estimacin de la varianza del trmino de perturbacin........ 35
2.5. Estimacin por mxima verosimilitud ............................................. 38
2.6. Medidas de la bondad del ajuste ...................................................... 40
2.7. Significacin de los parmetros del modelo .................................... 43
2.7.1 Significacin econmica.......................................................... 44
2.7.2 Significacin estadstica........................................................... 45
2.8. El modelo de regresin lineal mltiple en desviaciones
respecto a la media ........................................................................... 48
2.9. Prediccin.......................................................................................... 49
2.9.1. Prediccin puntual.................................................................. 50
2.9.2. Prediccin por intervalo ......................................................... 50
3. El modelo de regresin con restricciones lineales...................... 53
3.1. Contrastacin de restricciones lineales ............................................ 53
3.1.1. Formulacin matricial de las restricciones lineales................ 54
3.1.2. Metodologa para contrastar restricciones lineales:
estadstico de prueba .............................................................. 55
3.1.3. Un mtodo alternativo para contrastar restricciones
lineales .................................................................................... 58
FUOC P01/85014/00170
UW01/85014/00174
WEB
FUOC P01/85014/00170
Introduccin
Este mdulo didctico est formado por los tres apartados siguientes:
1) El primero es una introduccin que nos permitir ponernos en contacto
con los aspectos relacionados con la econometra. En concreto, veremos cules son los fundamentos de la econometra, sus objetivos, qu tipo de problemas nos permite solucionar, y pondremos de manifiesto las relaciones que
tiene con otros mbitos de la economa.
2) En el segundo apartado introduciremos el modelo de regresin mltiple
(MRLM), que ser la base de todos los aspectos que trataremos a lo largo de esta
asignatura y de su continuacin. En concreto, veremos los contenidos siguientes:
a) La formulacin del MRLM.
b) Las hiptesis bsicas relativas al comportamiento de las diferentes partes
que lo integran: las variables (endgena y explicativas), los parmetros y el
trmino de perturbacin.
c) La estimacin de los parmetros desconocidos del modelo por los mtodos de mnimos cuadrados ordinarios (MCO) y mxima verosimilitud (MV).
d) Las propiedades de los estimadores cuando se cumplen las hiptesis bsicas.
e) Las medidas que nos permitirn cuantificar la bondad del ajuste y evaluar
el modelo.
f) La manera de obtener predicciones una vez que el modelo ya se ha formulado, estimado y validado.
3) El tercer y ltimo apartado de este mdulo lo dedicaremos a estudiar los
aspectos relacionados con la contrastacin de restricciones lineales. Es en
este apartado, pues, donde presentaremos las herramientas que necesitaremos para contrastar hiptesis que se puedan formular sobre el comportamiento de los parmetros. En concreto, veremos los puntos siguientes:
a) Los tipos de restricciones lineales que podremos contrastar.
b) La manera de formularlos matricialmente.
c) Los estadsticos de prueba adecuados para comprobar si las hiptesis formuladas sobre los parmetros de la poblacin en forma de restricciones lineales se pueden considerar ciertas en el mbito de la poblacin o no.
FUOC P01/85014/00170
FUOC P01/85014/00170
Objetivos
Una vez trabajados los contenidos de este mdulo didctico, los estudiantes
tenis que ser capaces de:
1. Conocer las hiptesis bsicas que debe cumplir el modelo de regresin
mltiple que denominaremos modelo estndar.
2. Obtener los estimadores de mnimos cuadrados ordinarios y de mxima
verosimilitud de los parmetros desconocidos del modelo de regresin
mltiple, y conocer las propiedades que tienen cuando se cumplen las
hiptesis bsicas.
3. Cuantificar la bondad del ajuste del modelo.
4. Determinar cul de las variables exgenas contribuye ms a explicar el
comportamiento de la variable endgena, y contrastar la significacin
individual de un parmetro y la global del modelo.
5. Obtener la prediccin puntual y por intervalo de la variable endgena.
6. Expresar restricciones lineales matricialmente.
7. Poder contrastar cualquier restriccin lineal homognea de igualdad mediante mtodos distintos.
8. Obtener los estimadores restringidos y conocer sus propiedades tanto si
partimos de la hiptesis de que las restricciones lineales planteadas son
ciertas como si partimos de que no lo son.
9. Saber cmo contrastar la permanencia estructural de los parmetros del
modelo.
FUOC P01/85014/00170
1. Introduccin a la econometra
El objetivo de este apartado es presentar las bases sobre las cuales se asienta la
metodologa economtrica. Por ello, en primer lugar, despus de una pequea
introduccin sobre cuestiones como, por ejemplo, el origen de la econometra y
qu es la econometra, presentamos toda una serie de conceptos bsicos y, cuando nos hayamos familiarizado con ellos, abordaremos el cuerpo central del
mdulo: la modelizacin economtrica. Con esta finalidad, explicamos las diferentes etapas que hay que seguir en todo estudio economtrico. Para acabar, presentamos los objetivos que se pueden alcanzar con un estudio de este tipo.
1.1. Qu es la econometra?
El nacimiento de la econometra, del mismo modo que otras disciplinas del
mbito de la ciencia econmica, se produce ante la necesidad de resolver toda
una serie de problemas con la informacin econmica existente. Esta aparicin se basa en el desarrollo de determinadas tcnicas que facilitan el anlisis
cuantificado de las relaciones econmicas.
En concreto, en el nacimiento de la econometra confluyeron muchos factores, entre los cuales destaca el planteamiento distinto que exista, durante las
dcadas de los aos veinte y treinta, del estudio de los ciclos econmicos. En
estos aos apareci un grupo de economistas preocupados por la colaboracin entre matemticos, estadsticos y economistas. Crean que la introduccin de los mtodos matemticos en la investigacin, en las ciencias sociales
en general y en la economa en particular, permitira avanzar en su desarrollo. Adems, criticaban la no-consideracin de la teora econmica en los
modelos explicativos de los ciclos econmicos. Las aportaciones de estos
autores constituyeron el antecedente del anlisis econmico propuesto por la
Comisin Cowles y por T. Haavelmo (1944), basado en el enfoque probabilstico que hay en las interrelaciones econmicas.
En la literatura podemos encontrar definiciones distintas de la econometra.
Entre ellas, podemos destacar las dos siguientes:
1) Anlisis cuantitativo de los fenmenos econmicos reales, basado en el desarrollo
simultneo de la teora y la observacin que se relacionan mediante los mtodos de inferencia adecuados.
P.A. Samuelson; T.C. Koopmans; M.H. Stone (1954).
Algunos
de los economistas
preocupados por la
colaboracin entre
matemticos, estadsticos y
economistas eran personajes
como R. Frisch, J. Tinbergen,
K. Pearson y J. Slutskij, entre
otros.
FUOC P01/85014/00170
10
As, por ejemplo, siguiendo el modelo keynesiano consumo-renta, el consumo de los individuos depende de (se explica por) la renta de cada uno de
ellos. Por tanto, en este modelo, la variable endgena (aquello que queremos
conocer y explicar) es el consumo de los individuos, y la variable explicativa
(aquello que permite explicarlo) es la renta de los individuos. Se trata, pues,
de un modelo simple. Si partimos de la hiptesis de que, adems de la renta
de los individuos, el nmero de hijos tambin permite explicar las pautas de
comportamiento del consumo, tendremos dos variables explicativas y, por
tanto, estaremos ante un modelo mltiple.
11
FUOC P01/85014/00170
La funcin anterior, tal y como se puede ver, es determinista. Nos dice, por ejemplo,
que para un nivel de renta Y1 el consumo ser C1 y que para un nivel de renta Y2 el
consumo ser C2.
Si tenemos en cuenta que el nmero de hijos Ni tambin permite explicar el consumo, entonces tendremos un modelo mltiple, que puede ser el siguiente:
Ci 5 1 Yi 1 Ni .
* De ahora en adelante
supondremos que trabajamos
con un modelo mltiple.
salidad que se caracteriza por el hecho de ser unidireccional: los comportamientos de las variables explicativas causan (determinan, explican) el de
la variable endgena. Precisamente la existencia de esta relacin de causalidad es la que permite formular un modelo. No obstante, esta relacin que
se establece entre las variables del modelo puede ser de muchos tipos: lineal, cuadrtica, exponencial, logartmica, etc. En consecuencia, en el momento de especificar el modelo hay que determinar (tambin de acuerdo con los
postulados de la teora econmica) la forma funcional que adopta la relacin entre la variable endgena y las explicativas. De todos modos, en el
mbito del modelo que estudiaremos supondremos que la relacin es lineal y que, si no lo es, se puede linealizar mediante una transformacin adecuada.
Adicionalmente, en todo modelo aparecen lo que denominaremos parmetros. Los parmetros, que estn asociados a cada variable explicativa, cuantifican la relacin existente entre la variable endgena y cada una de las
variables explicativas. Son, por tanto, lo que se desconoce y se debe estimar.
La relacin entre
la variable endgena y las
variables explicativas no es
lineal o linealizable en todos
los casos. A veces, nos
encontraremos ante modelos
no lineales, que tambin se
podran estudiar, pero que
quedan fuera de los objetivos
de este material didctico.
FUOC P01/85014/00170
12
La econometra es la rama de la economa que tiene que ver con la estimacin emprica, con la cuantificacin de las relaciones econmicas:
a partir de los postulados que establece la teora econmica se especifica un modelo economtrico, el cual, a partir de un conjunto de informacin estadstica (datos), se estima empleando tcnicas estadsticas y
economtricas con el fin de medir y contrastar empricamente determinadas relaciones entre variables econmicas.
1) El primer pilar, la teora, permite derivar un modelo (el modelo econmico), que sintetiza la incgnita relevante sobre el fenmeno (la variable endgena) objeto de anlisis y del cual deriva el modelo economtrico que permite medirlo y contrastarlo empricamente.
La modelizacin economtrica
presenta tres fases: la especificacin, la
estimacin y el contraste.
Las tcnicas
economtricas
no slo estn limitadas
al mundo economicoempresarial. Por el contrario, tambin son susceptibles de aplicacin no slo a otros campos
de las ciencias sociales (como
la sociologa, la historia, etc.),
sino tambin
a otros mbitos (como la
educacin, la sanidad,
el medio ambiente, etc.).
13
FUOC P01/85014/00170
2) El otro pilar bsico, los hechos (sucesos del mundo real referidos al fenmeno que se investiga), se concreta en una serie de datos que pueden ser de
corte transversal, si hacen referencia a distintos individuos en el mismo instante de tiempo, o de serie temporal, si se observan durante un periodo de
tiempo determinado.
Para garantizar la calidad de los datos es necesario, a veces, someterlos a un
tratamiento previo (deflacin, enlace, interpolacin de datos ausentes, obtencin de la tendencia de la serie, etc.). Saber de qu informacin estadstica se
dispone (de qu variables se tiene informacin) tambin condiciona el mode-
Ejemplos de tipos
de datos
Las observaciones (datos)
correspondientes a las ventas
de un conjunto de empresas
referidas a un mismo periodo
(ao, trimestre, etc.)
constituyen un conjunto
de datos de corte transversal.
Por otro lado, las ventas de
una empresa realizadas, por
ejemplo, desde 1960 hasta
1997 constituyen una serie
temporal.
FUOC P01/85014/00170
14
15
FUOC P01/85014/00170
2.1. Especificacin
En este apartado analizaremos un modelo de regresin que, tal como indica
el ttulo, presenta dos caractersticas importantes:
1) Se trata de un modelo de regresin mltiple, lo cual supone que el comportamiento de una determinada variable, que denominaremos variable endgena, variable dependiente o variable que se debe explicar y que representaremos
con la letra Y, es causado y, por tanto, puede ser explicado adecuadamente, por
un conjunto de k variables que denominaremos explicativas (independientes o
exgenas) y que, en general, representaremos mediante la letra X. Es decir:
Y 5 (X1,X2,X3, ... ,Xk ).
(2.1)
(2.2)
2) La segunda caracterstica del modelo de regresin que estudiaremos se refiere a la linealidad. Esto quiere decir que la relacin que hipotticamente existe
entre la variable endgena y las k explicativas es de tipo lineal; por lo tanto,
podemos expresar la variable dependiente como combinacin lineal de las
variables explicativas. Aunque no es estrictamente necesario, normalmente
especificaremos el MRLM incluyendo en las variables explicativas un trmino
independiente. As, a menudo se considera que la variable X1 es una constante
igual a la unidad:
X1 5 1.
(2.3)
16
FUOC P01/85014/00170
;j 5 2, ..., k.
(2.4)
obstante, en la realidad, no se cumple casi nunca que las relaciones entre las
variables econmicas sean de este tipo, sino que las relaciones de dependencia tienen un cierto grado de aleatoriedad. Recordemos la funcin keynesiana de consumo, que estipula que el consumo de las unidades domsticas
depende de su renta:
Ci 5 1 Yi.
La funcin anterior es determinista, pero si preguntsemos a un conjunto
de agentes econmicos sobre sus niveles de renta y los recursos que destinan al consumo, nos hallaramos con una situacin como la del grfico
siguiente:
Relacin funcional real
renta-consumo
El grfico nos dice que hay
otros condicionantes en la
decisin de consumo de los
agentes econmicos que no
quedan reflejados en la renta.
Esto se ve en el hecho de
que los puntos tienen una
determinada incertidumbre:
no se encuentran
exactamente sobre la recta,
sino que se sitan en algn
punto ms o menos prximo
a la recta.
En consecuencia, es necesario incluir algn trmino en el modelo de regresin que capte esta aleatoriedad, ya que un modelo determinista no puede
explicar totalmente el comportamiento de la variable endgena. As, en un
modelo de regresin se introduce el trmino de perturbacin para recoger:
a) Todas las dems variables que explican el comportamiento de la variable
endgena pero que no han quedado explicitadas como regresores*. Muchas
17
FUOC P01/85014/00170
Pues bien, este trmino que incorporaremos se conoce con el nombre de trmino de perturbacin y lo representaremos con la letra u.
Por lo tanto, cuando introducimos este trmino, el MRLM queda de la manera siguiente:
Y 5 1 1 2X2 1 3X3 1 ... 1 k Xk 1 u.
(2.5)
Parte determinista
Parte aleatoria
i 5 1, 2, 3, ..., N.
(2.6)
Serie temporal:
Yi 5 1 1 2X2t 1 3X3t 1 ... 1 k Xkt 1 ut
t 5 1, 2, 3, ..., T.
* Si el trmino de perturbacin
fuese observable, se tratara
como una variable explicativa
del modelo.
18
FUOC P01/85014/00170
1 3X31
1 3X32
1 3X33
A
1 3X 3i
A
1 3X3N
1 ... 1 j Xj1
1 ... 1 j Xj2
1 ... 1 j Xj3
A
1 ... 1 j X ji
A
1 ... 1 j XjN
1 ... 1 k Xk1
1 ... 1 k Xk2
1 ... 1 k Xk3
A
1 ... 1 k X ki
A
1 ... 1 k XkN
1
1
1
A
1
A
1
u1
u2
u3
ui
(2.7)
uN
donde, por ejemplo, Y1 representa el valor de la variable endgena para la primera observacin; Y2, el valor de la variable endgena para la segunda observacin, etc. Por lo tanto, en general, Yi es el valor de la variable endgena para
la i-sima observacin.
Xji representa el valor de la variable j-sima (j = 2, 3, , k) para la observacin
i-sima (i =1, 2, 3, , N). As, por ejemplo, X21 es el valor de la segunda variable explicativa en la primera observacin, X46 es el valor que toma la cuarta
variable explicativa para la sexta observacin, etc.
Puesto que trabajar con el sistema anterior es bastante pesado, ya que tenemos tantas ecuaciones como observaciones, lo expresaremos habitualmente
de manera matricial. Por lo tanto, la expresin 2.7 puede escribirse de la
manera siguiente:
Y = XB + U,
(2.8)
1. observacin
2. observacin
3. observacin
(2.9)
i-sima observacin
N-sima observacin.
X21
X22
X23
A
X2i
A
X2N
X31
X32
X33
A
X3i
A
X3N
... Xj1
... Xj2
... Xj3
A
... Xji
A
... XjN
... Xk1
... Xk2
... Xk3
A .
... Xki
A
... XkN
(2.10)
19
FUOC P01/85014/00170
En la matriz anterior tenemos en cada columna las observaciones de la variable explicativa correspondiente. Por ejemplo, en la primera columna est el
B5
1
2
3
A
j
A
k
1.er parmetro
2. parmetro
3.er parmetro
A
j-simo parmetro
A
k-simo parmetro.
(2.11)
1. observacin
2. observacin
3. observacin
A
i-sima observacin
A
N-sima observacin.
(2.12)
dores surgidos como resultado de la aplicacin de mtodos distintos de estimacin y el tipo de contraste que hay que realizar para saber la significacin
de los parmetros. Estudiaremos los cuatro grupos de hiptesis siguientes: las
hiptesis generales del MRLM, las hiptesis sobre el trmino de perturbacin,
las hiptesis sobre las variables explicativas del modelo, y las hiptesis sobre
los parmetros del modelo.
20
FUOC P01/85014/00170
tamente restrictivas, pero, como veremos a continuacin, no lo son. Hay numerosas relaciones no lineales entre variables que se pueden transformar, sin excesiva dificultad, en lineales. Simplemente hay que aplicar unas transformaciones
sencillas a las variables implicadas en el modelo. Como ejemplo podemos considerar la funcin de produccin de Cobb-Douglas, en la cual slo hay que
tomar logaritmos neperianos para obtener una expresin lineal:
Q i 5 ALi1K i2 R ln(Q i ) 5 ln(A) 1 1ln(L i ) 1 2ln(K i ).
2) Supondremos que disponemos de informacin estadstica suficientemen-
El modelo
de Cobb-Douglas
es intrnsecamente lineal,
ya que se ha podido
linealizar. Otros modelos
no lineales son, adems,
intrnsecamente no lineales si
no se pueden linealizar. Un
ejemplo es yi 5 1 1e2xi.
Puesto que presentan un
mayor grado de complejidad,
este tipo de modelos queda
fuera del anlisis de este
mdulo didctico.
E[ui] 5 0
;i 5 1, ..., N,
o, en notacin matricial:
E[U ] 5
u1
u2
u3
A 5
ui
A
uN
E[u1]
E[u2]
E[u3]
5
A
E[ui]
A
E[uN]
0
0
0
A
0
A
0
5 0 N 1.
(2.13)
21
FUOC P01/85014/00170
Lo que se supone con esta hiptesis es que, por trmino medio, el efecto conjunto de los factores incluidos en el trmino de perturbacin es nulo. Es decir,
que los efectos puntuales de las variables que no se consideran relevantes se
compensan entre s.
Como veremos ms adelante, la hiptesis anterior se cumplir siempre que el
modelo est especificado correctamente, en el sentido de que todas las variables relevantes, a la hora de explicar el comportamiento de la variable end-
VAR[ui] 5 u2
;i 5 1, ..., N.
(2.14)
Nota
COV[ui,uj] 5 E[uiuj] 5 0
;i,j 5 1, ..., N.
;i,j 5 1, ..., N.
(2.15)
Si el trmino de perturbacin del modelo cumple las propiedades de homoscedasticidad y de ausencia de autocorrelacin, se dice que es esfrico. Cuando el trmino de perturbacin presenta heteroscedasticidad o est autorrelacionado, o ambas cosas a la vez, se dice que es no esfrico.
22
FUOC P01/85014/00170
Por otro lado, cuando el trmino de perturbacin del modelo cumple las propiedades de homoscedasticidad y de ausencia de autocorrelacin, decimos
que su matriz de varianzas y covarianzas es escalar. La forma general de la
matriz de varianzas y covarianzas es la siguiente:
... COV[u1,uN]
... COV[u2,uN]
... COV[u3,uN] .
A
VAR[uN]
...
...
...
...
...
0
0
0
A
u2
5 u2
1
0
0
A
0
0
1
0
A
0
0
0
1
A
0
...
...
...
...
0
0
0
A
1
5 u2 IN,
u2 ;i 5 j
0 ;i j
i,j 5 1, ..., N.
i,j 5 1, ..., N.
(2.16)
4) La ltima hiptesis que formularemos respecto al comportamiento del trmino de perturbacin es que cada uno de los componentes se distribuyen
segn una ley normal.
;i 5 1, ..., N.
Ley de distribucin
normal
Recordad la representacin
grfica de la funcin de
densidad de una distribucin
normal con esperanza 0
y varianza 2, N(0,2).