You are on page 1of 35

Fichero: capitulo 5

CAPTULO 5
VALIDACIN DEL MODELO DE REGRESIN: CONTRASTES DE
ESPEFICIACIN INCORRECTA Y CONTRASTES DE ESPECIFICACIN

1.

INTRODUCCION.

TIPOS

DE

PRUEBAS

DE

VALIDACIN

DE

LOS

RESULTADOS DE LA ESTIMACIN MCO DEL MODELO DE REGRESIN


Despus de la estimacin de los parmetros conviene efectuar un conjunto de
pruebas de validacin de los resultados obtenidos. Estableceremos dos tipos de
pruebas. Las primeras consisten en la realizacin de comprobaciones de la calidad de
la informacin muestral utilizada, del ajuste de dicha informacin al modelo terico
subyacente y la estabilidad de los datos frente a la estructura que debi generarlos en
relacin con el modelo especificado. Asimismo, es conveniente sealar las posibles
divergencias, si las hubiere, en relacin con las hiptesis mantenidas y que definieron
lo que hemos venido en calificar como modelo de regresin estndar.
Si existen discrepancias en el resultado de estas pruebas con respecto a las hiptesis
iniciales tendremos indicios de una especificacin incorrecta del modelo. En
consecuencia, se proceder a revisar su construccin formal, los datos utilizados para
la inferencia o, acaso, los procedimientos de estimacin y contraste de las hiptesis.
Este proceso cclico de revisin, re-especificacin y nueva validacin concluye en el
punto en el que convenimos que el modelo especificado est corroborado por los
datos.
El segundo tipo de pruebas de validacin consisten en la comparacin del modelo
______________________________________
Manual de Econometra. Captulo 5, pgina 1
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

estimado con otros posibles modelos. Estos modelos alternativos pueden incluir ms,
o menos, variables explicativas que las utilizadas hasta el momento. Tambin cabe la
posibilidad de realizar comparaciones con modelos diferentes tanto por la forma
funcional especificada como por las variables utilizadas como predeterminadas. En
cualquier caso se trata de sealar las pautas que nos permitan aproximarnos, en la
medida de lo posible, a inferencias que garanticen la adecuacin de los datos al
modelo subyacente desconocido.
Siguiendo la terminologa habitual nos referiremos al primer tipo de pruebas como
pruebas de especificacin errnea del modelo, mientras que las segundas las
reconoceremos sencillamente como pruebas de especificacin entre modelos
alternativos. Para establecer una cierta sistemtica en la aplicacin de estas pruebas
ahora las presentaremos en forma de una batera ordenada. En la prctica, esta etapa
de validacin se realiza de manera mucho ms automtica y simultnea. Sin
embargo, con objeto de presentar separadamente los conceptos e hiptesis que se
cuestionan junto con las pruebas aconsejadas, researemos, en lo que sigue, dichas
pruebas de manera ordenada clasificadas segn la hiptesis nula establecida.
La pgina siguiente contiene un esquema de las pruebas y contrastes de validacin y
especificacin del modelo.

______________________________________
Manual de Econometra. Captulo 5, pgina 2
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

ESQUEMA DE VALIDACIN DEL MODELOS: CONTRASTES DE ESPECIFICACIN INCORRECTA


Y CONTRASTES DE ESPECIFICACIN
Significado de los parmetros

Concuerdan el signo y el valor con lo esperado, segn la teora?

Significacin estadstica de la Contrastes de significacin individual (t)


ecuacin y de los parmetros

Contrastes de significacin de subconjuntos de parmetros (F)


Contrastes de restricciones lineales sobre los parmetros (F)
Contraste de significacin global del ajuste (F)

Multicolinealidad?

Matriz de correlaciones de X

Outliers?

Grficos de los residuos


Otros (ver captulo especfico)

Autocorrelacin

entre

errores?
CONTRASTES DE

los Grfico de los residuos


Contraste Durbin-Watson (DW)
Otros (ver captulo especfico)

ESPECIFICACIN

Heterocedasticidad?

Grficos

INCORRECTA Y

Contraste de Breusch y Pagan (BP)

CALIDAD DE LOS

Otros contrastes (ver captulo especfico)

DATOS

Errores normales?

Histograma de los residuos


Contraste Jarque y Bera (JB)
Otros (ver captulo especfico)

Pruebas de linealidad de la Grficos


relacin (especificacin de la Contraste RESET de Ramsey
forma funcional)
Anlisis de Estabilidad

Contraste de Chow
Contraste de Hansen
Contrastes basados en la estimacin recursiva: CUSUM,
CUSUMQ

CONTRASTES

DE Contrastes anidados

ESPECIFICACIN
ENTRE

MODELOS

ALTERNATIVOS (Qu

Contrastes no anidados

Contrastes de la F de significacin de subconjuntos de parmetros


Contraste J de Davidson y MacKinnon (1993)
Contrastes de abarcamiento (Encompassing)
Contraste PE (Modelo lineal o modelo log-lineal?

variables?, Qu forma
funcional?

______________________________________
Manual de Econometra. Captulo 5, pgina 3
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

2. PRUEBAS DE ESPECIFICACIN ERRNEA Y DE CALIDAD DE LOS DATOS.


El tipo de pruebas que vamos ahora a proponer tiene por objeto diagnosticar la
calidad de la especificacin realizada y de la informacin muestral utilizada. Las
hiptesis H1 y H4 establecan como supuestos de partida que el modelo economtrico
elegido era correcto. Cualquier discrepancia acerca de dicho supuesto repercute en
los resultados de la estimacin por MCO, as como en la potencia de los contrastes
estadsticos propuestos, tal como tendremos ocasin de analizar con mayor detalle en
prximos captulos. Por el momento nos basta con disponer de instrumentos de
diagnstico de la evidencia emprica disponible para estar en favor, o en contra, del
mantenimiento de los supuestos. De la misma forma, hemos realizado la inferencia
por MCO con la confianza de que la base de datos de la muestra utilizada era
suficiente como para garantizar el mantenimiento de las propiedades de los
estimadores y de los contrastes propuestos. Tambin analizaremos los resultados de
la estimacin por MCO para obtener apoyo en favor del mantenimiento de este tipo de
supuestos. Presentamos a continuacin un conjunto de pruebas a realizar con los
resultados de la estimacin mnimocuadrtica de los parmetros del modelo de
regresin. Estas pruebas nos permitirn disponer de evidencia suficiente para creer
que las hiptesis establecidas al comienzo del estudio son vlidas o, por el contrario,
si se apuntan graves divergencias que aconsejen la reformulacin del modelo o de los
procedimientos inferenciales utilizados hasta el momento.

2.1. Significado de los parmetros


En el modelo economtrico especificado habremos sealado previamente los signos,
y en ocasiones los valores, esperados de todos o algunos de sus coeficientes. Por
ejemplo, si se trata de una ecuacin representativa del comportamiento de los
consumidores y como variable explicativa aparece la renta y los precios, esperamos
un signo positivo para el coeficiente que acompaa a la renta y signo negativo para el
coeficiente de la variable precio. Si la relacin es entre los logaritmos de las variables
______________________________________
Manual de Econometra. Captulo 5, pgina 4
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

indicadas, los coeficientes en la regresin son, respectivamente, las elasticidades del


consumo respecto de la renta y el precio. Si el bien es un bien normal, esperamos que
la elasticidad renta sea mayor que la unidad.
La primera de las pruebas propuestas consiste sencillamente en la comprobacin de
que los signos, o valores, de las estimaciones de los parmetros del modelo
especificado coinciden con los signos, o valores, esperados de los parmetros. Se
trata, en definitiva, de un mecanismo elemental de interpretacin del significado
econmico de los resultados ms que de una prueba estadstica.

2.2. Significacin estadstica de la ecuacin estimada y de los parmetros del modelo

Este segundo instrumento de validacin del modelo consiste en la realizacin de


pruebas de hiptesis estadsticas. La primera de ellas sirve para sealar la
significacin estadstica del modelo economtrico en su conjunto. Formalmente se
trata de efectuar una prueba de significacin conjunta del modelo, es decir de los
parmetros que acompaan a las variables explicativas (excluyendo la constante):
H o : 2 = 3 = ... = K = 0
siendo el contraste propuesto el indicado en (3.15), es decir:
(e0 e0 ea ea ) /( K 1) ( SCE 0 SCE a ) /( K 1)
=
~ FK 1;n K
ea ea /(n K )
SCE a /(n K )
en el que eo y ea indican, respectivamente, los errores del modelo bajo la hiptesis
nula (o sea, Yi=1+ui) y el modelo que contiene todos los parmetros. Si el estadstico
de prueba proporciona valores mayores que el valor tabulado de F con K-1 y n-K
grados de libertad, entonces se rechaza la hiptesis nula. En este caso decimos que
la regresin globalmente considerada explica las variaciones intramuestrales de la
variable endgena.
______________________________________
Manual de Econometra. Captulo 5, pgina 5
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

Adems de esta prueba global deben establecerse las pruebas de significacin


individual de cada uno de los parmetros del modelo de regresin, as como pruebas
de significacin de subconjuntos paramtricos y de relaciones entre los parmetros. El
planteamiento de estas pruebas de relacin entre parmetros est inspirado en el
significado econmico de los mismos. En una ecuacin que represente una funcin de
produccin tipo Cobb-Douglas esteremos interesados, por ejemplo, en contrastar que
existen rendimientos constantes de escala. Esto equivale a decir, si la ecuacin es
una relacin entre los logaritmos del producto como variable explicada y de los inputs
capital y trabajo como explicativas, que la suma de los coeficientes de las dos
explicativas es igual a la unidad.
El contraste de significacin individual se realiza mediante el estadstico definido en
(3.12):

k
~ t(n - K)
es ( k )
El estadstico de prueba de q restricciones lineales independientes sobre los
parmetros, que incluye como caso particular la significacin conjunta de q
coeficientes de regresin, es el siguiente:

( SCE o - SCE a ) /q
~ F(q; n - K)
SCE a /(n - K)
En ambos casos, si los estadsticos de prueba superan los valores tabulados se
rechazan las hiptesis nulas planteadas. En el caso del contraste de significacin
individual de un parmetro esto cuestionara la presencia de la variable explicativa
correspondiente en la regresin. Si se rechaza la hiptesis nula de significacin
estadstica de alguna relacin lineal entre parmetros, establecida en base a la
informacin terica a priori, entonces estamos cuestionando la existencia de alguna
______________________________________
Manual de Econometra. Captulo 5, pgina 6
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

relacin con significado econmico.


2.3. Calidad de la informacin muestral
La informacin muestral utilizada debe ser homognea o, dicho de otro modo, no
debe contener elementos extraos. Un elemento atpico (outlier en la terminologa
anglosajona) es una observacin para la que resulta forzado creer que se gener por
la misma estructura que la restante informacin muestral. Otra debilidad, habitual por
lo dems, de la informacin muestral es la que resulta del hecho de que las variables
explicativas presenten entre s correlaciones lineales altas, lo que resta precisin a los
estimadores minimocuadrticos. Esta cuestin ser analizada posteriormente con
mayor detalle en el mbito de lo que en la literatura economtrica se conoce como el
problema de la multicolinealidad.
Por el momento, efectuaremos las siguientes pruebas. En primer lugar analizaremos
la matriz de correlaciones entre las variables explicativas. Si esta matriz presenta
valores elevados, digamos que correlaciones entre pares de variables con valores
superiores a 0.7, hay una elevada correlacin entre las variables explicativas que
disminuir la precisin de las estimaciones efectuadas. En consecuencia, al aumentar
la varianza de los estimadores ser ms probable no rechazar la hiptesis nula de
significacin individual de los parmetros de regresin (al aumentar la varianza,
aumenta el denominador en (2.13) y por lo tanto disminuye el valor del estadstico de
prueba y es ms difcil rechazar la hiptesis nula).
El anlisis de existencia de valores atpicos se puede efectuar de distintas formas. Por
una parte, obtendremos una representacin grfica de los residuos de la estimacin
MCO. Los residuos que estn situados ms all de 2 desviaciones estndar (2se) de
la distribucin de los errores son, en principio, candidatos a sealar para la
observacin a la que correspondan la existencia de un valor atpico. Sin embargo,
hemos de precisar que si se trabaja con un nivel de confianza del 95%, entonces es
______________________________________
Manual de Econometra. Captulo 5, pgina 7
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

correcto esperar que, aproximadamente, el 5% de los residuos estn situados fuera


de las bandas de dos desviaciones estndar.
El grfico de la izquierda en la figura 5.1 muestra un ejemplo con datos simulados de
la distribucin de los residuos. La distribucin no presenta ninguna estructura
determinada (no son sistemticamente crecientes o decrecientes, no estn dispuestos
en forma de V o V invertida, etc.) lo que no indica la existencia de errores sistemticos
en la especificacin del modelo. Por otra parte aparecen algunos residuos fuera de las
bandas de confianza, pero no suficientemente alejados de las mismas como para
sospechar que se trate de algn dato extrao. El grfico de la derecha muestra una
distribucin de los errores en el que aparecen dos valores muy alejados de la media.
Los valores situados ms all de 3 desviaciones estndar deben considerarse valores
anormalmente diferentes en la distribucin y posiblemente asociados con algn dato
atpico.
Figura 5.1
Ejemplo de residuos con outliers

3
2

2
1

0
-1

-2
-2
-3

-4
76 78 80 82 84 86 88 90 92 94 96 98 00
Residuos estandariazados

20

40

60

80

100

Residuos estandariazados

______________________________________
Manual de Econometra. Captulo 5, pgina 8
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

2.4. Pruebas relativas a la pertinencia de las hiptesis mantenidas sobre el trmino de


perturbacin aleatoria (homoscedasticidad, ausencia de autocorrelacin y normalidad)
Las hiptesis relativas a las caractersticas de la distribucin de probabilidad de las
variables aleatorias que constituyen los trminos de perturbacin aleatoria del modelo
de regresin, pueden ser revisadas mediante dos enfoques distintos. Por una parte,
con el recurso de ilustraciones grficas del comportamiento de los residuos de la
estimacin MCO y, por otra, con pruebas estadsticas especficamente diseadas
para estos objetivos. Ya hemos visto cmo la distribucin del vector de residuos se
asemeja, en el lmite, a la distribucin del vector de perturbaciones aleatorias incluidas
en el modelo de regresin. Este es el fundamento sobre el que se construyen los
contrastes para calibrar la validez de las hiptesis sobre U, as como las pruebas
grficas que ayudan de una manera ms sencilla, aunque ms elemental y menos
precisa, a valorar el mantenimiento de dichos supuestos.

Ausencia de autocorrelacin
Para analizar la independencia en la distribucin de los distintos trminos de
perturbacin

aleatoria

en

la

regresin,

podemos

empezar

observando

la

representacin grfica de los residuos MCO de la estimacin. Ya hemos comentado


repetidamente que esta hiptesis es especialmente importante en inferencias
realizadas con modelos que utilizan datos temporales. Los residuos se ordenarn de
acuerdo con la secuencia temporal de los datos en la muestra. Si observamos
cualquier patrn de comportamiento sistemtico en la distribucin en el tiempo de los
residuos, entonces estamos en condiciones de dudar de la conveniencia de mantener
la hiptesis H6 de no autocorrelacin en la distribucin de los trminos de
perturbacin aleatoria. La figura 5.2 muestra dos situaciones distintas de la
distribucin de residuos de dos estimaciones realizadas por MCO. En la primera de
______________________________________
Manual de Econometra. Captulo 5, pgina 9
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

ellas no hay sospechas de violacin de la hiptesis de no autocorrelacin de los


trminos de perturbacin aleatoria (la distribucin de los residuos parece generada de
manera aleatoria), mientras que en el segundo la estructura observada (a cada
residuo con valor negativo le sigue otro con valor positivo) seala que no puede
sostenerse la hiptesis aludida.
Figura 5.2
Distribucin de residuos MCO de dos modelos de regresin

3
Ejemplo de residuos autocorrelacionados

Ejemplo de residuos no autocorrelacionados

-1

-1

-2

-2
-3

-3
20

40

60

80

Residuos estandarizados

100

78

80

82

84

86

88

90

92

Residuos estandariazados

Las pruebas relativas a la distribucin del trmino de perturbacin aleatoria sirven


para detectar problemas de especificacin del modelo. Teniendo presente que su
justificacin analtica y su deduccin formal debe hacerse en el mbito del anlisis de
las consecuencias de la alteracin de las hiptesis relativas al comportamiento del
trmino de perturbacin de la regresin, indicaremos ahora la mecnica de estos
contrastes. Los resultados del rechazo de la hiptesis nula, que sostienen las
hiptesis mantenidas en el modelo de regresin estndar, debern interpretarse por el
momento como pruebas de incorrecta especificacin. Un resultado as es indicativo de
que hay algo mal construido en la relacin y que deben revisarse los supuestos
establecidos.
Sin embargo, enunciaremos ahora una prueba elemental de ausencia de correlacin
______________________________________
Manual de Econometra. Captulo 5, pgina 10
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

serial en el trmino de perturbacin. Este contraste lo proporciona la prueba propuesta


por Durbin y Watson (1950, 1951) que definen el siguiente estadstico:
i= n

( e - e
i

d=

i -1

i= 2

i= n

2
i

i=1

que tiene una distribucin tabulada por estos mismos autores. Para que la aplicacin
de este contraste tenga sentido es preciso que las observaciones muestrales estn
ordenadas. Un criterio de ordenacin inmediato es el proporcionado por el argumento
temporal. Si los datos provienen de series en el tiempo entonces las observaciones
muestrales las ordenamos segn su aparicin en el tiempo. Cuando los datos son de
corte transversal una ordenacin lgica no siempre es posible con lo que el contraste,
y en general todos los contrastes de autocorrelacin, no tendrn interpretacin y no
sern instrumentos tiles a estos efectos. El estadstico d toma valores en el rango
comprendido entre 0 y 4. Las tablas proporcionan los valores de los lmites inferior (dl)
y superior (du) del contraste. La hiptesis nula de ausencia de autocorrelacin se
rechaza cuando:

0 < d < d l , si 0 < d < 2


4 - d u < d < 4, si 2 < d < 4
Es un contraste de una cola. La hiptesis alternativa es , o bien que hay
autocorrelacin de primer orden entre las perturbaciones positiva, o bien que hay
autocorrelacin negativa.
Por el momento bastar con interpretar este contraste como una prueba de
especificacin errnea. Por ello diremos que nuestra hiptesis nula es la correcta
especificacin de modelo. El rechazo de la hiptesis nula sealar algn error en la
construccin del modelo. Estos errores pueden deberse, entre otras causas, a la mala
especificacin de la forma funcional, es decir de la linealidad, y a la omisin de
______________________________________
Manual de Econometra. Captulo 5, pgina 11
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

variables explicativas importantes. Cuando abordemos el tema de la autocorrelacin


encontraremos mayor explicacin del funcionamiento del contraste y mejores pistas
para su interpretacin. Dejamos para entonces el anlisis ms detallado del contraste.

Heterocedasticidad
Con respecto a la hiptesis de varianza constante apuntaremos ahora, como en el
caso del tratamiento de la no autocorrelacin, dos instrumentos de naturaleza distinta:
en primer lugar, un conjunto de grficos para analizar la forma de la distribucin de los
residuos y, en segundo lugar, un contraste estadstico de fcil construccin. Los
grficos que insinan el comportamiento de la varianza del trmino de perturbacin
aleatoria son de dos tipos. El primero de ellos compara los valores de los residuos de
la estimacin MCO con los valores ajustados de la variable dependiente. El segundo
tipo de grfico describe la distribucin de los residuos en comparacin con los de cada
variable explicativa. Si se observan variaciones sistemticas de la dispersin de los
residuos cuando varian los valores de la variable dependiente y/o alguna de las
explicativas, entonces podemos dudar de la validez de la hiptesis H7 de
homoscedasticidad, es decir de varianza constante en el trmino de perturbacin.
En los grficos que aparecen en la figura 5.3 se representan distintas situaciones que
evidencian en unos casos el mantenimiento de la hiptesis de homoscedasticidad,
cuando la distribucin de los residuos no vara sistemticamente al hacerlo Y , o la
variable explicativa X, y en otros la duda sobre el cumplimiento de dicha hiptesis.
Obsrvese que cuando el trmino de perturbacin deja de ser homoscedstico, los
residuos tienden a comportarse con una variacin distinta segn cuales sean los
valores de Y , o de alguna de las variables explicativas en el modelo de regresin.

Figura 5.3
______________________________________
Manual de Econometra. Captulo 5, pgina 12
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

3000
Ejemplo de homocedasticidad

Valor absoluto de los residuos MCO

Valor absoluto de los residuos MCO

40

60

80

2000

1000

-1000
10

0
20

Ejemplo de heterocedasticidad

100

20

30

40

50

Xj

Valores ajustados de Y

Para contrastar la homoscedasticidad utilizaremos el contraste de Breusch y Pagan


(1979), que definen el siguiente estadstico:

LM =

SCR
2
~ q
2

en el que SCR es la suma de cuadrados explicada en la regresin cuya variable


dependiente es

ei2
ei2

donde e son los residuos MCO de la regresin original, cuya homocedasticidad


queremos contrastar. Las variables explicativas de la regresin auxiliar del contraste
son un conjunto de q variables explicativas que, adems de un trmino constante,
recojan los posibles argumentos de variacin de la varianza del trmino de

______________________________________
Manual de Econometra. Captulo 5, pgina 13
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

perturbacin1.
Al igual que en el caso del contraste relativo a la autocorrelacin, la prueba de
Breusch y Pagan debe contemplarse en este contexto como un contraste para poder
rechazar, si este es el caso, la hiptesis de especificacin correcta. Si el estadstico de
prueba es mayor que el valor en tablas de la 2, entonces se rechaza la buena
especificacin del modelo y deben revisarse las etapas de su construccin. Es posible
que el rechazo de la hiptesis nula que proporciona el contraste de Breusch y Pagan
est asociado con problemas de homogeneidad de los datos o, sencillamente, con
situaciones en las que resulta muy forzado el supuesto de constancia en la varianza
de la distribucin de los distintos trminos de perturbacin aleatoria en la ecuacin de
regresin.
Normalidad
Finalmente, para el supuesto de normalidad en la distribucin de las u's, sealaremos
la existencia de un contraste, adems de otra representacin grfica de los residuos.
En una primera instancia utilizaremos el grfico de la distribucin de las frecuencias
(histograma) de los valores de los residuos. La comparacin de la forma de esta
distribucin con la que tericamente presenta la distribucin normal (unimodal,
simtrica y acampanada) seala las similitudes, o discrepancias, con respecto al
supuesto de normalidad en la distribucin de las perturbaciones, tal como sealan los
grficos de la figura 5.4

Figura 5.4

El conjunto de variables explicativas en esta regresin puede coincidir con las variables explicativas de la ecuacin que
estemos evaluando. En este caso q=K-1. Cuando utilizemos este contraste como prueba efectiva de homoscedasticidad
contemplaremos otras posibilidades para esta regresin auxiliar.

______________________________________
Manual de Econometra. Captulo 5, pgina 14
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

25

Histograma de los residuos:


Ejemplo de residuos normales

Series: Residuals
Sample 1 200
Observations 200

20

Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis

15
10

-9.99E-17
-0.010369
0.844970
-0.891293
0.293782
0.038570
3.103209

5
Jarque-Bera
Probability

0.138357
0.933160

0
-0.75 -0.50 -0.25 0.00 0.25 0.50 0.75

40

Histograma de los residuos


Ejemplo de residuos no normales

Series: Residuals
Sample 1 200
Observations 200

30

Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis

20

10

Jarque-Bera
Probability

-2.16E-16
-0.262040
5.002113
-1.625097
1.065914
1.546720
6.274814
169.1148
0.000000

0
-1

El contraste propuesto por Jarque y Bera (1980) est construido a partir de los
momentos de tercer y cuarto orden o, expresado de otra forma, de los coeficientes de
asimetra y curtosis de los residuos de la regresin. Estos autores demuestran que el
estadstico:

1
3

2
2
n[ 3 3 + ( 42 - 3 ) ] + n[ 1 - 3 2 1 ] ~ (2)
6 2 24 2
2 2 2
2

siendo,
______________________________________
Manual de Econometra. Captulo 5, pgina 15
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

s = ii==1n

ei
s = 1,2...
n

y, por lo tanto, se rechaza la hiptesis nula de normalidad en la distribucin de los


errores en la regresin cuando el estadstico de prueba supera el valor tabulado segn
una ley 2 con 2 grados de libertad.

2.5. Pruebas relativas a la linealidad de la relacin


Una forma sencilla de analizar la existencia de relacin lineal entre las variables en el
modelo especificado consiste en la observacin del grfico resultante de representar
sobre un plano los valores de los errores de la regresin con los valores ajustados de
la endgena. Tambin se utilizan en ocasiones los grficos de los errores con cada
una de las variables explicativas. Si en cualquiera de estos grficos se aprecia un
comportamiento sistemtico, podemos sospechar que la especificacin lineal no es la
ms adecuada. La figuras 5.5 sirve de ejemplo de representacin grfica de un
modelo en el que cabe sospechar que se incumple la linealidad formulada como
hiptesis.

Figura 5.5

______________________________________
Manual de Econometra. Captulo 5, pgina 16
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

20

Ejemplo de sospecha de relacin no lineal

Residuos MCO

10

-10

-20
-10

-5

10

Y ajustada

Un contraste estadstico, debido a Ramsey, y conocido como contraste RESET, es el


siguiente. Se estima la ecuacin de regresin y se guardan los valores ajustados de la
endgena. Se estima a continuacin la misma ecuacin, aadiendo como variable
explicativa la endgena ajustada elevada al cuadrado y se contrasta la significacin
individual de sta, con el contraste t habitual. Si el coeficiente de esta nueva variable
es significativamente distinto de cero entonces se rechaza la linealidad de la relacin.
Expresado formalmente este contraste, se estima la regresin auxiliar:
2
Y i = 1 + 2 X 2i + ...+ K X Ki + Yi + ui ; i = 1,2...n

y, a continuacin, se hace el contraste de hiptesis nula sobre el parmetro , en la


forma acostumbrada:

______________________________________
Manual de Econometra. Captulo 5, pgina 17
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

Ho : = 0
Ha : 0

~ t(n - K - 1)
es ( )
Ntese que los grados de libertad en la distribucin de t son n-K-1 puesto que en la
regresin efectuada hemos aadido un regresor y el nmero total de parmetros es
K+1.
Se pueden incluir en la ecuacin auxiliar varias potencias de los valores ajustados de
Y, empezando por el cuadrado. En este caso, se emplea el contraste F habitual de
significacin de un subconjunto de parmetros:
2
3
h
Y i = 1 + 2 X 2i + ...+ K X Ki + 2Yi + 3Yi + ... + hYi + ui ; i = 1,2...n

H o : 2 = 3 = ... = h = 0
H a : 2 0 o ... h 0

2.6. Anlisis de la estabilidad


La hiptesis de relacin estable debe tambin analizarse. El diagnstico de la
existencia de indicios en contra de este supuesto se realiza tanto a nivel intra-muestral
como extra-muestral. La estabilidad dentro de la muestra, estabilidad intra-muestral,
se refiere a la informacin utilizada para la inferencia. Cuando los datos corresponden
a observaciones en un corte transversal y se dispone de muestra suficiente, es
aconsejable realizar una prueba de validacin cruzada. Esta prueba consiste en lo
siguiente. Se divide la muestra disponible en dos partes no necesariamente iguales
______________________________________
Manual de Econometra. Captulo 5, pgina 18
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

(se puede utilizar, por ejemplo, dos tercios de la muestra para la primera submuestra y
el tercio restante para la segunda submuestra). Con los datos que configuran la
primera submuestra se efecta la estimacin del modelo de regresin propuesto. Esta
inferencia permite efectuar predicciones para la segunda submuestra. Para ello
tomamos como conocidos los valores de las variables explicativas y obtenemos los
predictores utilizando (3.18). Los valores predichos se comparan con los observados
que hemos reservado en la segunda submuestra. Se trata, en definitiva, de evaluar el
resultado de esta comparacin entre pronsticos y observaciones reales.
Si la informacin utilizada es del tipo de serie temporal entonces esta prueba de
validacin se reduce a la subdivisin de la muestra en subperiodos. Se estima el
modelo propuesto para cada subperiodo y se comparan los resultados alcanzados. Si
no existe evidencia suficiente de cambios decimos que la muestra es estable y puede
realizarse la estimacin definitiva con todos los datos disponibles.
Las pruebas de estabilidad post-muestral funcionan de manera similar, con la
salvedad que la informacin utilizada para la comparacin es informacin externa a la
muestra. En sentido estricto debemos obtener datos nuevos para elementos distintos,
en el caso de informacin en un corte transversal, o dejar transcurrir el tiempo con
objeto de disponer de una serie temporal ms larga, y estar en condiciones de
efectuar la comparacin sugerida, en el caso de modelos para datos de serie
temporal.
2.6.1. El contraste de Chow
Es uno de los ms utilizados para probar la estabilidad de la estructura que ha
generado los datos. El constraste se refiere a la constancia de los parmetros en las
dos submuestras. Para ello habremos dividido la muestra total en dos submuestras de
tamao igual, respectivamente, a n1 y n2:

______________________________________
Manual de Econometra. Captulo 5, pgina 19
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

(1)
(1)
(1)
(1)
Y i = 1 + 2 X 21 + ...+ K X Ki + u i i = 1,2... n1

(2)
(2)
(2)
(2)
Y i = 1 + 2 X 2i + ...+ K X Ki + u i i = n1 + 1, n1 + 2...n

Y i = 1 + 2 X 2i + ...+ K X Ki + u i i = 1,2...n

Recordemos que la hiptesis a contrastar se formula de la forma siguiente:

Ho : 1 = 1 = 1
(1)
(2)
2 = 2 = 2
(1)

(2)

...

K = K = K
(1)

(2)

siendo la hiptesis alternativa que al menos una de estas igualdades no sea cierta. El
estadstico de prueba es:

[ SCE T - ( SCE 1 + SCE 2 )] /K


~ F(K; n - 2K)
( SCE 1 + SCE 2 ) /(n - 2K)
en donde SCE1, SCE2 y SCET son, respectivamente, las sumas de los cuadrados de
los errores en la estimacin de las submuestras primera, segunda y total. Si el
estadstico de prueba es mayor que el valor en tablas, rechazaremos la hiptesis nula
planteada (la estabilidad de la muestra total).
2.6.2. El contraste de Hansen
Un inconveniente del contraste de Chow es que su resultado es sensible a la particin
de la muestra. Parece razonable aplicarlo cuando sospechamos un cambio estructural
determinado, con submuestras bien definidas. En caso de datos temporales, cuando
______________________________________
Manual de Econometra. Captulo 5, pgina 20
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

en un determinado perodo ocurri un suceso (cambio de legislacin, por ejemplo) que


podra ser el causante del cambio de estructura. Si nuestros datos son transversales,
cuando hay dos o ms submuestras bien definidas que podran comportarse de
manera distinta (por ejemplo, familias rurales y urbanas). Pero muchas veces
tenemos que contrastar a ciegas. El contraste de Hansen (1992)2 salva esta dificultad.
Sea el modelo de regresin con K variables explicativas, incluyendo una constante
(X1), que se estima por MCO con datos de una muestra de T elementos (t=1,2,...T).
Definimos

f it = X it et
f it = et2 2
T

2 =

e
t =1

i = 1,..., K
i = K +1

donde et es el residuo MCO de la observacin t.


El ajuste de MCO garantiza, como del lector puede comprobar, que
T

f = 0; i = 1,...K + 1
t =1

it

El contraste de Hansen se basa en los sumatorios acumulados de f. Permite


contrastar la estabilidad de cada parmetro individualmente, y tambin la estabilidad
conjunta de todos los parmetros del modelo.
El estadstico de prueba para contrastar la estabilidad individual del parmetro i es el
siguiente:

Li =

T
1 T 2
1 t
S it ; i = 1,...K + 1; S it = f ij ; Vi = f it2

t =1
TV1 t =1
T j =1

Su distribucin asinttica bajo la hiptesis nula (el parmetro i es estable) fue


estudiada por Hansen. Los valores crticos asintticos estn tabulados. El valor crtico
del contraste de inestabilidad individual,al 5% de significacin, es 0.47. Si nuestro
estadstico de prueba toma un valor mayor que 0.47 rechazaremos la hiptesis nula,
2

Para una exposicin ms detallada, vase Johnston y Dinardo (2001), pp.133-135

______________________________________
Manual de Econometra. Captulo 5, pgina 21
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

decidiendo, por tanto, que el parmetro en cuestin es inestable.


Para contrastar la estabilidad conjunta de los K+1 parmetros (los K coeficientes de la
regresin y la varianza de la perturbacin), se emplea el estadstico de prueba
siguiente:

Lc =

1 T
st V 1 st

T t =1
T

V = f t f t
t =1

f t = { f 1t

...

st = {S1t

... S K +1,t }

f K +1,t }

En las tablas correspondientes pueden consultarse los valores crticos asintticos de


este contraste, que dependen del nmero de parmetros cuya estabilidad se somete a
prueba.

2.6.3. Los contrastes basados en la estimacin recursiva: el CUSUM y el


CUSUMQ
Cuando los datos de la muestra estn ordenados (si son de serie temporal lo estn. Si
los datos son transversales, habra que ordenar la muestra previamente por una
variable representativa del tamao), para evaluar la estabilidad de los coeficientes a
lo largo del tiempo se pueden hacer estimaciones recursivas del modelo. La idea es
estimar el modelo secuencialmente, aadiendo cada vez una nueva observacin
muestral, desde K+1 hasta T, y ver cmo cambian los coeficientes y dems
resultados. Empezamos ajustando el modelo a las primeras K observaciones (K es el
nmero de variables explicativas, incluyendo la constante). El ajuste es perfecto, y el
vector de estimadores lo notamos por bK. Reestimamos el modelo, aadiendo la
observacin K+1, as obtenemos el vector de estimadores bK+1. Y as sucesivamente,
______________________________________
Manual de Econometra. Captulo 5, pgina 22
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

hasta terminar estimando el modelo con la muestra total (t=1,...T). Este proceso de
estimacin genera, por tanto, una secuencia de vectores de estimaciones MCO:

bt = ( X t X t ) 1 X t Yt
donde t indica que la estimacin emplea los datos de los t primeros elementos de la
muestra (t=K,K+1,...T). Una simple inspeccin visual de los K grficos (uno por
coeficiente), y sus errores estndar, nos indica si los coeficientes se mantienen o no
estables a lo largo de la muestra.
Para hacer la estimacin recursiva, y calcular los intervalos de confianza
correspondientes a cada vector de estimadores MCO, no es preciso realizar todos los
clculos con las frmulas habituales. En los manuales de econometra pueden
consultarse las frmulas de clculo recursivo, que actualizan los valores de los
estimadores, y sus errores estndar, a partir de los obtenidos con la muestra previa y
de los datos del perodo t. Estas frmulas de actualizacin son las que, de hecho,
emplean los paquetes economtricos al uso.
Los contrastes CUSUM y CUSUMQ
Ambos se deben a Brown y otros (1975) y parten de la estimacin recursiva del
modelo. Definen los residuos recursivos reescalados (wt) de la siguiente forma:

wt =

donde

vt
1 + xt ( X t 1 X t 1 ) 1 xt
vt = yt xt bt 1

t = K + 1,...T

es el error de prediccin un paso adelante (diferencia entre el

valor real de y en el periodo t y su valor predicho por el modelo estimado con la


informacin muestral hasta t-1). Xt es el vector de datos de las variables explicativas
en el periodo t, y Xt-1 es la matriz de datos de los regresores hasta el periodo t-1. Si
las perturbaciones son rudo blanco y no hay cambio estructural, los residuos
recursivos reescalados w siguen una distribucin Normal con media cero, varianza
constante y no estn autocorrelacionados:
______________________________________
Manual de Econometra. Captulo 5, pgina 23
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

wt ~ N (0, 2 ); E ( wt wt ) = 0 t t t , t= 1,...T
Contraste CUSUM
El estadstico de prueba del contraste CUSUM es:

wj
; t = K + 1,...T ; 2 = eeT
T K
j = K +1

Wt =

Cuando los parmetros son constantes, la esperanza de W es cero. Se calculan los


lmites de confianza mediante las expresiones siguientes:

Limite inf erior : ( K , a T K )


Limite sup erior : (T ,3a T K )
donde a es un parmetro que depende del nivel de significacin que se use en el
contraste:
Contraste CUSUM. Correspondencia entre el nivel de significacin y el valor de a
Nivel de significacin

Valor de a

0.01

1.143

0.05

0.948

0.10

0.850

Contraste CUSUMQ
Se basa en los sumatorios acumulados de los cuadrados de los residuos recursivos
reescalados. Su estadstico de prueba es:
t

CUSUMQ =

j = K +1
T

j = K +1

2
j
2

; t = K + 1,...T

______________________________________
Manual de Econometra. Captulo 5, pgina 24
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

Bajo la hiptesis nula, el valor esperado del estadstico de prueba es, como el lector
puese constatar fcilmente,

E (St ) =

tK
T K

Los valores crticos para calcular las bandas de confianza estn tabulados y se
recogen en los paquetes economtricos al uso.
Hansen muestra la equivalencia del contraste CUSUM con el L1 (estabilidad del
trmino independiente) y del CUSUMQ con el contraste LK+1 de estabilidad de la
varianza del error.

Un Ejemplo de contraste de estabilidad de los coeficientes CUSUM y CUSUMQ, para


datos temporales:

Test CUSUM
20
15
10
5
0
-5
-10
-15
48

50

52

54

CUSUM

56

58

60

62

5% Significance

Test CUSUMQ
______________________________________
Manual de Econometra. Captulo 5, pgina 25
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

1.6
1.2
0.8
0.4
0.0
-0.4
48

50

52

54

56

58

CUSUM of Squares

60

62

5% Significance

Error de prediccin a un perodo

0.6
0.4
0.2
0.0
-0.2
-0.4

0.00

-0.6

0.05
0.10
0.15
48

50

52

54

One-Step Probability

56

58

60

62

Recursive Residuals

______________________________________
Manual de Econometra. Captulo 5, pgina 26
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

Estabilidad del coeficiente de una de las variables


explicativas del modelo
0.15
0.10
0.05
0.00
-0.05
-0.10
-0.15
51 52 53 54 55 56 57 58 59 60 61 62 63
Recursive C(2) Estimates

2 S.E.

3. PRUEBAS DE ESPECIFICACIN ENTRE MODELOS ALTERNATIVOS


Con cierta frecuencia, hay varios modelos compatibles con la teora que difieren en
sus variables explicativas. El proceso de bsqueda de especificacin, o conjunto de
procedimientos para pasar de una especificacin inicial a otra final que nos reconcilie
con los datos incluye herramientas estadsticas capaces de ayudarnos a tomar la
decisin adecuada sobre qu regresores introducir. No es sta, como sabemos desde
el captulo anterior, una cuestin balad ya que los errores de especificacin se pagan.
Hay un precio de omitir variables relevantes (sesgo) y otro por aadir variables
irrelevantes (prdida de eficiencia).
Diferenciaremos entre los contrastes de modelos anidados y los de modelos no
anidados. En ambos, se trata de contrastrar, para una muestra dada de tamao n, dos
modelos, M1 y M2 que se diferencian en las columnas de la matriz X. Si uno de los
modelos (digamos M2) contiene todos los regresores del otro y algunos ms, se dice
______________________________________
Manual de Econometra. Captulo 5, pgina 27
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

que los modelos son anidados. Una definicin ms precisa es la siguiente: dos
modelos estn anidados cuando las variables de uno de ellos se pueden expresar
como combinacin lineal de las del otro. Si esto ocurre, una de las hiptesis a
contrastar es un caso particular o versin restringida de la otra. En caso contrario,
estamos frente a un contraste de familias de hiptesis separadas.

3.1. CONTRASTES DE ESPECIFICACION DE MODELOS ANIDADOS


Los contrastes anidados son casos particulares de empleo del estadstico F de
subconjuntos paramtricos o de combinaciones lineales de parmetros. La hiptesis
nula es el modelo restringido (M1) que slo tiene los K1 regresores X. La hiptesis
alternativa es M2 que contiene, adems de X, el subconjunto Z formado por K2
regresores. Ambas matrices se suponen de rango pleno y las perturbaciones bien
comportadas:

(M1) H 0 : Y = X + U 1 ; U 1 _N(0, 2 )
(M2) H 1 : Y = X + Z + U 2 ; U 2 _N(0, 2 )
El contraste de inclusin de los regresores Z se basa en el conocido estadstico F que
computa cunto se reduce la suma de cuadrados de los errores si se aaden las
variables Z al modelo restringido que solo tiene los regresores X:
F( K 2 , n - K 1 - K 2 ) =

(e 1 e1 - e 2 e2 )/ K 2
e 2 e2 /(n - K 1 - K 2 )

donde, como siempre, e1 y e2 se refieren a los vectores nx1 de residuos


minimocuadrticos de las regresiones de M1 y M2 respectivamente.
El contraste de omisin de Z tiene como hiptesis nula M2 y se emplea para decidir si
vale la pena mantener al subconjunto Z de regresores en el modelo estimado. Su
estadstico de prueba evala cunto se pierde de la explicacin de Y (cunto empeora
______________________________________
Manual de Econometra. Captulo 5, pgina 28
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

el ajuste) si se omiten las variables contenidas en Z.


Casos particulares de los contrastes de significacin y de omisin de subconjuntos de
parmetros son aquellos en que K2=1, evalundose la pertinencia de aadir o de
eliminar una variable explicativa. Existe como sabemos una versin t de Student
equivalente del estadstico F.
Los procedimientos paso a paso (stepwise) automticos de seleccin de variables en
regresin, que ofrecen los paquetes de software estadstico en uso, se basan en una
batera de contrastes secuenciales para decidir sobre los regresores, uno por uno. Los
procedimientos hacia adelante (forward) ejecutan automticamente contrastes de
inclusin. A partir del modelo que solo contiene la constante, se decide cul de las
posibles variables explicativas contribuye ms a explicar la variabilidad de Y,
obteniendo un modelo de regresin simple. En cada paso del proceso iterativo una
nueva variable entra en el modelo, aquella que mayor coeficiente de correlacin
parcial

posee,

siempre

que

al

nivel

de

significacin

prefijado

contribuya

significativamente a mejorar el ajuste (es decir, que el coeficiente de correlacin


parcial ha de ser significativamente distinto de cero). El procedimiento opuesto se
denomina hacia atrs (backward), y consiste en ejecutar secuencialmente una batera
de contrastes de omisin de variables, cada uno de ellos restringiendo el modelo en la
hiptesis nula de forma que se omite uno de los regresores en cada paso.
La mayor parte de paquetes estadsticos y varios economtricos ofrecen rutinas de
seleccin automtica de regresores stepwise que deben ser utilizadas con precaucin
o, mejor todava, no utilizadas. Entre sus limitaciones apuntamos que prescinden por
completo de la teora, que debe ser la base de la especificacin de cualquier modelo
economtrico, dejando 'hablar' demasiado a los datos. Es en definitiva la bsqueda de
la especificacin que mejor ajuste presenta para la muestra. Si las variables
candidatas a ser regresores estn muy correlacionadas, es posible que la
especificacin obtenida sea muy poco robusta en el sentido de que cambiando
______________________________________
Manual de Econometra. Captulo 5, pgina 29
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

mnimamente la muestra, eliminando unos pocos individuos, por ejemplo, se


modifique sustencialmente la seleccin de variables. Adems, cuando se realiza una
batera de contrastes secuencialmente, los test sucesivos no son independientes de
forma que sus niveles de significacin no son los aparentes porque las decisiones
sobre qu escribir como hiptesis nula y alternativa dependen de los resultados de los
contrastes previos y en ltimo trmino del nivel de significacin que se haya fijado
para hacerlos.

3.2. CONTRASTES DE ESPECIFICACION DE MODELOS NO ANIDADOS


Los contrastes de familias separadas de hiptesis se plantean cuando nos
encontramos con teoras competitivas que sustentan posibles especificaciones del
modelo con diferentes conjuntos de regresores, X y Z, sin que ninguna de esas dos
matrices est contenida en la otra. Puede ocurrir que enfrentemos dos formas
funcionales diferentes (contraste entre un modelo lineal y otro doble log), o
transformacin diferente de las variables (mtodos de deflactacin de las series de
precios, por ejemplo) o bien definiciones alternativas de un mismo constructo
abstracto (diferentes escalas de likert para medir actitudes, motivaciones o influencia).
Son stos ejemplos de situaciones que en la prctica encontraremos con relativa
frecuencia.
Se suele diferenciar entre los contrastes emparejados y los mltiples. En los primeros
se enfrentan dos modelos, el de la H0 y el de la H1. Su hiptesis alternativa, un solo
modelo, es simple. En los contrastes mltiples el modelo de la hiptesis nula se
enfrenta a varios modelos alternativos candidatos. Nos limitaremos al primer caso3,
cuyo planteamiento genrico es el siguiente: Dudamos entre los modelos M1 y M2
que contienen K1 y K2 regresores, X y Z respectivamente, no anidados:
3

Para una revisin de los contrastes de especificacin no anidados, incluyendo los mltiples, M.McAleer (1995).
"Sherlock Holmes and the Search for Truth: A Diagnostic Tale", en L. Oxley, D.A.George, C.J. Roberts y S.Sayer (comp.)
Surveys in Econometrics. Basil Blackwell, cap.5 (pp. 91-138)

______________________________________
Manual de Econometra. Captulo 5, pgina 30
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

(M1) H 0 : Y = X 1 + U 1 U 1 _N(0, 12 )
(M2) H 1 : Y = Z 2 + U 2 U 2 _N(0, 22 )

El contraste J de Davidson y MacKinnon (1981, 1993) entre M1 y M2, consiste en


seguir los siguientes pasos:
1. Estimar el modelo M2 por MCO, y guardar los valores ajustados de Y
2. Estimar M1 aadiendo como explicativa la variable que contiene los valores
ajustados de Y resultantes de M2, guardados en el paso previo
3. Contrastar la significacin individual del coeficiente de la variable aadida. Si es
significativa, rechazamos M1
La regresin auxiliar es, por tanto:
Y = X 1 + (Z 2 ) +U
donde 2 es el vector de estimadores MCO de M2. El estadstico de prueba es el ratio
t de (coeficiente estimado por MCO dividido entre su error estndar). Bajo la
hiptesis nula, es decir, si el modelo correcto es M1, se distribuye asintticamente
como una Normal estandar. Si el ratio t es mayor que el valor crtico de la N(0,1),
rechazamos H0 (M1).
Otros contrastes se basan en el anidamiento artificial de un modelo en el otro y
reciben el nombre genrico de abarcamiento (encompassing). Se hace la regresin
combinada, incluyendo como regresores X y las p columnas de Z linealmente
independientes de X (es decir, las K1 variables X y las p variables contenidas en Z que
no se pueden expresar como combinacin lineal de las de X):
Y = X + Z * +U
donde Z* es la matriz nxp de variables en Z linealmente independientes de las
variables en X. El estadstico de prueba es el clsico del contraste F para el
______________________________________
Manual de Econometra. Captulo 5, pgina 31
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

subconjunto de parmetros aadidos en la regresin auxiliar:


H0 : = 0
Llamando e* al vector de residuos MCO de la regresin conjunta y e1 al de la
regresin M1, el estadstico de prueba se calcula mediante:
F(p , n - K 1 - p) =

(e 1 e1 - e * e* )/p
e * e* /(n - K 1 - p)

que es la expresin habitual del estadstico F para el contraste de significacin de los


p coeficientes de Z independientes de X. Observe que los grados de libertad del
numerador (p) son el nmero de restricciones de nulidad que se imponen y los del
denominador son los que corresponden a los errores del modelo conjunto (nmero de
observaciones efectivas, igual a tamao de la muestra menos nmero de parmetros
estimados).
Adems de stos, existen otros contrastes no anidados. Pero ninguno de ellos es
siempre mejor que los dems y la eleccin entre ellos no es una cuestin fcil. Para
muestras grandes parece preferible el test J, mientras que el contraste F tiene
claramente menos potencia asinttica local. Con muestras pequeas, sin embargo,
ocurre lo contrario. El contraste J tiene, segn estudios de simulacin Monte Carlo,
probabilidades de error de tipo I muy grandes pero, por otra parte, el test F puede
tener potencias menores que el J cuando la hiptesis nula es falsa.
Naturalmente, deben formularse y probarse versiones de los contrastes no anidados
en las que M2 es la hiptesis nula y M1 la alternativa, sin ms que reformular
adecuadamente las expresiones anteriores. Los paquetes economtricos suelen
ofrecer ambas versiones de cada contraste. Si en ambos casos se rechaza la
hiptesis nula, debemos considerar que ninguno de los modelos considerados se
ajusta aceptablemente a la realidad que estudiamos.

______________________________________
Manual de Econometra. Captulo 5, pgina 32
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

Un contraste para decidir entre la especificacin lineal y la log-lineal: el


contraste PE
Con frecuencia dudamos entre un modelo lineal, donde X explican a Y, y un modelo
log-lineal, en el que todas las variables estn en logaritmos, y se supone elasticidades
constantes. Un contraste especfico entre ambos es el PE, que generaliza el contraste
J que se present en el epgrafe anterior. No es tan potente como los contrastes de
RV, Wald o ML (ver apartado siguiente), pero es muy sencillo y da buenos resultados
en la prctica.
La hiptesis nula es el modelo lineal de Y contra X, y la alternativa es el modelo doblelog:

H 0 : y = X + u
H 1 : ln Y = ln( X ) + v
Se estima una regresin auxiliar, que es el modelo lineal (H0) al que se aade como
regresor la diferencia entre las predicciones del logaritmo de Y obtenidas de la
estimacin de M2 y el logaritmo de las predicciones de Y obtenidas de estimar M1:

Y = X + {(ln Y ) ln( X )} +
El estadstico de prueba es el ratio t del coeficiente () de la variable aadida. Su valor
se compara con el de la N(0,1). Si es mayor, se rechaza la hiptesis nula, es decir, el
modelo lineal. Debe hacerse la prueba en los dos sentidos, es decir, poniendo como
hiptesis nula el modelo lineal primero y el log-lineal despus.

H 0 ln Y = ln( X ) + v
H 1 : Y = X + u

LnY = Ln( X ) + {Y e ln( X } +

______________________________________
Manual de Econometra. Captulo 5, pgina 33
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

PRINCIPIOS GENERALES DE CONTRASTACIN ESTADSTICA


Hay tres principios de contrastacin estadstica que pueden aplicarse a los
contrastes de hiptesis anidados. La hiptesis nula es el modelo restringido, y la
alternativa, el modelo general no restringido. Son los principios de Razn de
Verosimilitudes (RV), Wald (W) y Multiplicadores de Lagrange (ML).
Ilustramos grficamente los tres principios en la siguiente figura:

LnL
LnLR

dLnL()d
LnL()

RV

C()
ML

Wald

^R

MV

El contraste de razn de verosimilitudes se basa en la estimacin de ambos


modelos, el restringido (H0) y el no restringido (H1), y calcular el cociente entre las
verosimilitudes maximizadas en ambos casos , o lo que es lo mismo, la diferencia
entre los logaritmos de ambas funciones de verosimilitud maximizadas. Si la diferencia
es pequea, se acepta la restriccin (H0). Bajo condiciones de regularidad, el
estadstico de prueba se distribuye, cuando se cumple la H0, as:
______________________________________
Manual de Econometra. Captulo 5, pgina 34
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

2 Ln(

LR
) ~ q2
LH 1

donde q es el nmero de restricciones impuestas por el modelo restringido (H1).


El contraste de Wald se basa en los resultados de estimar el modelo no
restringido, es decir, bajo la hiptesis alternativa. El estadstico de prueba del
contraste de k restricciones es:

H 0 : c( ) = q
H 1 : c( ) q
W = {(c() q )}Var{c( q ) 1}{c( q )} ~ h2
El principio de multiplicadores de Lagrange requiere estimar el modelo bajo la
hiptesis nula, y medir la distancia entre los estimadores restringidos y los valores
que hipotetizan las restricciones. El estadstico de prueba es:

LnL(R )
1 LnL ( R )

LM = (
)(I ( R ) (
)
R
R
que, bajo la hiptesis nula, se distribuye asintticamente como una Ji-Cuadrado con
tantos grados de libertad como restricciones se imponen en la hiptesis nula.
Los tres principios con asintticamente equivalentes, aunque en muestras pequeas
pueden dar resultados contradictorios

______________________________________
Manual de Econometra. Captulo 5, pgina 35
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

You might also like