Professional Documents
Culture Documents
CAPTULO 5
VALIDACIN DEL MODELO DE REGRESIN: CONTRASTES DE
ESPEFICIACIN INCORRECTA Y CONTRASTES DE ESPECIFICACIN
1.
INTRODUCCION.
TIPOS
DE
PRUEBAS
DE
VALIDACIN
DE
LOS
estimado con otros posibles modelos. Estos modelos alternativos pueden incluir ms,
o menos, variables explicativas que las utilizadas hasta el momento. Tambin cabe la
posibilidad de realizar comparaciones con modelos diferentes tanto por la forma
funcional especificada como por las variables utilizadas como predeterminadas. En
cualquier caso se trata de sealar las pautas que nos permitan aproximarnos, en la
medida de lo posible, a inferencias que garanticen la adecuacin de los datos al
modelo subyacente desconocido.
Siguiendo la terminologa habitual nos referiremos al primer tipo de pruebas como
pruebas de especificacin errnea del modelo, mientras que las segundas las
reconoceremos sencillamente como pruebas de especificacin entre modelos
alternativos. Para establecer una cierta sistemtica en la aplicacin de estas pruebas
ahora las presentaremos en forma de una batera ordenada. En la prctica, esta etapa
de validacin se realiza de manera mucho ms automtica y simultnea. Sin
embargo, con objeto de presentar separadamente los conceptos e hiptesis que se
cuestionan junto con las pruebas aconsejadas, researemos, en lo que sigue, dichas
pruebas de manera ordenada clasificadas segn la hiptesis nula establecida.
La pgina siguiente contiene un esquema de las pruebas y contrastes de validacin y
especificacin del modelo.
______________________________________
Manual de Econometra. Captulo 5, pgina 2
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
Multicolinealidad?
Matriz de correlaciones de X
Outliers?
Autocorrelacin
entre
errores?
CONTRASTES DE
ESPECIFICACIN
Heterocedasticidad?
Grficos
INCORRECTA Y
CALIDAD DE LOS
DATOS
Errores normales?
Contraste de Chow
Contraste de Hansen
Contrastes basados en la estimacin recursiva: CUSUM,
CUSUMQ
CONTRASTES
DE Contrastes anidados
ESPECIFICACIN
ENTRE
MODELOS
ALTERNATIVOS (Qu
Contrastes no anidados
variables?, Qu forma
funcional?
______________________________________
Manual de Econometra. Captulo 5, pgina 3
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
k
~ t(n - K)
es ( k )
El estadstico de prueba de q restricciones lineales independientes sobre los
parmetros, que incluye como caso particular la significacin conjunta de q
coeficientes de regresin, es el siguiente:
( SCE o - SCE a ) /q
~ F(q; n - K)
SCE a /(n - K)
En ambos casos, si los estadsticos de prueba superan los valores tabulados se
rechazan las hiptesis nulas planteadas. En el caso del contraste de significacin
individual de un parmetro esto cuestionara la presencia de la variable explicativa
correspondiente en la regresin. Si se rechaza la hiptesis nula de significacin
estadstica de alguna relacin lineal entre parmetros, establecida en base a la
informacin terica a priori, entonces estamos cuestionando la existencia de alguna
______________________________________
Manual de Econometra. Captulo 5, pgina 6
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
3
2
2
1
0
-1
-2
-2
-3
-4
76 78 80 82 84 86 88 90 92 94 96 98 00
Residuos estandariazados
20
40
60
80
100
Residuos estandariazados
______________________________________
Manual de Econometra. Captulo 5, pgina 8
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
Ausencia de autocorrelacin
Para analizar la independencia en la distribucin de los distintos trminos de
perturbacin
aleatoria
en
la
regresin,
podemos
empezar
observando
la
3
Ejemplo de residuos autocorrelacionados
-1
-1
-2
-2
-3
-3
20
40
60
80
Residuos estandarizados
100
78
80
82
84
86
88
90
92
Residuos estandariazados
( e - e
i
d=
i -1
i= 2
i= n
2
i
i=1
que tiene una distribucin tabulada por estos mismos autores. Para que la aplicacin
de este contraste tenga sentido es preciso que las observaciones muestrales estn
ordenadas. Un criterio de ordenacin inmediato es el proporcionado por el argumento
temporal. Si los datos provienen de series en el tiempo entonces las observaciones
muestrales las ordenamos segn su aparicin en el tiempo. Cuando los datos son de
corte transversal una ordenacin lgica no siempre es posible con lo que el contraste,
y en general todos los contrastes de autocorrelacin, no tendrn interpretacin y no
sern instrumentos tiles a estos efectos. El estadstico d toma valores en el rango
comprendido entre 0 y 4. Las tablas proporcionan los valores de los lmites inferior (dl)
y superior (du) del contraste. La hiptesis nula de ausencia de autocorrelacin se
rechaza cuando:
Heterocedasticidad
Con respecto a la hiptesis de varianza constante apuntaremos ahora, como en el
caso del tratamiento de la no autocorrelacin, dos instrumentos de naturaleza distinta:
en primer lugar, un conjunto de grficos para analizar la forma de la distribucin de los
residuos y, en segundo lugar, un contraste estadstico de fcil construccin. Los
grficos que insinan el comportamiento de la varianza del trmino de perturbacin
aleatoria son de dos tipos. El primero de ellos compara los valores de los residuos de
la estimacin MCO con los valores ajustados de la variable dependiente. El segundo
tipo de grfico describe la distribucin de los residuos en comparacin con los de cada
variable explicativa. Si se observan variaciones sistemticas de la dispersin de los
residuos cuando varian los valores de la variable dependiente y/o alguna de las
explicativas, entonces podemos dudar de la validez de la hiptesis H7 de
homoscedasticidad, es decir de varianza constante en el trmino de perturbacin.
En los grficos que aparecen en la figura 5.3 se representan distintas situaciones que
evidencian en unos casos el mantenimiento de la hiptesis de homoscedasticidad,
cuando la distribucin de los residuos no vara sistemticamente al hacerlo Y , o la
variable explicativa X, y en otros la duda sobre el cumplimiento de dicha hiptesis.
Obsrvese que cuando el trmino de perturbacin deja de ser homoscedstico, los
residuos tienden a comportarse con una variacin distinta segn cuales sean los
valores de Y , o de alguna de las variables explicativas en el modelo de regresin.
Figura 5.3
______________________________________
Manual de Econometra. Captulo 5, pgina 12
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
3000
Ejemplo de homocedasticidad
40
60
80
2000
1000
-1000
10
0
20
Ejemplo de heterocedasticidad
100
20
30
40
50
Xj
Valores ajustados de Y
LM =
SCR
2
~ q
2
ei2
ei2
______________________________________
Manual de Econometra. Captulo 5, pgina 13
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
perturbacin1.
Al igual que en el caso del contraste relativo a la autocorrelacin, la prueba de
Breusch y Pagan debe contemplarse en este contexto como un contraste para poder
rechazar, si este es el caso, la hiptesis de especificacin correcta. Si el estadstico de
prueba es mayor que el valor en tablas de la 2, entonces se rechaza la buena
especificacin del modelo y deben revisarse las etapas de su construccin. Es posible
que el rechazo de la hiptesis nula que proporciona el contraste de Breusch y Pagan
est asociado con problemas de homogeneidad de los datos o, sencillamente, con
situaciones en las que resulta muy forzado el supuesto de constancia en la varianza
de la distribucin de los distintos trminos de perturbacin aleatoria en la ecuacin de
regresin.
Normalidad
Finalmente, para el supuesto de normalidad en la distribucin de las u's, sealaremos
la existencia de un contraste, adems de otra representacin grfica de los residuos.
En una primera instancia utilizaremos el grfico de la distribucin de las frecuencias
(histograma) de los valores de los residuos. La comparacin de la forma de esta
distribucin con la que tericamente presenta la distribucin normal (unimodal,
simtrica y acampanada) seala las similitudes, o discrepancias, con respecto al
supuesto de normalidad en la distribucin de las perturbaciones, tal como sealan los
grficos de la figura 5.4
Figura 5.4
El conjunto de variables explicativas en esta regresin puede coincidir con las variables explicativas de la ecuacin que
estemos evaluando. En este caso q=K-1. Cuando utilizemos este contraste como prueba efectiva de homoscedasticidad
contemplaremos otras posibilidades para esta regresin auxiliar.
______________________________________
Manual de Econometra. Captulo 5, pgina 14
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
25
Series: Residuals
Sample 1 200
Observations 200
20
Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis
15
10
-9.99E-17
-0.010369
0.844970
-0.891293
0.293782
0.038570
3.103209
5
Jarque-Bera
Probability
0.138357
0.933160
0
-0.75 -0.50 -0.25 0.00 0.25 0.50 0.75
40
Series: Residuals
Sample 1 200
Observations 200
30
Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis
20
10
Jarque-Bera
Probability
-2.16E-16
-0.262040
5.002113
-1.625097
1.065914
1.546720
6.274814
169.1148
0.000000
0
-1
El contraste propuesto por Jarque y Bera (1980) est construido a partir de los
momentos de tercer y cuarto orden o, expresado de otra forma, de los coeficientes de
asimetra y curtosis de los residuos de la regresin. Estos autores demuestran que el
estadstico:
1
3
2
2
n[ 3 3 + ( 42 - 3 ) ] + n[ 1 - 3 2 1 ] ~ (2)
6 2 24 2
2 2 2
2
siendo,
______________________________________
Manual de Econometra. Captulo 5, pgina 15
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
s = ii==1n
ei
s = 1,2...
n
Figura 5.5
______________________________________
Manual de Econometra. Captulo 5, pgina 16
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
20
Residuos MCO
10
-10
-20
-10
-5
10
Y ajustada
______________________________________
Manual de Econometra. Captulo 5, pgina 17
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
Ho : = 0
Ha : 0
~ t(n - K - 1)
es ( )
Ntese que los grados de libertad en la distribucin de t son n-K-1 puesto que en la
regresin efectuada hemos aadido un regresor y el nmero total de parmetros es
K+1.
Se pueden incluir en la ecuacin auxiliar varias potencias de los valores ajustados de
Y, empezando por el cuadrado. En este caso, se emplea el contraste F habitual de
significacin de un subconjunto de parmetros:
2
3
h
Y i = 1 + 2 X 2i + ...+ K X Ki + 2Yi + 3Yi + ... + hYi + ui ; i = 1,2...n
H o : 2 = 3 = ... = h = 0
H a : 2 0 o ... h 0
(se puede utilizar, por ejemplo, dos tercios de la muestra para la primera submuestra y
el tercio restante para la segunda submuestra). Con los datos que configuran la
primera submuestra se efecta la estimacin del modelo de regresin propuesto. Esta
inferencia permite efectuar predicciones para la segunda submuestra. Para ello
tomamos como conocidos los valores de las variables explicativas y obtenemos los
predictores utilizando (3.18). Los valores predichos se comparan con los observados
que hemos reservado en la segunda submuestra. Se trata, en definitiva, de evaluar el
resultado de esta comparacin entre pronsticos y observaciones reales.
Si la informacin utilizada es del tipo de serie temporal entonces esta prueba de
validacin se reduce a la subdivisin de la muestra en subperiodos. Se estima el
modelo propuesto para cada subperiodo y se comparan los resultados alcanzados. Si
no existe evidencia suficiente de cambios decimos que la muestra es estable y puede
realizarse la estimacin definitiva con todos los datos disponibles.
Las pruebas de estabilidad post-muestral funcionan de manera similar, con la
salvedad que la informacin utilizada para la comparacin es informacin externa a la
muestra. En sentido estricto debemos obtener datos nuevos para elementos distintos,
en el caso de informacin en un corte transversal, o dejar transcurrir el tiempo con
objeto de disponer de una serie temporal ms larga, y estar en condiciones de
efectuar la comparacin sugerida, en el caso de modelos para datos de serie
temporal.
2.6.1. El contraste de Chow
Es uno de los ms utilizados para probar la estabilidad de la estructura que ha
generado los datos. El constraste se refiere a la constancia de los parmetros en las
dos submuestras. Para ello habremos dividido la muestra total en dos submuestras de
tamao igual, respectivamente, a n1 y n2:
______________________________________
Manual de Econometra. Captulo 5, pgina 19
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
(1)
(1)
(1)
(1)
Y i = 1 + 2 X 21 + ...+ K X Ki + u i i = 1,2... n1
(2)
(2)
(2)
(2)
Y i = 1 + 2 X 2i + ...+ K X Ki + u i i = n1 + 1, n1 + 2...n
Y i = 1 + 2 X 2i + ...+ K X Ki + u i i = 1,2...n
Ho : 1 = 1 = 1
(1)
(2)
2 = 2 = 2
(1)
(2)
...
K = K = K
(1)
(2)
siendo la hiptesis alternativa que al menos una de estas igualdades no sea cierta. El
estadstico de prueba es:
f it = X it et
f it = et2 2
T
2 =
e
t =1
i = 1,..., K
i = K +1
f = 0; i = 1,...K + 1
t =1
it
Li =
T
1 T 2
1 t
S it ; i = 1,...K + 1; S it = f ij ; Vi = f it2
t =1
TV1 t =1
T j =1
______________________________________
Manual de Econometra. Captulo 5, pgina 21
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
Lc =
1 T
st V 1 st
T t =1
T
V = f t f t
t =1
f t = { f 1t
...
st = {S1t
... S K +1,t }
f K +1,t }
hasta terminar estimando el modelo con la muestra total (t=1,...T). Este proceso de
estimacin genera, por tanto, una secuencia de vectores de estimaciones MCO:
bt = ( X t X t ) 1 X t Yt
donde t indica que la estimacin emplea los datos de los t primeros elementos de la
muestra (t=K,K+1,...T). Una simple inspeccin visual de los K grficos (uno por
coeficiente), y sus errores estndar, nos indica si los coeficientes se mantienen o no
estables a lo largo de la muestra.
Para hacer la estimacin recursiva, y calcular los intervalos de confianza
correspondientes a cada vector de estimadores MCO, no es preciso realizar todos los
clculos con las frmulas habituales. En los manuales de econometra pueden
consultarse las frmulas de clculo recursivo, que actualizan los valores de los
estimadores, y sus errores estndar, a partir de los obtenidos con la muestra previa y
de los datos del perodo t. Estas frmulas de actualizacin son las que, de hecho,
emplean los paquetes economtricos al uso.
Los contrastes CUSUM y CUSUMQ
Ambos se deben a Brown y otros (1975) y parten de la estimacin recursiva del
modelo. Definen los residuos recursivos reescalados (wt) de la siguiente forma:
wt =
donde
vt
1 + xt ( X t 1 X t 1 ) 1 xt
vt = yt xt bt 1
t = K + 1,...T
wt ~ N (0, 2 ); E ( wt wt ) = 0 t t t , t= 1,...T
Contraste CUSUM
El estadstico de prueba del contraste CUSUM es:
wj
; t = K + 1,...T ; 2 = eeT
T K
j = K +1
Wt =
Valor de a
0.01
1.143
0.05
0.948
0.10
0.850
Contraste CUSUMQ
Se basa en los sumatorios acumulados de los cuadrados de los residuos recursivos
reescalados. Su estadstico de prueba es:
t
CUSUMQ =
j = K +1
T
j = K +1
2
j
2
; t = K + 1,...T
______________________________________
Manual de Econometra. Captulo 5, pgina 24
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
Bajo la hiptesis nula, el valor esperado del estadstico de prueba es, como el lector
puese constatar fcilmente,
E (St ) =
tK
T K
Los valores crticos para calcular las bandas de confianza estn tabulados y se
recogen en los paquetes economtricos al uso.
Hansen muestra la equivalencia del contraste CUSUM con el L1 (estabilidad del
trmino independiente) y del CUSUMQ con el contraste LK+1 de estabilidad de la
varianza del error.
Test CUSUM
20
15
10
5
0
-5
-10
-15
48
50
52
54
CUSUM
56
58
60
62
5% Significance
Test CUSUMQ
______________________________________
Manual de Econometra. Captulo 5, pgina 25
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
1.6
1.2
0.8
0.4
0.0
-0.4
48
50
52
54
56
58
CUSUM of Squares
60
62
5% Significance
0.6
0.4
0.2
0.0
-0.2
-0.4
0.00
-0.6
0.05
0.10
0.15
48
50
52
54
One-Step Probability
56
58
60
62
Recursive Residuals
______________________________________
Manual de Econometra. Captulo 5, pgina 26
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
2 S.E.
que los modelos son anidados. Una definicin ms precisa es la siguiente: dos
modelos estn anidados cuando las variables de uno de ellos se pueden expresar
como combinacin lineal de las del otro. Si esto ocurre, una de las hiptesis a
contrastar es un caso particular o versin restringida de la otra. En caso contrario,
estamos frente a un contraste de familias de hiptesis separadas.
(M1) H 0 : Y = X + U 1 ; U 1 _N(0, 2 )
(M2) H 1 : Y = X + Z + U 2 ; U 2 _N(0, 2 )
El contraste de inclusin de los regresores Z se basa en el conocido estadstico F que
computa cunto se reduce la suma de cuadrados de los errores si se aaden las
variables Z al modelo restringido que solo tiene los regresores X:
F( K 2 , n - K 1 - K 2 ) =
(e 1 e1 - e 2 e2 )/ K 2
e 2 e2 /(n - K 1 - K 2 )
posee,
siempre
que
al
nivel
de
significacin
prefijado
contribuya
Para una revisin de los contrastes de especificacin no anidados, incluyendo los mltiples, M.McAleer (1995).
"Sherlock Holmes and the Search for Truth: A Diagnostic Tale", en L. Oxley, D.A.George, C.J. Roberts y S.Sayer (comp.)
Surveys in Econometrics. Basil Blackwell, cap.5 (pp. 91-138)
______________________________________
Manual de Econometra. Captulo 5, pgina 30
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
(M1) H 0 : Y = X 1 + U 1 U 1 _N(0, 12 )
(M2) H 1 : Y = Z 2 + U 2 U 2 _N(0, 22 )
(e 1 e1 - e * e* )/p
e * e* /(n - K 1 - p)
______________________________________
Manual de Econometra. Captulo 5, pgina 32
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
H 0 : y = X + u
H 1 : ln Y = ln( X ) + v
Se estima una regresin auxiliar, que es el modelo lineal (H0) al que se aade como
regresor la diferencia entre las predicciones del logaritmo de Y obtenidas de la
estimacin de M2 y el logaritmo de las predicciones de Y obtenidas de estimar M1:
Y = X + {(ln Y ) ln( X )} +
El estadstico de prueba es el ratio t del coeficiente () de la variable aadida. Su valor
se compara con el de la N(0,1). Si es mayor, se rechaza la hiptesis nula, es decir, el
modelo lineal. Debe hacerse la prueba en los dos sentidos, es decir, poniendo como
hiptesis nula el modelo lineal primero y el log-lineal despus.
H 0 ln Y = ln( X ) + v
H 1 : Y = X + u
______________________________________
Manual de Econometra. Captulo 5, pgina 33
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
LnL
LnLR
dLnL()d
LnL()
RV
C()
ML
Wald
^R
MV
2 Ln(
LR
) ~ q2
LH 1
H 0 : c( ) = q
H 1 : c( ) q
W = {(c() q )}Var{c( q ) 1}{c( q )} ~ h2
El principio de multiplicadores de Lagrange requiere estimar el modelo bajo la
hiptesis nula, y medir la distancia entre los estimadores restringidos y los valores
que hipotetizan las restricciones. El estadstico de prueba es:
LnL(R )
1 LnL ( R )
LM = (
)(I ( R ) (
)
R
R
que, bajo la hiptesis nula, se distribuye asintticamente como una Ji-Cuadrado con
tantos grados de libertad como restricciones se imponen en la hiptesis nula.
Los tres principios con asintticamente equivalentes, aunque en muestras pequeas
pueden dar resultados contradictorios
______________________________________
Manual de Econometra. Captulo 5, pgina 35
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC