You are on page 1of 7

Notas de Aulas Econometria I ** Eduardo P. Ribeiro, 2011 PARTE II Autocorrelao Autocorrelao: violao da hiptese: E [t.

t. t-s] = 0, para s > 0, como por exemplo, t = t-1 + t, onde t rudo branco). Neste caso E()= 2I, Como esta hiptese importante para demonstrar que V(b)=2(XX)-1, se violarmos a hiptese de independncia dos erros, os pacotes estatsticos iro errar no clculo do desvio padro dos coeficientes e errar nos valores dos testes de hiptese. Este o principal problema da autocorrelao. O estimador de MQO ainda ir gerar estimativas no viesadas, embora no mais eficientes (supondo a ordem de autocorrelao). Na verdade, V(b) = (XX)-1X X(XX)-1, onde uma matriz complexa (desenvolvida abaixo). Para identificar o problema, necessrio fazer testes de especificao. Este o diagnstico. Os testes mais comuns so os de Durbin-Watson e de Breush-Godfey. Para entender o teste, vamos especificar uma forma de classificao dos erros autorregressivos. H o caso geral de t = 1 t-1 +2 t-2 + ... +p t-p + t chamado de modelo autoregressivo de ordem p (AR(p)). A regresso sem constante, pois mantm-se a hiptese de que E[t]=0. Para o caso especial de p=1, o modelo AR(1) para a varivel t dado por t = t-1 + erro, e a ausncia de autocorrelao est associado ao parmetro : H0: no h autocorrelao, => Ho: = 0. O teste de DW tem uma tabela especfica, e o teste calculado por (e e )2 DW = T= 2 t T t 1 ~ 2(1 r ) t t =1 et2 onde r = Tt=2(et - et-1)2/(t=2et-12), ou seja, o coeficiente de uma regresso do resduo em funo do resduo defasado um perodo. A regra de deciso :Rejeitamos Ho se DW < D (Lower); Aceitamos Ho se DW > D (Upper) e Inconclusivo se D (lower) < DW < D (upper), onde D(upper) e D(lower) so os valores tabulados.

Para o teste de Breusch-Godfrey, estimamos uma regresso do resduo contra o residuo defasado p vezes e as explicativas e fazemos um teste F para significncia dos coeficientes angulares dos resduos defasados. Obs: se as explicativas no incluem a dependente defasada Yt-1, ento o teste pode ser calculado da regresso de et contra et-1 ,...., et-p apenas e pode-se usar o F de significncia da regresso.
**

OBS: Notas de aulas para o curso de Econometria I MFEE 2011. Estas notas de aula servem para orientao do estudo apenas. Este material no substitui a presena em sala de aula nem reproduz todo o contedo do curso. As obras de referncia para o material aqui apresentado esto citadas no programa do curso. Material sujeito a reviso.

11

Para entender melhor a matriz de varincia-covarincia, tomemos o caso de um modelo de regresso com erros AR(1): Y = X + , com t = t-1 + ut, onde ut ~ iid (0, 2 -1 ). Temos que b = (XX) XY, como sempre, mas V(b) 2 (XX)-1 e na verdade, V(b) = (XX)-1X X(XX)-1, onde 12 1 2 . . 1 n 2 2 1 2 = E [] = E . . . . 2 n n 1
1 2 2 = u/(1- ) . . T 1

. .

T 1 T 2

T 2

. 1

As solues para obter boas estimativas de e estimativas de V(b) corretas so: - o uso de uma matriz de varincia-covarincia que acomoda a Autocorrelao (tambm chamada matriz de Newey-West, e apresentada como opo no Eviews na estimao por LS); OU - o uso de MQG, atravs de transformao das variveis explicativas e explicada. Ou seja, como em heterocedasticidade, o problema de MQ Min (Y - X) -1(Y - X), que gera estimativas bGLS = (X -1X) (X 1Y), com V(bGLS) = (X -1X)-1. Estas podem ser obtidas atravs de bGLS = (X*X*) -1(X*Y*), onde X* = PX Y* = PY e onde PP= 1. Para o caso de autocorrelao de primeira ordem (para regresso simples)
(1 r ) x rx 2 1 (1 r ) x3 rx 2 X* = . . . . (1 r ) xT rxT 1

y ry 1 2 * Y = . . yT ryT +1

O mtodo de Mxima Verossimilhana, que envolve uma estimao no linear do modelo de regresso com autocorrelao. - E por fim, a Transformao do Modelo de Regresso. Tomando o exemplo de regresso simples, yt = + xt+ t e t = t-1 + ut () 2 onde ut ~ iid (0, ) e t = 1,..., T Substituindo t = yt - - xt na segunda equao, temos: yt xt = (yt-1 xt-1) + ut

12

(*)yt = (1 ) + yt-1 + xt xt-1 + ut (**)yt = + yt-1 + 0 xt 1 xt-1 + ut O erro do modelo (**) independentes no tempo, i.e., no tem autocorrelao. Por isto, podem ser estimado por MQO sem problemas. O modelo (**) chamado ADL(1,1) Autoregressive Distributed Lag de ordem 1 e 1. Note que se 1 = 0, o modelo (*) pode ser escrito como (), sendo ento o modelo de regresso com autocorrelao de 1 ordem um caso especial de um modelo mais geral1, ADL(1,1). Interpretao dos coeficientes no modelo ADL(1,1): E [yt| yt-1, xt, xt-1] = + yt-1 + 0 xt 1 xt-1 E [yt| . ]/xt = 0 (curto prazo) limT-> E [yt| . ]/xt = (0 + 1)/(1 ) (longo prazo), onde || < 1 Para entender, lembre-se que, no steady-state (longo prazo), yt = yt-1 = .. = y e xt = xt-1 = .. = x na mdia da regresso. Substituindo na expresso da mdia condicional, y = + y+ 0 x 1x , temos y = /(1 ) + (0 + 1)x/(1 ) O teste de COMFAC (common factor) um teste para avaliar se um modelo dinmico ADL(1,1), isto , (**), pode ser escrito como um modelo esttico com erro autoregressivo, isto , (*). O modelo autoregressivo (onde COMFAC vlido, isto 1 = 0) apresenta uma peculiaridade em relao aos efeitos de curto e longo prazo [qual?]. Esta peculiaridade nos permite identific-los. O teste COMFAC no linear e recomenda-se que seja feito via um teste de razo de verossimilhana Q= 2[loglikADL(p,p) loglikAR(p)], que segue uma distribuio qui-quadrado com p graus de liberdade. O teste similar ao teste F de significncia, mas com uma justificativa de grandes amostras. Muito freqentemente, sries econmicas apresentam forte autocorrelao, associadas a presena de tendncias ou demora para reverso mdia de longo prazo. Nestes casos (de sries no estacionrias), os modelos de regresso apresentam erros com fortssima autocorrelao. No caso extremo ||=1, ou seja o processo autoregressivo apresenta raiz unitria. Esta forte autocorrelao pode levar a concluses de inferncia errnea, pois os estimadores apresentam distribuio limite diferentes da Normal. Desta forma, deve-se testar, alm da presena de autocorrelao, a ausncia de autocorrelao extrema, atravs do teste de co-integrao dos resduos de uma regresso com sries com tendncia. O teste de cointegrao possui uma tabela especfica, apresentada por Engle e Granger (ganhadores do prmio Nobel em Economia). Se o teste de no-cointegrao no for rejeitado, deve-se estimar o modelo com as variveis em diferenas (taxas de variao). yt = + xt+ t e t = ut (FD)

O Eviews estima o modelo (*) atravs de Mnimos Quadrados no Lineares.

13

Se o teste de no-cointegrao for rejeitado, deve-se estimar o modelo na forma de modelo de correo de erros. yt = + xt+ t e t =( 1)t-1 + ut yt = + xt+ ( 1)t-1 + ut yt = + xt+ ( yt-1 xt-1) + ut (ECM) Recentemente, McCallum (2010) defendeu que os modelos (**) ou () podem ser usado com pequeno erro, em relao ao modelo ECM ou FD.

Obs: O caso geral de ADL(p,q) Yt = + 1 Yt-1 + ... + p Yt-p + 1 Xt + + q Xt-q + ut

14

Heterocedasticidade Heterocedasticidade: violao da hiptese do MCRL: V [i|X] = 2, erros tm varincia constante. Agora, V [i|X] = i2 = f(0 + 1z1i+... + pzpi) Como esta hiptese importante para demonstrar que V(b)=2(XX)-1, se violarmos a hiptese de homocedasticidade, os pacotes estatsticos iro errar no clculo do desvio padro dos coeficientes e errar nos valores dos testes de hiptese. Este o problema da heterocedasticidade. O estimador de MQO ainda ir gerar estimativas no viesadas e consistentes. Na verdade, V(b) = (XX)-1X X(XX)-1, onde uma matriz diagonal com elemento da diagonal igual a i2. Para identificar o problema, necessrio fazer testes de especificao. Este o diagnstico. Os testes mais comuns so os de White e de BreushPagan, que so equivalentes, a grosso modo. O teste busca avaliar a heterocedasticidade, atravs de um teste de H0:homocedasticidade; Ha:heterocedasticidade ou H0: 1=...=p=0 no modelo para a varinica. O teste supe que f( ) acima linear, que uma estimativa de i2 pode ser dada por ei2. Os testes diferem pela hiptese de z: alguns usam as variveis x, outros usam as variveis x e seus quadrados. Uma vez identificado o problema de heterocedasticidade, a soluo tm duas formas. Primeiro, o uso de uma matriz de varincia-covarincia dos coeficientes ajustada para heterocedasticidade (a chamada Matriz de White) que uma estimativa de V(b) = (XX)1 X X(XX)-1, implementada nos softwares como uma opo robust na estimao. Segundo a transformao das variveis explicativas e explicadas, para obter, de modo indireto, estimativas por mnimos quadrados generalizados (MQG ou GLS em ingls). O problema de MQG obter estimativas de , tal que, dado E()= , MQG: Min 2t wt bGLS = (X
-1

ou
1

Min (Y - X)

-1

(Y - X)

X)-1 (X

Y)

com V(bGLS) = (X -1X)-1. bGLS pode ser calculado atravs de transformao das explicativas e explicadas, tal que bGLS = (X*X*) -1(X*Y*), onde X* = PX Y* = PY e 1 onde PP = . Para o caso de heterocedasticidade, a sugesto multiplicar cada observao por (1/si), onde si2 obtido a partir da estimao da equao do teste de White/Breush-Pagan, em um processo interativo. Todavia, possvel demonstrar que este mtodo de MQG factvel gera estimativas viesadas, embora consistentes, quando temos o caso usual de i2 desconhecido. O melhor a estimao por Mxima Verossimilhana, se sabemos a distribuio dos erros (em geral, suposta Normal) e a forma da heterocedasticidade (em geral linear na varincia).

Multicolinearidade

15

Multicolinearidade Perfeita: violao da hiptese As variveis explicativas X1,..,Xk no so combinaes lineares entre si.. Em outras palavras, o posto da matriz X no k+1. Neste caso, no possvel obter estimativas por MQO. Multicolinearidade: altssima correlao entre variveis explicativas. Isto no gera estimativas viesadas ou altera a forma da matriz de varincia-covarincia. Mas infla os desvios padres de cada coeficiente (pela matriz (XX)-1 ter termos muito grandes). Este o problema da multicolinearidade. Com isto, passa a ser comum ter (pares) de coeficientes com estatsticas t pequenas, mas com testes F conjuntos de excluso rejeitados. Este o sintoma de multicolinearidade. Outro modo de identificar, seria atravs do clculo do FIV(bk)=1/(1 Rk2), o fator de inflao da varincia de um parmetro bk e onde Rk2 o coeficiente de determinao da regresso de xk em x1, ..., xk-1. Se este for alto, possvel que o problema da multicolinearidade esteja presente. Diz-se possvel, pois um alto FIC no condio necessria nem suficiente para o problema de multicolinearidade, j que pode-se demonstrar que V(bk)=2/(Skk(1Rk2)), onde Skk= (xki mxk)2, O que ocorre que h duas variveis explicativas com o mesmo contedo informacional (variabilidade similar, i.e., altamente correlacionada). Com isto, o mtodo de mnimos quadrados no consegue distinguir entre os efeitos diretos e indiretos das variveis. Embora haja solues ditas ad-hoc como o mtodo de ridge regression e o uso de anlise fatorial, talvez o mais razovel seja pensarmos no problema e identificarmos qual varivel (dentre aquelas que tem, na prtica, a mesma informao) a mais importante e/ou a mais representativa.

Dados em Painel Muitas vezes, os modelos tericos indicam que os modelos economtricos apresentam heterogeneidade, ou seja, os parmetros variam de empresa a empresa ou pessoa a pessoa. Nesta situao, dados em cross-section nos permitem estimar apenas os efeitos mdios. Ou seja, se yi= i + i xi no modelo terico, podemos fazer a hiptese de efeitos mdios i = + i e i = + i, onde os erros i e i tm mdia zero e so independentes. Com isto temos um modelo de regresso heterocedstico. yi= + xi + vi, onde vi= i + i xi Este modelo pode ser considerado muito restritivo, pois supe que as diferenas de coeficientes no influenciam as escolhas das pessoas ou empresas, ou seja, E(i xi)=0, E(i xi)=0. Alm disso, a estimao do modelo completo exigiria muitas observaes por empresa ou pessoa (i), para permitir rodar uma regresso para cada i. Um modelo intermedirio nas hipteses seria aquele em que h heterogeneidade na constante. O mesmo pode ser estimado com dados em painel, ou seja um conjunto de

16

dados com vrias unidades observadas durante um perodo de tempo curto. Assim, o modelo ficaria na forma yit= xit + i + it, i=1,..,n e t=1,..,T As vantagens deste modelo que ele permite controlar diferenas entre as unidades pesquisadas (empresas ou pessoas) de modo simples. Este controle pode ser importante pois existem algumas caractersticas individuais que so correlacionadas com as explicativas. Como temos mais de uma observao por pessoa, a regresso pode ser calculada utilizando dummies para cada pessoa (LSDV), ou seja, i=1,..,n e t=1,..,T. yit= xit + i i dit + it, onde a dummy dit=1 se i=j e 0 caso contrrio. Este o chamado modelo de efeitos fixos. Pode parecer que o uso das dummies gera muitos parmetros, mas como em geral temos NT observaes, colocar as dummies nos deixa com N(T-1)-k graus de liberdade. Com n=50 e T=10 e trs explicativas, mesmo com as dummies, ainda temos 447 graus de liberadade. Outra vantagem do modelo de efeitos fixos que na verdade estimamos os coeficientes avaliando o que acontece com as unidades ao longo do tempo. Descartamos do modelo as diferenas entre unidades. Estas diferenas entre unidades, utilizadas em crosssection para calcular os coeficientes, em geral so contaminadas por causalidade reversa. Na anlise em painel importante perceber que SQT = SQW + SQB + SQR, onde SQT=it(yit y**)2, SQW=it(yit yi*)2, SQB=it(yi* y**)2 e SQR=it(ei)2. Em palavras, a variao nos dados (SQT) se divide em variao intra unidades (ao longo do tempo, SQW), variao entre unidades (cross-section, SQB) e variao residual (SQR). Alm do modelo de efeitos fixos, h o modelo de efeitos aleatrios, que pressupe que o componente individual seja no correlacionado com as explicativas. A estimao por MQG. O uso de mais um cross-section permite que efeitos temporais, alm de variveis que indicam diferenas entre unidades, sejam avaliados na regresso. O uso de dados em painel tambm gera estimativas mais eficientes do que aquelas em crosssection, pois usam mais informao. E quando o horizonte temporal curto, permite avaliar efeitos temporais, sob certas hipteses, mesmo que uma regresso de srie de tempo apenas tenha muito poucos graus de liberadade.

17

You might also like