Professional Documents
Culture Documents
11. HETEROCEDASTICIDADE No captulo anterior, foi visto que o termo aleatrio, alm de no autocorrelacionado, devia apresentar varincia constante. A essa caracterstica d-se o nome de Homocedasticidade, ou seja, 2 2 Var (u i ) = E (u i ) = u2 . A violao dessa ltima hiptese gera o problema denominado Heterocedasticidade. Podemos ter uma viso intuitiva do problema analisando os Grficos 11.1 e 11.2.
11.1
11.2
Verificamos no Grfico 11.1 que o incremento da varivel X (explicativa ou independente) acompanhado por uma disperso dos pontos. Isso implica que a varincia do termo aleatrio ser tanto maior quanto maiores forem os valores da varivel explicativa X. J no Grfico 11.2 ocorre o inverso. Ambas as situaes geram problemas quando utilizamos o mtodo dos mnimos quadrados ordinrios, semelhana do que ocorre na presena de autocorrelao. A seguir, sero analisadas as causas, as conseqncias, os testes e as solues para a presena de Heterocedasticidade.
Fontes da Heterocedasticidade
Prof. Me. Waldemir Santos Nogueira / 2007
168
Inicialmente, deve-se lembrar que falhas na especificao do modelo1 pode gerar um termo aleatrio Heterocedstico. Alm dessa causa, devemos alertar para o fato de que esse problema pode ser resultado de uma caracterstica intrnseca da funo que se est estudando. Nesses casos, razovel a suposio de que os resduos da regresso sigam o padro descrito nos Grficos 11.1 ou 11.2. Conseqncias da Heterocedasticidade Implica que, apesar de os estimadores dos parmetros serem no viesados, existem problemas nas concluses tiradas com base nos testes de hiptese. Concluso: A presena de Heterocedasticidade gera: 1. estimadores dos parmetros ( ) no visados, mas ineficientes. 2. as varincias estimadas dos parmetros so viesadas, gerando problemas com os testes de hiptese. Testes para detectar a presena de Heterocedasticidade Teste de Goldfeld-Quandt A idia bsica do teste verificar se existe diferena entre a varincia dos resduos estimados, ou seja, ui, localizados nas proximidades do intercepto, e aqueles que se encontram a uma distncia maior. Com o auxlio do Grfico 11.3, fcil verificar que, se a Var(u1) for igual Var(u2), poderamos considerar que os resduos so homocedsticos. Caso contrrio, devemos tratar o modelo como Heterocedstico.
Conforme ser explicitado na seo a seguir, dedicada aos problemas de especificao. Prof. Me. Waldemir Santos Nogueira / 2007
169
Var (u1 )
Var (u 2 )
11.3 importante notar que, nesse exemplo, estamos tratando de uma regresso simples, ou seja, com uma nica varivel explicativa. No caso de uma regresso mltipla, antes de mais nada, necessrio identificar com qual das variveis independentes o resduo est relacionado, O teste de Goldfeld-Quandt dever ser realizado utilizando-se cada uma das variveis explicativas suspeitas por vez. O procedimento para a realizao do teste o seguinte: 1. Ordenar todos os dados da amostra de acordo com os valores da varivel explicativa relacionada com os resduos. 2. Dividir a amostra em trs partes, separando aproximadamente 25% dos elementos centrais - c. Assim, teremos
(n c ) elementos na
2
primeira e na terceira parte, conforme ilustrado no Grfico 11.3. 3. Estimar uma regresso utilizando somente os elementos da parte 1, e calcular a soma dos quadrados dos resduos, ou seja: 2. Calcular u1 2 .
2 i =1 n
u
i =1
2 11
170
5. Calcular
(n
c) 2
graus de liberdade no numerador e no denominador. Obs.: Colocar sempre no numerador a soma de resduos supostamente superior. Assim, se o modelo fosse representado pelo Grfico 11.2, teramos uma inverso entre o numerador e o denominador de F*. Os critrios para realizao do teste so os seguintes: 1. Se F* > Ftabelado. Portanto, u22 > u12 rejeita-se a hiptese nula de que H0: de que ui Homocedstico. Nesse caso, pode-se dizer que existe Heterocedasticidade. 2 u12 2. Se F* > Ftabelado F* 1. Portanto, u2 Aceito a hiptese nula - H0: de que ui Homocedstico. Nesse caso, pode-se dizer que no existe Heterocedasticidade. importante destacar que o teste de Goldfeld-Quandt apresenta algumas limitaes: 1. Exige amostra relativamente grande. 2. Pressupe que a Heterocedasticidade seja decorrente da relao entre o termo aleatrio e alguma(s) das variveis explicativas. Existem, porm, outras possibilidades, tais como a Heterocedasticidade resultante da utilizao de dados grupados. 3. No d indicao sobre a exata relao existente entre a varivel X e os resduos ui 4. Depende do nmero de elementos excludos, ou seja, do valor de c. Assim, se c for muito grande, sobraro poucos graus de liberdade para o clculo de u i 2 das duas regresses. Por outro lado, se ele
Prof. Me. Waldemir Santos Nogueira / 2007
171
for muito pequeno, ser difcil captar as diferenas de varincias possivelmente existentes. Teste de Glejser Esse teste, alm da facilidade de realizao, permite que se supere a limitao 3 do teste de Goldfeld-Quandt. Assim, os resultados desse teste daro indicaes sobre o padro da Heterocedasticidade. Essa informao til para a escolha de um mtodo conveniente de estimao do modelo Heterocedstico. Os procedimentos para realizao desse teste so os seguintes: 1. Estimar a regresso original, ou seja, Y = X + u . 2. Com os resduos obtidos em 1, estimar as seguintes regresses:
ui = 0 + 1 X i
ui = 0 + 1 X i2
ui = 0 + 1
1 Xi
ui = 0 + 1 X i
sendo X a varivel explicativa com a qual se supe que ui esteja relacionado e h qualquer potncia selecionada. O teste ser realizado pela forma usual, ou seja, H0: 1 = 0, tendo distribuio t. Os critrios para realizao do teste so os seguintes:
1
1. Se 1 = 0, para todas as regresses estimadas aceita-se H0 Consequentemente no existe Heterocedasficidade. 2. Se 1 0, para pelo menos uma das regresses estimadas Rejeitase H0 . Consequentemente existe Heterocedasticidade.
Prof. Me. Waldemir Santos Nogueira / 2007
172
A limitao mais importante desse teste refere-se ao pressuposto de que a Heterocedasticidade seja decorrente da relao entre o termo aleatrio ui e alguma(s) das variveis independentes xs. Como dito antes, esse no o nico padro existente. Resumo e Exerccios Se a hiptese do mtodo dos mnimos quadrados de que a varincia do termo erro (resduos)ui constante para todos os valores das variveis independentes no se mantm, deparamo-nos com o problema da Heterocedasticidade. Isto conduz a estimativas viesadas e ineficientes(isto , maior que a varincia mnima) dos erros padro (e, assim, h testes estatsticos e intervalos de confiana incorretos). Um teste de Heterocedasticidade de Quandt-Goldfeld envolve ordenar os dados para pequenos e grandes valores da varivel independente X, e fazer duas regresses, uma para os pequenos valores de X e uma para grandes valores de X, omitindo, digamos um quinto das observaes com valores mdios. Ento, testamos se a razo da soma 2 dos quadrados dos erros ( u ) (VR) da segunda para a primeira regresso significativamente diferente de zero, usando a tabela F com (n-d-2k)/2 graus de liberdade, onde, n o nmero total de observaes, d o nmero de observaes omitidas e k o nmero de parmetros estimados. Se a varincia do erro proporcional a X2 (caso mais freqente), a Heterocedasticidade pode ser reduzida pela diviso de cada termo do modelo por X, ento reestimando a regresso usando as variveis transformadas.
173
Testes da Heterocedasticidade: Exemplos numricos Os exerccios resolvidos a seguir mostram como testar a Heterocedasticidade e como proceder a sua correo. Aplicao do teste de Quandt-Goldfeld Salrios Mdios e Nmero de Trabalhadores Empregados Salrios Mdios 8,40 8,40 8,60 8,90 9,10 9,30 9,50 9,80 9,90 10,30 10,60 10,90 11,60 11,80 12,10 Fonte: Salvatore (1982) 8,70 9,30 10,30 11,30 12,50 8,90 9,40 10,30 11,50 12,70 9,00 9,60 10,50 11,70 13,10 Trabalhadores Empregados 100 200 300 400 500
O exemplo acima fornece os salrios mdios Y, e o nmero de trabalhadores empregados, X, para 30 empresas de uma indstria. Fazendo a regresso de Y em relao a X para a amostra inteira, obtemos: ) Y = 7,5 + 0,009X R2 = 0,90 t (40,27) t (16,10) Os resultados da regresso de Y com relao a X para as 12 primeiras e para as 12 ltimas so:
) Y=
Desde que VR2/VR1 = 3,095/0,507 = 6,10 excede F10,10 = 2,97 ao nvel de significncia de 5% a hiptese de Heterocedasticidade
174
t (14,43)
R2 = 0,99 t (76,58)
O coeficiente de declividade agora dado pelo intercepto (isto 0,008) e, este menor do que do ajustamento (que 0,009).
Aplicao do teste de Glejser, segundo Matos (2000) Com os dados da demanda de energia eltrica constantes da tabela abaixo, calcula-se os resduos da regresso. Ano 1981 1982 1983 1984 1985 Q 69 76 81 90 94 T 143 134 117 111 109 Y 84 85 82 86 93 D 0 0 0 0 1 Fonte: Matos(2000) Calculando a regresso de Q = temos:
Regression Analysis: Q versus T; Y; D
The regression equation is Q = 5,7 - 0,264 T + 1,27 Y - 0,60 D Predictor Constant T Y D Coef 5,73 -0,26447 1,2660 -0,596 SE Coef 40,49 0,09871 0,4491 8,594 T 0,14 -2,68 2,82 -0,07 P 0,892 0,037 0,030 0,947
1988 1989 1990 108 113 115 122 85 90 104 107 102 1 1 1
no MINITAB
S = 5,03671
R-Sq = 93,2%
R-Sq(adj) = 89,8%
Analysis of Variance Source Regression Residual Error Total DF 3 6 9 SS 2088,69 152,21 2240,90 MS 696,23 25,37 F 27,44 P 0,001
175
Source T Y D Obs 1 2 3 4 5 6 7 8 9 10
DF 1 1 1
Seq SS 1079,49 1009,08 0,12 Fit 74,25 77,90 78,60 85,25 94,04 105,29 100,56 104,53 118,11 110,46 SE Fit 3,01 2,66 2,88 3,02 4,40 2,31 3,78 2,76 3,77 2,66 Residual -5,25 -1,90 2,40 4,75 -0,04 -5,29 2,44 3,47 -5,11 4,54 St Resid -1,30 -0,44 0,58 1,18 -0,02 -1,18 0,73 0,82 -1,53 1,06
Q 69,00 76,00 81,00 90,00 94,00 100,00 103,00 108,00 113,00 115,00
Com os dados da varivel explicativa (T) e dos resduos admitindo-se, a priori, que a varincia dos resduos seja correlacionada aos valores da tarifa (T), solicita-se testar a presena ou no de Heterocedasticidade, utilizando-se o procedimento de Glejser e um nvel de significncia de 5%. Soluo - A estimao da equao |u| = os seguintes resultados:
Regression Analysis: Residual versus T
The regression equation is Residual = 6,57 - 0,0265 T Predictor Constant T Coef 6,567 -0,02655 SE Coef 3,546 0,03049 T 1,85 -0,87 P 0,101 0,409
1T+
v (c = 1) fornece
S = 1,79966
R-Sq = 8,7%
R-Sq(adj) = 0,0%
Analysis of Variance Source Regression Residual Error Total DF 1 8 9 SS 2,455 25,910 28,365 MS 2,455 3,239 F 0,76 P 0,409
Obs 1 2 3 4 5 6 7 8 9
Residual 5,250 1,900 2,400 4,750 0,040 5,290 2,440 3,470 5,110
Fit 2,770 3,009 3,461 3,620 3,673 3,912 2,930 3,328 4,310
SE Fit 1,031 0,816 0,573 0,581 0,596 0,726 0,884 0,610 1,072
Residual 2,480 -1,109 -1,061 1,130 -3,633 1,378 -0,490 0,142 0,800
St Resid 1,68 -0,69 -0,62 0,66 -2,14R 0,84 -0,31 0,08 0,55
176
10 90 4,540 4,177 0,946 0,363 0,24
Pelos testes F e t, a hiptese de relao significativa entre os valores absolutos dos resduos ui e a varivel tarifa (T) rejeitada, ao nvel de significncia de 5%. Nesse nvel, o termo constante , tambm, estatisticamente nulo. Portanto, aceita-se a hiptese de ausncia de Heterocedasticidade. Isso era, de certa forma, esperado em virtude de se tratar de srie histrica, em que tal problema pouco freqente. Aplicao de testes e correo da Heterocedasticidade (outro exempo) Com os dados a seguir sobre produo (P) e mo de obra utilizada (M) no processo produtivo de oito empresas industriais, solicita-se; a) Estimar a equao de produo (forma linear) e testar a presena de Heterocedasticidade pelo procedimento de Glejser, ao nvel de produtividade 5%. b) Fazer a correo da Heterocedasticidade. Produo (P) Mo-de-obra(M) Soluo: a) Equao estimada e teste de Glejser
Regression Analysis: P versus M
The regression equation is P = 0,91 + 0,994 M Predictor Constant M Coef 0,911 0,9935 SE Coef 2,817 0,4518 T 0,32 2,20 P 0,757 0,070
3 2
5 4
3 15 3 3 10 9
8 10 5 6 7 4
S = 3,43687
R-Sq = 44,6%
R-Sq(adj) = 35,4%
177
Analysis of Variance Source Regression Residual Error Total Obs 1 2 3 4 5 6 7 8 M 2,0 4,0 3,0 10,0 9,0 6,0 7,0 4,0 DF 1 6 7 SS 57,13 70,87 128,00 MS 57,13 11,81 F 4,84 P 0,070
0,1 0,1
1,13 1,13
2,13 2,13
0,11 0,11
Com esses resultados, rejeita-se a hiptese nula de ausncia de Heterocedasticidade aceitando-se, por conseguinte, a presena do problema visto que os parmetros estimados so estatisticamente diferentes de zero ao nvel de 5%. b) Correo da heterocedasticidade 2 Admitindo-se que a varincia dos resduos, i , diretamente proporcional a M poder-se- escrever:
178
Assim, dividindo-se a equao original P=b+cM+v por M, obtm-se a seguinte forma transformada:
P 1 v =b +c+ M M M
Se P/M = W, 1/M=Z e v/M=u, obtm-se: W=b Z+c+u. Com essa transformao, note-se que var(u)= . Como o uma constante, est assegurada a homocedasticidade.
2 2
Dessa forma, as variveis transformadas so: W Z 1,50 0,50 1,25 0,25 1,00 0,33 1,50 0,10 0,33 0,11 1,33 0,17 1,43 0,14 1,25 0,25
S = 0,402677
R-Sq = 7,5%
R-Sq(adj) = 0,0%
Analysis of Variance Source Regression Residual Error Total Obs 1 2 3 4 5 6 7 8 Z 0,500 0,250 0,330 0,100 0,110 0,170 0,140 0,250 DF 1 6 7 SS 0,0788 0,9729 1,0517 Fit 1,411 1,214 1,277 1,095 1,103 1,150 1,127 1,214 MS 0,0788 0,1621 F 0,49 P 0,512
179
R denotes an observation with a large standardized residual.
= 1 ,02 + 0 ,77 Z W
Utilizando-se a notao original e multiplicando-se a equao estimada por 1/M e acrescentando-se as estatsticas t, obtm-se os seguintes resultados:
S = 0,217951
R-Sq = 31,8%
R-Sq(adj) = 20,4%
180