You are on page 1of 32

UNIVERSIDADE DE SO PAULO

FACULDADE DE ECONOMIA, ADMINISTRAO E CONTABILIDADE


DEPARTAMENTO DE CONTABILIDADE
PROGRAMA DE PS GRADUAO EM CONTROLADORIA E CONTABILIDADE

MARLOS FERNANDES

Estudo das consequncias das violaes dos pressupostos clssicos de estimao da


regresso linear por mnimos quadrados ordinrios por meio das simulaes de Monte
Carlo

Docente: Prof. Dr. Marcelo Sanches Pagliarussi

RIBEIRO PRETO
2017
SUMRIO

1 Introduo ...................................................................................................................... 3
2 A violao investigao dos pressupostos estatstico na literatura acadmica .............. 5
2.1 Modelo clssico de regresso linear simples e mltipla ......................................... 6
3 Metodologia ................................................................................................................. 10
5 Anlise dos resultados ................................................................................................. 12
5.1 Anlise das propriedades assintticas ................................................................... 12
5.2 Violao do pressuposto de homocedasticidade ..................................................... 7
5.3 Violao do pressuposto de distribuio normal dos resduos ............................... 7
5.4 Violao da premissa de no correlao entre as variveis independentes ............ 7
5.5 Violao do pressuposto do termo de erro com mdia zero ................................... 9
5.6 Variveis omitidas .................................................................................................. 7
6 Concluses ................................................................................................................... 10
Referncias ..................................................................................................................... 11
1 Introduo

Atualmente, o paradigma dominante em pesquisas contbeis caracterizado,


conforme Oler, Oler e Skousen (2010), por sua perspectiva positivista, que possui razes
em economia e finanas, abrangendo as consequncias da informao contbil sobre
eventos econmicos.
Embora existam mtodos cientficos alternativos, Abdel-Khalik e Ajinkya (1979)
sustentam que a pesquisa positiva-quantitativa a ideal para a formulao de estudos
contbeis, delineando que o mtodo cientfico principia de uma teoria slida, expressa em
modelos matemticos e derivada, usualmente, de uma reviso da literatura acadmica
concernente ao fenmeno estudado.
Ao analisar, entre 2002 e 2007, 1055 artigos publicados em 11 revistas acadmicas
de alta influncia e reputao, Brow e Jones (2015) do contorno a esse paradigma
dominante na contabilidade. Esses autores apuraram que 74% dos artigos examinados
utilizaram teorias baseadas em economia e matemtica, teorias positivas de contabilidade,
outras teorias econmicas, teorias financeiras e teorias estatsticas.
O uso de modelos de regresso linear, quando utilizados corretamente e sem
violao de seus pressupostos, permite confirmar ou rejeitar hipteses com preciso,
fornecendo ao pesquisador informaes sobre os dados analisados como poucas outras
tcnicas podem fazer (COHEN et al., 2002; NETER et al., 2004; WEINZIMMER,
MONE E ALWAN, 1994).
Entretanto, a violao dos pressupostos podem expressivamente influir o exame de
erros do tipo I e II, conforme Osborne e Waters (2002), que defendem que tais violaes
resultam muitas vezes na superestimao ou subestimao das medidas dos parmetros e,
portanto, no efeito das variveis independentes sobre a varivel dependente.
Mesmo sendo isso um conhecimento comum entre pesquisadores, como salienta
Petersen (2008), observa-se, segundo o mesmo autor, que mais de dois quintos dos artigos
publicados, entre 2001 e 2004, no Journal of Finance, Journal of Financial Economics e
Review of Financial Studies no realizaram quaisquer ajustes nos erros padro para
possveis dependncias nos resduos.
Isso levanta dvidas razoveis sobre parte relevante dos trabalhos publicados nessas
supracitadas revistas e, por serem trs dos mais prestigiados e influentes peridicos, sob
o desenvolvimento cientfico em finanas. Diante do exposto, o presente trabalho tem por

3
objetivo geral examinar, por meio de simulaes de Monte Carlo, os impactos de
possveis violaes dos pressupostos do modelo estatstico.
Para tanto, so objetivos especficos desta pesquisa verificar os impactos, em
regresses lineares simples e mltiplas das violaes ao pressupostos (i) de distribuio
normal do resduos, (ii) com varincia constante, (iii) e termo de erro com mdia igual a
zero. Para as regresses lineares mltiplas ainda verificado os impactos advindos da (iv)
multicolinearidade.
A pesquisa foi segmentada em 5 sees, sendo que na primeira delas foram
estipulados os problemas de pesquisa e seus objetivos geral e especficos; na seo 2 so
expostos artigos que referenciam o tema da violao dos pressupostos estatsticos e as
teorias relacionadas a simulao de Monte Carlo e as anlises de regresses simples e
multivariadas e; na terceira seo so apresentados os procedimentos metodolgicos
adotados; a seo 4 apresenta os resultados advindos da simulao de Monte Carlo; e, por
fim, a quinta seo demonstra sucintamente as concluses encontradas no presente
trabalho.

4
2 A violao investigao dos pressupostos estatstico na literatura acadmica

Embora haja um uso extensivo da utilizao de mtodos quantitativos,


predominantemente de regresses lineares, so escassos os estudos que examinam se os
pesquisadores verificam os pressupostos subjacentes s suas estratgias analticas de
dados, como defendem Weinzimmer, Mone e Alwan (1994). De acordo com esses
autores, apenas 9,5% dos artigos publicados pela Academy of Management Journal e
Administrative Science Quarterly, entre 1986 e 1990, apresentaram diagnsticos de
validao dos testes economtricos.
Em uma segunda anlise, a fim de verificar se os pesquisadores realizam os testes
de validao, ainda que no os publiquem, Weinzimmer, Mone e Alwan (1994) enviaram
questionrios autores de pesquisas baseadas em regresses e que tenham publicado seus
artigos, entre 1989 e 1992, no Academy of Management Journal, Administrative Science
Quarterly, Journal of Applied Psychology, Journal of Management, e Strategic
Management Journal. Constatou-se que em menos um tero de seus trabalhos os
pesquisadores avaliam a aleatoriedade e as propriedades distributivas dos resduos; e que
a validao dos pressupostos estatsticos no claramente compreendida por
pesquisadores (WEINZIMMER, MONE E ALWA, 1994).
Mais recentemente, Petersen (2008), ao analisar artigos publicados no Journal of
Finance, Journal of Financial Economics e Review of Financial Studies, entre 2001 e
2004, observou que as formas com as quais pesquisadores abordam eventuais desvios nos
erros-padro variam amplamente e, em muitos casos, so incorretas. De acordo com o
autor, 42% dos trabalhos analisados e que incluem uma regresso em dados de painel,
no ajustaram os erros padro para possveis dependncias nos resduos.
Estudos realizados em outras reas do conhecimento tambm demonstram
preocupao sobre a validao de pressupostos estatsticos em pesquisas cientficas.
Hoekstra, Kiers e Johnson (2012) investigaram se estudantes de doutorado (Ph.D) do
departamento de psicologia, com pelo menos 2 anos de experincia em conduo de
pesquisas cientficas, verificam a validao dos pressupostos estatsticos. Observou-se
que raramente so conduzidos testes de validao e que os estudantes tem pouco
conhecimento sobre os pressupostos (HOEKSTRA, KIERS E JOHNSON, 2012).
No Brasil, Teixeira et al. (2015) analisaram, entre 2009 e 2011, o uso de estatstica
em artigos cientficos publicados em peridicos da rea de educao fsica, cuja
classificao Qualis Capes seja igual ou superior a B2. Os autores constataram que

5
aproximadamente 43,3% dos 872 artigos analisados no atenderam aos pressupostos
bsicos para a utilizao de testes paramtricos, e que essa ocorrncia tende a ser
independente da titulao dos autores, da regio de afiliao ou mesmo da revista de
publicao.
Portanto, observa-se um cenrio em que parte significativa das pesquisas elaboradas
em contabilidade, tal como ocorre em outras reas do conhecimento, embora faam uso
de modelos estatsticos, no realizam testes de verificao de seus pressupostos.

2.1 Modelo clssico de regresso linear simples e mltipla

Diversas cincias, tais como a biologia e economia, so dedicadas ao estudo de


diversas relaes inexatas, afetadas por fatores aleatrios. A regresso linear uma
tcnica quantitativa de abordagem para algumas dessas relaes. Gujarati e Porter (2011)
explicam que a regresso visa estimar, por meio de uma relao causal, o valor mdio de
uma populao (varivel dependente) com base em valores amostrais conhecidos
(variveis independentes).
As regresses lineares podem ser subdivididas de acordo com a especificao do
modelo, podendo eles serem simples, nos quais apenas uma varivel dependente
utilizada para explicar o comportamento da varivel dependente, ou multivariados, de
forma que dois ou mais regressores so designados para prever as oscilaes da varivel
explicada.
Segundo Wooldridge (2006), a principal dificuldade inerente a utilizao da
regresso linear simples est atrelada a frequentemente irreal premissa de que todos os
outros fatores que afetam a varivel dependente no apresentam mais que correlaes
fracas com a varivel dependente.
Ainda conforme Wooldridge (2006), a regresso linear mltipla, ao controlar de
forma explcita os diversos outros fatores que afetam a varivel dependente, mais
receptiva anlise ceteris paribus. Ainda segundo o mesmo autor, em parte por isso, a
regresso linear mltipla a tcnica mais utilizada para a anlise emprica em economia
e outras cincias sociais.
De acordo com Kennedy (2004), o principal critrio para avaliar a confiabilidade
dos estimadores advindos das regresses o da gerao dos menores erros possveis. O
autor ainda explica que o mtodo mais aplicado para essa estimao o dos mnimos
quadrados ordinrios (MQO), no qual so minimizadas a soma do quadrado dos erros.
6
Entretanto, a tcnica de MQO parte de algumas premissas fundamentais obteno
dos melhores estimadores no-viesados (BLUE). Os pressupostos que devem ser
observados nas regresses lineares so de que os modelos realmente podem ser expressos
por uma funo linear mais um termo de erro; que as observaes do erro so
independentes e distribudas por normal com mdia 0 e varincia constante; que as
variveis independentes so fixas em amostras repetidas; que o nmero de observaes
maior que o nmero de variveis independentes; e que entre tais variveis no existam
relaes lineares. (KENNEDY, 2004).
A violao dos supracitados pressupostos estatsticos, se desconsiderados, podem
impactar significativamente a estimao dos modelos lineares. De acordo com
Weinzimmer, Mone e Alwan (1994), a transgresso das premissas estatsticas podem
gerar modelos mal especificados e impreciso das concluses, acarretando em efeitos
disfuncionais na produo do conhecimento cientfico.
Conforme Keselman et al. (1998), apenas nos casos em que os erros aleatrio so
independentes e tm distribuio normal com mdia 0 e varincia constante, o teste F
pode ser interpretado de forma vlida, de modo que a violao dessas premissas faz com
que as probabilidades significantes que dele resultem apresentem distines em relao
ao seu valor real, podendo at mesmo serem desprovidas qualquer valor.
Dentre as premissas necessrias estimao por mnimos quadrados ordinrios,
Wooldridge (2006) explica que a premissa homocedasticidade, ou seja, de que a varincia
do termo de erro constante, em nada se refere a estimao de parmetros no-viesados.
Segundo o mesmo autor, a heterocedasticidade, que a designao da transgresso dessa
premissa, advm principalmente de o termo de erro ser funo do conjunto de variveis
independentes.
Gujarati e Porter (2011) elucidam que a heterecedasticidade implica em uma
estimao no confivel, afirmando que essa confiabilidade advm da proximidade dos
valores estimados com seu valor mdio, e parte desses valores esto distantes da mdia.
Por sua vez, a violao da premissa de normalidade dos resduos, segundo
Rodrigues et al. (2011), no deturpa a estimao por mnimos quadrados ordinrios,
afetando, no entanto, a definio dos intervalos de confiana e os testes de significncia.
Bussab e Morettin (2002) explicam que o teste t fundamentado no pressuposto de
normalidade e que a transgresso dessa premissa altera as probabilidades de erros do tipo
I e II.

7
A transgresso da premissa de normalidade dos resduos, entretanto, tende a ser
amenizada em grandes amostras, como rege o teorema do limite central. Hoffmann (2006)
explica que em caso de um grande nmero de observaes, desde que nenhuma delas seja
dominante, a distribuio das variveis tende a uma normal.
Em funo disso, os estimadores passam a apresentar propriedades estatsticas
desejveis, denominadas de propriedades das grandes amostras ou propriedades
assintticas, conforme ocorre o aumento da amostra, como elucidam Gujarati e Porter
(2011). Os autores ainda explicam que, em funo disso, ainda que algumas premissas do
modelo clssico de regresso linear sejam violadas, o crescimento amostral pode gerar
estimadores consistentes.
Entretanto, h debilidades na argumentao do uso do teorema do limite central
como forma de correo de erros com distribuio no normal, como aponta Wooldridge
(2006). De acordo com o autor, o teorema do limite central assume que todos os fatores
no observados afetam a varivel dependente de um modo separado e aditivo. Contudo,
no h garantias que isso ocorra, de modo que caractersticas inerentes aos fatores no
observados podem implicar na no aplicao do teorema do limite central
(WOOLDRIDGE, 2006).
Nos casos de regresses lineares multivariadas, h ainda a premissa de que as
variveis independentes apresentam no mais que correlaes fracas entre si, como
explicam Rodrigues et al. (2011). Segundo esses autores, a multicolinearidade, ou seja, a
presena de correlaes mdias e fortes entre variveis dependentes, distorce os
parmetros de inclinao, prejudicando habilidade de previso do modelo ao dificultar a
distino dos efeitos das variveis independentes.
Por fim, o pressuposto de que o valor mdio do termo de erro ser igual a zero
implica na estimao no-viesada do parmetro de intercepto (0) e/ou dos parmetros de
inclinao (1, 2, ..., n), de acordo com Wooldridge (2006). Gujarati e Porter (2011)
explicam que a no transgresso dessa premissa requer que o modelo de regresso esteja
corretamente especificado, no havendo outros fatores que sistematicamente afetem a
varivel dependente.
Ainda conforme Gujarati e Porter (2011), para os casos de regresses lineares
multivariadas, o pressuposto de que o valor mdio do termo de erro ser igual a zero
tambm implica na preposio de que a varivel independente e o erro so no
correlacionados. Segundo Wooldridge (2006), a correlao entre uma varivel

8
independente e um varivel omitida do modelo resulta em vis do parmetro de
inclinao, tal como apresentado no quadro a seguir.

Quadro 1 - Vis no intercepto de inclinao (b1) quando x2 omitida


Corr (x1, x2) > 0 Corr (x1, x2) < 0
2 > 0 Vis positivo Vis negativo
2 < 0 Vis negativo Vis negativo
Fonte: Wooldridge (2006).

Em face do exposto, a utilizao da tcnica de simulao de Monte Carlo ter por


finalidade, ao longo do presente trabalho, viabilizar a execuo do objetivo central
estipulado e caracterizar os distintos impactos advindos das possveis violaes dos
pressupostos clssicos de normalidade dos resduos, varincia constante e mdia zero e
ausncia de correlaes maiores que fraca entre as variveis independentes ou entre uma
varivel independente e o termo de erro.

9
3 Metodologia

Kennedy (2008) define a simulao de Monte Carlo como sendo uma simulao
computacional realizada no intuito de elucidar as propriedades da amostra, sendo um
importante meio para a compresso dos modelos de regresso lineares. O mesmo autor
ainda explica que as simulaes de Monte Carlo so fundamentas em quatro etapas, como
representadas na figura 1.

Figura 1 Etapas da simulao de Monte Carlo.

Modelo de
gerao de dados

Criao de diferentes
conjuntos de dados

Estimar diferentes Estimar diferentes


valores de * valores de **

Estimar a distribuio Estimar a distribuio


amostral de * amostral de **

Comparar

Fonte: Kennedy (2008).

A primeira dessas etapas a gerao de dados que incorporem os efeitos de um erro


estocstico. Posteriormente, com base nos resultados advindos da primeira etapa, so
gerados dados artificialmente. Em um terceiro momento so geradas repeties das
estimativas. Por fim, so calculadas as propriedades das estimaes geradas.

10
Com base nas etapas da simulao de Monte Carlo apresentadas por Kennedy
(2008), foram gerados dois modelos de construes de dados, designados para simular,
respectivamente, equaes lineares simples e multivariadas.

y(i) = 0 + 1 X1 + (i) (1)


y(i) = 0 + 1 X1 + 2 X2 + (i) (2)

Para cada uma dessas equaes foram elaboradas trs planilhas com amostragem
de 20, 40, e 80 observaes (i), sendo que para cada uma das trs planilhas foram
estimadas mil repeties da estimao da varivel dependente (). As variveis
independentes e os parmetros populacionais e foram estipulados arbitrariamente, de
modo que os valores Beta 1, Beta 2 e Beta 3 foram fixados, respectivamente, em 50, 0,25
e 0,35. O processo estocstico para estimao das variveis dependentes, e tambm dos
parmetros amostrais necessrios a sua mensurao, fundamentado na estimao do
erro, cuja probabilidade aleatria.
O processo acima descrito foi repetido de modo a gerar estimativas com a presena
e ausncia de violaes aos pressupostos estatsticos. Dentre as premissas transgredidas,
foram estimadas regresses com erros tendo distribuio diferente da normal; com erros
diferentes de zero e com varincia no constante. Exclusivamente para a equao 2 ainda
foram realizadas regresses com correlaes mdias (0,4) e fortes (0,8) entre as variveis
dependentes e estimaes com varivel omissa.
A significncia estatstica individual dos parmetros estimados e o teste F foram
realizados em um intervalo de confiana de 95%. As estimao dos modelos ocorrero
por meio da aplicao do software Excel.

11
5 Anlise dos resultados

Ao longo dessa seo sero analisados os principais resultados advindos das


simulao de Monte Carlo com violaes dos pressupostos clssicos da estimao de
regresses lineares pelo mtodo dos mnimos quadrados ordinrios.
Nesse intuito e a fim de facilitar a compreenso dos resultados, a presente seo
foi subdividida em seis grupos, sendo eles, respectivamente, anlise das propriedades
assintticas; violao do pressuposto de homocedasticidade; violao do pressuposto de
distribuio normal dos resduos; violao da premissa de no correlao entre as
variveis independentes; violao do pressuposto do termo de erro com mdia zero; e,
por fim, variveis omitidas.

5.1 Anlise das propriedades assintticas

As propriedades assintticas puderam ser notadas nas diversas simulaes de


transgresses das premissas do modelo clssico de regresso linear. Como enunciado
previamente por Gujarati e Porter (2011), conforme ocorre o crescimento da amostra,
estipuladas em 20, 40 e 80 observaes, os estimares tenderam a possuir propriedades
estatsticas desejveis, tornando-se mais consistentes. As tabelas 1 e 2, presentes nas
pginas a seguir, demonstram os resultados apurados.
Independentemente da regresso linear ser simples ou multivariada ou at mesmo
das violaes aos pressupostos estatsticos clssicos, constatou-se que, de modo
consistente, ocorreram quedas substanciais na varincia dos estimadores e no aumento da
quantidade de parmetros significativos, sejam eles analisados individualmente pelo teste
t, ou enquanto grupo pelo teste F, a medida que aumentaram o nmero de observaes.
O grau de ajuste dos modelos, mensurado por meio do R, demonstrou, entretanto,
uma relao inversa com o tamanho amostral, de modo que o crescimento do nmero de
observaes consistentemente implicou em decrscimo do R apurado.
De tal modo sendo, conclui-se que, em todos os modelos analisados, a soma dos
quadrados total apresentou crescimento superior ao da soma dos quadrados explicados
pela reta de regresso. Portanto, os aumentos amostrais implicaram em maiores
dificuldades de prever os resultados individuais sobre a varivel dependente com
preciso.

12
Tabela 1 - Regresso linear simples
Sem violaes Heterocedasticidade Distribuio uniforme dos Erro mdio = 3
resduos
20 40 80 20 40 80 20 40 80 20 40 80
F SIG 681 921 999 402 577 848 586 859 989 677 928 999
E(B0) 49,71117 50,33134 50,60442 49,09173 50,35864 50,46188 49,18704 49,35423 49,70667 52,80195 52,59055 53,13362
VAR(B0) 324,05 145,63 74,83 470,90 258,16 116,90 425,80 199,92 111,60 326,89 145,92 79,72
E(B1) 0,25159 0,24728 0,24677 0,25882 0,24677 0,24737 0,25501 0,25388 0,25086 0,25136 0,25238 0,24890
VAR(B1) 0,01327 0,00580 0,00306 0,02961 0,01606 0,00750 0,01699 0,00803 0,00427 0,01325 0,00581 0,00318
B0 IC 973 972 970 996 995 994 976 983 968 966 965 943
B1 IC 970 970 975 986 975 978 972 979 979 978 981 967
B0 SIG 753 988 998 369 735 979 608 912 996 808 983 1000
B1 SIG 548 874 993 286 470 780 447 783 976 552 888 994
R 0,24245 0,21623 0,20302 0,14087 0,11098 0,10068 0,19632 0,17881 0,16644 0,23971 0,21882 0,20741
Fonte: Elaborado pelo autor.

Tabela 2 - Regresso linear multivariada


Sem violaes Correlao 0,4 entre as Correlao 0,8 entre as Varivel omitida e Varivel omitida e Varivel omitida e
variveis indepedentes variveis indepedentes correlao zero entre var. correlao 0,4 entre var. correlao 0,8 entre var.
independente e erro independente e erro independente e erro
20 40 80 20 40 80 20 40 80 20 40 80 20 40 80 20 40 80
F SIG 849 990 999 923 999 1000 978 1000 1000 603 972 993 874 999 1000 996 1000 1000
E(B0) 49,341 49,389 50,823 50,699 50,260 49,936 50,288 49,417 50,066 91,813 92,024 91,661 75,222 74,025 71,241 58,141 59,175 58,381
VAR(B0) 606,605 307,224 144,653 455,767 230,834 99,622 330,364 184,943 87,434 314,347 154,393 78,444 321,221 148,027 77,591 283,838 163,755 73,149
E(B1) 0,256 0,246 0,245 0,250 0,248 0,250 0,252 0,249 0,250 0,251 0,250 0,252 0,361 0,361 0,353 0,478 0,469 0,473
VAR(B1) 0,013 0,006 0,003 0,015 0,008 0,004 0,036 0,018 0,008 0,013 0,006 0,003 0,013 0,006 0,003 0,011 0,006 0,003
E(B2) 0,347 0,358 0,349 0,344 0,351 0,350 0,345 0,353 0,349 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
VAR(B2) 0,020 0,010 0,004 0,022 0,013 0,007 0,056 0,028 0,014 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
B0 IC 932 956 957 938 956 957 948 940 951 511 151 11 806 638 419 951 902 888
B1 IC 950 944 948 948 944 948 955 945 954 977 975 965 895 814 612 563 264 28
B2 IC 943 947 962 961 951 946 940 947 943 0 0 0 0 0 0 0 0 0
B0 SIG 491 781 994 622 911 999 713 945 1000 995 1000 1000 959 1000 1000 866 991 1000
B1 SIG 594 858 993 480 800 983 249 443 760 439 816 984 785 985 1000 985 999 1000
B2 SIG 655 948 998 572 877 986 296 558 842 0 0 0 0 0 0 0 0 0
R 0,431 0,392 0,369 0,493 0,465 0,437 0,555 0,527 0,514 0,193 0,175 0,170 0,316 0,306 0,296 0,476 0,456 0,451
Fonte: Elaborado pelo autor.

7
5.2 Violao do pressuposto de homocedasticidade

Um dos pressupostos para estimao da regresso linear por mnimos quadrados


ordinrios de que os erros se distribuem por uma normal com varincia constante. Os
casos de heterocedasticidade tm por caracterstica que a varincia da distribuio dos
resduos uma funo dos valores de uma ou mais variveis independentes. A tabela 4
apresenta os resultados obtidos da simulao de Monte Carlo para regresses lineares
simples na presena de heterocedasticidade.

Tabela 3 - Regresso linear simples com heterocedasticidade


Sem violaes dos pressupostos Heterocedasticidade
20 40 80 20 40 80
F SIG 681 921 999 402 577 848
E(B0) 49,7112 50,3313 50,6044 49,0917 50,3586 50,4619
VAR(B0) 324,0521 145,6296 74,8331 470,9025 258,1553 116,9010
E(B1) 0,2516 0,2473 0,2468 0,2588 0,2468 0,2474
VAR(B1) 0,0133 0,0058 0,0031 0,0296 0,0161 0,0075
B0 IC 973 972 970 996 995 994
B1 IC 970 970 975 986 975 978
B0 SIG 753 988 998 369 735 979
B1 SIG 548 874 993 286 470 780
R 0,24245 0,21623 0,20302 0,14087 0,11098 0,10068
Fonte: Elaborado pelo autor.

Observa-se nas tabelas anteriores que, embora os parmetros sejam no viesados,


a varincia deles teve grande incremento. O parmetro de intercepto e de inclinao
estimados tiveram crescimento mdio de suas varincias, respectivamente, de 59,60% e
148,53%, em relao ao caso de no violao dos pressupostos. Essa ascenso da
disperso dos parmetros representada no grfico abaixo.

Grfico 1 Boxplot comparativos dos parmetros com e sem heterocedasticidade.

Beta 0 Beta 1
140 1
120
0.8
100
0.6
80
60 0.4
40
0.2
20
0 0
20SV 20Het 40SV 40Het 80SV 80Het 20SV 20Het 40SV 40Het 80SV 80Het
-20 -0.2
-40
-0.4

Fonte: Elaborado pelo autor

7
Tambm os grficos 2, 3, 4 e 5, apresentados nas duas pginas em sequncia,
demonstram os impactos do consequente aumento da varincia sobre os parmetros. Tm-
se, nesses grficos, que os eixos das abcissas tendem a ser maiores na presena de
heterocedasticidade, revelando que uma maior quantidade de valores so assumidos pelos
parmetros. O eixo das ordenadas, entretanto, tende a ser menor, o que implica que
reduzida a quantidade parmetros que assumem valores prximos aos encontrados.
Como consequncia do aumento sistemtico da varincia, observa-se na tabela 4
expressivos decrscimos dos parmetros estimados. Tomando como referncia os
resultados advindos da no transgresso das premissas clssicas, foram reduzidos em,
aproximadamente, 26,17% os parmetros de intercepto que impactam de modo relevante
a varivel independente, em comparao com os resultados advindos da no violao das
premissas. Tambm nos parmetros de inclinao essa reduo foi cerca de 38,49%. Em
funo desses resultados, tambm o teste F, presente na tabela 4, revela que a quantidade
conjunta de parmetros que impactam a varivel dependente apresentou queda mdia
aproximada de 31,14%.
Esses resultados esto de acordo com o previsto por Gujarati e Porter (2011).
Segundo esses autores, o aumento da varincia traduz um distanciamento dos valores
estimados de seu valor mdio, o que torna a estimao no confivel.
A tabela 4 ainda revela que o grau de ajuste da estimao, mensurado pelo R,
tambm teve queda mdia de cerca de 46,99% na presena de hetrocedasticidade em
relao a no violao dos pressupostos. Isso demonstra que a violao do pressuposto
de homocedasticidade resulta em aumento dos resduos e reduo do poder preditivo da
estimao.

8
Grfico 2 - Beta 0 sem violao dos pressupostos
Beta 1 - 20 Beta 1 - 40 Beta 1 - 80
120 0.025 100 0.035 100 0.05
90 90 0.045
100 0.03
0.02 80 80 0.04
70 0.025 70 0.035
80
0.015 60 0.02 60 0.03
60 50 50 0.025
0.01 40 0.015
40 0.02
40 30 0.01 30 0.015
0.005 20 20 0.01
20 0.005
10 10 0.005
0 0 0 0 0 0
-20.00 30.00 80.00 130.00 0.00 20.00 40.00 60.00 80.00 100.00 0.00 20.00 40.00 60.00 80.00 100.00

Fonte: Elaborado pelo autor

Grfico 3 - Beta 0 com heterocedasticidade


Beta 1 - 20 Beta 1 - 40 Beta 1 - 80
80 0.02 90 0.03 100 0.04
70 0.018 80 90 0.035
0.016 0.025 80
60 70 0.03
0.014 70
60 0.02
50 0.012 60 0.025
50
40 0.01 0.015 50 0.02
40
30 0.008 40 0.015
0.006 30 0.01 30
20 0.01
0.004 20 20
0.005
10 0.002 10 10 0.005
0 0 0 0 0 0
-50.00 0.00 50.00 100.00 150.00 0.00 20.00 40.00 60.00 80.00 100.00 120.00 0.00 20.00 40.00 60.00 80.00 100.00

Fonte: Elaborado pelo autor

7
Grfico 4 - Beta 1 sem violao dos pressupostos
Beta 2 - 20 Beta 2 - 40 Beta 2 - 80
100 4 100 6 100 8
90 3.5 90 90
5 7
80 80 80
3 6
70 70 4 70
60 2.5 60 5
60
50 2 50 3 50 4
40 1.5 40 40
2 3
30 30 30
1 2
20 20 1 20
10 0.5 10 10 1
0 0 0 0 0 0
-0.25 -0.05 0.15 0.35 0.55 0.75 -0.10 0.00 0.10 0.20 0.30 0.40 0.50 0.05 0.15 0.25 0.35 0.45 0.55

Fonte: Elaborado pelo autor

Grfico 5 - Beta 1 com heterocedasticidade


Beta 2 - 20 Beta 2 - 40 Beta 2 - 80
90 2.5 90 3.5 100 5
80 80 90 4.5
3
70 2 70 80 4
2.5 70 3.5
60 60
1.5 60 3
50 50 2
50 2.5
40 40 1.5
1 40 2
30 30
1 30 1.5
20 0.5 20 20 1
10 10 0.5
10 0.5
0 0 0 0 0 0
-0.40 -0.20 0.00 0.20 0.40 0.60 0.80 1.00 -0.20 0.00 0.20 0.40 0.60 -0.20 0.00 0.20 0.40 0.60

Fonte: Elaborado pelo autor

8
5.3 Violao do pressuposto de distribuio normal dos resduos

Observa-se, na tabela a seguir, os resultados advindos da estimao com


distribuio uniforme dos resduos, transgredindo a premissa de distribuio normal.

Tabela 4 - Regresso linear simples com distribuio uniforme dos resduos


Sem violaes dos pressupostos Distribuio uniforme dos resduos
20 40 80 20 40 80
F SIG 681 921 999 586 859 989
E(B0) 49,7112 50,3313 50,6044 49,1870 49,3542 49,7067
VAR(B0) 324,0521 145,6296 74,8331 425,8025 199,9205 111,5985
E(B1) 0,2516 0,2473 0,2468 0,2550 0,2539 0,2509
VAR(B1) 0,0133 0,0058 0,0031 0,0170 0,0080 0,0043
B0 IC 973 972 970 976 983 968
B1 IC 970 970 975 972 979 979
B0 SIG 753 988 998 608 912 996
B1 SIG 548 874 993 447 783 976
R 0,24245 0,21623 0,20302 0,19632 0,17881 0,16644
Fonte: Elaborado pelo autor.

Embora os resultados apontem que os parmetros estimados so no-viesados, a


perda de propriedades assintticas implicou em relevantes aumentos da varincia dos
estimadores. Os parmetros de intercepto e inclinao tiveram incrementos mdios de
suas varincias de 39,27% e 35,40% em relao aos valores estimados sem as
transgresses dos pressupostos, como demonstrado no grfico 6.

Grfico 6 - Boxplot comparativos dos parmetros com e sem distribuio normal


Beta 0 Beta 0
140 1

120 0.8
100
0.6
80
60 0.4

40 0.2
20
0
0 20SV 20Uni 40SV 40Uni 80SV 80Uni
20SV 20Uni 40SV 40Uni 80SV 80Uni -0.2
-20
-40 -0.4

Fonte: Elaborado pelo autor.

7
Os grficos 7, 8, 9 e 10, presentes nas duas prximas pginas, revelam o aumento
da varincia sobre os parmetros. Os eixos das abcissas tenderam a apresentar
incrementos, o que demonstra uma maior quantidade de valores assumidos pelos
parmetros, enquanto o eixo das ordenadas tiveram como tendncia sua reduo, sendo,
portanto, menor a quantidade parmetros que assumem valores prximos aos
encontrados.
Tal como verificado na presena de heterocedasticidade, tambm para o caso de
distribuio no normal dos resduos o aumento da varincia dos parmetros gerou quedas
na significncia mdia do parmetro de intercepto (9,05%), do parmetro de inclinao
(10,18%), e do teste F (7,23%) em relao ao caso de no transgresso das premissas
clssicas. De acordo com Rodrigues et al. (2011), parte desses resultados, advm da
deturpao dos intervalos de confiana e dos testes de significncia, os quais requerem a
presena de normalidade dos resduos.
Em consonncia com as quedas de significncia dos parmetros, o R tambm
apresenta um resultado mdio 18,12% menor na presena de distribuio no normal dos
resduos em relao ao caso de no transgresso dos pressupostos, o que demonstra que
o modelo menos preditivo e possui maior soma dos quadrados dos resduos em
comparao a soma dos quadrados total.

8
Grfico 7 - Beta 0 sem violao dos pressupostos
Beta 1 - 20 Beta 1 - 40 Beta 1 - 80
120 0.025 100 0.035 100 0.05
90 90 0.045
100 0.03
0.02 80 80 0.04
70 0.025 70 0.035
80
0.015 60 0.02 60 0.03
60 50 50 0.025
0.01 40 0.015
40 0.02
40 30 0.01 30 0.015
0.005 20 20 0.01
20 0.005
10 10 0.005
0 0 0 0 0 0
-20.00 30.00 80.00 130.00 0.00 20.00 40.00 60.00 80.00 100.00 120.00 0.00 20.00 40.00 60.00 80.00 100.00

Fonte: Elaborado pelo autor

Grfico 8 - Beta 0 com distribuio uniforme dos resduos


Beta 1 - 20 Beta 1 - 40 Beta 1 - 80
100 0.025 120 0.03 100 0.04
90 90 0.035
80 0.02 100 0.025 80
0.03
70 70
80 0.02
60 0.015 60 0.025
50 60 0.015 50 0.02
40 0.01 40 0.015
30 40 0.01 30
0.01
20 0.005 20
20 0.005
10 10 0.005
0 0 0 0 0 0
-20.00 30.00 80.00 130.00 0.00 20.00 40.00 60.00 80.00 100.00 120.00 0.00 20.00 40.00 60.00 80.00 100.00

Fonte: Elaborado pelo autor

7
Grfico 9 - Beta 1 sem violao dos pressupostos
Beta 2 - 20 Beta 2 - 40 Beta 2 - 80
100 4 100 6 100 8
90 3.5 90 90
5 7
80 80 80
3 6
70 70 4 70
60 2.5 60 5
60
50 2 50 3 50 4
40 1.5 40 40
2 3
30 30 30
1 2
20 20 1 20
10 0.5 10 10 1
0 0 0 0 0 0
-0.25 -0.05 0.15 0.35 0.55 0.75 -0.10 0.00 0.10 0.20 0.30 0.40 0.50 0.05 0.15 0.25 0.35 0.45 0.55

Fonte: Elaborado pelo autor

Grfico 10 - Beta 1 com distribuio uniforme dos resduos


Beta 2 - 20 Beta 2 - 40 Beta 2 - 80
100 3.5 100 5 120 7
90 90 4.5
3 100 6
80 80 4
70 2.5 70 3.5 5
80
60 2 60 3 4
50 50 2.5 60
40 1.5 3
40 2
30 40
1 30 1.5 2
20 20 1
0.5 20 1
10 10 0.5
0 0 0 0 0 0
-0.20 0.00 0.20 0.40 0.60 0.80 -0.20 0.00 0.20 0.40 0.60 0.00 0.10 0.20 0.30 0.40 0.50 0.60

Fonte: Elaborado pelo autor

8
5.4 Violao da premissa de no correlao entre as variveis independentes

As regresses lineares mltiplas tm ainda como pressuposto necessrio para a


estimao por mnimos quadrados ordinrio a no correlao entre as variveis
independentes. A transgresso dessa premissa denominada de multicolinearidade. A
tabela a seguir demonstra os principais resultados obtidos.

Tabela 5 - Regresso linear multivariada com multicolinearidade


Sem violaes Correlao 0,4 entre Correlao 0,8 entre
as variveis as variveis
indepedentes indepedentes
20 40 80 20 40 80 20 40 80
F SIG 789 988 1000 923 999 1000 978 1000 1000
E(B0) 77,51 77,61 76,63 50,70 50,26 49,94 50,29 49,42 50,07
VAR(B0) 688 309 180 456 231 100 330 185 87
E(B1) 0,386 0,384 0,386 0,250 0,248 0,250 0,252 0,249 0,250
VAR(B1) 0,015 0,007 0,004 0,015 0,008 0,004 0,036 0,018 0,008
E(B2) 0,387 0,384 0,386 0,344 0,351 0,350 0,345 0,353 0,349
VAR(B2) 0,015 0,007 0,004 0,022 0,013 0,007 0,056 0,028 0,014
B0 IC 842 692 485 938 956 957 948 940 951
B1 IC 999 1000 1000 948 944 948 955 945 954
B2 IC 999 1000 1000 961 951 946 940 947 943
B0 SIG 786 994 1000 622 911 999 713 945 1000
B1 SIG 844 991 1000 480 800 983 249 443 760
B2 SIG 844 992 1000 572 877 986 296 558 842
R 0,402 0,372 0,360 0,493 0,465 0,437 0,555 0,527 0,514
Fonte: Elaborado pelo autor

Observa-se inicialmente que o parmetros so no-viesados. Ressalta-se tambm


que, diferente dos casos anteriormente analisados, o parmetro de intercepto possui
menor varincia no caso de violao de uma das premissas da estimao por mnimos
quadrados ordinrios.
Na circunstncia de correlao moderada (0,4) entre as variveis independentes,
tem-se que a varincia do parmetro de intercepto 29,95% menor que o estimado sem
violao dos pressupostos. Para uma forte correlao entre as variveis independentes, a
diferena entre as varincias ainda maior, tendo o parmetro de intercepto uma varincia
41,63% menor que a verificada sem violaes. Em funo disso, em mdia, h,
respectivamente, 14,61% e 22,27% mais parmetros de intercepto significativos nos
casos de multicolinearidade moderada e forte.
Entretanto, os parmetros de inclinao (1 e 2) no apresentam resultado to
positivos. Pelo contrrio. Na presena de correlao moderada e forte entre as variveis
independentes, a varincia de 1 , em mdia, 17,88% e 179,59% maior, respectivamente,

7
que no caso de no transgresso dos pressupostos. Para 2, a varincia 33,42% e
193,95% maior, nessa ordem, para os casos de multicolinearidade fraca e forte em relao
a circunstncia de no transgresso das premissas.
Em razo disso, observa-se que a quantidade de parmetros 1 e 2 significativos
, respectivamente, 8,99% e 7,12% menor quando h multicolinearidade moderada; e
43,30% e 37,19%, nessa ordem, inferior aos casos de no violao dos pressupostos
quando h multicolinearidade forte.
Esses resultados esto alinhados com o enunciado por Rodrigues et al. (2011), os
quais afirmam que na presena de multicolinearidade os parmetros de inclinao ficam
distorcidos, prejudicando a habilidade de previso do modelo ao dificultar a distino dos
efeitos das variveis independentes.
Apesar disso, a significncia conjunta dos parmetros no foi prejudicada pela
correlao entre as variveis independentes. Tem-se, na verdade, elevaes de 3,24% e
5,43%, respectivamente, na quantidade repeties avaliadas como significativas pelo
teste F nos casos de multicolinearidade moderada e fraca em relao a circunstncia de
no transgresso das premissas.
Em parte por isso, observa-se tambm um incremento mdio do grau de ajuste dos
modelos (R) na presena correlaes moderada e forte entre as variveis independentes,
mensuradas, respectivamente, em 17,12% e 34,30% superiores ao caso de no violao
das premissas. Embora isso indique maior previsibilidade dos resultados pela reta de
regresso, importante destacar que so menos confiveis os parmetros de inclinao
na presena de multicolinearidade do que no caso de no violao das premissas, como
indicado pela significncia dos parmetros.

8
5.5 Violao do pressuposto do termo de erro com mdia zero

O termo de erro superior a zero designa uma incorreta especificao do modelo,


conforme elucida Wooldridge (2006). A tabela 6 apresenta os resultados obtidos.

Tabela 6 - Regresso linear multivariada com termo de erro igual a 3


Sem violaes dos pressupostos Distribuio uniforme dos
resduos
20 40 80 20 40 80
F SIG 681 921 999 677 928 999
E(B0) 49,7112 50,3313 50,6044 52,8020 52,5906 53,1336
VAR(B0) 324,0521 145,6296 74,8331 326,8914 145,9187 79,7160
E(B1) 0,2516 0,2473 0,2468 0,2514 0,2524 0,2489
VAR(B1) 0,0133 0,0058 0,0031 0,0133 0,0058 0,0032
B0 IC 973 972 970 966 965 943
B1 IC 970 970 975 978 981 967
B0 SIG 753 988 998 808 983 1000
B1 SIG 548 874 993 552 888 994
R 0,24245 0,21623 0,20302 0,23971 0,21882 0,20741
Fonte: Elaborado pelo autor

Observa-se na tabela 6 que no h alteraes significativas no parmetro de


inclinao, seja na sua varincia, valor mdio, ou significncia. Tem-se ainda que no h
alteraes significativas na varincia no parmetro de intercepto, como representam os
grficos a seguir.

Grfico 11 - Boxplot comparativos dos parmetros com e sem termo de erro.

Beta 0 Beta 1
140 1
120 0.8
100
0.6
80
60 0.4
40 0.2
20
0
0 20SV 20Erro 40SV 40Erro 80SV 80Erro
20SV 20Erro 40SV 40Erro 80SV 80Erro -0.2
-20
-40 -0.4

Fonte: Elaborado pelo autor.

9
Grfico 1 - Beta 0 sem violao dos pressupostos
Beta 1 - 20 Beta 1 - 40 Beta 1 - 80
120 0.025 100 0.035 100 0.05
90 90 0.045
100 0.03
0.02 80 80 0.04
70 0.025 70 0.035
80
0.015 60 0.02 60 0.03
60 50 50 0.025
0.01 40 0.015
40 0.02
40 30 0.01 30 0.015
0.005 20 20 0.01
20 0.005
10 10 0.005
0 0 0 0 0 0
-20.00 30.00 80.00 130.00 0.00 20.00 40.00 60.00 80.00 100.00 0.00 20.00 40.00 60.00 80.00 100.00

Fonte: Elaborado pelo autor

Grfico 2 - Beta 0 com termo de erro igual a 3


Beta 1 - 20 Beta 1 - 40 Beta 1 - 80
120 0.025 120 0.035 90 0.05
80 0.045
100 100 0.03
0.02 70 0.04
0.025 0.035
80 80 60
0.015 0.03
0.02 50
60 60 0.025
0.015 40
0.01 0.02
40 40 30
0.01 0.015
0.005 20 0.01
20 20 0.005 10 0.005
0 0 0 0 0 0
-25.00 25.00 75.00 125.00 0.00 20.00 40.00 60.00 80.00 100.00 120.00 0.00 20.00 40.00 60.00 80.00 100.00

Fonte: Elaborado pelo autor

7
Grfico 3 - Beta 1 sem violao dos pressupostos
Beta 2 - 20 Beta 2 - 40 Beta 2 - 80
100 4 100 6 100 8
90 3.5 90 90
5 7
80 80 80
3 6
70 70 4 70
60 2.5 60 5
60
50 2 50 3 50 4
40 1.5 40 40
2 3
30 30 30
1 2
20 20 1 20
10 0.5 10 10 1
0 0 0 0 0 0
-0.25 -0.05 0.15 0.35 0.55 0.75 -0.10 0.00 0.10 0.20 0.30 0.40 0.50 0.05 0.15 0.25 0.35 0.45 0.55

Fonte: Elaborado pelo autor

Grfico 4 - Beta 1 com termo de erro igual a 3


Beta 2 - 20 Beta 2 - 40 Beta 2 - 80
120 4 100 6 90 8
3.5 90 80 7
100 5
80 70
3 6
80 70 60
4
2.5 60 5
50
60 2 50 3 4
40
1.5 40 3
40 2 30
30
1 2
20 20
20 1
0.5 10 10 1
0 0 0 0 0 0
-0.40 -0.20 0.00 0.20 0.40 0.60 0.80 -0.20 0.00 0.20 0.40 0.60 0.00 0.10 0.20 0.30 0.40 0.50

Fonte: Elaborado pelo autor

8
Em parte pela no alterao da varincia dos parmetros com termo de erro
diferente de zero, no houve tambm alterao significativa dos resultados advindos do
teste F e do grau de ajuste do modelo (R) na presena de violao do pressuposto de que
o termo de erro diferente de zero comparativamente a circunstncia de no transgresso
das premissas.
O grfico 10 e a tabela 6 revelam, entretanto, que a principal alterao nas
estimaes advm do valor mdio do parmetro de intercepto, o qual apresenta vis
tendendo exatamente ao valor do termo de erro, ou seja, igual a trs.

5.6 Variveis omitidas

Na presente anlise, tem-se uma m especificao do modelo sem resultar em um


termo de erro superior a zero. A tabela 7 apresenta os principais resultados advindos da
estimao com varivel omitida com correlao nula com a varivel independente
explicitada.

Tabela 7 - Regresso linear multivariada com varivel omitida


Sem violaes Varivel omitida e correlao zero
entre var. independente e erro
20 40 80 20 40 80
F SIG 849 990 999 603 972 993
E(B0) 49,341 49,389 50,823 91,813 92,024 91,661
VAR(B0) 606,605 307,224 144,653 314,347 154,393 78,444
E(B1) 0,256 0,246 0,245 0,251 0,250 0,252
VAR(B1) 0,013 0,006 0,003 0,013 0,006 0,003
E(B2) 0,347 0,358 0,349 0,000 0,000 0,000
VAR(B2) 0,020 0,010 0,004 0,000 0,000 0,000
B0 IC 932 956 957 511 151 11
B1 IC 950 944 948 977 975 965
B2 IC 943 947 962 0 0 0
B0 SIG 491 781 994 995 1000 1000
B1 SIG 594 858 993 439 816 984
B2 SIG 655 948 998 0 0 0
R 0,431 0,392 0,369 0,193 0,175 0,170
Fonte: Elaborado pelo autor.

Observa-se na tabela que no h alteraes significativa da mdia ou na varincia


do parmetro de inclinao, e, ainda assim, h uma reduo mdia de aproximadamente
10,63% da quantidade desse parmetro avaliado como significativo em relao a
circunstncia de no violao das premissas. Ressalta-se tambm que, embora o

7
parmetro de intercepto seja significativo, poucos desses parmetros esto no intervalo
de confiana; e que em consonncia com a queda de aproximadamente 10,60% dos
parmetros de inclinao, houve uma de cerca de 10,46% das repeties do teste F que
foram avaliadas como significativas.
Esses resultados so explicados por Gujarati e Porter (2011, p. 470) ao afirmarem
que uma das consequncias das variveis omitidas que os procedimentos habituais para
determinar os intervalos de confiana e o teste de hipteses provavelmente conduziro a
concluses equivocadas quanto significncia estatstica dos parmetros estimados.
A tabela 7 ainda demonstra um incremento mdio do valor estimado do parmetro
de intercepto de 84,25% em relao ao caso de no haver transgresso dos pressupostos.
Desse modo, a estimao desse parmetro altamente viesada, explicando a baixa
quantidade de valores no intervalo de confiana.
Em parte por esse vis, a tabela 7 ainda demonstra uma queda mdia de 54,79%
do R obtido com varivel omitida em relao a circunstncia de no violao dos
pressupostos. Esse resultado demonstra um aumento da soma do quadrado dos resduos
sobre a soma dos quadrados total.
Na tabela 8 so apresentados os resultados da omisso de uma varivel
correlacionada com a varivel independente explicitada.

Tabela 8- Regresso linear multivariada com varivel omitida


Sem violaes Varivel omitida e Varivel omitida e
correlao 0,4 entre var. correlao 0,8 entre var.
independente e erro independente e erro
20 40 80 20 40 80 20 40 80
F SIG 849 990 999 874 999 1000 996 1000 1000
E(B1) 49,341 49,389 50,823 75,222 74,025 71,241 58,141 59,175 58,381
VAR(B1) 606,605 307,224 144,653 321,221 148,027 77,591 283,838 163,755 73,149
E(B2) 0,256 0,246 0,245 0,361 0,361 0,353 0,478 0,469 0,473
VAR(B2) 0,013 0,006 0,003 0,013 0,006 0,003 0,011 0,006 0,003
E(B3) 0,347 0,358 0,349 0,000 0,000 0,000 0,000 0,000 0,000
VAR(B3) 0,020 0,010 0,004 0,000 0,000 0,000 0,000 0,000 0,000
B1 IC 932 956 957 806 638 419 951 902 888
B2 IC 950 944 948 895 814 612 563 264 28
B3 IC 943 947 962 0 0 0 0 0 0
B1 SIG 491 781 994 959 1000 1000 866 991 1000
B2 SIG 594 858 993 785 985 1000 985 999 1000
B3 SIG 655 948 998 0 0 0 0 0 0
R 0,431 0,392 0,369 0,316 0,306 0,296 0,476 0,456 0,451
Fonte: Elaborado pelo autor.

8
A omisso de uma varivel faz com que ela passe a integrar o termo de erro. Sendo
essa varvel omissa correlata a varivel independente explicitada, tem-se um caso similar
ao de heterocedasticidade. Por consequncia, como elucidado por Gujarati e Porter
(2011), no h confiabilidade nos valores estimados.
Novamente verificado quedas expressivas dos parmetros contidos no intervalo
de confiana e, ainda assim, aumentos expressivos na significncia dos mesmos
parmetros, sendo isso elucidado por concluses equivocadas quanto significncia
estatstica dos estimadores, como explicado anterior por Gujarati e Porter (2011).
O valor mdio do parmetro de intercepto e do parmetro de inclinao, nessa
ordem, tiveram incrementos mdios, em relao a no violao das premissas, de 47,50%
e 44,03% no caso de correlao moderada, e de 17,51% e 90,26% na presena de
correlao forte. Esses resultados esto alinhados com o previsto por Wooldridge (2006)
que afirma que a correlao entre uma varivel independente e um varivel omitida gera
vis do parmetro de inclinao. Ainda de acordo com esse autor, nesse caso em que o
parmetro de inclinao omitido positivo, e a correlao existente entre as variveis
tambm positiva, tem-se uma um vis maior que zero.
Apesar da regresso com vis, o grau de ajuste do modelo 16,43% superior no
caso de forte correlao em relao a circunstncia de no violao dos pressupostos. Isso
demonstra que o vis no necessariamente implica em aumento dos resduos, dado que o
vis pode ser resultado da incorporao dos efeitos da varivel omissa sobre a varivel
dependente.

9
6 Concluses

Ao longo desse trabalho foram elaboradas simulaes de Monte Carlo a fim de


verificar os impactos advindos das transgresses das premissas clssicas da estimao de
regresso linear por mnimos quadrados ordinrios.
Constatou-se como principais resultados que aumentos amostrais implicam em
maior consistncia dos estimadores em funo do teorema do limite central e das
propriedades de grandes amostras; que a heterocedasticidade e a omisso de variveis
implicam na no confiabilidade dos estimadores; que os erros de especificao do modelo
tendem a gerar vis; e que a multicolinearidade distorce os parmetros estimados.
Esses resultados justificam o presente trabalho, no apenas pela contribuio
terica de caracterizar os impactos advindos das violaes dos pressupostos estatsticos,
como tambm por estipular os critrios necessrios para uma anlise criteriosa dos
resultados estatsticos advindos da produo cientfica; alm de salientar a necessidade
de realizao de testes de validao estatstica para o artigos que utilizem dessa tcnica
metodolgica.

10
Referncias

Abdel-Khalik, A., & Ajinkya, B. (1979). Empirical research in accounting: a


methodological viewpoint. Accounting Education Series, Vol. 4. Sarasota, FL: American
Accounting Association.

Brown, R., & Jones, M. (2015). Mapping and exploring the topography of contemporary
financial accounting research. The British Accounting Review, 47, 237261.

Bussab, W. O., & Morettin, P. A. (2002). Estatstica Bsica (fifth ed.). So Paulo: Editora
Saraiva.

Cohen, J., Cohen, P., West, S. G., & Aiken, L. S (2002). Applied Multiple
Regression/Correlation Analysis for the Behavioral Sciences (third ed.). Abingdon:
Routledge.

Gujarati, D. N., & Porter, D. C. (2011). Econometria Bsica (fifth ed.). So Paulo:
AMGH Editora.

Hoekstra, R., Kiers, H. A. L., & Johnson, A. (2012). Are assumptions of well-known
statistical techniques checked, and why (not)? Frontiers in Psychology, 3, 19.

Hoffmann, R. (2006). Estatstica para Economistas (fourth ed.). So Paulo: Pioneira


Thomson Learning.

Keselman, H. J., et. al. (1998). Statistical practices of educational researchers: An analysis
of their ANOVA, MANOVA and ANCOVA analyses. Review of Educational Research,
68, 350386.

Kennedy, P. E. (2008). A Guide to Econometrics (sixth ed.). New Jersey: Wiley-


Blackwell.

Neter, J., Nachtsheim, C., Kutner, M., & Li, W. (2004). Applied Linear Statistical Models
(fifth ed.). New York: McGraw-Hill Irwin.

Oler, D. K., Oler, M. J., & Skousen, C. J. (2010). Characterizing accounting research.
Accounting Horizons, 24(4), 635670.

Osborne, J. W., & Waters, E. (2002). Four assumptions of multiple regression that
researchers should always test. Practical Assessment Research & Evaluating, Vol. 8, 2,
1-5. Available at: http://pareonline.net/getvn.asp?n=2&v=8.

Petersen, M. A. (2008). Estimating Standard Errors in Finance Panel Data Sets:


Comparing Approaches. The Review of Financial Studies, 22(1), 435480.

Rodrigues, A., et al. (2011). Anlise Multivariada. So Paulo: Editora Atlas.

Teixeira, I. P., et. al. (2015). Uso da estatstica na Educao Fsica: Anlise das
Publicaes Nacionais entre os Anos de 2009 e 2011. Revista Brasileira de Educao
Fsica e Esporte, 29(1), 3947.

11
Weinzimmer, L., Mone, M., & Alwan, L. (1994). An examination of perceptions and
usage of regression in diagnostics m organization studies. Journal of Management, 20(1),
179192.

Wooldridge, J. M. (2006). Introduo Econometria (second ed.). So Paulo: Cengage


Learning.

12

You might also like