You are on page 1of 15

ECONOMETRIA II - ECN 191

AULAS 1, 2 e 3
O Modelo de Regresso Mltipla - estimao na forma matricial
Modelo populacional:
Y = X +
Modelo amostral:
Y = Xb + e
Matrizes/vetores:

Y1

Y
Y
2

1
1

.
1

Y N
nx1

X
X
X

12

22

32

.
n2

X
X
X

1K

2K

3K

nK

nxK

2
3

Kx1

N
nx1

Ex. equao de investimento:


Inv_realt = 1 + 2 Tend + 3 PNB_realt + 4 Tx_jurost + 5 Tx_inflaot + t

20

Estimao pelo Mtodo dos Mnimos Quadrados Ordinrios


Y = X +
O Vetor de Coeficientes dos MQO minimiza:
S() = = (Y - X) (Y - X)
S() = YY - XY YX + XX
S() = YY 2 XY + XX
S(b)/ b = 2 XY + 2 XX b
XX b = XY equaes normais

(1)

Exemplo da forma das matrizes e vetores no modelo com 2 variveis (1 var +


constante)
Y = b1 + b2X2 + e
Vetor Y
2
3

7

8
9

matriz X
1
1

1
1

X'

1
2

4
5

X'

21

1
1

(X'X)
5
15

1
1

1
1

X
=

55
X X

15

1
2

4
5

2
2
2

b

b
b
1

1
1

2
3

7

8
9

(X'Y)
29
106

X Y
X Y

(X'X) b

(X'Y)

X 2 b1
Y

Y
2
X 2 X 2 b2
X2
E as equaes normais so :

N b1 X 2 b2 Y
X 2 b1 X 22 b2 X 2 Y
Resolvendo para b2:
Obs: multiplicar a equao (1) por X2 e a equao (2) por N e depois
subtrairN(2) - (1). (
)2
Y

b1 X 2 X 2 b2 X 2
N b1 X 2 N b2 X 22 N X 2 Y
Chega - se a :
N X 2 Y X 2 Y
b2
N X 22 ( X 2) 2
Resolvendo para b1 a partir de (1) :
Y
X2
b2
Y b2 X 2
b1
N
N

22

Agora voltando a:
XX b = XY equaes normais

(1)

Pr-multiplicando os dois lados das equaes normais em (1) por (XX) -1


temos:
(XX)-1 (XX) b = (XX)-1 XY
Simplificando temos:
b = (XX)-1XY
2 S(b)/ bb = 2 XX
Obs: XX : matriz positiva e definida
Aspectos Algbricos dos MQO na forma matricial:
XX b - XY = 0
X(X b Y) = 0
Pela propriedade associativa:
- X(Y - Xb) =0
- Xe = 0
Ou seja, X independente dos resduos. Cada coluna de X multiplicada pelo
vetor de resduos igual a zero : Xk.e =0
1 aspecto algbrico:
A soma dos resduos igual a zero.(obs: prova com a primeira coluna de X)
X1 e = i e = ei = 0
Onde i = vetor de uns
2 aspecto algbrico:
A regresso passa pelos pontos de mdia dos dados.

Y b1 b2 X

b1 Y b2 X
23

Obs: Ateno interpretao da constante


3 aspecto algbrico:
A mdia dos valores ajustados igual mdia dos valores reais.
^

Y Xb
^

Y Y e

E Y E

Ee

E Y E

Y

Y

Estimadores e suas propriedades


Exemplo parmetro
Um estimador de

na populao

definido como uma funo dos dados:


(Y , X 1 , X 2 , X 3 .... X K )

(ou b) uma varivel aleatria porque funo da amostra e cada

amostra nos fornece uma estimativa diferente.

na populao fixo

Ex. estimador MQO:


b = (XX)-1XY
Estimador a maneira de utilizar a informao disponvel para obter uma
estimativa.
Mas como podemos saber que o estimador MQO fornece boas estimativas
dos parmetros populacionais? Para isso precisamos conhecer as
propriedades dos estimadores.
Um estimador uma varivel aleatria cujos valores variam de amostra para
amostra, e as suas propriedades so na verdade as propriedades da sua
distribuio amostral
Existem as propriedades em pequenas amostras e em grandes amostras.
Propriedades em pequenas amostras (amostras finitas): ausncia de vis e
eficincia
24

Propriedades grandes amostras: consistncia e eficincia assinttica

Propriedades em pequenas amostras


Referem-se as propriedades da distribuio amostral de um estimador
baseadas em qualquer tamanho de amostra fixo.
Conceitos importantes:
1.

Var (b) E [b E (b)b E (b)' ]2

O desvio padro de b, definido como a

Varb

conhecido como o erro

padro de b.
Diferena entre desvio padro e erro padro
O desvio padro uma medida da disperso dos dados em torno da mdia.
a) Extramos uma amostra de uma populao (amostra 1) e calcularmos a
mdia e o desvio padro da mdia dessa amostra;
b) Extramos outras amostras da mesma populao (amostras 1,2,3,4,etc) e
calculamos as mdias e os desvios padres de todas essas amostras.
Agora temos uma distribuio das mdias amostrais. Se calcularmos a
mdia dessa distribuio (ou seja, a mdia de todas essas mdias) e o
desvio padro dessa nova mdia, esse desvio padro o erro padro.
c) Na maioria das vezes em econometria, temos somente uma amostra e
temos que calcular o seu erro padro. O erro padro importante para
obter o intervalo de confiana da mdia na populao. Ou seja, dada a
sua amostra, voc quer calcular a mdia da populao de onde veio
aquela amostra. Para isso voc constri um intervalo de confiana que
provavelmente conter a media populacional, usando a mdia e o

25

desvio padro obtidos com a sua amostra. Como obter o erro padro
partir do desvio padro?
Erro padro = desvio padro /
Desvio padro:

(X X )

N 1

Vis E (b)

2.

E (b) a mdia da distribuio amostral. No modelo economtrico como


assumimos o estimador MQO como no viesado, o desvio padro de b,
definido como
se

Vis E (b)

Var b

, o erro padro de b.

dizemos que o estimador viesado (mais correto,

enviesado)
3. Eficincia
No somente o vis (ou ausncia dele) importante para definir um
estimador. Precisamos de critrios de preciso. A varincia um critrios de
preciso ou eficincia.
Varincia se eu tenho dois estimadores no viesados, aquele com a menor
varincia o mais preciso eficiente
Um estimador qualquer, , considerado eficiente se as seguintes condies
ao satisfeitas:
1) no viesado
~
2) Var () Var ( ) onde ~ qualquer outro estimador no viesado de .
Um estimador eficiente chamado de estimador de varincia mnima, ou
melhor estimador no viesado. Observar que pelas condies acima, um

26

estimador um pouco viesado, mesmo que tenha uma varincia bem menor
no pode ser chamado de eficiente.
Notar tambm que estamos preocupados com a eficincia relativa, uma vez
que estamos comparando dois estimadores.
Existe uma condio que fornece a eficincia no sentido absoluto. o limite
inferior de Cramer-Rao (Cramer-Rao lower bound) que veremos mais tarde.
Propriedades dos MQO em amostras finitas (pequenas amostras)
Ausncia de vis:
b = (X X)-1 X Y
b = (X X)-1 X (X + )
b = (X X)-1 X X + (X X)-1 X
b = + (X X)-1 X
E[b] = E[ + (X X)-1 X ]
E[b] = + (X X)-1 X E[]
E[b] =
Ento, o vetor b dos MQO um estimador linear no viesado do vetor de
parmetros populacionais, .
Matriz de varincias e covarincias de b
varincia eficincia!!
Var b = E{(b E[b]) (b - E[b])}
Var b = E[(b - ) (b - )]
Var b = E[( + (X X)-1 X - ) ( + (X X)-1 X - )]
Var b = E[(X X)-1 X X (X X)-1]
Var b = (X X)-1 X 2 I X (X X)-1
Var b = 2 (X X)-1

27

Estimador para a varincia dos resduos: 2


Antes de derivarmos os estimador para a varincia dos resduos precisamos
conhecer uma matriz muito importante em econometria, a matriz M.

A matriz M
Y=Xb + e
e = Y- X (XX)-1XY
e = [I- X (XX)-1X]Y
e = MY
M = [I - X (XX)-1X] = matriz que quando pr-multiplicada por Y produz os
resduos da regresso de Y em X.
M = matriz idempotente M= M ; MM= M; M M= M ; M2 = M
MX = 0 ( resduos da regresso de X em X!!)
[I - X (XX)-1X] X = X - X (XX)-1XX = 0
Resduos dos MQO:
e = MY = M(X + ) = M
ee = M
E[ee X] = E[M X] = E[tr(M) X] = E[tr(M) X]
E[ee X] = tr(M E[ X] = tr (M 2 I)
Obs: ateno s propriedades do trao: trao de ABC = trao de BCA= trao
de CAB
Trao de M = n- k
E[ee X] = 2 (n-k)
2 = E[ee X]/(n-k)
28

s2=ee/n-k
E[s2] = 2
Unidades de medida e forma funcional
(cap. 2 item 2.4 do livro do Wooldridge)
Mudana da unidade de medida na varivel dependente:
Ex: salrio medido em reais
Source |
SS
df
MS
-------------+-----------------------------Model | 35121876.3
8 4390234.54
Residual |
117594292
926 126991.676
-------------+-----------------------------Total |
152716168
934 163507.675

Number of obs =
F( 8,
926)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=

935
34.57
0.0000
0.2300
0.2233
356.36

-----------------------------------------------------------------------------salariom |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------educ |
56.72081
6.825013
8.31
0.000
43.32652
70.11509
exper |
19.26636
12.28546
1.57
0.117
-4.844224
43.37694
exp2 | -.1413615
.5149724
-0.27
0.784
-1.15201
.8692869
qi |
3.472021
.9724784
3.57
0.000
1.563503
5.380538
casado |
185.6528
38.1132
4.87
0.000
110.8545
260.451
negro | -126.9398
38.72529
-3.28
0.001
-202.9393
-50.9403
sul | -54.49159
25.73656
-2.12
0.035
-105.0003
-3.98285
urban |
166.3909
26.27843
6.33
0.000
114.8187
217.9631
_cons | -609.1583
136.2062
-4.47
0.000
-876.467
-341.8496

Ex: salrio medido em mil reais


Source |
SS
df
MS
-------------+-----------------------------Model | 35.1218769
8 4.39023461
Residual | 117.594293
926 .126991677
-------------+-----------------------------Total |
152.71617
934 .163507677

Number of obs
F( 8,
926)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

935
34.57
0.0000
0.2300
0.2233
.35636

-----------------------------------------------------------------------------salariom_mil |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------educ |
.0567208
.006825
8.31
0.000
.0433265
.0701151
exper |
.0192664
.0122855
1.57
0.117
-.0048442
.0433769
exp2 | -.0001414
.000515
-0.27
0.784
-.001152
.0008693
qi |
.003472
.0009725
3.57
0.000
.0015635
.0053805
casado |
.1856528
.0381132
4.87
0.000
.1108545
.260451
negro | -.1269398
.0387253
-3.28
0.001
-.2029393
-.0509403
sul | -.0544916
.0257366
-2.12
0.035
-.1050003
-.0039829
urban |
.1663909
.0262784
6.33
0.000
.1148187
.2179631
_cons | -.6091584
.1362062
-4.47
0.000
-.876467
-.3418497
------------------------------------------------------------------------------

29

Observar que todos os coeficientes ficaram divididos por mil e a soma dos
quadrados dos resduos (e do modelo SQ explicada) ficou dividida por um
milho isso porque os resduos ficaram divididos por mil.
Mudana da unidade de medida nas variveis independentes:
Ex. dividindo a varivel educao por dez.
Source |
SS
df
MS
-------------+-----------------------------Model | 35121876.1
8 4390234.52
Residual |
117594292
926 126991.676
-------------+-----------------------------Total |
152716168
934 163507.675

Number of obs
F( 8,
926)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

935
34.57
0.0000
0.2300
0.2233
356.36

-----------------------------------------------------------------------------salariom |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------educ_dez |
567.2081
68.25013
8.31
0.000
433.2652
701.1509
exper |
19.26636
12.28546
1.57
0.117
-4.844224
43.37694
exp2 | -.1413615
.5149724
-0.27
0.784
-1.15201
.8692869
qi |
3.472021
.9724784
3.57
0.000
1.563504
5.380538
casado |
185.6528
38.1132
4.87
0.000
110.8545
260.451
negro | -126.9398
38.72529
-3.28
0.001
-202.9393
-50.9403
sul | -54.49159
25.73656
-2.12
0.035
-105.0003
-3.982849
urban |
166.3909
26.27843
6.33
0.000
114.8187
217.9631
_cons | -609.1584
136.2062
-4.47
0.000
-876.4671
-341.8497
------------------------------------------------------------------------------

Observar que somente o coeficiente de educao ficou alterado; foi


multiplicado por 10, de modo que a interpretao no se alterou.
Variveis medidas em desvios padres
Lembrar que quando dividimos uma varivel aleatria pelo seu desvio
padro, obtemos uma varivel normal padro.
s vezes no faz sentido medir uma determinada em unidades, como, por
exemplo, pontuao de testes, QI e variveis ndices em geral. Nesses casos
faz mais sentido saber como um individuo em particular se compara com a
populao. Na equao de salrios, faz mais sentido calcular qual o salrio de
30

indivduos com QI dentro da mdia (ou acima, ou baixo). Nesse caso,


devemos incluir a varivel QI no modelo medida como desvios padres. Ou
seja, o que acontece com a varivel dependente (salariom) quando o QI
aumenta (ou diminui) um certo nmero de desvios padres.
Podemos transformar a varivel em termos de desvios em relao mdia ou
ento computar o desvio padro da varivel e calcular mudanas em termos
de desvios padres. Lembrar que:

Seja o modelo anterior:


Source |
SS
df
MS
-------------+-----------------------------Model | 35121876.3
8 4390234.54
Residual |
117594292
926 126991.676
-------------+-----------------------------Total |
152716168
934 163507.675

Number of obs
F( 8,
926)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

935
34.57
0.0000
0.2300
0.2233
356.36

-----------------------------------------------------------------------------salariom |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------educ |
56.72081
6.825013
8.31
0.000
43.32652
70.11509
exper |
19.26636
12.28546
1.57
0.117
-4.844224
43.37694
exp2 | -.1413615
.5149724
-0.27
0.784
-1.15201
.8692869
qi |
3.472021
.9724784
3.57
0.000
1.563503
5.380538
casado |
185.6528
38.1132
4.87
0.000
110.8545
260.451
negro | -126.9398
38.72529
-3.28
0.001
-202.9393
-50.9403
sul | -54.49159
25.73656
-2.12
0.035
-105.0003
-3.98285
urban |
166.3909
26.27843
6.33
0.000
114.8187
217.9631
_cons | -609.1583
136.2062
-4.47
0.000
-876.467
-341.8496
-----------------------------------------------------------------------------summarize qi

31

Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------qi |
935
101.2824
15.05264
50
145

Interpretao:
Aumento de um desvio padro (15.05264) no QI provoca um aumento de:
15.05264*3.472021 = 52.26307 reais no salrio
Regresso com a varivel transformada em desvios padres antes de
estimar:
Source |
SS
df
MS
-------------+-----------------------------Model | 35121876.3
8 4390234.54
Residual |
117594292
926 126991.676
-------------+-----------------------------Total |
152716168
934 163507.675

Number of obs
F( 8,
926)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

935
34.57
0.0000
0.2300
0.2233
356.36

-----------------------------------------------------------------------------salariom |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------educ |
56.7208
6.825013
8.31
0.000
43.32652
70.11509
exper |
19.26636
12.28546
1.57
0.117
-4.844224
43.37694
exp2 | -.1413615
.5149724
-0.27
0.784
-1.15201
.8692869
qin |
52.26307
14.63836
3.57
0.000
23.53485
80.99128
casado |
185.6528
38.1132
4.87
0.000
110.8545
260.451
negro | -126.9398
38.72529
-3.28
0.001
-202.9393
-50.9403
sul | -54.49159
25.73656
-2.12
0.035
-105.0003
-3.98285
urban |
166.3909
26.27843
6.33
0.000
114.8187
217.9631
_cons | -257.5039
128.0464
-2.01
0.045
-508.7986
-6.209174
------------------------------------------------------------------------------

Os coeficientes obtidos como acima so chamados de coeficientes


padronizados ou coeficientes Beta.
Incorporao de no linearidade na regresso
Muitos tipos de no linearidade podem ser includos num modelo de
regresso. As mais comuns so as transformaes logartmicas.

32

Ex. no modelo de salrio vimos que um aumento de um ano de escolaridade


provoca um aumento mdio de 56 reais no salrio, isso independentemente
do nvel salarial. Nesse caso, faz mais sentido medir aumentos percentuais
do que absolutos. Aumentos percentuais so fornecidos diretamente nos
resultados do modelo atravs da transformao das variveis em logaritmo.
Tipos de modelos log:
1) log-lin: % Y (100 b) X
lsal |
Coef.
Std. Err.
t
P>|t|
-------------+-----------------------------------------educ |
.0559778
.0070366
7.96
0.000
exper |
.0167049
.0126663
1.32
0.188

Aumento de um ano de escolaridade causa um aumento de 5,5 % nos


salrios
2) log-log: % Y b % X
Ex: salrio dos executivos (em mil dlares) e vendas (em milhes de
dlares) das empresas
lsalary |
Coef.
Std. Err.
t
P>|t|
-------------+------------------------------------------lsales |
.2566717
.0345167
7.44
0.000
_cons |
4.821997
.2883396
16.72
0.000
---------------------------------------------------------

Aumento de 1% nas vendas causam um aumento de 0,25% nos salrios


dos executivos.
O modelo acima fornece diretamente as elasticidades
3) lin-log: Y (b/100) % X
salary |
Coef.
Std. Err.
t
P>|t|
-------------+------------------------------------------lsales |
262.9014
92.35524
2.85
0.005
_cons | -898.9287
771.5021
-1.17
0.245
---------------------------------------------------------

33

Aumento de 1% nas vendas causam um aumento de 2,62 mil dlares no


salrio.

34

You might also like