You are on page 1of 105

3 Modelul unifactorial

3.1 Specificarea şi definirea modelului unifactorial

Specificarea unui model econometric se face pe baza teoriei


economice a fenomenului observat şi constă în precizarea variabilei
endogene şi a variabilei exogene.
Un model unifactorial se prezintă astfel:

y = f ( x) + u (3.1.1)
unde:
y = ( y 1 , y 2 , K , y n ) - variabila endogenă sau rezultativă;
x = (x 1 , x 2 , K , x n ) - variabila exogenă sau factorială sau cauzală;
u= (u 1 , u 2 , K , u n ) - variabila reziduală, aleatoare sau eroare.

Relaţia (3.1.1) reprezintă o ipoteză construită pe baza teoriei


economice şi presupune că fenomenul economic y este rezultatul acţiunii
unui complex de factori: fenomenul economic x este factorul principal,
esenţial, ce determină fenomenul y, restul factorilor fiind consideraţi
neesenţiali, cu acţiune întâmplătoare, ei fiind specificaţi în modelul
econometric cu ajutorul variabilei aleatoare u. Ca orice ipoteză teoretică, ea
poate fi adevărată sau falsă – x este sau nu este factorul hotărâtor al
fenomenului y – iar validarea sau invalidarea unei astfel de ipoteze se face
în urma unui „experiment” statistic.
Modele econometrice

Teoria economică a folosit şi foloseşte în numeroase cazuri modelul


unifactorial pentru a fundamenta şi descrie mecanismul de formare şi de
manifestare a legilor economice. În acest sens, pot fi menţionate:
- legea cererii C = f(P) + u ; f’(P) < 0 Æ cererea (C) unui anumit
produs creşte sau se reduce, dacă preţul (P) acestuia se micşorează sau se
măreşte;
- legea ofertei O = g(P) + u ; g’(P) > 0 Æ oferta (O) unui produs
creşte sau se diminuează, dacă preţul (P) acestuia se măreşte sau scade;
- funcţia de producţie a cheltuielilor totale ale unei firme: Ch =
f(Q) + u; f’(Q) > 0 Æ cheltuielile de producţie cresc sau scad, dacă volumul
producţiei creşte sau scade (în situaţia în care productivitatea rămâne
constantă);
- legile consumului – formulate de Engel şi descrise de funcţiile lui
Tornqvist – consideră venitul (V) consumatorului ca principal factor al
consumului (C) unui produs sau grupe de produse C = f(V) + u; f’(V)>0.
De asemenea, foarte multe analize economice utilizează modelul
unifactorial pentru a explica şi prospecta dependenţa dintre două fenomene,
cum ar fi:
- corelaţia dintre creşterea preţurilor şi creşterea salariilor;
- corelaţia dintre creşterea preţurilor şi rata şomajului – curba lui
Philips;
- corelaţia dintre creşterea salariilor şi productivitatea muncii etc.

3.2 Identificarea modelului unifactorial

Identificarea modelului constă în alegerea unei funcţii (sau a unui


grup de funcţii) matematice, cu ajutorul căreia se urmăreşte să se descrie (să
se aproximeze) valorile variabilei endogene y numai în funcţie de variaţia
variabilei exogene x. Funcţiile matematice care se pot utiliza în acest sens –
funcţii liniare sau neliniare – sunt numeroase şi de forme diverse, printre
acestea figurând şi cele prezentate în continuare.
Modelul unifactorial

y
y
a
a,b >0 b>0

a<0, b>0

b<0
a a>0, b<0

0
x 0 x
-a

1. Funcţia liniară 2. Funcţia semilogaritmică

y=a+bx+u y = a + b log x + u

y y
b>1

b=1

b>0
nivel de saturaţie
0 < b <1 a
b<0

b<0

0
x 0 x

3. Funcţia putere şi funcţia logaritmică 4. Funcţia inversă (hiperbola)


b
y = axb + u y = a+ +u
x
log y = log a + b log x + u sau log y = a + b log x + u
Modele econometrice

y y
yM

b>0

exp nivel de saturaţie


(a)
b, c >0 b, c >0
b<0

0 x 0 b b x
2 ,3026 2,3026
c −1 c

5. Funcţia loginversă 6. Funcţia log-loginversă


b b
log y = a + + u log y = a + + c log x + u
x x

y a<0
c>0
yM b>0
a, c > 0,
b<0

a, c < 0,
ym b>0

0 b x

2c

7. Parabola de gradul II
y = a + bx + cx 2 + u
Modelul unifactorial

y a, c > 0,
b<0
yM

a, c < 0,
ym b>0
0 b x
− 2 , 3026
e 2c

8. Parabola logaritmică
y = a + b log x + c(log x) + u
2

III
y

a II
Nivel de saturaţie II

aI
Nivel de I
saturaţie

0 C x

9. Funcţiile lui Tornquist


x
I. y =a + u ; a, b > 0
x +b
x −c
II . y = a + u ; a , c > 0; b > −c ; x ≥ c
x +b
x −c
III . y = ax + u ; a , c > 0; b > −c ; x ≥ c
x +b
Modele econometrice

y
a > 0, b > 0
yM

a > 0, b < 0

0 ⎛ b ⎞ x
− ⎜ 1 + 2 , 3026 ⎟
⎝ a ⎠
e

10. Funcţia lui Konius


y = x (a + b log x ) + u

y
(3) (1) c
c (1) y = +u
Nivel de saturaţie (2)
b<0 1+ e a+bx
b>0
c
(2) y = a + b log x
+u
1+ e
b<0 c
(3) y = b
+u
a+
1+ e x
0 x

11. Funcţia logistică

Alegerea unei anumite funcţii matematice ca funcţie de regresie a


unui model econometric – Y = f(x) – se face pe baza valorilor reale sau
empirice ale celor două fenomene economice, sistematizate, fie în serii
spaţiale (yi, xi,), i = 1, n , n = numărul unităţilor statistice omogene la care
s-au înregistrat, într-o anumită perioadă de timp, valorile celor două
fenomene y şi x, fie în serii de timp (yt, xt ), t = 1, n , n = numărul perioadelor
Modelul unifactorial

de timp în care s-au înregistrat valorile celor două fenomene y şi x la aceeaşi


unitate statistică.
Dispunând de o serie statistică privind variaţia, în timp sau în spaţiu,
a celor două variabile economice (vezi tabelul 3.2.1), problema identificării
constă în a alege o funcţie matematică, Yt = f(xt), cu ajutorul căreia,
cunoscând valorile fenomenului economic xt, să se aproximeze (să se
estimeze) cât mai bine (cu erori cât mai mici) valorile empirice ale
fenomenului yt = (y1, y2, _ _ _, yn) prin valorile teoretice.

Tabelul 3.2.1
xt yt yt − yt −1 xt −1 yt − y t −1
cmi = cei = ⋅
xt − xt −1 yt −1 xt − xt −1
x1 y1 -- --
x2 y2 y 2 − y1 x1 y 2 − y1
= cm2 ce2 = ⋅
x2 − x1 y1 x 2 − x1
M M M M

xn yn y n − y n −1 x n −1 y n − y n −1
= cmn ce n = ⋅
x n − xn −1 y n −1 x n − x n −1

Această operaţie se poate face, în general, utilizând următoarele


procedee de lucru:
a) procedeul grafic;
b) procedeul conservării ariilor;
c) procedeul calculelor algebrice.
Modele econometrice

a) Procedeul grafic constă în construirea corelogramei dintre cele


două variabile:

y
ymax

y1
S
0 L x

Figura 3.2.1

La construirea corelogramei, scala pe cele două axe, Oy şi Ox,


trebuie să se calculeze pe baza următoarei reguli:

A x x max − x 1
Ox : 1 cm ≈ =
L L
Ay y − y1
Oy : 1 cm ≈ = max
L L

adică variaţia fiecărei variabile, exprimată prin amplitudinea acesteia, Ax şi


Ay, este reprezentată printr-un un segment de dreaptă având aceeaşi lungime,
L, pe cele două axe. În acest mod, intensitatea legăturii dintre cele două
variabile, exprimată prin amplitudinea acestora, nu este viciată de grafic –
prin aplatizarea sau alungirea acestuia.
Prin unirea cu segmente de dreaptă a punctelor N(xt, yt) se obţine
graficul punctelor empirice – vezi Figura 3.2.1. În funcţie de forma
graficului punctelor empirice se alege o funcţie matematică al cărei grafic
aproximează cel mai bine graficul punctelor empirice.
Modelul unifactorial

În urma acestei operaţii se va alege:


- funcţia liniară: Yt = a + b xt – dacă curba empirică poate fi
aproximată cu o dreaptă;
- funcţia putere: Yt = a xtb – dacă curba empirică poate fi
aproximată cu curba acestei funcţii;
sau
ln Yt =ln a + b ln xt – dacă curba empirică poate fi aproximată cu o
dreaptă pe un grafic dublu logaritmic;

ln y

0 ln x

- funcţia exponenţială: Yt = ea+bxt - dacă curba empirică poate fi


aproximată cu graficul acestei funcţii,
sau
ln Yt = a + b xt – dacă curba empirică poate fi aproximată cu o
dreaptă pe un grafic semilogaritmic;

ln y

0 x

e Yt = a b xt Æ Yt = ln a + b ln xt
Modele econometrice

0 ln x

b) Procedeul conservării ariilor continuă procedeul grafic şi constă


în a compara suprafaţa curbei empirice „S” – vezi figura 3.2.1 – cu
suprafeţele teoretice Sj, ale celor h, j = 1, h , funcţii matematice: j = 1 Æ
funcţia liniară, j = 2 Æ funcţia putere etc.
Suprafaţa aferentă curbei empirice „S” se va calcula prin însumarea
suprafeţelor trapezelor al căror număr, (n-1), depinde de numărul punctelor
empirice N(xt, yt), t = 1, n , iar suprafeţele teoretice ale funcţiilor
matematice, acceptate în urma vizualizării curbei empirice, se vor calcula cu
ajutorul formulei:
x max
S j = ∫ f j (x )dx
x1

În final, alegerea celei mai adecvate funcţii de regresie se poate face


cu ajutorul următoarei reguli:
S −S j
min
j S j

c) Procedeul calculelor algebrice se fundamentează pe proprietăţile


pe care le posedă funcţiile matematice y = f(x) privind următorii indicatori:
∂y
- Cm = – viteza de variaţie absolută a funcţiei sau coeficientul
∂x
marginal;
f (x )
- y = – viteza medie de variaţie a funcţiei (valoarea medie);
x
Modelul unifactorial

∂y ∂x ∂ ln y
- Ce = : = – viteza de variaţie relativă a funcţiei sau
y x ∂ ln x
coeficientul de elasticitate.
În acest sens, vom exemplifica proprietăţile acestor indicatori pentru
câteva categorii de funcţii de regresie.
Deoarece x şi y descriu fenomene economice valorile lor trebuie să
fie pozitive. Deci funcţiile de regresie sunt definite pe intervalul
[0;+∞] →[0;+∞]. Variabila y reprezintă variabila efect, iar variabila x
variabila cauză.

1. y = a + bx

În cazul în care parametrul b este pozitiv se spune că există o


dependenţă directă între cauză şi efect, iar când parametrul b este negativ se
spune că există o dependenţă inversă între cauză şi efect.
Parametrul a reprezintă valoarea efectului atunci când cauza este
egală cu zero.
Parametrii a şi b nu pot fi în acelaşi timp negativi deoarece s-ar
obţine pentru y doar valori negative.
În funcţie de valorile parametrilor a şi b există trei cazuri:

y y y
a, b≥ 0 a<0 a>0
b>0 b<0
a
a

x x x
a a
− −
b b
Modele econometrice

Cm Cm
b<0
b>0
b x
1. a) Cm = y x′ = b x b

În cazul în care b>0, la o creştere cu o unitate a lui x îi va corespunde


o creştere cu b unităţi a lui y. În cazul în care b>0, la o creştere cu o unitate a
lui x îi va corespunde o scădere cu b unităţi a lui y.

y
y

b
y a b
1. b) y = =b +
x x
x x
a>0, b>0 a<0, b>0

y
y
lim y = b ;
x →∞

lim y = ∞ , pentru a> 0


x →0 x x
b
lim y = −∞ , pentru a< 0 b
x →0
a>0, b<0
a<0, b<0

În cazul în care cauza este maximă, aceasta tinde spre infinit, efectul
mediu fiind egal cu b. Atunci când cauza tinde către zero, iar parametrul a
este pozitiv, efectul mediu (efectul pe fiecare unitate de cauză) va tinde să
fie maxim, spre infinit, iar dacă parametrul a este negativ, efectul mediu
tinde să fie minim, spre minus infinit.
Modelul unifactorial

Ce

x bx
1. c) Ce = y x′ ⋅ =
y a + bx
lim Ce = 0 ; lim Ce = 1
x →0 x →∞

Coeficientul de elasticitate exprimă cu câte procente se modifică


efectul atunci când cauza se modifică cu un procent. Se observă că, la o
modificare cu un procent a cauzei, pentru valori mici ale acesteia, tinzând
către zero, efectul nu se modifică cu nici un procent. În cazul valorilor mari
ale cauzei, modificarea cu un procent a acesteia implică o modificare cu un
procent a efectului. Indiferent de valorile cauzei, unei modificări de un
procent a acesteia îi vor corespunde modificări ale efectului cuprinse între
zero şi unu.

b
2. y = a + ; a, b>0
x
y lim y = +∞
x →0
x >0

lim y = a
a x →∞

x
b
y ′=− < 0 ⇒ y este
x2
descrescător
Modele econometrice

b
2. a) Cm = −
x2
Cm

x
lim Cm = −∞ ; lim Cm = 0
x →0 x →∞
x >0

(Cm)′ x = (− b) ⋅ (- 1)2 ⋅ 2x = 2b3 ⇒


(x )
2 x

Cm e crescător pe (0, +∞)

Deci, la creşteri ale cauzei, efectul scade. Pentru valori mici ale
cauzei modificările efectului sunt foarte mari, tinzând spre infinit, iar pentru
valori foarte mari ale cauzei, modificările efectului, ca urmare a modificării
cauzei, tind spre zero. Cu cât valorile cauzei sunt mai mari, cu atât efectul
variază mai puţin la variaţiile cauzei.

a b
2. b) y = + 2
x x
y
lim y = +∞ lim y = 0
x →0 x →∞
x >0

a b 1 ⎛ax+b ⎞
( y )x′ = − − ⋅ 2x = − ⎜ ⎟
x 2 2 2
(x ) x2 ⎝ x ⎠
Deoarece x>0, a, b>0 ⇒ ( y )x′ < 0
x
⇒ y descrescător

În cazul în care cauza tinde spre infinit, efectul mediu, adică efectul
pe unitatea de cauză este zero. Atunci când cauza tinde către zero, efectul pe
fiecare unitate de cauză tinde spre infinit. Efectul mediu este descrescător,
deci, cu cât cauza este mai mare, efectul pe unitatea de cauză este mai mic.
Modelul unifactorial

x b
2. c) Ce = y x′ ⋅ =−
y ax + b
Ce

lim Ce = −1
x x →0
x >0

-1 lim Ce = 0
x →∞

−1 ab
(Ce) x′ = ( −b) ⋅ 2
⋅a = >0⇒
(ax + b) (ax + b) 2
Ce este crescător

Se observă că, la o modificare cu un procent a cauzei, pentru valori


mici ale acesteia, tinzând către zero, efectul se modifică (scade) cu un
procent. În cazul valorilor mari ale cauzei, modificarea cu un procent a
acesteia nu implică nici o modificare a efectului. Indiferent de valorile
cauzei, la modificări (creşteri) cu un procent ale acesteia le corespund
modificări (scăderi) ale efectului cuprinse între zero şi unu. Cu cât valorile
cauzei sunt mai mari, cu atât modificările relative ale efectului sunt mai
mici.

3. y = a + bx + cx2 , a, b şi c nu sunt toţi egali cu zero.


Graficul acestei funcţii depinde de parametrii a, b şi c. De exemplu,
pentru a>0, b<0, c>0 se obţine următorul grafic:

y b
y x′ = 2cx +b = 0 ⇒ x = −
2c
y x′′ = 2c > 0 ⇒ x corespunde
x2
x1 b lui y minim
a −
2c
x ⎧⎛ b ⎞ ∆ ⎫
min y ⎨⎜ − ⎟; − ⎬
⎩⎝ 2c ⎠ 4c ⎭


4c

3. a) Cm = y x′ = 2cx + b
Modele econometrice

Dacă c este negativ, atunci Cm este descrescător, deci variaţiile


efectului ca răspuns la variaţia cauzei sunt din ce în ce mai mici. Dacă b este
pozitiv, înseamnă că, pentru o cauză mai mică decât –b/2c, efectul creşte ca
urmare a creşterii cauzei. Pentru o cauză mai mare decât –b/2c efectul scade
ca urmare a creşterii cauzei. Dacă b este negativ, efectul va scădea ca
urmare a creşterii cauzei.
În cazul în care c este pozitiv, Cm este crescător, deci variaţiile
efectului ca urmare a variaţiilor cauzei sunt din ce în ce mai mari. Dacă b
este negativ, înseamnă că, pentru o cauză mai mică decât –b/2c efectul scade
ca urmare a creşterii cauzei. Pentru o cauză mai mare decât –b/2c, efectul
creşte ca urmare a creşterii cauzei. Dacă b este pozitiv, efectul va creşte ca
urmare a creşterii cauzei.

Cm
b>0
c>0
b<0

x
b

2c

a + bx + cx 2
3. b) y =
x
- pentru a, c>0:
lim y = +∞
x →∞
y
a
lim y = = +∞
x →0
x >0
0+

cx 2 − a x ≥0 a
b + 2 ac ( y ) x′ = ⇒ x 1,2 =
x 2 c
x
⎛ a⎞
a ( y )⎜⎜ ⎟ = 2 ac + b
⎝ c ⎟⎠
c
Modelul unifactorial

a
x 0 + +∞
c
------------- 0 + + + + + + +
( y)′x
y | +∞ b + 2 ac +∞

Ce x bx + 2cx 2
3.c) Ce = y ′ ⋅ =
y a + bx + cx 2
2
lim Ce = 2
x →∞

0 lim Ce = 0
x x →0

4. y = axb, a>0 deoarece y trebuie să fie pozitiv, iar fucţia putere este
o funcţie pozitivă şi b≠1, deoarece altfel s-ar obţine o funcţie liniară.

4. a) Cm = abxb-1 ⇒ grafic similar cu cel al funcţiei iniţiale


y
4. b) y = = a ⋅ x b −1 ⇒ grafic similar cu cel al funcţiei iniţiale
x
x x
4. c) Ce = y ⋅ = a ⋅ b ⋅ x b −1 . =b
y a⋅x b
Modele econometrice

Ce
b>0
b

x
b<0
b

Dacă b este cuprins între zero şi unu, atunci cauza variază în acelaşi
sens cu efectul, dar coeficientul marginal fiind descrescător, înseamnă că
variaţiile efectului sunt din ce în ce mai mici. De asemenea, şi efectul pe
unitatea de cauză este cu atât mai mic cu cât cauza este mai mare. Totuşi,
dacă există o variaţie de un procent a cauzei, efectul va varia cu b procente,
indiferent de mărimea cauzei.
Dacă b este mai mic decât unu, atunci cauza variază în sens invers
efectului. Coeficientul marginal fiind descrescător, înseamnă că variaţiile
efectului sunt din ce în ce mai mici. De asemenea, şi efectul pe unitatea de
cauză este cu atât mai mic cu cât cauza este mai mare. Dacă există o variaţie
de un procent a cauzei, efectul va varia cu b procente, indiferent de mărimea
cauzei.
Dacă b este mai mare decât unu, atunci cauza variază în acelaşi sens
cu efectul. Coeficientul marginal fiind crescător, înseamnă că variaţiile
efectului sunt din ce în ce mai mari. De asemenea, şi efectul pe unitatea de
cauză este cu atât mai mare cu cât cauza este mai mare. Dacă există o
variaţie de un procent a cauzei, efectul va varia cu b procente, indiferent de
mărimea cauzei.
Prin compararea proprietăţilor indicatorilor teoretici ai funcţiilor de
regresie – variaţie continuă – cu indicatorii empirici – variaţie discretă – ai
celor două variabile, calculaţi pe baza seriei statistice –
y − y t −1 y − y t −1 x t − x t −1
cm i = t ; ce i = t : – se va putea alege acea
x t − x t −1 y t −1 x t −1
funcţie de regresie ai cărei indicatori au proprietăţi apropiate cu indicatorii
empirici.
Modelul unifactorial

De exemplu, dacă coeficienţii marginali ai variabilei y în raport de


variabila x, calculaţi pe baza seriei statistice sunt aproximativ egali:
y 2 − y1 y 3 − y 2 y − y n −1
≈ ≈K≈ n ≈ ct ∀ t = 1, n ; se va alege
x 2 − x1 x 3 − x 2 x n − x n −1
funcţia liniară - Yt = a + b xt, sau funcţia putere - Yt = axtb - în cazul în care
coeficienţii empirici de elasticitate vor fi aproximativ egali:

x1 y 2 − y 1 x 2 y 3 − y 2 x y − y n −1
⋅ ≈ ⋅ ≈ K ≈ n −1 ⋅ n
y 1 x 2 − x1 y 2 x 3 − x 2 y n −1 x n − x n −1

De reţinut că, în economia reală, datele statistice relevă corelaţii


diverse şi contradictorii, care nu pot fi descrise cu o singură funcţie
matematică. În astfel de cazuri se recomandă ca identificarea modelului
econometric să se facă cu ajutorul mai multor funcţii de regresie, urmând ca,
în final – în etapa de verificare a modelului –, să se decidă asupra unei
singure forme a modelului.

3.3 Estimarea parametrilor unui model econometric unifactorial

Parametrii unui model econometric sunt reprezentaţi de coeficienţii


funcţiei de regresie acceptată în etapa de identificare a acestuia. Aceşti
parametrii fiind necunoscuţi, ei vor trebui estimaţi (aproximaţi) pe baza
datelor experimentale sistematizate în seriile statistice ale celor două
variabile y şi x, prin valorile yt, xt, t = 1, n .
Funcţiile de regresie ale unui model econometric unifactorial pot fi
funcţii linare, Y= a + bx, sau funcţii neliniare, ca de exemplu:
- funcţia putere – Yt = a xtb ;
- funcţia exponenţială – Yt = ea+bxt ;
- funcţia de gradul doi – Yt = a + bxt + cxt2 ;
c
- funcţia logistică –Y t = .
1 + e a +bx t
Modele econometrice

Deoarece, în numeroase cazuri, funcţiile neliniare (curbilinii) pot fi


liniarizate, estimarea parametrilor unui model econometric se va axa numai
pe cazul modelelor liniare. Liniarizarea unui model neliniar se poate face
prin mai multe procedee, cum ar fi: logaritmarea modelului econometric,
schimbări de variabilă, stabilirea arbitrară a valorii unor parametri etc.
De exemplu:

Liniarizarea prin logaritmare


b
1) Fie modelul neliniar exprimat prin funcţia putere – yt = a xt ut.
Prin transformare logaritmică acesta devine:
ln yt = ln a +b ln xt + ln ut,
sau
* * *
yt = A + b xt + ut
unde:
*
yt = ln yt;
A = ln a;
*
xt = ln xt;
*
ut = ln ut.
2) Cazul modelului neliniar exponenţial – yt = ea+bxt ut
Prin logaritmare acesta devine:
* *
ln yt = a + b xt + ln ut Æ yt = a + b xt + ut

Liniarizarea prin schimbare de variabile


Fie modelul neliniar – yt = b0 + b1x + b2xt2 + _ _ _ + bkxtk + ut
Notând cu: x1t = xt; x2t = xt2;…, xkt = xtk, se obţine modelul liniar
multifactorial:
yt = b0 + b1 x1t + b2 x2t + … + bk xkt + ut

Liniarizarea prin fixarea arbitrară a valorii unor parametri


Acest model poate fi aplicat atunci când, pe baza unei analize
economice a fenomenelor studiate, se poate evalua valoarea unui parametru.
Modelul unifactorial

De exemplu, funcţia logistică se pretează foarte bine la descrierea evoluţiei


consumului (y) unui anumit produs în funcţie de venitul consumatorului (x).
Dar, consumul unui anumit produs are anumite limite raţionale, respectiv un
nivel de saturaţie, nivel estimat prin parametrul „e” al funcţiei logistice.
Stabilind valoarea parametrului prin constanta „c” – acest lucru se poate
face, fie prin calcule statistice de specialitate, fie prin preluarea valorii
acestuia de la o ţară dezvoltată unde consumul acelui produs s-a stabilizat –
funcţia logistică se poate transforma într-o funcţie liniară:

c ⎛ c ⎞ ⎛ c ⎞
yt = a +bx t
⇒⎜ − 1⎟ = e a +bx t ⇒ ln ⎜ − 1⎟ = a + bx t ⇒
1+e ⎝yt ⎠ ⎝yt ⎠
* ∗ ⎛ c ⎞
yt = a + b xt, unde: y t = ln ⎜ − 1⎟
⎝yt ⎠

Revenind la problema estimării parametrilor unui model


econometric, aceştia pot fi calculaţi cu ajutorul mai multor metode cum ar
fi:
a) metoda punctelor empirice (M.P.E.);
b) metoda punctelor medii (M.P.M.);
c) metoda celor mai mici pătrate (M.C.M.M.P.);
d) metoda celor mai mici pătrate generalizată;
e) metoda verosimilităţii maxime (M.V.M) cu informaţie limitată
sau completă.
Metodele a) şi b) se folosesc atunci când nu se urmăreşte o rigoare
statistică a calculelor, datorită simplităţii şi rapidităţii calculelor, sau când
aplicarea M.C.M.M.P. este anevoioasă, necesitând calcule complicate.
Metodele d) şi e) au mai mult valoare teoretică deoarece, în
economie, ipotezele pe care se fundamentează pot fi acceptate cu multă
reţinere, în plus, calculele complicate pe care le solicită, măresc mult costul
estimării parametrilor, fără a genera o creştere pe măsură a preciziei
estimaţiilor.
Modele econometrice

Estimarea parametrilor unui model liniar unifactorial presupune:


- existenţa seriei statistice a celor două variabile economice

Tabelul 3.3.1
xt yt xt2 xt yt ŷ t = â + b̂x t û t = y t − ŷ t (uˆt ) 2

x1 y1 x12 x1 y1 ŷ 1 = â + b̂x 1 û 1 = y 1 − ŷ 1 (uˆ1 ) 2


| | | | | | |
|| || || || || || ||
xn yn xn2 xn yn ŷ n = â + b̂ x n | û n = y n − ŷ n (uˆ n ) 2
Σ xt Σ yt Σ xt2 Σ xt yt ∑ ŷ t ∑ uˆt = 0 ∑ (uˆt )
2

- modelul econometric liniar:


yt = a + bxt + ut (3.3.1)
ŷ t = â + b̂x t (3.3.2)
û t = y t − ŷ t (3.3.3)

unde:
yt, xt = valorile empirice ale variabilelor;
a, b = parametrii modelului;
â , b̂ = estimaţiile parametrilor modelului;
ut = variabila eroare;
uˆt = estimaţia lui ut.

- utilizarea unei metode de estimare pentru a calcula estimatorii


parametrilor modelului.

În acest sens ne referim la:


a) Metoda punctelor empirice (M.P.E.) - constă în alegerea unui
număr de puncte empirice, M(xt, yt), egal cu numărul parametrilor
modelului. Coordonatele acestor puncte se introduc în funcţia de regresie a
modelului şi va rezulta un sistem de ecuaţii egal cu numărul acestora. De
Modelul unifactorial

exemplu, în cazul modelului liniar -vezi relaţia (3.3.1) - vor trebui alese
două puncte. Fie acestea, M3(x3, y3) şi M8(x8, y8):

y3 x3 1 y3
ˆ
y3 = aˆ + bx3 ⎫⎪ y8 x8 1 y8
⎬ ⇒ aˆ = ; b̂ =
y8 = aˆ + bˆx8 ⎪⎭ 1 x3 1 x3
1 x8 1 x8

De regulă, alegerea punctelor empirice se face, fie pe baza


reprezentării grafice a celor două serii statistice, în sensul că acestea ar
trebui să fie foarte aproape de dreapta virtual trasată sau să fie intersectate
de aceasta, fie prin aprecierea că aceste puncte sunt reprezentative pentru
caracterizarea variaţiilor celor două fenomene şi nu sunt rezultatul unor
condiţii speciale.

b) Metoda punctelor medii (M.P.M.) – presupune ca cele două serii


statistice să fie împărţite într-un număr de subserii egal cu numărul
estimatorilor. Pentru fiecare subserie se vor calcula mediile aritmetice ale
celor două variabile. Aceste valori medii se vor introduce în funcţia de
regresie şi se va continua procedura ca în cazul M.P.E. Dacă numărul
termenilor seriilor statistice nu este divizibil cu numărul parametrilor, se va
renunţa la un număr de termeni – cei mai îndepărtaţi în timp sau de media
celor două variabile. De exemplu, în cazul modelului liniar, numărul
parametrilor este egal cu doi. Dacă seriile de timp ale celor două variabile se
referă la nouă perioade, t = 1,9 , se va renunţa la valorile primei perioade,
respectiv la x1 şi y1. În acest caz, cele două serii vor fi:

1
⎛x2 x3 x4 x5 ⎞ x1 = 4 (x 2 + x 3 + x 4 + x5)
⎜⎜ ⎟⇒ ;
⎝y 2 y3 y4 y 5 ⎟⎠ y = 1 (y + y + y + y )
1
4 2 3 4 5
Modele econometrice

1
⎛ x6 x7 x8 x9 ⎞ x2 = 4 (x6 + x7 + x8 + x9 )
⎜⎜ ⎟⇒
⎝y 6 y7 y8 y 9 ⎟⎠ y = 1 (y + y + y + y )
2
4 6 7 8 9

Prin introducerea acestor valori în relaţia (3.3.2) rezultă:

y1 x1 1 y1
aˆ + bˆx 1 = y 1 ⎫⎪ y2 x2 1 y2
⎬ ⇒ aˆ = ; bˆ =
aˆ + bˆx = y
2 2⎪⎭
1 x1 1 x1
1 x2 1 x2

c) Metoda celor mai mici pătrate (M.C.M.M.P.) – este tehnica de


lucru cea mai des folosită la estimarea parametrilor unui model econometric.
Utilizarea acestei metode porneşte de la următoarele relaţii:

yt = a + bxt + ut
ŷ t = â + b̂x t
û t = y t − ŷ t = y t − â − b̂x t

unde:
yt, xt = valorile reale ale celor două fenomene economice existente în
seriile statistice ale acestora;
ŷ t = valorile teoretice ale variabilei y, obţinute numai în funcţie de
valorile factorului esenţial xt şi de valorile estimatorilor
parametrilor a şi b, respectiv aˆ şi bˆ ;
û t = estimaţiile valorilor variabile reziduale ut.

Practic, M.C.M.M.P. constă în a minimiza funcţia:

( ) n
F â , b̂ = min ∑ (y t − ŷ t
t =1
)2 = min
n
(
∑ y t − â − b̂x t
t =1
)
2
(3.3.4)
Modelul unifactorial

adică a minimiza suma pătratelor distanţelor, faţă de axa OY, dintre valorile
reale, yt, şi valorile teoretice, ŷ t .
Condiţia de minim a funcţiei (3.3.4) rezultă din:

∑ 2(y − aˆ − bˆx )(− 1) = 0 ⇒ ∑ (y − aˆ − bˆx ) = 0


∂F (aˆ , bˆ)
n
=0⇒ t t t t (3.3.5)
∂aˆ t =1

∑2 (y − aˆ − bˆx )(− x ) = 0 ⇒ ∑(y x − aˆx − bˆx ) = 0 (3.3.6)


∂F (aˆ, bˆ)
n
2
=0⇒ t t t t t t t
∂bˆ t =1

sistem de ecuaţii ce devine în final:

⎧ n n
⎪⎪ nâ + b̂ ⋅ ∑ x t = ∑ yt
t =1 t =1
⎨ (3.3.7)
n
⎪â ⋅ ∑ x t + b̂ ⋅ ∑ x t2 = ∑ y t x t
⎩⎪ t =1

din care se vor calcula valorile estimatorilor:


- estimaţia parametrului a
1 ∑ xt ∑y (3.3.8)
n â + b̂ ∑ x t = ∑ y t * ⇔ â + b̂ = t
⇔ â = y − b̂ x
n n n

- estimaţia parametrului b

n ∑y t ∑y t xt
∑x t ∑y t xt n ∑ y t x t − ∑ y t ∑x t −x* y
b̂ = = = n (3.3.9)
n ∑x t2 − (∑x t )
2 2
n ∑x t ∑x t
2 −x 2
∑x t ∑x t n

- dispersia variabilei x

σ 2x =
∑ (x t − x )2 =
(
2
∑ x t − 2x t x + x
2
) =
∑xt
2
− 2x
∑xt
+x 2
=
n n n n
Modele econometrice

2 2
∑xt ∑xt
= − 2x 2 + x 2 = −x2
n n
∑ y t xt
−x* y
⇒ b̂ = n
σ 2x

- covarianţa dintre variabilele y şi x

∑ (x t − x )(y t − y ) ∑ (x t y t − x t y − x y t + x ⋅ y ) ∑ x t y t
cov (y , x ) = = = −
n n n
∑xt ∑y t ∑xt y t ∑x i y t
−y −x +x ⋅y = − y ⋅x −x ⋅y +x ⋅ y = −x ⋅y
n n n n
cov (y , x ) ∑ (x t − x )(y t − y )
⇒ b̂ = = (3.3.10)
σ 2x ∑ (x t − x )
2

- coeficientul de corelaţie liniară a celor două variabile

cov(y , x ) σ σy
r ( y , x ) = r (x , y ) = ⇒ r ( y , x ) = bˆ ⋅ x ⇒ bˆ = r ( y , x ) ⋅ (3.3.11)
σxσ y σy σx
unde: σy, σx = abaterile medii pătratice ale variabilelor y şi x.

Sistemul de ecuaţii, format din relaţiile (3.3.5) şi (3.3.6), rezultat în


urma aplicării M.C.M.M.P., poartă numele şi de sistem de ecuaţii normale.
Acest sistem de ecuaţii posedă câteva proprietăţi cum ar fi:
Din ecuaţia (3.3.5) se deduce că:

( )
1) ∑ y t − aˆ − bˆx t = ∑ uˆt = 0 ⇒ M (uˆt ) = 0 – variabila aleatoare ut
t t
este de sumă nulă şi, evident, de medie zero;
Modelul unifactorial

t
( )
2) ∑ y t − â − b̂x t = ∑ (y t − ŷ t ) = 0 ⇒ ∑ y t = ∑ ŷ t
t t t
– suma

valorilor empirice ( ∑ y t ) este egală cu suma informaţiilor teoretice ( ∑ ŷ t )


t t

– principiul conservării informaţiilor.

Din rezolvarea sistemului de ecuaţii rezultă că:

3) aˆ = y − bˆx – dreapta de regresie, ŷ t = â + b̂x t , trasată pe baza


M.C.M.M.P., trece prin punctul M ( x , y ) – vezi figura 3.3.1;

(x t −x)
∑ (y t − y )(x t − x ) ∑ [(y t − y )(x t − x )] ⋅
(x t −x)
4) bˆ = t
= =
∑ (x t − x ) ∑ (x t − x )
2 2

⎡y − y
∑⎢ t
t xt − x

[
⋅ (x t − x )2 ⎥ ∑ bt (x t − x )2 ]
= ⎣ ⎦= t ⇒ panta dreptei de regresie,
∑ (x t − x ) ∑ (x t − x )
2 2
t

yˆ t = aˆ + bˆx t , este o medie aritmetică a pantelor dreptelor ce pot fi trasate


yt −y
prin punctele M ( x , y ) şi M t ( x t , y t ) , respectiv bt = , ponderate
xt − x
cu pătratul abaterilor, ( x t − x ) 2 , variabilei factoriale x – vezi figura 3.3.1.
Modele econometrice

y2 − y
b2 =
y x2 − x yˆ = a + bx
yn

y1 − y
b1 =
x1 − x
M
y

y2 M2
y1
M1
0
x1 x2 x xn x

Figura 3.3.1

b1 ( x1 − x ) + b2 ( x2 − x ) + K + bn ( xn − x )
2 2 2
b=
(x1 − x )2 + (x2 − x )2 + K + (xn − x )2

După estimarea parametrilor a şi b prin valorile aˆ şi bˆ se vor


putea calcula valorile teoretice ale fenomenului explicat y, ŷ t = â + b̂x t , şi
apoi estimaţiile variabilei aleatoare u, prin û t = y t − ŷ t (vezi tabelul 3.3.1,
coloanele 5 şi 6).

3.4 Verificarea modelului econometric

Întrucât modelul econometric, în etapele de specificare, identificare


şi estimare, se fundamentează pe acceptarea unor ipoteze de lucru, cât şi pe
date experimentale de sondaj, este necesar ca, înainte de utilizarea sa ca
instrument pertinent scopului urmărit, acesta să fie verificat (testat, filtrat).
În această etapă se pune problema similitudinii dintre modelul economic
real, descris de seriile statistice ale fenomenelor analizate, şi modelul
teoretic, de natură econometrică, construit şi rezolvat.
Modelul unifactorial

În economie, spre deosebire de domeniul tehnic, de exemplu, nu


putem vorbi de o similitudine absolută între modelul teoretic şi modelul real
(cum poate să existe între macheta unei clădiri şi clădirea construită), ci de o
similitudine statistică între cele două modele, în sensul că modelul
econometric posedă şi descrie în mare (în medie) principalele caracteristici
ale modelului economic real.
Practic, acceptarea econometrică a modelului teoretic ca model
similar, ca aproximaţie statistică echivalentă cu modelul real, presupune:
3.4.1 Verificarea ipotezelor pe care se fundamentează estimarea
parametrilor unui model econometric
3.4.2 Verificarea semnificaţiei estimatorilor pararametrilor
modelului econometric
3.4.3 Verificarea similitudinii modelului econometric

3.4.1 Verificarea ipotezelor pe care se fundamentează estimarea


parametrilor unui model econometric

În general, estimatorul sau estimaţia este o aproximaţie a unei


dimensiuni privind un anumit fenomen. Această dimensiune (volum,
suprafaţă, valoare etc.) exactă, stabilă şi repetabilă, adică constantă,
reprezintă parametrul (măsura) unei caracteristici, al unei însuşiri a unităţilor
statistice.
Statistica calculează parametrii caracteristicilor unităţilor statistice
ale unei populaţii în urma unei observări totale asupra colectivităţii
statistice. Dacă datele privind valorile caracteristicilor provin dintr-o
observare selectivă (sondaj), indicatorii calculaţi din aceste date reprezintă
estimaţiile statistice ale parametrilor, adică ale indicatorilor care s-ar fi
obţinut din prelucrarea datelor provenite dintr-o observare totală. Dar
statistica nu foloseşte orice fel de aproximaţii, de estimaţii ale parametrilor,
ci numai estimaţii de maximă verosimilitate1.

1
Vezi teorema 2 şi 3.
Modele econometrice

Din acest motiv, estimarea parametrilor unui model econometric se


fundamentează pe câteva ipoteze pe care trebuie să le posede modelul
econometric – yt = a + bxt + ut.
Aceste ipoteze se referă la:
I1: Cele două variabile yt şi xt sunt observate fără erori de măsură. ut
este o variabilă aleatoare, iar variabila xt este un fenomen cu
valori predeterminate => variabila explicată yt este la rândul ei o
variabilă aleatoare;
I2: Variabila aleatoare ut este de medie nulă, M(ut) = 0, şi de
dispersie constantă, D 2 (u1 ) = D 2 (u 2 ) = K = D 2 (u n ) = σ u2 , ∀ t = 1, n .
Ipoteza I2 presupune că erorile ut sunt homoscedastice şi nu
heteroscedastice D 2 ( u1 ) ≠ D 2 ( u2 ) ≠ K ≠ D 2 ( u n ) ≠ σu2 ;
I3: Valorile variabilei reziduale sunt independente (nu sunt corelate),
adică nu există fenomenul de autocorelare a erorilor:
⎧0, i ≠ j ⇒ erorile sunt independente
cov( u i , u j ) = ⎨
⎩≠ 0, i ≠ j ⇒ erorile sunt autocorelate
I4: Variabila aleatoare ut urmează distribuţia normală, de medie zero
şi de abatere medie pătratică constantă şi egală cu
σ u = σ u2 = ct , respectiv L(ut) = N(0, σu)

Dacă aceste ipoteze pot fi acceptate, iar estimarea parametrilor


modelului liniar unifactorial – yt = a + bxt + ut – , atunci se pot demonstra
următoarele:
Se efectuează o selecţie de volum n, adică se observă valorile
caracteristicii x şi, pentru fiecare valoare observată, valorile caracteristicii
y / x = xt = y t . Se obţine astfel selecţia: (xt,yt)t=1,….,n. Pe baza acestei selecţii
se estimează parametrii a şi b din modelul de regresie liniară -yt =a+bxt+ut..
Modelul unifactorial

Parametrii a şi b pot fi estimaţi prin:


- metoda celor mai mici pătrate prin care se minimizează suma
pătratelor erorilor, adică funcţia:

( ) n
F â , b̂ = min ∑ û t2 = min ∑ y t − â − b̂x t
t =1
n

t =1
( )2

- metoda verosimilităţii maxime prin care se maximizează funcţia


de verosimilitate, adică:

L (y t ; a, b ) = f (y 1 ) ⋅ f (y 2 ) ⋅ ... ⋅ f (y n ); t = 1 , n , unde f este


repartiţia caracteristicii y.

Teorema 1
Dacă variabila reziduală ut este repartizată normal, având media
egală cu zero şi abaterea medie pătratică σu, atunci metoda verosimilităţii
maxime este echivalentă cu metoda celor mai mici pătrate.
Demonstraţie
În cazul modelului liniar y = a + bx + u , u este repartizată N(0, σu),
ceea ce este echivalent cu y repartizată N(a+bx, σ).
Funcţia de verosimilitate a caracteristicii y este:

( )
L y t ; â , b̂ = f (y 1 ) ⋅ f (y 2 ) ⋅ ... ⋅ f (y n )

1
( )
2 1
( )
2

( )
− y 1 −â −b̂x 1 − y n −â −b̂x n
1 2σ 2 1 2σ 2
L y t ; â , b̂ = e ⋅ ... ⋅ e ⇒
2π σ 2π σ
∑ ( y t − aˆ − bˆ x t )
n
1

( )
n 2

⎛ 1 ⎞
⇒ L y t ; aˆ , bˆ = ⎜
2

⎟ ⋅e t =1

⎝ 2π σ ⎠
Modele econometrice

Metoda verosimilităţii maxime presupune maximizarea funcţiei de


verosimilitate:
⎡ ⎛ 1 n
2⎤
∑ (y )
n
⎞ 1
max L( yt , aˆ , bˆ) ⇔ max ln L( yt , aˆ , bˆ) = max ⎢ln⎜⎜ ⎟⎟ − t − aˆ − bˆxt ⎥
a ,b a ,b a ,b ⎢ ⎝ 2π σ ⎠ 2σ 2 ⎥
⎣ t =1 ⎦

n
⎛ 1 ⎞
Deoarece σ este constant, ln⎜⎜ ⎟⎟ = k = constant.
⎝ 2πσ ⎠

⎡ ⎛ 1 n ⎤
∑ (y ) ∑( ) ⎤⎥ =
⎞ 1
n ⎡ n
max ⎢ln⎜⎜ ⎟ − − aˆ − bˆx 2 ⎥ = k + max ⎢− 1 y t − aˆ − bˆxt
2

a ,b ⎢ ⎝ 2π σ ⎟ 2σ 2 t t
⎥ a ,b ⎢ 2σ 2
⎣ ⎠ t =1 ⎦ ⎣ t =1 ⎥⎦

∑( ) ( )
⎛ 1 ⎞ ⎡ n 2⎤ ⎛ 1 ⎞
= k + ⎜− ⎟ min ⎢ y t − aˆ − bˆxt ⎥ = k + ⎜ − ⎟ min F aˆ , bˆ
⎝ 2σ 2 ⎠ a ,b ⎢⎣ t =1 ⎥⎦ ⎝ 2σ 2 ⎠ a ,b

În concluzie, a determina maximul funcţiei de verosimilitate este


echivalent cu a determina minimul sumei pătratelor erorilor.

Observaţie
Se ştie că estimatorii de verosimilitate maximă sunt estimatori
nedeplasaţi, consistenţi şi eficienţi, adică:
- M ( â ) = a , M ( b̂ ) = b (estimatorii sunt nedeplasaţi);
p p
- â ⎯⎯→ a , b̂ ⎯⎯→ b (estimatorii sunt consistenţi);
- orice alt estimator pentru a şi b are dispersia mai mare decât
dispersia lui â şi b̂ (estimatorii sunt eficienţi).
În cazul repartiţiei normale a variabilei reziduale, estimatorii obţinuţi
prin metoda celor mai mici pătrate sunt nedeplasaţi, consistenţi şi eficienţi.
În consecinţă, aceşti estimatori pot fi consideraţi drept cei mai buni în
procesul de decizie sau de modelare econometrică.
Modelul unifactorial

Teorema 2
Dacă variabila reziduală este repartizată normal, având media egală
⎛ ⎞
⎜ ⎟
σ u2
cu zero şi dispersia σ u2 = ct . , atunci bˆ este repartizat N ⎜ b , ⎟.


n
(
∑ xt − x )2 ⎟

⎝ t =1 ⎠

Demonstraţie
n
(
∑ y t − y xt −x
t =1
)( ) n
( )
∑y t xt − x − y ∑ xt − x
t =1
n

t =1
( ) n
∑y t xt − x ( ) n
b̂ = = = t =n1 = ∑αt y t
n
(
∑ xt −x
t =1
) 2 n
(
∑ xt −x
t =1
)2
(
∑ xt − x
t =1
)2 t =1

unde:
xt − x
αt = n
∑ xt − x
t =1
( )2

u t ~ N (0, σ u ) ⇒ y t ~ N (a + bx t , σ u ) , t = 1, … , n

În concluzie, b̂ fiind combinaţie liniară de variabile aleatoare


repartizate normal, este şi el repartizat normal.

n n n n
M ( b̂ ) = ∑ αt M ( y t ) = ∑ αt ( a + bx t ) = ∑ αt a + ∑ bαt x t
t =1 t =1 t =1 t =1
n 2 n 2
D 2 ( b̂ ) = ∑ α t D 2 ( y t ) = σ u2 ∑ α t
t =1 t =1

Se calculează:
n n ( x t − x)
∑αt = ∑ n
=0
t =1 t =1
∑ ( x t − x) 2
t =1
Modele econometrice

n n n n 2
(x − x )x =
2 2
n n
∑xt − x ∑x t ∑ x t − 2x ∑ x t + n x
t =1 t =1
∑αt x t = ∑ t t
= t =1 t =1
=1
∑ (x − x ) ∑ (x − x ) ∑ (x )
n 2 n 2 n 2
t =1 t =1
t t t −x
t =1 t =1 t =1

n
∑ αt
2
=∑
n (x − x ) = 1
t
2

⎡ ( ∑ (x − x )
⎢⎣ ∑ x − x ) ⎥⎦
2 n 2
t =1 t =1 n ⎤ 2
t
t t =1
t =1

Deci:

M ( b̂ ) = b

2 σ u2
D ( b̂ ) = n
(
∑ xt − x
t =1
)2

Teorema 3
Dacă variabila reziduală este repartizată normal, având media egală
cu zero şi dispersia σ u2 = ct . , atunci aˆ este repartizat
⎛ ⎛ ⎞ ⎞⎟
⎜ ⎜1 ⎟
x2
N ⎜ a , σ u2 ⋅ ⎜ + n ⎟⎟.


⎜n


∑ xt − x ( ) 2 ⎟⎟
⎟⎟
⎠⎠
⎝ t =1

Demonstraţie
n
∑yt n ⎛1
n ⎞ n
â = y − b̂ x = t =1 − x ∑ αt y t = ∑ ⎜ − xαt ⎟ y t = ∑ βt y t
n t =1 t =1⎝ n ⎠ t =1

unde:
1
βt = − x α t , t =1,…., n
n
u t ~ N (0, σ u ) ⇒ y t ~ N (a + bx t , σ u ) , t = 1, … , n
Modelul unifactorial

În concluzie, â fiind combinaţie liniară de variabile aleatoare


repartizate normal, este şi el repartizat normal.

n n n n
M ( â ) = ∑ β t M ( y t ) = ∑ β t ( a + bx t ) = ∑ β t a + ∑ bβ t x t
t =1 t =1 t =1 t =1
n 2 n 2
D 2 ( â ) = ∑ β t D 2 ( y t ) = σ u2 ∑ β t
t =1 t =1

Se calculează:

n n ⎡1 ⎤ n
∑ βt = ∑ ⎢ − x αt ⎥ = 1 − x ∑ αt = 1
t =1 t =1 ⎣ n ⎦ t =1

n n ⎡1 ⎤ n
∑ β t x t = ∑ ⎢ − x α t ⎥x t = x − x ∑ α t x t = 0
t =1 t =1 ⎣ n ⎦ t =1
2
n 2 n ⎡1 ⎤ 1 2x n n 2 1 x2
∑ βt = ∑ ⎢ − x αt ⎥ = − ∑ αt + x ∑ αt = + n
2
t =1 t =1 ⎣ n ⎦ n n t =1 t =1 n
∑ xt −x
t =1
( )
2

Deci:

M ( â ) = a
⎛ ⎞
⎜1 x2 ⎟
D 2 ( â ) = σ u2 ⎜ + n ⎟
⎜n ⎟
∑ (x t − x )
2
⎜ ⎟
⎝ t =1 ⎠

Teorema 4
Dacă x0 este fixat, iar variabila reziduală este repartizată normal,
având media egală cu zero şi dispersia σ u2 = ct . , atunci ŷ = â + b̂x 0 este
⎛ ⎛ ⎞⎞
⎜ ⎜ ⎟⎟
⎜ 2⎜ 1
repartizat N a + bx 0 , σ u + n
(x0 − x )
2
⎟⎟ .


⎜n


∑ xt − x( 2
) ⎟⎟
⎟⎟
⎠⎠
⎝ t =1
Modele econometrice

Demonstraţie
n
∑yt n
ŷ = â + b̂x 0 = y + b̂ (x 0 − x ) = t =1 + (x 0 − x ) ∑ α t y t =
n t =1
n ⎡1 ⎤ n
= ∑ ⎢ + (x 0 − x )α t ⎥ y t = ∑ γ t y t
t =1 ⎣ n ⎦ t =1

unde:
1
γt = + (x 0 − x )α t , t = 1, …, n
n
u t ~ N (0, σ u ) ⇒ y t ~ N (a + bx t , σ u ) , t = 1, … , n

Deci, ŷ fiind combinaţie liniară de variabile aleatoare repartizate


normal, este şi el repartizat normal.
∧ n n n n
M ( y ) = ∑ βt M ( y t ) = ∑γ t ( a + bxt ) = ∑γ t a + ∑bγ t x t
t =1 t =1 t =1 t =1

( ) n n
(
F â,b̂ = min ∑(y t − ŷ t ) = min ∑ y t − â − b̂x t
t =1
2

t =1
)2

Se calculează:
n n ⎡1 ⎤ n
∑ γ t = ∑ ⎢ + (x 0 − x )α t ⎥ = 1 + (x 0 − x ) ∑ α t = 1
t =1 t =1 ⎣ n ⎦ t =1

n n ⎡1 ⎤ n
∑γ t x t = ∑ ⎢ + (x 0 − x )αt ⎥x t = x + (x 0 − x ) ∑αt x t = x + (x 0 − x ) = x 0
t =1 t =1⎣ n ⎦ t =1

⎤ 1 2(x −x ) n (x −x )
2 2
n n ⎡1 2n 2 1
∑γt = ∑⎢ +(x0 −x )αt ⎥ = + 0 ∑αt +(x0 −x ) ∑αt = + n 0
2

t =1 t =1⎣n ⎦ n n t =1 t =1 n
∑ x −x
2
(
t =1
t )
Modelul unifactorial

Deci:
M ( ŷ ) = a + bx 0
⎛ ⎞
⎜1 (x − x )2 ⎟
D 2 ( ŷ ) = σ u2 ⎜ + n 0 ⎟
⎜n


∑ xt − x
t =1
( 2
) ⎟

Teorema 5
Dacă variabila reziduală este repartizată normal, având media egală
cu zero şi dispersia σ u2 = ct . , atunci eroarea previziunii, û t = y t − ŷ t ,
⎛ ⎛ ⎞⎞
⎜ ⎜ 1 x
t = 1, .., n, este repartizată N ⎜ 0,σ u2 ⎜1 − − n t
− x (
2 ⎟⎟
⎟⎟ .
)


⎜ n


2 ⎟⎟
∑ x t − x ⎟⎟
⎠⎠
( )
⎝ t =1

Demonstraţie
û t = y t − ŷ t = y t − â − b̂x t

unde:
â , bˆ sunt repartizaţi normal
u t ~ N (0, σ u ) ⇒ y t ~ N (a + bx t , σ u ) , t = 1, … , n
În concluzie, û t fiind combinaţie liniară de variabile aleatoare
repartizate normal, este şi ea repartizată normal.

M ( ût ) = M ( y t − ŷ t ) = M ( y t ) − M ( â + b̂x t ) = a + bxt − a − bxt = 0


( )2 2 2
( 2
) ( ) ( )
D2 (uˆt ) = M uˆt − M (uˆt ) = M (uˆt ) = M ( yt − yˆt ) = M yt2 − 2M ( yt yˆt ) + M yˆt
2

M ( y t2 ) = D 2 ( y t ) + M ( y t ) 2 = σ u2 + ( a + bx t ) 2
⎛ ⎞
⎜ 1 ( x −x )2 ⎟
M ( ŷ t2 ) = D 2 ( ŷ t ) + M ( ŷ t ) 2 = σ u2 ⎜ + n t ⎟ + (a + bx t )2
⎜n 2 ⎟
⎜ ∑( x t − x ) ⎟
⎝ t =1 ⎠
Modele econometrice

M ( yt yˆt ) = M ((a + bxt + ut )(aˆ + bˆxt )) = M ((a + bxt )((aˆ + bˆxt )) + M (ut (aˆ + bˆxt ))
= (a + bx )2 + M (u (aˆ + bˆx ))
t t t

M ( u t ( â + b̂x t )) = M ( u t ( y − b̂ x + b̂x t )) ⎫

n ⎬⇒
b̂ = ∑ α k y k ⎪
k =1 ⎭
⎡ ⎛ n n ⎞⎤
M ( u t ( â + b̂x t )) = M ⎢u t ⎜ y − x ∑ α k y k + x t ∑ α k y k ⎟⎥ =
⎣ ⎝ k =1 k =1 ⎠⎦
n n
= M ( ut y ) − M ( x ∑α k y k ut ) + M ( x t ∑α k y k ut )
k =1 k =1

1 n 1 1
M ( ut y ) = M ( ∑ y k u t ) = M ( u t2 ) = σ u2
n k =1 n n

(deoarece erorile sunt necorelate între ele)

n n n
M ( x ∑α k yk ut ) = xM (∑α k yk ut ) = x ∑α k M ( yk ut )
k =1 k =1 k =1
n n n
M ( xt ∑ α k yk ut ) = xt M (∑α k yk ut ) = xt ∑ α k M ( yk ut )
k =1 k =1 k =1
n n

∑ α M ( y u ) = ∑ α M ((a + bx
k =1
k k t
k =1
k k + uk )ut ) =
n n n
= ∑ α k M ((a + bxk )ut ) + ∑ α k M (uk ut ) = ∑ α k (a + bxk ) M (ut ) + α t M (ut ut )
k =1 k =1 k =1

( xt − x)
= n
σ2
∑ ( x − x)
t =1
t
2

Deci:
1 2 ( x −x )2
M ( u t ( â + b̂x t )) = σu + n t
n 2
∑( x t − x )
t =1
Modelul unifactorial

Din relaţiile anterioare rezultă că:


⎛ ⎞
⎜1 ( x −x )2 ⎟
D 2 ( û t ) = σ u2 + ( a + bx t ) 2 + σ u2 ⋅ ⎜ + n t ⎟ + ( a + bx t ) 2 −
⎜n 2 ⎟
⎜ ∑( x t − x ) ⎟
⎝ t =1 ⎠
⎛ ⎞ ⎛ ⎞
⎜1 ( x −x )2 ⎟ ⎜ ( xt − x ) 2 ⎟
− 2σ u2 ⎜ + n t ⎟ − 2( a + bx t ) 2 = σ u2 ⎜1 − 1 − ⎟
⎜n 2 ⎟ ⎜ n n
( xt − x ) 2 ⎟
⎜ ∑( x t − x ) ⎟ ⎜ ∑ ⎟
⎝ t =1 ⎠ ⎝ t = 1 ⎠

Teorema 6
Dacă variabila reziduală este repartizată normal, având media egală
1 n ∧2
cu zero şi dispersia σ u2 = ct . , atunci ∑ u t este un estimator
n − 2 t =1
nedeplasat pentru dispersia variabilei reziduale σ u2 .

Demonstraţie
Trebuie demonstrat că:

⎛ 1 n 2⎞
∑ û t ⎟ = σ u
2
M⎜
⎝ n − 2 t =1 ⎠

Folosind teorema anterioară rezultă că:

⎛ 1 n 2⎞ 1 n 2 1 n 2
M⎜ ∑ût ⎟ = ∑ M ( ût ) = ∑ D ( ût ) =
⎝ n − 2 t =1 ⎠ n − 2 t =1 n − 2 t =1
⎛ ⎞ ⎛ n ⎞
⎜ 2 ⎟ ⎜ ∑ ( xt −x ) 2 ⎟
1 n ⎜ 1 ( xt − x ) ⎟ 2 1 ⎜ ⎟ ⋅σ u2 = σ u2
= ∑ 1− − ⋅σ u = n −1 − t n=1
n − 2 t =1⎜ n n 2 ⎟ n − 2 ⎜ 2⎟
⎜ ∑( x t − x ) ⎟ ⎜ ∑( x t − x ) ⎟
⎝ t =1 ⎠ ⎝ t =1 ⎠
Modele econometrice

Teorema 7
Dacă variabila reziduală este repartizată normal, având media egală
cu zero şi dispersia σ u2 = ct . , atunci eroarea previziunii û n +τ = y n +τ − ŷ n +τ ,
⎛ ⎛ ⎞⎞
⎜ ⎜ 1 x
este repartizată N ⎜ 0, σ u2 ⎜1 + + n n +τ
−x( )2 ⎟⎟
⎟ ⎟ , pentru orice τ.





n
∑ xt − x ( )2 ⎟⎟
⎟⎟
⎠⎠
⎝ t =1

Demonstraţie
Se reia demonstraţia teoremei 5, unde t se înlocuieşte cu τ+n şi,
deoarece τ+n este mai mare ca n, pentru orice k = 1,.., n, M (u k u n+τ ) = 0 ,
n
rezultă că: ∑α M ( y u
k =1
k k n +τ ) = 0 şi M (un +τ y ) = 0 .

Deci M ( u n +τ ( â + b̂x n +τ )) = 0

În final, rezultă că:


⎛ ⎞
⎜ 1 x
D 2 (û n +τ ) = σ u2 + (a + bx n +τ ) + σ u2 ⎜1 + + n n +τ
2 ( − x
2 ⎟
)
⎟ + (a + bx n +τ )2 −



n
t
( 2
∑ xt − x ⎟
=1


)
⎛ ⎞

1
− 2(a + bxn +τ ) = σ u2 ⎜1 + + n n +τ
2 ( x −x ⎟ )
2 ⎟

⎜ n
⎜ ∑ (xt − x ⎟)
2 ⎟

⎝ t =1 ⎠
Demonstraţia pentru normalitate şi valoarea medie este identică cu
cea de la teorema 5.
Deoarece, cele patru ipoteze, I1, I2, I3 şi I4, au fost acceptate a priori
în etapa de estimare a parametrilor, în această etapă urmează ca ele să fie
testate, iar eventualele abateri de la cerinţele lor să fie corectate prin
utilizarea unor proceduri econometrice adecvate fiecărei abateri.
Modelul unifactorial

De regulă, în cazul unui număr mare al observaţiilor efectuate


t = 1, n , n → α , ipoteza de normalitate a variabilei eroare ut se acceptă fără
rezerve.

Verificarea ipotezelor de fundamentare a M.C.M.M.P.

I1 Variabilele x şi y nu sunt afectate de erori de măsură.


Această ipoteză se poate verifica cu regula celor trei sigma, regulă
care constă în verificarea următoarelor relaţii:
x t ∈ (x ± 3 σ x ) ⇔ x − 3 σ x < x t < x + 3 σ x
( )
y t ∈ y ± 3σ y ⇔ y − 3σ y < y t < y + 3σ y

unde:
∑ (x t − x )
2
σx =
n
∑ (y t − y )
2
σy =
n

Dacă valorile acestor variabile aparţin intervalelor x t ∈ (x ± 3σ x ) şi


( )
y t ∈ y ± 3 σ y , ipoteza de mai sus poate fi acceptată fără rezerve.
Această ipoteză, referitoare la calitatea datelor înregistrate, se
consideră rezolvată în etapa de prelucrare a datelor observate statistic sau,
cel mai târziu, în etapa de identificare a modelului.

I2 Ipoteza de homoscedasticitate a variabilei reziduale –


Variabila aleatoare (reziduală) u este de medie nulă M (û ) = 0 , iar
dispersia ei s û2 este constantă şi independentă de X.
Pe baza acestei ipoteze se poate admite că legătura dintre Y şi X este
relativ stabilă. Contrariul acestei ipoteze este heteroscedasticitatea.
În cazul modelului liniar y t = a + bxt + u t , reziduurile
û t = y t − ŷ t = y t − â − b̂x t sunt homoscedastice dacă dispersiile lor sunt
constante şi egale cu dispersiile teoretice, pentru orice t şi sunt independente
de variabila exogenă x.
Modele econometrice

s u2ˆ = M (uˆ t ) 2 = σ u2 , (∀)t = 1, n

Contrariul homoscedasticităţii este heteroscedasticitatea, care


înseamnă că erorile nu au dispersiile egale ci diferite:
M ( u 1 ) 2 ≠ M ( u 2 ) 2 ≠ ... ≠ M ( u n ) 2 ≠ σ u2 .
Dacă dispersiile nu mai sunt egale, estimatorii rămân nedeplasaţi, dar
nu mai sunt eficace, M.C.M.M.P. conducând la o subestimare a parametrilor
modelului, influenţând sensibil şi calitatea diferitelor teste statistice aplicate
acestuia.
Depistarea heteroscedasticităţii se poate realiza prin mai multe
procedee:
I2.1) Procedeul grafic - care constă în construirea corelogramei
privind valorile variabilei factoriale x şi ale variabilei reziduale u. Dacă, pe
măsura creşterii (scăderii) valorilor variabilei factoriale x, se observă o
creştere (scădere) a valorilor variabilei reziduale u, înseamnă că cele două
variabile sunt corelate şi nu independente.

û û

x x

Figura 3.4.1 Corelare pozitivă Figura 3.4.2 Corelare negativă

I2.2) Procedeul dispersiilor variabilei reziduale


Acest procedeu se poate aplica atunci când se dispune de serii lungi
de date. În acest caz, seria valorilor variabilei reziduale se împarte în două
sau mai multe grupe, pentru fiecare grupă calculându-se dispersiiile
corespunzătoare ( s û21 , s û22 ,... ). Dacă se acceptă ipoteza că dispersiile acestor
grupe nu diferă semnificativ, se acceptă ipoteza de homoscedasticitate şi se
utilizează testul Fisher-Snedecor.
Modelul unifactorial

- dacă su21 ≈ su22 , atunci se acceptă ipoteza I2;


- dacă su21 ≠ su22 , atunci se respinge ipoteza I2.

Testul Fisher-Snedecor constă în calcularea raportului dintre cele


două dispersii (dispersia având valoarea cea mai mare fiind plasată la
numărător; iar dacă numărul de termeni ai seriei este impar se recomandă
eliminarea termenului din mijlocul seriei, astfel încât să se ajungă la
subeşantioane egale):

n/2
⎛ n − k −1⎞
s u21 ∑u
t =1
2
1 /⎜
⎝ 2


Fc = = (3.4.1)
s u22 n
⎛ n − k −1⎞
∑ n
u 22 / ⎜
⎝ 2


t = +1
2

- dacă Fc > F ⎛ n − k −1 ⎞ ⎛ n − k −1 ⎞
, atunci ipoteza de homoscedasticitate este
α; ⎜ ⎟; ⎜ ⎟
⎝ 2 ⎠ ⎝ 2 ⎠

infirmată, deci erorile sunt heteroscedastice, eliminarea acestui fenomen


făcându-se cu ajutorul metodei regresiei ponderate;
- dacă Fc ≤ F ⎛ n − k −1 ⎞ ⎛ n − k −1 ⎞ atunci se acceptă ipoteza de
α; ⎜ ⎟; ⎜ ⎟
⎝ 2 ⎠ ⎝ 2 ⎠

homoscedasticitate.

I2.3) Calculul coeficientului de corelaţie liniară simplă


cov(u , x ) ∑ (ut − u )(x t − x ) ∑ut (x t − x )
ru / x = = = (3.4.2)
σu σ x n σuσ x n σuσ x
- dacă valoarea coeficientului de corelaţie liniară este aproximativ
egală cu zero – ru/x ≅ 0, atunci se acceptă ipoteza de homoscedasticitate,
variabilele u şi x fiind independente;
- dacă valoarea coeficientului de corelaţie liniară este diferită de
zero – ru/x ≠ 0, atunci se respinge ipoteza de homoscedasticitate.
Modele econometrice

I2.4) Acceptarea sau respingerea ipotezei de homoscedasticitate se


mai poate realiza şi cu ajutorul metodei analizei variaţiei.
Cele două restricţii enunţate mai sus se realizează dacă variabila
reziduală u şi variabila explicativă x sunt independente. Pe această premisă
se fundamentează utilizarea metodei analizei variaţiei la acceptarea sau
respingerea ipotezei de homoscedasticitate.
Metoda analizei variaţiei porneşte de la relaţia:

y t − y = y t − ŷ t + ŷ t − y
(y t − y ) = (y t − ŷ t + ŷ t − y )
2 2

n n
∑ ( y t − y ) = ∑ [( ŷ t − y ) + ( y t − ŷ t ) ]
2 2
(3.4.3)
t =1 t =1
n n n n n
∑(yt − y ) = ∑[(ŷt − y ) + (yt − ŷt ))] = ∑(ŷt − y ) + ∑(yt − ŷt ) + 2∑(ŷt − y )(yt − ŷt )
2 2 2 2
(3.4.4)
t =1 t =1 t =1 t =1 t =1

Dar y t = a + bxt + u t ;
ŷ t = â + b̂x t ⇒ y = â + b̂x
û t = y t − ŷ t
n
⇒ 2 ∑ (Yˆt − y )( y t − Yˆt ) = 2 ∑ ( aˆ + bˆ xt − aˆ − bˆ x )uˆ t =
t =1

n
= 2 bˆ ∑ ( xt − x ) u t = 2 n bˆ cov( u t , xt )
n

Dacă împărţim relaţia (3.4.4) la n ⇒ σ 02 = σ x2 + σ u2ˆ + 2 bˆ cov(u, x)


Pentru ca egalitatea să se verifice este necesar ca:
cov(u , x) = 0 (b ≠ 0) Acceptarea ipotezei I2 pe baza analizei variaţiei constă
în efectuarea următoarelor calcule:
Modelul unifactorial

∑(y t − y ) = A ⎫
2 - dacă A=B+C, atunci variabilele ut şi xt sunt
⎪⎪ independente şi se acceptă I2;
∑ (Yˆt − y ) = B ⎬
2

⎪ - dacă A≠B+C atunci ut şi xt sunt corelate


∑ ( y t −Yˆt ) = C ⎪⎭
2
şi se respinge I2

Dacă se constată existenţa fenomenului de heteroscedasticitate,


acesta trebuie eliminat deoarece prezenţa lui determină subestimarea
parametrilor modelului şi obţinerea de valori viciate, fiind afectată calitatea
estimatorilor, aceştia nemaifiind eficienţi (dispersie minimă).

I2.5) Estimarea unei matrici a covarianţelor corespunzătoare


estimatorilor parametrilor modelului1 adecvată aplicării M.C.M.M.P. în
cazul unui model conţinând erori heteroscedastice.
Heteroscedasticitatea erorilor implică faptul că dispersiile
corespunzătoare erorilor nu mai sunt egale, ci diferite, caz în care estimatorii
parametrilor modelului rămân nedeplasaţi, dar nu mai sunt eficace. Astfel,
aplicarea M.C.M.M.P. va conduce la o subestimare a parametrilor
modelului, influenţând sensibil şi calitatea diferitelor teste statistice aplicate
modelului.
În cazul unui model multifactorial, vectorul estimatorilor
parametrilor modelului se calculează, matriceal, cu ajutorul relaţiei:
Bˆ = ( X ′X ) ⋅ ( X ′Y ) . Matricea varianţelor şi covarianţelor corespunzătoare
−1

acestuia este de forma: V (B ) = σ u2 ⋅ ( X ′X )


−1 2
. Acest mod de calcul al
matricei varianţelor şi covarianţelor este valabil doar în cazul în care
aplicarea M.C.M.M.P. conduce la obţinerea de estimatori eficienţi,
convergenţi şi nedeplasaţi, deci ipotezele corespunzătoare acestei metode au
fost verificate în prealabil. În cazul unor erori heteroscedastice, a căror
formă este, în general, necunoscută, este posibil, ca prin aplicarea metodei
regresiei ponderate în vederea eliminării heteroscedasticităţii erorilor, să nu
se obţină estimatori consistenţi. White a arătat că este posibil să se calculeze
1
Conform Wiliam H. Greene, Econometric Analysis, 2d ed., Macmillan, New York, 1993,
p. 384-392
Modele econometrice

un estimator adecvat al matricei covarianţelor corespunzătoare estimatorilor


parametrilor modelului, chiar dacă există o relaţie de dependenţă între
erorile heteroscedatice şi variabilele exogene incluse în model, pe care a
denumit-o matricea covarianţelor estimatorilor consistenţi heteroscedastici
(HCCME), de forma:

( X ′X )−1 ⎛⎜ ∑ u t2 xt xt ′ ⎞⎟( X ′X )−1


n
n
VW (B ) = (3.4.5)
n−k ⎝ t =1 ⎠

unde:
n = numărul de observaţii;
k = numărul regresorilor;
ut = variabila reziduală.
Prin aplicarea acestei matrici, estimaţiile punctuale ale parametrilor
nu vor suferi modificări, ci doar abaterile standard corespunzătoare
parametrilor. Utilizarea acestei matrici va permite observarea mai rapidă a
prezenţei fenomenului de heteroscedasticitate a erorilor. Astfel, abaterile
standard vor putea fi mai mari sau mai mici comparativ cu cele obţinute în
cazul modelului iniţial, iar valorile mai mici înregistrate de testul Student, t,
vor semnaliza faptul că estimatorii parametrilor sunt nesemnificativi, deci
posibila prezenţă a erorilor heteroscedastice.

I2.6) Testul Goldfeld-Quandt3


Acest test se poate aplica atunci când se dispune de serii lungi de
date şi când una dintre variabile reprezintă cauza heteroscedasticităţii (între
dispersia variabilei reziduale heteroscedastică şi variabila exogenă există o
relaţie de dependenţă pozitivă), şi presupune parcurgerea următoarelor
etape:
• ordonarea crescătoare a observaţiilor în funcţie de variabila
exogenă x;

2
vezi demonstraţie op. cit., p.182
3
Conform D. N. Gujarati, Basic Econometrics, 3rd ed., New York, Mc Graw-Hill, 1995,
p 374-375.
Modelul unifactorial

• eliminarea a c observaţii centrale, c fiind specificat a priori. În


privinţa numărului de observaţii omise, c, au fost emise diverse opinii. În
cazul unui model unifactorial, Goldfeld şi Quandt, în urma efectuării
experimentelor Monte-Carlo, au propus ca c să fie aproximativ egal cu 8 în
cazul în care mărimea eşantionului este de aproximativ 30 de observaţii şi
16, dacă eşantionul cuprinde 60 de observaţii. Judge şi colaboratorii săi
menţionează faptul că, în cazul în care c=4 pentru n=30 şi c=10 pentru
n≈60, se obţin rezultate mai bune. În general, se consideră că c trebuie să
reprezinte o treime sau un sfert din numărul total de observaţii.
• efectuarea de regresii aplicând M.C.M.M.P. asupra celor două
sub-eşantioane de dimensiune (n-c)/2 şi calcularea sumei pătratelor erorilor
pentru fiecare subeşantion în parte;

• calcularea raportului dintre sumele pătratelor erorilor sau


dispersiilor acestora, corespunzătoare celor două subeşantioane (suma
pătratelor erorilor având valoarea cea mai mare fiind plasată la numărător):

⎛ (n − c )
(n −c ) / 2

s u21 ∑ u12 / ⎜
⎝ 2
− (k + 1)⎟

F* = = t =n1 (3.4.6)
s u22 ⎛ (n − c ) ⎞

(n −c ) +1
u 22 / ⎜
⎝ 2
− (k + 1)⎟

t=
2

unde: k = numărul variabilelor exogene.

Presupunând că erorile sunt normal distribuite, atunci raportul F*

urmează o distribuţie F cu v1 = v2 =
(n − c ) − (k + 1) grade de libertate.
2

- dacă F* > F ⎛ ( n−c ) ⎞ ⎛ ( n−c ) ⎞ , atunci ipoteza de


α; ⎜ −( k +1) ⎟;⎜ −( k +1) ⎟
⎝ 2 ⎠⎝ 2 ⎠

homoscedasticitate este infirmată, deci erorile sunt heteroscedastice;


Modele econometrice

*
- dacă F ≤ F ⎛ (n−c) ⎞ ⎛ ( n−c) ⎞ ipoteza de homoscedasticitate
α; ⎜ −( k +1) ⎟;⎜ −( k +1) ⎟
⎝ 2 ⎠⎝ 2 ⎠

este acceptată.

I2.7) Testul Park4


Testul propus de Park se bazează pe existenţa unei relaţii de
dependenţă între dispersia corespunzătoare erorilor heteroscedastice şi
variabila exogenă x de forma:

σ u2t = σ 2 xtb eωt (3.4.7)

Acest model neliniar poate fi transformat într-un model liniar prin


logaritmare:
ln σ u2t = ln σ 2 + b ln xt + ωt (3.4.8)

unde:
ωt = variabila reziduală, ce verifică ipotezele corespunzătoare
M.C.M.M.P.

Ca urmare a faptului că valoarea dispersiei erorilor heteroscedastice


este necunoscută, aceasta a fost înlocuită cu pătratul erorilor, uˆ i2 , în cadrul
modelului liniarizat prin logaritmare:

ln uˆt2 = ln σ 2 + b ln xt + ωt = β + b ln xt + ωt (3.4.9)

În situaţia în care parametrul b corespunzător variabilei exogene este


nesemnificativ ipoteza de homoscedasticitate a erorilor este verificată, cazul
contrar indicând existenţa heteroscedasticităţii.

I2.8) Testul Glejser5


Acest test se bazează pe bazează pe relaţia dintre erorile estimate în
urma aplicării M.C.M.M.P. asupra modelului iniţial şi variabila explicativă,
presupusă a fi cauza heteroscedasticităţii.

4
cf. op. cit., p. 369-370
5
cf. op. cit., p. 371-372
Modelul unifactorial

Testul Glejser prezintă o serie de puncte comune cu testul precedent,


respectiv, după calcularea erorilor în urma aplicării M.C.M.M.P., valoarea
absolută a acestora este regresată în funcţie de valorile variabilei exogene
utilizându-se în acest scop următoarele forme de exprimare corespunzătoare
celor două variabile:

I. uˆ t = a + bxt + ω t

În această situaţie heteroscedasticitatea este de tipul: σ u2t = λ2 xt2 , caz


în care va fi aplicată regresia ponderată asupra datelor iniţiale, care vor fi
y t a1 u
împărţite la xi , rezultând astfel un model de forma: = + b1 + t
xt xt xt

II. uˆ t = a + b x t + ω t
În această situaţie heteroscedasticitatea este de tipul: σ u2i = λ2 xt , caz
în care va fi aplicată regresia ponderată asupra datelor iniţiale, care vor fi
împărţite la xt , rezultând astfel un model de forma:
yt a1 ut
= + b1 x t + .
xt xt xt

1
III. uˆ t = a + b + ωt
xt
În această situaţie heteroscedasticitatea este de tipul: σ u2i = λ2 xt−2 .

1
IV. uˆ t = a + b + ωt
xt

V. uˆ t = a + bx t + ω t

VI. uˆ t = a + bxt2 + ω t
Modele econometrice

Verificarea homoscedasticităţii erorilor presupune, ca şi în cazul


testului precedent, verificarea semnificaţiei parametrului corespunzător
variabilei exogene. Aplicarea acestui test conduce la rezultate semnificative
în cazul unor eşantioane de dimensiuni mari, iar, în cazul celor de
dimensiuni mici, este pur teoretică, aşa cum menţionează însuşi autorul.
De menţionat faptul că ultimele două modele nu pot fi estimate cu
ajutorul M.C.M.M.P.

I2.9) Testul Breusch-Pagan-Godfrey (BPG)6


Acest test are în vedere modelul multifactorial liniar de forma:

yi = b0 + b1 x1t + b2 x2t + …+ bk x kt + ut (3.4.10)


plecând de la ipoteza potrivit căreia dispersia corespunzătoare erorilor
heteroscedastice este dependentă de o serie de variabile factoriale zi. În locul
acestor variabile pot fi utilizate câteva sau toate variabilele exogene ce
intervin în modelul iniţial. Se presupune, de asemenea, că între dispersia
corespunzătoare erorilor heteroscedastice şi variabilele factoriale zi există o
relaţie de dependenţă liniară, respectiv:

σ u2t = β 0 + β1 z1t + β 2 z 2t + K + β m z mt (3.4.11)

Verificarea homoscedasticităţii dispersiei presupune verificarea


ipotezei nulităţii parametrilor corespunzători variabilelor factoriale, caz în
care σ u2t = β 0 = ct.
Aplicarea acestui test constă în:
- calculul valorilor variabilei reziduale prin aplicarea M.C.M.M.P.
asupra modelului iniţial;
- calculul estimatorului de maximă verosimilitate corespunzător
dispersiei variabilei reziduale homoscedastice: σ̂ u2 = ∑ uˆt ;
2

t
n

6
cf. op. cit., p. 377-378
Modelul unifactorial

uˆ t2
- construirea unei variabile de forma: θ t = şi regresarea
σˆ u2t
acesteia în funcţie de variabilele factoriale zt, ce pot fi înlocuite cu
variabilele exogene xi din modelul original, respectiv:

θ t = β 0 + β 1 x1t + β 2 x 2t + K + β m x mt + ω t (3.4.12)

unde:
ωt = variabila reziduală.
- calculul sumei pătratelor explicată de model, notată cu SSR, şi
SSR
calculul unei variabile H de forma: H = .
2

Presupunând că erorile sunt normal distribuite, şi că ne aflăm în


situaţia unui eşantion de volum mare, variabila H este asimptotic distribuită
sub forma unui χ α2 ; v , pentru care numărul gradelor de libertate este egal cu:
v = m − 1 , unde m = numărul parametrilor modelului, respectiv: H~ χ α2 ;v .
Dacă H > χ α2 ; v , erorile sunt heteroscedastice, în caz contrar, sunt
homoscedastice.

I2.10) Testul White7


Aplicarea testului White în cazul modelului unifactorial presupune
parcurgerea următoarelor etape:
- estimarea parametrilor modelului iniţial şi calculul valorilor
estimate ale variabilei reziduale, u;
- construirea unei regresii auxiliare, bazată pe prespunerea
existenţei unei relaţii de dependenţă între pătratul valorilor erorii, variabila
exogenă inclusă în modelul iniţial şi pătratul valorilor acesteia:

uˆ t2 = α 0 + α 1 xt + α 2 xt2 + ω t (3.4.13)

7
cf. op. cit., p. 379
Modele econometrice

şi calcularea coeficientului de determinare, R2, corespunzător acestei regresii


auxiliare;
- verificarea semnificaţiei parametrilor modelului nou construit, iar
dacă unul dintre aceştia este semnificativ diferit de zero, atunci ipoteza de
heteroscedasticitate a erorilor este acceptată.
Există două variante de aplicare a testului White:
- utilizarea testului Fisher-Snedecor clasic, bazat pe ipoteza
nulităţii parametrilor, respectiv: H0: α 0 = α1 = α 2 = 0 ;
Dacă ipoteza nulă, potrivit căreia rezultatele estimării sunt
nesemnificative ( Fc ≤ Fα ;v1 ;v2 ), este acceptată, atunci ipoteza de
homoscedasticitate se verifică, cazul contrar semnificând prezenţa
heteroscedasticităţii erorilor.

- utilizarea testului LM, calculat ca produs între numărul de


observaţii corespunzătoare modelului, n, şi coeficientul de determinare, R2,
corespunzător acestei regresii auxiliare. În general, testul LM este
asimptotic distribuit sub forma unui χ α2 ; v , pentru care numărul gradelor de
libertate este egal cu: v = k , unde k = numărul variabilelor exogene,
respectiv:

LM = n ⋅ R 2 ~ χ α2 ; v (3.4.14)

Dacă LM > χ α2 ; v , erorile sunt heteroscedastice, în caz contrar, sunt


homoscedastice, respectiv ipoteza nulităţii parametrilor, α 0 = α1 = α 2 = 0 ,
este acceptată.

Eliminarea fenomenului de heteroscedasticitate se poate realiza


prin următoarele procedee:

a) Construirea modelului pe baza abaterilor centrate ale variabilelor


Fie y t = a + bxt + u t (3.4.15)
Modelul unifactorial

ŷ t = â + b̂x t (3.4.16)
y = a + bx + u (3.4.17)
________________
(3.4.15) – (3.4.17) ⇒ y t − y = b ( x t − x ) + u t (3.4.18)

y t* = y t − y ⎫⎪ ⎧⎪ y t* = b xt* + u t
Notând cu: * ⎬⇒⎨
xt = xt − x ⎪⎭ ⎪⎩ yˆ t* = bˆ xt*

Estimarea parametrului b presupune minimizarea funcţiei:

() ( ) ( )
n n
F bˆ = min ∑ y t* − yˆ t* = min ∑ y t* − bˆ xt*
2 2

t =1 t =1

şi calculul derivatei parţiale a funcţiei:

F ' (bˆ) = 0 ⇒ 2 ∑ (y *
t )( )
− bˆ xt* ⋅ − xt* = 0 ⇔ ∑ u (x
t t − x ) = 0 ⇒ cov(u t , xt ) = 0

b) Metoda regresiei ponderate


Fie modelul iniţial y t = a + bxt + u t
Heteroscedasticitatea presupune M (u t ) 2 ≠ σ u2 , ceea ce înseamnă:
σ u2 = λ1σ u2
1

σ 2
u2 = λ 2σ u2
……………. (3.4.19)
σ 2
un = λ nσ 2
u

unde:
λt este un coeficient de ponderare.

Estimarea parametrilor modelului presupune minimizarea funcţiei:


n
1
min F (aˆ , bˆ) = min ∑ 2 ( y t − aˆ − bˆxt ) 2
t =1 σu
Modele econometrice

n
1
Conform relaţiei (3.4.19): min F (aˆ , bˆ) = min ∑ ( y t − aˆ − bˆxt ) 2 (3.4.20)
t =1 λt
În relaţia (3.4.20) cantităţile σ u2 şi λt sunt, în general, necunoscute.
S-a constatat însă că, în practică, abaterile standard, σ ut , sunt aproximativ
proporţionale cu valorile variabilei exogene x, adică:

σ u = σ u x1
1

σ u = σ u x2
2

…………… (3.4.21)
σ un = σ u x n

Corelând relaţiile (3.4.19) şi (3.4.21), rezultă că relaţia (3.4.20)


devine:

n
1 1
min F (aˆ, bˆ) = 2 min
σu
∑x 2
( yt − aˆ − bˆxt ) 2
t t
2
(3.4.22)
2
⎛ y − aˆ − bˆxt
n ⎞ n
1 ⎟ = 1 min ⎛⎜ yt − aˆ 1 − bˆ ⎞⎟
= 2 min ⎜ t
σu ⎜
t =1 ⎝
∑ xt ⎟ σ u2
∑⎜x
t =1 ⎝ t
xt ⎟

Dar relaţia (3.4.22) este echivalentă cu aplicarea M.C.M.M.P.


modelului iniţial, după ce, în prealabil, a fost împărţit la xt:

yt 1 u
y t = a + bxt + u t |: xt ⇒ = a +b+ t
xt xt xt
2 2
n ⎛u ⎞ n ⎛y 1 ⎞
minF( â,b̂ ) = min∑ ⎜ t ⎟ = min∑ ⎜ t −â −b̂ ⎟ (3.4.23)
x
t =1 ⎝ t ⎠ x
t =1 ⎝ t x t ⎠
Modelul unifactorial

Calculând derivatele parţiale în raport cu â şi b̂ ale funcţiilor


(3.4.22) şi (3.4.23) şi anulându-le se ajunge la acelaşi sistem de ecuaţii pe
baza căruia se determină cei doi estimatori:

⎧ 1 1 yt
F ' (aˆ ) = 0 ⇒ ⎪

aˆ ∑x 2
+ bˆ ∑ x =∑ x 2

t t t (3.4.24)
F ' (bˆ) = 0 ⇒ 1 yt
⎪aˆ


∑x t
+ nbˆ = ∑x t

⎧ 1 yt 1 yt

⎪ˆ
∑ x ∑ x −∑ x ∑ x
2
t t t
2
t
⎪b = 2
⎪ 1 ⎛ 1 ⎞
⎪⎪ n ∑ x −∑ 2

⎜x
⎝ t



⇒⎨ t (3.4.25)
⎪ yt 1


∑x 2 ∑x
⎪aˆ =
t
− bˆ t
1 1

⎪⎩
∑x 2
t
∑x 2
t

Un caz concret de utilizare a acestei metode o constituie situaţia în


care se urmăreşte modelarea investiţiilor unor intreprinderi de dimensiuni
diferite în funcţie de capital, cifra de afaceri şi venit: I = f (K, CA, V) + u.
O altă metodă constă în segmentarea eşantionului în subcolectivităţi
omogene din punct de vedere al nivelelor factorilor, urmată de o
respecificare a modelului pentru fiecare segment în parte.
În mod curent, acest procedeu se utilizează la estimarea parametrilor
unui model econometric privind cererea sau consumul populaţiei faţă de un
produs de folosinţă curentă, deoarece s-a constatat că dispersia
corespunzătoare consumului creşte pe măsura creşterii nivelului venitului.

I3 Valorile variabilei reziduale u sunt necorelate, respectiv nu


există fenomenul de autocorelare a erorilor.

cov(ut , uk ) = M (ut , uk ) = 0 (∀)t , k = 1, n , t < k


Modele econometrice

Deoarece aplicaţiile practice au arătat că acest fenomen e frecvent în


special în cazul seriilor cronologice interdependente, verificarea acestuia
este necesară, mai ales în cazul calculelor de prognoză.
M.C.M.M.P., în cazul existenţei fenomenului de autocorelaţie,
M (ut , uk ) ≠ 0 , nu mai permite obţinerea de estimatori eficienţi, aceştia
prezentând totodată distorsiuni de la valorile reale. Se păstrează însă
calitatea acestora de a fi consistenţi, fapt ce impune introducerea în calcul a
unor serii de date suficient de lungi (eşantion de valori cât mai mare).
Autocorelarea erorilor se datorează analizei în timp a legăturii dintre
variabile, respectiv a unui efect inerţial în evoluţia variabilelor sau o altă
cauză ar constitui – o eroare de specificare a modelului, respectiv omiterea
unei variabile explicative, xt, cu influenţă puternică asupra variabilei
endogene y.
Depistarea autocorelării erorilor se poate face utilizând următoarele
procedee:

1) Procedeul grafic – se realizează corelograma între valorile


estimate ale variabilei endogene ŷt şi valorile variabilei reziduale û t .

û t

ŷ t

Figura 3.4.3

Grafic, autocorelaţia erorilor se manifestă fie printr-un număr foarte


mic sau foarte mare de schimbări ale semnului variabilei aleatoare, fie ca
urmare a unor schimbări simetrice (o oscilaţie regulată a valorilor variabilei
reziduale faţă de valorile lui ŷ ).
Modelul unifactorial

2) Calculul coeficientului de autocorelaţie de ordinul 1

n n
∑ û t û t −1 ∑ û t û t −1
r1 = t =2 = t =2 (3.4.26)
n −1 n
2 2
∑ û t ∑ û t −1
t =1 t =2

Acesta este definit în intervalul [− 1; 1] , având următoarea


semnificaţie:

⎧− 1, autocorelaţie strict negativă



r( 1) = ⎨ 0, independenţă
⎪+ 1, autocorelaţie strict pozitivă

3) Testul Durbin-Watson constă în calcularea valorii:

n
∑ (û t − û t −1 )
2

d = t =2 n
(3.4.27)
2
∑ û t
t =1

Această valoare empirică, „d”, se compară cu două valori teoretice,


d1 şi d2, preluate din tabelul distribuţiei Durbin-Watson (vezi Anexa 3) în
funcţie de un prag de semnificaţie α, arbitrar ales, (α = 0,05 sau α = 0,01),
de numărul de variabile exogene (k) şi de valorile observate ( n, n ≥ 15) .

Regula de decizie a aplicării testului se prezintă în tabelul următor:

0 < d < d1 d1 ≤ d ≤ d2 d2 < d< 4-d2 4-d2 ≤ d ≤ 4-d1 4-d1 < d <4
Autocorelare Indecizie Erorile sunt Indecizie Autocorelare
pozitivă ← independente → negativă

Cei doi autori, acceptând ipoteza de normalitate a variabilei


reziduale, au demonstrat că distribuţia variabilei aleatoare d este cuprinsă
Modele econometrice

între două distribuţii limită, d1 şi d2, ale căror mărimi depind de pragul de
semnificaţie (α), de numărul de variabile exogene (k) şi de numărul de
valori observate (n, n ≥ 15).
Dezvoltând relaţia lui d, aceasta devine:

n n n

∑ uˆt 2 + ∑ uˆt −1 2 − 2∑ uˆt uˆ t −1


d= t =2 t =2
n
t =2

∑ uˆ
2
t
t =1

n n n
Pentru un n suficient de mare, cele trei sume, ∑ uˆ t , ∑ uˆ t2−1 , ∑ uˆ t ,
2 2

t =2 t =2 t =1

fiind aproximativ egale, relaţia lui d va fi egală cu:

∑ uˆ uˆ t t −1
d = 2 − 2 t = 2n −1
∑ uˆt =1
2
t

∑ uˆ uˆ t t −1
Se notează cu: r1 = t =2
n −1
coeficientul de autocorelaţie de ordinul
∑ uˆ
t =1
2
t

1 a reziduurilor ut.

(
⇒ d = 2 1 − r (1) ⇒ r (1) = 1 −
d
2
) (3.4.28)

⇒ d ∈ [0,4]
Modelul unifactorial

cu semnificaţia:

⎧ − 1 ⇒ autocorela re strict negati vă ⎧4


⎪ ↑ ⇒ indecizie ⎪↑
⎪⎪ ⎪⎪
r1 = ⎨ 0 ⇒ independen ţă ⇒ d = ⎨2
⎪ ↓ ⇒ indecizie ⎪↓
⎪ ⎪
⎪⎩ 1 ⇒ autocorela re strict poziti vă ⎪⎩ 0

4) Un alt procedeu de verificare a ipotezei de independenţă a erorilor


constă în aplicarea testului Breusch-Godfrey8, acest test fiind utilizat în
vederea depistării unei autocorelaţii de ordin superior. Ca urmare a
presupunerii existenţei unei autocorelaţii de ordin superior se construieşte
următorul model:

u t = r1u t −1 + r2 u t − 2 + K + r p u t − p + z t (3.4.29)

unde:
zt = variabilă reziduală de medie zero şi dispersie constantă.

Ipoteza nulă care stă la baza testului este aceea potrivit căreia toţi
coeficienţii corespunzători valorilor decalate ale variabilei reziduale sunt
simultan egali cu zero, fapt ce implică non-existenţa fenomenului de
autocorelaţie a erorilor.
În vederea utilizării testului sunt estimate valorile variabilei
reziduale ut, obţinute în urma aplicării M.C.M.M.P. asupra modelului iniţial.
Variabila reziduală ut este regresată apoi în funcţie de variabilele exogene
iniţiale ale modelului şi de valorile sale decalate, respectiv ut-1, ut-2, …, ut-p.
În cazul acestei regresii este calculată valoarea coeficientului de determinare
R2 şi a unei variabile de forma:

BG = (n-p)·R2 (3.4.30)

8
cf. op. cit., p. 425
Modele econometrice

Presupunând că ne aflăm în situaţia unui eşantion de volum mare,


variabila BG este asimptotic distribuită sub forma unui χ α2 ; v , pentru care
numărul gradelor de libertate este egal cu: v = p , unde p = mărimea
decalajului , respectiv: BG~ χ α2 ; v .
Dacă BG > χ α2 ; v , ipoteza nulă este respinsă, ceea ce presupune că
există cel puţin un coeficient de autocorelaţie nenul.
În general, autocorelaţia erorilor este provocată de două cauze:
• fie că variabila endogenă y se autocorelează în evoluţia sa (ca
urmare a unui efect inerţial) generând o autocorelare în timp a erorilor;
• fie datorită omiterii unei variabile exogene x, cu influenţă
semnificativă asupra lui y, adică a unei erori de specificare a modelului
econometric.

Eliminarea fenomenului de autocorelare a variabilei reziduale ut


– în cazul depistării sale – se fundamentează pe evitarea cauzelor care îl
generează.
O modalitate directă de a evita consecinţele statistice pe care le
generează acest fenomen o constituie utilizarea următoarelor procedee:
a) Aplicarea M.C.M.M.P. generalizate în vederea estimării
parametrilor modelului care, în cazul autocorelării reziduurilor, permite
obţinerea de estimatori nedeplasaţi, consistenţi şi eficienţi. Această metodă
este recomandată în situaţia în care numărul variabilelor cauzale este
superior lui unu (modele multifactoriale). Estimatorii modelului se obţin
−1
astfel: B̂ = ( X ' V X ) −1 ( X ' V −1
Y ) unde V = matricea varianţelor şi
covarianţelor reziduurilor.

b) Un alt procedeu este următorul:


Fie modelul liniar unifactorial: y t = a + bx t + u t . Se estimează
parametrii acestuia, a şi b, cu ajutorul M.C.M.M.P. Se calculează valorile
ajustate ale variabilei endogene - ŷ t = â + b̂x t şi reziduurile -
û t = y t − ŷ t = y t − â − b̂x t (3.4.31) şi se aplică testul “d”. Dacă ipoteza de
Modelul unifactorial

independenţă a variabilelor reziduale, I3, nu poate fi acceptată ( r1 ≠ 0 ,


d
r1 = 1 − ), aceasta presupune o autocorelare de ordinul întâi a erorilor,
2
respectiv:

uˆ t = r(1) uˆ t −1 + z t (3.4.32)

unde:
zt este variabila aleatoare ce verifică ipotezele I2, I3 şi I4.

Ştiind că:
û t −1 = y t −1 − ŷ t −1 = y t −1 − â − b̂x t −1 (3.4.33)

Înlocuind relaţiile (3.4.31)şi (3.4.33) în relaţia (3.4.32) se obţine:

y t − aˆ − bˆxt = r(1) ( y t −1 − aˆ − bˆxt −1 ) + z t

yt − r(1) yt −1 = aˆ (1 − r(1) ) + bˆ( xt − r(1) xt −1 ) + zt (3.4.34)

În ecuaţia (3.4.34) variabilele yt şi xt sunt cunoscute, iar valoarea


coeficientului de autocorelaţie se va calcula cu relaţia:

∑u u
t =2
t t −1
r(1) = n −1

∑u t =1
2
t

Se introduce valorile acestuia în relaţia (3.4.34) şi se vor estima


parametrii a şi b prin aplicarea din nou a M.C.M.M.P. Fie α̂ şi
β̂ estimaţiile parametrilor a şi b, calculate pe baza diferenţelor de ordinul
întâi ale variabilelor y şi x.

Se ajunge astfel la modelul:

( y t − r(1) y t −1 ) = α (1 − r(1) ) + β ( xt − r(1) xt −1 ) (3.4.35)


Modele econometrice

unde:
( y t − r(1) y t −1 ) reprezintă diferenţele teoretice (ajustate) de ordinul întâi
ale variabilei endogene y, calculate pe baza funcţiei de
regresie (3.4.34).

c) Procedeul prin baleiaj (Hildreth-Lu)


Dacă există corelaţie se ajunge la relaţia:

y t − r(1) yt −1 = aˆ 0 (1 − r(1) ) + bˆ0 ( xt − r(1) xt −1 ) + z t ⇒ y t* = a1 + b1 xt* + z t

Procedeul prin baleiaj constă în atribuirea de valori lui r(1) în


intervalul [0,1] ⇒ autocorelare pozitivă, sau în intervalul [-1,0] ⇒
autocorelare negativă.

De exemplu, în cazul unei autocorelări pozitive, i se atribuie lui r(1)


următoarele valori:

r(1) = 0,1 ⇒ ∑zt2 = 1,75;


r(1) = 0,2 ⇒ ∑zt2 = 2,75;
r(1) = 0,3 ⇒ ∑zt2 = 3,75.

Deci minimul se situează în intervalul [0,2; 0,3].


Se dau apoi valori lui r = ⎨0,21; 0,22;…0,27⎬, oprindu-ne la
valoarea pentru care se obţine min ∑zt2. Pentru această valoare se păstrează
estimatorii aˆ şi bˆ obţinuţi în acest caz.

d) Procedeul iterativ al lui D. Cochran şi C. Orcutt


Se consideră modelul yt = a + bxt + ut . Se estimează parametrii
modelului, se aplică testul D-W, se calculează coeficientul de autocorelaţie
de ordinul întâi şi se înlocuieşte valoarea sa în ecuaţia iniţială, (3.4.34),
obţinându-se modelul - y *t = a1 + b1 x *t + z t . În cazul acestui model se
verifică dacă s-a eliminat sau nu autocorelaţia erorilor. În caz contrar, se
continuă procedeul până când se atinge acest deziderat.
Modelul unifactorial

e) Procedeul Durbin

y t − aˆ − bˆxt = r(1) ( y t −1 − aˆ − bˆx t −1 ) + z t

Se calculează r(1), se introduce în relaţia (3.4.34) şi rezultă estimatorii


parametrilor, aˆ , bˆ . Această metodă dă rezultate bune numai în cazul
1 1

existenţei unei autocorelaţii de ordinul întâi şi este aplicabilă în cazul în se


lucrează cu un număr mare de date.

f) Uneori, eliminarea autocorelaţiei se poate realiza şi prin


construirea modelului pe baza diferenţelor de ordinul întâi ale
variabilelor:

y t − y t −1 = a + b( x t − x t −1 ) + z t ⇒ y t* = a + bx t* + z t

g) Pentru eliminarea autocorelaţiei se poate construi un model nou în


care se introduce o variabilă fictivă suplimentară. Această metodă
porneşte de la ideea că variabila reziduală u nu este influenţată numai de
factori aleatori, ci există cel puţin un factor sistematic care provoacă
autocorelaţia.

I4 Legea de probabilitate a variabilei reziduale ut este legea


normală, de medie nulă şi abatere medie pătratică σu, ut → Ν(0,σu).
Se ştie că, dacă erorile urmează legea normală de medie zero şi de
abatere medie pătratică su$ (consecinţa ipotezelor I1, I2, I3), atunci are loc
relaţia:

P (uˆt ≤ t α s uˆ ) = 1 − α

Pe baza acestei relaţii, în funcţie de diferite praguri de semnificaţie


α , din tabela distribuţiei normale sau a distribuţiei Student se vor prelua
valorile corespunzătoare lui tα .
Verificarea ipotezei de normalitate se poate face pe baza unui grafic
în cadrul căruia pe axa Ox se vor reprezenta valorile ajustate ale variabilei y
Modele econometrice

- ŷ t , iar pe axa Oy se vor trece valorile variabilei reziduale - u t . Dacă


valorile empirice ale variabilei reziduale se înscriu în banda ± t α ⋅ s uˆ , cu un
anumit prag de semnificaţie α , ipoteza de normalitate a variabilei reziduale
poate fi acceptată cu acest prag de semnificaţie – vezi figura 3.4.4:

u + tα ⋅ su

0 ŷ

− tα ⋅ su

Figura 3.4.4

O altă modalitate de verificare a ipotezei de normalitate a erorilor o


constituie testul Jarque-Berra9, care este şi el un test asimptotic (valabil în
cazul unui eşantion de volum mare), ce urmează o distribuţie hi pătrat cu un
număr al gradelor de libertate egal cu 2, având următoarea formă:

⎡ S 2 (K − 3)2 ⎤ 2
JB = n ⎢ + ⎥ ~ χ α ;2 (3.4.36)
⎢⎣ 6 24 ⎥⎦

unde:
n = numărul de observaţii;

S = coeficientul de asimetrie (skewness), ce măsoară simetria distribuţiei


erorilor în jurul mediei acestora, care este egală cu zero, având
următoarea relaţie de calcul:

1 n
(
∑ yt − y
n t =1
)3

S= (3.4.37)
σ3
9
cf. EViews, User Guide, Version 2.0, QMS Quantitative Micro Software, Irvine, California,
1995, p. 140-141
Modelul unifactorial

K = coeficientul de aplatizare calculat de Pearson (kurtosis), ce măsoară


boltirea distribuţiei (cât de „ascuţită” sau de aplatizată este distribuţia
comparativ cu distribuţia normală), având următoarea relaţie de calcul:

1 n
(
∑ yt − y
n t =1
)4

K= (3.4.38)
σ4

Testul Jarque-Berra se bazează pe ipoteza că distribuţia normală are


un coeficient de asimetrie egal cu zero, S = 0, şi un coeficient de aplatizare
egal cu trei, K = 3.
Dacă probabilitatea, p(JB), corespunzătoare valorii calculate a
testului este suficient de scăzută, atunci ipoteza de normalitate a erorilor este
respinsă, în timp ce, în caz contrar, pentru un nivel suficient de ridicat al
probabilităţii ipoteza de normalitate a erorilor este acceptată, sau dacă
JB > χ α2 ; 2 , atunci ipoteza de normalitate a erorilor este respinsă.

3.4.2. Verificarea semnificaţiei estimatorilor parametrilor


modelului econometric

Dacă cele patru ipoteze pot fi acceptate, se poate demonstra (vezi


Teorema 1) că M.C.M.M.P. este echivalentă cu M.V.M. (metoda
verosimilităţii maxime) şi, deci, estimatorii obţinuţi în acest caz sunt
nedeplasaţi, convergenţi şi eficienţi.
De asemenea (vezi Teorema 2 şi 3), cei doi estimatori, â şi b̂ , sunt
variabile aleatoare repartizate normal:

L ( â ) = N ( a , s â ) ; L ( b̂ ) = N ( b , s b̂ )
Modele econometrice

unde:
⎛ ⎞
⎜1 x2 ⎟
s â = s u2 ⎜ + ⎟ = abaterea medie pătratică a estimatorului aˆ ;
⎜ n ∑ (x t − x )
2

⎝ t ⎠

s u2
s bˆ = = abaterea medie pătratică a estimatorului b̂ ;
∑ (x t − x )2
t

2
∑ ( y t − ŷ t )
1
s u2 = 2
∑ ( û t ) = t
= dispersia variabilei reziduale (vezi
n −2 t n −2
teorema 6)

Verificarea semnificaţiei estimatorilor constă în a accepta, sau a


respinge, una din cele două ipoteze:

⎧a = 0
H0 :⎨
⎩b = 0
⎧a ≠ 0
H1 : ⎨
⎩b ≠ 0

Testul adecvat acestui scop, â şi b̂ fiind variabile normale, este


testul “t”. Prin centrarea şi normarea estimaţiilor â şi b̂ , în cazul ipotezei
H0: L( aˆ )=N(0, s â ) şi L( bˆ )=N(0, s b̂ ), se obţin valorile calculate:

1 â − 0 2 b̂ − 0
t cal = şi t cal = . Aceste valori calculate sau empirice se compară
s â s b̂
cu valoarea teoretică:
• tα = variabilă normală, dacă t = 1, n , n>30, preluată din tabela
distribuţiei normale, în funcţie de o valoare arbitrar aleasă a probabilităţii
Modelul unifactorial

„p“ sau a pragului de semnificaţie „α”, p+ α = 1; aceste valori, de regulă


fiind: p = 0,9 => α = 0,1; p = 0,95 => α = 0,05; p = 0,99 => α = 0,01;
• - tα;n-(k+1) = variabilă Student, dacă t = 1, n , n≤30, preluată din
tabela distribuţiei Student, în funcţie de valoarea stabilită pentru α şi de
numărul gradelor de libertate, n-(k+1); n = numărul observaţiilor; k =
numărul variabilelor exogene xj, j = 1, k (k+1 = numărul parametrilor
modelului econometric).
Pe baza celor două valori, tcal şi tα;v , regula de decizie a testului este:
1 aˆ ⎫
t cal = ≤ tα ;v ⎪
s aˆ ⎪
• dacă ⎬ => se acceptă H0 => estimatorii nu sunt
b ˆ ⎪
2
t cal = ≤ t α ;v ⎪
sbˆ

semnificativ diferiţi de zero, se renunţă la ei şi la model => se revine la
prima etapă cu o nouă specificare;
1 aˆ ⎫
t cal = > t α ;v ⎪
s aˆ ⎪
• dacă ⎬ => se acceptă H1 => modelul a fost corect
bˆ ⎪
2
t cal = > t α ;v ⎪
s bˆ

specificat, identificat şi estimat şi se continuă discuţia econometrică;
1 aˆ ⎫
t cal = ≤ tα ;v ⎪
s aˆ ⎪
• dacă ⎬ => se reţine modelul y = f(x) + u = bx + u şi
2 bˆ ⎪
t cal = > tα ;v ⎪
sbˆ

se continuă discuţia econometrică.

În practică, deoarece t0,05 > 2, economiştii acceptă ipoteza H1 -


estimatorii sunt semnificativi dacă:
1 aˆ
t cal = ≥2
s aˆ

2 bˆ
t cal = ≥2
s bˆ
Modele econometrice

În acelaşi timp, ştiind că â şi bˆ sunt repartizaţi normal, se poate


estima intervalul de încredere al parametrilor acestora:
P (aˆ − tα ;v ⋅ s aˆ ≤ a ≤ aˆ + tα ;v ⋅ s aˆ ) = p = 1 − α

( )
P bˆ − tα ;v ⋅ sbˆ ≤ b ≤ bˆ + tα ;v ⋅ sbˆ = p = 1 − α

Parametrii a şi b vor fi consideraţi semnificativ diferiţi de zero dacă:


( )
P a = aˆ ± tα ;v ⋅ s aˆ > 0 = p = 1 − α

( )
P b = bˆ ± tα ;v ⋅ sbˆ > 0 = p = 1 − α

3.4.3 Verificarea similitudinii modelului econometric

Modelul econometric, ŷ t = â + b̂x t , este expresia formală a


modelului economic real, yt = f(xt) + ut = a + bxt + ut, conceput pe baza
teoriei economice şi rezultat pe baza unui singur experiment, unui singur
sondaj statistic.
Ca atare, în această etapă se urmăreşte să se verifice:
1) dacă ipoteza de pornire – x = principalul factor de influenţă a
fenomenului y – este corectă sau nu;
2) dacă legitatea economică dintre cele două variabile este de forma
- y = a + bx;
3) dacă rezultatele obţinute pot fi considerate sistematice – în sensul
că se vor obţine aproape aceleaşi rezultate dacă se va repeta
experienţa cu alte sondaje, de volum şi structură (alte unităţi
statistice) diferite – sau întâmplătoare, adică rezultate diferite
pentru sondaje diferite.
În general, scopurile urmărite în această etapă se rezolvă cu ajutorul
metodei analizei variaţiei, cunoscută şi sub numele de metoda ANOVA.
Metoda analizei variaţiei porneşte de la identitatea:

y t − y = y t − ŷ t + ŷ t − y → ( yt − y )2 = ( yt − yˆ t + yˆ t − y )2

n n


t =1
( yt − y) 2 = ∑[( yˆ − y) + ( y − yˆ )]
t =1
t t t
2
(3.4.3)
Modelul unifactorial

unde10:
yt = valorile reale ale fenomenului y;
yˆ t = valorile teoretice ale fenomenului y;
ŷ t = â + b̂x t
1
y =
n
1 1
(
∑ y t = ∑ ŷ t = ∑ â + b̂x t = â + b̂x
n n
)
Prin ridicarea la pătrat a binomului din partea dreaptă a relaţiei
(3.4.3) rezultă:
n n n n

∑( yt − y)2 == ∑( yˆt − y)2 + ∑( yt − yˆt )2 + 2∑( yˆt − y)(yt − yˆt )


t =1 t =1 t =1 t =1
(3.4.4)

Termenii relaţiei (3.4.4) se definesc prin:


n
V = ∑( yt − y) = variaţia totală a variabilei y provocată de toţi
2 2
0
t =1

factorii săi de influenţă;


n
V x2 = ∑(ŷ t − y ) = variaţia fenomenului y provocată numai de variaţia
2

t =1

factorului x, considerat factorul principal al variabilei y, adică variaţia lui y


explicată de modelul econometric;
n
Vu2 = ∑(yt − ŷt ) = variaţia reziduală, sau variaţia fenomenului y
2

t =1

generată de către factorii nespecificaţi în model, aceşti factori fiind


consideraţi – în etapa de specificare – drept factori cu influenţă
întâmplătoare, neesenţiali pentru a explica variaţia fenomenului y;

10
Relaţia (3.4.3) rămâne valabilă în toate cazurile de modele liniare sau liniarizabile. În
cazul acestora din urmă, se va ţine cont de semnificaţia simbolurilor. De exemplu:
b
- modelul putere: yt = a xt ut => ln yt = ln a +b ln xt + ln ut,
În acest caz, semnificaţiile simbolurilor vor fi: yt* = ln yt; ŷ *t = ln ŷ t ;
1 1
∑ ln y t = ∑ ln ŷ t ;u t = ln yt - ln ŷ t ;
*
y =
n n
- modelul exponenţial yt = ea+bxt ut => ln yt = a + b xt + ln ut,=> yt* = ln yt;
ŷ *t = ln ŷ t ; y = media geometrică a termenilor.
Modele econometrice

n
n
2∑ ( yˆ
t =1
t − y )( y t − yˆ t ) = 2 ∑ (aˆ + bˆx t − aˆ − bˆx )uˆ t = 2bˆ ∑ (x t − x ) ut
n
= 2n bˆ cov(u t , xt ) = 0

cov (xt, ut) = 0, adică xt şi ut sunt variabile independente. Această condiţie se


realizează dacă erorile sunt homoscedastice ( vezi ipoteza I2).

De regulă, rezultatele aplicării metodei ANOVA se prezintă într-un


tabel de forma:
Tabelul 3.4.1
Numărul Valoarea testului „F”
Sursa de Măsura Dispersii
gradelor de Fα ;v1 ;v2
variaţie variaţiei corectate Fc
libertate
Varianţa n
V x2 s 2y / x
explicată de
model
Vx2 = ∑( yˆ − y)
t =1
t
2
k =1 s 2y / x =
k
Fc =
su2ˆ
Varianţa n Vu2
reziduală Vu2 = ∑
t =1
( yt − yˆt )2 n − k −1 su2ˆ =
n − k −1
-

Varianţa n
totală V02 = ∑( y − y)
t =1
t
2
n −1 - -

Pe baza datelor din tabel se pot testa următoarele ipoteze:


H 0 : s y2 / x = su2 => cele două dispersii sunt aproximativ egale, adică
influenţa factorului x nu diferă de influenţa factorilor întâmplători;
H 1 : s y2 / x ≠ su2 => influenţa factorului x şi a factorilor întâmplători
– măsurată prin cele două dispersii – diferă semnificativ şi, deci, se poate
trece la discuţia similitudinii, a verosimilităţii modelului teoretic în raport cu
modelul real.
După cum se ştie, testarea semnificaţiei dintre două dispersii se face
cu ajutorul distribuţiei teoretice Fisher-Snedecor, respectiv cu testul „F”.
Cunoscând cele două valori:
s y2 / x V x2 V u2
Fcal = = : = valoarea calculată a variabilei „F”
s u2 k n − k −1
pe baza rezultatelor modelului econometric;
Fα,v ,v = valoarea teoretică a variabilei „F”, preluată din tabela
1 2
repartiţiei Fisher – Snedecor, în funcţie de un prag de semnificaţie α
Modelul unifactorial

(α = 0,1 sau α = 0,05 sau α = 0,01) şi de numărul gradelor de libertate


v1 = k; v2 = n-k-1;

Regula de decizie este următoarea:


- se acceptă H0 şi se respinge H1 dacă:

Fcal≤ Fα,v ,v
1 2

- se acceptă H1 şi se respinge H0 dacă:

Fcal >Fα,v ,v
1 2

Dacă se acceptă H1 şi dacă variabila u este independentă de


fenomenul x, cov(x,u)=0, atunci ecuaţia analizei variaţiei este:

V 02 =V x2 + V u2 (3.4.39)

ecuaţie care, prin împărţirea la V02 , se transformă în:

V x2 V u2 V x2 V u2
1= + ⇒ 100 = ⋅ 100 + ⋅ 100 (3.4.40)
V 02 V 02 V 02 V 02
V x2
Termenul R y2 / x = se numeşte coeficient de determinare şi are
V 02
următoarele semnificaţii:

⎧0 ⇒ y ≠ f ( x ) + u ⇒ x nu este factor (cauza) al fenomenulu i y;


⎪ } ⇒ y = f ( x ) + u ⇒ x este factor al variabile i y, dar nu este factor esential;
⎪⎪
R y2 / x = ⎨0,5
⎪ } ⇒ y = f ( x ) + u ⇒ x este un factor esential al fenomenulu i y;

⎪⎩1 ⇒ y = f ( x ) ⇒ x este singurul factor de influenta a fenomenulu i y.
Modele econometrice

Pe baza afirmaţiilor de mai sus, se deduce uşor că un model


econometric este cu atât mai performant cu cât valoarea lui R y2 / x se
apropie mai mult de unu, respectiv cu cât se apropie mai mult de 100(%).
Statistic, intensitatea legăturii dintre cele două variabile se măsoară
cu ajutorul indicatorului R y / x , denumit raport de corelaţie:

V x2 V u2
Ry / x = R y2 / x = = 1−
V 02 V 02

⎧0 ⇒ x şi y sunt independente
⎪ }⇒ corelatie slabă
⎪⎪
Ry / x = ⎨0,5
⎪ }⇒ corelatie puternică

⎪⎩1 ⇒ corelatie deterministă - y este corelat strict cu x

În cazul unei legături liniare între cele două variabile – y = a + bx +


u, ln y = ln a + b ln x + ln u, ln y = a + bx + ln u, estimatorii parametrilor
fiind obţinuţi cu ajutorul M.C.M.M.P., se poate demonstra că raportul de
corelaţie, R y / x , este egal cu coeficientul de corelaţie liniară, ry / x :

∑ ( yˆ − y)
∑ (aˆ + bˆx )
2

∑ bˆ (x − x )
2
− aˆ − bˆx
t 2 2
t t
Ry x = t =1
= =
∑ (y − y) ∑ (y − y)
n 2 2

∑ ( yt − y )
2 t t

t =1

∑ (x − x)
2
σ
= bˆ = bˆ x
t
Ry
∑ (y − y) σy
x 2
t

⎧⎪naˆ + bˆ∑ xt = ∑ y t

⎪⎩aˆ ∑ xt + bˆ∑ xt = ∑ y t xt
2
Modelul unifactorial

n ∑y t
∑y x t t
−x⋅y
bˆ =
∑ xt ∑y x t t
=
n∑ y t xt − ∑ xt ∑ y t
= n
∑x n∑ xt2 − (∑ xt ) ∑x
2 2
n t
t
− x2
∑ xt ∑x 2
t n

∑ (x − x) ∑ (x ) = ∑x ∑x
2 2
− 2 xt x + x 2 2

σ
t t t t
2
x = = − 2x + x2 =
n n n n

=
∑x 2
t
− 2x 2 + x 2 =
∑x 2
t
− x2
n n
∑y x t t
−x⋅y
⇒ bˆ = n
σ x2

cov( y, x ) =
∑ (x t − x )( y t − y )
=
∑ (x y
t t − xt y − x y t + x ⋅ y )
n n

=
∑x y t t
− −y
∑x t
−x
∑y t
+x⋅y =
n n n

=
∑ xt y t − y⋅x−x⋅y+ x⋅y =
∑x y t t
−x⋅y
n n

cov( y , x)
⇒ b$ = 2
σx

cov( y, x ) cov( y, x ) σ x ˆ σ x
ry / x = = ⋅ =b⋅ = Ry
σ xσ y σx
2
σy σy x

De asemenea, testarea semnificaţiei unui model econometric se


poate face tot cu testul „F”, dar, pornind de la valoarea raportului de
corelaţie, R y / x , sau a coeficientului de determinare, R y2 / x :

s y2 / x V x2 V u2 R2 n − k −1
Fcal = = : = ⋅
s u2 k n − k −1 1− R 2 k
Modele econometrice

Astfel:
n − k −1 R 2
- dacă Fcal = ⋅ ≤ Fα ;v 1 = k ;v 2 = n − k −1 ⇒ R y / x = 0 ⇒
k 1− R 2
se renunţă la modelul econometric obţinut;
n − k −1 R2
- dacă Fcal = ⋅ > Fα ;v1 =k ;v2 =n−k −1 ⇒ R y / x ≠ 0 ⇒ se trece la
k 1− R2
discuţia econometrică a ecuaţiei analizei variaţiei – V 02 =V x2 + V u2 – vezi
relaţia (3.4.25).

3.5 Utilizarea modelului econometric unifactorial

În practica economică, un model econometric se utilizează pentru


explicarea variaţiei fenomenului rezultativ y în raport de variaţia factorului
său x, pentru estimarea valorilor probabile ale fenomenului y (simularea
acestuia) în funcţie de posibilele valori pe care economic le poate înregistra
factorul x, şi, în final, prognoza fenomenului y în funcţie de valorile
fenomenului x, pe intervalul de prognoză v, v = 1, 2, ..., h.
Pentru a permite ca utilizatorii să verifice proprietăţile
(performanţele) unui model econometric obţinut, acesta trebuie prezentat cu
următoarele informaţii:

yˆ t = aˆ + bˆxt ; R
( s â ) ( s b̂ ) d
s û
Dispunând de aceste informaţii se poate testa:
- independenţa erorilor Æ testul „d” – Durbin – Watson;
- semnificaţia estimatorilor Æ testul „t”;
- similitudinea modelului Æ testul „F”.
În anumite cazuri, când s-au estimat două modele pentru spaţii
diferite (două judeţe, sau două pieţe diferite) sau pentru perioade de timp
diferite, ale aceloraşi două fenomene y şi x, de exemplu: M 1 : y = a1 + b1 x şi
Modelul unifactorial

M 2 : y = a 2 + b2 x , se poate testa ipoteza omogenităţii sau stabilităţii relative a


legităţii dintre cele două fenomene:

H 0 : b1 = b2 ⇒ cele două modele sunt relativ omogene, sau legătura


este relativ stabilă în timp;
H 1 : b1 ≠ b2 ⇒ cele două modele nu sunt omogene (legătura nu este
relativ stabilă).

Astfel,

b1 − b 2
- dacă: t cal = ≤ t α ⇒ se acceptă H0;
s b21 + s b22

b1 − b 2
- dacă: t cal = > t α ⇒ se acceptă H1.
s b21 + s b22

De reţinut că ipoteza H0 este folosită în special în domeniul


prognozei, deoarece acceptarea ei presupune existenţa unei legături relativ
stabile în timp, premisă ce justifică previziunea fenomenului y pe baza
valorilor viitoare ale fenomenului x. În acelaşi timp, în toate cele trei
direcţii în care poate fi folosit un model econometric, valorile fenomenului
pot fi estimate, fie pe baza estimaţiei punctuale, ŷ t = â + b̂x t , fie pe baza
unui interval de încredere:

( )
P ŷ t − t α ⋅ s ŷ t ≤ y t ≤ ŷ t + t α ⋅ s ŷ t = p = 1 − α (3.5.1)

De regulă, prognoza fenomenului y dacă se cunosc valorile variabilei


factoriale x pentru momentul (n+v) se realizează pe baza unui interval de
încredere, deoarece y este o variabilă aleatoare normală de medie ŷ n + v şi de
abatere medie pătratică s ŷ n + v (vezi ipotezele I1 şi I4 ale M.C.M.M.P.):
Modele econometrice

( )
P ŷ n +v − t α ⋅ s ŷ n +v ≤ y n +v ≤ ŷ n +v + t α ⋅ s ŷ n +v = p = 1 − α (3.5.2)

unde:
y n +v = valoarea reală a variabilei y în momentul de prognoză ( n + v );
ŷn + v = estimaţia punctuală a valorii de prognoză pentru variabila y,
care se calculează cu ajutorul relaţiei:

ŷ n +v = â + b̂ x n +v (3.5.3)

s ŷ = abaterea medie pătratică a erorii de previziune, calculată cu


n +v

relaţia:

⎛ ⎞
⎜ ⎟
s yˆ = s2 2
⎜ 1
= s u ⋅⎜ 1 + + n
(
xn + v − x ) 2

⎟ (3.5.4)
∑( )
n+v yˆ n + v ⎜ n 2 ⎟
⎜ xt − x ⎟
⎝ t =1 ⎠

Din relaţia de mai sus rezultă că eroarea de previziune ( s ŷ n + v ) este


cu atât mai mică cu cât numărul de observaţii va fi mai mare, cu cât valorile
variabilelor în momentul de prognoză (n+v) vor fi mai apropiate de media
lor, cu cât dispersia variabilei exogene x va fi mai mare şi cu cât dispersia
variabilei reziduale ( s u2 ) este mai mică, iar aceasta va fi cu atât mai mică cu
cât modelul econometric va explica o parte tot mai mare din variaţia
variabilei prognozate ŷ , sau cu cât raportul de corelaţie ( R y x ) va avea o
valoare mai apropiată de unu.
Aprecierea prognozei unui fenomen y pe baza unui model
econometric, ŷ t = â + b̂x t , se poate face cu ajutorul a două noţiuni,
siguranţa prognozei şi precizia prognozei, noţiuni care se află în relaţie
invers proporţională.
Modelul unifactorial

Siguranţa prognozei este dată de probabilitatea (p) cu care este


estimat intervalul de încredere, iar precizia prognozei de relaţia:

- eroarea absolută: e a = y n +v − ŷ n +v = t α ⋅ s ŷ n +v (3.5.5)

ea t α ⋅ s ŷ n +v
- eroarea relativă: e r (%) = ⋅ 100 = ⋅ 100 (3.5.6)
ŷ n +v ŷ n +v

Dar, dacă pÆ1 rezultă că siguranţa prognozei creşte, iar dacă tÆ α


rezultă că eroarea creşte, iar precizia se diminuează. Din acest motiv,
estimarea valorilor probabile ale fenomenului y se face pe baza unor valori
prestabilite privind siguranţa şi precizia prognozei. De exemplu, se poate
preciza că prognozele vor trebui acceptate cu o probabilitate dată, p = 0,95
=> α = 0,05, iar eroarea de prognoză – pe un anumit orizont al prognozei –
trebuie să fie:

t α ⋅ s ŷ n +v
e r (%) = ⋅ 100 ≤ E (%) E(%) = 5, 10,...
ŷ n +v

Analiza capacităţii de prognoză a unui model poate fi realizată pe


baza indicatorilor statistici propuşi de H. Theil (Pindyck, Rubinfeld, 1981,
p. 364-366). Aceşti indicatori sunt calculaţi pe baza următoarelor relaţii:
• coeficientul Theil

1 n
∑ ( yˆt − yt )2
n t =1 (3.5.7)
T=
1 n 2 1 n 2
∑ t
n t =1
ˆ
y + ∑ yt
n t =1
ale cărui valori sunt cuprinse în intervalul [0, 1].

Semnificaţia acestui indicator este invers proporţională cu mărimea


lui, respectiv cu cât valoarea acestuia este mai mică, tinzând către zero, cu
atât capacitatea de prognoză a modelului este mai bună.
Modele econometrice

• ponderea abaterii

T =
A (yˆ − y ) 2

=
(yˆ − y ) 2

(3.5.8)
1 n σ u2
∑ ( yˆt − yt )2
n t =1

unde:
ŷ = media valorilor teoretice ale variabilei endogene;
y = media valorilor reale ale variabilei endogene;
σu2 = dispersia variabilei reziduale necorectată cu numărul gradelor de
libertate.

Interpretarea acestui indicator, care evidenţiază existenţa unor erori


sistematice, este aceea că, în cazul ideal11, valoarea sa este egală cu zero,
aceasta tinzând către unu în cazul unor erori de estimare de-a lungul întregii
serii de timp.
• ponderea dispersiei

2
⎡ 1 n 2⎤

(σ − σ yt )
2 ⎢ ∑ yˆ t − yˆt ( )
2

1 n
∑ ( )
yt − y ⎥
⎢ n t =1 n t =1 ⎥⎦
=⎣
yˆ t
TD = (3.5.9)
1 n σ u2
∑ ( yˆt − yt )2
n t =1

care este definită tot în intervalul [0, 1], aceasta măsurând evoluţia oscilantă
a celor două serii, respectiv seria ajustată şi seria empirică a variabilei
endogene. Acest indicator are aceeaşi semnificaţie ca şi cei precedenţi,
respectiv o valoare scăzută indică o capacitate bună de prognoză, în timp ce
o valoare apropiată de unu exprimă o eroare de specificare a modelului.

11
Demn de menţionat este faptul că, în cazul estimării parametrilor unui model statistic cu ajutorul
metodei celor mai mici pătrate, valoarea acestui indicator este egală cu zero, acesta fiind
discriminant numai în cazul utilizării altor procedee de estimare cum ar fi, de exemplu, metoda
grafică, metoda punctelor empirice sau metoda punctelor medii.
Modelul unifactorial

• ponderea covarianţei

2(1 − r )σ yˆ t σ yt
TC = (3.5.10)
1 n
∑ ( yˆ t − yt )2
n t =1

unde:
r = coeficientul de corelaţie liniară dintre valoarea estimată a variabilei
endogene, ŷt , şi cea reală, yt.

∑ (yˆ )( )
n

t − yˆ yt − y
r= t =1
(3.5.11)
nσ yˆ t σ yt

Se poate observa uşor că semnificaţia acestui indicator este analogă


cu a celor menţionaţi anterior.
De altfel cei patru indicatori se regăsesc în următoarea ecuaţie
propusă de Theil:

1 n

n t =1
(
2
) (
( yˆ t − yt )2 = yˆ − y + σ yˆt − σ yt )
2
+ 2(1 − r )σ yˆ t σ yt (3.5.12)

a cărei interpretare se realizează prin intermediul semnificaţiei acestor


indicatori.
În cazul în care modelul econometric se utilizează în special la
prognoza fenomenelor economice este necesară verificarea stabilităţii în
timp a legităţii de evoluţie a fenomenului analizat în funcţie de evoluţia
factorilor săi. Acest lucru se poate realiza cu ajutorul testului Chow, care se
aplică astfel:
- fie modelul unifactorial iniţial:

n
2
- y0t = a + b x0t + u0t ( t = 1, n ); V u0
= ∑ u 02t (3.5.13)
t =1
Modele econometrice

pe care îl împărţim în două modele:

n1
2
- y1t = a1 + b1 xt + u1t ( t = 1, n 1 ); V u1
= ∑ u 12t (3.5.14)
t =1

n
2 2
y2t = a2 + b2 xt + u2t ( t = n 1 +1, n ); V u2= ∑u 2t (3.5.15)
t = n 1 +1

n n1 n
∑ u 2t = ∑ u 2
1t + ∑u2
2t ⇔V 2
u =V 2
u1
+V 2
u2
(3.5.16)
t =1 t =1 t = n 1 +1

n = n 1 + n 2, n = numărul de observaţii.

Testarea ipotezei de stabilitate constă în alegerea uneia din


următoarele ipoteze:
2 2
H0: Dacă V u0
≅V u rezultă că legitatea de evoluţie a fenomenului
este stabilă în timp, iar modelul poate fi utilizat în vederea efectuării
prognozei;
2 2
H1: Dacă V u0
≠V u rezultă că legitatea de evoluţie a fenomenului
nu este stabilă în timp, iar modelul nu va putea fi utilizat în vederea
efectuării prognozei.

Aplicarea testului Fisher-Snedecor constă în:

2 2
V u0
−V u n − 2 (k + 1)
- dacă F c = ⋅ ≤F α ; v 1 ;v (3.5.17)
V 2
u
k +1 2

se alege ipoteza H0, în caz contrar se alege ipoteza H1 ( numărul gradelor de


libertate este: v1= k + 1, v2 = n – 2 ( k + 1 ), k = numărul variabilelor
exogene).
Modelul unifactorial

Exemplu de aplicare a modelului unifactorial

Se cunosc următoarele date privind consumul final real al


gospodăriilor populaţiei şi PIB-ul real în România, în perioada 1990-2003,
exprimate în preţuri comparabile (1990=100).

Tabelul 3.5.1
Consumul final real al
PIB
gospodăriilor populaţiei
Anul (mild.lei preţuri comparabile)
(mild.lei preţuri comparabile)
(1990=100)
(1990=100)
0 1 2
1990 557,7 857,9
1991 467,4 746,8
1992 432,1 681
1993 435,9 691,3
1994 447,3 718,2
1995 505,3 769,3
1996 545,7 799,5
1997 525,7 750,7
1998 586,2 714,8
1999 579,8 706,1
2000 582,3 720,7
2001 610,7 761,7
2002 629,1 799,1
2003 673,7 838,3
Notă: Ambii indicatori sunt calculaţi conform metodologiei de calcul a Sistemului European al
Conturilor Economiei Integrate - SEC 1979. Consumul final al populaţiei a fost deflaţionat cu ajutorul
deflatorului consumului final al populaţiei exprimat în preţuri constante (1990 = 100), datele
provenind de la Ministerul Prognozei şi Dezvoltării, iar PIB-ul a fost deflaţionat cu ajutorul
deflatorului PIB exprimat în preţuri constante (1990 = 100), obţinut în urma prelucrării datelor din
Raportul Anual BNR.
Sursa: Date prelucrate pe baza Anuarului Statistic al României 2003, INS, Bucureşti, 2004-CD,
Raportului Anual 2000, BNR, Bucureşti, 2001, p. 6*-7*, Raportului Anual 2002 BNR, Bucureşti, 2003,
p. 4*-5*, Comunicatului de Presă al INS nr.11/26.02.2004.

Se cere:
a) Să se construiască modelul econometric ce descrie legătura dintre
cele două variabile şi să se interpreteze semnificaţia parametrilor modelului;
Modele econometrice

b) Să se estimeze parametrii modelului şi să se verifice semnificaţia


acestora;
c) Ştiind că în anul 2004, valoarea PIB-ului real12 a fost egală cu
907,8 mild lei preţuri comparabile (1990=100), să se estimeze valoarea
consumului final real al gospodăriilor populaţiei în anul 2004 şi să se
verifice capacitatea de prognoză a modelului utilizat.

Rezolvare:

a) Notând cu y = consumul final real al gospodăriilor populaţiei;


x = PIB-ul real;
modelul econometric va fi de forma: y = f ( x) + u .
Pentru alegerea funcţiei matematice f ( x) se recurge la reprezentarea
grafică a celor două şiruri de valori.

y
670
650
630
610
590
570
550
530
510
490
470
450 x
430
670 685 700 715 730 745 760 775 790 805 820 835 850

Figura 2.3.1. Legătura dintre consumul final real al gospodăriilor populaţiei


şi PIB-ul real al României

12
Valoare estimată pe baza informaţiilor furnizate în cadrul Comunicatului de Presă al INS
nr. 12/11.03.2005, privind principalii indicatori conjuncturali în anul 2004 şi luna
ianuarie 2005
Modelul unifactorial

Deoarece graficul punctelor empirice indică faptul că distribuţia


poate fi aproximată cu o dreaptă, modelul econometric devine:

yt = a + bxt + ut ; t = 1,14

Semnificaţia economică a celor doi parametrii a şi b , ţinând cont de


semnificaţia celor două variabile (y - consumul final real al gospodăriilor
populaţiei şi x - PIB-ul real) este:
- parametrul a reprezintă în acest caz autoconsumul, deoarece
pentru x = 0 ⇒ y = a ;
- parametrul b reprezintă panta dreptei sau coeficientul de regresie al
consumului în funcţie de PIB, care măsoară creşterea consumului dacă PIB-
ul se modifică cu un miliard de lei.
b) Estimarea parametrilor modelului econometric de la punctul a) se
face cu ajutorul M.C.M.M.P.:

( ) ( )
14 14
F aˆ , bˆ = min ∑ ( y t − yˆ t ) = min ∑ y t − aˆ − bˆxt
2 2

t =1 t =1

F ′( a$ ) = 0 ⇒ na$ + b$∑ x t = ∑ y t

()
F ′ b$ = 0 ⇒ a$ ∑ x t + b$∑ x t2 = ∑ y t x t
⎧⎪14 aˆ + 10555 ,4bˆ = 7578 ,9
⇒⎨
⎪⎩10555 , 4 aˆ + 7996163 ,14 bˆ = 5744734 ,07
(vezi tabelul 3.5.2., coloanele 2, 3, 4, 5).
Modele econometrice

Tabelul 3.5.2
Nr.
Anul xt yt x t2 xt yt uˆ t −1 uˆ t2−1 uˆ t uˆ t −1
crt.
0 1 2 3 4 5 6 7 8
1 1990 857,9 557,7 735992,41 478450,83 - - -
2 1991 746,8 467,4 557710,24 349054,32 -67,6095 4571.0382 4608,8583
3 1992 681 432,1 463761,00 294260,10 -68,1688 4646.9914 3430,1977
4 1993 691,3 435,9 477895,69 301337,67 -50,3191 2532.0160 2759,4477
5 1994 718,2 447,3 515811,24 321250,86 -54,8389 3007.3080 3573,7049
6 1995 769,3 505,3 591822,49 388727,29 -65,1673 4246.7772 3156,9084
7 1996 799,5 545,7 639200,25 436287,15 -48,4431 2346.7374 1571,3535
8 1997 750,7 525,7 563550,49 394642,99 -32,4371 1052.1637 422,3000
9 1998 714,8 586,2 510939,04 419015,76 -13,0191 169.4958 -995,6848
10 1999 706,1 579,8 498577,21 409396,78 76,4790 5849.0429 5897,0252
11 2000 720,7 582,3 519408,49 419663,61 77,1064 5945.4012 5228,8438
12 2001 761,7 610,7 580186,89 465170,19 67,8133 4598.6481 4278,7321
13 2002 799,1 629,1 638560,81 502713,81 63,0957 3981.0719 3235,9296
14 2003 838,3 673,7 702746,89 564762,71 51,2860 2630.2565 3293,7103
Total 10555,4 7578,9 7996163,14 5744734,07 - 45576,9481 40461,3270

Tabelul 3.5.2 (continuare)


y = yt −
*
t x = xt −
*
y = yt −
*
t
xt* = xt −
t
− 0,8878 yt −1 − 0,9016 yt −1 − 0,9016 xt −1
− 0,8878 x t −1
9 10 11 12
- - - -
-27,7030 -14,8081 -35,4029 -26,6527
17,1616 18,0219 10,7085 7,7112
52,2995 86,7364 46,3337 77,3342
60,3260 104,4925 54,3078 94,9481
108,2056 131,7118 102,0299 121,7959
97,1156 116,5473 90,1392 105,9260
41,2501 40,9370 33,7159 29,8987
119,5053 48,3596 112,2472 37,9951
59,3959 71,5302 51,3025 61,6613
67,5776 93,8537 59,5726 84,1049
93,7582 121,8924 85,7186 111,9420
86,9458 122,8943 78,5142 112,3779
115,2111 128,8921 106,5254 117,8593
891,0494 1071,0611 795,7127 936,9018
Modelul unifactorial

Utilizând pachetul de programe EViews în vederea estimării


parametrilor modelului au fost obţinute următoarele rezultate:

Dependent Variable: Y
Method: Least Squares
Sample: 1990 2003
Included observations: 14
Std. t-
Variable Coefficient Semnif. ind. Semnif. ind. Semnif. ind. Prob.
Error Statistic
C -67,6561 â 250,0188 saˆ -0,2706 t aˆ 0,7913 p(aˆ )
X 0,8077 b̂ 0,3308 sbˆ 2,4416 tbˆ ()
0,0311 p b̂

R-squared 0,3319 R2 Mean dependent var 541,35 y


Adjusted sy
R-squared
0,2762 Rc2 S.D. dependent var 75,6474

S.E. of
64,3567 suˆ Akaike info criterion 11,2983 AIC
regression

Sum
∑ ( y − yˆ )
2
t t =
squared 49701,46 Schwarz criterion 11,3896 SC
= ∑ uˆ 2

resid t

Log
-77,0883 L F-statistic 5,9615 Fc
likelihood
Durbin-
Watson 0,1969 d Prob(F-statistic) 0,0311 p(F)
stat

Semnificaţia indicatorilor necunoscuţi pe care-i calculează pachetul


de programe EViews este următoarea:
()
p (aˆ ), p bˆ = probabilitatea asociată parametrului â, respectiv b̂ . O
valoare cât mai apropiată de zero a acestei probabilităţi va indica o
semnificaţie ridicată a parametrului respectiv, în caz contrar, aceasta
confirmând, împreună cu testul t, faptul că parametrul respectiv este
nesemnificativ.
Rc2 = coeficientul de deteminare corectat sau ajustat. Acesta este
utilizat în vederea evidenţierii numărului de variabile factoriale cuprinse în
model, precum şi a numărului de observaţii pe baza cărora au fost estimaţi
parametrii modelului. În cazul unui model multifactorial acesta va înregistra
Modele econometrice

valori inferioare coeficientului de deteminaţie. Expresia acestui indicator


este următoarea:

n −1
Rc2 =1 − ⋅ (1 − R 2 )
n−k

L= logaritmul funcţiei de verosimilitate (presupunând că erorile sunt


normal distribuite), funcţie ce este determinată ţinând seama de valorile
estimate ale parametrilor. Relaţia de calcul a acestui indicator, utilizată de
către pachetul de programe EViews, este următoarea:

n ⎛⎜ ⎛ ∑ uˆ t2 ⎞ ⎞
L = 1 + ln(2π ) + ln⎜ ⎟⎟
2 ⎜⎝ ⎜ n ⎟⎟
⎝ ⎠⎠

unde:
∑ uˆ 2
t = suma pătratelor erorilor;
k = numărul variabilelor exogene;
n = numărul de observaţii.
Acest indicator este utilizat în vederea elaborării unor teste statistice
destinate depistării variabilelor omise dintr-un model econometric, precum
şi a unor teste destinate depistării variabilelor redundante dintr-un model
econometric, ca, de exemplu, testul LR sau raportul verosimilităţilor
(Likelihood Ratio).
y = media variabilei dependente sau endogene, având următoarea
relaţie de calcul:
n

∑y t
y= t =1

n
Modelul unifactorial

s y = abaterea medie pătratică (standard) corespunzătoare variabilei


dependente, a cărei relaţie de calcul este următoarea:

∑ (y )
n
2
t −y
sy = t =1

n −1

AIC = criteriul Akaike este utilizat în cazul comparării a două sau


mai multe modele econometrice. Relaţia de calcul a acestuia, utilizată de
către pachetul de programe EViews, este următoarea:
2 L 2k
AIC = − +
n n
Regula de decizie utilizată în cazul aplicării acestui test este aceea
potrivit căreia este ales acel model econometric pentru care s-a obţinut
valoarea cea mai mică corespunzătoare acestui indicator.
SC = criteriul Schwartz este, de asemenea, utilizat pentru a compara
două sau mai multe modele econometrice. Relaţia de calcul a acestuia,
utilizată de către pachetul de programe EViews, este următoarea:

2 L k ln n
SC = − +
n n

Şi în acest caz, este ales acel model econometric pentru care s-a
obţinut valoarea cea mai mică corespunzătoare acestui indicator.
p(F) = probabilitatea asociată statisticii F. O valoare cât mai
apropiată de zero a acestei probabilităţi va indica o semnificaţie ridicată a
rezultatelor estimării, respectiv a modelului.
Pe baza estimatorilor parametrilor au fost calculate valorile estimate
ale variabilei y, yˆ t = −67,6561 + 0,8077 xt şi ale variabilei reziduale,
uˆt = yt − yˆ t . Valorile acestora sunt prezentate în cadrul tabelului 3.5.3
(utilizând pachetul de programe EViews).
Modele econometrice

Tabelul 3.5.3
Actual Fitted Residual Residual Plot
yt ŷt uˆt = yt − yˆt (graficul reziduurilor)

557,7 625,3095 -67,6095 | * | . |


467,4 535,5688 -68,1688 | *. | . |
432,1 482,4191 -50,3191 | .* | . |
435,9 490,7389 -54,8389 | .* | . |
447,3 512,4673 -65,1673 | * | . |
505,3 553,7431 -48,4431 | .* | . |
545,7 578,1371 -32,4371 | . * | . |
525,7 538,7191 -13,0191 | . *| . |
586,2 509,7210 76,4790 | . | . *|
579,8 502,6936 77,1064 | . | . *|
582,3 514,4867 67,8133 | . | * |
610,7 547,6043 63,0957 | . | * |
629,1 577,8140 51,2860 | . | *. |
673,7 609,4776 64,2224 | . | * |

- dispersia variabilei reziduale


(y − yˆ t )
=∑
2
49701,4613
2
s uˆ t
= = 4141,7884
n − k −1 14 − 2

unde:
k = numărul variabilelor exogene.
(vezi tabelul afişat de programul EViews)
- abaterea medie pătratică a variabilei reziduale, suˆ :

∑(y − yˆ t )
2

suˆ = t
= 4141,7884 = 64,3567
n − k −1
(vezi tabelul afişat de programul EViews)

- abaterile medii pătratice ale celor doi estimatori:

⎡1 x2 ⎤
saˆ = su2ˆ ⎢ + 2⎥
= 250,0188
⎢⎣ n ∑ ( xt − x ) ⎥⎦
Modelul unifactorial

su2ˆ
sbˆ = = 0,3308
∑ (xt − x )
2

(vezi tabelul afişat de programul EViews)

- raportul de corelaţie:

14 14

∑(y − yˆ t ) ∑(y − yˆ t )
2 2
t t
t =1 t =1
R = R2 = 1− = 1−
14
s y2 ⋅ (n − 1)
∑ ( yt − y )
2

t =1

49701,4613
R = 1− = 0,3319 = 0,5761
74392,875
(vezi tabelul afişat de programul EViews)

- variabila Durbin-Watson, d:

14

∑ (uˆ t − uˆ t −1 )
2

9784,7173
d= t =2
14
= = 0,20
49701,4613
∑ uˆ
t =1
2
t

(vezi tabelul afişat de programul EViews)

Astfel, modelul estimat devine:


yˆ t = −67,6561 + 0,8077 xt ; R = 0,576
(250,0188) (0,3308) d = 0,20
suˆ = 64,3567
Verificarea semnificaţiei modelului necesită:
- verificarea ipotezei de independenţă a erorilor;
- verificarea ipotezei de homoscedasticitate a erorilor;
- verificarea semnificaţiei estimatorilor;
- verificarea semnificaţiei raportului de corelaţie.
Modele econometrice

Verificarea ipotezei de independenţă a erorilor, care presupune


cov( u t , u t −1 ) = 0 , se realizează cu ajutorul testului Durbin-Watson, constând
în calcularea variabilei d şi compararea sa cu două valori teoretice d 1 şi
d2 (d1 = 1,08; d 2 = 1,36) , preluate din tabela distribuţiei Durbin-Watson în
funcţie de un prag de semnificaţie α (α = 0,05) , de numărul variabilelor
explicative k ( k = 1) şi de numărul observaţiilor n ( n ≥ 15) . Observaţie:
tabela Durbin-Watson este construită pentru un număr de observaţii n ≥ 15 ;
pentru valori inferioare se va lucra cu valorile calculate pentru n = 15 .
adică d1 = 1,08, d 2 = 1,36 .
Deoarece valoarea calculată d = 0,2 este cuprinsă în intervalul
0 < d = 0,2 < d1 = 1,08 , aceasta indică existenţa unei autocorelări pozitive.
Din acest motiv, nu mai are sens testarea celorlalte ipoteze, a semnificaţiei
estimatorilor şi a raportului de corelaţie, estimatorii nemaifiind eficienţi,
deci se impune mai întâi eliminarea fenomenului de autocorelaţie a erorilor.
Un alt procedeu de verificare a ipotezei de independenţă a erorilor
constă în aplicarea testului Breusch-Godfrey, acest test fiind utilizat în
vederea depistării unei autocorelaţii de ordin superior. Ca urmare a
presupunerii existenţei unei autocorelaţii de ordin superior se construieşte
următorul model:

u t = r1u t −1 + r2 u t − 2 + K + r p u t − p + z t

unde:
zt = variabilă reziduală de medie zero şi dispersie constantă.

Ipoteza nulă care stă la baza testului este aceea potrivit căreia toţi
coeficienţii corespunzători valorilor decalate ale variabilei reziduale sunt
simultan egali cu zero, fapt ce implică non-existenţa fenomenului de
autocorelaţie a erorilor.
În vederea aplicării testului sunt estimate valorile variabilei reziduale
ut în urma aplicării M.C.M.M.P. asupra modelului iniţial. Variabila
Modelul unifactorial

reziduală ut este regresată apoi în funcţie de variabilele exogene iniţiale ale


modelului şi de valorile decalate ale sale, respectiv ut-1, ut-2,…, ut-p. În cazul
acestei regresii este calculată valoarea coeficientului de determinare R2 şi a
unei variabile de forma: BG = (n-p) R2. Presupunând că ne aflăm în situaţia
unui eşantion de volum mare, variabila BG este asimptotic distribuită sub
forma unui χ α2 ;v , pentru care numărul gradelor de libertate este egal cu:
v = p , unde p = mărimea decalajului , respectiv: BG~ χ α2 ;v .

Dacă BG > χ α2 ;v , ipoteza nulă este respinsă, ceea ce presupune că


există cel puţin un coeficient de autocorelaţie nenul.

Aplicarea testului Breusch-Godfrey s-a realizat utilizând pachetul de


programe EViews (presupunând ca mărimea decalajului este p = 2):

Breusch-Godfrey Serial Correlation LM Test:


F-statistic 16,6537 Probability 0,0007
Obs*R-squared 10,7673 Probability 0,0046

Test Equation:
Dependent Variable: RESID
Method: Least Squares
Variable Coefficient Std. Error t-Statistic Prob.
C 166,6378 146,9445 1,1340 0,2832
X -0,2158 0,1935 -1,1154 0,2908
RESID(-1) 1,0098 0,2999 3,3669 0,0072
RESID(-2) -0,0880 0,3298 -0,2667 0,7951
R-squared 0,7691 Mean dependent var -3,45E-14
Adjusted R-squared 0,6998 S.D. dependent var 61,8319
S.E. of regression 33,8769 Akaike info criterion 10,1183
Sum squared resid 11476,43 Schwarz criterion 10,3009
Log likelihood -66,8281 F-statistic 11,1025
Durbin-Watson stat 1,4994 Prob(F-statistic) 0,0016
Modele econometrice

În cazul utilizării pachetului de programe EViews există două


variante de aplicare a testului Breusch-Godfrey:
- utilizarea testului Fisher–Snedecor aplicat în vederea verificării
existenţei unor variabile absente (omise) în model, având următoarea relaţie
de calcul:
R2 p
Fc =
(1 − R 2 ) (n − m)
unde:
p = numărul de variabile noi adăugate în model, respectiv ut-1, ut-2,…, ut-
p;
m = numărul total de parametri corespunzători noului model.

Dacă Fc < Fα ;v1 ;v2 , unde v1 = p şi v2 = n-m, ipoteza conform căreia


estimatorii corespunzători noilor parametri adăugaţi în model sunt nuli este
verificată, respectiv, în cazul nostru, fenomenul de autocorelare a erorilor nu
este prezent, cazul contrar implicând existenţa cel puţin a unei autocorelaţii
de ordinul întâi. Cum Fc = 16,6537 > F0, 05; 2;10 = 4,10 , rezultă că noul model
este incorect specificat, indicând astfel prezenţa unei autocorelaţii de ordinul
întâi.
- utilizarea testului LM, calculat ca produs între numărul de
observaţii corespunzătoare modelului, n, şi coeficientul de determinare, R2,
corespunzător acestei regresii auxiliare. În general, testul LM este asimptotic
distribuit sub forma unui χ α2 ;v , pentru care numărul gradelor de libertate este
egal cu: v = p , unde p = mărimea decalajului, respectiv:

LM = n ⋅ R 2 ~ χ α2 ;v

Dacă LM > χ α2 ;v , erorile sunt autocorelate, în caz contrar, sunt


independente, respectiv ipoteza nulităţii parametrilor, r1 = r2 = 0 , este
Modelul unifactorial

acceptată. Se constată astfel că pachetul de programe nu utilizează relaţia


clasică de calcul a testului Breusch-Godfrey, respectiv: BG = (n-p)·R2.
Deoarece LM = 10,7673 > χ 02,05; 2 = 5,99147 , aceasta implică existenţa
a cel puţin unei autocorelaţii de ordinul întâi, ce poate fi remarcată şi pe
baza semnificaţiei parametrului corespunzător valorii decalate cu o perioadă
a variabilei reziduale.
În cazul calculării în varianta clasică a testului Breusch-Godfrey,
respectiv: BG = 12 ⋅ 0,7691 = 9,2291 > χ 02,05; 2 = 5,99147 , se ajunge la aceleaşi
concluzii menţionate anterior.
Eliminarea fenomenului de autocorelare a erorilor presupune
efectuarea următoarelor operaţii:
- erorile fiind corelate, adică:

u t = r(1) u t −1 + z t (1)

se va estima valoarea coeficientului de autocorelaţie de ordinul 1:

14

∑ uˆ uˆ t t −1
40461,327
r(1) = t =2
14
= = 0,89
45576,9481
∑ uˆ
t =2
2
t −1

(vezi tabelul 2.3.2., coloanele 6, 7, 8)

- ştiind că:
y t = a + bx t + u t ⇒ u t = y t − a − bx t
y t − 1 = a + bx t −1 + u t −1 ⇒ u t − 1 = y t −1 − a − bx t − 1
expresiile obţinute pentru u t şi u t − 1 vor fi înlocuite în relaţia (1) şi se
obţine:

y t − a − bx t = r(1) ( y t −1 − a − bx t −1 ) + z t

( ) ( )
y t − r(1) y t −1 = a 1 − r(1) + b x t − r(1) x t −1 + z t
Modele econometrice

Notând cu: y t* = y t − r(1) y t −1


x t* = x t − r(1) x t −1

(
a 1 = a 1 − r(1) )
b1 = b

se obţine:
yt* = a1 + b1 xt* + z t ⇒ yˆ t* = aˆ1 + bˆ1 xt* (2)
În vederea estimării parametrilor a$ 1 şi b$1 se aplică M.C.M.M.P.:

( ) ( )
14
F aˆ1 , bˆ1 = min ∑ y t* − aˆ1 − bˆ1 xt*
2

t =2

F ′( a1 ) = 0 ⇒ ( n − 1) a$ 1 + b$1 ∑ x t* = ∑ y t*

F ′(b1 ) = 0 ⇒ a$ 1 ∑ x t* + b$1 ∑ x t* ( ) =∑y x


2 * *
t t

În urma aplicării programului EViews, rezultatele estimării noului


modelului au fost următoarele:

*
Dependent Variable: y t
Method: Least Squares
Sample: 1991 2003
Included observations: 13
Variable Coefficient Std. Error t-Statistic Prob.
C 9,5845 15,4322 0,6211 0,5472
x t* 0,7156 0,1645 4,3505 0,0012
R-squared 0,6324 Mean dependent var 68,5423
Adjusted R-squared 0,5990 S.D. dependent var 42,0350
S.E. of regression 26,6176 Akaike info criterion 9,5417
Sum squared resid 7793,4860 Schwarz criterion 9,6286
Log likelihood -60,0208 F-statistic 18,9270
Durbin-Watson stat 1,7216 Prob(F-statistic) 0,0012
Modelul unifactorial

Ca şi în cazul modelului iniţial se vor calcula valorile estimate ale


variabilei y t* , ⇒ yˆ t* = 9 ,5845 + 0 , 7156 x t* şi ale variabilei reziduale,
zˆ t = y t* − yˆ t* . Valorile acestora sunt prezentate în cadrul tabelului 3.5.4
(utilizând pachetul de programe EViews).

Tabelul 3.5.4
Actual Fitted Residual Residual Plot
zˆ t = y t* − yˆ t* (graficul reziduurilor)
y t* yˆ t*
-27,7030 -1,0121 -26,6909 | * | . |
17,1616 22,4810 -5,3194 | . *| . |
52,2995 71,6530 -19,3535 | .* | . |
60,3260 84,3593 -24,0332 | * | . |
108,2056 103,8374 4,3682 | . |* . |
97,1156 92,9857 4,1299 | . |* . |
41,2501 38,8790 2,3711 | . * . |
119,5053 44,1907 75,3147 | . | . *|
59,3959 60,7715 -1,3755 | . * . |
67,5776 76,7461 -9,1686 | . *| . |
93,7582 96,8106 -3,0525 | . *| . |
86,9458 97,5276 -10,5818 | .*| . |
115,2111 101,8196 13,3914 | . |*. |

Pe baza calculelor prezentate mai sus rezultă modelul:


yˆ t* = 9,5845 + 0,7156 xt* ; R′ = 0,795
(15,4322) (0,1645) d ′ = 1,72 (3)
szˆ = 26,6176

Utilizând testul Durbin-Watson pentru a verifica dacă fenomenul de


autocorelaţie a fost eliminat - pentru un prag de semnificaţie
α = 0,05, k = 1, n = 13 ≅ 15 valorile teoretice ale variabilei Durbin-Watson
sunt d1 = 1,08, d 2 = 1,36 . În comparaţie cu acestea, valoarea empirică
d ′ = 1,72 se situează astfel: d 2 = 1,36 < d ′ = 1,72 < 4 − d 2 = 2,64 , ceea ce
indică fenomenul de independenţă a erorilor, deci fenomenul de
autocorelaţie a fost eliminat.
Modele econometrice

Verificarea ipotezei de homoscedasticitate a erorilor în cazul acestui


model se va realiza cu ajutorul testului White. Utilizând programul EViews
au fost obţinute următoarele rezultate:

White Heteroskedasticity Test:


F-statistic 0,8259 Probability 0,4656
Obs*R-squared 1,8430 Probability 0,3979

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Sample: 1991 2003
Included observations: 13
Variable Coefficient Std. Error t-Statistic Prob.
C 927,8680 1016,2720 0,9130 0,3827
*
x t
18,3437 32,0687 0,5720 0,5799
2
xt* -0,2090 0,2342 -0,8925 0,3931

R-squared 0,1418 Mean dependent var 599,4989


Adjusted R-squared -0,0299 S.D. dependent var 1542,118
S.E. of regression 1564,9870 Akaike info criterion 17,7483
Sum squared resid 24491851 Schwarz criterion 17,8787
Log likelihood -112,3641 F-statistic 0,8259
Durbin-Watson stat 2,7426 Prob(F-statistic) 0,4656

Analizând rezultatele afişate de programul EViews se constată că


Fc = 0,8259 < F0, 05; 2;10 = 4,10 şi LM = 1,843 < χ 02,05; 2 = 5,99147 , iar
estimatorii parametrilor modelului sunt nesemnificativi pentru un prag de
semnificaţie α = 0,05 ( t0, 05;10 = 2,228 ), deci ipoteza de homoscedasticitate
se verifică.
Estimatorii modelului sunt semnificativ diferiţi de zero dacă:
aˆ1
t aˆ1 = ≥ tα ;(n −1)− k −1
s aˆ1
Modelul unifactorial

9,5845
t aˆ1 = = 0,6211
15,4322

bˆ1
t bˆ = ≥ tα ;(n −1)− k −1
1
sbˆ
1

0,7156
t bˆ = = 4,3505
1 0,1645

Lucrând cu un prag de semnificaţie α (α = 0,05) , din tabela


distribuţiei Student se preia valoarea t 0, 05;11 = 2,201 . Comparând această
valoare cu valorile calculate pentru cei doi estimatori, se constată că:
- t aˆ1 = 0,6211 < t0, 05;11 = 2,201 ⇒ parametrul a$ 1 nu este semnificativ
diferit de zero;
- t bˆ = 4,3505 > t0.05;11 = 2,201 ⇒ parametrul b$1 este semnificativ
1

diferit de zero.
Raportul de corelaţie este semnificativ diferit de zero dacă se verifică
inegalitatea: Fc ≥ Fα ;v1 ;v2 , unde valoarea empirică a variabilei
Fisher-Snedecor este:

R2 0,3319
Fc = ((n − 1) − 2) = 11 * = 5,9615
1− R 2
1 − 0,3319

Din tabela distribuţiei Fisher-Snedeckor, cu un prag de semnificaţie


de 5% şi în funcţie de numărul gradelor de libertate v1 = k = 1 şi
v2 = (n − 1) − k − 1 = 11 se preia valoarea teoretică F0,05;1;11 = 4,84 . Se
constată că Fc = 5,9615 > F0, 05;1;11 = 4,84 , deci pentru un prag de
semnificaţie de 5%, valoarea raportului de corelaţie este semnificativ
diferită de zero.
Modele econometrice

În concluzie, modelul yˆ t* = 9,5845 + 0,7156 xt* poate fi apreciat ca


reprezentativ pentru descrierea dependenţei dintre consumul final real al
gospodăriilor populaţiei şi PIB-ul real.

O altă variantă a metodei de eliminare a fenomenului de autocorelare


a erorilor prezentate mai sus constă în determinarea coeficientului de
autocorelaţie de ordinul 1 pe baza variabilei Durbin-Watson, d, pentru a
facilita utilizarea pachetului de programe EViews în vederea eliminării
autocorelaţiei erorilor (utilizând programul autocorelaţie.prg):

d 0,20
r(1) = 1 − = 1− = 0,90
2 2

Rezultatele estimării modelului (2), utilizând pachetul de programe


EViews3, sunt următoarele:

Dependent Variable: DY
Method: Least Squares
Sample(adjusted): 1991 2003
Included observations: 13 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C 10,1602 13,8505 0,7336 0,4786
DX 0,7083 0,1628 4,3506 0,0012
R-squared 0,6325 Mean dependent var 61,2087
Adjusted R-squared 0,5990 S.D. dependent var 41,9044
S.E. of regression 26,5346 Akaike info criterion 9,5354

3
Pentru a elimina autocorelaţia erorilor cu ajutorul pachetului de programe EViews a fost
utilizat următorul program (conform http://www.cip.dauphine.fr/bourbonnaise/eco.html)
denumit autocorelatie.prg:
Estimarea directa a coeficientului de autocorelatie notat cu rau plecand de la statistica DW'
Equation eq1.ls y c x
genr res = resid
scalar rau1=1-@dw/2
genr dy=y-rau1*y(-1) 'Se genereaza qvasi-diferentele.'
genr dx=x-rau1*x(-1)
equation eqm1.ls dy c dx 'Régresie denumita eqm1'
scalar am1=c(1)/(1-rau1) 'Coef de reg.'
Modelul unifactorial

Sum squared resid 7744,9060 Schwarz criterion 9,6223


Log likelihood -59,9802 F-statistic 18,9279
Durbin-Watson stat 1,75 Prob(F-statistic) 0,0012

Valorile estimate ale variabilei y t* şi ale variabilei reziduale,


zˆ t = y t* − yˆ t* sunt prezentate în cadrul tabelului 3.5.5 (utilizând pachetul de
programe EViews).

Tabelul 3.5.5
Actual Fitted Residual Residual Plot
y *
yˆ * zˆ t = y t* − yˆ t* (graficul reziduurilor)
t t

-35,2893 -8,5948 -26,6945 | * | . |


10,8036 15,7300 -4,9263 | . *| . |
46,4217 65,0361 -18,6144 | .* | . |
54,3965 77,5139 -23,1174 | * | . |
102,1210 96,5348 5,5862 | . |* . |
90,2420 85,3011 4,9410 | . |* . |
33,8270 31,4535 2,3735 | . * . |
112,3543 37,1813 75,1730 | . | . *|
51,4219 53,9395 -2,5176 | . * . |
59,6906 69,8356 -10,1449 | .*| . |
85,8372 89,5554 -3,7182 | . *| . |
78,6385 89,8700 -11,2314 | .*| . |
106,6535 93,7580 12,8955 | . |*. |

Pe baza calculelor prezentate mai sus rezultă modelul:

yˆ t* = 10,1602 + 0,7083 xt* ; R ′ = 0,795


(13,8505) (0,1628) d ′ = 1,75 (4)
s zˆ = 26,5346

Utilizând testul Durbin-Watson pentru a verifica dacă fenomenul de


autocorelaţie a fost eliminat - pentru un prag de semnificaţie
α = 0,05, k = 1, n = 13 ≅ 15 valorile teoretice ale variabilei Durbin-Watson
Modele econometrice

sunt d1 = 1,08, d 2 = 1,36 . În comparaţie cu acestea, valoarea empirică


d ′ = 1,75 se situează astfel: d 2 = 1,36 < d ′ = 1,75 < 4 − d 2 = 2,64 , ceea ce
indică fenomenul de independenţă a erorilor, deci fenomenul de
autocorelaţie a fost eliminat.
Verificarea ipotezei de homoscedasticitate a erorilor în cazul acestui
model se va realiza cu ajutorul testului White. Utilizând programul EViews
au fost obţinute următoarele rezultate:

White Heteroskedasticity Test:


F-statistic 0,8302 Probability 0,4639
Obs*R-squared 1,8512 Probability 0,3963

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Sample: 1991 2003
Included observations: 13
Variable Coefficient Std. Error t-Statistic Prob.
C 1108,2070 824,2150 1,3446 0,2085
*
x t 13,6436 26,6751 0,5115 0,6201
*2
x t -0,2067 0,2293 -0,9013 0,3886
R-squared 0,1424 Mean dependent var 595,7620
Adjusted R-squared -0,0291 S.D. dependent var 1535,4140
S.E. of regression 1557,6090 Akaike info criterion 17,7389
Sum squared resid 24261469,0 Schwarz criterion 17,8692
Log likelihood -112,3026 F-statistic 0,8302
Durbin-Watson stat 2,7474 Prob(F-statistic) 0,4639

Analizând rezultatele afişate de programul EViews se constată că


Fc = 0,8302 < F0, 05; 2;10 = 4,10 şi LM = 1,8512 < χ 02,05; 2 = 5,99147 , iar
estimatorii parametrilor modelului sunt nesemnificativi pentru un prag de
semnificaţie α = 0,05 ( t0, 05;10 = 2,228 ), deci ipoteza de homoscedasticitate
se verifică.
Modelul unifactorial

Pentru a verifica semnificaţia estimatorilor parametrilor modelului,


lucrând cu un prag de semnificaţie α (α = 0,05) , din tabela distribuţiei
Student se preia valoarea t 0, 05;11 = 2,201 . Comparând această valoare cu
valorile calculate pentru cei doi estimatori, se constată că:
- t aˆ1 = 0,7336 < t 0,05;11 = 2,201 ⇒ parametrul a$ 1 nu este semnificativ
diferit de zero;
- t bˆ = 4,3506 > t 0.05;11 = 2,201 ⇒ parametrul b$1 este semnificativ
1

diferit de zero.
Pentru a verifica semnificaţia raportului de corelaţie, din tabela
distribuţiei Fisher-Snedecor, cu un prag de semnificaţie de 5% şi în funcţie
de numărul gradelor de libertate v1 = k = 1 şi v2 = (n − 1) − k − 1 = 11 se
preia valoarea teoretică F0, 05;1;11 = 4,84 . Se constată că
Fc = 18,9279 > F0, 05;1;11 = 4,84 , deci pentru un prag de semnificaţie de 5%,
valoarea raportului de corelaţie este semnificativ diferită de zero.
În concluzie, şi acest model, yˆ t* = 10,1602 + 0,7083 xt* , poate fi
apreciat ca reprezentativ pentru descrierea dependenţei dintre consumul
final real al gospodăriilor populaţiei şi PIB-ul real.

c) Analiza capacităţii de prognoză a modelului privind dependenţa


dintre dintre consumul final real al gospodăriilor populaţiei şi PIB-ul real în
România în perioada 1981-2003 poate fi realizată pe baza indicatorilor
statistici propuşi de H. Theil.
Aceşti indicatori, adaptaţi modelui supus analizei, au fost calculaţi
pe baza următoarelor relaţii:
• coeficientul Theil

1 n *
(
∑ yˆ t − y t*
n t =1
)
2

T=
1 n *2 1 n *2

n t =1
yˆ t + ∑ yt
n t =1

ale cărui valori sunt cuprinse în intervalul [0, 1].


Semnificaţia acestui indicator este invers proporţională cu mărimea
lui, respectiv cu cât valoarea acestuia este mai mică, tinzând către zero, cu
atât capacitatea de prognoză a modelului este mai bună.
Modele econometrice

• ponderea abaterii
2 2
⎛⎜ yˆ * − y * ⎞⎟ ⎛⎜ yˆ * − y * ⎞⎟
TA= ⎝ ⎠ =⎝ ⎠

∑ (yˆ )
n
1 * 2 σ z2
t − y t*
n t =1

unde:
*
ŷ = media valorilor teoretice ale variabilei endogene;
*
y = media valorilor reale ale variabilei endogene;
σz2 = dispersia variabilei reziduale necorectată cu numărul gradelor de
libertate.
Interpretarea acestui indicator, care evidenţiază existenţa unor erori
sistematice, este aceea că, în cazul ideal∗, valoarea sa este egală cu zero,
aceasta tinzând către unu în cazul unor erori de estimare de-a lungul întregii
serii de timp.
• ponderea dispersiei
2
⎡ 1 n 2
1
n 2 ⎤

(σ − σ y* )2

⎢ n ∑ ⎛⎜⎝ yˆ *
t − yˆ * ⎞⎟ −
⎠ n ∑ ⎛⎜ y * − y * ⎞⎟ ⎥
⎝ t
⎠ ⎥
D yˆ t* ⎣ t =1 t =1 ⎦
T = t
=
∑( )
n
1 2 σ z2
yˆ t* − y t*
n t =1

care este definită tot în intervalul [0, 1], aceasta măsurând evoluţia oscilantă
a celor două serii, respectiv seria ajustată şi seria empirică a variabilei
endogene. Acest indicator are aceeaşi semnificaţie ca şi cei precedenţi,
respectiv o valoare scăzută indică o capacitate bună de prognoză, în timp ce
o valoare apropiată de unu exprimă o eroare de specificare a modelului.
• ponderea covarianţei
2(1 − r )σ yˆ * σ y*
TC = t t

∑ (yˆ )
n
1 * 2
t − y t*
n t =1


Demn de menţionat este faptul că, în cazul estimării parametrilor unui model statistic cu ajutorul
metodei celor mai mici pătrate, valoarea acestui indicator este egală cu zero, acesta fiind
discriminant numai în cazul utilizării altor procedee de estimare cum ar fi, de exemplu, metoda
grafică, metoda punctelor empirice sau metoda punctelor medii.
Modelul unifactorial

unde:
r = coeficientul de corelaţie liniară dintre valoarea estimată a variabilei
endogene, yˆ t* , şi cea reală, yt* :

∑ (yˆ )( )
n
*
t − yˆ * yt* − y*
r= t =1
nσ yˆ * σ y *
t t

Se poate observa uşor că semnificaţia acestui indicator este analogă


cu a celor menţionaţi anterior.
De altfel cei patru indicatori se regăsesc în următoarea ecuaţie
propusă de Theil:

1 n *
( ) ( )
2
= yˆ * − y * + ⎛⎜ σ yˆ * − σ y * ⎞⎟ + 2(1 − r )σ yˆ * σ y *
2

2
yˆ t − y *t
n t =1 ⎝ t t ⎠ t t

a cărei interpretare se realizează prin intermediul semnificaţiei acestor


indicatori.
În urma calculelor efectuate cu ajutorul pachetului de programe
EViews în vederea testării capacităţii de prognoză a modelului privind
dependenţa dintre dintre consumul final real al gospodăriilor populaţiei şi
PIB-ul real în perioada 1981-2003 au rezultat următoarele informaţii:

Rezultatele testării capacităţii de prognoză a modelului privind


dependenţa dintre consumul final real al gospodăriilor populaţiei
şi PIB-ul real în România în perioada 1981-2003

Tabelul 3.5.6
Denumirea indicatorului Simbolul indicatorului Valoarea indicatorului
0 1 2
Coeficientul Theil T 0,1577
Ponderea abaterii TA 0,0000
Ponderea dispersiei TD 0,1140
Ponderea covarianţei TC 0,8860

În urma analizei rezultatelor obţinute se constată că modelul posedă


o bună capacitate de prognoză, ca urmare a valorilor mici înregistrate în
cazul coeficientului Theil, a ponderii abaterii şi a covarianţei şi, deci, poate
Modele econometrice

fi acceptat în vederea realizării unei prognoze a consumului final real al


gospodăriilor populaţiei.
Astfel, dacă valoarea PIB-ului real în anul 2004 a fost egală cu 907,8
mild. lei preţuri comparabile (1990=100), atunci:

*
x 2004 = 907,8 − 838,3 ⋅ 0,89 = 163,6272 mild. lei preţuri comparabile
Valoarea estimată a consumului final real al gospodăriilor populaţiei
în anul 2004, utilizând rezultatele estimării obţinute în cazul modelului (3)
este egală cu:

*
yˆ 2004 = aˆ1 + bˆ1 x 2004
*
= 9,5845 + 0,7156 ⋅ 163,6272 = 126,676 mild.lei
preţuri comparabile
Pe baza ipotezei formulate la punctele precedente, consumul final
real al gospodăriilor populaţiei, y*, urmează o distribuţie normală (sau
distribuţia Student, dacă n ≤ 30 ), de medie ŷ 2004
*
şi de abatere medie
pătratică s ŷ* , L ( y * ) = N yˆ 2004
2004
*
(
, s yˆ *
2004
).
*
Pentru x 2004 = 163,6272 ⇒ yˆ 2004
*
= 126,676

s yˆ *
⎛ 1

= s 1+ +
2
*
x2004 (
− x * ⎞⎟
2

= 708,
)
4988 ⋅

⎜1 +
1 (163,6272 − 82,3893) ⎞
+
2

2004
z
⎜ n′
⎝ ∑ tx *
− x (
* 2 ⎟
⎠ ) ⎜ 13
⎝ 26186 ,7452 ⎟

s yˆ * = 30,6848
2004

Estimarea consumului final real al gospodăriilor populaţiei, pe baza


unui interval de încredere, se calculează cu relaţia:

( *
P yˆ 2004 − t α s yˆ *
2004
≤ y 2004
*
≤ yˆ 2004
*
+ t α s yˆ *
2004
)= 1−α
Pentru α = 0,05 şi v = n − k − 1 = 11 , din tabela distribuţiei Student
se preia valoarea variabilei tα ;v = t 0, 05;11 = 2,201 .
Modelul unifactorial

Deci, cu un prag de semnificaţie de 0,05 sau cu o probabilitate egală


cu 0,95, valoarea estimată a consumului final real al gospodăriilor populaţiei
României în anul 2004 va fi cuprinsă în intervalul:

( *
P y 2004 )
∈ [126,676 ± 2,201 ⋅ 30,6848] = 1 − 0,05 = 0,95
P(y *
2004 )
∈ [59,14;194,21] = 0,95

You might also like