You are on page 1of 68

ACADEMIA DE STUDII ECONOMICE FACULTATEA DE ECONOMIE AGROALIMENTAR MEDIULUI

IA

Prof. univ. dr. MIRCEA GHEORGHI Conf. univ.dr. SIMONA ROXANA P T RL GEANU

ECONOMETRIE

BUCURE TI -2008-

CUPRINS Introducere Capitolul I: Modele econometrice 1.1. Generalit i 1.2. Model aleator 1.3. Natura variabilelor care apar n model 1.4. Induc ia statistic 1.5. Identificarea modelului 1.6. Previziunea variabilei endogene 1.7. Vocabular uzual Capitolul II: Regresia simpl 2.1. Modelul liniar al regresiei simple 2.2. Determinarea estimatorilor parametrilor prin metoda celor mai mici p trate 2.3. Propriet ile estimatorilor 2.3.1. Covarian a estimatorilor 2.3.2. Determinarea unui estimator nedeplasat pentru varian a erorilor 2.3.3. Interpretarea geometric a metodei celor mai mici p trate 2.3.4. Coeficientul de corela ie liniar 2.3.5. Distribu ia de probabilitate a estimatorilor 2.4. Teste i intervale de ncredere 2.5. Previziunea cu modelul liniar 2.6. Experien de calcul Capitolul III: Regresia multipl 3.1. Modelul liniar al regresiei multiple 3.2. Determinarea estimatorilor parametrilor 3.3. Propriet ile estimatorilor 3.4. Determinarea unui estimator nedeplasat pentru varian a reziduurilor 3.5. Teste i regiuni de ncredere 3.6. Previziunea variabilei endogene 3.7. Coeficientul de corela ie multipl . Analiza varian ei 3.8. Experien de calcul Capitolul IV: Studiul modelului liniar cnd ipotezele clasice asupra erorilor nu mai sunt realizate 4.1. Ipoteza de independen a erorilor 4.1.1. Testarea ipotezei de independen a erorilor 4.1.2. Experien de calcul 4.2. Ipoteza de normalitate a erorilor 4.3. Ipoteza de heteroscedasticitate 4.3.1. Experien de calcul 4.4. Ipoteza de independen a erorilor n raport cu variabilele exogene 4.5. Ipoteza referitoare la faptul c variabilele sunt observate f r er oare 4.5.1. Experien de calcul Bibliografie 3 4 4 4 4 5 5 5 6 10 10 11 12 15 16 18 21 22 24 25 29 34 34 35 36 38 39 41 42 45 49 49 52 55 59 60 61 63 63 65 68

INTRODUCERE Dezvoltarea aparatului statistic furnizeaz economi tilor tot mai multe date cifrice despre procesele i fenomenele care au loc n timp i spa iu. Econometria este un mijloc de a exploata aceste date. No iunea de econometrie provine din termenii oikonomie (economie) i metron (m surare) i desemneaz totalitatea metodelor i tehnicilor de m surare a fenomenelor i proceselor care au loc n domeniul economic. Primele lucr ri econometrice au avut ca obiect func iile consumului, care leag nivelul consumului de venitul disponibil (aceste func ii stau la baza teoriei keynesiene). n decursul timpului, numero i autori au ncercat definirea econometriei. Lucrarea ECONOMETRIA PENTRU...ECONOMI TI, a profesorului Eugen tefan Pecican, ap rut la Editura Econmic n 2003, con ine multe referiri n acest sens, din care am selectat cteva. Autori R. Frisch P.A. Samuelson, T.C. Koopmans, J.R.N. Stone Fr. Perroux G.C. Chow W. Griffits, H. Carter, G. Judge Referin a Econometria realizeaz mbinarea punctelor de vedere care se refer la teoria economic , statistic i matematic cu privire la natura rela iilor cantitative din economie Econometria reprezint o analiz de natur cantitativ a fenomenelor economice, bazat pe dezvoltarea recent a teoriei culegerii i interpret rii datelor, n conexiune cu metodele de inferen (induc ie) statistic adecvate Econometria este o economie de inten ie tiin ific Econometria este un domeniu n care se mbin arta i tiin a de a utiliza metodele statistice n vederea m sur rii rela iilor economice Econometria este ansamblul metodelor de realizare a analizei datelor economice

Autorul lucr rii citate mai sus este de p rerea c obiectul econometriei const n cunoa terea mecanismelor de desf urare a proceselor economice descrise de serii de date statistice, prin utilizarea metodelor cantitative de natur statistic sau matematic . Defini iile date econometriei pun n eviden dou elemente: domeniul de studiu (economia, rela iile dintre variabilele economice) i metodele utilizate (provenite din statistic i matematic ). Econometria se orienteaz spre construirea de modele econometrice care s reprezinte simplificat procesele sau fenomenele economice analizate i s permit simul ri ale acestora, n scopul n elegerii lor, pe de o parte, dar i s serveasc la realizarea de previziuni, prognoze care s fundamenteze politicile economice, pe de alt parte.

CAPITOLUL I MODELE ECONOMETRICE 1.1. Generalit i

Modelarea economic reprezint un proces de cunoa tere mijlocit a realit ii cu ajutorul unui instrument cu caracteristici speciale: modelul. Sistemul real supus studiului este nlocuit prin modelul s u, care este o reprezentare simplificat a obiectului cercetat. Modelul econometric este, de regul , o mul ime de rela ii numerice care permite reprezentarea simplificat a procesului economic supus studiului (uneori chiar a ntregii economii). Modelele actuale comport adesea mai mult de zece rela ii (ecua ii). Validitatea unui model este testat prin confruntarea rezultatelor ob inute cu observa iile statistic e. Pentru a studia un fenomen economic se ncearc reprezentarea lui prin comportamentul unei variabile. Aceast variabil economic depinde, la rndul s u de alte variabile de care este legat pr in rela ii matematice. De exemplu, dac se studiaz cererea (C) i oferta (O) dintr-un anumit bun pe o pia , se tie c cererea i oferta depind de pre ul (p) bunului respectiv. Putem scrie c variabilele C i O sunt func ii de variabila p i c la echilibrul pie ei, trebuie ca cererea s fie egal cu oferta. Se construie te astfel un model elementar de forma:

[1]

C ! f ( p) O ! g ( p ) C ! O

Oferta i cererea dintr-un anumit bun depind i de alte variabile dect pre ul. Astfel, cererea dintr-un bun alimentar depinde i de venitul disponibil, de pre ul unor produse analoage etc. La fel, dac este vorba despre un bun agricol (gru,...) oferta depinde de pre ul anului precedent. Rela ia stabilit ntre variabile n modelul econometric este dat , de regul , la un anumit moment de timp t, caz n care variabilele apar indiciate:

[2]

Ct

n modelul [2] s-au introdus mai multe variabile care explic cererea i oferta dintr-un bun i s-a considerat realizarea acestor variabile la momentul t sau t -1. Se observ c modelul comport mai multe rela ii. Se zice c avem un model cu ecua ii multiple. Evident, se va ncepe studiul cu un model mai simplu, cu o unic ecua ie. 1.2. Model aleator

S presupunem c se studiaz consumul (Ci ) dintr-un anumit bun de c tre o familie (i). ntre alte variabile, consumul depinde de venitul disponibil al familiei (Vi ). Modelul econometric elementar const n a exprima Ci n func ie de Vi . Desigur, al i factori dintre care unii sunt necunoscu i determin de asemenea consumul familiei. Condens m efectele acestor al i factori ntr-unul singur, aleator, notat i. Se ob ine astfel un model aleator: [3] i i i Factorul aleator i este o variabil aleatoare care urmeaz o anumit lege de probabilitate, ce va trebui s fie specificat prin ipotezele f cute asupra modelului. Cel mai frecvent, ipotezele se ref er doar la momentele de ordinul I i II ale variabilei aleatoare i. Urmeaz s ne asigur m c func ia f (sau clasa de func ii) aleas nu contrazice rezultatele experien ei. De exemplu, dac s-a ales f ca o func ie liniar (adic f(Vi ) = aVi+b), modelul econometric este: [4]

C ! f (V )  I

C i ! aVi  b  I i

i variind pe i pentru diferitele familii studiate, ne vom asigura c rela ia [4] este bine satisf cut . Se spune c test m modelul. Dac rezultatul ob inut este convenabil, se va trece la estimarea parametrilor a i b. Apoi, definind o regul de previziune se va putea determina consumul Ci dac se cunoa te venitul Vi . 1.3. Natura variabilelor care apar n model

ntr-un model econometric se disting dou tipuri de variabile: -exogene. Sunt variabilele explicative ale variabilei studiate i se consider ca fiind date autonom. n modelul [4] Vi este variabila exogen (sau explicativ , independent ). Venitul familiei Vi explic n acest model 4

Ct Ot

f ( pt , x1t , x 2 t ,..., x nt ) g ( p t 1 , x1t , x 2 t ,..., x rt ) Ot

consumul familiei Ci. Valoarea variabilei exogene pentru un i dat i pentru i precizat- permite determinarea consumului Ci . -endogene. Sunt variabilele de explicat (sau dependente). Ci este variabila endogen n modelul precedent. Se poate remarca faptul c Ci este acum o variabil aleatoare datorit lui i. Distinc ia ntre natura variabilelor este foarte important i va trebui precizat ntotdeauna nainte de a studia modelul. Cnd modelul econometric a c p tat formularea matematic definitiv se spune c modelul a fost specificat. Modelul [4] de mai sus este specificat. Se cunoa te forma func iei f din expresia Ci = f(V i ) + i , adic f(Vi) = aVi +b. Ad ugarea variabilei exogene i d modelului formularea definitiv [4]. Mul imea parametrilor care definesc complet modelul econometric constituie structura acestuia. De exemplu, dac a = 0,7 i b = 23 iar urmeaz o lege de probabilitate normal de medie (speran matematic ) egal cu zero i dispersie (varian ) egal cu 5, atunci mul imea a = 0,7; b= 23; W = 5 constituie structura modelului [4]. Scopul va fi acela ca, plecnd de la cuplurile (Ci,Vi ) asociate diferitelor familii i, s se determine structura adev rat a modelului. Cu alte cuvinte, plecnd de la un spa iu e antion definit de mul imea cuplurilor (Ci ,Vi) s se determine structura adev rat a modelului n spa iul cu trei dimensiuni al structurilor a , b, W . Aici intervine induc iastatistic . 1.4. Induc ia statistic

Obiectul induc iei statistice este de a determina o procedur care, pornind doar de la observa iile statistice de care dispunem, s permit trecerea de la spa iul e antion la spa iul structurilor. Odat ce modelul a fost ales, se admite c exist un triplet (a, b, W ) care permite reprezentarea exact a procesului prin care valorile variabilelor observate au fost determinate. n cursul induc iei statistice modelul nu se mai modific . Procedura aleas a a cum se va vedea n continuare va consta n ob inerea de estimatori pentru parametrii a i b care s permit determinarea celor mai bune valori reale ale acestor parametri. Aceste valori se vor aprecia, n general, cu ajutorul unor intervale de ncredere construite la un prag de semnifica ie (E) dat. De exemplu, n modelul [4] se va g si c a[0,64;0,78] i b[20;27] cu o probabilitate de 95% (s-a considerat E=5%). Se poate estima i abaterea medie p tratic (W) a variabilei aleatoare i. Se va vedea rolul important jucat de aceast variabil aleatoare n modelul econometric. Identificarea modelului

1.5.

Consider m din nou modelul Ci =aVi+b+ i . S presupunem c procedura utilizat , pornind de la informa ia de inut , adic de la cuplurile (Ci ,Vi ), i=1,2,... nu conduce la o solu ie unic , ci la dou structuri distincte: s0 =a0 ,b0,W 0 , s1 =a1 ,b1,W 1. Deorece legea de probabilitate pentru precizeaz i legea de probabilitate pentru C, fiecare structur ( innd cont de valorile exogenelor i de legea lui ) conduce la o lege de probabilitate pentru C. Presupunem c structurile s0 i s1 conduc la aceea i lege de probabilitate pentru consumul C. Sunt posibile dou cazuri: s0 i s1 sunt distincte i nu putem alege ntre ele. Se spune c structurile considerate nu sunt identificabile i, ca urmare, modelul nu este identificabil. Din aceast cauz nu vom putea determina valorile parametrilor care figureaz n model; s0 i s1 nu sunt distincte, intersec ia lor nu este vid . Acestea vor permite identificarea unei p r i a parametrilor modelului (cei care apar in intersec iei). Se spune c cele dou structuri sunt echivalente, dar nu permit o identificare complet a modelului. Problema identific rii este important mai ales n cazul modelelor cu ecua ii multiple. Previziunea variabilei endogene

1.6.

Interesul unui model a c rui structur a fost determinat const n a-l utiliza pentru previzionarea variabilelor endogene ntr-o etap viitoare sau ntr-o circumstan dat , dac este vorba despre observa ii luate la acela i moment-, atunci cnd cele exogene au fost fixate. De exemplu, dac dorim s studiem evolu ia importurilor (Y) n func ie de produsul intern brut (X1) i de nivelul stocurilor (X 2), modelul econometric este: yt=a1x1t +a2x2t+b+ t, t=1,2,...,T unde t este timpul. Datele istorice (pe perioada 1990-2005) despre Y, X1 i X2 (observa iile fiind anuale) permit determinarea parametrilor modelului. S presupunem c am g sit estima iile punctuale:

a 1 ! 0,14 a 2 ! 0,6 b!6


5

Modelul estimat este: y t ! 0,14 x1t  0,6 x 2t  6 . Dac dorim s facem o previziune a importurilor pentru anul 2007, trebuie s tim PIB-ul i nivelul stocurilor n anul 2007. Presupunnd c aceste variabile exogene sunt x1=1030 i x2=12,7 vom avea ca previziune pentru y: y2007=(0,14).1030+(0,6).(12,7)+6
sau, n general, U , unde este perioada de previziune. 1 1U 2 2U Observa ie. Asupra valorii previzionate trebuie s remarc m: - valorile exogenelor x1 , x2 au fost alese arbitrar, eventual innd cont de evolu ia lor trecut ; - specificarea modelului nu poate fi perfect , forma func iei alese pentru a explica evolu ia lui y neputnd fi suficient de precis ; - este posibil ca variabilele explicative (exogene) ale variabilei endogene (explicate), s nu mai intervin n acela i mod ca n perioada 1990-2005, cnd s-a studiat legatura dintre ele. Este posibil s aib loc un oc, o ruptur care s perturbe echilibrul dintre variabilele care explic fenomenul, la momentul previziunii. Este evident c toate aceste cauze pot constitui surse de eroare a previziunii. Vom vedea care sunt metodele de a minimiza eroarea de previziune. Rezumatul capitolului I Pentru construc ia i utilizarea unui model econometric, se parcurg urm toarele etape: - specificarea modelului (g sirea formul rii matematice definitive a leg turii dintre variabilele care descriu fenomenul sau procesul economic studiat); - estimarea parametrilor i testarea modelului cu ajutorul statisticilor (seriilor de date observate) deja cunoscute; - previziunea variabilei endogene. Vocabular uzual

yp ! a x  a x  b

1.7.

Dac sunte i familiariza i cu statistica matematic , pute i trece la capitolul II. n caz contrar, v reamintim aici cteva no iuni de baz . Lectura acestui paragraf credem c v va incita s revede i cursul de Statistic matematic . Nor de puncte Fiind dat o serie de date statistice n care valorile (xi ,yj) apar efectiv de nij ori putem reprezenta ntr-un plan toate aceste valori prin puncte de coordonate (xi ,yj) afectate de coeficien ii nij , ob inndu-se astfel un nor de puncte. Ajustare Reprezentarea grafic a seriilor de date economice conduce frecvent la figuri pu in lizibile i greu de interpretat din cauza varia iilor pe termen scurt, numeroase i sensibile, dar f r o semnifica ie important . Metodele matematice numite de ajustare permit ob inerea unei curbe simple, ct mai apropiat posibil de mul imea de puncte furnizate de observa iile empirice disponibile. Ajustare liniar Atunci cnd reprezentarea grafic a unei serii statistice duble d un nor de puncte de form alungit , se ncearc ob inerea unei aproxim ri bune a acestei serii cu ajutorul unei drepte, realizndu -se astfel o ajustare liniar . Exist mai multe metode pentru g sirea acestei drepte: - metoda grafic (se determin punctul mediu M ale c rui coordonate sunt x, y i se traseaz dreapta care pare a fi cea mai reprezentativ a seriei, determinnd ecua ia Y=aX+b. Aceast metod este ambigu pentru c nu ine cont de ponderea fiec rui punct n norul de puncte); - metoda lui Mayer (se regrupeaz punctele norului n dou submul imi c rora li se determin punctele medii M1 i M2. Dreapta de ajustare este atunci dreapta care trece prin M1 i M2); - metoda celor mai mici p trate (const n a face minim suma p tratelor distan elor de la punctele norului la o dreapt de ecua ie Y=aX+b numit dreapt de regresie a lui Y n X. Se arat c panta (coeficientul director) acestei drepte este a=cov(X,Y)/Var(X). Coeficientul b se ob ine scriind c dreapta de regresie trece prin punctul mediu:

b ! Y  aX . Procednd la fel se g se te dreapta de regresie de ecua ie X=adY+bd , cu ad=cov(X,Y)/Var(Y) i b d X  a d . Cele dou drepte de regresie sunt, n general, distincte. Compararea lor permite m surarea nivelului ! Y
de corela ie al caracteristicilor X i Y. Corela ia se m soar cu coeficientul de corela ie V=cov(X,Y)/W(X)W(Y). Se constat c V2=aad i c V variaz ntre 1 i 1. V2 m soar unghiul dintre cele dou drepte de regresie, care coincid dac V2=1, adic

V ! 1 . Caracteristicile X i Y sunt corelate maximal cnd V este apropiat de 1).

n afara faptului de a da o reprezentare mai mult sau mai pu in satisf c toare leg turii dintre X i Y, importan a ajust rii liniare este de a permite previziuni statistice, asociind lui X o valoare probabil a lui Y prin rela ia Y=aX+b. Probabilitate Fiind dat o mul ime finit ;, numim probabilitate pe ; orice aplica ie p a lui P(;) mul imea p r ilor lui ; - n intervalul [0,1A care verific trei condi ii: 6

- p(A)u0, pentru  A P(;) - p(;)=1 - p(AB)= p(A)+ p(B), dac A,B P(;), AB=* ; se nume te univers (sau univers de probabilit i). ; nzestrat cu probabilitatea p se nume te spa iu probabilizat. Orice parte a lui ; este un eveniment. Un singleton (mul ime ce con ine un singur element) al lui ; se nume te eveniment elementar sau eventualitate. ; este evenimentul cert. * este evenimentul imposibil. A este evenimentul complementar lui A n ; (se nume te eveniment contrar lui A). Dac AB=*, evenimentele A i B sunt incompatibile. Variabil aleatoare Dac ; este un univers finit, numim variabil aleatoare orice aplica ie X: ; pR ( a lui ; n mul imea numerelor reale). Mul imea valorilor lui X, adic X(;) se nume te universul imagine. Aten ie!- o variabil aleatoare nu este o variabil , ci o aplica ie! Se observ c nu este necesar s cunoa tem o probabilitate pe ; pentru a defini o variabil aleatoare pe ;. Legea de probabilitate a unei variabile aleatoare Dac universul finit ; este nzestrat cu o probabilitate p, iar X este o variabil aleatoare definit pe ;, numim lege de probabilitate a variabilei aleatoare X, aplica ia px : X(;)p[0,1A care asociaz oric rui xX(;) probabilitatea evenimentului mul imea antecedentelor lui x prin X. Aceast mul ime X-1(x) este notat (X=x). Legea de probabilitate a lui X, notat px este definit prin px: X(;)p[0,1A, x pp(X=x). A studia o variabil aleatoare nseamn a-i descoperi legea sa de probabilitate. Func ie de reparti ie Dac universul finit ; este nzestrat cu o probabilitate p, iar X este o variabil aleatoare definit pe ;, se asociaz acestei variabile aleatoare func ia F:Rp[0,1A definit prin F(x)=p(X x) numit func ie de reparti ie a variabilei aleatoare X. Evenimentul (X x) este imaginea intervalului  g, x prin func ia X. Func ia de reparti ie este o func ie n scar . Speran a matematic Dac X este o variabil aleatoare definit pe universul finit ;, nzestrat cu probabilitatea p, universul imagine este o mul ime finit i ia valorile xi , i=1,2,...,n. Legea de probabilitate a lui X asociaz fiec rui xi probabilitatea pi =p(X=xi ). Se nume te speran matematic a variabilei aleatoare X, num rul real

E ( X ) ! p i xi
i !1

. E(X) este media n probabilitate a valorilor luate de variabila aleatoare X. E(.) este un operator

liniar. Varian a Dac X este o variabil aleatoare definit pe universul finit ;, nzestrat cu probabilitatea p, universul imagine este o mul ime finit i ia valorile xi , i=1,2,...,n. Legea de probabilitate a lui X asociaz fiec rui xi probabilitatea pi =p(X=xi ). Se nume te varian a variabilei aleatoare X, num rul real pozitiv

Var ( X ) ! pi ( x i  E ( X )) 2
i !1

. Varian a este media n probabilitate a p tratului distan elor de la xi la media lor.

R d cina p trat (radicalul) lui Var(X) este ecartul-tip al variabilei aleatoare X, notat W x. Momente condi ionate Se consider vectorul aleator

X , Y : ; p R 2

cu

reparti ia

P ( X ! x i , Y ! y j ) ! pij , p ij " 0,

p
i j

ij

! 1 i variabila aleatoare condi ionat (X/Y=yj) cu reparti a

P( X ! xi / Y ! y j ) !

p ij p. j

, p. j ! pij . Momentul de ordinul k al variabilei aleatoare X condi ionat de Y=yj este


i

momentul ini ial de ordinul k al variabilei aleatoare condi ionate (X/Y=yj):

M ( X k / Y ! y j ) ! x ik P ( X ! xi / Y ! y j ) ! xik
i i

p ij p. j

1 p. j

p
i

ij

x ik

Similar se define te momentul de ordinul k al variabilei aleatoare Y condi ionat de X=xi . Pentru k=1 se ob in mediile condi ionate:

M (X /Y ! y j ) !

1 p. j

x p
i i

ij

Se pot defini variabilele aleatoare medii condi ionate astfel: - variabila aleatoare media lui X condi ionat de Y, cu reparti ia:

M (X /Y ! y j ) , p. j u 0, p. j ! 1 M (X /Y ) : p. j j
-variabila aleatoare media lui Y condi ionat de X , cu reparti ia:

(Y / X ! x i ) !

1 y j pij pi . j

M (Y / X ! x i ) , p i . u 0, p i . ! 1 M (Y / X ) : pi . i
Regresie Se nume te regresia variabilei aleatoare X n raport cu Y, variabila aleatoare M(X/Y) cu mul imea valorilor posibile: M(X/Y=y),

x R.
(se mai scrie i

Similar, regresia variabilei aleatoare Y n raport cu X este: M(Y/X=x), y R. Dac M(X/Y)=aX+b sau M(Y/X)=cY+d se spune c regresia este liniar Reparti a normal Variabila aleatoare X urmeaz o reparti ie normal de parametri m i N (m, W ) ) dac densitatea ei de probabilitate (derivata func iei de reparti ie) este:

f ( x) !
Pentru m=0 i

1 W 2T

exp( 

( x  m) 2 ), x R, 2W 2

m R, >0

=1 se ob ine reparti ia normal normat N(0,1), cu densitatea de probabilitate:

f ( x) !

1 2T

exp( 

x2 ), x R, 2

Se arat c parametri m i 2 sunt media (speran a matematic ), respectiv dispersia (varian a) variabilei aleatoare X N (m, W ) . Reparti ia 2 (hi-p trat) cu n grade de libertate Variabila aleatoare X urmeaz legea de reparti ie hi-p trat cu n grade de libertate (se mai scrie i X H (n) ) dac densitatea ei de reparti ie este:

f ( x) !

1 n +( )2 2
n 2

n 1 2

x exp(  ), x>0, n N * 2
i=1,2,...,n sunt independente, atunci variabila aleatoare

Dac

variabilele
n

aleatoare

X i N (0,1),

Y ! X i2
i !1

urmeaz legea de reparti ie H(n).

Reparti ia Student cu n grade de libertate S(n) Variabila aleatoare X urmeaz legea de reparti ie Student cu n grade de libertate dac densitatea ei de reparti ie este:

f ( x) !

1 x2 1  n n 1 n & , 2 2

n 1 2

, x R, n N *

Dac

variabilele aleatoare

X N (0,1), Y H (n) sunt

independente, atunci variabila aleatoare

Z!

X Y n

S (n) .

Reparti ia Fisher-Snedecor F(n1,n2) Variabila aleatoare X urmeaz legea de reparti ie Fisher-Snedecor cu n1 i n2 grade de libertate dac densitatea ei de reparti ie este:
n1

n1 2 n21 1 n n x  1 2 n n 2 1  1 x , f ( x) ! 2 n1 n 2 n 2 & , 2 2

x>0,

n1 , n 2 N *

Dac

variabilele aleatoare

X 1 H (n1 )

X 2 H (n 2 )

sunt independente, atunci variabila

X1 n aleatoare X ! 1 F ( n1 , n 2 ) . X2 n2

CAPITOLUL II REGRESIA SIMPL Studiem, pentru nceput, cel mai simplu model econometric: o variabil n cadrul capitolului este prezentat

endogen

reprezint

evolu ia

fenomenului considerat i aceast evolu ie este explicat printr-o singur variabil exogen . metoda de estimare a parametrilor care intervin ntr -un model econometric, se vor examina propriet ile estimatorilor ob inu i i se vor generaliza rezultatele analizei pentru modele mai complexe. ntr-o prima parte se va trata ob inerea estimatorilor parametrilor modelului i propriet ilor lor, iar ntr o a doua parte se d o interpretarea geometric a metodei utilizate, determinarea intervalelor de ncredere referitoare la parametri i previziunea care poate fi f cut cu un astfel de model. 2.1. Modelul liniar al regresiei simple Consider m modelul: (1)

yt ! axt  b  I t , t=1, 2, ...,T


X o variabil exogen ; I o variabil aleatoare ale c rei caracteristici vor fi precizate prin ipoteze.

n care: Y reprezint o variabil endogen ;

Se dispune de T observa ii asupra lui Y i X, adic T cupluri (xt , yt ) care sunt realiz ri ale lui X i Y. a i b sunt parametri reali necunoscu i pe care dorim s -i estim m cu ajutorul observa iilor (xt , yt ) cunoscute. Ipoteze fundamentale Pentru a putea ob ine rezultatele enun ate la nceput, vom simplifica lucrurile impunnd o serie de ipoteze restrictive asupra modelului. Ulterior, n alte capitole, se vor relaxa aceste restric ii, discutnd implica iile abandon ri i unora din aceste ipoteze asupra calit ii estimatorilor. I1 : xt i yt sunt m rimi numerice observate f r eroare; X variabila explicativ se consider dat autonom n model; Y variabila endogen este o variabil aleatoare, prin intermediul lui I. I2 : a)- I urmeaz o lege de distribu ie independent de timp, adic media i dispersia lui I nu depind de t:

E I t ! 0, t ! 1,2,..., T ,
Var I t ! W I2 , cantitate finit , t .
Observa ie: S-au folosit aici, pentru medie i dispersie, nota iile E y , respectiv Var y , provenind de la speran a matematic i varian a unei variabile aleatoare. Se presupune c studen ii au cuno tin e elementare despre teoria probabilit ilor i statistic matematic . Altfel, ele trebuie rev zute! b)- Realiz rile lui I sunt independente de realiz rile lui X n cursul timpului. Aceasta este ipoteza de homoscedasticitate. n caz contrar, exist heteroscedasticitate. 10

c)- Independen a erorilor (se va vedea pe parcurs c variabila aleatoare I reprezint erori sau reziduuri). Dou erori relative la dou observa ii diferite t i t sunt independente ntre ele, nsemnnd c au covarian a nul :

I cov t , I t d ! 0 , ceea ce implic E I t .I t d ! 0 .


Prin defini ie, cov( I t , I t d ! E (I t  E (I t ))(I t d E (I t d ) ))

i innd cont de a) rezult implica ia.

d)- Normalitatea erorilor. Presupunem c I urmeaz o lege de reparti ie normal , cu media 0 i dispersia ceea ce poate fi scris astfel: I3 : Primele momente empirice ale variabilei X, pentru T foarte mare, sunt finite:

W I2 ,

I N 0, W I2

1 T xt Tg p x0 p T t !1

(media empiric ).

2 1 T xt  x T pg p s 2 T t !1

(varian a empiric ).

Aceast ipotez va fi folosit pentru a preciza propriet ile asimptotice ale estimatorilor parametrilor a i b. Ipotezele I1, I2, I3 pot p rea foarte restrictive. Vom vedea ulterior ce consecin e are abandonarea unora dintre ele asupra propriet ilor estimatorilor lui a i b. 2.2. Determinarea estimatorilor parametrilor prin metoda celor mai mici p trate Determinarea estimatorilor parametrilor a i b (nota i cu

b)

prin metoda celor mai mici p trate

(MCMMP) se face punnd condi ia ca suma p tratelor erorilor s fie minim , adic :

I t2 ! ?yt  axt  bA ! N a, b .
2 t !1 t !1

Pentru ca N a, b s fie minimal , trebuie ca: 1. condi ii necesare:

xN xN ! 0, ! 0. xa xb
2

x 2N 2 xN 2. condi ii suficiente: " 0 , xa 2 2 xN xa xbxa

x 2N xaxb " 0 . x 2N xb 2

Calcul m derivatele par iale ale func iei N a, b .


T xN ! 2 y t  ax t  b  xt ! 0 xa t !1 T xN ! 2 y t  ax t  b  1 ! 0 xb t !1 T x 2N ! 2 xt2 " 0 xa 2 t !1

11

x 2N ! 2T xb 2
T x 2N x 2N ! 2 x t . ! xaxb xbxa t !1

Atunci, condi iile de ordinul I (necesare) conduc la sistemul de ecua ii:


T T T 2 xt yt  a xt  b xt ! 0 !1 t !1 t !1 1 tT , T y  a x  Tb ! 0 t !1 t t !1 t

iar condi iile suficiente (de ordinul II) sunt verificate. Ecua iile condi ii de ordinul I (numite ecua ii normale, vezi justificarea geometric din partea a II-a), le mp r im la T, rezultnd:

1 T 1 T xt yt  a xt2  b x ! 0 T t !1 T t !1 .  ax  b ! 0 y

2.3. Propriet ile estimatorilor

demonstra ie vom ine cont de ipotezele I1, I2, I3. Pentru a u ura demonstrarea propriet ilor enun ate, transform m mai nti expresiile (2) pentru a le exprima n func ie de parametrii a i b. Vom considera modelul (1)

yt ! axt  b  I t , t=1, 2, ...,T, nsum

Din a doua ecua ie avem

b ! y  ax
t t

i nlocuind n prima ecua ie:

1 xt yt  y x a! T ! 2 1 2 xt  x T
Am ob inut estimatorii

x y  T y x ! y  y x  x . x Tx x  x
t t 2 t 2 2 t

a i b ai parametrilor a i b da i de rela iile:

yt  y xt  x a , ! 2 2 xt  x b ! y  ax

Observa ie:

a este o variabil aleatoare pentru c e func ie de yt, iar b este aleator pentru c e func ie de a .

Vom ar ta c estimatorii a i

b ob inu i prin metoda celor mai mici p trate sunt nedeplasa i i convergen i. n

m dup to i t i mp r im la T. Rezult :

1 1 1 y t ! a T xt  b  T I t T

, adic

12

2 y ! a x  b  I .
Sc dem membru cu membru pe (2) din (1):

yt  y ! a xt  x  I t  I
i nlocuim y t  y n expresia lui

a:
2 t t t 2

! a x  x   I x  x ! A I x  x x  x I x  x  I x  x ! a  I x  x !a x  x x  x
t

a ? x a!

 x  I t  I xt  x
t

(deoarece

I ( x

 x) !I ( xt  x) ! 0 ).

Din expresia lui

b , avem c b ! y  a x , adic y ! a x  b , iar din (2)

y ! a x  b  I , astfel c prin

sc dere rezult : 0 ! a  a x  b  b  I sau b ! b  I  a  a x . Am ob inut c :

a !a

x
i

I t xt  x
t

x

b ! b  I  a  a x .


sunt estimatori nedeplasa i pentru a i b. media estimatorului este chiar parametrul estimat. Vom aplica n rela iile g site mai sus. Pentru comoditate, not m cu wt cantitatea:

Un estimator este nedeplasat dac operatorul de medie E

wt !

x  x
2 t

xt  x

, astfel c

a ! a  I t wt

Rezult :

E a ! E a  wt E I t ! a , pentru c

E(a)=a i E(It )=0.

E b ! E b  E I  xE a  a
Avem c : E(b)=b,

1 1 E I ! E I t ! E I t ! 0 T T

E a  a ! E a  E a ! a  a ! 0 , deci E b ! b .


sunt estimatori convergen i pentru a i b.

13

tiind c

E a ! a
pentru ca

E b !b,

este suficient s

ar t m c

Var a T pg p 0

Var b T p g p 0
estimatorilor

bs

fie convergen i n probabilitate c tre a i b. Calcul m varian a

b.
, adic

tim c

a ! a  wt I t

a  a ! wt I t

2 2 Var a ! E a  a ! E wt I t ! E wt2I t2  2 wt wt 'I t I t ' ! t t' ! wt2 E I t2  2 wt wt ' E I t I t '


t t'

Conform ipotezelor fundamentale,

Var a ! wt W I ! W I
2 2

x x 2 t dar wt ! xt  x

n final, dispersia estimatorului

Conform ipotezei I3,

Am ob inut c

Determin m acum dispersia estimatorului

2 2 2 2 2 Var b ! E b  b ! E I  a  a x ! E I  2I x a  a  a  a x ! 2 2 2

? A ! E 2 xE ? a  a A x E a  a I  I 
EI
!

Evalu m, pe rnd, fiecare termen:

t t

(deoarece

E I t I t ! 0 ).

1 T2

TW 2 1 E I  T E I I ! T Var I ! T
2 t 2 t

14

1 1 2 ! E I t ! E 2 I t  2 I t I t ! T t t T
2 I 2

E I t2 ! W I2
,

E I t I t ' ! 0 , pentru

2 t

! 2

x  x
2 t

este:

Var a !

x  x .
2 t

W I2

2 1 xt  x Tg p s 2 i avem c p T

a T pg p a

( a este convergent n probabilitate c tre a).

t { t ' , rezultnd:

W I2 Var a ! 2 T pg p 0 . Ts

W I2 T

1 1 2 E I a  a ! E I t wt I t ! E wt I t  wt I t I t ' ! T t t' T 2 W 1 1 1 ! wt E I t2  wt E I t I t ' ! wtVar I t ! I wt T T t t' T T


dar

w !
t t !1 t !1

xt  x
t

adic E I a  a ! 0 .

Folosind aceste rezultate par iale, se ob ine:


2 2 2 W2 W2 x W I2 2 W Var b ! I  x E a  a ! I  x Var a ! I  T T T xt  x

Dispersia estimatorului

1 Var (b) ! W I2  T
Cum ns

1 p 0 i T T pg
P

adic 2.3.1.

b T pg p b

Covarian a estimatorilor a i b

Calcul m acum covarian a estimatorilor pornind de la defini ie:

cov a, b ! E a  E a ) b  E (b ! E a  a b  b !
2

A ? A ? A I ! E ?a  a  x a  a ! E ? a  a  x a  a A! I xW ! E ? a  a A xE a  a !  xVar a !   I
2

Matricea de varian

i covarian a lui

x

x  x
2

x  x ! 0 ,
t

este:
2 x ( xt  x)2

1
t

x

1 p 0 rezult c Ts 2 T pg

( b converge n probabilitate c tre b) .

x

a i b , notat

; a ,b este deci:

15

Var b T pg p 0 ,

2 I

Var a ; a ,b ! cov b, a

W I2 2 cov a , b xt  x ! Var b xW I2  2 xt  x

xt  x ! 2 1 x W I2  2 T xt  x 

xW I2

1 2 xt  x 2 ! WI x  x x 2 t

xt  x 2 1 x  2 T x x t 

Se remarc faptul c

; a ,b con ine

pe W I , adic varian a lui I t care este necunoscut . Se pune deci adic o estima ie pentru

problema de a ob ine o estima ie pentru

; a ,b ,

Var (I t ) ! W I2 .

Not m aceast

estima ie cu

W I2 .
Determinarea unui estimator nedeplasat pentru varian a erorilor

2.3.2.

Utiliznd estimatorii a i
ajustate ale variabilei endogene):

b putem calcula estima ia variabilei endogene yt, notat y t (se mai numesc i valori

y t ! ax t  b .
yt este un estimator pentru eroarea

Atunci diferen a dintre yt i

I t . Not m I t ! yt  yt . Avem c

I t ! y t  yt ! y t  axt  b ! ax t  b  I t  axt  b ! I t  a  a xt  b  b
deoarece a i b converg n probabilitate c tre a i b, distribu ia lui

Remarc :

It

converge n probabilitate c tre distribu ia lui

It

(distribu ie normal , conform I2). tim c

b  b ! I  a  a x

i nlocuind ob inem:

I t ! I t  a  a xt  I  a  a x ! I t  I  a  a xt  x
iar prin ridicare la p trat:

I t2 ! I t  I

 2 a  a x
2

 x I t  I  a  a xt  x
2

.
2
2

nsum m dup t=1,2,...,T i mp r im la T:

1 1 It2 ! T I t  I T
Dar:

1  2 a  a T x  x I
2 t

 I  a  a

1 xt  x T

.
2

aa !

I x  x , x  x
t t 2

 x I t  I ! I t xt  x  I xt  x ! I t xt  x  I xt  x ! a  a xt  x
16

pentru c I

 x ! 0.

nlocuind, rezult :

1 1 It2 ! T I t  I T
Not m cu

1  a  a T x  x
2 2 2 t

W2 !

1 It  I T

dispersia erorilor fa
2

de media lor i cum ea este o variabil aleatoare, i

calcul m media E W

:
2

2 2 2 1 1 1 E W 2 ! E I t  I ! E I t2  2I I t  I ! E I t2  I ! T T T

t t'

Aplicnd acum operatorul de medie n rela ia:

1 1 It2 ! T I t  I T

1  a  a T x  x ,
2 2 2 t

i innd cont de expresia varian ei estimatorului a , rezult :


2 2 1 2 1 W 1 t2 ! E W 2  Var a xt  x ! W I2 1   I ! W I2 1  . E I T T T T T

Rela ia g sit se poate scrie i astfel:

ob inut:

E W I2 ! W I2 , adic W I
Este de remarcat c

2
este un estimator nedeplasat pentru

modelul

numitorul lui probleme.

W I2

este T-2. (T-2) constituie num rul gradelor de libertate. Vom reveni ulterior asupra acestei

n concluzie, pentru modelul liniar al regresiei simple, avem estimatorii:

a!

y  y x  x x  x
t t 2 t

b ! y  ax
W I2 ! 1 It2 T 2
17

! W I2 

1 T2

2 I E  T E I I !W
2 t t t'

2 I

W I2 1 ! W I2 1  T T

1 W I2 ! E It2 , a a c T 2

, notnd

W I2

(varian a erorilor).

yt ! axt  b  I t

presupune estimarea a doi parametri (a i b), iar

2 1 1 2 1 E I t2  E I ! W I2  E I t ! W I2  E 2 I t2  2 I t I t ' ! T t t' T T

W I2 !

1 It2 , am T 2

Estimatorul estima ie a matricei

W I2

permite s d m o estima ie a varian elor i covarian ei parametrilor din model, deci o

; a ,b , notat ; a ,b :

Var a ; a ,b ! cov a, b
Var a !


x
W I2
t

cov a, b , Var b

unde:

2 x !W 21  I Var b T xt  x

2.3.3.

Am determinat estimatorii a
minimului sumei p tratelor erorilor

minimal , cu ajutorul unei reprezent ri grafice. Aceast condi ie va consta n egalitatea cu zero a dou produse scalare care redau ecua iile normale. Modelul

y1 x1 I1 1 y2 x2 I2 1 . . . . unde: Y ! , X ! , U ! . , I ! . . . . . . . . 1 y x I T T T
n spa iul ortonormat consider m vectorii Y, X, U i I.
T

x

,
2

2 ,

cov a, b !  x Var a .

Interpretarea geometric a metodei celor mai mici p trate i


2 t

b ai parametrilor modelului utiliznd condi ia necesar de existen


. Putem s d m o condi ie necesar i suficient pentru ca

2 t

s fie

yt ! axt  b  I t

se scrie sub form matriceal astfel:

Y ! aX  bU  I

18

A Y
Y

I X

(L)

Vectorul 0H=aX+bU apar ine planului (L) determinat de vectorii X i U. Fie 0A=Y, 0B=X, 0C=U, HA=I. Cantitatea traduce

I
prin

2 t

! I

!H

egalitatea

cu

zero

produsului

scalar

al

vectorilor

respectivi:

H 0B ! 0 , sau H 0C ! 0

Y  aX  bU , X "! 0 , adic Y  aX  bU , U "! 0

x t y t  a xt2  b xt ! 0 . y t  a xt  T b ! 0

Am reg sit, deci, sistemul de ecua ii normale. Not m

Y proiec ia pe planul (L) a vectorului Y i cu I vectorul HA ortogonal la planul (L).

A efectua o regresie a variabilei Y asupra variabilei X n modelul proiecta vectorul Y pe planul (L) din determinat de X i U.
T

yt ! axt  b  I t

Observa ie: Consider m modelul

yt ! b  I t . O reprezentare analog

celei dinainte este:

A Y 0 U
n scriere matricial , modelul este OA=OH+HA.

Y ! bU  I ,

iar conform cu reprezentarea grafic , avem rela ia

19

 

este minimal dac HA este ortogonal pe (L), adic pe X i U. Aceast condi ie se

 

revine, deci, la a

2 t

!H

Y  bU ,U "! 0 sau

proiec iei vectorului Y pe suportul vectorului U este varian ei.

Ecua ia varian ei Relu m reprezentarea geometric precedent i not m cu K proiec ia lui A pe suportul vectorului U:

(L)

Evident, KH este perpendicular n K pe 0C. n triunghiul AKH, dreptunghic, avem:

tim c

y ! a x  b , rezultnd c y ! y .
Deoarece: AK=0A-0K ( (A0 K dreptunghic n K) HK=0H-0K ( ( 0 HK dreptunghic n K), rezult , folosind (1):

2 yt  y
2

Variabilitatea total

Aceasta este ecua ia varian ei. Vom reveni asupra ei cnd vom aborda regresia multipl .


2

este minimal dac

HA B 0 H (HA este perpendicular pe 0H), adic HA U ! 0 sau

1  T b ! 0 , b ! yt ! y i 0 H ! b U ! y U ! Y . M sura algebric a T

y . Vom utiliza aceast observa ie pentru a exprima ecua ia

A
I

Y
Y

H K

! KH

 H
i

y t ! ax t  b

1 1 y t ! a T xt  b , T

adic :

y ! ax  b .

Dar

!
!

y




2 t

Variabilitatea datorat regresiei

Variabilitatea rezidual

20

2.3.4. Coeficientul de corela ie liniar Coeficientul de corela ie liniar ntre variabilele X i Y, notat V, se calculeaz cu rela ia:

y  y x  x . y  y x  x cov X , Y , unde W n general, V !


V!
t t 2 2 t t

XY

W X W Y

i W Y sunt abaterile standard (radicalul dispersiei) ale variabilelor

X i Y. tim c estimatorul parametrului a are expresia

a!

y  y x  x , astfel c x  x
t t 2 t 2 t 2 t

putem scrie:

y  y x  x x  x V! x  x y  y x
2 t t t 2 2 t t

x

x  x . Am ob inut o expresie a coeficientului y  y


2

de corela ie n func ie de estimator, iar prin ridicare la p trat: V ! Un calcul imediat arat c :

a 2 xt  x
t

. y  y
2 2 2 2 2 t t

! ?x  b  x  b ! ? x  x A !a x  x . A a a a y y n acela i timp, ecua ia varian ei conduce la:  y !  y  I , de unde: y  y ! y  y  I ! 1  I . V ! y  y y  y y  y y


t

y

! y
2

y

2 t

2 2

t t

2 t

2 t

Pe de alt

parte, utiliznd figura geometric

i notnd cu

unghiul

AKH , avem cos E !

KH , AK

cos 2 E !

KH AK

2 2

y y

t t

, adic  y
y
2 2 2

V ! cos E ! 1 

I
t

2 t

y

2 .

n mod necesar, 0 e V e 1 i  1 e V e 1 .   Cnd V !


2

0 , nu exist o rela ie de tip liniar yt ! ax t  b ntre yt i xt, adic a=0.

Cnd V ! 1 , yt este legat de xt printr-o rela ie de forma y t ! ax t  b . V ! 1 implic a>0, iar

V ! 1 implic a<0.
 Cnd rela ia dintre yt i xt nu este strict , adic V fiind cel al lui a.

yt $ axt  b , atunci V este apropiat de 1, semnul lui

21

2.3.5. Distribu ia de probabilitate a estimatorilor


2

Deoarece erorile It t=1,2,...,T au o distribu ie normal , de medie zero i dispersie W I , densitatea de probabilitate a lui It este:

f I t !

1
WI

1 I t2 , t ! 1,2,..., T . exp 2 2T 2 WI

Cum It i It sunt independente pentru

egal cu produsul densit ilor de probabilitate relative la fiecare It.

1 I t2 1 exp 1 f I 1 , I 2 ,..., I t !  2 W 2T 2 WI I
T

Dar,

I t ! yt  axt  b

y t  ax t  b ! y t  ax t  b  a xt  a xt  b  b ! y t  axt  b  a  a xt  b  b ! ! I  ( a  a ) x  (b  b )
t t

(deoarece

y t  axt  b ! y t  y t ! I t ).
2 t 2 2

Evalu m suma p tratelor erorilor:

A b I I ! y  ax  b ! ?  a  a x   b ! b  ! I  a  a x   b  2I a  a x  2I  b 2 a  a  b ! b b x
t t t t 2 t 2 2 t 2 t t t t

! I t2  a  a xt  b  b

( 2I t a  a xt ! 0 , 2I t b  b ! 0 pentru c a a cum arat reprezentarea grafic , vectorul I este ortogonal la


planul (L), prin urmare este perpendicular pe orice vector din acel plan, deci i pe X i U. Produsele scalare cu ace ti vectori vor fi nule, adic : ntr-o scriere matricial :

I , X "! 0 i

A a b ?a  a x   b ! b
2 t

 a x t2 b T x

( las m studen ilor pl cerea de a verifica !). nlocuind n (1) fiecare It prin expresiile calculate mai sus, deducem densitatea de probabilitate a vectorului aleator (y1 ,y2,...,y T):

1 y  axt  b 2 exp 1 t N y1 , y2 ,..., yt ! !  2 WI 2 W I 2T


T

1 ! W 2T I

a  a ' 1 x 2 I2 exp 1 t 1 t  exp 2 2 W I 2 b  b W I2 T x


T

t { t , densitatea de probabilitate a vectorului aleator (I1 , I2, ..., IT) va fi

! I  ?a  a x   b A b
2 2 t 2 t

I ,U "! 0 ). T x a  a b  b T

T x a  a b  b T

22

innd cont de matricea de varian

i covarian
T

a estimatorilor,

; a ,b , se arat

u or c :

1 W I2

xt2 Tx

1 T x ! ; a1,b i N y1 , y 2 ,..., yt ! W 2T T I

g I t h a, b unde g I t este densitatea de

probabilitate a lui I t , iar h a, b cea a lui a, b .


urm toarele distribu ii de probabilitate: 1. Deoarece


I
2 t

Cu aceste rezultate i f cnd apel la unele teoreme importante ale statisticii matematice, putem deduce

W I2 !

1 It2 T 2
2 1 W I W I2

, adic

! T  2 I2 , W

variabila aleatoare definit de

raportul

T  2 W I2 !

2 t

urmeaz o reparti ie G2 (hi-p trat) cu (T-2) grade de

libertate. (Vectorul I admite T-2 componente independente nenule distribuite dup T-2 legi
normale independente, cu media zero i abatere standard W I )

2.

Folosind rela ile de calcul stabilite anterior, rezult c

2 W I2 W a ! 2 2 WI Wa
a , respectiv

(am utilizat aici nota iile

W a2 ! Var (a )

2 W a ! Var ( a) pentru varian a estimatorului

pentru estima ia acesteia). Atunci variabila aleatoare definit de raportul G2 cu (T-2) grade de libertate. 3. Cuplul

T  2 W a2
W a

2
urmeaz tot o reparti ie

a, b

urmeaz o reparti ie normal bidimensional , astfel c variabilele aleatoare

definite mai jos au reparti iile urm toare:

aa N 0,1 ; Wa

aa S T  2 (reparti ia Student cu Wa

(T-2) grade de libertate);

bb N 0,1 ; W b

bb S T  2 . W b
Expresia
' 1 a  a 1 a  a ; a ,b F ! b  b b  b este 2

4.

variabil aleatoare repartizat Fisher-

Snedecor, cu 2 i (T-2) grade de libertate. 23

2.4. Teste i intervale de ncredere Pentru c exist tabele cu valorile legilor de probabilitate anterioare, putem determina intervale de ncredere pentru parametrii a i b la un nivel de semnifica ie E fixat.

 a a Prob e tE ! 1  E W a

tE

este luat din tabela distribu iei Student cu (T-2) grade de libertate. Un calcul simplu conduce la intervalul

de ncredere pentru parametrul a, de forma:

a  tE W a e a e a  tE W a
ceea ce permite afirma ia c adev rata valoare a parametrului real a , se g se te n intervalul de valori

?a  tE W a ;

a  tE W a A

cu probabilitatea 1- .

Cnd se dore te testarea unei valori a0 a parametrului a, este suficient, pentru a accepta aceast valoare cu riscul E, s ne asigur m c :

a  a0 e tE . Wa
Altfel spus, este suficient ca a0 s apar in intervalului de ncredere stabilit: De asemenea,

a0 ?a  tE W a , a  tE W a A.

a Prob_ e F ,2, T  2 ! 1  E . F E

F ! F ,2, T  2 este ecua ia unei elipse cu centrul n w , b care define te astfel o regiune de ncredere E a
pentru cuplul

a, b la nivelul de semnifica ie E:

B w
b

B A
a
24

Proiec iile acestei elipse pe axe determin , de asemenea, dou intervale de ncredere pentru a i b, centrate n

a i b . Dar, este important de remarcat c , nivelul de semnifica ie referitor la aceste intervale nu mai este nivelul E
asociat elipsei. Dac se dore te testarea simultan a dou valori a0, b0 alese apriori, este suficient s nlocuim a i b n expresia F prin a0 i b0. Dac

F a0 , b0 e F E ,2, T  2 se accept

valorile, altfel ele vor fi respinse. Altfel spus, pentru a

accepta cuplul (a0, b0) la nivelul de semnifica ie E este suficient ca punctul M0(a0,b0) s apar in elipsei de ncredere asociat cuplului (a, b).

Observa ii: 1. Expresia N y1 , y2 ,..., yT func ie de yt ,

se descompune n doi factori (g

i h). g se exprim doar n func ie de I t , adic n

a , b ; h nu con ine dect pe a , b , a i b. Aceasta arat c , odat cunoscut o realizare a

cuplului a, b , legea de probabilitate condi ionat a lui yt (dat de factorul g) nu depinde dect de valorile
adev rate (dar necunoscute) ale parametrilor a i b. Se zice c

, b sunt estimatori exhaustivi pentru a i b, a


i b prin metoda s minimiz m

adic ei rezum toat informa ia pe care e antionul o poate aduce despre a i b. 2. Cnd ipoteza de normalitate asupra erorilor I t este realizat , func ia de verosimilitate relativ la e antionul

y1 , y 2 ,..., yT este chiar func ia N y1 , y 2 ,..., yT . Pentru ob inerea de estimatori ai lui a verosimilit ii maxime, este suficient s maximiz m expresia N y1 , y 2 ,..., yT , adic

y
3.

2  axt  b . Estimatorii a, b ob inu i cu metoda celor mai mici p trate coincid, deci, cu cei ob inu i

prin metoda verosimilit ii maxime. Atunci cnd ipoteza de normalitate a erorilor nu se realizeaz , se va ar ta c estimatorii demonstra ie pe cazul general).

a i b ob inu i prin

metoda celor mai mici p trate au varian a minim printre to i estimatorii liniari centra i n a i b (se va da o

2.5. Previziunea cu modelul liniar Fie

xU

realizarea variabilei exogene la momentul U. Valoarea previzionat pentru endogena Y va fi:

yUP ! axU  b ,
iar realizarea efectiv a lui Y este:

yU ! axU  b  I U

Eroarea de previziune se poate exprima prin variabila aleatoare

yUP  yU ! a  a xU  b  b  I U .
25

e P ! yUP  yU .

Se remarc imediat c

E e P ! 0 , iar varian a erorii de previziune este:

2 2 2 Var e P ! E yUP  yU ! xU2 E a  a  E b  b  E I U2   2 xU E a  a b  b  2 xU E I U a  a  2 E I U b  b

A ? A

.

Ultimii doi termeni sunt nuli (s-a demonstrat anterior!) (I i a , ca i I i


Deci:

b sunt necorela i).

Var eP ! xU2Var a  Var b  Var I U  2 xU cov a , b


Not m varian a erorii de previziune cu

QU2 ! Var eP

i folosind rela iile de calcul anterioare, rezult :

Q !x

2 U

!W

2 I

x  x 1 x  x 1   T  x x
2 t 2 U 2 t

2 U

W I2

2 W I2 Tx 1   T x x t

2 xU xW I2  W I2  2 xt  x

W I2 este necunoscut, dar estimat prin W I2 i varian a estimat a erorii de previziune este:
2 1 xU  x Q ! W 1   T xt  x 2 2 U 2 I

Aceast varian prin alegerea lui

poate fi redus , pe de o parte prin cre terea num rului de observa ii (T), iar pe de alt parte,

xU astfel nct xU  x

nu fie prea mare (adic f cnd o previziune pe termen scurt).

Deoarece erorile sunt normal distribuite, I t N 0, W I

atunci i a  a N i  b N b

(urmeaz legi

normale). Rezult urm toarele distribu ii de probabilitate pentru variabilele:

yUP  yU N 0,1 . QU
yUP  yU QU
QU2 W I2 T T urmeaz o lege Student cu T-2 grade de libertate pentru c  2 2 !  2 2 . QU WI

n planul (x,y) tras m dreapta de ajustare y ! ax  b . Fie

P xU , yUP punctul situat pe dreapta de ajustare.

Putem construi, avnd P ca centru i paralel cu axa 0y un interval de ncredere M1 M2 la nivelul de semnifica ie E.

yUP  yU P QU

tE ! 1  E . 2

26

t E fiind luat din tabela distribu iei Student. Pentru T dat, Q U ca func ie de xU  x
2

este minim pentru

xU ! x . Punctele M1 i M2 sunt deci situate, cnd U variaz , pe dou arce de curb (vezi figura), care determin astfel
regiunea c reia i apar ine yU pentru xU dat, cu o probabilitate egal cu (1-E).

M2 P M1

y ! ax  b

yUP

xU

x
Observa ii 1. O variabil aleatoare t este distribuit dup o lege Student cu T-2 grade de libertate dac expresia este raportul dintre o variabil aleatoare distribuit libertate. Fie t !

t2 T 2

G 2 cu 1 grad de libertate i o alta distribuit G 2 cu (T-2) grade de

aa . Atunci: Wa

a  a ! t2 ! T  2 T  2 a W2
2

a  a 2 G 2 cu un grad de libertate ! . 2 G 2 cu (T - 2) grade de libertate Wa T  2 2 Wa


2 Wa

2. O variabil aleatoare F este distribuit dup o lege Fisher-Snedecor cu n1 i n2 grade de libertate dac expresia

n1 F 2 2 este raportul dintre o variabil aleatoare distribuit G cu n1 grade de libertate i o alta distribuit G n2
1 a  a 1 a  a ; a ,b . 2 b  b b  b

cu n2 grade de libertate. Fie F ! Atunci:

27

a  a xt2 T x a  a b  b b  b T 2F Tx ! ! T 2 T  2 W I2
,

a b !

 a  b

xt2 T x a  a Tx b  b T W I2 G 2 cu doua grade de libertate ! 2 2 G cu (T - 2) grade de libertate T  2 W I2 WI


o lege normal bidimensional .

pentru c

, b urmeaz a

3. Jacobianul transform rii permite exprimarea densit ii de probailitate a vectorului aleator pornind de la cea a lui I 1 , I 2 ,..., I T . Cnd proced m astfel:   nlocuim I t prin expresia ei n func ie de yt ; nmul im expresia ob inut cu valoarea absolut a determinantului:

y1 , y 2 ,..., yT

f I 1 , I 2 ,..., I T este cunoscut , pentru a ob ine N y1 , y 2 ,..., yT ,

xI 1 xy1 xI 2 D I J! ! xy 1 D y ... xI T xy1

xI 1 xy 2 xI 2 xy 2 ... xI T xy 2

xI 1 xyT 1 0 xI 2 0 1 ... xyT ! ... ... ... ... 0 0 xI T ... xyT ...

... ... ... ...

0 0 !1 ... 1

N y1 , y 2 ,..., yT ! f I 1 y1 , I 2 y 2 ,..., I T yT J .
4. Am v zut c de I t . Deci:

a  a ! wt I t , I t

a  a fiind distribuite normal. a  a este o combina ie liniar

a  a N 0,1 Wa

a  a 2
2 Wa

este distribuit G2 cu 1 grad de libertate pentru c este p tratul unei variabile aleatoare N(0,1).

 b N 0,1 b
W b b  b G
2 2 Wb 2

Deoarece

2 t

! It  I I
2 I 2

 a  a x
2 2 2 2

 x , prin mp r irea la W I2 , ob inem:

I
W
2 I

2 t

I !

 a  a x  x W
2 I t

28

I

W I2

! I
2

2 t

W I2

TI  2 ! G (2T )  G (2 ) ! G (2T 1) 1 WI


2 2 1

a  a 2
W
2 I

a  a x  x ! Var a G
2 t

Rezult c :

I
W
2 I

2 t

! G (2T 1)  G (2 ) ! G (2T  2 ) . 1

2.6. Experien

de calcul

Pentru a studia cum variaz cheltuielile de ntre inere i repara ii ale unui utilaj agricol n func ie de vrsta utilajului, s-au cules urm toarele date: Vrsta utilajului (xt ) n luniCheltuieli anuale de ntre inere i repara ii ( yt ) n RONVrsta utilajului (xt ) n luniCheltuieli anuale de ntre inere i repara ii ( yt ) n RONRezolvare: C ut m s estim m parametrii unei regresii liniare nte variabilele X i Y, de forma presupunnd c sunt ndeplinite ipotezele fundamentale I1,I2,I3. 1. Pentru a calcula estimatorii, se folosesc rela iile de calcul stabilite anterior (n cadrul seminarului se vor prezenta facilit ile de calcul oferite de diferite pachete de programe dedicate). Elementele necesare calculului sunt date n tabelul ce urmeaz : 100 47 71 58 102 35 60 53 10 32 17 58 6 20 48 43 77 89 50 40 56 62 15 8 36 41 16 8 21 21

yt ! axt  b  I t

29


t 3 3
t

0 3

 
yt

0 362 3 0 3 00 0 3 0 0 3
t yt

& !"
0 3 3

0 938 30 300 0 0 00 27437 00 3 0 -

" % "!
-

" &  $ # "!

#$ 
xt  x

- , 333 3, , 333 0, , 0, , , - , 333 , - , 333 0, -3, 333 , -3, 333 , , 33, - , 333 , , , - , 333 0, 33, , - , 333 3 , - , 333 ,0 3753,73

( xt  x ) 2 y t  y

, , , , - , - , - , -0, 3 , - , , - , 3 , - , - , 333 333 33 333 333 333 333 333 333 333 333 3 , , 0 , 00, ,0 0 , , 0, 03, , , 0, , ,0 , 6269,73 0

!
0 00

$$ 

( yt  y ) 2 xt2

"
3 00 12490 3 00 64926

30

$&
-

yt2 30

 !  $ $ & & # & $ " $ $ %& %"& ! " "& # #" $"" &!& " ! " % ! $ $# %!& ! #" &# $ &!# " &  !$ ! & &! $"% & $ !! &! "#& $ $ " &$ & ! $ #& $   & %"# %"# $&$" !$ & $"! !$&"! ## ! ! &! "! & & $ #$!" %!&
00 00 3 3 3 0000 0 0 33 0 0

% $ # !#  $#$ !# #"& ! $""& &&  &" "! %# $"  ! "!& #!& &# $ & &"! !$" !# ! $!  $"% ! $%  ! $ ! & " "% # ! &!% $#$ ! &"& "& & &$ & $ "!!" !" &$" !$ " ! &!& !!& % &# &$ !"! %$"! " &" $%& &! #%$ %$% "!% $!
y t ! 1, 28 x t  31,67

0, , 03 , 0 3 , 00 , 33 , 03 , , , , 0 , 3, 0 , 3 3 ,3 ,

y y
- , - 0,

$"

$"

$#% #& !# !%

( y  y)

3 ,3 , , 30, , , - 0, 00 0 , - 0, , - ,00 ,0 3 - ,00 ,0 3 3 , 3 , - ,0 3 , 3 0,0 0 , - , 3, 0 3,30 ,3 - 3, 3 3 , - , 3 , 3 6137,72 -

" ! #$ !! %! " "% " %$ &% ! $&# ! %$  "# &% ! & ! % $! $ & "# "$ " $&& &$ & "#

"$& !% $ "! #!" !& $&$% ! $#& " $ & !$ "& !& %!&

## !% " #!! # $&$% &#" ' !$ " % $ !$% &%& ( % ! $
- , ,0 -0, 0 3 , - , 33 - , 03 - , 3, 3 0, , 3 - , , -3, 3 - ,3 ,

It !
t

) !"%
, , 0 3 0, 003 ,00 , 03 3, 3 ,3 ,0 3 0,30 , , 3 ,0 0 , 3 , 3 , 3 132,0144

 t

I t2

$# !! "" !" %&% ## """ !## $ ! %

%$ $ ! !# $$& % $# $& &!&% # $&# &"!$

&$$

  ## ! $! $

%& $"! ) $$ "!# %

Pe baza elementelor din tabelul de calcul, se determin :

1 x! T
!

1 xt ! 15 362 ! 24,133 t !1
T
t t t 2 t 2 t 2

1 T 1 y ! yt ! 938 ! 62,533 T t !1 15
2

-a

y  y x  x ! x y  Tx. y ! 27437  15(24,133)(62,533) ! 1,28 12490  15(24,133) x  Tx x  x


t

b ! y  a x ! 62,533  1, 28(24,133) ! 31,67


- coeficientul de corela ie liniar :

V!

y y
t

 y xt  x

 y xt  x

27437  15( 24,133)(62,533) 6269.733 3753,733

! 0,9894

Valoarea apropiat de 1 a coeficientului de corela ie arat c ntre cele dou variabile studiate exist o corela ie liniar . Observa ie: Am v zut c :

V !

a 2 xt  x
t

! ( ax y  y ( y
2 2

t t

 ax ) 2  y) 2

(y (y

t t

 y) 2  y) 2
prin model i

P tratul coeficientului de corela ie liniar este raportul dintre variabilitatea explicat variabilitatea total . - ecua ia de analiz a varian ei: variabilitatea total = variabilitatea explicat + variabilitatea rezidual

y
=

!
6137,719

y
+

y

2 t

6269,733

132,014

n spa iul observa iilor, Y este cu att mai bine explicat prin modelul liniar, cu ct este mai aproape se planul (L) generat de vectorii X i U (vectorul unitar), deci cu ct variabilitatea rezidual este mai mic fa de variabilitatea empiric total . Aceasta face ca raportul dintre variabilitatea explicat prin model i variabilitatea total , adic
2

, s fie apropiat de 1.

- estima iile varian elor reziduurilor i ale estimatorilor:

W I2 !

1 132,0144 It2 ! 15  2 ! 10,15 T 2

Var a !

W I2
t

x

10,15 ! 0,0027; 3753,733

W a ! 0,0027 ! 0,052

2 x !W 21  I Var b T xt  x

1 (24,133) 2 ! 10,15  ! 2,25 2 15 3753,733


31

W b ! 2,25 ! 1,5
- calculul intervalelor de ncredere pentru estimatori:

a  a
Variabilele aleatoare

Wa

 b urmeaz b
W b

fiecare o reparti ie Student cu (T-2) grade de

libertate. Alegnd un nivel de semnifica ie =0,05, putem extrage din tabelele reparti iei (astfel de tabele se g sesc n majoritatea c r ilor de econometrie, sau de statistic matematic ) valoarea ttab corespunz toare num rului de grade de libertate i nivelului de semnifica ie ales. n cazul nostru, pentru T-2=13 grade de libertate i =5%, g sim ttab=2,16. Intervalele de ncredere vor fi:

a ?a  tE W a ; a  tE W a A! [1,28-(2,16)(0,052) ; 1,28+(2,16)(0,052)]= b b  tE W b ; b  tE W b ! [31,67 (2,16)(1,5) ; 31,67+(2,16)(1,5)]=


=[28,43 ; 34,91] Prin urmare, putem afirma c probabilitate de 95%. Stabilim acum un interval de ncredere pentru estimatorul varian ei erorilor. Am v zut c variabila valorile parametrilor reali a i b se g sesc n aceste intervale cu o

= [1,17 ; 1,39]

T aleatoare  2

W I2 1 ! W I2 W I2

2 t

urmeaz o lege de reparti ie hi-p trat cu (T-2) grade de libertate. dat, dou valori: v1 avnd

n tabelele legii hi-p trat vom g si, pentru un nivel de semnifica ie

probabilitatea (1- /2) de a fi dep it , respectiv v2 avnd probabilitatea ( /2) de a fi dep it , astfel c

W I2 r ob v1 e (T  2) 2 e v 2 ! 1  E WI
Se ob ine astfel intervalul de ncredere:

(T  2)W I2 (T  2)W I2 W I2 ; v2 v1
pentru =0,05 i 13 grade de libertate extragem din tabel v1=5,01 i v2=24,7 rezultnd intervalul:

(15  2)10,15 (15  2)10,15 W I2 ; ! [5,34 ; 26,34] 24,7 5,01


- test m dac parametrii a i b ai modelului sunt semnificativ diferi i de zero la pragul de semnifica ie =0,05.

32

Variabilele aleatoare

a Wa

b W b

urmeaz legi de probabilitate Student cu (T-2) grade de libertate.

Aceste rapoarte se numesc i raportul t Student empiric (tcalculat). Se accept ipoteza H0: (a=0) dac tcalculat (luat n modul) este mai mic dect ttabelat , altfel se accept ipoteza contrar H1:(a { 0). Acest lucru se poate scrie:

a0 Wa

t tab

. Este exact acela i lucru cu a spune c 0 s apar in intervalului de ncredere

determinat pentru a. Cum 0 [1,17 ; 1,39], accept m ipoteza H1:(a { 0). La fel stau lucrurile i pentru b. Prin urmare, a i b sunt semnificativ diferi i de zero la pragul de semnifica ie de 5%. Se spune c variabila explicativ (exogen ) X (vrsta utilajului) este contributiv . - ne propunem acum s determin m o previziune a cheltuielilor de ntre inere i repara ii pentru un utilaj de 4 ani (48 de luni). Not m cu

yUp

cheltuielile de ntre inere i repara ii pentru un utilaj cu vrsta

xU . Avem c

yUP ! axU  b ! 1,28.48  31,67 ! 93,11


este o variabil aleatoare distribuit normal, cu media zero i varian a estimat a

Ce eroare corespunde unei astfel de previziuni? tim c :

e p ! yUP  yU ,
erorii de previziune:
2 U 2 I

2 1 xU  x 1 (48  24,133) 2 1   ! 10,151   Q !W ! 12,366 2 3753,733 T xt  x 15

QU ! QU2 ! 12,366 ! 3,5164


Deoarece variabila aleatoare

yUP  yU QU

este distribuit Student cu (T-2) grade de libertate, putem

determina un interval de ncredere pentru valoarea previzionat :

93 85 yU yUp  t E QU ; yUp  t E QU ! ? ,11  (2,16)(3,5164);93,11  (2,16)(3,51840A! ? ,56;100,66A 2 2


Cu o probabilitate de 95%, valoarea adev rat a cheltuielilor de ntre inere i repara ii pentru un utilaj de 48 de luni se va afla n intervalul determinat.

33

CAPITOLUL III REGRESIA MULTIPL De multe ori, studiul unui fenomen economic necesit introducerea mai multor variabile

explicative. O variabil endogen se exprim , deci, n func ie de mai multe variabile exogene. Metodele de regresie utilizate sunt n acest caz generaliz ri ale celor din capitolul anterior. 3.1. Modelul liniar al regresiei multiple Consider m acum modelul: (1)

yt ! a1 x1t  a 2 x 2t  ...  a p x pt  I t , t=1, 2, ...,T


X1, X2 ,..., Xp sunt variabile exogene; a1, a2 ,..., ap sunt parametri necunoscu i care trebuie estima i.

n care: Y reprezint o variabil endogen ;

Modelul nu con ine o constant

deoarece variabila Xp poate fi considerat

astfel ca xpt =1,

t ! 1,2,..., T (se nume te variabil auxiliar ).


Folosind nota iile:

y1 x11 y2 . x12 Y ! , X ! ... . x . 1T y T

x 21 x 22 ... x 2T

I1 a1 x p1 I2 ... x p 2 . a2 , a ! ... , I ! . ... ... a . ... x pT p I T ...

ecua ia (1) se scrie sub form matriceal : (2)

Y ! Xa  I .
Ipoteze fundamentale Ipotezele I1, I2 din capitolul II r mn valabile: ceea ce era adev rat pentru xt este acum valabil

pentru xit, i=1,2,...,p. Ipoteza I3 referitoare la variabilele exogene se modific astfel: a. absen a coliniarit ii variabilelor exogene:

34

Nu exist
p

nici o mul ime de p numere reale Pi , i=1,2,...,p

astfel nct

P x
i i !1

it

! 0 , t=1, 2, ...,T.

Matricea X de format (Txp) are n acest caz rangul p (T>p) i matricea (XX), unde X este transpusa lui X, este nesingular , deci exist inversa ei (XX)-1. b. Atunci cnd T p g , matricea

1 X ' X tinde c tre o matrice finit , nesingular . T

3.2. Determinarea estimatorilor parametrilor Pentru a scrie ecua iile normale utiliz m interpretarea geometric propunem s minimiz m expresia dat n capitolul II. Ne

U ! I t2 .
t !1
T

Fie vectorii Y, X1, X2,...,Xp n spa iul ortonormat .

A
I

Y
Y

Xp X2 X1

(L)

Vectorul

a1 a2 Xa ! X 1 , X 2 ,..., X p ... a p

apar ine subspa iului (L) generat de vectorii X1,

X2,...,Xp. Cantitatea U !

2 t

! I

va fi minim atunci cnd vectorul

I ! Y  Xa

este ortogonal

35

la subspa iul (L). Aceast condi ie se traduce prin egalitatea cu zero a produselor scalare dintre vectorul

Y  Xa

i orice vector din subspa ul (L),deci i X1,X2,...,Xp:

Y  a1 X 1  a 2 X 2  ...  a p X p , X 1 "! 0 Y  a1 X 1  a 2 X 2  ...  a p X p , X 2 "! 0 ............... Y  a X  a X  ...  a X , X "! 0 1 1 2 2 p p p


Efectund produsele scalare, rezult sistemul de ecua ii:

x1t yt x12t x2t yt x2 t x1t ... ! ... x y x x pt t pt 1t

x x x
1t

2t

2 2t

... ... ... ...

x x

... x pt x2t

x pt a1 x pt a2 2t . ... ... x2 a p pt
1t

Sau, cu nota iile matriciale introduse:

XY=(XX)a , de unde rezult : (3) 1 a ! X ' X X 'Y

3.3. Propriet ile estimatorului a Ar t m c a este un estimator nedeplasat al lui a i deducem expresia matricei de varian
covarian a. i

;a .
transform m expresia (3) nlocuind Y prin expresia lui n func ie de X:

1 1 a ! X ' X X 'Y ! X ' X X ' Xa  I !

(4)

! X ' X X ' X a  X ' X X ' I ! a  X ' X X ' I


1 1 1

Aplicnd operatorul de medie expresiei (4), rezult :


1 E a ! a  X ' X X ' E I .

Dar, E I ! 0 conform I2, deci b. Prin defini ie:

E a ! a , adic

a este estimator nedeplasat pentru a.

; a ! E a  a a  a ' .

36

Din (4) rezult : a  a ! X ' X X ' I


1

i ( a  a ) d I ' X X ' X !

1

pentru c

X ' X 1 este o matrice

simetric . Atunci:

a  a a  a ' ! X ' X 1 X ' II ' X X ' X 1

; a ! X ' X X ' E II ' X X ' X


1

1

ns

E II ' ! ; I

este matricea de varian

i covarian a lui I . tim c

E II ' ! W I2 I
1

(I este

matricea unitate de ordinul T). Atunci rezult :

; a ! X ' X X 'W I2 X X ' X ! W I2 X ' X X ' X X ' X ! W I2 X ' X


1 1 1

1

Se poate ar ta c dac ipoteza a) din I3 r mne valabil cnd T p g , atunci a este estimator
convergent c tre a. Propozi ie. Estimatorul a. Pentru a ar ta aceast proprietate vom construi un estimator liniar pentru a care s aib varian a minim i el va fi identic cu cel ob inut prin MCMMP. Fie a* un estimator liniar al lui a, adic a*=MY, unde M este o matrice cu coeficien i constan i de format (pxT). Estimatorul a* este nedeplasat dac :
1 a ! X ' X X 'Y

este cel mai bun estimator liniar nedeplasat al lui

E a * ! ME Y ! ME Xa  I ! a
I adic E a * ! MX E a  ME I ! MX a pentru c E ! 0 .
Pentru ca a* s fie nedeplasat, trebuie ca (MX)=I (matricea unitate de ordinul p). Construim acum matricea de varian i covarian a lui a*:

; a* ! E ? a *  a a * a 'A
Dar,

a* ! MY ! M Xa  I ! MX a  MI ! a  MI ,
2

deci

a *  a ! MI ,

a * a ' ! I ' M '

i ; a* ! E MII ' M ' ! ME ' M ' ! W I MM ' . Pentru ca a* s fie de varian II

minim , trebuie ca urma matricei (MM) s fie minim , sub restric ia (MX)=I. Urma unei matrici este, prin defini ie, suma elementelor de pe diagonala principal . Not m Ur(X) urma matricei X. Ur este un operator liniar (demonstra i!). Rezolvnd problema de extremum condi ionat:

s .r.MX ! I

MinUr MM '
1 1

se ob ine solu ia M ! X ' X X ' , adic a* ! MY ! X ' X X 'Y . Am g sit c a* ! a .


Un astfel de estimator se nume te estimator BLUE (best liniar unbiaised estimator).

37

3.4. Determinarea unui estimator nedeplasat al varian ei W I Varian a reziduurilor

W I2

fiind necunoscut , avem nevoie de un estimator al ei. Dac p este

num rul de coeficien i de estimat n model, se va ar ta c :

W I2 !

1 It2 Tp
Y ! Xa  I ;

Avem c :

Y ! Xa ; I ! Y  Y ! Xa  I  Xa ;

I ! I  X a  a .
Dar: a  a ! X ' X X ' I i I ! I  X X ' X X ' I
1 1

1 I ! I  X X ' X X ' I

Not m: + ! I  X X ' X X ' .


1

+ este o matrice de format (TxT) cu propriet ile +=+ (simetric ) i +2=+ (idempotent de grad 2). Am
2 t

ob inut

I ! +I .

Evalu m

acum

I
i{ j

2 t

care

sub

form

matriceal

este:

! I 'I ! I ' + ' +I ! I ' + I ! K ii I i2  K ij I i I j , unde Kij este elementul matricii + situat la
i

intersec ia liniei i cu coloana j. Atunci, rezult c :

I ! K E I  K E I I .
2 t ii 2 i ij i j i i{ j

ns , E I i I j ! 0 conform I2 i Ar t m c Ur + ! T  p .

I ! K E I ! K W
2 t ii 2 i ii i i

2 I

! W I2Ur + .

Ur + ! Ur I  X X ' X X ' ! Ur I  Ur X X ' X X '


1 1

Ur I ! T
Ur X X ' X X ' ! Ur X ' X X ' X
1

1

! p

(permutarea ntre X X ' X operatorului Ur.) n final rezult :

1

i X ' este posibil datorit formatului acestor matrici i propriet ilor

38

E
W I2 !

I ! T  p W
2 t

2 I

W I2 !

1 1 E I t2 ! E It2 , Tp T  p
2

astfel

1 It2 Tp

este estimator nedeplasat al lui W I . o

T este num rul de observa ii, p este num rul de parametri de estimat i rela ia g sit generalizeaz pe cea din capitolul II. 3.5. Teste i regiuni de ncredere

Ipoteza de normalitate a erorilor It fiind ndeplinit , se pot generaliza rezultatele ob inute la

regresia simpl . Deoarece a ! a  X ' X X ' I , rezult c a este distribuit dup o lege normal n p
1

dimensiuni, cu media E a ! 0 i dispersia ; a ! W I X ' X . Pentru un estimator ai dat, avem c :


2
1

(*)

ai  a i urmeaz o lege normal redus N(0,1); W ai T  p W I2 ! It2 W


2 I

(**)

2 I

este distribuit G2 (hi-p trat) cu (T-p) grade de libertate.

(***)

ai  ai urmeaz o lege Student cu (T-p) grade de libertate. W ai


n mod curent pentru a aprecia validitatea estimatorului unui

Legea Student este utilizat

coeficient ai . De exemplu, dac se testeaz ipoteza (H0:ai =0) contra ipotezei (H1:ai { 0), pentru a accepta H1 trebuie ca

ai u tE , unde tE este valoarea tabelat a variabilei t repartizat Student, cu T-p grade 2 2 W ai

de libertate, iar E este pragul de semnifica ie.

Observa ie: Pentru T>30 i E=0,05, tE $ 2 . Deci, dac


2

ai u 2 se accept H1, adic ipoteza c variabila W ai

Xi are un coeficient ai semnificativ diferit de zero. Mai general, cnd se pune problema de a ti dac un coeficient ai este diferit de o valoare particular ai , se calculeaz raportul t !
0

a i  a i0 W ai

i se compar cu tE .
2

39

Dac tcalculat>ttabelat concludem c ai { a i .

Consider m acum to i estimatorii a1 ,..., a p : (*) variabila aleatoare a  a ' ; a a  a este distribuit G2 cu p grade de libertate;
1

(**) variabila aleatoare F ! p) grade de libertate.

1 a  a d 1 a  a urmeaz o lege Fisher-Snedecor cu p i (T;a p

La fel ca la regresia liniar simpl , rezultatele anterioare permit construirea de intervale de ncredere relative la coeficien ii ai, ca i a unui elipsoid de ncredere relativ la ansamblul coeficien ilor n spa iul . Pentru ai, intervalul de ncredere, la pragul de seminifica ie E este:
p

ai  ai u tE 2 W ai
 tE e
2

ai  ai e tE 2 W ai
2 2

 W ai tE e ai  ai e W ai tE

a i  W ai t E e a i e a i  W ai t E
2

iar pentru ansamblul coeficien ilor, ecua ia elipsoidului de ncredere este: F=F(E,p,T-p). Acelea i principii conduc la determinarea de regiuni de ncredere relative la un num r oarecare de coeficien i din model. Dac F1=F(E,q,T-p), unde: q este num rul coeficien ilor re inu i, n spa iul , avem ecua ia
q

F1 !

1 aq  aq ' ; a1 aq  aq . q
q

cu a q extras din vectorul a i ; aq extras din ; a :


Dac
(0)

dorim s

test m, la pragul de semnifica ie E, ipoteza (H0:aq= a q ) contra ipotezei

( 0)

(H1:aq { a q ), atunci dac :

1 ( (  aq  a q0) ' ; a1 a q  a q0) e F E , q, T  p q

E se accept ipoteza H0 ( F , q, T  p se extrage din tabelele distribu iei Fisher-Snedecor).

40

Observa ie: Se observ c valoarea tabelat F depinde de , q, T  p i nu de , q, T  q . Rezult c E E expresia

G 2q W2 qF face s apar la numitor  p I2 distribuit G2 cu (T-p) grade de libertate. T ! 2 T  p G T  p WI


3.6. Previziunea variabilei endogene Dac presupunem cunoscute la un moment U valorile (x1U, x2U,..., xpU) atunci previziunea variabilei

endogene va fi:

yUp ! a1 x1U  a 2 x 2U  ...  a p x pU .


Eroarea de previziune va fi variabila aleatoare:

YUp  YU ! a1  a1 x1U  ...  p  a p pU  I U . a x


E U p  YU ! 0 , Y

Se constat c media erorii de previziune este zero:

iar varian a erorii de previziune este:

p 2 2 Var U p  YU ! E U p  YU ! E ai  a i xi2  2 a i  a i j  a j iU x jU  I U2 Y Y a x U i j i !1

deoarece ai i I U sunt necorelate ( ai nu depind dect de I t ), t=1,2,...,T i T<U.


Deducem c :

E YU  YU
p

A! x
2 i !1

2 iU

Var ai  2 xiU x jU cov i , a j W I2 , a


i j

iar sub form matricial :

A! X ; X  W , adic : Var  Y ! W ? X ' X X  1A Y X ,


E YU p  YU
p U

' U

2 I

2 I

' U

1

unde:

X U' ! 1U , x2U ,..., x pU . x


Observa ie: Se arat c

dac T este finit i It sunt normal distribuite, atunci a este distribuit normal n p T a  a urmeaz o

dimensiuni. Dac ipotezele nu sunt ndeplinite, atunci cnd T p g , vectorul distribu ie normal cu media egal cu zero. 41

3.7. Coeficientul de corela ie multipl R. Analiza varian ei i n acest caz, ecua ia varian ei se scrie:

Variabilit atea total

Variabilit atea valorilor ajustate

Variabilit atea rezidual

y
R
2

y

!
2 2

y
2 t

2 t

Coeficientul de corela ie multipl R are defini ia:

y ! y

t t

! 1  I  y y  y
y
t

2 .

Din reprezentarea geometric f cut , rezult c dar tim c

Y !Y I ,
de medie

Y ! Xa  I

Y ! X a , rezultnd c : Y  Y !  X  I , ceea ce arat X a


efectu m regresia pe ecua ia general , cu variabilele necentrate sau

c vectorul rezidual I este acela i i pentru valorile (Y,X) i pentru valorile centrate fa

 Y , X  X . Cu alte cuvinte, dac Y


Observa ie:

o efectu m cu variabilele centrate pe media lor, estimatorul a i vectorul rezidual I sunt aceea i.
Cnd se centreaz valorile X i Y, vectorul a nu con ine ultimul estimator a p . Constanta a p
dispare cnd se centreaz variabilele. Considerarea modelului f r constante, cu variabilele necentrate pe media lor, poate conduce la valori ale lui R care ies din intervalul (0,1). Expresia matricial a coeficientului de corela ie multipl este:
2

 Y  Y , dar  Y ! X  X a . 'Y Y  Y  Y Y 'Y Y a ! ?X  X  X  X  Y i coeficientul devine: ' X A X 'Y X a '  X  Y 'Y R !  Y  Y . Y 'Y
R2 !
1

Coeficientul R

arat

rolul jucat de toate variabilele exogene asupra evolu iei variabilei


2

endogene. El este cu att mai bun cu ct e mai apropiat de 1. Dar, judecarea calit ii unui model doar prin valoarea lui R poate duce la erori grosiere. El

mascheaz uneori influen a variabilelor exogene luate separat asupra variabilei endogene i nu poate s se 42

substituie studiului estimatorilor coeficien ilor modelului. P tratul coeficientului de corela ie multipl nu ine cont nici de num rul de observa ii (T) i nici de num rul variabilelor explicative (p). Ori, se poate foarte bine ca, avnd acelea i observa ii asupra variabilei endogene s consider m dou modele distincte, n al doilea f cnd s apar un num r de variabile explicative noi. n aceast a doua regresie coeficientul de corela ie multipl nu poate dect s creasc (pentru c variabilitatea explicat prin regresie cre te). O definire mai precis a lui R , care ine cont de T i p este:
2

R ! 1
2

T 1 1 R2 . Tp

R se nume te coeficient de corela ie multipl corectat.


1. 2. 3. 4. dac p=1, atunci R ! R ; dac p>1, atunci R
2 2 2 2

R2 ;

R poate sc dea prin introducerea n model a unei noi variabile exogene; R poate lua i valori negative, dac R 2
2

p 1 . T 1

Analiza varian ei Atunci cnd studiem rolul jucat de exogene asupra evolu iei endogenei, ne putem ntreba care este partea de variabilitate explicat de una sau mai multe variabile exogene. Relu m modelul ini ial: (1)

y t ! a1 x1t  a 2 x 2 t  ...  a p x pt  I t , t=1, 2, ...,T y t ! a1 x1t  a 2 x 2 t  ...  a q x qt  \ t .

i consider m q variabile printre cele p, pe care le index m de la 1 la q: (2)

Variabilitatea ne-explicat de cele q exogene n modelul (1) este variabilitatea rezidual asociat modelului (2). Fie:

y
t

2  a1 x1t  a 2 x2 t  ...  a q xqt ! \

Variabilitatea ne-explicat de cele p exogene din modelul (1) este:

y
t

2  a1 x1t  a 2 x 2 t  ...  a p x pt ! I

43

Variabilitatea explicat de cele (p-q) exogene din modelul (1) atunci cnd a1,...,aq sunt estima i cu modelul (2) este atunci:

! \  I

A
I

Xp
\

Hp
L

Xq

(L)

Hq

X1

tim c

! 0H

 H

Rezultatele se grupeaz , adesea, ntr-un tabel de analiz a varian ei: Sursa variabilit ii 1. X: mul imea celor p exogene Suma p tratelor corespunz toare acestei surse Num rul gradelor de libertate p Media p tratelor asociate

2. I : mul imea reziduurilor


3. Y: variabil endogen

4. (p-q) variabile exogene dintre cele p

n figura anterioar avem:

Y p ! 0 H p este proiec ia lui Y pe subspa iul (L) ai c rui vectori generatori sunt X1,X2,...,Xp. Yq ! 0 H q este proiec ia lui Y pe subspa iul generat de X1,X2,...,Xq.

, adic Y 'Y ! Y 'Y  I ' I .

Y p 'Y p I ' I ! Y 'Y  Y p 'Y p


Y 'Y L 'L ! \ '\  I ' I

Y p 'Y p p

T-p

I 'I Tp
Y 'Y T

p-q

L 'L pq

44

Hq apar ine lui (L) i triunghiul AHpHq este dreptunghic n Hp.

AH q B 0 Hq i H p H q B 0 Hq , iar L este chiar H p H q .


3.8. Experien pornind de la de calcul exogene X1 i X2, printr-un model liniar de forma:

Dispunem de observa iile din tabelul de mai jos i ne propunem s explic m variabile endogen Y variabilele

Y ! a1 X 1  a2 X 2  a3  I , unde:
x11 y1 x 21 I1 x1 2 y2 x 22 I2 Y ! , X 1 ! , X 2 ! ... , I ! ... ... ... y x I x 1T T 2T T
adic :

Y ! Xa  I , unde:
x 21 ... x 2T 1 a1 ... , a ! a 2 a 1 3
yt 100 106 107 120 111 116 123 133 137 x1t 100 104 106 111 111 115 120 124 126 x2t 100 99 110 126 113 103 102 103 98

x11 X ! ... x 1T
t 1 2 3 4 5 6 7 8 9

S observ m c num rul de observa ii (T=9) este mic, din ra iuni de simplificare a calculelor. Vom estima modelul, presupunnd c sunt ndeplinite ipotezele principale ale modelului liniar general de regresie: ipoteze stochastice:

E (I ) ! 0, E (I .I d! W I2 I , (homoscedasticitate), )
t{s i

adic :

E (I t .I s ) ! 0 , dac
X d , X

E (I t2 ) ! W I2 , t.

- ipoteze structurale: dac num rul de variabile exogene veritabile este k, atunci p=k+1 este num rul parametrilor de estimat. Trebuie ca rangul matricii X s fie egal cu p (p<T), iar matricea unde X d transpusa lui X este nesingular , deci inversabil . este 45

n exemplul nostru avem k=2 i p=3.

Atunci, a ! X d X deste un estimator liniar nedeplasat i cu varian a minimal (estimator BLUE). X Y


1

Pentru a simplifica procedura de calcul vom centra variabilele modelului. Cu nota iile:

Z ! Y  Y , U 1 ! X 1  X 1 , U 2 ! X 2  X 2 ,L ! I  I
unde:

Y !

1 1 1 1 yt , X 1 ! T x1t , X 2 ! T x 2t , I ! T I t T t t t t
, unde

modelul se scrie:

Z ! a1U 1  a 2U 2  L , sau Z ! Ub  L
y1  y x11  X 1 y2  y Z ! , U ! ... ... x  X 1 y  y 1T T
Deoarece

x 21  X 2 I1  I a1 ... , b ! ,L ! ... a 2 I  I x 2T  X 2 T

Y !

1 1 1 1 yt ! 9 1053 ! 117, X 1 ! T x1t ! 9 1017 ! 113, T t t

X2 !
t 1 2 3 4 5 6 7 8 9

1 T

x 2t !
t

1 954 ! 106 , valorile centrate ale variabilelor sunt: 9


Z ! Y Y
-17 -11 -10 +3 -6 -1 +6 +16 +20

U1 ! X 1  X 1
-13 -9 -7 -2 -2 +2 +7 +11 +13

U2 ! X2  X2
-6 -7 +4 +20 +7 -3 -4 -3 -8

a U U 1 Z b ! 1 ! d U d, avem nevoie de matricile: Pentru a calcula estimatorul a 2

46

u11 ... u1T Ud! U u 21 ... u 2T u11 ... u1T U d! Z u 21 ... u 2T

u11 ... u 1T

u 21 u12t ... ! u u 1t 2t u 2T

u u u
1t

2t

2 2t

650  112 !  112 648

z1 u1t z t 872 ... ! u z !  72 z 2 t t T


1

U d U

1

650  112 !  112 648

648 ! 408656 112 408656

112 408656 650 408656

648 a1 1 UU Z b ! ! d U d ! 408656 a 112 2 408656


Pentru a determina estimatorul celui

112 408656 872 ! 1,3629 650  72 0,1244 408656


de al treilea parametru, a3, utiliz m rela ia:

Y ! a1 X 1  a 2 X 2  a 3 , de unde: a 3 ! Y  a1 X 1  a 2 X 2 ! 117  1,3629 .113  0,1244 .106 ! 50,1941


Modelul estimat este:

Y ! Xa ! 1,3629 X 1  0,1244 X 2  50,1941 ,

iar

reziduurile

sunt:

I ! Y  Y ! Y  Xa ! Y  1,3629 X 1  0,1244 X 2  50,1941 .


C ut m acum un estimator nedeplasat pentru varian a reziduurilor. Am v zut c acest estimator este dat de

rela ia:

W I2 !

1 It2 Tp

. Dar,

Y I ! Y  Y !  Y  Y  Y ! Z  Z ! Z  Ub , iar

2 t

872 d I Z Z UZ ! I d! Z  Ub Z  Ub ! Z d bd d. Avem c : U d!  72

872 UZ 1 Z d ! z t2 ! 1248 i b d d ! ,3629 0,1244 Z  72 ! 1179,5704

2 t

! 1248  1179,5704 ! 68, 4296

W I2 !

1 68,4296 It2 ! 9  3 ! 11,4049 Tp

47

Matricea de varian ob ine nlocuind pe

i covarian

a vectorului b este:

; b ! W I2 d UU

1

, iar o estima ie a ei se

W I2

cu

W I2 . Avem c :
112 408656 ! 0,0180 0,0031 650 0,0031 0,0181 408656

U U 1 ; b ! W I2 d

648 ! (11,4049 ) 408656 112 408656

Coeficientul de corela ie multipl R2, are valoarea:

R2 !

var iabilitatea exp licata var iabilitatea reziduala ! 1 var iabilitatea totala var iabilitatea totala
2 t 2 t

y  y ! z ! 1248 Variabilitatea rezidual = I ! 68,4296


Variabilitatea total =
2 t

Variabilitatea explicat = Variabilitatea total Variabilitatea rezidual = =1248 68,4296 = 1179,5704

R2 !

1179,5704 ! 0,9451 . 1248


Tabelul de analiz a varian ei (variabile centrate): Sursa variabilit ii Suma p tratelor corespunz toare acestei surse Num rul gradelor de libertate T-1=8 Media p tratelor asociate

1.Variabila endogen centrat

z
z
2 t

2 t

! 1248

1 zt2 T 1 1 z t2 k 1 It2 T  k 1

2.Variabilele exogene centrate

! 1179,5704
2 t

k=2

3. Reziduurile

! 68,4296

T-k-1=6

48

CAPITOLUL IV STUDIUL MODELULUI LINIAR CND IPOTEZELE CLASICE ASUPRA ERORILOR NU MAI SUNT REALIZATE 4.1. Ipoteza de independen a erorilor a erorilor ;I nu se mai reduce la W I I , iar
2 2

S-a studiat anterior modelul liniar de regresie sub ipoteza c erorile sunt independente. n cazul n care erorile It sunt corelate, matricea de varian i covarian

estimatorii parametrilor modelului general Y=Xa+I, cu E(It )=0, t=1,2,...,T i ; I ! E II ' { W I I nu mai posed acelea i propriet i ca n cazul erorilor independente.

Fie a vectorul estimatorilor parametrilor a. Estimatorul a trebuie s fie liniar n raport cu


variabilele endogene Y, adic nedeplasat deoarece:

a ! MY , unde M este o matrice de coeficien i. Estimatorul a este

E a ! E MY ! E?MXa  MI A! MXa  ME I ! MXa


(pentru c E ! 0 ). I

Pentru ca E a ! a trebuie s impunem condi ia MX=I, rezultnd c :


a ! MY ! MXa  MI ! a  MI
Matricea de varian

i covarian a estimatorilor ( innd cont c a  a ! MI ) este:

A! A! M A! ; a ! E ?(a  a ) (a  a)d E ?MI ( MI )d E ?MII d d ME (II d d M;I M d )M !


Punnd condi ia ca ; a s fie minimal , sub restric ia MX=I i rezolvnd aceast problem de extremum condi ionat, rezult c matricea M este de forma: Prin nlocuire i calcul se ob ine:

M ! X dI 1 X ;

A Xd ;

1

1 I

a ! MY ! X dI 1 X ;

A Xd Y ;
1 I

1

; a ! X dI 1 X ;

1

Estimatorul a astfel ob inut este un estimator liniar, nedeplasat i de dispersie minim . El a fost ob inut
prin MCMMP generalizat . Se observ imediat c dac erorile sunt independente, adic

; I ! W I2 I , atunci a ! ?X dA1 X d, adic X Y


obi nuit .

reg sim estimatorul ob inut prin MCMMP

49

n cazul n care erorile sunt corelate, determinarea estimatorului a necesit cunoa terea matricei
de varian i covarian a erorilor

;I

. n aplica ii, deoarece erori prea grave.

;I

este necunoscut , se lucreaz cu

estima ia ei

; I , ceea ce nu antreneaz

Corelarea erorilor I t poate mbr ca diverse forme. Cel mai frecvent se studiaz cazul cnd

I t ! VI t 1  L t
(1) (n care

(se spune c erorile urmeaz un proces autoregresiv de ordinul nti).

Modelul liniar general Y=Xa+I, scris i sub forma:

yt ! a1 x1t  a 2 x 2t  ...  a p x pt  I t , t=1, 2, ...,T


iar asupra erorilor L t facem ipotezele cunoscute: i (1)

I t ! VI t 1  L t ,

E t ! 0 , L

E t1L t 2 ! 0 , pentru t1 { t 2 L
ecua ia

2 Var t ! W L , t ), poate fi pus sub urm toarea form : L

scris

pentru

t-1

este:

y t 1 ! a1 x1 t 1  a 2 x 2 t 1  ...  a p x p t 1  I t 1 pe care o nmul im cu V (presupunem


V 1 ):
(2)

Vy t 1 ! Va1 x1 t 1  V a 2 x 2 t 1  ...  Va p x p t 1  VI t 1
Prin sc derea (1)-(2) ob inem:

(3)

y t  Vy t 1 ! a1 x1t  Vx1 t 1  a 2 x2t  Vx2 t 1  ...  a p x pt  Vx p t 1  L t


Dac s-ar cunoa te parametrul V, atunci ecua ia (3) ar putea fi scris sub forma:

(4) unde:

z t ! a1u1t  a 2u 2t  ...  a p u pt  L t
u it ! xit  Vxi t 1 , i=1,2,...,p.

z t ! yt  Vyt 1

L t ! I t  VI t 1
Deoarece, prin ipoteze, erorile L t sunt independente, se poate aplica MCMMP obi nuit ecua iei (4) care va conduce la estimatorul

a a ! 1 , a 2 ,..., a p nedeplasat

i de minim dispersie.

Dar, cum parametrul V nu este cunoscut, pentru estimarea parametrilor unei ecua ii de regresie atunci cnd erorile sunt corelate (sub forma unui proces autoregresiv de ordinul I, I t ! VI t 1  L t ,

50

sta ionar, adic media E t i dispersia Var t sunt independente de timp, iar V I I urm toarele metode: Metoda I: 1.

1 ) se pot aplica

Se aplic MCMMP obi nuit ecua iilor (1) f r a ine cont c erorile I t sunt corelate.

Se ob ine estimatorul a1 al lui a i se determin valorile ajustate Y1 ! Xa1 estima iile erorilor I t ! y t  y1t .
2. D m o estimare a parametrului V aplicnd MCMMP obi nuit

ecua iei

I t ! VI t 1  L t , ob innd
3. nlocuim V cu

V.

n ecua ia (3) i aplic m MCMMP obi nuit acestei ecua ii. Se

ob ine estimatorul

a pentru parametrul a.

Evident, pentru e antioane mici, estimatorul a nu prezint garan ii c are propriet ile dorite.
Metoda II: Ecua ia (3) de mai nainte se poate scrie i sub forma: (5)

yt  1 x1t  ...  a p x pt ! V yt 1  1 x1 t 1  ...  a p x p t 1  L t a a

Se aplic MCMMP obi nuit ecua iilor (3) i (5) astfel: 1. D m o valoare ini ial lui V, de exemplu V0=0 n ecua ia (3) i ob inem o prim

estima ie a parametrilor a0 .
2.

nlocuim a0 ! a1 , a 2 ,..., a p
valoare pentru V, notat V1.

n ecua ia (5)

i efectund regresia, ob inem o nou

3.

nlocuim V cu V1 n ecua ia (3) i efectu m o nou regresie, ob innd estimatorul

p a1 ! 1 , a 1 ,..., a 1 .a.m.d. a1 2
4. Se opresc itera iile dac valorile g site n dou itera ii succesive nu difer dect printr-

un num r orict de mic dorit (se spune c estimatorii ai , i=1,2,... converg).


Metoda III (baleiaj): Presupunem c V " 0 , ia succesiv valorile:

V ! _ ;0,01;0,02;...;1a. 0

51

Aplic m MCMMP obi nuit ecua iei (3) pentru fiecare valoare a lui V i calcul m reziduurile L t .
Se re ine valoarea lui V care d cea mai mic sum a p tratelor erorilor

L
t

2 t

, c reia i corespund

estimatorii a1 , a 2 ,..., a p ai parametrilor.


*** Exist i alte proceduri de estimare a parametrilor n cazul cnd erorile sunt corelate. a erorilor

4.1.1. Testarea ipotezei de independen

Atunci cnd ipotezele fundamentale ale modelului liniar al regresiei nu sunt ndeplinite propriet ile estimatorilor parametrilor sufer . Astfel, sub ipoteza I2 referitoare la distribu ia erorilor i la independen a lor, estimatorii ob inu i sunt nedeplasa i i au varian a minimal . Dac erorile sunt corelate, estimatorii r mn, n general, nedeplasa i, dar matricea de varian i covarian a acestora nu mai este

W I2 I . Pentru a ne asigura de independen a erorilor trebuie s efectu m teste. Este vorba despre testul lui
Durbin i Watson. Modelul liniar general al regresiei:

yt ! a1 x1t  a 2 x 2t  ...  a p x pt  I t
se poate scrie sub forma:

yt ! axt  I t
a ! 1 , a2 ,..., a p i a
x1t x2 t xt ! ... . x pt
i se ob ine un estimator

unde:

Se aplic MCMMP obi nuit valorile ajustate

a a ! 1 , a2 ,..., a p , calculndu-se

yt ! axt

i erorile estimate

I t ! yt  yt .

Reziduurile estimate depind de irul erorilor I t i de irul valorilor exogene xt , deoarece:

I t ! yt  yt ! a  a xt  I t .
Se consider variabila aleatoare, notat ecua ia:

d , numit

i statistica Durbin-Watson definit prin

52

d!

I  I
t t 1 t !2

It2
t !1

Durbin i Watson au determinat densitatea de probabilitate a variabilei aleatoare d , notat

f d

i au ar tat c oricare ar fi irul de exogene considerate, curbele reprezentative ale lui f d oscileaz ntre
dou curbe limit

f di

i f . Aceste func ii depind de num rul de observa ii (T), de num rul de d


s

variabile exogene veritabile ce figureaz n model (m) i de irul erorilor I t . Cele dou curbe limit (reprezentate grafic n figur ) sunt atinse pentru anumite iruri de exogene xt i sunt simetrice n raport cu axa de abscis 2.
f d

d1 d2

d1

d2

Scopul este de a ti dac erorile modelului sunt autocorelate. Cel mai frecvent se caut testarea leg turii erorilor printr-o rela ie de forma I t ! VI t 1  L t . Se spune c erorile urmeaz un proces autoregresiv de ordinul nti. Vrem s test m ipoteza I0: V ! 0 (absen a autocorela iei erorilor), contra ipotezei I1: V " 0 (erorile I t sunt autocorelate). La un nivel de semnifica ie E dat, Durbin i Watson au determinat dou valori, d1 i d2, n func ie de num rul de observa ii (T) i de num rul de exogene veritabile (m) corespunz toare fiec reia din curbele limit . 53

Se calculeaz statistica d cu rela ia dat


1. 2.

i se observ c :

dac d
dac

d 1 , atunci se accept I1; d d 2 , atunci exist


ndoieli c leg tura dintre erori este de forma

d1

I t ! VI t 1  L t ;
3.

dac d " d 2 , atunci se accept I0.

n tabelul urm tor sunt date cteva valori uzuale pentru d1 i d2 n func ie de T i m, pentru nivelul de semnifica ie E=0,05: Tabela D-W T 15 20 30 50 100 m=1 d1 1,08 1,20 1,35 1,50 1,65 d2 1,36 1,41 1,49 1,59 1,69 m=2 d1 0,96 1,10 1,28 1,46 1,63 d2 1,54 1,54 1,57 1,63 1,72 m=3 d1 0,82 1,00 1,21 1,42 1,61 d2 1,75 1,68 1,65 1,67 1,74 m=4 d1 0,69 0,90 1,14 1,38 1,59 d2 1,97 1,83 1,74 1,72 1,76 m=5 d1 0,56 0,79 1,07 1,34 1,57 d2 2,21 1,99 1,83 1,77 1,78

Observa ii: 1. n loc s test m V ! 0 contra V " 0 , se poate testa I0: V ! 0 , contra I1: V { 0 . Se ob in dou valori d1 i d 2 simetrice n raport cu 2 i se constat c :
' '

a. dac d

' d 1 sau d " d 2 , atunci se accept I1; ' '

b. dac d 2 e d e d 2 sau d1 e d e d 2 , atunci exist ndoieli c erorile sunt corelate;


c. dac d 2

d1' , atunci se accept I0.

2. Dac modelul studiat nu con ine constanta, trebuie s determin m d ca i cnd modelul ar
con ine o constant . 3. Statistica Durbin-Watson aplicat pe un model care con ine variabile endogene retardate este deplasat c tre 2, ceea ce nseamn c erorile sunt mai pu in corelate ntr-un proces autoregresiv, dect ntrun proces ordinar.

54

4.1.2. Experien constante): t yt t yt 1 662,3 9 1281,7

de calcul

I. Se cunosc urm toarele date referitoare la evolu ia n timp a unei variabile economice (n pre uri 2 669,4 10 1426,3 3 912,7 11 1376,2 4 935,2 12 1327,8 5 1027,2 13 1420,6 6 1145,0 14 1933,9 7 1193,7 15 2023,4 ,s-a aplicat MCMMP, 8 1224,1

Pe aceast serie cronologic , utiliznd modelul ob inndu-se estimatorii:

yt ! a t  b  I t

a ! 81,8657 ; b ! 582,404
De asemenea, s-a calculat varian a estimatorilor i ecartul-tip al acestora: W a ! 7,94887 ;

W b ! 72, 2721

i valorile ajustate ale

variabilei endogene y t ! 81,8657 .t  582,404

i ale

reziduurilor I t ! y t  y t :
t 1 664,2 9 1319,2 2 746,1 10 1401,0 3 828,0 11 1482,9 4 909,8 12 1564,6 5 991,7 13 1646,6 6 1073,6 14 1728,5 7 1155,5 15 1810,4 8 1237,3

yt
t

yt
t 1

2 -76,79 10 +25,25

3 +84,79 11 -106,64

4 +25,35 12 -237,01

5 +35,49 13 -226,00

6 +71,44 14 +205,42

7 +38,30 15 +213,03

8 -13,25

It
t

-1,93 9 -37,54

It

Ne propunem s cercet m o eventual autocorelare a erorilor. Rezolvare: Pentru a putea utiliza testul Durbin-Watson trebuie ca num rul de observa ii T s fie suficient de mare (n practic T>15), iar modelul s con in un termen constant.

Statistica Durbin-Watson definit de ecua ia d !

I
t !1

 I t 1
2 t

I
t !1

conduce, conform datelor din

265867,35 ! 1,156 . tabel, la: d ! 229991,79

55

Durbin i Watson au ar tat c pentru un proces sta ionar (primele dou momente ale variabilei

aleatoare I t independente de timp), valoarea calculat a statisticii d este cuprins ntre 0 i 4, cu absen a
corela iei n vecin tatea lui 2. ntre aceste valori limit , tabela D-W furnizeaz , la pragul de seminifica ie E, diferite intervale de valori

d corespunz toare prezen ei autocorela iei pozitive sau negative, absen ei


d1 , atunci erorile sunt pozitiv autocorelate; d 2 , atunci exist ndoieli c erorile ar fi corelate; 4  d 2 , atunci erorile I t sunt independente; d 4  d1 , atunci exist ndoieli c erorile ar fi corelate;

autocorela iei i situa iilor de indecizie, astfel: 1. 2. 3. 4. 5. dac 0 dac d1 dac d 2

d d d

dac 4  d 2 dac 4  d1

d , atunci erorile sunt negativ corelate.

n exemplul nostru, num rul de exogene veritabile n model este (m=1) i dispunem de T=15 observa ii. Tabela D-W furnizeaz valorile d1=1,08 i d2=1,36 la pragul de semnifica ie E=0,05. Deoarece

d1 ! 1,08 d ! 1,156

d 2 ! 1,36 , suntem ntr-o situa ie de indecizie, nu

putem s spunem c erorile I t sunt corelate. II. n tabelul urm tor sunt date, pentru perioada 1985-2002:  volumul investi iilor n agricultur , yt;  produsul intern brut agricol, x1t ;  indicele volumului importurilor pentru agricultur , x2t. Anul t 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 Investi ii n agricultur yt 85,2 90,2 96,6 112,0 124,5 120,8 131,5 146,2 140,8 160,0 188,3 Produsul intern brut agricol x1t 563,8 594,7 635,7 688,1 753,0 796,3 868,5 935,5 982,4 1063,4 1171,1 Indicele volumului importurilor pentru agricultur x2t 90,6 91,7 92,9 94,5 97,2 100,0 104,2 109,8 116,3 121,3 125,3

56

Anul t 1996 1997 1998 1999 2000 2001 2002

Investi ii n agricultur yt 220,0 214,6 190,9 243,0 303,3 351,5 386,2 Se cere: 1. 2. 3. Rezolvare: -

Produsul intern brut agricol x1t 1306,6 1412,9 1528,8 1702,2 1899,5 2127,6 2368,5

Indicele volumului importurilor pentru agricultur x2t 133,1 147,7 161,2 170,5 181,5 195,4 217,4

Determinarea leg turii dintre investi ii, PIB i volumul importurilor; Testarea autocorela iei erorilor; Dac exist autocorela ie, cum se pot nl tura efectele acesteia? Studierea leg turii dintre variabilele economice amintite se poate efectua cu modelul de regresie multipl :

yt ! a  bx1t  cx2t  I t
Aplicarea MCMMP conduce la urm toarea estimare a modelului:

yt ! 125,44  0,37 x1t  2,93 x2t


Coeficientul de corela ie multipl are valoarea calculat : R2=0,98 2. Dup calcularea reziduurilor estimate, Conform tabelei D-W, pentru d1=1,05>

I t , statistica Durbin-Watson este: d ! 0,72 .


erorile sunt corelate pozitiv.

=5%, T=18 observa ii i m=2 variabile exogene veritabile, rezult :

d ! 0,72 , ceea ce conduce la concluzia c

3. Pentru a nl tura efectele autocorela iei erorilor, se procedeaz astfel: - scriem dependen a dintre variabile (1) (2)

y t ! a  bx1t  cx 2 t  I t , pentru momentul t-1: yt 1 ! a  bx1( t 1)  cx2 ( t 1)  I t 1


i efectu m sc derea (1)-(2):

- nmul im (2) cu

yt  Vyt 1 ! a  V  b( x1t  Vx1( t 1) )  c ( x2 t  Vx2 (t 1) )  (I t  VI t 1 ) 1

57

c ut m o estima ie a coeficientului

. Observ m c

este coeficientul

variabilei yt-1 n rela ia anterioar . Efectu m o regresie cu MCMMP pe ultima ecua ie, f r s inem cont de rela iile dintre coeficien i, adic pe ecua ia:

yt ! a0  Vy t 1  a1 x1t  a 2 x1(t 1)  a3 x2t  a 4 x 2(t 1)  L t


unde a0=a(1- ) , a1=b, a2=-b , a3=c, a4=-c Efectund calculele, ob inem: i Lt

! I t  VI t 1

yt ! 47,56  0,70 yt 1  0,68 x1t  0,60 x1(t 1)  3,08x2t  2,11x2(t 1)
Estima ia g sit pentru coeficientul Anul 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 este

V ! 0,70

cu ajutorul estima iei g site, transform m variabilele modelului ini ial pentru o nou regresie:

z t ! y t  Vy t 1
30,56 33,46 44,38 46,10 33,68 46,94 54,15 38,46 61,44 76,30 88,19 60,60 40,68 109,37 133,20 139,19 140,15

u1t ! x1t  Vx1(t 1)


200,04 219,41 243,11 271,33 269,70 311,09 327,55 327,55 375,72 426,72 486,83 498,28 539,77 632,04 707,96 797,95 879,18

u 2 t ! x 2t  Vx2 ( t 1)
28,28 28,71 29,47 31,05 31,96 34,20 36,86 39,44 39,89 40,39 45,39 54,53 57,81 57,66 62,15 68,35 80,62

Observa ie: Pentru a evita eliminarea primei valori din irul de observa ii, prin trecerea la diferen e, se pot folosi transform rile:

z1 ! y1 1  V 2 , u11 ! x11 1  V 2 , u 21 ! x 21 1  V 2
58

se aplic MCMMP ecua iei:

z t ! a 0  a1u1t  a 2 u 2t  L t , zt ! 7,19  0,24u1t  0,99u 2t

i rezult :

Coeficientul de corela ie multipl este acum R2=0,88 iar statistica Durbin-Watson

d ! 1,54 .

Testul de independen conduce acum la concluzia c erorile sunt independente, deoarece: 4-d2=2,47> d =1,54>d2=1,53 4.2. Ipoteza de normalitate a erorilor Unele propriet i ale estimatorilor nu depind de normalitatea erorilor. De exemplu, distribu iile asimptotice ale estimatorilor necesit doar existen a primelor dou momente (media i dispersia) ale erorilor I t i nu n mod obligatoriu ca I t s urmeze o lege normal . Acest lucru nu este ns valabil pe e antioane mici. Testarea ipotezelor i intervalele de ncredere nu mai au acelea i propriet i dac legea de distribu ie a erorilor nu este legea normal . Pentru a caracteriza devia iile de la legea normal se utilizeaz doi coeficien i: a) coeficientul de asimetrie, calculat prin raportul:

K1 !

Q3 W I2
0 , exist o deviere spre stnga.

unde: Q 3 este momentul centrat de ordinul 3. Dac K 1 " 0 , atunci seria de date este deplasat spre dreapta fa de legea normal , iar dac K 1

b) coeficientul de aplatizare, calculat prin raportul:

K2 !

Q4 3 W I2
0 caracterizeaz o distribu ie mai aplatizat dect cea normal .

O valoare pozitiv pentru K 3 indic faptul c distribu ia este mai pu in aplatizat dect distribu ia normal , n timp ce o valoare K 3

Aceste devia ii afecteaz testele i intervalele de ncredere ale estimatorilor. Studiul teoretic al acestor devia ii este complex. Pentru a ob ine teste i intervale de ncredere mai robuste, n practic se procedeaz astfel:

59

1.

Se efectueaz o regresie cu metodele uzuale i se determin o estima ie a reziduurilor

It .
2. 3. Se examineaz cele T reziduuri estimate i se repereaz cele a c ror valoare absolut este foarte mare. Se elimin din seria de date observa iile corespunzatoare acestor erori foarte mari sau se corecteaz aceste observa ii astfel ca s se ajung la valori ct mai normale ale erorilor. 4. Se efectueaz o nou regresie pe e antionul corectat. Propriet ile estimatorilor ob inu i vor depinde de regula adoptat n etapa anterioar . De exemplu, se poate adopta regula de a respinge sau corecta observa iile corespunz toare reziduurilor a

c ror valoare absolut I t este mai mare dect de trei ori media erorilor absolute.
4.3. Ipoteza de heteroscedasticitate S presupunem, deci, c de i I t

W I2t sunt independente, dispesia erorilor

variaz n func ie de

t. n acest caz, estimatorii ob inu i sunt nc nedeplasa i. Dar, momentele centrate de ordinul doi nemaifiind constante se comite o eroare de calcul a ecartului-tip al estimatorilor. Se poate evalua deplasarea n estima ia lui de valori

; a . Aceast
2 It

deplasare depinde de natura i importan a heteroscedasticit ii, adic de irul

W
(1)

, xt


2 It

. Deplasarea este nul dac sunt realizate rela iile urm toare:

1 W I2t xt  x ! 0 ; T t

(2)

1 T

W x
t

x

1 ! T W x
2 2 It t t

2  x .

Aceste rela iile sunt realizate atunci cnd nu exist nicio leg tur sistematic ntre

W I2t

xt .

Homoscedasticitatea erorilor se admite n seriile cronologice atunci cnd ordinul de m rime al variabilelor este apropiat pentru diverse observa ii. Dar, n studiul datelor micro-economice, variabilele pot avea ordine de m rime foarte diferite. Acest fapt conduce la erori de estimare importante pentru coeficien ii unui model econometric.

60

Dac putem evalua varian a erorilor

W I2t

atunci, n loc s determin m parametrii din condi ia ca

suma p tratelor erorilor s fie minim , ace tia pot fi determina i din condi ia ca

I t2 W2 t It

s fie minim .

Pentru modelul elementar expresia

y t ! axt  b  I t , estimatorii a

i b vor fi cei care minimizeaz

1 W y
t

2 It

2  axt  b .

n cazul n care

W I2t

(dispersiile reziduurilor) variaz propor ional cu valorile variabilei exogene,

se poate pune condi ia ca 4.3.1. Experien

yt  axt  b 2
xt2

y b ! t  a  s fie minim . x xt t t

de calcul

Ne propunem s studiem legatura dintre volumul investi iilor i suprafa a cultivat . Pe un e antion de 30 de ntreprinderi agricole s-au ob inut urm toarele date: Suprafa a (ha) 100 200 300 400 500 75,6 80,1 85,5 92,7 104,4 75,6 81,9 88,2 95,4 106,2 Cheltuielile de investi ii (RON) 77,4 83,7 89,1 98,1 108,9 78,3 83,7 92,7 101,7 112,5 80,1 84,6 92,7 103,5 117,9 81 84,6 94,5 105,3 117,9

Aplicnd MCMMP pe ntregul e antion cu modelul elementar

y t ! axt  b  I t , ob inem:

yt ! 0,08145 xt  67,965

R 2 ! 0,9 .

Dorim s test m ipoteza de homoscedasticitate a erorilor. n acest scop efectu m dou regresii separate, una pe primele 12 observa ii, alta pe ultimele 12 (valorile lui X fiind ordonate cresc tor). Fie SPE1 i SPE2 suma p tratelor erorilor relative la cele dou regresii. Regresia lui Y n raport cu X pentru primele 12 observa ii, conduce la:

y t 1 ! 0,054 xt  72,6
iar regresia pe ultimele 12 observa ii d :

R 2 ! 0,66 ; SPE1 ! 49,14 ,


i

y t 2 ! 0,1125 xt  54,45

R 2 ! 0,60 ; SPE 2 ! 250,695 .

61

n cazul n care erorile ar fi distribuite normal i homoscedastice, variabilele aleatoare

SPE1 , W2

respectiv

SPE 2 ar trebui s urmeze fiecare o distribu ie hi-p trat cu (T-d-k-p) grade de libertate, unde T W2

este num rul de observa ii, d este num rul de observa ii omise (n cazul nostru d=6), k este num rul de observa ii luat n fiecare regresie separat , iar p este num rul parametrilor de estimat. n exemplul nostru T-

1 SPE 2 10 d-k-p=10. n aceste condi ii, variabila aleatoare are o distribu ie Fisher cu 10 i respectiv 10 1 SPE1 10
grade de libertate (F10,10). Cu datele calculate, ob inem distribu iei Fischer-Snedecor, la pragul de

SPE 2 250,695 ! ! 51,01 . Din tabelele 49,14 SPE1


Deoarece

semnifica ie E=0,05 gasim Ftab=2,97.

Fcalc=51,01>Ftab=2,97 se admite ipoteza de heteroscedasticitate a erorilor. Dac presupunem acum c


2 2

varian a erorilor

W I2t

este propor ional

cu p tratul valorilor

variabilei exogene, adic W I t ! P xt , P fiind o constant nenul , atunci efectele heteroscedasticit ii pot fi corectate prin transformarea modelului. mp r ind fiecare termen al ecua iei de regresie prin xt, rezult :

yt b I ! a  t xt xt xt
sau

z t ! a  bu t  L t , unde: zt ! yt , ut ! 1
xt
Se observ c

xt

i Lt !

It . xt

I Var t ! Var t L x t

1 2 ! 2 W It ! P . x t

Prin urmare, modelul transformat are erorile L t homoscedastice, deoarece dispersia lor este independent de timp. Efectund regresia pe modelul transformat, rezult :

z t u t  T zu b ! 2 u t2  T u ! z  bu a
Revenind n variabilele ini iale ob inem:

62

yt 1 1 yt 1 x x  T x x t t t ! t t t 2 b 2 1 1 1 x  T x t t t 1 y 1 1 a ! t b T t xt T t xt
Efectund calculele, rezult :

b ! 70,44 ; a ! 0,072 ; R 2 ! 0,99 , adic :


yt 70,44 ! 0,072  xt xt
sau

yt ! 0,072 xt  70,44 .

S remarc m faptul c panta dreptei de regresie (dup corectarea heteroscedasticit ii) este mai mic dect cea ob inut naintea corect rii. 4.4. Ipoteza de independen Se tie c a erorilor n raport cu varibilele exogene ipotez fundamental estimatorii ob inu i au propriet i optimale

sub aceast

(nedeplasa i, cu varian

minimal ). Cnd ipoteza nu mai este satisf cut aceste propriet i nu mai sunt

valabile. Cu ct coeficientul de corela ie liniar ( V ) dintre I t i xt este mai mare, cu att deplasarea estimatorilor va fi mai mare. n astfel de cazuri este de preferat s se aleag un alt model econometric pentru studierea leg turii dintre variabile. La fel trebuie procedat i atunci cnd se constat c varian a erorilor nu este finit . 4.5. Ipoteza referitoare la faptul c variabilele modelului sunt observate f r eroare Atunci cnd variabilele care apar n model nu sunt variabile observate f r eroare, va exista o corela ie ntre reziduuri i exogenele din model. n acest caz, pentru a ob ine estimatori convergen i, s-a dezvoltat o metod de estimare special , numit metoda variabilelor instrumentale, pe care o prezent m mai jos. Fie modelul liniar general:

y t ! a1 x1t  a 2 x 2 t  ...  a p x pt  I t , t=1, 2, ...,T,


care, cu nota iile obi nuite, se scrie n forma matricial Y=Xa+I. Not m cu Y

i X valorile reale

(necunoscute acum pentru c observa iile Y i X con in erori!) ale variabilelor din model.

63

Putem scrie c Y ! Y  Q , X ! X  K , unde Q i K sunt variabile aleatoare. Vom presupune c Q i K satisface ipotezele fundamentale (medie zero, varian finit , independente). nlocuind X i Y prin expresiile lor, ob inem modelul

~ ~ Y ! Xa  L ,

unde

L ! Ka  I  Q . Aceasta arat
intermediul lui K.

c n modelul ini ial, Y=Xa+I , reziduurile I sunt corelate cu X prin

Presupunem acum c se cunosc alte p variabile exogene Zi , i=1,2,...,p necorelate cu Q, K i L, deci necorelate cu I. Acest lucru nseamn c sub forma: (1)

E Z i I ! 0 , i=1,2,...,p. Consider

m modelul ini ial Y=Xa+I scris

Y ! a1 X 1  a 2 X 2  ...  a p X p  I ,

x p1 x11 x 21 . . . unde X 1 ! . , X 2 ! . ,..., X p ! . . . . x x x pT 1T 2T


nmul im, succesiv, ecua ia (1) cu Z1, Z2, ...Zp i aplic m operatorul de medie E fiec rei ecua ii. Se ob ine sistemul:

E Z Z 1 Y ! a1 E Z 1 X 1  ...  a p E 1 X p E Z Z 2 Y ! a1 E Z 2 X 1  ...  a p E 2 X p (2) .... Y ! a E X  ...  a E X E Zp 1 Zp p 1 p Zp Metoda de estimare VI (variabilelor instrumentale) const n a lua ca estimatori a1 ,..., a p exact
solu iile sistemului de ecua ii (2), n care speran ele matematice sunt nlocuite cu momentele empirice corespunz toare:

E Z i Y !

1 zit yt , i=1,2,...,p T t 1 zit x jt , i,j=1,2,...,p T t

E i X j ! Z
Dac not m:

64

z11 Z ! ... z 1T
matricial :

x11 z p1 ... ... i X ! ... x ... z pT 1T ...

x p1 ... ... sistemul (2) transformat se scrie sub form ... x pT ...

Z 'Y ! Z ' X a , iar pentru c Z 'Y este inversabil , ob inem estimatorul:

1 a ! Z ' X Z 'Y .

S observ m similitudinea cu estimatorii ob inu i prin MCMMP: 1. 2. 3. MCMMP obi nuit :


1 a ! X ' X X 'Y
  a ! X ' ; I 1 X X ' ; I 1 Y 1

MCMMP generalizat : metoda VI:

1 a ! Z ' X Z 'Y .
1

 Se trece de la 1. la 2. nlocuind X ' prin X ' ; I .  Se trece de la 1. la 3. nlocuind X ' prin Z ' . Cunoa terea primei formule permite exprimarea celorlalte dou .

Estimatorul a ob inut prin metoda VI este un estimator deplasat pentru a, dar converge n
probabilitate c tre a pentru T suficient de mare. Pentru a putea utiliza metoda VI trebuie g site attea variabile instrumentale cte exogene con ine modelul. Aceste variabile instrumentale trebuie s fie necorelate cu reziduurile, dar puternic corelate cu exogenele modelului. Aceste restric ii limiteaz alegerea variabilelor instrumentale i, prin urmare, metoda VI nu este o metod general de estimare. 4.5.1. Experien de calcul

Consider m o anchet pe bugetele de familie pentru a studia consumul dintr-un anumit produs. Ancheta cuprinde un e antion de T familii. Facem urm toarele nota ii: y1t: cheltuielile totale ale familiei t; y2t: cheltuielile relative la produsul studiat; Vt : veniturile familiei t; i scriem ecua iile: (1) (2)

y1t ! Vt  I 1t
y 2t ! aVt  b  I 2t

65

Ne propunem s exprim m cheltuielile relative la produsul studiat n func ie de cheltuielile totale. Din ecua ia (1) avem c

Vt ! y1t  I 1t

i nlocuind n (2), rezult :

y 2t ! ay1t  b  I 2t  aI 1t
sau, punnd L t (3)

! I 2 t  aI 1t :

y 2t ! ay1t  b  L t .

S observ m c L t este corelat cu y1t prin intermediul lui I1t. Vom estima a i b din ecua ia (3) introducnd o variabil instrumental . Fie VDt venitul declarat de familia t. Este evident corela ia puternic dintre variabilele VDt i Vt. Dimpotriv , venitul declarat VDt nu este corelat cu

I 1t ! y1t  Vt ,

care este ecartul ntre

cheltuielile totale i veniturile familiei t. Rezult c VDt nu va fi corelat cu L t . Utiliz m venitul declarat ca variabil instrumental . Pentru simplificarea calculelor, centr m variabilele din model:

y 2t ! ay1t  b  L t , t=1,2,...,T

1 1 1 y2t ! a T y1t  b  T L t T t t t
y 2 ! a y1  b  L
(4)

y 2t  y 2 ! a y1t  y1  L t  L

Dac aplic m MCMMP ecua iei (4), ob inem estimatorul:

y
t

1t

 y1 y 2t  y 2
1t

(5).

a!

y
t

 y1


i aplicnd

Folosim ns instrumental centrat

metoda variabilelor instrumentale. Pentru aceasta, consider m variabila

VD

 VD . nmul ind ecua ia (4) cu variabila instrumental centrat

operatorul de medie E, rezult :

E y 2t  y 2 VDt  VD ! aE y1t  y1 VDt  VD  E L t  L VDt  VD

? A

. A

66

Dar, cum L t

i VDt nu sunt corelate, nseamn c

E L t  L VDt  VD ! 0 , iar acum

nlocuind E cu media empiric , ob inem:

E y 2t  y 2 VDt  VD ! aE y1t  y 1 VDt  VD

1 1 VDt  VD y2t  y 2 ! a T VDt  VD y1t  y1 , T t t


de unde:

VD  VD y a! VD  VD y
t t t t

2t

1t

. y
 y2
1

Am ob inut practic estimatorul (5) n care variabila instrumental

1t

 y1

s-a nlocuit cu variabila

VD

 VD att la num r tor, ct i la numitor.

67

BIBLIOGRAFIE 1. Andrei, T. 2. Cenu , Ghe. (coord.) 3. Chow, G. 4. Dobrescu, E. 5. Gheroghi , M. 6. Giraud, R. 7. Gourieroux, C. Monfort, A. 8. Gujarati, R.N. 9. Isaic-Maniu, Al. Mitru , C. Voineagu, V. 10. Malinvaud, E. 11. Onicescu, O. Botez, M. 12. Pecican, E.S. 13. Pecican, E.S. 14. Ta nadi, Al. 15. Ta nadi, Al. Cre u, A. Peptan, E. 16. T n soiu, O. Pecican, E.S. Iacob, A. 17. T n soiu, O. 18. T n soiu, O. Iacob, A. 19. www.asecib.ase.ro/soft.htm Econometrie-studii de caz, Editura A.S.E., 1998 Econometrie aplicat , Editura Arteticart, Bucure ti, 1999 Modele econometrice, Editura A.S.E., 2001 Methodes statistiques de leconometrie, Dunod, Paris, 1978 Incertitudine i modelare economic (Econometrie informa ional ), Editura tiin ific Bucure ti, 1985 Econometria pentru ... economi ti; Econometrie-teorie i aplica ii, Editura Economic , Bucure ti, 2003 Econometrie, Editura All, Bucure ti, 1994 Econometrie, Editura A.S.E., 2001 Econometrie proiect, Editura A.S.E., 2003 i Enciclopedic , Statistic i econometrie, Editura Economic , Bucure ti, 2004

Matematici pentru economi ti, Editura CISON, Bucure ti, 2000 Econometrics, McGraw Hill, New York, 1989 Tranzi ia n Romnia-Abord ri econometrice, Editura Economic , Bucure ti, 2002 Modelarea i simularea proceselor economice, Editura ASE, Bucure ti, 2001 Econometrie, Economica, 49 rue Hericart, Paris, 1990 Statistique et Modeles Econometriques, Economica, Paris, 1989 Essentials of Econometrics, McGraw Hill, New York, 1998 Statistica pentru managementul afacerilor, Editura Economic , 1995

68