Professional Documents
Culture Documents
Lestimation du modle peut tre ponctuelle Dans une rgression, la variable y et la (ou les) variable(s) x
(obtention dune valeur spcifique du paramtre) ou est (sont) traite(s) de manire asymtrique.
par intervalle (la vraie valeur du paramtre est La variable y est suppose tre alatoire ou stochastique.
La (ou les) variable(s) x est (sont) suppose(s), au sens strict, avoir
comprise dans un intervalle de confiance). des valeurs fixes dun chantillon lautre.
Le plus souvent, on sintresse aux proprits En raison du caractre alatoire de y, les valeurs observes
dune variable conditionnellement dautres dvient de leur esprance conditionnelle. Cette dviation est
variables. qualifie dcart alatoire ().
Proprit conditionnelle : esprance dune variable y Cas dune rgression linaire simple :
conditionnelle la variable x. E(y|x) = f(x) yi = ( yi xi , i ) = 1 + 2 xi + i
1 : ordonne lorigine (constante - intercept)
Dpendante, endogne, explique, Indpendante, exogne, explicative, 2 : pente, mesure limpact marginal, ceteris paribus, de x sur y.
rgressant, de rponse rgresseur, de contrle
Licence 3 Licence 3
yi = 1 + 2 xi + i
de manire maximiser la probabilit dobserver les yi
sachant la valeur de xi.
On suppose que les yi (i) sont distribus normalement et
indpendamment (nid) de moyenne 1 + 2 xi et de On cherche les valeurs des coefficients 1 et 2 qui
variance . minimisent la somme des carrs des carts alatoires.
Licence 3 Licence 3
2. Lestimation des paramtres par les MCO 2. Lestimation des paramtres par les MCO
y1 .} 1 2 xi yi 1 xi 2 xi2 = 0
i i i quations normales
x1 x2 x3 x4 x 2 yi n1 2 xi = 0
i i
Licence 3 Licence 3
2. Lestimation des paramtres par les MCO 2. Lestimation des paramtres par les MCO
On obtient les estimateurs 1 et 2 partir des quations normales : En utilisant les donnes de consommation et revenu,
( x x )( y y ) x y nx y
n n
on obtient les valeurs suivantes pour les estimateurs :
i i i i
2 = ^1 = 2 373,26 (ordonne lorigine) ;
= 1 = y 2 x
i =1 i =1
^2 = 0,66 (pente de la droite)
(x x )
n n
nx
2 2 2
i x i
i =1 i =1 Le coefficient 2 mesure limpact dune variation du
C Cm (y) R - Rm (x) (R Rm) (C Cm) * (R Rm) revenu sur la consommation (2 = y / x).
1 504 2 000 4 000 000 3 008 000 Interprtation (en supposant que x et y soient mesurs
874 1 500 2 250 000 1 311 000 en ) : Si x varie d1 point de %, y varie de 0,66 .
26 Ne pas confondre rgression et corrlation.
826 1 000 1 000 000 826 000 Dans une rgression, les variables sont traites de manire
1 526 2 500 6 250 000 3 815 000 asymtrique (y : alatoire ; x : fixe).
Quant la corrlation, les variables sont traites de manire
SOMME 13 500 000 8 960 000
symtrique (x et y : alatoires).
Licence 3 Licence 3
2. Lestimation des paramtres par les MCO 2. Lestimation des paramtres par les MCO
3. Identification et proprits des estimateurs Proprits sur petit Proprits sur chantillon de taille
chantillon infinie (proprits asymptotiques)
a) Notion dun estimateur
Soit les variables alatoires x et y, leurs distributions sont Sans biais si
()
E =
Asymptotiquement sans biais si
()
limn E =
caractrises par .
La population originale est compose de toutes les valeurs de x et Efficace si les 2 conditions Convergent si
y. suivantes sont satisfaites: p lim =
Le paramtre est une des caractristiques paramtrique de cette Non-biais
population. (consistant en franglais )
Variance minimale
x et/ou y peuvent tre continu ou discret.
Meilleur Estimateur linaire Efficience asymptotique, si les 3
Lestimation de dpend de linformation de lchantillon, on peut conditions sont satisfaites
la dcrire par une formule destimation : lestimateur sans biais (BLUE) si les 3
( )
conditions sont satisfaites: Distribution asymptotique avec
=
y , y ,L , y ; x , x , L , x
1 2 N 1 2 N
Fonction linaire des
moyenne et variance finies
observation de lchantillon Convergent
Lestimateur a des proprits que lon distingue selon la taille de Non-biais Variance asymptotique minimale
lchantillon. Licence 3 Variance minimale Licence 3
Licence 3 Licence 3
( )
Il ny a pas de corrlation srielle dans les erreurs
(indpendance srielle des carts) = E
Efficience
Corr(t , s | x) = 0
()
Il ny a pas de corrlation entre les erreur linstant t et une erreur
suivante (s > t) ou prcdente (s < t). f
Sous lhypothses de Gauss Markov (existence, sans
biais et efficience), lestimateur MCO est BLUE
Si une hypothse est viole, lestimateur nest pas BLUE.
Licence 3 Licence 3
{[ ( )] [ ( ) ]}
Sous les hypothses du modle de rgression linaire classique :
2
= E E + E
= E[ E( )] + E[E( ) ] + 2E[ E( )][E( ) ]
i i i
N (0,1) i t n 2 , i = (1,2 )
2 2
V ( i ) i
b) Test sur un seul coefficient : t ratio 5. Utiliser la table statistique (Student) pour obtenir la valeur
Soit lquation suivante : yi = 1 + 2 xi + i critique (quantile de la distribution, au-del duquel
lhypothse nulle est rejete).
Etapes pour effectuer un test sur un seul coefficient: Pour un test bilatral, avec k = 2, = 10% et N = 30 ;
1. Estimation de 1 , 2 , 1 , 2 par MCO ddl = N K = 28
2. Calcul de la statistique t de Student empirique t * = 2
2*
H0 : 2 = 2*
2* : valeur de 2 sous H0 2 Rgion de non Pour un test unilatral :
HA : 2 2* rejet (H0) H0 : 2 = 2*
Lorsque 2 = 0 et que le test est bilatral, t* est appel le
*
RATIO t de Student (t-ratio test). f(t) HA soit : 2 > 2*, si partie droite
Licence 3 2* Licence 3
Licence 3 Licence 3
4. Infrence statistique
Il nest pas exclu daccepter H0 sachant quelle est fausse 5. ANOVA (ANalysis Of VAriance)
Erreur de deuxime espce ()
a) Equation fondamentale
La dcision se traduit par 2 erreurs : et antagonistes
N N
SCT = ( yi y ) SCR = ( yi y i ) = i2
Dcision 2 2
H0 HA i =1 i =1 i
N
SCE = ( y i y )
Hypothses H0 Pas derreur 2
vraies HA
Puissance i =1
dun test Somme des carrs des rsidus
(1 ) : puissance dun test. Mesure de la probabilit de
rejeter H0 sachant quelle est fausse SCT = SCE + SCR
Plus la rgion dacceptation est grande plus est leve
Lerreur de premire espce est plus grave que lerreur de Cf. dmonstration dans Somme des carrs explique
lABC dE page 55
deuxime espce
Obs : ne pas confondre ici et Licence
avec les3 paramtres du modle Licence 3
5. ANOVA