Professional Documents
Culture Documents
INDICE
PRUEBAS DE NORMALIDAD 03
MODELO LINEAL SIMPLE
Estimadores mnimos cuadrticos ordinarios 04
Pruebas para correlacin de Pearson 06
Problema de prediccin 07
MODELO LINEAL MLTIPLE
Formulacin matricial 08
Supuestos bsicos 08
Coeficiente de determinacin 09
Prueba F-Global 09
Test de razn de verosimilitud 10
Pruebas t para los parmetros individuales 12
Coeficientes beta 13
Pronsticos 14
Puntos influyentes 16
Error cuadrtico medio 17
Modelos con trmino de interaccin 19
Prueba de una hiptesis lineal 21
Variables dicotmicas 23
MULTICOLINEALIDAD
Diagnstico de la multicolinealidad 24
Correlaciones parciales 25
HETEROCEDASTICIDAD
Test de heterocedasticidad 26
Mtodo de los mnimos cuadrados ponderados 28
AUTOCORRELACIN
Autocorrelacin residual de orden 1 30
Mtodo de Cochrane-Orcutt 31
Test de Durbin-Watson 33
Otros test de autocorrelacin 34
3
PRUEBAS DE NORMALIDAD
Sesgo de X
3 2
m
a3 X 33 en que: X X X X
S m3 S2
n n 1
Curtosis de X
4
m
a 4 X 44 en que: X X
S m4
n
Test de Sesgo: H 0 : a3 X 0
a3 X
Zn
6 ~ N 0,1
n
Test de Curtosis: H 0 : a4 X 3
a4 X 3
Zn
24 ~ N 0,1
n
Test de Jarque-Bera: H 0 : X ~ N ,
2
JB
n 2
a X
a 4 X 3 2 2
3 2
6 4
4
Y 0 1 X Y 0 1 X Y Y
Supuestos Bsicos:
XY n X Y
1
1
X X Y Y
X X 1
X 2
2
X 2
n
0 Y 1 X
V ( 0 ) 2
X 2
E( 0 ) 0
n ( X X ) 2
2
V ( 1 )
E ( 1 ) 1
(X X ) 2
X
Cov ( 0 , 1 ) 2
(X X ) 2
5
S 2
2
Estimador insesgado de 2
E ( S 2 ) 2
n2
S 2 S 2
X 2
S 2
X 2
0
n(X X ) 1
n X 2 ( X ) 2
2
S 2 S 2
S 2
1
(X X ) X 2 n ( X ) 2
1 2
X X
S S 2
S 2
X X
X 2 n X
0 1
2
1 2
6
TEST PARA: H0 : r ( X ,Y ) 0
n3 1 r
Zc ln ~ N 0,1
2 1 r
(2) Prueba F
Fc
n 2 r 2 ~ F(1,n 2 )
1 r2
(3) Prueba t
Teorema:
F ~ F(1,n 2 ) F ~ t ( n2)
n2 r
tc ~ t ( n2)
1 r2
(4) Criterio
Para = 0.05 y n 20
t 2
2
n2 r 2
Se rechaza H 0 para 2 r
1 r2 n
RELACIN ENTRE R 2 Y r ( X ,Y )
XY n X Y
1
r ( X ,Y )
X X Y Y
X X Y Y 1
X 2 1
Y 2
2 2
X 2
n
Y 2
n
Teorema:
R 2 r 2 ( X ,Y )
7
PROBLEMA DE PREDICCION
Y0 0 1 X 0 estimacin puntual de E Y / X 0 0 1 X 0
1
Y0 N E Y / X 0 , y o , y2 2
X 0 X 2
X X
2
n
0
Sea
1
S y20 S2
X 0 X 2 es un estimador de 2
n X X
2 y 0
n 1 S y2 0
2n 2
2
Y0 E Y / X 0
Por lo tanto t c t n2
S y 0
Por lo tanto Y0 t n 2 S y 0
2
V Y0 Y0 E Y0 Y0 2 1
2 1
X X
0
2
X X
2
n
S 2
1
S 1 2 X X 0
2
X X
y 0 y 0 2
n
Observacin:
Yi 0 1 X 1i ki X ki i , 1 i n
Yi 0 1 X 1i ki X ki i Yi Yi in
Formulacin matricial
Y X1 ... Xk Y
Y1 X 11 ... X k1 Y
1
1
Yn X 1n ... X kn Yn n
Y1 1 X 11 X k1 0 1
Y 1 X X kn k n
n 1n
Y X
Resumidamente
Y X Y Y
X t X X t Y
1
Estimadores Mnimo Cuadrticos Ordinarios :
t
Estimador de 2 : S2 es un estimador insesgado y consistente de 2
n k 1
Supuestos Bsicos:
(2)
X 1 , , X k no correlacionadas X i , X j 0 1 i j n
(3) ( i ) 0 , 1 i n
COEFICIENTE DE DETERMINACIN
Y Y
2
SCT : Varianza total de Y
9
SCM Y Y
2
: Varianza de Y explicada por el modelo
Y 0 1 X 1 .... k X k Y 1 X 1 .... k X k
Adems, es posible que R 2 asuma valores fuera del rango [0,1], de hecho puede ocurrir que
R2 0 .
PRUEBA F GLOBAL
SCE 2
(n k 1) S 2 SCE
2n k 1 no-central: (2n k 1)
2 2
(2n k 1)
i N (0, 2 ) Yi N ( X i , 2 )
(n 1) S Y2 SCT
SCT (Y Y ) 2 (2n 1) no-central: (2n 1) (2n 1)
2 2
SCM
SCM SCT SCE (k
2
) no-central: (k
2
)
2
10
Teorema:
X 1 ( n1 )
2
, X 2 (2n2 ) ; X1, X 2 v.a.i.
Entonces:
X 1 / n1
F( n1 , n2 )
X 2 / n2
SCM / k
H 0: 1 0 Fc F( k , n k 1)
SCE /( n k 1)
RELACION ENTRE Fc y R2
R2 / k
Fc
(1 R 2 ) /( n k 1)
Entonces:
2 ln f 1 , n ln f 1* , n* ~ 2 J
Observacin: Si N 0, 2 I n , entonces;
f 1 , , n 2 2
n / 2
Exp
1
t
2
2
ln 2 2 ln 2 2
n 1 t n 1
ln f 1 , , n Y X t Y X
2 2 2
2 2 2
Anlogamente:
ln f 1* , , n* ln 2 *
n
2
2
2
1
*
2
t n
Y Z Y Z ln 2 *
2
2 1
2 ' 2
* t *
11
ln f 1 , , n funcin de log-verosimilitud.
ln f 1* , , n* funcin de log-verosimilitud.
Entonces:
2 ln f 1 , n ln f 1* , nn ~ 2
J
EJEMPLO
Si i ~ N 0, 2 1 i n
f 1 , , n 2 2 n / 2
e i
2 / 2 2
ln f 1 , , n
n
ln 2 2
1
i
2
S2 i
estimador insesgado para
2 2 2 n k 1
2
n k 1
n
1
n
ln f 1 , , n ln 2 S 2 2 i
2 ln 2 S2
2 2 S 2 2
As:
n k 1 n n k* 1
ln f 1 , , n ln f 1* , , n* n
2
ln 2S2
2
ln 2S2*
2 2
n S * k k*
2
2
2 2
*
ln 2S * ln 2S n k 1 n k 1 ln 2
n 1
2 S
2
n S 2* J S2
2 ln 2 n ln 2 J
*
Luego,
2
2 S S
12
H 0 : 0 0* ; H 0 : j *j
0
N 0 , 20
j
N j , 2 j
0 0 j j
N (0 , 1) y N (0 , 1)
0 j
Adems:
n k 1 S2 ~ (2n k 1)
2
Teorema:
Entonces:
X1
X2 ~ t( p)
p
0*
H0 : 0 *
0
tc 0 ~ t ( n k 1)
S
0
j *j
H0 : j *j tc ~ t ( n k 1)
S
j
13
COEFICIENTES BETA
Y 0 1 X 1 .......... k X k
Y Y
Y
*
SY
X Xi
X i* i
S xi
X X1 X Xk
Y * 1* X 1* ....... k* X k* * 1* 1 ..... k* k
S X1 S Xk
Y Y * X1 * Xk * 1 * 1
1 ..... k 1 X 1 ..... k Xk
SY S X1 SXk S X1 SXk
S S S S
Y Y 1* Y X 1 .... k* Y X k 1* Y X 1 .... k* Y X k
S X1 S Xk S X1 S Xk
SY S
0 Y 1* X 1 .... k* Y X k
S X1 S XK
SY S X1
1 1* 1* 1
S X1 SY
. .
. .
. .
SY S Xk
k k* k* k
S Xk SY
14
PRONSTICOS
Yi 0 1 X 1i ... k X ki i 1 i n Y X
Y i 0 1 X 1i ... k X ki 1 i n
Suponiendo que queremos estimar el valor de Y para particulares valores de X 1 ,..., X k , a decir:
X 10 ,..., X k0
Sea Y 0 0 1 X 10 ... k X k0
1 0
X10 1
Si
X . y .
0
. .
. .
Xk
0
k
Entonces:
Y 0 X 0t ,
~
N ,V 2
X t
X 1
Y0 ~ N Y 0 , V Y 0
Y 0 X 0t X 0t X 0t Y0
15
1
V Y 0 V X 0t X 0t V X 0 2 X 0t X t X X0
1
Estimador para V Y 0 : V Y 0 S2 X 0t X t X X0
16
Intervalo de Confianza:
Y 0 t S2 X 0t X t X
1
X0 t valor en tabla t
n k 1
2
2
V Y 0
2
1 X t
0 X t
X 1
X0
Estimador para V Y 0 :
V Y 0 S2 1 X 0t X t X
1
X0
Intervalo de Confianza:
Y 0 t S 1 X 0t X t X
1
X0 t valor en tabla t
n k 1
2
2
EVALUACIN DE PRONSTICOS
2
Y i Yi
U n 0 U 1
2
Y i
Y i
2
n n
Ntese que Y i Yi ; 1 i n
i
j : EMCO para j cuando se extrae la i-sima observacin.
i i i i
j : Y j 0 1 X 1 j ... k X k j
i
j
Residual Studentizado: *j 2
S i
S2 i estimador de la varianza del error cuando se extrae del modelo la i-sima observacin.
(2) DF Betas
i
j
DF Beta j
S i
j
DF Betas j 1,96 Punto influyente en la estimacin de j
j
2
Criterio general: DF Betas
n
18
Estimador de Estimador insesgado de solo si E
2
V E E Sesgo E
2
ECM : E
2 2
ECM E E E E
2
2
E E 2 E E E
2 2
E E 2 E E E E E
2
V 0 E
2
ECM V sesgo
Y 0 1 X 1
*
Sea el EMCO para
1
1
*
1 es un estimador sesgado para 1
*
Pero: V V
1 1
*
Qu estimador se prefiere o ?
1 1
19
*
1
ECM
1 2
1 2 X , X t 2 1
2
ECM 1
20
Y Y
As: s X t t X s
X s X t
EJEMPLOS
1) Se hizo un estudio para analizar la influencia del precio ( X 1 ) y los gastos en publicidad (
X 2 ) en las ventas de cierto modelo de automvil de una determinada marca ( Y ). Con datos de
30 concesionarios se estim el siguiente modelo:
Y 116 .16 1.31X 1 11 .24 X 2
(11 .5) ( 9.6) ( 4.7)
R 0.96
2
Fc 10.96
1.1- Cmo reformulara el modelo para recoger la posible interaccin entre precio y gasto en
publicidad?
Solucin:
Y 0 1 X 1 2 X 2 X 1 X 2
Y Y
1 X 2 2 X 1
X 1 X 2
1.2- Cmo verificara en este nuevo modelo la hiptesis de que las ventas no estn influidas
por los gastos en publicidad?
Solucin:
H0 : 2 0
21
Las elasticidades demanda-renta y demanda-tamao son constantes. Para que las elasticidades
demanda-renta y demanda-tamao dependan respectivamente del tamao familiar y del nivel de
ingreso, es necesario incorporar al modelo los correspondientes trminos de interaccin.
ln Y 0 1 ln X 1 2 ln X 2 1 ln X 1 X 2 2 ln X 2 X 1
1 Y 1 1 X 1 Y
As se tiene: 1 1 X 2 1 1 X 2
Y X 1 X1 X1 Y X 1
YX1 1 1 X 2
Anlogamente:
1 Y 1 1 X 2 Y
2 2 X1 2 2 X1
Y X 2 X 2 X2 Y X 2
YX 2 2 2 X 1
2.2- Si desea, adems, que la elasticidad-renta dependa del nivel de renta. Especifique el
modelo.
ln Y 0 1 ln X 1 2 ln X 2 1 ln X 1 X 2 2 ln X 2 X 1 3 X 1
As:
1 Y 1 1 X 1 Y
1 1 X 2 3 1 1 X 2 3 X 1
Y X 1 X1 X1 Y X 1
YX1 1 1 X 2 3 X 1
22
Prueba de la hiptesis: H 0 : C q
Y 0 1 X 1 k X k
H 0 : C q
C10C11 C1k 0
C20C21 C2k B1
C
C C C
m0 m1 mk k
C10 0 C11 1 C1k k q1
C 20 0 C 21 1 C 2 k k q 2
C m 0 0 C m1 1 C mk k q m
Para: Y X se tiene
ANOVA
Fuente Grados de libertad
SCM k
SCE n k 1
SCT n 1
Y 0 1 Z1 k m Z k m '
ANOVA
Fuente Grados de libertad
SCM C q k m
23
SCE C q n k 1 m
SCT n 1
24
SCE C q SCE 2 ( m )
SCE 2 ( n k 1)
la estadstica:
SCM ( ) SCM (C q) / m SCE (C q) SCE ( ) / m R 2
RC2 / m
FC
SCE ( ) / n k 1 SCE ( ) / n k 1 1 R / n k 1 F
2
m , n k 1
EJEMPLO:
Q AK L
Q es homognea de grado
Q (K , L) A(K ) (L) AK L
Q( K , L)
Apliquemos: H 0 : 1 1
ln(Q) ln( A) ln( K ) (1 ) ln L
ln( A) ln( L) ln( K ) ln(L)
K
ln( AL) ln
L
SCE C q 2 ( n 2)
FC
SCE (C q) SCE ( ) / 1 F
1, n 3
SCE ( ) / n 3
25
VARIABLES DICOTMICAS
Y 0 1 X 1 k X k Y , X1 , , X k Continuas
1
Si tenemos Q AK L 2 podemos
a) ln Q 0 1 ln K 2 ln L Suponiendo empresas en A
b) ln Q 0 1 ln K 2 ln L Suponiendo empresas en Ac
2. Utilizar variables dicotmicas
0 en otro caso
D w
1 si w A
Las variables dicotmicas pueden ser incorporadas de dos maneras:
ln Q 0 1 ln K 2 ln L D
Si D 0 ln Q 0 1 ln K 2 ln L
Si D 1 ln Q 0 1 ln K 2 ln L
ln Q 0 1 ln K 2 ln L D ln L
Si D 0 ln Q 0 1 ln K 2 ln L
Si D 1 ln Q 0 1 ln K 2 ln L
El nico caso en que se puede dar una interpretacin al parmetro asociado a una variable
dicotmica es en un modelo del tipo:
ln Y 0 1 D 2 X
26
1 si w A
D w
0 si w Ac
e 1 % : Cambio relativo en la media de Y para D=1 c/r a D=0.
1
27
MULTICOLINEALIDAD
1. Efectos de la multicolinealidad
Consideremos el modelo: Yi 0 1 X 1i 2 X 2i i 1 i n
Entonces:
V 1
S 2
X 1i X 1 1 rX21X 2
i
V 2
S 2
X 2i X 2 1 rX21X 2
i
COV 1 , 2 S 2 rX 1 X 2
1 r X
2
X1 X 2 1i X1
2
X 2i X2
2
i i
Ntese que: r 2
X1 X 2
1 V 1 V 2
De aqu, se puede observar que una alta correlacin entre las variables exgenas del modelo,
implica un crecimiento en la varianza (error de estimacin) de los EMCO asociados a dichas
variables.
2. Diagnstico de la multicolinealidad
X i , X j
ii) significativamente alta para algn 1 i j k .
R 2j : X j 0 1 X 1 j 1 X j 1 j 1 X j 1 k X k
1 1
2.2.Factor de Inflacin de la Varianza: FIV j
1 Rj
2
TOL j
Se considera sntoma de multicolinealidad grave:
K
mximo valor propio de X t X
1
IC K
mnimo valor propio de X X t 1
Multicolinealidad grave : IC 30
Multicolinealidad moderada : 10 IC 30
Rk2 : Y 0 1 X 1 k 1 X k 1 k X k
Rk21 : Y 0 1 X 1 k 1 X k 1
Rk2 Rk21 SCM 0 , , k SCM 0 , , k 1
2
t k
r 2
SCE 0 , , k 1
YX k / X 1 X k 1
1 Rk21 t 2k n k 1
2
En que t k es la estadstica pivote para la prueba de hiptesis 0 : k 0
29
TEST DE HETEROCEDASTICIDAD
Yi 0 1 X 1i k X ki i
2. TEST DE PARK
Yi 0 1 X 1i k X ki i V i i2
H 0 : i2 2 X ji ei
ln i2 ln 2 ln X ji i
ln i2 ln X ji i
H0 : 0 t
S
Si es significativo no se rechaza H o
3. TEST DE GLEJSER
Yi 0 1 X 1i k X ki i V i i2
H 0 : i X ji i 1 j k
H0 : i X ji i 1 j k
30
i X ji i
i X ji i
y se prueba la hiptesis H 0 : 0
t
S
Yi 0 1 X 1i k X ki i V i i2
k
i2 0 i X j i st X s i X t i i R2
j 1 s t
i2 i2
H o : 1 0 1 i k , st 0 1 s, t k Hiptesis de homocedasticidad
c2 n R2 (2g )
El mtodo de los mnimos cuadrados ponderados es capaz de producir estimadores que sean
eficientes.
Si se considera
Suponer que las varianzas homocedsticas i son conocidas. Divdase a ambos lados por i y
2
se obtiene
Yi X X
0 oi 1 i i
i i i i
2
var *
i E
* 2
i E i
i
1
E i2 puesto que 2 es conocida
i2
1
2 i2 puesto que E i2 i2
i
=1
Es decir, la varianza del trmino perturbacin es ahora homocedstica. Si se conservan los otros
supuestos el hallazgo de que * es homocedstico sugiere que si se aplica MMCO al modelo
transformado se producirn estimadores eficientes
2
Supuesto 1: La varianza del error es proporcional a X i :
E i2 2 X i2
Yi 0 1
1 i 0 1 vi
Xi Xi Xi Xi
i
donde v i es el trmino de perturbacin transformado, igual a ahora es fcil de verificar que
Xi
32
2
E v E i 2 E i2 2
2 1
i
Xi Xi
E i2 2 X i2
Yi 0 1
1 X i i 0 1 X i vi
Xi Xi Xi Xi
i
Donde v i y donde X i 0
Xi
Supuesto 3: La varianza del error es proporcional al cuadrado del valor medio de es proporcional
al cuadrado del valor medio de Y
E u i2 2 E Yi
2
Ahora,
E Yi 0 1 X i
Yi Xi 1 Xi
0 1 i 0 1 i
E Yi E Yi E Yi E Yi Yi Yi
i
Donde vi
E Yi
, puede verse que
E vi2 2 , es decir, las perturbaciones vi son
homocedsticas.
33
AUTOCORRELACION RESIDUAL
Yt 0 1 X 1t k X kt t , t: tiempo 1 t T
Supongamos: t 0 , V t 2 , t
2 1 2 1 T
2 1 2 2 T
V 2 n
2
T 1 T 2
Cov i , j i j i j i j
V X t X 1
Xt XX t
X 1
X t X X t Y
1
Si EMCO
Sup. que H 0 : 1 t , t 1 0 es falsa
Es decir, hay un problema de autocorrelacin residual de orden 1
Como t t 1 0 0
t t 1 t
t t t 1 es un ruido blanco
Si aplicamos MMCO:
T
t t 1 t t 1 y
t 2
T T
t 1 t
t 2
t 2
2
t 1
34
t 1 t
S t 1 , t
t 2
T
S 2t 1
t21
t 2
pero: S 2t 1 S 2t
S t 1 t
1 t 1 , t
S t 1 * S t
t 1 t 1 t es un ruido blanco
Yt 0 1 X 1t k X kt t V t 2 t 0
t 1 t 1 t
Yt 1 0 1 X 1t 1 k X kt 1 t 1
Yt 1Yt 1 0 1 1 1 X 1t 1 X 1t 1 k X kt 1 X kt 1 t 1 t 1
ESTIMACIN DE 1
Sea Yt 0 1 X 1t k X k t t
donde : Yt Yt 1Yt 1 , X it X it 1 X it 1 , 1 i k
* *
Yt 0 1 1 1Yt 1 1 X 1t ....... k X k t t
Observacin:
DW 21 1
DW 2 2 1
2 1 2 DW
2 DW
1
2
Esto produce un estimador de 1 que slo es consistente
Yt 0 1 X 1t k X kt t
tal que t 0 , V t 1 t T
2
pero : t t m 0 m
t t m t t m
m t , t m
t t m 2
2 1 2 1 3 1 n
2 2 3 2 n
V 2 1
2
n 1 n 2 n 3
1 1 2 n 1
2
1 1 1 n2
V
n2 n 3 1
n 1
36
1 1 0 0 0
1 1 1 0 0
2
V 0 1 1 1 0
1
0 0 0 0 1
t t 1
2
H 0 : 1 0 DW t 2
T
21 1
t 1
t
2
La gran ventaja del test de D-W es que est basado en los residuos estimados, los cuales se
obtienen directamente del Anlisis de Regresin. Por tanto, en los sofware Estadsticos que poseen
un mdulo de Regresin se incluye directamente en el primer informe emitido, el clculo de la
estadstica D.
1. El modelo bajo anlisis debe incluir el trmino de intercepto. Aunque el modelo no pase por
el origen la SCE se debe obtener a partir de un modelo que contenga el trmino de
intercepto.
La prueba de las Rachas o de Geary es un test no paramtrico que permite probar la hiptesis:
Contra la alternativa
Debera haber muchas rachas, porque eso significara que t cambia frecuentemente de signo. Si
hay pocas rachas esto puede sugerir que los residuos t estn autocorrelacionados.
Notacin:
n = Nmero total de observaciones= n1 n 2
n1 = Nmero de signos +
n 2 = Nmero de signos
k = Nmero de rachas
(2) n1 10 y n2 10
2 n1 n 2 2 n1 n 2 n1 n 2
k2
n1 n2 n
2
1 n 2 1
38
Entonces:
k k
Zc ~ N 0,1
k
Observacin:
Por ejemplo, supongamos que los signos de los residuos estimados t se presentan de la
siguiente manera:
(++)(---)(+)(-------)(++)
Entonces: n = 20
n1 = 7
n 2 = 13
k =7
La ventaja de esta prueba es que es aplicable an cuando el modelo tenga valores rezagados de la
variable endgena, Yt , como variables predeterminadas, Yt 1 ; es decir, el test es aplicable a
modelos autorregresivos.
n p R2 2p
2
En que R es el coeficiente de determinacin que se obtiene al regresionar el modelo:
39
t 1 t 1 2 t 2 ........ p t p t , R2
Observacin:
t t 1t 1 ...... 2 t 2 ....... p t p
H 0 : 1 0
(3) El valor de p en el test de B-G, no se puede especificar a priori. Hay que experimentar.
PRUEBA ASINTOTICA
n 1 N 0,1
Para construir una estadstica que permita probar esta hiptesis se procede de la siguiente
manera.
Yt 0 1 X 1t ..... k X kt t , 1 t n
Yt Yt 1 1 X 1t X 1t 1 ...... k X kt X kt 1 t , 2 t n
40
n
Se determina: SCE t t
2
t 2
SCE t
Se propone, entonces el siguiente estadstico de prueba: g
SCE t
Cuando 0 0 en el modelo original, entonces los valores crticos para g se pueden obtener de
la tabla de D-W.