Professional Documents
Culture Documents
Econometra
Curso 2011-2012. Primera parte
Esquemas de teora
Profesores:
Jess Cavero lvarez
Helena Corrales Herrero
Yolanda Gonzlez Gonzlez
Carmen Lorenzo Lago
Mercedes Prieto Alaiz
Pilar Zarzosa Espina
Material Docente de Econometra
Primera parte
Curso 2011-2012
Introduccin............................................................................................... 1
Tema 1.- El modelo de regresin lineal clsico I ..................................... 5
Tema 2.- El modelo de regresin lineal clsico II ................................... 17
Tema 3.- Prediccin .................................................................................. 21
Tema 4.- Variables ficticias ...................................................................... 25
Tema 5.- Errores de especificacin ........................................................... 31
Tema 6.- Multicolinealidad ..................................................................... 41
Anexo ........................................................................................................ 47
Econometra Curso 2011-2012
INTRODUCCIN
Concepto de Econometra
1
Econometra Curso 2011-2012
2
Econometra Curso 2011-2012
3er criterio: atendiendo al periodo de tiempo al que estn referidas las variables
Modelos estticos: estn especificados para un momento de tiempo determinado.
Ejemplo: Ct = + Rt+ t
Modelos dinmicos: en ellos aparece alguna variable retardada. Ejemplo: Ct =
0 + 1Rt + 2Ct-1 + t
Para que el modelo economtrico sea operativo necesitamos conocer los valores
numricos de sus parmetros y para ello hemos de disponer de un conjunto de datos sobre
las variables.
Los datos pueden ser de tres tipos: datos temporales, datos de corte transversal y
datos de panel.
Datos temporales o series temporales: son observaciones de una variable, para
una unidad econmica a lo largo del tiempo. Ejemplos: datos de la Contabilidad
Nacional, indicadores de coyuntura mensuales o trimestrales, ventas de una
empresa a lo largo del tiempo, etc.
Datos atemporales o de corte transversal: son observaciones de una variable,
para distintas unidades econmicas en un momento de tiempo dado. Ejemplo:
Encuesta de Presupuestos Familiares (INE) en el perodo 90-91, en la que se ha
entrevistado a ms de 20.000 familias.
Datos de panel: son observaciones de una variable para distintas unidades
econmicas a lo largo del tiempo, es decir, es la combinacin de datos
temporales y de corte transversal.
3
Econometra Curso 2011-2012
4
Econometra Curso 2011-2012
Yi = X i' + i
Forma matricial: Y = X +
Y1 1 X 11 . . X k1 1
Y2 1 X 12 . . X k2 2
Donde:Y= . , X= . . . . . , = .
. . . . . . .
Y 1 X . . X kN
N 1N N
Hiptesis Clsicas:
Linealidad en los parmetros
N (0, 2 I ) o Y N (X , 2 I ) por tanto o Y son variables iid
X no aleatoria
rg(X) = k+1 < N
e' e = Y ' Y Y ' X ' X ' Y + ' X ' X = Y ' Y 2Y ' X + ' X ' X
Condiciones de mnimo:
e' e
1 Condicin : =0
2 e' e
2 Condicin : sea definida positiva
'
Obtencin del estimador MCO:
e' e
= 2 X ' Y + 2 X ' X = 0 X ' X = X ' Y Sistema de ecuaciones normales
= ( X ' X )1 X ' Y
5
Econometra Curso 2011-2012
2 e' e
= 2 X ' X matriz definida positiva
'
Finitas
- Lineal en Y y en : por ser X no aleatoria
- ()
Insesgado: E = por ser X no aleatoria y E ( ) = 0
()
E = + ( X ' X ) X ' E ( )
1
( )( '
( )) '
= E E ( ) E = E =( )( )
= E(X ' X ) X ' ' X (X ' X ) = 2 (X ' X )
1 1 1
( )
1
X ' X
- Asintticamente normal : N
a
N 0, lim N
2
N
- Asintticamente eficiente : La varianza asinttica alcanza la cota de Cramer-Rao.
6
Econometra Curso 2011-2012
1
S = S 2 (X ' X )
1
- Insesgado : E S = E S 2 ( X ' X ) =
Poblacionales: e=M
Ya que: e = Y Y = Y X = MY = M
Y = X
1
M = I X ( X ' X ) X ' matriz no aleatoria, simtrica e idempotente
- E(e)=0
ee' = Eee' = E (M ' M ') = M I
2 2
- si N MI
- E ( X ' e) = 0
- (
e N 0 , 2 M )
Muestrales:
- X 'e = 0
( )
X Y Y = X ' Y X ' Y Y = Y si XNx(k+1)
N
e = 0 e=0 si XNx(k+1)
i =1 i
X ji ei = 0 j = 1....k cov(e, Xj)=0 rex j = 0
7
Econometra Curso 2011-2012
(
Yi Y ) 2
= Yi 2 N Y
2
( )(
Yi = Y ' Y = Y + e ' Y + e = Y ' Y + e' e
2
)
2
Restando a ambos lados : N Y
(
Yi Y )
2
( )
2
= Yi Y + ei e ( )
2
si Y = Y
SCT=SCE+SCR
Coeficientes de determinacin R2 y de determinacin ajustado
SCR SCE
R2 = 1 = 0 R 2 1
SCT SCT
2 SCR / N k 1
R = 1
SCT / N 1
ln L , 2 = N ln (2 ) N ln 2 1 (Y X )' (Y X )
2 2 2 2
Condiciones de mximo:
1 condicin: Se igualan a cero las primeras derivadas
ln L
=
1
( 2 X 'Y + 2 X ' X ) = 0 X ' Y = X ' X MV
2 2
MV
MV
8
Econometra Curso 2011-2012
ln L N 2(Y X ) ' (Y X )
= + MV MV
=0
2
2 2
2 (
2 2
) 2
MV MV
MV
2
= e' e
N
ln L , 2 = N ln (2 ) N ln 2 1
2 2
(Y X )(' Y X )
2 2
MV MV MV
MV
ln L , 2 = N ln (2 ) N ln
ei2 N
2 2 N 2
No est acotado y est influido por el nmero de variables explicativas que introduzcamos
en el modelo.
2) Criterio de Akaike AIC y Criterio de informacin bayesiano de Schwartz SBIC
2 2(k + 1)
AIC = ln L +
N N
2 (k + 1) ln N
SBIC = ln L +
N N
Cuanto menor sean estos estadsticos mejor ser la estimacin del modelo.
9
Econometra Curso 2011-2012
En el primer modelo, 1 mide en cunto vara la variable endgena cuando vara X1 en una
unidad, manteniendo constante el resto de las variables. En el segundo modelo, 1* mide en
cunto vara la variable endgena cuando vara X1 en una unidad
La informacin que proporciona un regresor, por ejemplo X1, sobre la variable endgena
puede ser parecida a la que tienen el resto de las variables. De hecho, la informacin de X1
puede ser genuina de la propia variable o compartida con el resto de las variables
explicativas. Cuando estimamos por mnimos cuadrados ordinarios un modelo de regresin
simple el estimador asociado a X1 solamente recoge el efecto de la informacin propia de
X1, ya que no estn incluidos otros regresores. La importancia de la regresin mltiple es
que el estimador por mnimos cuadrados ordinarios asociado a X1 es capaz de medir el
efecto de X1 una vez descontada la informacin que comparte con el resto de los
regresores.
Existen dos casos especiales en los que el coeficiente estimado por MCO asociado a X1
ser el mismo en la regresin simple que en la regresin conjunta.
1) Cuando no exista informacin compartida (regresores ortogonales)
2) Cuando los coeficientes asociados al resto de los regresores sean cero.
10
Econometra Curso 2011-2012
11
Econometra Curso 2011-2012
MCO
*
= ( X *' X * ) 1 X *' Y tiene buenas propiedades y no hay ningn problema por lo que
respecta a las propiedades de los estimadores, pero se dejan de cumplir algunas
caractersticas que se daban en el modelo con trmino constante.
e' e
S = S2( X *' X * )-1 donde S 2 =
N k
1
N 2 N N
N
X 1i X 1i X 2i L X 1i X ki X 1i Yi
1
*
N i =1 i =1 i =1 iN=1
X X L X 2i X ki X Y *
N N
MCO
*
=i =1
2i 1i X 22i
i =1 i =1
i =1
2i i =
2
M M M M M M
N N N N *
X ki X 1i X ki X 2i L ki X 2
X ki Yi k
i =1 i =1 i =1 i =1
Particularidades de estos modelos:
1) Los estimadores obtenidos con datos centrados no coinciden con los obtenidos con
datos sin centrar ya que si trabajamos con datos centrados en un modelo sin trmino
constante obtenemos los mismos estimadores que si trabajsemos con datos centrados en el
modelo con trmino constante. Lo ms correcto en estos modelos es trabajar con datos sin
centrar.
3) Aunque se sigue cumpliendo que los regresores son ortogonales a los residuos X *' e = 0,
ya no se cumple que los errores estn linealmente incorrelacionados porque no se cumple
que ei = 0 .
4) No se cumple la descomposicin de la varianza y por lo tanto el R2 no tiene sentido
porque nunca estara acotado SCT SCR+SCE
S se sigue cumpliendo YY = Y Y + ee
12
Econometra Curso 2011-2012
e' e Y ' Y
En este caso lo nico que se puede hacer es definir un R*2 como: R*2 = 1 = que
Y' Y Y' Y
s estar acotado, pero que en realidad no medir la variabilidad de Y porque YY no es la
SCT, simplemente nos dar una idea de como ha sido el ajuste. El R2 de un modelo con
trmino constante y el R*2 del modelo sin trmino constante no son comparables.
En ocasiones nos interesa cambiar las unidades de una, varias o todas las variables del
modelo para hacer sus valores numricos comparables con las dems variables o para que
su manejo sea menos engorroso.
Otras veces necesitamos hacer un cambio de origen en los valores de las variables.
Analizaremos, a continuacin, los efectos que, sobre la estimacin de un modelo, generan
esos cambios.
Cambio de escala
Sea el modelo: Yi = 0 +1X1i +2X2i +3X3i +..+kXki +i con i=1,2,3,....N
Supongamos que hacemos un cambio de escala en todas las variables pasando a tener:
Yi ' = aYi
X 1'i = a1 X 1i
................
X ki' = a k X ki
Ahora el modelo ser: Yi' = 0' + 1' X 1' i + ... + k' X ki' + i
0' a1 a
Yi = + 1' X 1i + ... + k' k X ki + i
a a a a
i
donde cumple las hiptesis clsicas.
a
0'
Luego o = 0' = a 0
a
1' a1 a
1 = 1' = 1
a a1
.........................................
k' a k a
k = 1' = k
a ak
Estos son los cambios que experimentan los coeficientes cuando hacemos un cambio de
escala en todas las variables.
Por lo tanto:
13
Econometra Curso 2011-2012
S 2** = a 2 S 2
0 0
Cambio de origen
Sea el modelo: Yi = 0 +1X1i +2X2i +3X3i +..+KXKi +i con i=1,2,3,....N
Supongamos que hacemos un cambio de origen en todas las variables pasando a tener:
Yi ' = Yi + a
X 1'i = X 1i + a1
................
X ki' = X ki + a k
Ahora el modelo ser: Yi' = 0' + 1' X 1' i + ... + k' X ki' + i
1' = 1
...................
k' = k
0 = a + 0' + 1' a1 + ... + k' a k 0 = a + 0' + 1 a1 + ... + k a k
0' = 0 + a 1 a1 ... k a k
Luego los cambios de origen en alguna o en todas las variables del modelo slo afectan al
trmino independiente.
El nico resultado que tambin cambia es la varianza estimada de 0 .
14
Econometra Curso 2011-2012
Los parmetros estimados de un modelo lineal son valores absolutos y dependen de las
unidades de medida en las que se expresen las variables del modelo.
Una variable no es ms importante que otra por tener un parmetro mayor. Esto ocurre
cuando, siendo ambos parmetros significativos, ambas variables estn medidas en las
mismas unidades.
Una solucin a este problema es calcular unos coeficientes estandarizados o coeficientes
beta a partir de la normalizacin de las variables (restarles su media y dividirles por su
desviacin tpica)
Yi Y X X1 X Xk
= 1* 1i + ... + k* ki + ui
SY S X1 S Xk
donde la relacin entre los coeficientes beta y los coeficientes estimados originales es:
SXj
*j = j .
SY
1
Pulido (2001): Modelos economtricos. Pirmide.
15
Econometra Curso 2011-2012
16
Econometra Curso 2011-2012
Hiptesis a contrastar:
H o : R = r
H 1 : R r
R (
N R , 2 R ( X ' X ) R '
1
)
A partir de aqu, se demuestra que, si la hiptesis nula es cierta:
e' r e r e ' e
FNHk 1
S2 H
Donde er = Y Xr
Ho : j = 0
H1 : j 0
j
Ho
t N k 1
S
j
17
Econometra Curso 2011-2012
1 0
Ho : =
0
k
H1 :
SCE R 2 ( N k 1)
Ho
FNk k 1
Ho
FNk k 1
S2 k
o bien
(1 R2 k)
Sea la restriccin lineal sobre los parmetros: R=r. Intentaremos encontrar el estimador
del vector paramtrico que satisfaga la restriccin. En definitiva, vamos a elegir r de
forma que minimice
Para obtener dicho estimador restringido habra que formar la funcin lagrangiana. El
proceso de minimizacin da como resultado el estimador restringido siguiente:
[ ]
r = + ( X ' X ) 1 R ' R ( X ' X ) 1 R '
1
(r R )
Ejemplo:
Yt = 0 + 1 X 1t + 2 X 2 t + t
18
Econometra Curso 2011-2012
5,4118
= 0,4471 ;
- 0,2672
1
326 94.5
[ 1
R ( X ' X ) R ' = ]
0.0235 0.0706
1
=
0.0706 0.2435 94.5 31.5
5.4118
0.5 0 1 0 0.5 0.4471 0.0529
(r R ) =
0.4471 = =
0 0 1 2 - 0.2672 0 0.0874 0.0874
19
Econometra Curso 2011-2012
5
r = 0.5
- 0.25
Los residuos restringidos se pueden obtener a partir del modelo original con los
estimadores restingidos o a travs del modelo restringido:
Y Y er Y* Y * er
3 3,5=5+0.5*1-0.25*8 -0,5=3-3.5 4,5=3-0.5*1+0.25*8 5 -0,5
2 2,5=5+0.5*2-0.25*14 -0,5=2-2.5 4,5=2-0.5*2+0.25*14 5 -0,5
4 3,5 0,5 5,5 5 0,5
5 4,25 0,75 5,75 5 0,75
5 5,25 -0,25 4,75 5 -0,25
7 6 1 6 5 1
6 5,5 0,5 5,5 5 0,5
8 8,5 -0,5 4,5 5 -0,5
8 8,75 -0,75 4,25 5 -0,75
12 12,25 -0,25 4,75 5 -0,25
Las propiedades del estimador restringido dependen de si la restriccin es cierta o no. As,
el siguiente cuadro enumera las propiedades en ambos casos.
20
Econometra Curso 2011-2012
3.1.- Prediccin
Punto de partida:
( ) ( ) ( ) (
Donde: E p = 0 , Var p = 2 , Cov j p = E j p = 0 j = 1....N )
Definimos:
Predictor: Yp = X p un estimador del valor a predecir.
Error de prediccin: f diferencia entre el predictor y lo que queremos predecir.
f es una variable aleatoria con media cero E ( f ) = 0 y varianza: 2f = E ( f E ( f ) )
2
S 2f = S 2 (1 + X 'p ( X ' X ) X p )
1
21
Econometra Curso 2011-2012
f (
N 0 , 2f )
S2 N2 k 1
N (0,1)
f
f 2 N k 1
N (0,1)
como = t N k 1
N2 k 1
N k 1
f
tenemos: t N k 1
Sf
donde :
f = Yp Y p y S f = S 1 + X 'p ( X ' X )1 X p
[
Por tanto, el I. C. de Yp vendr dado por: Yp t / 2 S f ]
Test de Hiptesis para la prediccin de un valor individual:
H o : Y p = Y po
H1 : Y p Ypo
- Yo
Y Ho
t N k 1
p p
Si la Ho es cierta:
Sf
22
Econometra Curso 2011-2012
n
fj
j =1
Error absoluto medio: EAM =
n
1 n fj
Error absoluto medio del porcentaje de error: EAMP =
n j =1 Y j
Coeficiente de desigualdad de Theil:
(Y j Y j ) / n
n 2
j =1
U = 0U1
n n
Y j / n + Y j / n
2 2
j =1 j =1
Todos los estadsticos descritos hasta ahora indican una mejor capacidad predictiva
del modelo cuanto ms cercanos a cero sean, lo que permite comparar un determinado
modelo con otros alternativos.
1 n
Y
n j =1 j
Y =
j
2
(1
Y Y )
23
2
+ (1
S S )
23
Y Y
2
+ (
2 1 rY Y S Y S Y
1442443
)
componente sesgo componente var ianza componente cov arianza
El cociente entre cada uno de los componentes en la suma total se denomina
proporcin del sesgo, proporcin de la varianza y proporcin de la covarianza.
Cada una de estas proporciones vara entre cero y uno, siendo su suma la unidad
como es de esperar. Los dos primeros miden, respectivamente, las diferencias entre la
media y la varianza de la serie predicha ( Y$ ) y las de la serie observada (Y) en el periodo de
prediccin. Por tanto, lo deseable es que su valor sea pequeo. La ltima proporcin mide
la parte residual o no sistemtica de los errores de prediccin, en donde debera recaer la
mayor parte del error total cometido.
23
Econometra Curso 2011-2012
24
Econometra Curso 2011-2012
1.- Introduccin
Las variables que hemos introducido como regresores en los temas precedentes son
variables de tipo cuantitativo. Sin embargo, en ocasiones existen factores de tipo cualitativo
que pueden ser relevantes para explicar el comportamiento de la variable endgena.
La inclusin de estos factores en un modelo economtrico se realiza a partir de la
construccin de lo que se conoce como variables ficticias, variables dicotmicas o variables
dummy que toman dos valores arbitrarios, normalmente 1 y 0, que corresponden a las
modalidades del factor, aunque no necesariamente ya que podrn tomar otros valores o ms
de dos.
Pueden utilizarse para recoger:
Efectos temporales:
Efectos espaciales:
Efectos de tipo puramente cualitativo.
Otro tipo de efectos: efectos estacionales, funciones escalonadas, etc
Ejemplo: Queremos explicar el salario de los empleados de varias empresas (Yi) en
funcin del nmero de aos de experiencia laboral (Xi) y del gnero (factor cualitativo con
dos modalidades: hombre/mujer).
0 hom bre
Di =
1 mujer
Yi=1 +Xi+i
Yi=2 +Xi+i
las dos ecuaciones se pueden expresar en una sola por medio de una variable ficticia:
Yi= 1 + Xi +Di +i
1 Yi = ( + ) + X i + i
1123
donde cuando Di =
2
0 Y = + X +
i 1 i i
1+ = 2 = 2-1
25
Econometra Curso 2011-2012
El coeficiente de la variable ficticia nos mide el efecto diferencial entre las dos
ordenadas en el origen, es decir, el efecto diferencial del valor esperado de la variable
dependiente por presentar una de las caractersticas del factor cualitativo respecto al hecho
de no presentarla.
1 Z i = X i
donde cuando Di =
0 Z i = 0
1 Yi = + ( 1
1 + ) X i + i
23
por tanto cuando Di =
0 Y = + X +
2
i 1 i i
1+ = 2 = 2-1
El coeficiente de la variable ficticia nos mide el efecto diferencial entre las
pendientes en los dos grupos, es decir, la diferencia de la influencia de la variable
explicativa sobre la variable endgena por presentar una caracterstica respecto de no
presentarla.
3.- Que afecte a ambas (ordenada y pendiente)
Si tenemos dos modelos con diferente ordenada en el origen y diferente pendiente:
Yi=1 +1Xi+i
Yi=2 +2Xi+i
las dos ecuaciones se pueden expresar en una sola por medio de una variable ficticia de la
forma:
Yi= 1 +1 Xi +Di+ X i Di +i
123
Zi
1 Yi = ( + ) + ( 1 + ) X i + i
1123 123
donde cuando Di = 2 2
0 Yi = 1 + 1 X i + i
26
Econometra Curso 2011-2012
k
Yi =1 +Di + j X ji +i
j =1
27
Econometra Curso 2011-2012
29
Econometra Curso 2011-2012
30
Econometra Curso 2011-2012
1.-Formulacin de la ecuacin
31
Econometra Curso 2011-2012
Hay que tener en cuenta que hay varios tipos de modelos no lineales. Algunos
pueden ser tratados con las tcnicas vistas hasta ahora realizando algunas transformaciones
y teniendo en cuenta algunas diferencias2.
2
Ver el apndice 1 de este tema. Si las variables estn todas en logaritmos, los parmetros miden
elasticidades. En general, la elasticidad de Y respecto a X recoge la variacin porcentual de Y ante una
Y X
variacin porcentual de X: E=
X Y
3
Basado en Carrascal, U. y otros (2001). Anlisis economtrico con Eviews. Ed. RAMA.
32
Econometra Curso 2011-2012
Nota 1: Es necesario que las observaciones de ambas submuestras sean suficientes para
estimar los modelos, es decir, N1>k+1 y N2>k+1. No obstante, el contraste se puede hacer
aunque en una de las dos muestras no haya suficientes grados de libertad, asignando cero a
la SCR correspondiente a esa muestra (Johnston, 1989, pg. 264 y ss.)
Nota 2: Una forma alternativa de llevar a cabo este contraste de Chow es mediante la
incorporacin de variables ficticias que recojan el cambio en los coeficientes del modelo.
33
Econometra Curso 2011-2012
1500000 1.1
1000000 1.0
500000 0.9
0 0.8
-500000 0.7
-1000000 0.6
75 80 85 90 95 75 80 85 90 95
Rec ursiv e C(1) Estimates 2 S.E. Rec urs iv e C(2) Estimates 2 S.E.
12000000 1200
10000000
800
8000000
6000000 400
4000000
0
2000000
0 -400
75 80 85 90 95 75 80 85 90 95
Rec ursiv e C(3) Estimates 2 S.E. Rec urs iv e C(4) Estimates 2 S.E.
600000
400000
200000
-200000
-400000
70 75 80 85 90 95
34
Econometra Curso 2011-2012
Supongamos ahora, que por error, incluimos en la parte sistemtica del modelo una
serie de variables que no son significativas. Es decir:
Modelo correctamente especificado: [1] Y=X11+
Modelo estimado (con inclusin): [2] Y=X11+ X22+
En este caso se estima un modelo donde no se incluye la restriccin cierta 2 = 0.
Los estimadores del modelo estimado seguirn siendo ELIO y consistentes y tambin lo
ser S2. El problema, por tanto, no est en las propiedades de los estimadores sino en su
eficiencia comparada con los estimadores del modelo correctamente especificado. Como ya
sabemos, el estimador mnimo cuadrtico restringido tiene siempre varianza ms pequea
que el mnimo cuadrtico ordinario sin restringir y, por lo tanto, en este caso ser ms
eficiente. Adems, los test de hiptesis son vlidos y el predictor es un estimador insesgado
del valor medio.
La deteccin de error de omisin o de inclusin consiste en aplicar los criterios de seleccin
del modelo adecuado.
35
Econometra Curso 2011-2012
Asimetra Kurtosis
N N
ei3 / N ei4 / N
g1 = i =1
3/ 2
g2 = i =1
2
N
N
ei / N ei / N
2 2
i =1 i =1
36
Econometra Curso 2011-2012
d JB =
N k 1 2 1
6 4
( )2
g1 + g 2 3 2
2
TABLA RESUMEN
Error de especificacin cmo detectarlo?
1. Formulacin del modelo
a) Forma funcional Test RESET de Ramsey
b) Forma estructural * Test de Chow
Cambio/permanencia * Estimacin recursiva
En general, el test RESET de Ramsey puede
2. Especificacin de la matriz de regresores detectar cualquier tipo de error de
especificacin en un modelo
a)Omisin de variable relevante *E-views (test Wald de omisin de v.
relevante)
b)Inclusin de variable irrelevante *E-views (test Wald de inclusin de v.
irrelevante)
c)Rango de la matriz X (Multicolinealidad) *Indicios de multicolinealidad (tema 6)
d) X no estocstica
3. Hiptesis sobre las perturbaciones
37
Econometra Curso 2011-2012
38
Econometra Curso 2011-2012
Recprocos Yt = 0 + 11 / X 1t + t 11 / X 2 11 / XY (*)
(*) Indica que el coeficiente de la pendiente vara dependiendo del valor asumido para X, Y o ambas.
Cuando no se especifica ningn valor de X o Y, las elasticidades suelen medirse en los valores medios de
las variables.
Fuente: Gujarati (2006): Principios de Econometra, pg. 275.
4
La elasticidad de Y respecto a X recoge la variacin porcentual de Y ante una variacin porcentual de X,
Y X
E= .
X Y
39
Econometra Curso 2011-2012
40
Econometra Curso 2011-2012
TEMA 6: MULTICOLINEALIDAD
Una cuestin importante que debe analizarse al estudiar los resultados de un modelo
de regresin es el grado de relacin lineal existente entre las observaciones de las variables
explicativas, siendo tres las situaciones posibles con las que nos podemos encontrar.
Ortogonalidad: supone la ausencia de relacin lineal entre algunos o todos los
regresores incluidos en el modelo, es decir, implica incorrelacin entre los regresores.
Multicolinealidad perfecta: se da cuando existe una relacin lineal exacta entre
algunos o todos los regresores incluidos en el modelo.
Multicolinealidad imperfecta: consiste en la existencia de una relacin lineal fuerte
entre los regresores del modelo.
A continuacin vamos a analizar las consecuencias de estas tres situaciones
centrndonos sobre todo en la multicolinealidad imperfecta que es la situacin ms
frecuente.
Ortogonalidad : Se dice que dos regresores son ortogonales cuando estn linealmente
incorrelacionados, es decir, cuando su coeficiente de correlacin lineal, o su covarianza es
cero. As, Xh y Xj son ortogonales si rxh x j = 0 .
Dos grupos de regresores son ortogonales si X 1' X 2 = 0 , lo que significa que cada
regresor del primer bloque est incorrelacionado con cada regresor del segundo bloque.
Particularidades del modelo con regresores ortogonales:
Sea el modelo particionado: Y = X 1 1 + X 2 2 +
Los EMCO de los parmetros de este modelo coinciden con los que obtendramos
efectuando la regresin individual de Y sobre cada uno de los bloques:
Los estimadores de los parmetros del modelo particionado en la regresin
Y
R
X 1 X 2 son:
( )
1 1 1
1 X 1' X 1 X 1' X 2 X 1'Y X 1' X 1 0 X 1'Y X 1' X 1 X 1'Y
= = '
' = ' =
2 X 2 X1
X 2' X 2 X Y 0
2 X 2' X 2 X Y X'X
2 2 2 ( )
1
X 2' Y
Y
R
X1 Y = X 1 1 + u (
b1 = X 1' X 1 ) 1
X 1'Y
Y
R
X2 Y = X 22 + v (
b2 = X 2' X 2 ) 1
X 2' Y
Por lo tanto, se obtienen los mismos resultados.
Sin embargo, si los regresores no son ortogonales, no se obtienen los mismos
resultados, sino que en la regresin conjunta, cada uno de los dos estimadores
depende de toda la matriz X, por tanto de X1 y de X2, debido a que X 1' X 2 0
41
Econometra Curso 2011-2012
Las varianzas de los estimadores tambin coinciden con las calculadas al hacer las
regresiones individuales pero no los estimadores de esas varianzas:
1 1
X 1' X 1 0 2 X1X1
'
0 e'e
0
= 2
X 2' X 2
, S
= S
0
X 2' X 2
siendo S 2
=
N K 1
Haciendo las regresiones individuales:
b1b1
(
= 2 X 1' X 1 )
1
b2b2
(
= 2 X 2' X 2 ) 1
S b1b1 = S1 X X 1
2
( '
1 )
1
siendo S1
2
=
u ' u
N K1 1
2
(
S b2b2 = S 2 X 2' X 2 )
1
siendo S2 =
2 v ' v
N K2 1
42
Econometra Curso 2011-2012
1) Dificultad para interpretar los coeficientes, y por tanto, sus estimaciones. Los
coeficientes de regresin ( j ) se interpretan como el cambio que se produce en Yi
al variar Xji en una unidad, permaneciendo el resto de variables explicativas
constantes. Cuando existe multicolinealidad imperfecta carece de sentido suponer
que, cuando una variable explicativa se modifica, el resto de las variables
permanecen constantes, al existir altas correlaciones entre ellas. Por este motivo, los
parmetros pierden este significado y, por lo tanto, tambin sus estimaciones.
2) La multicolinealidad afecta a la precisin de los estimadores ya que sus varianzas
toman valores grandes. Se puede ver, por un lado, a partir del determinante de XX,
que es relativamente pequeo y, por otro, analizando la varianza de un estimador de
la siguiente manera: Planteamos un modelo particionado en el que el 2 bloque est
formado por un nico regresor: Y = X 1 1 + X 2 2 +
2
En ese caso: Var 2 =
(1 R 2
X 2 X1 )N S 2
X2
S2
S 2 =
Y su estimador:
2
(1 R 2
X 2 X1 )N S 2
X2
Las varianzas de los estimadores pueden ser grandes como consecuencia de:
Valores grandes del S2
Fuerte correlacin entre X2 y X1 : valores grandes de R X2 2 X1
43
Econometra Curso 2011-2012
La simple lgica permite, algunas veces, saber si existe o no una relacin causal entre
ellas. Por ejemplo, si dos variables explicativas son la poblacin y el empleo, el
presupuesto nacional y el PNB, etc.
Grandes varianzas. Indicio poco fiable por s solo.
Altos coeficientes de correlacin lineal. Si el modelo tiene 2 regresores este coeficiente
es un buen indicio pero si tiene ms de dos regresores, los coeficientes de correlacin
altos son una condicin suficiente para la existencia de multicolinealidad pero no
necesaria, ya que sta puede existir aunque los coeficientes de correlacin sean
comparativamente bajos.
Coeficientes de correlacin mltiple entre los regresores grandes: R X2 j X1....
Estos coeficientes miden la correlacin que existe entre un regresor y todos los dems.
Se puede calcular como coeficiente de determinacin en la regresin auxiliar de cada
regresor frente a los otros.
Estadsticos t pequeos y F grandes
Factor de inflacin de la varianza: FIV
1
Este factor se define como el cociente: FIV j =
1 R X2 j X1 .....
tiene la relacin entre Xj y las dems variables sobre la varianza de j . Cuanto mayor sea
este factor, mayor es la varianza del estimador.
El factor de inflacin de la varianza se puede interpretar como cociente de dos varianzas del
estimador:
o Su varianza real 2
j
44
Econometra Curso 2011-2012
( )
X j X 1 ... X k Xj 1
= =
(1 R ) = FIV
j
2
j
2 2
X j X 1 ... X k
ortog
N S X2 j
1) Aumentar el tamao de la muestra. Esta podra ser una solucin siempre que la
multicolinealidad fuera un problema muestral.
2) Eliminacin de variables: Eliminar aquella o aquellas variables colineales. El
inconveniente de este mtodo es que podramos caer en graves problemas de errores
de especificacin por omisin. Este error sera tanto menor cuanto mayor fuese la
correlacin lineal entre la variable omitida y las incluidas y por tanto tambin ser
menor el sesgo de los estimadores.
3) Utilizacin de informacin a priori: Consiste en incorporar al modelo algn tipo de
informacin estableciendo restricciones sobre los parmetros del modelo.
4) Transformacin de variables: Si la multicolinealidad se presenta en modelos con una
muestra de series temporales la tendencia aproximadamente comn en los
regresores podra ser la principal causa del problema. En este caso una forma de
eliminar esa tendencia es trabajar con la series en primeras diferencias y de esa
forma no solo se eliminara la tendencia sino que la correlacin entre los regresores
disminuira. Tambin se podra trabajar con ratios.
45
Econometra Curso 2011-2012
46
Econometra Curso 2011-2012
ORDEN de una matriz.- Una matriz con T filas y K columnas se dice que es de orden T por
K, (TxK).
RANGO de una matriz.- Se define como el mximo nmero de columnas o filas, de X,
linealmente independientes. Corrientemente se dice que es el ORDEN del mayor MENOR
no nulo. Donde los MENORES son los determinantes (nxn) que se puede formar.
PROPIEDADES: Si A es una matriz nxm de rango m<n, entonces A'A es definida positiva y
AA' es semidefinida positiva. (Johnston, p. 182).
Si A es una matriz nxm de rango m<n, entonces A' es de rango m y la matriz resultante de
premultiplicar a A por su transpuesta (A'A) tambin es de rango m.
MATRIZ CUADRADA.- Es aquella que tiene el mismo nmero de filas y de columnas.
MATRIZ DIAGONAL.- Aqulla cuyos nicos elementos distintos de cero estn en la
diagonal principal.
MATRIZ NO SINGULAR.- Aqulla matriz cuadrada cuyo determinante es distinto de
cero.
MATRIZ IDENTIDAD.- Aqulla cuyos elementos de la diagonal principal son la unidad y
el resto ceros. Se cumple que AI = I.A = A.
OPERACIONES CON MATRICES
SUMA DE MATRICES.- Para sumar dos matrices deben tener el mismo orden. Se suma
cada elemento de la primera con su correspondiente elemento en la segunda.
PROPIEDADES: Conmutativa: A+B=B+A; Asociativa: A+(B+C)=(A+B)+C
MULTIPLICACIN POR UN ESCALAR: Se multiplica el escalar por todos los elementos
de la matriz. Admite la propiedad distributiva: a(A+B)= aA+aB
47
Econometra Curso 2011-2012
48
Econometra Curso 2011-2012
(xi X )
n n
2
xi2 nX 2
Varianza muestral: S x2 = i =1
= i =1
n n
(xi X )
n n
2
xi2 nX 2
Cuasivarianza muestral: S x2 = i =1 = i =1
n 1 n 1
49
Econometra Curso 2011-2012
X
n
Propiedad: Sean X e Y v.a.i. tal que X n21 e Y n22 , entonces U = 1 Fn1 ,n2
Y
n2
CONVERGENCIAS Y TEOREMA DEL LMITE
Convergencia en probabilidad: Una sucesin {X n }n =1 converge en probabilidad hacia la
variable X, X n c
. p.
X , si para cualquier >0,
Propiedades
1.- X n c
. p.
X X n X c
. p.
0
2.- X n c
. p.
X y g una funcin continua g ( X n ) c
. p.
g(X )
50
Econometra Curso 2011-2012
hacia la variable X, X n m
.c .
X , si
[
lim E X n X
n
2
]= 0
Propiedades
1) Una condicin suficiente pero no necesaria para la convergencia en probabilidad es que
se d la convergencia en media cuadrtica. Es decir , si X n m
.c .
X X n c
. p.
X.
lim Fn ( x) = F ( x)
n
3) Si X n m
.c .
X X n c
. p.
X Xn
L
X
Ley de los grandes nmeros
Los momentos muestrales de una sucesin de variables aleatorias independientes e
igualmente distribuidas convergen en probabilidad a los correspondientes momentos
poblacionales.
Teorema del lmite central
Sea {X n }n =1 una sucesin de v.a.i.i.d. con E(Xi)= y Var(Xi)=2. Entonces
n n n
X i E X i X i n
i =1 i =1 = i =1
N (0,1)
L
n n
Var X i
i =1
o lo que es lo mismo, X n
a
N ( , ).
n
LGEBRA DE LOS LIMITES EN PROBABILIDAD (PLIM)
Sean XT e YT dos sucesiones de variables aleatorias tales que plim XT = c, plim YT = d.
1.- plim (XT + YT) = plim XT + plim YT = c + d.
2.- plim XT.YT = plim XT . plim YT = c .d.
51
Econometra Curso 2011-2012
XT p lim X T c
3.- p lim = = si p lim YT 0
YT p lim YT d
4.- ( )
p lim X TS = ( p lim X T )S
5.- Si plim (XT - YT ) = 0 y plim XT = c, entonces plim YT = c.
Teorema de Slutsky
Sea XT una sucesin de variables aleatorias tales que plim XT = c, e YT = (XT) una
funcin continua en c que no depende de T, entonces plim YT = (c).
1
X X X X
Ejemplo: Si p lim = P, p lim = P 1 siempre que P sea una matriz no singular.
T T
ELEMENTOS BSICOS SOBRE CONTRASTES
Hiptesis estadstica: Es un enunciado sobre los valores de algunos de los parmetros en la
poblacin hipottica de la cual se toma la muestra.
Hiptesis puntual: es aquella en la que se plantea contrastar un valor especfico para un
parmetro.
Hiptesis de intervalo: es aquella en la que se plantea contrastar si el parmetro se
encuentra en un intervalo especfico.
Contraste de hiptesis: es la regla que nos permite dilucidar la validez de una hiptesis en
base a la evidencia emprica.
Hiptesis nula: es la hiptesis sometida a anlisis y se designa por Ho.
Hiptesis alternativa: es la hiptesis contra la que suele probarse la hiptesis nula y se
designa por H1 o HA.
Al contrastar una hiptesis cabe adoptar dos decisiones: por un lado, podemos rechazarla o
no rechazarla y, por otro, dicha hiptesis puede ser cierta o falsa. Por ello, las
consecuencias de la decisin se pueden esquematizar de la siguiente forma:
Ho cierta Ho falsa
No Rechazar Decisin correcta Error de II tipo
Rechazar Error de I tipo Decisin correcta
Nivel de significacin del contraste: Se denota con la letra (tambin se denomina tamao
del contraste) y se define como la probabilidad de rechazar la Ho siendo cierta, lo que
ocurrir cuando la observacin muestral pertenezca a la regin crtica.
= P{error de I tipo}=P{rechazar Ho| si Ho es cierta}
Potencia del contraste: se denota como (1-), siendo la probabilidad de cometer el error
de tipo II y se define como la probabilidad de no rechazar la hiptesis nula cuando sta es
falsa. As, una vez fijado , de todas las regiones crticas con el mismo nivel de
significacin, elegiremos aquella donde la potencia del contraste sea mayor, es decir que
sea menor.
= P{error de II tipo}=P{No rechazar Ho| si Ho es falsa}
52
Econometra Curso 2011-2012
Regin crtica: es aquella zona del espacio muestral donde se rechaza Ho. Si la observacin
muestral realizada pertenece a ella, entonces se rechaza la Ho.
Regin de aceptacin: es la complementaria a la regin crtica, es decir donde no se rechaza
la Ho.
Valor crtico: es el valor de la distribucin obtenido en las correspondientes tablas, fijado
un nivel de significacin, que separa la regin crtica de la regin de aceptacin.
La tcnica de los contrastes consiste en delimitar estas dos regiones y ver donde cae el valor
muestral obtenido.
P-valor: es el valor de probabilidad y describe el nivel de significacin exacto asociado con
un resultado economtrico particular. Por tanto es la probabilidad de rechazar de forma
incorrecta una hiptesis nula que es cierta. Cuanto menor sea el valor p ms seguros
estaremos al rechazar la hiptesis nula.
Nivel de confianza (1-): nos indica la proporcin aproximada de veces que el parmetro i
se encontrara en el intervalo si calculsemos el intervalo con muchas muestras diferentes.
Intervalo de confianza: es un intervalo numrico en el que creemos que se encontrara el
parmetro con un cierto grado (nivel) de confianza.
Intervalo de Probabilidad: es un intervalo aleatorio que se concreta en un intervalo de
confianza cuando disponemos de una realizacin muestral.
53