You are on page 1of 57

Material Docente de

Econometra
Curso 2011-2012. Primera parte
Esquemas de teora

Cuarto curso de Economa


Cuarto curso de Administracin y Direccin de Empresas
Cuarto curso de Derecho y A.D.E

Profesores:
Jess Cavero lvarez
Helena Corrales Herrero
Yolanda Gonzlez Gonzlez
Carmen Lorenzo Lago
Mercedes Prieto Alaiz
Pilar Zarzosa Espina
Material Docente de Econometra
Primera parte
Curso 2011-2012

Introduccin............................................................................................... 1
Tema 1.- El modelo de regresin lineal clsico I ..................................... 5
Tema 2.- El modelo de regresin lineal clsico II ................................... 17
Tema 3.- Prediccin .................................................................................. 21
Tema 4.- Variables ficticias ...................................................................... 25
Tema 5.- Errores de especificacin ........................................................... 31
Tema 6.- Multicolinealidad ..................................................................... 41
Anexo ........................................................................................................ 47
Econometra Curso 2011-2012

INTRODUCCIN

Concepto de Econometra

En sentido literal Econometra significa medicin de la economa.


A lo largo del tiempo se han formulado diversas definiciones del concepto de
Econometra. La primera, formulada por Frisch a finales de los aos 20, defina la
Econometra como la ciencia que combina la T Econmica, las Matemticas y la
Estadstica, con el objeto de medir los fenmenos econmicos. Entre las ms recientes
podramos quedarnos con la de Maddala que define la Econometra como la aplicacin
de mtodos estadsticos y matemticos al anlisis de los datos econmicos, con el
propsito de dar un contenido emprico a las teoras econmicas y verificarlas o
refutarlas.
Podemos considerar que los objetivos de la Econometra son:
Explicar el comportamiento de una o de varias variables econmicas en funcin
de otras.
Predecir el comportamiento de las variables econmicas.
Contrastar hiptesis de inters econmico.

Modelos Econmicos y Modelos Economtricos

Un modelo econmico es la expresin matemtica simplificada de una determinada


teora econmica.
Ejemplos:
- Si queremos especificar que la cantidad demandada de un bien depende del precio
de dicho bien, podremos formular una funcin matemtica, lineal o no, entre la cantidad
demandada y el precio. As, si la relacin es lineal la funcin de demanda ser : Dt = +
Pt.
- El consumo segn la teora keynesiana es funcin de la renta por lo que la funcin
de consumo podra expresarse: Ct = + Rt.
Estos modelos son deterministas.
Un modelo economtrico es un modelo econmico con las especificaciones
necesarias para su tratamiento emprico. As, en el ejemplo de la funcin de demanda el
modelo economtrico sera Dt = + Pt + t y en la de consumo Ct = + Rt+ t, donde t
es una variable aleatoria. Con su introduccin el fenmeno econmico se concibe como un
fenmeno aleatorio. Esta variable que llamaremos perturbacin aleatoria dota al modelo de
un mayor realismo ya que con ella aceptamos la incertidumbre existente en cualquier
comportamiento social.
Otros motivos adicionales para incorporar la perturbacin aleatoria son:
1) Es imposible especificar todos los factores causales que intervienen en el fenmeno. En
el ejemplo del consumo: nmero de hijos, lugar de residencia, nivel cultural, etc.
2) En ocasiones, aunque conozcamos todos los factores causales, algunos no sern
cuantificables o sern de cuantificacin difcil. En el ejemplo del consumo, los gustos
constituyen un factor que influye en el consumo, pero es de difcil cuantificacin.
3) Para recoger los posibles errores de observacin que podramos cometer.

1
Econometra Curso 2011-2012

Elementos constitutivos de un modelo economtrico

La forma general de presentar un modelo economtrico ser:


Yt =0 +1X1t +2X2t +3X3t +..+kXkt +t
Los elementos constitutivos de un modelo economtrico son por tanto: parmetros y
variables.
Parmetros: son las constantes del modelo que nos permiten cuantificar las
relaciones entre las variables y que trataremos de estimar mediante mtodos estadsticos.
Son los coeficientes del modelo y recogen la estructura del modelo.
Variables: pueden ser de dos tipos: variables observables y variables no
observables.
Variables observables: (Yt, X1t, X2t, X3t,..Xkt). Pueden ser endgenas o
predeterminadas
* Variables endgenas: son aquellas cuyo comportamiento se pretende
explicar con el modelo. (Yt). En el ejemplo del consumo sera Ct. En los
modelos uniecuacionales hay una sola variable endgena, que figura como
variable dependiente o regresando. En los modelos multiecuacionales
hay tantas variables endgenas como ecuaciones.
* Variables predeterminadas: son las variables explicativas del modelo. (X1t,
X2t, X3t,..Xkt). En el ejemplo del consumo sera Rt. En los modelos
uniecuacionales figuran como variables independientes y se suelen llamar
regresores. Pueden ser variables exgenas puras o variables endgenas
retardadas.
o Variables exgenas puras: son las que se determinan fuera del
modelo. En el ejemplo Rt.
o Variables endgenas retardadas: son variables endgenas pero
que aparecen en periodos de tiempo anteriores al del modelo. En
el ejemplo Ct-1.
C t = 0 + 1 Rt + 2 C t 1 + t
{ {
V. exgena V. endgena
pura retardada

Variables no observables: son variables para las cuales no podemos obtener


observaciones. Son variables aleatorias con propiedades probabilsticas bien
definidas, que se denominan perturbaciones aleatorias y recogen aqullo que
no es posible especificar explcitamente dentro de las variables explicativas del
modelo.

Etapas en la elaboracin de un modelo economtrico

1) Especificacin del modelo: se trata de expresar la relacin propuesta por la Teora


Econmica en un lenguaje matemtico, determinando las variables a introducir y la funcin
que las relaciona, as como las distintas hiptesis sobre todas las variables del modelo.
2) Eleccin y tratamiento de los datos
Estas dos etapas van muy unidas pues especificamos el modelo y elegimos los datos pero
tambin la disposicin de los datos nos permite especificar mejor el modelo.

2
Econometra Curso 2011-2012

3) Estimacin: consiste en obtener estimadores de los parmetros a partir de los datos


disponibles.
4) Evaluacin y Contrastacin: En esta fase se realizan diferentes contrastes con el fin
de conocer si tanto las hiptesis estadsticas, como las econmicas son coherentes con los
datos disponibles.
5) Prediccin: en esta fase se obtienen valores futuros de la variable dependiente, en
base a valores conocidos de las variables explicativas.

Clasificacin de los modelos economtricos

Segn los diferentes criterios que se pueden utilizar, existen mltiples


clasificaciones de modelos economtricos. Entre ellas las siguientes:
1er criterio: segn el nmero de ecuaciones
Modelos uniecuacionales. Ejemplo: Ct = + Rt+ t
Modelos multiecuacionales. Ejemplo: si al modelo uniecuacional de consumo
aadimos otra ecuacin como por ejemplo Rt = Ct + It donde It
Ct = + Rt+ t
sera la inversin, tendremos un modelo multiecuacional: Rt = Ct + It

2 criterio: atendiendo a la forma funcional


Modelos lineales. Ejemplo: Ct = + Rt+ t
Modelos no lineales. Ejemplo: la funcin de produccin de Cobb-Douglas Pt =
ALt K t e
1 2 t

3er criterio: atendiendo al periodo de tiempo al que estn referidas las variables
Modelos estticos: estn especificados para un momento de tiempo determinado.
Ejemplo: Ct = + Rt+ t
Modelos dinmicos: en ellos aparece alguna variable retardada. Ejemplo: Ct =
0 + 1Rt + 2Ct-1 + t

Clasificacin de los datos

Para que el modelo economtrico sea operativo necesitamos conocer los valores
numricos de sus parmetros y para ello hemos de disponer de un conjunto de datos sobre
las variables.
Los datos pueden ser de tres tipos: datos temporales, datos de corte transversal y
datos de panel.
Datos temporales o series temporales: son observaciones de una variable, para
una unidad econmica a lo largo del tiempo. Ejemplos: datos de la Contabilidad
Nacional, indicadores de coyuntura mensuales o trimestrales, ventas de una
empresa a lo largo del tiempo, etc.
Datos atemporales o de corte transversal: son observaciones de una variable,
para distintas unidades econmicas en un momento de tiempo dado. Ejemplo:
Encuesta de Presupuestos Familiares (INE) en el perodo 90-91, en la que se ha
entrevistado a ms de 20.000 familias.
Datos de panel: son observaciones de una variable para distintas unidades
econmicas a lo largo del tiempo, es decir, es la combinacin de datos
temporales y de corte transversal.

3
Econometra Curso 2011-2012

4
Econometra Curso 2011-2012

TEMA 1.-EL MODELO DE REGRESIN LINEAL CLSICO I

1.1.- Especificacin del modelo

Forma escalar : Yi = o + 1 X 1i + ..... + k X ki + i para i =1.N

Yi = X i' + i

Forma matricial: Y = X +

Y1 1 X 11 . . X k1 1

Y2 1 X 12 . . X k2 2
Donde:Y= . , X= . . . . . , = .

. . . . . . .
Y 1 X . . X kN
N 1N N
Hiptesis Clsicas:
Linealidad en los parmetros
N (0, 2 I ) o Y N (X , 2 I ) por tanto o Y son variables iid
X no aleatoria
rg(X) = k+1 < N

1.2.- Estimacin Mnimo Cuadrtica Ordinaria

Objetivo: Obtener estimadores de los parmetros y 2


Mtodo: Mnimos Cuadrados Ordinarios

Funcin Objetivo a minimizar: ei2 = e ' e = (Y X ) ' (Y X )

e' e = Y ' Y Y ' X ' X ' Y + ' X ' X = Y ' Y 2Y ' X + ' X ' X

Condiciones de mnimo:
e' e
1 Condicin : =0

2 e' e
2 Condicin : sea definida positiva
'
Obtencin del estimador MCO:
e' e
= 2 X ' Y + 2 X ' X = 0 X ' X = X ' Y Sistema de ecuaciones normales

= ( X ' X )1 X ' Y

5
Econometra Curso 2011-2012

2 e' e
= 2 X ' X matriz definida positiva
'

Por tanto: MCO = ( X ' X )1 X ' Y

1.3.- Propiedades del estimador de

Finitas
- Lineal en Y y en : por ser X no aleatoria
- ()
Insesgado: E = por ser X no aleatoria y E ( ) = 0

()
E = + ( X ' X ) X ' E ( )
1

- ptimo: de mnima varianza dentro de la familia de estimadores lineales e


insesgados. Cuya matriz de varianzas covarianzas es:

( )( '
( )) '
= E E ( ) E = E =( )( )
= E(X ' X ) X ' ' X (X ' X ) = 2 (X ' X )
1 1 1

Teorema de Gauss Markov demuestra que:


D' = C '( X ' X ) X
1
~~ = + D' D
2
donde
siendo C una matriz cualquiera no aleatoria y D' D una matriz semidefinida
positiva.
- Eficiente: de mnima varianza entre los insesgados. Alcanza la cota de Cramer Rao.
- Distribucin finita: MCO N , 2 ( X ' X ) (
1
)
Asintticas
X'X
- Consistente : Si se cumple P= XX = lim N ; P 0 y finita, entonces:
N
c. p.
- MCO o bien p lim N =
1
X'X X '
p lim N = p lim N + p lim N p lim N =
N N
X '
ya que: p lim N =0
N

( )
1
X ' X
- Asintticamente normal : N
a
N 0, lim N
2

N

- Asintticamente eficiente : La varianza asinttica alcanza la cota de Cramer-Rao.

6
Econometra Curso 2011-2012

1.4.- Estimador de 2 y sus propiedades

Denotamos por S2 el estimador de la varianza de las perturbaciones 2


e' e
Definimos S2 =
N K 1
Propiedades:
- Insesgado: E(S2) = 2
Consistente: p lim N S 2 = 2

Propiedades del estimador de

1
S = S 2 (X ' X )

1
- Insesgado : E S = E S 2 ( X ' X ) =

1.5.- Caractersticas de los residuos mnimo cuadrticos

Poblacionales: e=M
Ya que: e = Y Y = Y X = MY = M

Y = X
1
M = I X ( X ' X ) X ' matriz no aleatoria, simtrica e idempotente
- E(e)=0
ee' = Eee' = E (M ' M ') = M I
2 2
- si N MI
- E ( X ' e) = 0

- (
e N 0 , 2 M )
Muestrales:
- X 'e = 0

( )
X Y Y = X ' Y X ' Y Y = Y si XNx(k+1)
N
e = 0 e=0 si XNx(k+1)
i =1 i
X ji ei = 0 j = 1....k cov(e, Xj)=0 rex j = 0

- Y ' e = 0 cov( Y , e) = 0 reY = 0

7
Econometra Curso 2011-2012

1.6.- Descomposicin de la varianza

(
Yi Y ) 2
= Yi 2 N Y
2

( )(
Yi = Y ' Y = Y + e ' Y + e = Y ' Y + e' e
2
)
2
Restando a ambos lados : N Y

(
Yi Y )
2
( )
2
= Yi Y + ei e ( )
2
si Y = Y
SCT=SCE+SCR
Coeficientes de determinacin R2 y de determinacin ajustado
SCR SCE
R2 = 1 = 0 R 2 1
SCT SCT
2 SCR / N k 1
R = 1
SCT / N 1

1.7.- Estimadores mximo verosmiles de los parmetros

El mtodo de mxima verosimilitud consiste en hallar los estimadores que maximizan la


funcin de verosimilitud.
La funcin de verosimilitud de la muestra es, simplemente, la funcin de densidad conjunta
de la muestra hacindola depender de los parmetros desconocidos.
Puesto que Y es una variable normal N-dimensional : Y N X , 2 I ( )
su funcin de densidad y, por lo tanto, la funcin de verosimilitud es:
1
N (Y X )`(Y X )
2 2
f (Y ) = 2 2 2 e

dado que max L( , 2 ) es lo mismo que max ln L( , 2 )

ln L , 2 = N ln (2 ) N ln 2 1 (Y X )' (Y X )
2 2 2 2

ln L , 2 = N ln (2 ) N ln 2 1 Y 'Y 2Y ' X + ' X ' X


2 2 2 2

Condiciones de mximo:
1 condicin: Se igualan a cero las primeras derivadas

ln L

=
1
( 2 X 'Y + 2 X ' X ) = 0 X ' Y = X ' X MV
2 2
MV
MV

por tanto = ( X ' X ) 1 X ' Y =


MV MCO

8
Econometra Curso 2011-2012

ln L N 2(Y X ) ' (Y X )
= + MV MV
=0
2
2 2
2 (
2 2
) 2
MV MV

MV
2
= e' e
N

2 condicin: Se cumple que el hessiano evaluado en el mximo es una matriz definida


negativa.

Propiedades de los estimadores


Bajo condiciones de regularidad se demuestra que los EMV tienen las siguientes
propiedades:
Asintticamente insesgados
Consistentes
Asintticamente eficientes
Asintticamente normal
Invarianza

1.8.- Criterios de bondad del ajuste basados en la funcin de verosimilitud

1) Anlisis de la funcin de verosimilitud evaluada en los EMV de los parmetros

ln L , 2 = N ln (2 ) N ln 2 1
2 2
(Y X )(' Y X )
2 2
MV MV MV
MV

ln L , 2 = N ln (2 ) N ln
ei2 N
2 2 N 2
No est acotado y est influido por el nmero de variables explicativas que introduzcamos
en el modelo.
2) Criterio de Akaike AIC y Criterio de informacin bayesiano de Schwartz SBIC
2 2(k + 1)
AIC = ln L +
N N
2 (k + 1) ln N
SBIC = ln L +
N N
Cuanto menor sean estos estadsticos mejor ser la estimacin del modelo.

9
Econometra Curso 2011-2012

1.9.- Diferencias entre la regresin simple y la regresin mltiple

1) Los coeficientes son diferentes


Yi = o + 1 X 1i + ..... + k X ki + i

Yi = 0 + 1 X 1i + i
* * *

En el primer modelo, 1 mide en cunto vara la variable endgena cuando vara X1 en una
unidad, manteniendo constante el resto de las variables. En el segundo modelo, 1* mide en
cunto vara la variable endgena cuando vara X1 en una unidad

2) Los coeficientes estimados por MCO son diferentes

La informacin que proporciona un regresor, por ejemplo X1, sobre la variable endgena
puede ser parecida a la que tienen el resto de las variables. De hecho, la informacin de X1
puede ser genuina de la propia variable o compartida con el resto de las variables
explicativas. Cuando estimamos por mnimos cuadrados ordinarios un modelo de regresin
simple el estimador asociado a X1 solamente recoge el efecto de la informacin propia de
X1, ya que no estn incluidos otros regresores. La importancia de la regresin mltiple es
que el estimador por mnimos cuadrados ordinarios asociado a X1 es capaz de medir el
efecto de X1 una vez descontada la informacin que comparte con el resto de los
regresores.

3) Las varianzas estimadas de los coeficientes son diferentes

Existen dos casos especiales en los que el coeficiente estimado por MCO asociado a X1
ser el mismo en la regresin simple que en la regresin conjunta.
1) Cuando no exista informacin compartida (regresores ortogonales)
2) Cuando los coeficientes asociados al resto de los regresores sean cero.

10
Econometra Curso 2011-2012

Apndice 1.- Grfico de algunas hiptesis del modelo

11
Econometra Curso 2011-2012

Apndice 2.- Modelo de regresin sin trmino constante


Yi = 1X1i +2X2i +3X3i +..+kXki +i con i=1,2,3,....N
Matricialmente se podra expresar:
Y = X** + donde X* es la matriz de orden Nxk

1 X X 21 L X k 1
11
1 X 12 X 22 L X k 2
X=
M M M M M

1 X 1N X 2 N L X kN
1444 424444 3

X*

MCO
*
= ( X *' X * ) 1 X *' Y tiene buenas propiedades y no hay ningn problema por lo que
respecta a las propiedades de los estimadores, pero se dejan de cumplir algunas
caractersticas que se daban en el modelo con trmino constante.
e' e
S = S2( X *' X * )-1 donde S 2 =
N k
1
N 2 N N
N
X 1i X 1i X 2i L X 1i X ki X 1i Yi
1
*
N i =1 i =1 i =1 iN=1
X X L X 2i X ki X Y *
N N

MCO
*
=i =1
2i 1i X 22i
i =1 i =1
i =1
2i i =

2

M M M M M M
N N N N *
X ki X 1i X ki X 2i L ki X 2
X ki Yi k
i =1 i =1 i =1 i =1
Particularidades de estos modelos:
1) Los estimadores obtenidos con datos centrados no coinciden con los obtenidos con
datos sin centrar ya que si trabajamos con datos centrados en un modelo sin trmino
constante obtenemos los mismos estimadores que si trabajsemos con datos centrados en el
modelo con trmino constante. Lo ms correcto en estos modelos es trabajar con datos sin
centrar.

2) Ya no se cumple que Y = Y pues al no disponer X* de una columna de unos no se


N N
cumple que Yi = Yi y por lo tanto Y Y
i =1 i =1

3) Aunque se sigue cumpliendo que los regresores son ortogonales a los residuos X *' e = 0,
ya no se cumple que los errores estn linealmente incorrelacionados porque no se cumple
que ei = 0 .
4) No se cumple la descomposicin de la varianza y por lo tanto el R2 no tiene sentido
porque nunca estara acotado SCT SCR+SCE
S se sigue cumpliendo YY = Y Y + ee

12
Econometra Curso 2011-2012

e' e Y ' Y
En este caso lo nico que se puede hacer es definir un R*2 como: R*2 = 1 = que
Y' Y Y' Y
s estar acotado, pero que en realidad no medir la variabilidad de Y porque YY no es la
SCT, simplemente nos dar una idea de como ha sido el ajuste. El R2 de un modelo con
trmino constante y el R*2 del modelo sin trmino constante no son comparables.

Apndice 3.- Cambios de origen y escala en las variables

En ocasiones nos interesa cambiar las unidades de una, varias o todas las variables del
modelo para hacer sus valores numricos comparables con las dems variables o para que
su manejo sea menos engorroso.
Otras veces necesitamos hacer un cambio de origen en los valores de las variables.
Analizaremos, a continuacin, los efectos que, sobre la estimacin de un modelo, generan
esos cambios.
Cambio de escala
Sea el modelo: Yi = 0 +1X1i +2X2i +3X3i +..+kXki +i con i=1,2,3,....N
Supongamos que hacemos un cambio de escala en todas las variables pasando a tener:
Yi ' = aYi

X 1'i = a1 X 1i
................
X ki' = a k X ki

Ahora el modelo ser: Yi' = 0' + 1' X 1' i + ... + k' X ki' + i

Sustituyendo: aYi = 0' + 1' a1 X 1i + ... + k' a k X ki + i

0' a1 a
Yi = + 1' X 1i + ... + k' k X ki + i
a a a a
i
donde cumple las hiptesis clsicas.
a
0'
Luego o = 0' = a 0
a
1' a1 a
1 = 1' = 1
a a1
.........................................
k' a k a
k = 1' = k
a ak
Estos son los cambios que experimentan los coeficientes cuando hacemos un cambio de
escala en todas las variables.
Por lo tanto:
13
Econometra Curso 2011-2012

Si hacemos un cambio de escala slo en Yi ( a1 ,..., a k sern igual a 1) los nuevos


coeficientes son los originales multiplicados por la constante por la que hayamos
multiplicado los valores de Y.
Si hacemos un cambio de escala slo en Xjt slo cambia el coeficiente que
acompaa a Xjt y lo hace dividiendo el original entre a j .
Otros resultados que tambin cambian son:

La SCR. La nueva es e*' e* = a 2 e' e .

La SCT. La nueva es SCT*= a 2 SCT.


a2
La varianza estimada de los j : S 2** = S 2
j
a 2j j

S 2** = a 2 S 2
0 0

Cambio de origen
Sea el modelo: Yi = 0 +1X1i +2X2i +3X3i +..+KXKi +i con i=1,2,3,....N
Supongamos que hacemos un cambio de origen en todas las variables pasando a tener:
Yi ' = Yi + a

X 1'i = X 1i + a1
................
X ki' = X ki + a k

Ahora el modelo ser: Yi' = 0' + 1' X 1' i + ... + k' X ki' + i

Sustituyendo: Yi + a = 0' + 1' ( X 1i + a1 ) + ... + k' ( X ki + a k ) + i

Yi = a + 0' + 1' a1 + ... + k' a k + 1' X 1i + ... + k' X ki + i

1' = 1
...................
k' = k
0 = a + 0' + 1' a1 + ... + k' a k 0 = a + 0' + 1 a1 + ... + k a k
0' = 0 + a 1 a1 ... k a k
Luego los cambios de origen en alguna o en todas las variables del modelo slo afectan al
trmino independiente.
El nico resultado que tambin cambia es la varianza estimada de 0 .

14
Econometra Curso 2011-2012

Apndice 4.- Coeficientes Beta1

Los parmetros estimados de un modelo lineal son valores absolutos y dependen de las
unidades de medida en las que se expresen las variables del modelo.
Una variable no es ms importante que otra por tener un parmetro mayor. Esto ocurre
cuando, siendo ambos parmetros significativos, ambas variables estn medidas en las
mismas unidades.
Una solucin a este problema es calcular unos coeficientes estandarizados o coeficientes
beta a partir de la normalizacin de las variables (restarles su media y dividirles por su
desviacin tpica)
Yi Y X X1 X Xk
= 1* 1i + ... + k* ki + ui
SY S X1 S Xk

donde la relacin entre los coeficientes beta y los coeficientes estimados originales es:
SXj
*j = j .
SY

1
Pulido (2001): Modelos economtricos. Pirmide.

15
Econometra Curso 2011-2012

16
Econometra Curso 2011-2012

TEMA 2. EL MODELO DE REGRESIN LINEAL CLSICO II

2.1.- Contrastes de restricciones lineales sobre los parmetros. Forma general

Hiptesis a contrastar:

H o : R = r
H 1 : R r

Partiendo de la distribucin de las perturbaciones y de los estimadores, obtenemos la de


R :

R (
N R , 2 R ( X ' X ) R '
1
)
A partir de aqu, se demuestra que, si la hiptesis nula es cierta:

(R r )' [R(X ' X ) R ] (R r )


1 ' 1
FNHk 1
2
S H

Otra forma alternativa de realizar el contraste es introduciendo las restricciones en el


modelo y comparando el modelo restringido con el modelo sin restringir, ya que la
expresin anterior coincide con la siguiente:

e' r e r e ' e
FNHk 1
S2 H

Donde er = Y Xr

2.2.- Contrastes de restricciones lineales sobre los parmetros. Casos particulares

A) Contraste de significacin individual de un regresor:

Ho : j = 0

H1 : j 0

j

Ho
t N k 1
S
j

B) Contraste de significacin conjunta de los regresores:

17
Econometra Curso 2011-2012

1 0


Ho : =


0
k

H1 :

SCE R 2 ( N k 1)

Ho
FNk k 1
Ho
FNk k 1
S2 k
o bien
(1 R2 k)

2.3.- Estimacin restringida. Propiedades del estimador restringido

Sea la restriccin lineal sobre los parmetros: R=r. Intentaremos encontrar el estimador
del vector paramtrico que satisfaga la restriccin. En definitiva, vamos a elegir r de
forma que minimice

e r' e r = (Y X r )' (Y X r ) sujeto a la restriccin R r = r

Para obtener dicho estimador restringido habra que formar la funcin lagrangiana. El
proceso de minimizacin da como resultado el estimador restringido siguiente:

[ ]
r = + ( X ' X ) 1 R ' R ( X ' X ) 1 R '
1
(r R )

En la prctica este estimador se puede obtener introduciendo las restricciones en el modelo


inicial y estimando dicho modelo, denominado modelo restringido, por mnimos cuadrados
ordinarios.

Ejemplo:

Su pongamos el siguiente modelo

Yt = 0 + 1 X 1t + 2 X 2 t + t

Las variables Y, X1 y X2 toman los siguientes valores


Yt X1t X2t
3 1 8
2 2 14
4 2 10
5 3 9
5 4 7
7 5 6
6 5 8
8 9 4
8 9 3
12 15 1
Si queremos estimar bajo las dos siguientes restricciones 1 = 0.5 y 1 + 2 2 = 0
podemos proceder de las dos formas siguientes:

18
Econometra Curso 2011-2012

En primer lugar, se puede aplicar mnimos cuadrados restringidos

r = + ( X ' X ) 1 R ' [R( X ' X ) 1 R'] (r R )


1

5,4118

= 0,4471 ;
- 0,2672

4.1654 0.2941 0.3497 o


0 1 0 0.5
(X ' X ) 1
= 0.2941 0.0235 0.0235 ; R = r ; 1 =
0.3497 0.0235 10 1 2 0
0.0315 4243 2 123
R { r

4.1654 0.2941 0.3497 0 0 0.294 0.993


1

( X ' X ) R' = 0.2941 0.0235 0.0235 1 1 = 0.0235 0.0706
0.3497 0.0235 0.0315 0 2 0.0235 0.0865

4.1654 0.2941 0.3497 0 0


1 0 1 0 0.0235 0.0706
R ( X ' X ) R ' = 0.2941 0.0235 0.0235 1 1 =
0 1 2 0.3497 0.0235 0.0706 0.2435
0.0315 0 2

1
326 94.5
[ 1
R ( X ' X ) R ' = ]
0.0235 0.0706
1
=
0.0706 0.2435 94.5 31.5

5.4118
0.5 0 1 0 0.5 0.4471 0.0529
(r R ) =
0.4471 = =
0 0 1 2 - 0.2672 0 0.0874 0.0874

r = + ( X ' X ) 1 R ' [R( X ' X ) 1 R'] (r R ) =


1

5.4118 0.294 0.993 5.4118 - 0,4118 5


326 94.5 0.0529
0.4471 + 0.0235 0.0706 = 0.4471 + 0,0529 = 0.5
- 0.2672 0.0235 0.0865 94.5 31.5 0.0874 - 0.2672 0,0172 - 0.25

En segundo lugar, se puede introducir la restriccin en el modelo:

Yt = 0 + 0.5 X 1t 0.25 X 2t + t Yt 0.5 X 1t + 0.25 X 2t + = 0 + t Yt * = 0 + t

o = Y * = Y 0.5 X 1 + 0.25 X 2 = 6 0.5 * 5.5 + 0.25 * 7 = 5

19
Econometra Curso 2011-2012

5

r = 0.5
- 0.25

Los residuos restringidos se pueden obtener a partir del modelo original con los
estimadores restingidos o a travs del modelo restringido:

Primera forma Segunda forma

Y Y er Y* Y * er
3 3,5=5+0.5*1-0.25*8 -0,5=3-3.5 4,5=3-0.5*1+0.25*8 5 -0,5
2 2,5=5+0.5*2-0.25*14 -0,5=2-2.5 4,5=2-0.5*2+0.25*14 5 -0,5
4 3,5 0,5 5,5 5 0,5
5 4,25 0,75 5,75 5 0,75
5 5,25 -0,25 4,75 5 -0,25
7 6 1 6 5 1
6 5,5 0,5 5,5 5 0,5
8 8,5 -0,5 4,5 5 -0,5
8 8,75 -0,75 4,25 5 -0,75
12 12,25 -0,25 4,75 5 -0,25

Propiedades del estimador restringido:

Las propiedades del estimador restringido dependen de si la restriccin es cierta o no. As,
el siguiente cuadro enumera las propiedades en ambos casos.

Restriccin cierta Error en la restriccin


R=r Rr
1. r es insesgado 1. r es sesgado
2. r es consistente 2. r es inconsistente
3. r es ms eficiente que MCO 3. = Q
r r

= Q donde Q es semidefinida ECM ECM = A donde A es semidef.


r r

r
positiva posit. o semidef. negat.
4. S r2 es insesgado y consistente 4. S r2 es sesgado e inconsistente

20
Econometra Curso 2011-2012

TEMA 3.- PREDICCIN

3.1.- Prediccin

Objetivo: Obtener valores de observaciones fuera de la muestra que se ha utilizado en la


estimacin de la variable endgena. Para ello se requieren tres condiciones:

1) Buen comportamiento del modelo a lo largo del perodo muestral

2) Conocer lo ms exactamente posible los valores que tomarn las variables


explicativas en el perodo de prediccin.

3) Que el modelo mantenga la misma estructura en el perodo de prediccin que en el


muestral.

Punto de partida:

Sea el modelo: Yi = X i' + i que cumple las hiptesis clsicas


Y = X '
i i

Si esa relacin se mantiene para el perodo de prediccin : Yp = X 'p + p


siendo Yp y X 'p los valores que toma la variable endgena fuera de la muestra y el
vector fila formado por los valores que toman las variables explicativas, respectivamente.

( ) ( ) ( ) (
Donde: E p = 0 , Var p = 2 , Cov j p = E j p = 0 j = 1....N )
Definimos:
Predictor: Yp = X p un estimador del valor a predecir.
Error de prediccin: f diferencia entre el predictor y lo que queremos predecir.
f es una variable aleatoria con media cero E ( f ) = 0 y varianza: 2f = E ( f E ( f ) )
2

Propiedades del predictor:

Yp es un estimador sesgado de Yp , por tanto, para analizar su precisin calculamos su


ECM:
( ) (
ECM Yp = E Yp Y p )2 = E( f )2 = 2f
( ) ( )
donde podemos comprobar que: f = Yp Y p = X 'p p = X p ( X ' X )1 X ' p
Y, por tanto:
( ) ( )( )
ECM Yp = 2f = E Yp Y p Yp Y p = 2 (1 + X 'p ( X ' X )1 X p )
'

S 2f = S 2 (1 + X 'p ( X ' X ) X p )
1

21
Econometra Curso 2011-2012

Queremos predecir Predictor Esperanza ECM


Valor Yp= X 'p +p Y p = X 'p X 'p 2 [1 + X 'p ( X ' X ) 1 X p ]
individual

3.2.- Intervalos de confianza y test de hiptesis para un valor individual

f (
N 0 , 2f )
S2 N2 k 1
N (0,1)
f

f 2 N k 1

N (0,1)
como = t N k 1
N2 k 1
N k 1
f
tenemos: t N k 1
Sf
donde :
f = Yp Y p y S f = S 1 + X 'p ( X ' X )1 X p

Intervalo de confianza para la prediccin de un valor individual:


Yp Y p
P t / 2 t / 2 = 1
S f

[
Por tanto, el I. C. de Yp vendr dado por: Yp t / 2 S f ]
Test de Hiptesis para la prediccin de un valor individual:
H o : Y p = Y po
H1 : Y p Ypo
- Yo
Y Ho

t N k 1
p p
Si la Ho es cierta:
Sf

3.3.- Evaluacin de la capacidad predictiva del modelo:

La capacidad predictiva se puede evaluar a partir de varios estadsticos. Los


estadsticos que computa EViews, suponiendo que el tamao del periodo de prediccin es
n, son:
n
f j2
j =1
Raz del error cuadrtico medio: RECM =
n

22
Econometra Curso 2011-2012

n
fj
j =1
Error absoluto medio: EAM =
n
1 n fj
Error absoluto medio del porcentaje de error: EAMP =
n j =1 Y j
Coeficiente de desigualdad de Theil:

(Y j Y j ) / n
n 2

j =1
U = 0U1
n n
Y j / n + Y j / n
2 2

j =1 j =1

Todos los estadsticos descritos hasta ahora indican una mejor capacidad predictiva
del modelo cuanto ms cercanos a cero sean, lo que permite comparar un determinado
modelo con otros alternativos.

Descomposicin del error cuadrtico medio de prediccin:

1 n
Y
n j =1 j
Y =
j
2
(1
Y Y )
23
2
+ (1
S S )
23
Y Y
2
+ (
2 1 rY Y S Y S Y
1442443
)
componente sesgo componente var ianza componente cov arianza
El cociente entre cada uno de los componentes en la suma total se denomina
proporcin del sesgo, proporcin de la varianza y proporcin de la covarianza.
Cada una de estas proporciones vara entre cero y uno, siendo su suma la unidad
como es de esperar. Los dos primeros miden, respectivamente, las diferencias entre la
media y la varianza de la serie predicha ( Y$ ) y las de la serie observada (Y) en el periodo de
prediccin. Por tanto, lo deseable es que su valor sea pequeo. La ltima proporcin mide
la parte residual o no sistemtica de los errores de prediccin, en donde debera recaer la
mayor parte del error total cometido.

23
Econometra Curso 2011-2012

24
Econometra Curso 2011-2012

TEMA 4. VARIABLES FICTICIAS

1.- Introduccin
Las variables que hemos introducido como regresores en los temas precedentes son
variables de tipo cuantitativo. Sin embargo, en ocasiones existen factores de tipo cualitativo
que pueden ser relevantes para explicar el comportamiento de la variable endgena.
La inclusin de estos factores en un modelo economtrico se realiza a partir de la
construccin de lo que se conoce como variables ficticias, variables dicotmicas o variables
dummy que toman dos valores arbitrarios, normalmente 1 y 0, que corresponden a las
modalidades del factor, aunque no necesariamente ya que podrn tomar otros valores o ms
de dos.
Pueden utilizarse para recoger:
Efectos temporales:
Efectos espaciales:
Efectos de tipo puramente cualitativo.
Otro tipo de efectos: efectos estacionales, funciones escalonadas, etc
Ejemplo: Queremos explicar el salario de los empleados de varias empresas (Yi) en
funcin del nmero de aos de experiencia laboral (Xi) y del gnero (factor cualitativo con
dos modalidades: hombre/mujer).
0 hom bre
Di =
1 mujer

2.- Formas de introducir un factor cualitativo en el modelo de regresin


Las variables ficticias se pueden construir e incorporar de forma que acten en el
modelo de tres modos distintos. En el caso de un modelo de dos variables tendramos:

1.- Que afecte slo a la ordenada en el origen (Variables ficticias aditivas)


Si tenemos dos ecuaciones con la misma pendiente y diferente ordenada:

Yi=1 +Xi+i

Yi=2 +Xi+i

las dos ecuaciones se pueden expresar en una sola por medio de una variable ficticia:
Yi= 1 + Xi +Di +i

1 Yi = ( + ) + X i + i
1123

donde cuando Di =
2
0 Y = + X +
i 1 i i

1+ = 2 = 2-1

25
Econometra Curso 2011-2012

El coeficiente de la variable ficticia nos mide el efecto diferencial entre las dos
ordenadas en el origen, es decir, el efecto diferencial del valor esperado de la variable
dependiente por presentar una de las caractersticas del factor cualitativo respecto al hecho
de no presentarla.

2.- Que afecte slo a la pendiente (Variables multiplicativas o compuestas)


Si tenemos dos modelos con la misma ordenada en el origen y distinta pendiente:
Yi= +1Xi+i
Yi= +2Xi+i
las dos ecuaciones se pueden expresar en una sola por medio de una variable ficticia de la
forma:
Yi= +1 Xi + X i Di +i
123
Zi

1 Z i = X i
donde cuando Di =
0 Z i = 0
1 Yi = + ( 1
1 + ) X i + i
23

por tanto cuando Di =
0 Y = + X +
2

i 1 i i

1+ = 2 = 2-1
El coeficiente de la variable ficticia nos mide el efecto diferencial entre las
pendientes en los dos grupos, es decir, la diferencia de la influencia de la variable
explicativa sobre la variable endgena por presentar una caracterstica respecto de no
presentarla.
3.- Que afecte a ambas (ordenada y pendiente)
Si tenemos dos modelos con diferente ordenada en el origen y diferente pendiente:
Yi=1 +1Xi+i
Yi=2 +2Xi+i
las dos ecuaciones se pueden expresar en una sola por medio de una variable ficticia de la
forma:
Yi= 1 +1 Xi +Di+ X i Di +i
123
Zi

1 Yi = ( + ) + ( 1 + ) X i + i
1123 123
donde cuando Di = 2 2
0 Yi = 1 + 1 X i + i

Todos estos casos podran generalizarse para un modelo de k variables.


Para el caso de Variables ficticias que afectan al trmino independiente:

26
Econometra Curso 2011-2012

k
Yi =1 +Di + j X ji +i
j =1

Para el caso de variables ficticias que afectan a la pendiente depender de la variable


con la que se relacione la ficticia. Si es X1:
k
Yi = +1X1i + j X ji +DiX1i +i
j =2

Cmo introducir en el modelo un factor cualitativo con m modalidades?


Como regla general si tenemos m modalidades deberamos introducir m-1
variables ficticias.
1) Si las variables ficticias afectan a la ordenada, el nmero de variables ficticias a
introducir depender de que el modelo tenga o no trmino constante. Si el modelo tiene
trmino constante e incluimos tantas variables ficticias aditivas como modalidades tiene el
factor, caemos en la trampa de las variables ficticias que consiste en que la primera
columna de la matriz X ser combinacin lineal exacta de las columnas que contienen las
observaciones de las variables ficticias, por tanto, rg(X)<k+1 |XX|=0 y no se puede
invertir la matriz XX.
La regla para evitar la trampa es la siguiente: si el factor posee m modalidades
incluimos m-1 variables ficticias en el modelo (si hay varios factores cualitativos la regla
se aplica para cada uno de ellos). En caso de que el modelo no tenga trmino constante, el
nmero de variables ficticias sera igual al nmero de modalidades que tuvisemos.
2) Si las variables ficticias afectan a la pendiente del modelo tambin hay que utilizar esa
regla para no caer en la trampa de las variables ficticias, pero en ese caso
independientemente de que el modelo tenga trmino constante o no, ya que es la columna
de la variable X la que es combinacin lineal de las columnas de las ficticias.
Contrastes de hiptesis en modelos con variables ficticias
El estudio de la importancia de uno o varios factores cualitativos en un modelo
economtrico se realiza mediante el anlisis de la significacin de las variables ficticias que
utilizamos. Teniendo en cuenta los modelos considerados antes, podemos concretar dicho
anlisis en los siguientes contrastes:
1.- En modelos con variables ficticias que afectan al trmino independiente
H0: =0
H1: 0
estaramos contrastando si los dos modelos tienen la misma ordenada.
2.- En modelos con variables ficticias que afectan a la pendiente
H0: =0
H1: 0
En este caso estaramos contrastando si los dos modelos tienen la misma pendiente.

27
Econometra Curso 2011-2012

3.- En modelos con variables ficticias que afectan a pendiente y ordenada


0
H 0 : =
0
0
H1 :
0
y estaramos contrastando si los dos modelos tienen tanto la misma ordenada en el origen
como la misma pendiente.

3.- Formas de introducir varios factores cualitativos en el modelo de regresin

En el modelo tambin podemos introducir a la vez varios factores cualitativos, cada


uno con diversas modalidades, y podemos analizar adems las interacciones que se
producen entre esos factores cualitativos.
La forma de introducir ms factores cualitativos es similar a la introduccin de uno
de ellos y se aplican tambin las reglas vistas acerca de cuntas variables ficticias introducir
para un factor con m modalidades y de cmo realizar los contrastes de hiptesis.
Ejemplo: Supongamos que queremos estimar un modelo de determinacin de
salarios, para lo cual disponemos de una muestra de N trabajadores e informacin sobre el
salario que reciben, su categora profesional (empleado, tcnico y directivo) y el gnero.
Yi =0+ 1E1i + 2E2i+ 3Si +i
donde Yi es el salario
1 si el trabajador es mujer
Si =
0 si el trabajador es hombre
1 si el trabajador es tcnico
E1i =
0 en otro caso
1 si el trabajador es directivo
E 2i =
0 en otro caso
de esta forma el valor esperado de Yi en cada caso es:
Empleado Tcnico Directivo
Mujer 0+3 0+3+1 0+3+2
Hombre 0 0+1 0+2

La diferencia salarial entre hombres y mujeres viene dada por 3


independientemente de su categora profesional. Est claro que si 3 es <0 implica que el
salario de los hombres es superior al de las mujeres para la misma categora profesional.
Por otro lado, un contraste de discriminacin salarial respecto al gnero sera:
H0: 3 = 0
H1: 3 0
28
Econometra Curso 2011-2012

Un contraste de diferencias salariales respecto a la categora profesional sera:


0
H 0 : 1 =
2 0
1 0
H1 :
2 0
Efectos interaccin
El modelo que acabamos de plantear recoge que el hecho de ser hombre o mujer no
influye en la diferencia salarial segn la categora profesional. Sin embargo, podramos
estar interesados en estudiar el efecto que tiene sobre el salario recibido el hecho de ser
mujer o hombre con cierta categora profesional. En este caso, el modelo tendra que incluir
lo que se llama efectos interaccin entre variables ficticias y se especificara de la siguiente
forma:
Yi =0+ 1E1i + 2E2i+ 3Si +4E1iSi+5E2iSi +i
Ahora, el valor esperado de Yi en cada caso es:
Empleado Tcnico Directivo
Mujer 0+3 0+3+1+4 0+3+2+5
Hombre 0 0+1 0+2
La diferencia salarial entre hombres y mujeres ya no viene dada nicamente por 3,
sino tambin por 4 o 5, dependiendo de su categora profesional.

29
Econometra Curso 2011-2012

30
Econometra Curso 2011-2012

TEMA 5: ERRORES DE ESPECIFICACIN

Un error de especificacin es cualquier error que se pueda producir en la


especificacin del modelo economtrico. La especificacin de un modelo de regresin
consta de la formulacin de la ecuacin de regresin y de las afirmaciones o supuestos
acerca de los regresores y del trmino de perturbacin. En sentido amplio, existir un error
de especificacin siempre que sea incorrecta la formulacin de la ecuacin o uno de los
supuestos subyacentes (Kmenta, p.467).
Podemos mencionar los siguientes errores de especificacin:
1. Formulacin de la ecuacin:
1.1. Forma funcional. Representaciones grficas y contraste RESET.
1.2. Permanencia estructural. Contraste de estabilidad estructural y estimacin
recursiva.
2. Especificacin de la matriz X:
Omisin
Inclusin
X no estocstica. Contraste de exogeneidad.
Rango de X menor que K+1. Multicolinealidad.
3. Especificacin de la perturbacin
Perturbaciones no esfricas: Varianzas no constantes: heteroscedast.
Convarianzas no nulas: Autocorrelacin
Perturbaciones no normales. Contraste Jarque-Bera.

1.-Formulacin de la ecuacin

1.1. Errores de especificacin en la forma funcional

Una de las hiptesis clsicas que se realizan en el modelo de regresin es el de la


forma funcional lineal. La Teora Econmica a veces nos indica como es la relacin entre
las variables, pero otras veces tienen que ser los datos los que nos ayuden a decidir. La
especificacin incorrecta en la forma funcional genera estimadores sesgados e
inconsistentes.

31
Econometra Curso 2011-2012

Hay que tener en cuenta que hay varios tipos de modelos no lineales. Algunos
pueden ser tratados con las tcnicas vistas hasta ahora realizando algunas transformaciones
y teniendo en cuenta algunas diferencias2.

Deteccin de no linealidades en el modelo economtrico:

Contraste Reset de Ramsey:


Ramsey propuso una prueba general de errores de especificacin que puede ser
aplicada para la deteccin de no linealidades.
El contraste se basa en especificar un nuevo modelo alternativo al modelo inicial
(Y=X+ ) de la forma:
Y=X+Z+u
y contrastar la restriccin =0.
Ramsey sugiere incluir en Z potencias de los valores estimados de la variable
dependiente (los cuales son, por supuesto, combinaciones lineales de potencias y productos
cruzados de las variables explicativas), de modo que: Z=( Y 2 ,Y 3 ,Y 4 ,.. )
No se incluye Y porque existe correlacin perfecta de esta variable con la matriz X
y, por lo tanto, el modelo no se podra estimar.

1.2. Permanencia estructural3

Hasta ahora hemos supuesto que en el modelo de regresin especificado los


coeficientes se mantienen constantes para todo el periodo muestral. Sin embargo, es posible
que existan submuestras para las que el comportamiento del modelo sea diferente, es decir,
exista cambio estructural.
Deteccin de cambio estructural:

a).- Contraste de estabilidad estructural de Chow


Si no hay cambio estructural (modelo restringido)
Yi = 0 + 1 X 1i + ... + k X ki + i i=1...N
Si hay cambio estructural a partir del periodo N1
Yi = 01 + 11 X 1i + ... + k1 X ki + 1i i=1...N1

Yi = 02 + 12 X 1i + ... + k2 X ki + 2i i=N1+1...N (total N2 )

2
Ver el apndice 1 de este tema. Si las variables estn todas en logaritmos, los parmetros miden
elasticidades. En general, la elasticidad de Y respecto a X recoge la variacin porcentual de Y ante una
Y X
variacin porcentual de X: E=
X Y
3
Basado en Carrascal, U. y otros (2001). Anlisis economtrico con Eviews. Ed. RAMA.

32
Econometra Curso 2011-2012

Hiptesis del contraste


01 02 01 02
1 2 2
1
H0 = 1 = 1 H1 = 1 1
M M M M
1 2 1 2
k k k k
Estadstico de contraste
(er' er - (e1' e1 + e2' e2 )) / k + 1
FNk1++1N 2 -2 k -2
(e1' e1 + e2' e2 ) / N 1 + N 2 - 2k - 2

Nota 1: Es necesario que las observaciones de ambas submuestras sean suficientes para
estimar los modelos, es decir, N1>k+1 y N2>k+1. No obstante, el contraste se puede hacer
aunque en una de las dos muestras no haya suficientes grados de libertad, asignando cero a
la SCR correspondiente a esa muestra (Johnston, 1989, pg. 264 y ss.)
Nota 2: Una forma alternativa de llevar a cabo este contraste de Chow es mediante la
incorporacin de variables ficticias que recojan el cambio en los coeficientes del modelo.

b).- Estimacin recursiva


Esta tcnica es adecuada cuando trabajamos con datos temporales y se desconoce el
momento en el que se ha producido un cambio estructural. Consiste en la estimacin
secuencial del modelo especificado para distintos tamaos muestrales. Con cada estimacin
obtenemos un vector de estimadores (coeficientes recursivos), con el que podemos calcular
la prediccin de Y en el periodo siguiente, el error de prediccin correspondiente y los
llamados residuos recursivos. Si no existe un cambio estructural los coeficientes recursivos
se mantendrn constantes al ir aumentando la muestra secuencialmente y los residuos
recursivos no se desviarn de cero. Estos comportamientos se analizan mediante los
siguientes grficos:

33
Econometra Curso 2011-2012

* Grfico de los coeficientes recursivos. En l se muestran los coeficientes


recursivos junto con sus bandas de confianza ( dos veces su desviacin tpica).

1500000 1.1

1000000 1.0

500000 0.9

0 0.8

-500000 0.7

-1000000 0.6
75 80 85 90 95 75 80 85 90 95

Rec ursiv e C(1) Estimates 2 S.E. Rec urs iv e C(2) Estimates 2 S.E.

12000000 1200

10000000
800
8000000

6000000 400

4000000
0
2000000

0 -400
75 80 85 90 95 75 80 85 90 95

Rec ursiv e C(3) Estimates 2 S.E. Rec urs iv e C(4) Estimates 2 S.E.

* Grfico de los residuos recursivos. En l se muestran los residuos recursivos junto


con sus bandas de confianza ( dos veces su desviacin tpica).

600000

400000

200000

-200000

-400000
70 75 80 85 90 95

Recursive Residuals 2 S.E.

2.- Especificacin de la matriz X

2.1 Error por omisin de variables relevantes


Supongamos, que por error, omitimos de la parte sistemtica del modelo una serie
de variables que, en realidad, deberan estar especificadas por ser todas ellas relevantes. Es
decir:

34
Econometra Curso 2011-2012

Modelo correctamente especificado: [1] Y=X11+ X22+


Modelo estimado (con omisin): [2] Y=X11+ u donde u = X22+
En realidad, cuando cometemos un error de especificacin por omisin estamos
planteando un modelo restringido (bajo la restriccin 2 = 0 ) en el que la restriccin es
falsa.
Consecuencias:
a) El estimador restringido es sesgado (salvo la excepcin de que los dos bloques de
regresores sean ortogonales, es decir, que X 1' X 2 = 0) e inconsistente. Aunque tiene menor
varianza que el estimador del modelo correctamente especificado, como es sesgado, la
varianza no mide la precisin del estimador sino que la medira el ECM, que puede ser
mayor o menor (recordar propiedades del estimador restringido).
b) El estimador de la varianza de las perturbaciones, S2, tambin es sesgado e
inconsistente.
c) Al ser S2 sesgado el estimador de la matriz de varianzas y covarianzas de 1 : S b1b1
tambin ser sesgado: E( S b1b1 ) 2 ( X 1' X 1 ) 1

d) Los contrastes de hiptesis habituales sobre


no son vlidos porque la distribucin de
1
no es la habitual, ya que es sesgado.
1

e) El predictor Yp es un estimador sesgado de X p' .

2.2. Error por inclusin de variables irrelevantes

Supongamos ahora, que por error, incluimos en la parte sistemtica del modelo una
serie de variables que no son significativas. Es decir:
Modelo correctamente especificado: [1] Y=X11+
Modelo estimado (con inclusin): [2] Y=X11+ X22+
En este caso se estima un modelo donde no se incluye la restriccin cierta 2 = 0.
Los estimadores del modelo estimado seguirn siendo ELIO y consistentes y tambin lo
ser S2. El problema, por tanto, no est en las propiedades de los estimadores sino en su
eficiencia comparada con los estimadores del modelo correctamente especificado. Como ya
sabemos, el estimador mnimo cuadrtico restringido tiene siempre varianza ms pequea
que el mnimo cuadrtico ordinario sin restringir y, por lo tanto, en este caso ser ms
eficiente. Adems, los test de hiptesis son vlidos y el predictor es un estimador insesgado
del valor medio.
La deteccin de error de omisin o de inclusin consiste en aplicar los criterios de seleccin
del modelo adecuado.

2.3. Regresores estocsicos

La existencia de regresores estocsticos en el modelo economtrico rompe conla


hiptesis clsica de que la matriz X es determinista. El tratamiento de estos modelos se basa
fundamentalmente en analizar la relacin entre los regresores y la perturbacin. Existen
pruebas de hiptesis como el contraste de exogeneidad para su estudio.

35
Econometra Curso 2011-2012

2.4. Rango de X menor que K+1

El incumplimiento de la hiptesis de rango sobre X implica la existencia de


combinaciones lineales exactas sobre las variables explicativas, es decir, presencia de
multicolinealidad perfecta. Esta situacin, as como la presencia de relaciones entre los
regresores que no sean exactas se estudiarn en el tema Multicolinealidad.

3.- Especificacin de la perturbacin

3.1 Perturbaciones esfricas


La hiptesis de que E ( ' ) = 2 I es necesaria en la propiedad de optimalidad del
estimador de por MCO. Su incumplimiento genera estimadores insesgados, pero no
ptimos ni eficientes. El tratamiento de un modelo economtrico en el que se incumple
dicha hiptesis se realizar en los temas 7 y 8 del programa.

3.2. Perturbaciones no normales

La hiptesis de normalidad de la perturbacin aleatoria no se utiliza para la


obtencin de los estimadores MCO, por lo que dichos estimadores seguirn cumpliendo sus
propiedades aunque la perturbacin no sea normal. Sin embargo, bajo dicha hiptesis, los
estimadores de MCO coinciden con los estimadores MV, y tambin bajo dicha hiptesis se
construye todo el proceso inferencial sobre los modelos economtricos analizados.
El inclumplimiento de la hiptesis de normalidad hace que el estimador MCO no
sea el ms eficiente ni cumpla las propiedades adicionales de los EMV. Adems, los
estadsticos utilizados para realizar los contrastes de hiptesis, que seguan distribuciones
derivadas de la normal, como la t o la F, ya no seguirn, en general, distribuciones
conocidas. No obstante, asintticamente los contrastes habituales mantienen su validez.

Test de normalidad de Jarque-Bera


Este contraste analiza la normalidad de las perturbaciones a partir de la forma de la
distribucin de los residuos puesto que las perturbaciones son variables no observables.
Concretamente, examina sus discrepancias respecto a la curva campaniforme caracterstica
del modelo normal (distribucin simtrica y de kurtosis igual a 3).
As, se definen los coeficientes de asimetra g1 y de kurtosis g2::

Asimetra Kurtosis
N N
ei3 / N ei4 / N
g1 = i =1
3/ 2
g2 = i =1
2
N
N

ei / N ei / N
2 2

i =1 i =1

g1=0 Distribucin simtrica g2=3 Distribucin mesocrtica

g1>0 Distrib. con asimetra positiva g2>3 Distrib. Leptocrtica

g1<0 Distrib. con asimetra negativa g2<3 Distrib. Platicrtica

36
Econometra Curso 2011-2012

El contraste plantea en la hiptesis nula la normalidad de la perturbacin, siendo el


estadstico de Jarque-Bera:

d JB =
N k 1 2 1
6 4
( )2
g1 + g 2 3 2

2

Este estadstico adoptar valores pequeos si la distribucin observada de los


residuos es aproximadamente simtrica y mesocrtica (valores de g1 y g2-3 cercanos a
cero). En otro caso, a medida que se detectan asimetras (positivas o negativas) o
desviaciones en la kurtosis, aumenta su valor. Por lo tanto, aceptaremos H0 cuando dJB <
22 ( ) y rechazaremos en caso contrario.

TABLA RESUMEN
Error de especificacin cmo detectarlo?
1. Formulacin del modelo
a) Forma funcional Test RESET de Ramsey
b) Forma estructural * Test de Chow
Cambio/permanencia * Estimacin recursiva
En general, el test RESET de Ramsey puede
2. Especificacin de la matriz de regresores detectar cualquier tipo de error de
especificacin en un modelo
a)Omisin de variable relevante *E-views (test Wald de omisin de v.
relevante)
b)Inclusin de variable irrelevante *E-views (test Wald de inclusin de v.
irrelevante)
c)Rango de la matriz X (Multicolinealidad) *Indicios de multicolinealidad (tema 6)

d) X no estocstica
3. Hiptesis sobre las perturbaciones

a)Normalidad Test Jarque-Bera

b)Homoscedasticidad Varios contrastes (tema 7)

c)Incorrelacin Varios contrastes (tema 8)

37
Econometra Curso 2011-2012

38
Econometra Curso 2011-2012

Apndice 1.- Modelos no lineales


A) No linealidad en las variables:
* En las variables explicativas
Ej: Yt = 0 + 1 e X 1t + 2 X 22t + t . Basta con definir nuevas variables de la forma:
Z 1t = e X 1t y Z 2 t = X 22t
* En las variables explicadas
Ej: YtXt + 1lnYt = 2Xt + t. Sera imposible expresar Y como funcin de los
vectores X y .
B) No linealidad en los parmetros:
1.b) Modelos intrnsecamente lineales
Son modelos fcilmente linealizables mediante sencillas transformaciones.
Ejs: Yt = 0 X t1 t lnYt = ln0 +1lnXt +lnt Yt* = 0* + 1 X t* + t*
Funcin de produccin Cobb-Douglas: Qt = AK t Lt t
lnQt = lnA +lnKt +lnLt+lnt Qt* = + K t* + L*t + t*
Se estima el modelo transformado y una vez conocidos los estimadores, se deshacen los
cambios. As:

* = ln
* = e *0
= anti log
0 0 0 0

1 no hay que realizar ningn cambio


Interpretacin de los parmetros en los modelos no lineales
La hiptesis de linealidad del MRLC supone la existencia de una relacin lineal en los
parmetros que unen a las variables, pero no significa que esa linealidad tenga que darse
entre las variables. En Economa, las relaciones entre las variables no siempre son lineales.
As, por ejemplo, la demanda de un producto no tiene porque estar en relacin lineal directa
con la renta, si el incremento en la renta no supone un incremento equivalente en el
consumo del producto.

Otras formas funcionales


Modelo Pendiente Elasticidad4
Lineal en 1Y / X 1
ln Yt = 0 + 1 ln X 1t + t
logaritmo
Semilog en Y ln Yt = 0 + 1 X 1t + t 1Y 1 X (*)
Semilog en X Yt = 0 + 1 ln X 1t + t 11 / X 11 / Y (*)

Recprocos Yt = 0 + 11 / X 1t + t 11 / X 2 11 / XY (*)
(*) Indica que el coeficiente de la pendiente vara dependiendo del valor asumido para X, Y o ambas.
Cuando no se especifica ningn valor de X o Y, las elasticidades suelen medirse en los valores medios de
las variables.
Fuente: Gujarati (2006): Principios de Econometra, pg. 275.

4
La elasticidad de Y respecto a X recoge la variacin porcentual de Y ante una variacin porcentual de X,
Y X
E= .
X Y

39
Econometra Curso 2011-2012

Propiedades de los estimadores


a) Si los parmetros no sufren transformacin, los estimadores conservan las propiedades
de MCO.
b) Si sufren transformaciones lineales (sumas y restas) los estimadores conservan las
propiedades de los estimadores de MCO pues la esperanza es un operador lineal.
c) Si se realizan transformaciones logartmicas, los estimadores no conservan las
propiedades finitas, pero dado que los estimadores de MCO coinciden con los de MV y
estos tienen la propiedad de la invarianza, se mantendran las asintticas.
Problemas con el coeficiente de determinacin
a) Si el regresando no sufre modificacin, el R2 encontrado para el modelo transformado
sirve tambin para medir la bondad del ajuste.
b) Pero si existe transformacin en el regresando, el R2 nos medir la bondad del ajuste del
modelo transformado, es decir, no nos medir la variabilidad de Y sino por ejemplo del
lnY.

b.2) Modelos intrnsecamente no lineales


Son aquellos modelos que no se pueden linealizar mediante transformaciones sencillas. Son
de la forma:
Ejs. Yt = 1 X t 2 + t
[
Funcin de produccin CES: Yt = L p + (1 ) K p ]
n/ p

40
Econometra Curso 2011-2012

TEMA 6: MULTICOLINEALIDAD

6.1.- Ortogonalidad versus multicolinealidad perfecta

Una cuestin importante que debe analizarse al estudiar los resultados de un modelo
de regresin es el grado de relacin lineal existente entre las observaciones de las variables
explicativas, siendo tres las situaciones posibles con las que nos podemos encontrar.
Ortogonalidad: supone la ausencia de relacin lineal entre algunos o todos los
regresores incluidos en el modelo, es decir, implica incorrelacin entre los regresores.
Multicolinealidad perfecta: se da cuando existe una relacin lineal exacta entre
algunos o todos los regresores incluidos en el modelo.
Multicolinealidad imperfecta: consiste en la existencia de una relacin lineal fuerte
entre los regresores del modelo.
A continuacin vamos a analizar las consecuencias de estas tres situaciones
centrndonos sobre todo en la multicolinealidad imperfecta que es la situacin ms
frecuente.
Ortogonalidad : Se dice que dos regresores son ortogonales cuando estn linealmente
incorrelacionados, es decir, cuando su coeficiente de correlacin lineal, o su covarianza es
cero. As, Xh y Xj son ortogonales si rxh x j = 0 .

Dos grupos de regresores son ortogonales si X 1' X 2 = 0 , lo que significa que cada
regresor del primer bloque est incorrelacionado con cada regresor del segundo bloque.
Particularidades del modelo con regresores ortogonales:
Sea el modelo particionado: Y = X 1 1 + X 2 2 +
Los EMCO de los parmetros de este modelo coinciden con los que obtendramos
efectuando la regresin individual de Y sobre cada uno de los bloques:
Los estimadores de los parmetros del modelo particionado en la regresin
Y
R
X 1 X 2 son:

( )
1 1 1
1 X 1' X 1 X 1' X 2 X 1'Y X 1' X 1 0 X 1'Y X 1' X 1 X 1'Y
= = '
' = ' =
2 X 2 X1
X 2' X 2 X Y 0
2 X 2' X 2 X Y X'X
2 2 2 ( )
1
X 2' Y

Los estimadores de los parmetros de las regresiones individuales son:

Y

R
X1 Y = X 1 1 + u (
b1 = X 1' X 1 ) 1
X 1'Y

Y

R
X2 Y = X 22 + v (
b2 = X 2' X 2 ) 1
X 2' Y
Por lo tanto, se obtienen los mismos resultados.
Sin embargo, si los regresores no son ortogonales, no se obtienen los mismos
resultados, sino que en la regresin conjunta, cada uno de los dos estimadores
depende de toda la matriz X, por tanto de X1 y de X2, debido a que X 1' X 2 0

41
Econometra Curso 2011-2012

Las varianzas de los estimadores tambin coinciden con las calculadas al hacer las
regresiones individuales pero no los estimadores de esas varianzas:
1 1
X 1' X 1 0 2 X1X1
'
0 e'e
0
= 2

X 2' X 2
, S
= S
0

X 2' X 2
siendo S 2
=
N K 1

Haciendo las regresiones individuales:

b1b1
(
= 2 X 1' X 1 )
1
b2b2
(
= 2 X 2' X 2 ) 1

S b1b1 = S1 X X 1
2
( '
1 )
1
siendo S1
2
=
u ' u
N K1 1

2
(
S b2b2 = S 2 X 2' X 2 )
1
siendo S2 =
2 v ' v
N K2 1

Multicolinealidad Perfecta: Cuando la relacin que liga a dos o ms variables explicativas


es una relacin lineal exacta, es decir, las columnas de la matriz X son linealmente
dependientes. En este caso se deja de cumplir la hiptesis clsica Rg(X) = k+1, de modo
que:
Rg(X) < k+1 XX= 0
Y por tanto los estimadores mnimos cuadrados ordinarios no se pueden calcular.
Es, en definitiva un grave problema pero fcilmente detectable, as que si
conocemos la relacin lineal entre las variables es muy fcil de corregir, bastar con
eliminar una cualquiera de las variables correlacionadas sin sufrir ninguna disminucin en
la capacidad explicativa o predictiva del modelo
La multicolinealidad normalmente, es un problema meramente muestral.
Multicolinealidad Imperfecta o fuerte: cuando la relacin entre las variables es muy
fuerte pero no perfecta, es decir, los coeficientes de correlacin lineal no son igual a 1 o -1
pero se aproximan bastante. En este caso XX0 por lo tanto no existen razones, a priori,
para no poder estimar el modelo.
Los estimadores sern ELIO siempre que el modelo cumpla las hiptesis clsicas y
coincidirn con los mximo verosmiles, aunque en la prctica esto puede tener poco valor
debido a las consecuencias que este problema genera.
Causas de la multicolinealidad imperfecta:
Existencia de alguna relacin causal entre dos variables explicativas (o ms).
En economa, la mayora de las variables explicativas estn, de alguna manera
correlacionadas. Cuando trabajamos con series temporales, la mayora de las
variables econmicas tienen una tendencia creciente, Granger y Newold
demostraron que basta con introducir una tendencia lineal en dos series temporales
independientes para que su correlacin aumente considerablemente, por tanto, la
existencia de esa tendencia puede ser la causa de un problema de multicolinealidad.

42
Econometra Curso 2011-2012

Existencia de una variable explicativa con escasa variabilidad en su serie. Es decir,


si X ji X j i en un modelo con trmino constante, esto implicara que la
columna correspondiente a Xj sera proporcional al regresor falso (Xoi=1):
X ji X oi X j

Existencia de variables explicativas retardadas.

6.2.- Consecuencias de la multicolinealidad imperfecta

1) Dificultad para interpretar los coeficientes, y por tanto, sus estimaciones. Los
coeficientes de regresin ( j ) se interpretan como el cambio que se produce en Yi
al variar Xji en una unidad, permaneciendo el resto de variables explicativas
constantes. Cuando existe multicolinealidad imperfecta carece de sentido suponer
que, cuando una variable explicativa se modifica, el resto de las variables
permanecen constantes, al existir altas correlaciones entre ellas. Por este motivo, los
parmetros pierden este significado y, por lo tanto, tambin sus estimaciones.
2) La multicolinealidad afecta a la precisin de los estimadores ya que sus varianzas
toman valores grandes. Se puede ver, por un lado, a partir del determinante de XX,
que es relativamente pequeo y, por otro, analizando la varianza de un estimador de
la siguiente manera: Planteamos un modelo particionado en el que el 2 bloque est
formado por un nico regresor: Y = X 1 1 + X 2 2 +

2
En ese caso: Var 2 =
(1 R 2
X 2 X1 )N S 2
X2

S2
S 2 =
Y su estimador:
2
(1 R 2
X 2 X1 )N S 2
X2

Las varianzas de los estimadores pueden ser grandes como consecuencia de:
Valores grandes del S2
Fuerte correlacin entre X2 y X1 : valores grandes de R X2 2 X1

Poca variabilidad en X2: S X2 2 pequea

Tamao muestral pequeo


Esto implica que no siempre que las varianzas de los estimadores sean grandes ser
como consecuencia de la multicolinealidad, aunque cuando la haya las varianzas pueden
tomar valores ms grandes de lo que seran si no la hubiese.
3) Valores muestrales de los estadsticos t pequeos, lo que implica que es muy dificil
rechazar cualquier contraste de no singnificacin de las variables
4) No afecta al R2 ya que ste mide el efecto conjunto de todos los regresores sobre el
regresando y la multicolinealidad afecta a los valores individuales de los regresores,
por tanto la regresin podr ser significativa a pesar de la existencia de
multicolinealidad.
5) Los puntos 3 y 4 nos pueden llevar a rechazar la significacin individual de todos
los regresores y sin embargo no rechazar la significacin conjunta de todos ellos.

43
Econometra Curso 2011-2012

6) Sensibilidad de los EMC a los pequeos cambios en las muestras, como la


incorporacin o eliminacin de unas pocas observaciones o a la eliminacin de una
variable aparentemente no significativa.
7) No afecta a las predicciones

6.3.- Procedimientos para detectar la multicolinealidad

La simple lgica permite, algunas veces, saber si existe o no una relacin causal entre
ellas. Por ejemplo, si dos variables explicativas son la poblacin y el empleo, el
presupuesto nacional y el PNB, etc.
Grandes varianzas. Indicio poco fiable por s solo.
Altos coeficientes de correlacin lineal. Si el modelo tiene 2 regresores este coeficiente
es un buen indicio pero si tiene ms de dos regresores, los coeficientes de correlacin
altos son una condicin suficiente para la existencia de multicolinealidad pero no
necesaria, ya que sta puede existir aunque los coeficientes de correlacin sean
comparativamente bajos.
Coeficientes de correlacin mltiple entre los regresores grandes: R X2 j X1....

Estos coeficientes miden la correlacin que existe entre un regresor y todos los dems.
Se puede calcular como coeficiente de determinacin en la regresin auxiliar de cada
regresor frente a los otros.
Estadsticos t pequeos y F grandes
Factor de inflacin de la varianza: FIV
1
Este factor se define como el cociente: FIV j =
1 R X2 j X1 .....

Como 0 R X2 j X 1 .... 1 FIV j 1

Si las variables fuesen ortogonales R X2 j X 1 .... = 0 FIV = 1

Cuando R X2 j X 1 .... 1 FIV

Si expresamos la varianza del estimador de un parmetro cualquiera como vimos antes


2
Var j =
(1 R 2
X j X 1 ... X k )N S 2
Xj
, el factor de inflacin de la varianza mide la influencia que

tiene la relacin entre Xj y las dems variables sobre la varianza de j . Cuanto mayor sea
este factor, mayor es la varianza del estimador.
El factor de inflacin de la varianza se puede interpretar como cociente de dos varianzas del
estimador:
o Su varianza real 2
j

o La varianza que tendra si hubiera ortogonalidad 2 ( )j ortog

44
Econometra Curso 2011-2012

Si hay ortogonalidad, el FIV vale uno, luego 2 ( ) j ortog


=
2
N S X2 j

Si hacemos el cociente entre las dos varianzas tenemos


2
2 (1 R 2
)N S 2

( )
X j X 1 ... X k Xj 1
= =
(1 R ) = FIV
j

2
j
2 2
X j X 1 ... X k
ortog
N S X2 j

Esto nos permite interpretar este factor de la siguiente forma:


Supongamos que R X2 j X 1 .... = 0.5 FIV = 2 , es decir, la varianza de j es el doble del
valor que tomara en el caso de ortogonalidad entre los regresores.
Si R X2 j X 1 .... = 0.999 FIV = 1000 , la varianza es 1000 veces mayor que la que se
tendra en caso de ortogonalidad (con el mismo N , 2 , y S X2 j ).

6.4.- Soluciones a la multicolinealidad

Las soluciones ms frecuentes aunque no las nicas son:

1) Aumentar el tamao de la muestra. Esta podra ser una solucin siempre que la
multicolinealidad fuera un problema muestral.
2) Eliminacin de variables: Eliminar aquella o aquellas variables colineales. El
inconveniente de este mtodo es que podramos caer en graves problemas de errores
de especificacin por omisin. Este error sera tanto menor cuanto mayor fuese la
correlacin lineal entre la variable omitida y las incluidas y por tanto tambin ser
menor el sesgo de los estimadores.
3) Utilizacin de informacin a priori: Consiste en incorporar al modelo algn tipo de
informacin estableciendo restricciones sobre los parmetros del modelo.
4) Transformacin de variables: Si la multicolinealidad se presenta en modelos con una
muestra de series temporales la tendencia aproximadamente comn en los
regresores podra ser la principal causa del problema. En este caso una forma de
eliminar esa tendencia es trabajar con la series en primeras diferencias y de esa
forma no solo se eliminara la tendencia sino que la correlacin entre los regresores
disminuira. Tambin se podra trabajar con ratios.

45
Econometra Curso 2011-2012

46
Econometra Curso 2011-2012

ANEXO. INSTRUMENTOS MATEMTICOS Y ESTADSTICOS BSICOS


ELEMENTOS DE LGEBRA MATRICIAL

MATRIZ.- Se llama matriz a una agrupacin rectangular de nmeros ordenados en filas y


columnas (aij) donde el primer subndice indica la fila y el segundo la columna.
a11 a12 ...... a1n

a 21 a 22 ...... a 2n
A= . . .
......
. . .
a m1 a m2 ...... a mn

En Econometra, por comodidad, la notacin que seguiremos ser: (xij) donde el


primer subndice indica la columna y el segundo la fila a la que pertenece.
x11 x 21 ...... x k1

x12 x 22 ...... x k 2
X = . . .
......
. . .
x1T x 2T ...... x kT

ORDEN de una matriz.- Una matriz con T filas y K columnas se dice que es de orden T por
K, (TxK).
RANGO de una matriz.- Se define como el mximo nmero de columnas o filas, de X,
linealmente independientes. Corrientemente se dice que es el ORDEN del mayor MENOR
no nulo. Donde los MENORES son los determinantes (nxn) que se puede formar.
PROPIEDADES: Si A es una matriz nxm de rango m<n, entonces A'A es definida positiva y
AA' es semidefinida positiva. (Johnston, p. 182).
Si A es una matriz nxm de rango m<n, entonces A' es de rango m y la matriz resultante de
premultiplicar a A por su transpuesta (A'A) tambin es de rango m.
MATRIZ CUADRADA.- Es aquella que tiene el mismo nmero de filas y de columnas.
MATRIZ DIAGONAL.- Aqulla cuyos nicos elementos distintos de cero estn en la
diagonal principal.
MATRIZ NO SINGULAR.- Aqulla matriz cuadrada cuyo determinante es distinto de
cero.
MATRIZ IDENTIDAD.- Aqulla cuyos elementos de la diagonal principal son la unidad y
el resto ceros. Se cumple que AI = I.A = A.
OPERACIONES CON MATRICES
SUMA DE MATRICES.- Para sumar dos matrices deben tener el mismo orden. Se suma
cada elemento de la primera con su correspondiente elemento en la segunda.
PROPIEDADES: Conmutativa: A+B=B+A; Asociativa: A+(B+C)=(A+B)+C
MULTIPLICACIN POR UN ESCALAR: Se multiplica el escalar por todos los elementos
de la matriz. Admite la propiedad distributiva: a(A+B)= aA+aB

47
Econometra Curso 2011-2012

MULTIPLICACIN DE MATRICES.- Tiene que guardar la condicin de orden, es decir,


el nmero de columnas de la primera ha de ser igual al nmero de filas de la segunda. Se
multiplican filas por columnas.
PROPIEDADES.- No cumple la propiedad conmutativa, AB BA, pero s la distributiva
A(BC)=(AB)C
MATRIZ TRASPUESTA.- Es la que se obtiene cambiando filas por columnas y columnas
por filas.
PROPIEDADES.- (A) = A ; (A+B) = A + B ; (ABC) = CBA
MATRIZ SIMTRICA.- Aqulla que es igual a su traspuesta A = A
MATRIZ IDEMPOTENTE.- Aqulla que al multiplicarla por s misma se reproduce
AA=A
MATRIZ INVERSA.- Dada una matriz A, llamamos matriz inversa de A y la denotamos
como A-1, a aqulla que cumple AA-1 = I y A-1A= I
A tiene inversa si y slo si el determinante de A es distinto de cero.
CLCULO DE LA MATRIZ INVERSA: En primer lugar se calcula la matriz de adjuntos
de los elementos de A, y luego se divide por el valor del determinante.
La matriz adjunta es la traspuesta de la formada por los adjuntos (valor del determinante
suprimida la fila y la columna correspondiente, con el signo ms o menos dependiendo de
que la suma de lo subndices sea par o impar).
PROPIEDADES DE LA MATRIZ INVERSA: (A-1) -1 = A ; (AB)-1 = B-1 A-1 ; (ABC)-1
= C-1B-1A-1 siempre que las matrices sean invertibles.
TRAZA DE UNA MATRIZ.- Es la suma de sus elementos diagonales.
PROPIEDADES:
tr(A+B) = tr(A) + tr(B) ; tr(dA) = dtr(A)
tr(A) = tr A ; tr(AB) = tr(BA)
tr(ABC) = tr(CAB) = tr(BCA) ; E [tr ( A)] = tr [E ( A)]
MATRIZ DEFINIDA POSITIVA.- Dada una matriz cuadrada A de orden nxn y un vector x
de orden nx1, decimos que A es definida positiva si xAx es mayor que cero.
PROPIEDAD: Los elementos de la diagonal principal de A son mayores que cero.
MATRIZ DEFINIDA NO NEGATIVA O SEMIDEFINIDA POSITIVA.- Dada una matriz
cuadrada A de orden nxn y un vector x de orden nx1, decimos que A es semidefinida
positiva si xAx son mayores o iguales a cero.
PROPIEDAD: Los elementos de la diagonal principal de A son mayores o iguales que cero.
SISTEMA DE ECUACIONES LINEALES.- Si tenemos una serie de ecuaciones lineales
Y
que podemos expresar en trminos matriciales Y = A x entonces = A' .
( nx1) ( nxm ) ( mx1) x
FORMA CUADRTICA DE ECUACIONES.- Si tenemos una forma cuadrtica como
y
y = x' A x entonces se cumple que = 2 Ax .
(1 x1) (1 xm ) ( mxm ) ( mx1) x

48
Econometra Curso 2011-2012

CONCEPTOS BSICOS DE ESTADSTICA DESCRIPTIVA


Dados n datos x1, x2,,xn de una variable X
n
xi
Media aritmtica: X = i =1
n

(xi X )
n n
2
xi2 nX 2
Varianza muestral: S x2 = i =1
= i =1
n n

(xi X )
n n
2
xi2 nX 2
Cuasivarianza muestral: S x2 = i =1 = i =1
n 1 n 1

Desviacin tpica muestral: S x = + S x2

(xi X )(yi Y ) xi yi nXY


n n

Covarianza muestral: S xy = i=1 = i =1


n n

Donde y1, yn son n datos de la variable Y


S xy
Coeficiente de correlacin lineal rxy =
SxS y

DISTRIBUCIONES DE FORMAS LINEALES Y CUADRTICAS EN VECTORES


NORMALES
1) Supongamos una forma lineal Y=CX+b
donde: C es una matriz , X un vector normal T dimensional y b un vector de
constantes
si X N ( , ) Y N (C + b, C ' C )
2) Supongamos una forma cuadrtica idempotente XAX en vectores normales
donde A es una matriz idempotente lo que implica que rango(A)=traza A y X es un
vector normal
a) si X N (0, I ) y el rango(A) =r,

la forma cuadrtica idempotente X ' AX r2

b) si X N (0, 2 I ) y el rango(A) =r,

la forma cuadrtica idempotente X ' AX 2 r2


c) si X N ( , ) siendo la media y la matriz de varianzas covarianzas

la forma cuadrtica ( X ) ' 1 ( X ) rg2 ( )

cuando = 0 la forma cuadrtica X ' 1 X rg2 ( )

INDEPENDENCIA ENTRE FORMAS LINEALES Y CUADRTICAS EN


VECTORES NORMALES
a) Independencia entre una forma lineal y una forma cuadrtica en el mismo vector
normal

49
Econometra Curso 2011-2012

Sea X un vector: X N (0, I ) o bien X N (0, 2 I )


A una matriz idempotente y simtrica tal que rango(A)=r y B una matriz cualquiera
Bajo estos supuestos, la forma lineal BX y la forma cuadrtica idempotente XAX
son independientes si se verifica que BA=0.
b) Independencia entre formas cuadrticas idempotentes en el mismo vector normal
Sea: X N (0, I ) o bien X N (0, 2 I )
A y B dos matrices simtricas e idempotentes y por tanto XAX y XBX dos formas
cuadrticas idempotentes en el vector X. Ambas formas son independientes si:
AB=BA=0

DISTRIBUCIONES 2 DE PEARSON, T DE STUDENT Y F DE SNEDECOR


Distribucin 2 de Pearson
Sea XN(0,1). Decimos que Y=X2 sigue una distribucin 12 de Pearson.

Propiedad: Si X1,...Xn v.a.i.i.d con distribucin N(0,1), entonces X = X 12 + ... + X n2 n2


Distribucin t de Student
Sean X, X1,X2,...,Xn n+1 v.a.i.i.d con distribucin N(0,1). Entonces
X
T= t n se distribuye como una t de Student.
X 12 + ... + X n2
n
Distribucin F de Snedecor
Sean X1,X2,...,Xn, e Y1,Y2,...,Yn n1+n2 v.a.i.i.d con distribucin N(0,1). Entonces
X 12 + ... + X n21
n1
U = Fn1 ,n2 se distribuye como una F con n1 y n2 grados de libertad.
Y12 + ... + Yn22
n2

X
n
Propiedad: Sean X e Y v.a.i. tal que X n21 e Y n22 , entonces U = 1 Fn1 ,n2
Y
n2
CONVERGENCIAS Y TEOREMA DEL LMITE
Convergencia en probabilidad: Una sucesin {X n }n =1 converge en probabilidad hacia la

variable X, X n c
. p.
X , si para cualquier >0,

lim p[ X n X > ] = 0 , o bien si p lim X n = X .


n

Propiedades
1.- X n c
. p.
X X n X c
. p.
0

2.- X n c
. p.
X y g una funcin continua g ( X n ) c
. p.
g(X )

50
Econometra Curso 2011-2012

Convergencia en media cuadrtica: Una sucesin {X n }n =1 converge en media cuadrtica


hacia la variable X, X n m
.c .
X , si

[
lim E X n X
n
2
]= 0
Propiedades
1) Una condicin suficiente pero no necesaria para la convergencia en probabilidad es que
se d la convergencia en media cuadrtica. Es decir , si X n m
.c .
X X n c
. p.
X.

2) {X n }n =1 converge en media cuadrtica a X si y slo si el lim E ( X n ) = X



y el
lim Var ( X n ) = 0 .

Convergencia en ley o en distribucin: Una sucesin {X n }n=1 converge en ley o en


distribucin hacia la variable X, X n

L
X , si

lim Fn ( x) = F ( x)
n

x en los que la funcin de distribucin F sea continua.


Propiedades
1) Si X n

L
X decimos que Xn se distribuye asintticamente como X, es decir,
Xn

a
X.

3) Si X n m
.c .
X X n c
. p.
X Xn

L
X
Ley de los grandes nmeros
Los momentos muestrales de una sucesin de variables aleatorias independientes e
igualmente distribuidas convergen en probabilidad a los correspondientes momentos
poblacionales.
Teorema del lmite central
Sea {X n }n =1 una sucesin de v.a.i.i.d. con E(Xi)= y Var(Xi)=2. Entonces

n n n
X i E X i X i n
i =1 i =1 = i =1
N (0,1)
L

n n
Var X i
i =1

o lo que es lo mismo, X n

a
N ( , ).
n
LGEBRA DE LOS LIMITES EN PROBABILIDAD (PLIM)
Sean XT e YT dos sucesiones de variables aleatorias tales que plim XT = c, plim YT = d.
1.- plim (XT + YT) = plim XT + plim YT = c + d.
2.- plim XT.YT = plim XT . plim YT = c .d.

51
Econometra Curso 2011-2012

XT p lim X T c
3.- p lim = = si p lim YT 0
YT p lim YT d

4.- ( )
p lim X TS = ( p lim X T )S
5.- Si plim (XT - YT ) = 0 y plim XT = c, entonces plim YT = c.
Teorema de Slutsky
Sea XT una sucesin de variables aleatorias tales que plim XT = c, e YT = (XT) una
funcin continua en c que no depende de T, entonces plim YT = (c).
1
X X X X
Ejemplo: Si p lim = P, p lim = P 1 siempre que P sea una matriz no singular.
T T
ELEMENTOS BSICOS SOBRE CONTRASTES
Hiptesis estadstica: Es un enunciado sobre los valores de algunos de los parmetros en la
poblacin hipottica de la cual se toma la muestra.
Hiptesis puntual: es aquella en la que se plantea contrastar un valor especfico para un
parmetro.
Hiptesis de intervalo: es aquella en la que se plantea contrastar si el parmetro se
encuentra en un intervalo especfico.
Contraste de hiptesis: es la regla que nos permite dilucidar la validez de una hiptesis en
base a la evidencia emprica.
Hiptesis nula: es la hiptesis sometida a anlisis y se designa por Ho.
Hiptesis alternativa: es la hiptesis contra la que suele probarse la hiptesis nula y se
designa por H1 o HA.
Al contrastar una hiptesis cabe adoptar dos decisiones: por un lado, podemos rechazarla o
no rechazarla y, por otro, dicha hiptesis puede ser cierta o falsa. Por ello, las
consecuencias de la decisin se pueden esquematizar de la siguiente forma:

Ho cierta Ho falsa
No Rechazar Decisin correcta Error de II tipo
Rechazar Error de I tipo Decisin correcta

Nivel de significacin del contraste: Se denota con la letra (tambin se denomina tamao
del contraste) y se define como la probabilidad de rechazar la Ho siendo cierta, lo que
ocurrir cuando la observacin muestral pertenezca a la regin crtica.
= P{error de I tipo}=P{rechazar Ho| si Ho es cierta}
Potencia del contraste: se denota como (1-), siendo la probabilidad de cometer el error
de tipo II y se define como la probabilidad de no rechazar la hiptesis nula cuando sta es
falsa. As, una vez fijado , de todas las regiones crticas con el mismo nivel de
significacin, elegiremos aquella donde la potencia del contraste sea mayor, es decir que
sea menor.
= P{error de II tipo}=P{No rechazar Ho| si Ho es falsa}

52
Econometra Curso 2011-2012

Regin crtica: es aquella zona del espacio muestral donde se rechaza Ho. Si la observacin
muestral realizada pertenece a ella, entonces se rechaza la Ho.
Regin de aceptacin: es la complementaria a la regin crtica, es decir donde no se rechaza
la Ho.
Valor crtico: es el valor de la distribucin obtenido en las correspondientes tablas, fijado
un nivel de significacin, que separa la regin crtica de la regin de aceptacin.
La tcnica de los contrastes consiste en delimitar estas dos regiones y ver donde cae el valor
muestral obtenido.
P-valor: es el valor de probabilidad y describe el nivel de significacin exacto asociado con
un resultado economtrico particular. Por tanto es la probabilidad de rechazar de forma
incorrecta una hiptesis nula que es cierta. Cuanto menor sea el valor p ms seguros
estaremos al rechazar la hiptesis nula.
Nivel de confianza (1-): nos indica la proporcin aproximada de veces que el parmetro i
se encontrara en el intervalo si calculsemos el intervalo con muchas muestras diferentes.
Intervalo de confianza: es un intervalo numrico en el que creemos que se encontrara el
parmetro con un cierto grado (nivel) de confianza.
Intervalo de Probabilidad: es un intervalo aleatorio que se concreta en un intervalo de
confianza cuando disponemos de una realizacin muestral.

53

You might also like