You are on page 1of 32

Jorge Salgado Sistema de Ecuaciones STATA

g
i
n
a
1









Prctica Emprica: Sistema de Ecuaciones de
Demanda y Precios en el Mercado Espaol de
Transporte Areo


Jorge Salgado

15 de diciembre de 2011


1.- Elementos inciales: Preparacin del paquete informtico y de la base de
datos:

Se parte por actualizar a Stata 10 instalado en Ubuntu 11.10 (distribucin Oneric):

update query Busca las actualizaciones ms recientes y las compara con la actual.
update all Actualiza todas las libreras disponibles .
update swap Se completa la actualizacin y se reinicia el software.

Una vez reiniciado Stata, se importa la base de datos, inicialmente en .xls a un archivo .csv
utilizando Excel. Posteriormente, se abre y se carga en STATA.

cd /home/jorge/Desktop/prac Se define al directorio de trabajo.
insheet using pracsv.csv El documento convertido a un archivo con extensin .csv es
importado a STATA
xtset index year Se indica al software que ordene la base de datos de acuerdo al tipo
de rutas y de acuerdo al periodo de tiempo.

Se visualiza la informacin, se elabora un resumen estadstico general y posteriormente se
hace una sntesis descriptiva en consideracin de la naturaleza discreta o continua de las
variables.

list dist pibc pop pax turc pr Crea una lista de observaciones de las variables
seleccionadas.

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
2

Tabla No. 1
Ejecucin del comando list


summarize Resume todas las variables de la muestra (alternativamente sum).


Tabla No. 2
Ejecucin del comando summarize




sum pr pax pop pibc dist turc hha Presenta un resumen estadstico de las variables
continuas

sum modal if modal>0 Resume a la variable de competencia intermodal,
imponiendo una condicin que permite recoger su naturaleza binaria

sum hub if hub>0 Resume a la variable de rutas que tienen como origen al
aeropuerto de Madrid (hub primario de Iberia) identificadas como una dummy.

sum compet if compet>0 Resume a la variable de rutas que tienen ms de un
competidor.







Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
3

Tabla No. 3
Ejecucin del comando sum para variables continuas y discretas



Las tablas dos y tres muestran que el precio medio de las rutas incluidas en la muestra es de
188.90 euros, la ruta de menor valor tiene un precio promedio de 49.85 euros mientras la de
mayor 756.19. Es relevante la magnitud de la desviacin estndar del total de nmero de
pasajeros transportados por ruta, que muestra un valor de 329757.7 mayor al de la media de
248892.7 podra constituir un indicativo sobre la heterogeneidad en la demanda rutas. Los
resultados del valor medio del ndice de Hirchman-Herfindalh, sobre la concentracin de
cuotas de las aerolneas en trminos del total de salidas en el aeropuerto, se orientan en una
direccin cercana, la diferencia entre el ndice ms alto es de 0.5 con un valor mximo de
0.755.

La variable de turistas per cpita da pautas sobre el comportamiento asimtrico del sector
turstico entre las ciudades de la muestra, la desviacin estndar muestra un valor de 3.43
mayor a la media de 2.57, la diferencia entre la ciudad de mayor turismo per cpita y la de
menor es de 11.23. Los momentos estadsticos de la poblacin en las ciudades de origen y
destino podra reflejar las asimetras en la concentracin de poblacin en las ciudades de la
muestra, la desviacin estndar tiene un valor de 831171.1 mientras la media de 2999308
individuos, en cada ciudad. El producto per cpita medio de la muestra es de 21971.35 euros
y la desviacin de 3162.145, no obstante, existe una amplia brecha entre la ciudad de menor
producto per cpita y la de mayor, alrededor de 15.000 euros, lo cual brinda seales sobre la
polarizacin de las actividades productivas.

Las variables discretas sobre la competencia intermodal, la que representa a las rutas que
parten del Hub de Madrid y el de las rutas que no son un monopolio, representan en su
conjunto cerca del 50% de las observaciones para los tres casos.


La construccin de la matriz de varianzas y covarianzas parte del comando:

corre pax pr pop pibc dist turc hha modal hub compet <-El comando corre presenta a
la matriz de varianzas y covarianzas E(XX).


Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
4


Tabla No. 4
Matriz de varianzas y covarianzas: Aplicacin del comando corre




En la Tabla No.4 se muestra como el nmero total de pasajeros transportados conserva con
las variables restantes una relacin esperada en la mayora de los casos. El precio influye de
forma negativa en el nmero total de pasajeros, la poblacin en las ciudades de forma positiva,
el producto per cpita positivamente, la distancia de forma positiva lo cual sugiere que en
trayectos ms extensos los usuarios prefieren utilizar una ruta area. El turismo de forma
similar posee una relacin positiva, la media del ndice de Hirchman-Herfindalh se relaciona
de forma negativa, por lo que la mayor concentracin de cuotas de las aerolneas afectara
negativamente al nmero de pasajeros. La relacin entre aeropuertos con mayor competencia
y el nmero de pasajeros tendran un impacto positivo. La variable de competencia intermodal
que se esperara tenga una relacin negativa con el nmero de pasajeros tiene una covarianza
positiva, la variable de hub tambin refleja un resultado positivo.

Por otra parte, la variable de precios conserva covarianzas negativas con la poblacin de las
ciudades, con la actividad econmica, con la competencia intermodal, con la de hub y con la
de competencia intramodal todas esperadas. Mientras, presenta relaciones positivas con la
distancia el turismo per cpita y la media del ndice de Hirchman-Herfindalh, es decir
mientras ms cuotas tendra una aerolnea la posibilidad de subir el precio es mayor.

Adicionalmente, son de inters las covarianzas negativas entre la variable de Hub,
competencia intermodal, y la media del ndice de Hirchman-Herfindalh. Mientras existe una
covarianza positiva con la variable de competencia entre las aerolneas. Podra entregar una
intuicin sobre la relacin positiva entre aeropuertos no monoplicos o de competencia con la
actividad turstica.

Una vez examinada brevemente la matriz de varianzas y covarianzas, se emplea una
representacin grfica de las variables de: distancia, producto interno bruto per cpita y
poblacin:

histogram dist, frequency saving(h1distancia) Grafica un histograma de frecuencias
con el nombre h1ditancia de la variable distancia(dist) y con la extensin .gph


gr export h1distancia.ps Exporta el grfico con extensin .gph a una .ps, es de
utilidad en la versin esttica(o de consola) de Stata, que no posee la interfaz grfica
que permite visualizar al grfico de manera instantnea

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
5


Grfico No. 1
Histograma de la variable de distancia




twoway (mspline pax dist if dist<3000, bands(5) n(5)), saving(twoway) Estima de
forma no paramtrica la relacin entre el volumen de trfico de pasajeros y la distancia
gr export twoway.ps Exporta al grfico twoway.pgh a una extensin .ps

Grfico No. 2
Estimacin no paramtrica de la relacin entre el de trfico de pasajeros y la distancia



histogram pibc, frequency saving(h2pibc) Grafica un histograma de frecuencias de la
variable PIB per cpita
gr export h2pibc.ps Exporta al grfico h2pibc.ghp a una extensin .ps








Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
6


Grfico No. 3
Histograma de la variable del PIB per cpita


histogram pop, frequency saving(h2pop) Grafica un histograma de frecuencias de la
variable de poblacin
gr export pop.ps Exporta al grfico h2pop.pgh a una extensin .ps


Grfico No. 4
Histograma del nmero de turistas per cpita de las ciudades de origen y destino

El Grfico No. 1, muestra como la mayor parte de rutas tienen entre 0 hasta 900km de
distancia, en particular hay una alta frecuencia de rutas con cerca de 500 km, mientras un
grupo pequeo ms de 2000 km. El Grfico No. 2 representa como a medida que la distancia
se incrementa el trfico de pasajeros inicialmente aumenta hasta un punto en donde la

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
7

distancia es tan amplia que ya no existe una relacin directa con el trfico areo. En el Grfico
No. 3 se muestra al histograma de frecuencias para el PIB per cpita medio de cada ciudad de
destino y origen incorporada en la muestra, la mayora de ciudades se encuentra en un
intervalo de rente madia entre 20000 a 25000 euros. En el Grfico No. 4, se presenta a la
distribucin de frecuencias para la variable de turismo per cpita, la cual permite visualizar
que la mayora de ciudades que son destino tienen entre 0 hasta 3 turistas per cpita en los
periodos de observacin.

Para complementar el ejercicio descriptivo se elaboran contrastes de medias para las
variables de pasajeros totales y precios considerando: i) las rutas de monopolio y las rutas de
competencia, ii) las rutas durante verano y durante invierno.

ttest pax,by(compet) ttest elabora el contraste de medias para la variable de
pasajeros distinguiendo por el tipo de competencia de la ruta, como es habitual la E
0

plantea que no hay diferencias entre los dos grupos, y la alternativa que las hay.
ttest pr,by(compet) ttest elabora el contraste de medias para la variable de precios
distinguiendo por el tipo de competencia de la ruta

Tabla No. 5
Contraste de medias de acuerdo al tipo de competencia



En el primer caso el contraste de medias nos indica que se rechaza la hiptesis nula al 5% de
significacin, es decir existen diferencias en los dos grupos de rutas, monoplicas y las de
mayor competencia para el nmero de pasajeros. En el segundo caso, tambin se rechaza la
hiptesis nula, existen diferencias en el nivel de precios entre los dos tipos de rutas.


Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
8

ttest pax,by(ver) ttest elabora el contraste de medias para la variable de pasajeros
distinguiendo por el tipo de temporada: invierno verano.
ttest pr,by(ver) ttest elabora el contraste de medias para la variable de precios
distinguiendo por el tipo de temporada: invierno verano.

Tabla No. 6
Contraste de medias de acuerdo a la temporada (verano-invierno)



En el primer caso para el trfico de pasajeros se rechaza la hiptesis nula al 10% de significacin y
en el segundo caso se rechaza la hiptesis nula al 5% de significacin. Es decir, se tienen
intuiciones sobre las diferencias de pasajeros y precios en las dos estaciones climticas.

Para completar esta primera seccin descriptiva se comprueba si existen problemas de
heterocedasticidad, antes de continuar se hacen transformaciones logartmicas de las variables.

generate lpax = log(pax) Hace una transformacin logartmica de la variable pax.
generate lpop = log(pop) Hace una transformacin logartmica de la variable pop.
generate lpibc = log(pibc) Hace una transformacin logartmica de la variable pbc.
generate lturc = log(turc) Hace una transformacin logartmica de la variable turc.


Ahora se prueba si existen indicios de heterocedasticidad.


regress lpax lpop lpibc lturc hub modal time ver pr Estimacin de la ecuacin de
demanda.
estat hettest Comando que prueba la existencia de heterocedasticidad de la ecuacin
anterior. Es la prueba Breusch-Pagan / Cook-Weisberg, que tiene como hiptesis nula
que la varianza de los errores son iguales, mientras la hiptesis alternativa indica que

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
9

es una funcin de una o ms variables.


regress pr dist pax compet cap_barcelona cap_madrid ver Estimacin de la ecuacin
de precios.
estat hettest Comando que prueba la existencia de heterocedasticidad de la ecuacin
anterior.

Tabla No. 7
Prueba de heterocedasticidad de la ecuacin de demanda




Tabla No. 8
Prueba de heterocedasticidad de la ecuacin de precios



Los resultados de la ecuacin de demanda muestran un valor cercano a cero del estadstico de
ci
2
, por lo tanto, para esta prueba no existen indicios de heterocedasticidad. Por otra parte,
la ecuacin de precios presentara problemas de heterocedasticidad. Se rechaza a la hiptesis
nula para el segundo caso.


Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
1
0


2. Estimacin de la ecuacin de demanda (se supone que o

= u).

Las ecuaciones de demanda est dada por:

lpox
t
= o

+ o
t
Iimc + p + [
1
lpop
t
+ [
2
lpibc +[
3
lturc
t
+[
4
ub

+ [
5
moJol

+
[
6
:cr

+[
7
pr
t
+e
t
(1)

, mientras la ecuacin de pecios por:

pr
t
= o

,
+o
t
,
Cop_Borcclono + o
t
,,
Cop_HoJriJ + p
,
+[
1
,
ist +[
2
,
Pox + [
3
,
Compct +
[
4
,
:cr +e
t

(2)


, con i = 1,2, ,S6 y t = 1,2, ,16

, donde [
3
,
= [
7
(-1)
(1 0
oIgopoIo
), 0
oIgopoIo
es el parmetro de conducta en rutas en
oligopolio.

Si se supone que todas las variables explicativas de la ecuacin de demanda son exgenas la
estimacin por Mnimos Cuadrados Ordinarios sera la ms adecuada:

regress lpax lpop lpibc lturc hub modal time ver pr, robust Estimacin de la ecuacin
de demanda por Mnimos Cuadrados Ordinarios, controlando la existencia de
heterocedasticidad con el comando Robust.

mfx, dyex Obtiene las elasticidades de la regresin anterior.











Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
1
1


Tabla No. 9
Estimacin de la ecuacin de demanda por Mnimos Cuadrados Ordinarios controlando la
heterocedasticidad - elasticidades





Adems, se puede controlar por auto correlacin espacial:
regress lpax lpop lpibc lturc hub modal time ver pr, robust cluster(index) Se corrige
a la ecuacin de autocorrelacin espacial incorporando al comando cluster(index)
mfx, dyex Obtiene las elasticidades de la regresin anterior.











.

pr -.5669864 .05379 -10.54 0.000 -.672416 -.461557 189.13
ver .1647387 .03088 5.34 0.000 .104222 .225256 .50056
time .0060042 .07948 0.08 0.940 -.14978 .161789 4.48712
modal -.0813587 .0305 -2.67 0.008 -.141141 -.021576 .447928
hub .1482052 .03178 4.66 0.000 .085924 .210486 .444569
lturc .0442904 .00268 16.55 0.000 .039046 .049535 .103752
lpibc 6.224227 2.91506 2.14 0.033 .510809 11.9376 9.9865
lpop 20.24516 1.18283 17.12 0.000 17.9269 22.5635 14.8606

variable dy/ex Std. Err. z P>|z| [ 95% C.I. ] X

= 11.776655
y = Fitted values (predict)
Elasticities after regress
. mfx, dyex
.

_cons -14.40763 2.9306 -4.92 0.000 -20.15937 -8.655881
pr -.0029979 .0002844 -10.54 0.000 -.0035561 -.0024397
ver .3291088 .0616841 5.34 0.000 .2080444 .4501732
time .0013381 .0177136 0.08 0.940 -.0334276 .0361038
modal -.1816334 .0680955 -2.67 0.008 -.3152811 -.0479857
hub .3333684 .0714771 4.66 0.000 .1930839 .473653
lturc .4268872 .0257921 16.55 0.000 .3762664 .477508
lpibc .6232639 .2919003 2.14 0.033 .0503655 1.196162
lpop 1.36234 .0795949 17.12 0.000 1.206123 1.518557

lpax Coef. Std. Err. t P>|t| [95% Conf. Interval]
Robust

Root MSE = .89049
R-squared = 0.4634
Prob > F = 0.0000
F( 8, 884) = 147.94
Linear regression Number of obs = 893
. regress lpax lpop lpibc lturc hub modal time ver pr, robust

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
1
2


Tabla No. 10
Estimacin de la ecuacin de demanda controlando la heterocedasticidad y por
autocorrelacin espacial- elasticidades



Y por auto correlacin temporal:
regress lpax lpop lpibc lturc hub modal time ver pr, robust cluster(year) Se corrige a
la ecuacin de autocorrelacin temporal incorporando al comando cluster(year)
mfx, dyex Obtiene las elasticidades de la regresin anterior.













pr -.5669864 .11549 -4.91 0.000 -.793336 -.340637 189.13
ver .1647387 .01999 8.24 0.000 .125558 .203919 .50056
time .0060042 .19463 0.03 0.975 -.375461 .387469 4.48712
modal -.0813587 .10987 -0.74 0.459 -.296699 .133982 .447928
hub .1482052 .1173 1.26 0.206 -.081696 .378106 .444569
lturc .0442904 .00975 4.54 0.000 .025186 .063395 .103752
lpibc 6.224227 9.70826 0.64 0.521 -12.8036 25.2521 9.9865
lpop 20.24516 4.43039 4.57 0.000 11.5618 28.9286 14.8606

variable dy/ex Std. Err. z P>|z| [ 95% C.I. ] X

= 11.776655
y = Fitted values (predict)
Elasticities after regress
. mfx, dyex
.

_cons -14.40763 9.832324 -1.47 0.149 -34.11204 5.29679
pr -.0029979 .0006106 -4.91 0.000 -.0042216 -.0017742
ver .3291088 .0399359 8.24 0.000 .2490754 .4091422
time .0013381 .0433749 0.03 0.976 -.0855872 .0882634
modal -.1816334 .2452839 -0.74 0.462 -.6731932 .3099265
hub .3333684 .2638478 1.26 0.212 -.1953944 .8621313
lturc .4268872 .0939501 4.54 0.000 .238607 .6151674
lpibc .6232639 .9721379 0.64 0.524 -1.324944 2.571472
lpop 1.36234 .2981303 4.57 0.000 .7648739 1.959807

lpax Coef. Std. Err. t P>|t| [95% Conf. Interval]
Robust

(Std. Err. adjusted for 56 clusters in index)
Root MSE = .89049
R-squared = 0.4634
Prob > F = 0.0000
F( 8, 55) = 37.52
Linear regression Number of obs = 893
. regress lpax lpop lpibc lturc hub modal time ver pr, robust cluster(index)

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
1
3


Tabla No. 11
Estimacin de la ecuacin de demanda controlando la heterocedasticidad y por
autocorrelacin temporal - elasticidades


Como algunas de las variables son endgenas entonces se lleva a cabo una estimacin por
variables instrumentales, que trate de eliminar el sesgo de la estimacin.

ssc install ivreg2, replace Se instala al paquete ivreg2, una actualizacin de ivreg(
instrumental variable regression)

ssc install ranktest Se instala al paquete ranktest elaborado por Kleibergen-Paap
(2006). Es una del rango de una matriz necesaria para alguno de los estadsticos de
ivreg2.

ivreg2 lpax lpop lpibc lturc hub modal time ver (pr = dist), ffirst robust ivreg2
estima mediante variables instrumentales, el comando ffirst aade la estimacin de la
primera etapa del proceso de Mnimos Cuadrados de Variables Instrumentales. La
regresin en primera fase puede ser un soporte para decidir si un instrumento es dbil
o no. Las variables entre parntesis sealan a la variable explicativa que adolece de
endogeneidad en este caso pr y al intrumento dist.

mfx,dyex se obtienen las elasticidades

pr -.5669864 .0443 -12.80 0.000 -.653805 -.480168 189.13
ver .1647387 .01977 8.33 0.000 .125993 .203485 .50056
time .0060042 .06594 0.09 0.927 -.123243 .135252 4.48712
modal -.0813587 .01912 -4.26 0.000 -.118829 -.043889 .447928
hub .1482052 .01143 12.96 0.000 .125797 .170614 .444569
lturc .0442904 .00164 26.96 0.000 .041071 .04751 .103752
lpibc 6.224227 1.97804 3.15 0.002 2.34734 10.1011 9.9865
lpop 20.24516 .64636 31.32 0.000 18.9783 21.512 14.8606

variable dy/ex Std. Err. z P>|z| [ 95% C.I. ] X

= 11.776655
y = Fitted values (predict)
Elasticities after regress
. mfx, dyex
.

_cons -14.40763 2.057017 -7.00 0.000 -18.79205 -10.0232
pr -.0029979 .0002342 -12.80 0.000 -.0034971 -.0024987
ver .3291088 .0394933 8.33 0.000 .2449309 .4132867
time .0013381 .0146962 0.09 0.929 -.0299862 .0326624
modal -.1816334 .04268 -4.26 0.001 -.2726036 -.0906631
hub .3333684 .0257171 12.96 0.000 .2785538 .3881831
lturc .4268872 .0158338 26.96 0.000 .3931383 .4606361
lpibc .6232639 .1980714 3.15 0.007 .2010847 1.045443
lpop 1.36234 .043495 31.32 0.000 1.269633 1.455048

lpax Coef. Std. Err. t P>|t| [95% Conf. Interval]
Robust

(Std. Err. adjusted for 16 clusters in year)
Root MSE = .89049
R-squared = 0.4634
Prob > F = 0.0000
F( 8, 15) = 596.66
Linear regression Number of obs = 893
. regress lpax lpop lpibc lturc hub modal time ver pr, robust cluster(year)

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
1
4




Tabla No. 12
Estimacin de la ecuacin de demanda mediante variables instrumentales (primera etapa)








Number of excluded instruments L1 = 1
Number of instruments L = 9
Number of endogenous regressors K1 = 1
Number of regressors K = 9
Number of observations N = 893
test statistics heteroskedasticity-robust
NB: Underidentification, weak identification and weak-identification-robust
Stock-Wright LM S statistic Chi-sq(1)= 6.30 P-val=0.0121
Anderson-Rubin Wald test Chi-sq(1)= 6.65 P-val=0.0099
Anderson-Rubin Wald test F(1,884)= 6.59 P-val=0.0104
Ho: B1=0 and orthogonality conditions are valid
Tests of joint significance of endogenous regressors B1 in main equation
Weak-instrument-robust inference
NB: Critical values are for Cragg-Donald F statistic and i.i.d. errors.
Source: Stock-Yogo (2005). Reproduced by permission.
25% maximal IV size 5.53
20% maximal IV size 6.66
15% maximal IV size 8.96
10% maximal IV size 16.38
Stock-Yogo weak ID test critical values for K1=1 and L1=1:
Kleibergen-Paap Wald rk F statistic 259.42
Cragg-Donald Wald F statistic 319.60
Ho: equation is weakly identified
Weak identification test
Kleibergen-Paap rk LM statistic Chi-sq(1)=110.71 P-val=0.0000
Ha: matrix has rank=K1 (identified)
Ho: matrix of reduced form coefficients has rank=K1-1 (underidentified)
Underidentification test
NB: Critical values are for Cragg-Donald F statistic and i.i.d. errors.
Source: Stock-Yogo (2005). Reproduced by permission.
25% maximal IV size 5.53
20% maximal IV size 6.66
15% maximal IV size 8.96
10% maximal IV size 16.38
Stock-Yogo weak ID test critical values for single endogenous regressor:
NB: first-stage test statistics heteroskedasticity-robust
pr | 259.42 0.0000 | 262.06 0.0000 | 259.42
Variable | F( 1, 884) P-val | AP Chi-sq( 1) P-val | AP F( 1, 884)
(Underid) (Weak id)

Summary results for first-stage regressions
. ivreg2 lpax lpop lpibc lturc hub modal time ver (pr = dist), ffirst robust

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
1
5


Tabla No. 13
Estimacin de la ecuacin de demanda mediante variables instrumentales (segunda etapa)






ver .113007 .03236 3.49 0.000 .049591 .176423 .50056
time .0241192 .08079 0.30 0.765 -.134219 .182458 4.48712
modal -.0319681 .03505 -0.91 0.362 -.100657 .036721 .447928
hub .1434381 .03286 4.37 0.000 .079037 .207839 .444569
lturc .0448335 .00276 16.24 0.000 .039422 .050245 .103752
lpibc 7.375222 3.03878 2.43 0.015 1.41932 13.3311 9.9865
lpop 20.10379 1.21726 16.52 0.000 17.718 22.4896 14.8606
pr -.227728 .08578 -2.65 0.008 -.395858 -.059598 189.13

variable dy/ex Std. Err. z P>|z| [ 95% C.I. ] X

= 11.776655
y = Linear prediction (predict)
Elasticities after ivreg2
. mfx,dyex
.

Excluded instruments: dist
Included instruments: lpop lpibc lturc hub modal time ver
Instrumented: pr

(equation exactly identified)
Hansen J statistic (overidentification test of all instruments): 0.000

NB: Critical values are for Cragg-Donald F statistic and i.i.d. errors.
Source: Stock-Yogo (2005). Reproduced by permission.
25% maximal IV size 5.53
20% maximal IV size 6.66
15% maximal IV size 8.96
Stock-Yogo weak ID test critical values: 10% maximal IV size 16.38
(Kleibergen-Paap rk Wald F statistic): 259.419
Weak identification test (Cragg-Donald Wald F statistic): 319.604

Chi-sq(1) P-val = 0.0000
Underidentification test (Kleibergen-Paap rk LM statistic): 110.713

_cons -15.76805 3.048208 -5.17 0.000 -21.74243 -9.793676
ver .2257611 .0646387 3.49 0.000 .0990716 .3524506
time .0053752 .0180041 0.30 0.765 -.0299121 .0406626
modal -.0713689 .0782404 -0.91 0.362 -.2247172 .0819795
hub .3226453 .0739099 4.37 0.000 .1777846 .4675061
lturc .4321223 .0266112 16.24 0.000 .3799653 .4842793
lpibc .738519 .3042889 2.43 0.015 .1421237 1.334914
lpop 1.352827 .0819122 16.52 0.000 1.192282 1.513372
pr -.0012041 .0004536 -2.65 0.008 -.002093 -.0003151

lpax Coef. Std. Err. z P>|z| [95% Conf. Interval]
Robust

Residual SS = 723.8024896 Root MSE = .9003
Total (uncentered) SS = 125156.2234 Uncentered R2 = 0.9942
Total (centered) SS = 1306.417958 Centered R2 = 0.4460
Prob > F = 0.0000
F( 8, 884) = 135.88
Number of obs = 893
Statistics robust to heteroskedasticity
Estimates efficient for homoskedasticity only

IV (2SLS) estimation

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
1
6


En la Tabla No. 12 se reportan los resultados de la primera estimacin del proceso en dos
etapas. Se parte por recordar que la variable de precios (pr) adolece de endogeneidad como se
distingue en las ecuaciones (1) y (2). Los instrumentos se obtienen de la ecuacin de precios
(2). Se emplea a la variable de distancia entre las ciudades de origen y de destino (dist).

La prueba F indica que el instrumento es significativo al 1% de significacin, de acuerdo a
Bound, Jaeger y Baker (1995), cuando solo se tiene una variable explicativa con endogeneidad
y en consideracin de que esta prueba F, es no estndar, el resultado puede ser altamente
informativo.

No obstante, siguiendo a Staiger y Stock (1997) quienes mostraron, que los instrumentos
pueden ser dbiles incluso si las pruebas t y F de la primera etapa son representativos. Se
consideran a los estadsticos de Cragg y Donald fundamentado en los valores crticos de Stock
y Yogo, y a la prueba de Anderson ambos en el marco de ivreg2.

Stock y Yogo (2005), concentran su preocupacin en comprender si el sesgo del estimador de
variables instrumentales, que resulta por el uso de instrumentos dbiles puede ser grande e
incluso mayor que el de MCO. Si el valor del estadstico que sigue una distribucin F(en este
caso el de Cragg y Donald wald o el estadstico de Kleinbergen-Paap) es mayor que el de los
valores crticos, se rechaza la hiptesis nula de debilidad de los instrumentos, que es el
escenario de la estimacin de la Tabla No. 12. A pesar de ello, para Cameron y Trivedi(2009),
en el caso de un regresor con endogeneidad los valores crticos solo son vlidos si se tiene al
menos tres instrumentos.

Los estadsticos de las pruebas de Anderson-Rubin de parmetros estructurales y el de Stock-
Wright LM rechazan la hiptesis nula, por lo tanto los regresores endgenos son relevantes.
Por otra parte, las pruebas de sobreidentifacin no son de inters ya que existe un
instrumento para un regresor endgeno, el sistema est perfectamente identificado como se
intuye del estadstico de Hansen.

En cuanto a los coeficientes de las explicativas, en las dos estimaciones por MCO y mediante IV
los resultados cualitativos son los mismos, no obstante, la significacin de las regresores vara.
El coeficiente de la variable de precios, que es instrumentalizada en la estimacin de dos
etapas, muestra una relacin negativa con el logaritmo del nmero de pasajeros, que es un
resultado esperado, un mayor precio reducira la demanda de viajes. Sin embargo, en la
primera estimacin el coeficiente muestra un valor mucho ms elevado que en la segunda,
como resultado de la incorporacin de una variable explicativa endgena.

La variable de poblacin muestra una relacin positiva con el nmero de pasajeros en ambos
casos MCO y VI. Un espacio poblacional ms denso implica mayor trfico areo. La del ingreso
per cpita en la estimacin por mnimos cuadrados ordinarios presenta una relacin positiva
y estadsticamente significativa de forma similar en la de variables instrumentales, adems es
consecuente con los resultados esperados, espacios con mayor actividad econmica tendrn
ms trnsito de pasajeros. De la misma forma, la variable de turismo por habitante implicara
un mayor flujo de pasajeros, en ambas estimaciones.

La variable de hub, parecera tener una relacin positiva con el logaritmo del nmero de
pasajeros en la estimacin por MCO y en la de VI. La variable de modal, que pretende capturar
el efecto de la competencia de otros modos de transporte tiene una relacin negativa y
significativa en la estimacin por MCO, mientras en la estimacin en dos etapas es no

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
1
7

significativa incluyo al 10% del valor crtico. La variable de tendencia temporal parece no ser
significativa por MCO y IV. La variable de identificacin de cambio climtico para incidir de
forma positiva en el nmero de pasajeros, es decir que el trfico se incrementa en verano en
las dos estimaciones. Este resultado es consistente con el contraste de medias presentado en
la Tabla No. 5.

3.- Estimacin de la ecuacin de precios (se supone que o

= u).

Si se supone que todas las variables explicativas de la ecuacin de precios son exgenas:

regress pr dist pax compet cap_barcelona cap_madrid ver, robust Estimacin de la
ecuacin de precios por Mnimos Cuadrados Ordinarios, controlando la existencia de
heterocedasticidad con el comando Robust.

mfx, eyex Obtiene las elasticidades de la regresin anterior.

Tabla No. 14
Estimacin de la ecuacin de precios por Mnimos Cuadrados Ordinarios controlando la
heterocedasticidad elasticidades




ver .1483415 .01342 11.05 0.000 .122037 .174646 .5
cap_ma~d .0107576 .01508 0.71 0.476 -.018799 .040314 .375
cap_ba~a -.0619012 .02233 -2.77 0.006 -.105674 -.018129 .5625
compet -.1471032 .01773 -8.30 0.000 -.181845 -.112362 .58817
pax -.0233423 .00759 -3.08 0.002 -.038211 -.008474 248893
dist .3935115 .01925 20.44 0.000 .355785 .431238 642.929

variable ey/ex Std. Err. z P>|z| [ 95% C.I. ] X

= 188.89095
y = Fitted values (predict)
Elasticities after regress
. mfx, eyex
.

_cons 128.396 5.961887 21.54 0.000 116.695 140.097
ver 56.04074 5.244611 10.69 0.000 45.74748 66.33401
cap_madrid 5.418685 7.596215 0.71 0.476 -9.48992 20.32729
cap_barcelona -20.7868 7.442551 -2.79 0.005 -35.39382 -6.179781
compet -47.24226 5.893934 -8.02 0.000 -58.80991 -35.67461
pax -.0000177 5.78e-06 -3.06 0.002 -.0000291 -6.36e-06
dist .1156128 .0059981 19.27 0.000 .1038407 .1273849

pr Coef. Std. Err. t P>|t| [95% Conf. Interval]
Robust

Root MSE = 73.735
R-squared = 0.4503
Prob > F = 0.0000
F( 6, 889) = 101.64
Linear regression Number of obs = 896
. regress pr dist pax compet cap_barcelona cap_madrid ver, robust

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
1
8



Adems, la ecuacin de precios se puede controlar por auto correlacin espacial:
regress pr dist pax compet cap_barcelona cap_madrid ver, robust cluster(index) Se
corrige a la ecuacin de autocorrelacin espacial incorporando al comando
cluster(index)
mfx, dyex Se obtiene las elasticidades de la regresin anterior.


Tabla No. 15
Estimacin de la ecuacin de precios por Mnimos Cuadrados Ordinarios controlando la
heterocedasticidad y por la autocorrelacin espacial - elasticidades





Tambin puede controlarse por auto correlacin temporal:

regress pr dist pax compet cap_barcelona cap_madrid ver, robust cluster(year) Se
corrige a la ecuacin de autocorrelacin temporal incorporando al comando
cluster(index)

ver 28.02037 3.8799 7.22 0.000 20.4159 35.6248 .5
cap_ma~d 2.032007 3.34277 0.61 0.543 -4.51971 8.58372 .375
cap_ba~a -11.69257 5.91537 -1.98 0.048 -23.2865 -.09866 .5625
compet -27.78646 5.04822 -5.50 0.000 -37.6808 -17.8921 .58817
pax -4.409148 1.64202 -2.69 0.007 -7.62745 -1.19085 248893
dist 74.33075 8.20896 9.05 0.000 58.2415 90.42 642.929

variable dy/ex Std. Err. z P>|z| [ 95% C.I. ] X

= 188.89095
y = Fitted values (predict)
Elasticities after regress
. mfx, dyex
.

_cons 128.396 11.02889 11.64 0.000 104.8885 151.9035
ver 56.04074 7.759806 7.22 0.000 39.50111 72.58038
cap_madrid 5.418685 8.914063 0.61 0.552 -13.58119 24.41856
cap_barcelona -20.7868 10.51622 -1.98 0.067 -43.20158 1.627984
compet -47.24226 8.58294 -5.50 0.000 -65.53636 -28.94816
pax -.0000177 6.60e-06 -2.69 0.017 -.0000318 -3.65e-06
dist .1156128 .0127681 9.05 0.000 .0883983 .1428273

pr Coef. Std. Err. t P>|t| [95% Conf. Interval]
Robust

(Std. Err. adjusted for 16 clusters in year)
Root MSE = 73.735
R-squared = 0.4503
Prob > F = 0.0000
F( 6, 15) = 70.38
Linear regression Number of obs = 896
. regress pr dist pax compet cap_barcelona cap_madrid ver, robust cluster(year)

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
1
9


mfx, dyex Obtiene las elasticidades de la regresin anterior.


Tabla No. 16
Estimacin de la ecuacin de precios por Mnimos Cuadrados Ordinarios controlando la
heterocedasticidad y por la autocorrelacin temporal - elasticidades



Como algunas de las variables son endgenas entonces se lleva a cabo una estimacin por variables
instrumentales.


ivreg2 pr dist (pax compet = pop pibc turc hub modal hha) cap_barcelona cap_madrid
ver, ffirst robust ivreg2 estima mediante variables instrumentales, el comando ffirst
aade la estimacin de la primera etapa del proceso de Mnimos Cuadrados de
Variables Instrumentales. La regresin en primera fase puede ser un soporte para
decidir si un instrumento es dbil o no. Las variables entre parntesis sealan en el
lado izquierdo a la variables explicativas que adolecen de endogeneidad en este pax y
compent los instrumentos al lado derecho son pop pibc turc hub modal hha.

mfx,dyex Obtiene las elasticidades de la regresin anterior.



ver 28.02037 3.8799 7.22 0.000 20.4159 35.6248 .5
cap_ma~d 2.032007 3.34277 0.61 0.543 -4.51971 8.58372 .375
cap_ba~a -11.69257 5.91537 -1.98 0.048 -23.2865 -.09866 .5625
compet -27.78646 5.04822 -5.50 0.000 -37.6808 -17.8921 .58817
pax -4.409148 1.64202 -2.69 0.007 -7.62745 -1.19085 248893
dist 74.33075 8.20896 9.05 0.000 58.2415 90.42 642.929

variable dy/ex Std. Err. z P>|z| [ 95% C.I. ] X

= 188.89095
y = Fitted values (predict)
Elasticities after regress
. mfx, dyex
.

_cons 128.396 11.02889 11.64 0.000 104.8885 151.9035
ver 56.04074 7.759806 7.22 0.000 39.50111 72.58038
cap_madrid 5.418685 8.914063 0.61 0.552 -13.58119 24.41856
cap_barcelona -20.7868 10.51622 -1.98 0.067 -43.20158 1.627984
compet -47.24226 8.58294 -5.50 0.000 -65.53636 -28.94816
pax -.0000177 6.60e-06 -2.69 0.017 -.0000318 -3.65e-06
dist .1156128 .0127681 9.05 0.000 .0883983 .1428273

pr Coef. Std. Err. t P>|t| [95% Conf. Interval]
Robust

(Std. Err. adjusted for 16 clusters in year)
Root MSE = 73.735
R-squared = 0.4503
Prob > F = 0.0000
F( 6, 15) = 70.38
Linear regression Number of obs = 896
. regress pr dist pax compet cap_barcelona cap_madrid ver, robust cluster(year)

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
2
0



Tabla No. 17
Estimacin de la ecuacin de precios mediante variables instrumentales (primera fase).












Number of excluded instruments L1 = 6
Number of instruments L = 11
Number of endogenous regressors K1 = 2
Number of regressors K = 7
Number of observations N = 893
test statistics heteroskedasticity-robust
NB: Underidentification, weak identification and weak-identification-robust
Stock-Wright LM S statistic Chi-sq(6)= 87.88 P-val=0.0000
Anderson-Rubin Wald test Chi-sq(6)= 117.65 P-val=0.0000
Anderson-Rubin Wald test F(6,882)= 19.37 P-val=0.0000
Ho: B1=0 and orthogonality conditions are valid
Tests of joint significance of endogenous regressors B1 in main equation
Weak-instrument-robust inference
NB: Critical values are for Cragg-Donald F statistic and i.i.d. errors.
Source: Stock-Yogo (2005). Reproduced by permission.
25% maximal IV size 7.42
20% maximal IV size 9.10
15% maximal IV size 12.33
10% maximal IV size 21.68
30% maximal IV relative bias 4.78
20% maximal IV relative bias 6.08
10% maximal IV relative bias 9.48
5% maximal IV relative bias 15.72
Stock-Yogo weak ID test critical values for K1=2 and L1=6:
Kleibergen-Paap Wald rk F statistic 11.13
Cragg-Donald Wald F statistic 12.07
Ho: equation is weakly identified
Weak identification test
Kleibergen-Paap rk LM statistic Chi-sq(5)=47.57 P-val=0.0000
Ha: matrix has rank=K1 (identified)
Ho: matrix of reduced form coefficients has rank=K1-1 (underidentified)
Underidentification test
NB: Critical values are for Cragg-Donald F statistic and i.i.d. errors.
Source: Stock-Yogo (2005). Reproduced by permission.
25% maximal IV size 8.84
20% maximal IV size 10.98
15% maximal IV size 15.09
10% maximal IV size 26.87
30% maximal IV relative bias 5.25
20% maximal IV relative bias 6.77
10% maximal IV relative bias 10.83
5% maximal IV relative bias 19.28
Stock-Yogo weak ID test critical values for single endogenous regressor:
NB: first-stage test statistics heteroskedasticity-robust
compet | 85.18 0.0000 | 627.70 0.0000 | 123.99
pax | 57.24 0.0000 | 251.80 0.0000 | 49.74
Variable | F( 6, 882) P-val | AP Chi-sq( 5) P-val | AP F( 5, 882)
(Underid) (Weak id)

Summary results for first-stage regressions
. ivreg2 pr dist (pax compet = pop pibc turc hub modal hha) cap_barcelona cap

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
2
1



Tabla No. 18
Estimacin de la ecuacin de precios mediante variables instrumentales (segunda fase).






.

ver .149537 .01323 11.30 0.000 .123603 .175471 .50056
cap_ma~d .0135241 .01476 0.92 0.360 -.015411 .042459 .3729
cap_ba~a -.0577184 .02267 -2.55 0.011 -.102143 -.013293 .56103
dist .4002972 .01992 20.10 0.000 .361262 .439333 643.382
compet -.1732301 .03985 -4.35 0.000 -.251326 -.095134 .586786
pax -.0328448 .02293 -1.43 0.152 -.077784 .012094 248553

variable ey/ex Std. Err. z P>|z| [ 95% C.I. ] X

= 189.13028
y = Linear prediction (predict)
Elasticities after ivreg2
. mfx, eyex
.

Excluded instruments: pop pibc turc hub modal hha
Included instruments: dist cap_barcelona cap_madrid ver
Instrumented: pax compet

Chi-sq(4) P-val = 0.0000
Hansen J statistic (overidentification test of all instruments): 45.117

NB: Critical values are for Cragg-Donald F statistic and i.i.d. errors.
Source: Stock-Yogo (2005). Reproduced by permission.
25% maximal IV size 7.42
20% maximal IV size 9.10
15% maximal IV size 12.33
10% maximal IV size 21.68
30% maximal IV relative bias 4.78
20% maximal IV relative bias 6.08
10% maximal IV relative bias 9.48
Stock-Yogo weak ID test critical values: 5% maximal IV relative bias 15.72
(Kleibergen-Paap rk Wald F statistic): 11.129
Weak identification test (Cragg-Donald Wald F statistic): 12.073

Chi-sq(5) P-val = 0.0000
Underidentification test (Kleibergen-Paap rk LM statistic): 47.573

_cons 132.4735 6.365917 20.81 0.000 119.9965 144.9504
ver 56.50067 5.169861 10.93 0.000 46.36792 66.63341
cap_madrid 6.859253 7.488238 0.92 0.360 -7.817424 21.53593
cap_barcelona -19.45758 7.590536 -2.56 0.010 -34.33476 -4.580407
dist .1176725 .0062029 18.97 0.000 .1055151 .1298298
compet -55.83475 12.96561 -4.31 0.000 -81.24688 -30.42262
pax -.000025 .0000174 -1.43 0.152 -.0000592 9.19e-06

pr Coef. Std. Err. z P>|z| [95% Conf. Interval]
Robust

Residual SS = 4858915.932 Root MSE = 73.76
Total (uncentered) SS = 40720620.03 Uncentered R2 = 0.8807
Total (centered) SS = 8777775.386 Centered R2 = 0.4465
Prob > F = 0.0000
F( 6, 886) = 96.46
Number of obs = 893
Statistics robust to heteroskedasticity
Estimates efficient for homoskedasticity only

IV (2SLS) estimation

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
2
2


Se obtienen las elasticidades de las variables de la ecuacin de precios y la elasticidad precio de la
demanda, evaluadas con respecto a la media muestral.

p
1
= [
1
,
_
tst

pr
_ = _
opr
otst

] _
tst

pr
_ = (u.117672S) _
642.9286
188.89u9
] = u.4uu2972

p
2
= [
2
,
_
Pox

pr
_ = _
opr
oPox
] _
Pox

pr
_ = (u.uuuu2S) _
248892.7
188.89u9
] = u.uS28448

p
3
= [
3
,
_
Compct

pr
_ = _
opr
oCompct
] _
Compct

pr
_ = (SS.8S47S) _
u.S881696
188.89u9
] = u.17S2Su1

p
4
= [
4
,
_
:cr
pr
] = _
opr
o:cr
] _
:cr
pr
] = (S6.Suu67) _
u.S
188.89u9
] = u.149SS7

p
5
= o
t
,
_
Cop_Borcclono

pr
_ = _
opr
oCop_Borcclono
] _
Cop_Borcclono

pr
_ = (19.4S7S8) _
u.S62S
188.89u9
] = u.uS77184

p
6
= o
t
,,
_
Cop_HoJrtJ

pr
_ = _
opr
oCop_HoJriJ
] _
Cop_HoJrtJ

pr
_ = (6.8S92SS) _
u.S7S
188.89u9
] = u.u1SS241


Las anteriores coinciden con las expuestas en la Tabla No.18 y que se pueden obtener a partir
del comando mfx, dyex. La elasticidad precio de la demanda por otra parte iguala:

1
= [
7
= u.u12u41 188.89u9 = 2.2744SS


En la Tabla No. 17 se reportan los resultados de la primera estimacin del proceso en dos
etapas para la ecuacin de precios. Se parte por recordar que las variables de nmero total de
pasajeros transportados por las aerolneas (pax) y la variable sobre las caractersticas de la
competencia (compet) son endgenas como se distingue de las ecuaciones (1) y (2). Los
instrumentos empleados son la poblacin de las ciudades que son origen y destino (pop) la
renta per cpita (pibc), el turismo per cpita (turc), la variable que tienen como origen Madrid
el hub de Iberia (hub), la posibilidad de competencia intermodal (modal) y el promedio del
ndice de Hirschman-Herfindalh(hha).

La prueba F indica que los instrumentos son significativos, no obstante, Bound, Jaeger y Baker
(1995), sealan que en el marco de incluir ms de una variable endgena en la estimacin de
dos etapas la prueba F es poco fiable, debido a que es una distribucin no estndar.

Se opta entonces por analizar los resultados de las pruebas de instrumentos dbiles
explorados en la estimacin de la ecuacin de demanda y que estn incorporados en el
paquete de ivreg2. Se considera inicialmente a los valores crticos propuestos por Stock y Yogo
(2005), contrastados con los estadsticos de Kleibergen-Paap wald y de Cragg-Donald wald.
Para el primer caso, el estadstico de Kleinbergen-Paap wald, que es una generalizacin de la
prueba de correlacin de rango de Anderson, sugiere que los instrumentos pueden no ser los
mejores para la estimacin. No obstante, la prueba de Kleinbergen-Paap LM de
sobreidentificacin rechaza la hiptesis nula al 95% de nivel confianza. La prueba de Cragg-
Donald no rechaza la hiptesis nula de debilidad de los instrumentos al estndar del 5%. Cabe
mencionar que Baum, Schaffer y Stillman(2007) han advertido sobre la prdida de confianza
de este estadstico en los escenarios en donde los errores son heterocedsticos.

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
2
3



Los estadsticos de las pruebas de Anderson-Rubin de parmetros estructurales y el de Stock-
Wright LM rechazan la hiptesis nula, por lo tanto los regresores endgenos son relevantes.
Por otra parte, la prueba de Hansen de sobreidentifacin rechaza la hiptesis nula de
sobreidentificacin.

En cuanto a los coeficientes de las explicativas de la ecuacin de precios, en las dos
estimaciones los resultados cualitativos son los mismos, no obstante, la significacin de los
regresores vara de forma relevante. El coeficiente de la variable de pasajeros, que es
instrumentalizada en la estimacin de dos etapas, muestra una relacin negativa con el nivel
de precios, que es un resultado esperado. Sin embargo, es no significativa por VI. En la primera
estimacin por MCO el coeficiente muestra de forma similar una relacin negativa aunque con
una t negativa.

La variable de competencia en las rutas muestra una relacin negativa con el nmero de
pasajeros en ambos casos MCO y V, podra intuirse que rutas con ms competencia intramodal
tienes precios menores. La variable de distancia presenta una relacin positiva y
estadsticamente significativa de forma similar en la de variables instrumentales, adems es
consecuente con los resultados esperados mayores distancias implican mayores costos y
consecuentemente mayores precios. Asimismo, la variable de identificacin entre verano e
invierno incide de forma positiva en los precios en las dos estimaciones.

Finalmente, la variable que captura los efectos de la ampliacin en el aeropuerto de Barcelona
se relaciona de forma negativa y significativa con el nivel precios de las rutas, mientras la
ampliacin del aeropuerto de Madrid es no significativa en ambas relaciones aunque conserva
una relacin positiva.

4. Estimacin mediante la tcnica de datos de panel (se supone que o

= u).

Inicialmente se comprueba si las variables dependientes siguen un proceso no-estacionario
(raz unitaria). El contraste de Dickey-Fuller para un panel de datos es una alternativa. Para el
contraste en Stata se emplea al paquete levinlin, que debe ser previamente instalado.

ssc install levinlin Se instala al paquete levinlin

levinlin pax,lag(1) El comando levinlin prueba la existencia de races unitarias de
orden 1 para la variable pax

levinlin pr,lag(1) El comando levinlin prueba la existencia de races unitarias de
orden 1 para la variable pr









Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
2
4

Tabla No. 19
Pruebas de races unitarias para pax y pr





La hiptesis nula del test de Levin y Lin plantea la no existencia de races unitarias, en el
primer caso la hiptesis nula no se rechaza mientras en el segundo se rechaza por lo tanto
existira evidencia de autocorrelacin en la variable de precios.

Adems se comprueba si los trminos de error no estn auto correlacionados, mediante el
contraste propuesto por Wooldridge. Antes de hacer la prueba debe instalarse al paquete
st0039.pkg

net install st0039 o alternativamente

findit xtserial

package installation
--------------------------------------------------------------------------------------------------------

package name: st0039.pkg
from: http://www.stata-journal.com/software/sj3-2/

xtserial lpax lpop lpibc lturc hub modal time ver pr El comando xtserial elabora la
prueba de Wooldridge para la ecuacin de demanda

xtserial pr dist pax compet cap_barcelona cap_madrid ver El comando xtserial
elabora la prueba de Wooldridge para la ecuacin de precios.









-0.31991 -9.888 2.31712 0.9898
coefficient t-value t-star P > t
Augmented by 1 lags (average) Truncation: 7 lags
Pooled ADF test, N,T = (56,16) Obs = 784
Levin-Lin-Chu test for pax Deterministics chosen: constant
. levinlin pax,lag(1)
-0.87111 -17.568 -4.87203 0.0000
coefficient t-value t-star P > t
Augmented by 1 lags (average) Truncation: 7 lags
Pooled ADF test, N,T = (56,16) Obs = 784
Levin-Lin-Chu test for pr Deterministics chosen: constant
. levinlin pr,lag(1)

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
2
5

Tabla No. 20
Pruebas de errores correlacionados






La hiptesis nula del test de Wooldridge plantea la no existencia de autocorrelacin de primer
orden para la variable de pasajeros los resultados sugieren que no se rechaza la hiptesis nula
mientas en el segundo caso para la variable de precios se rechaza la hiptesis nula, por lo
tanto existira autocorrelacin, que debera ser considerada en la modelizacin del panel de
datos.

Se elabora el contraste de Hausman en relacin a la condicin E[Xiti] = 0. Con el comando
para el caso de la demanda:


xtreg lpax lpop lpibc lturc hub modal time ver pr,fe El comando xtreg estima datos
de panel o longitudinales, al final de la especificacin se aade los efectos individuales
incorporados en este caso fijos (Fixed Effects, FE).


est store fixed Guarda los resultados de los efectos fijos


xtreg lpax lpop lpibc lturc hub modal time ver pr,re El comando xtreg estima datos de
panel o longitudinales, al final de la especificacin se aade los efectos individuales
incorporados en este caso aleatorios (Random Effects, RE).


hausman fixed Elabora la prueba de Hausman.













Prob > F = 0.9628
F( 1, 55) = 0.002
H0: no first-order autocorrelation
Wooldridge test for autocorrelation in panel data
. xtserial lpax lpop lpibc lturc hub modal time ver pr
Prob > F = 0.0155
F( 1, 55) = 6.239
H0: no first-order autocorrelation
Wooldridge test for autocorrelation in panel data
. xtserial pr dist pax compet cap_barcelona cap_madrid ver

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
2
6

Tabla No. 20
Estimacin de la ecuacin de demanda por efectos fijos, aleatorios y test de Hausman


Para el caso de los precios se elabora un ejercicio similar:

xtreg pr dist pax compet cap_barcelona cap_madrid ver, fe xtreg estima datos de
panel o longitudinales, acompaado de fe, desarrolla una estimacin de efectos fijos,

est store fixed Guarda los resultados de los efectos fijos

xtreg pr dist pax compet cap_barcelona cap_madrid ver, re Estimacin por efectos
aletorios.

hausman fixed Elabora la prueba de Hausman.
(V_b-V_B is not positive definite)
Prob>chi2 = 0.0006
= 23.51
chi2(6) = (b-B)'[(V_b-V_B)^(-1)](b-B)
Test: Ho: difference in coefficients not systematic
B = inconsistent under Ha, efficient under Ho; obtained from xtreg
b = consistent under Ho and Ha; obtained from xtreg

pr -.0005012 -.0005373 .0000361 .
ver .1898421 .1901518 -.0003098 .
time .0064141 .0033995 .0030146 .006221
lturc -.1059834 .0994031 -.2053864 .0546033
lpibc 1.631179 1.394162 .2370177 .1104773
lpop -.3330704 .2968109 -.6298813 .199422

fixed . Difference S.E.
(b) (B) (b-B) sqrt(diag(V_b-V_B))
Coefficients
. hausman fixed
.
.
.

rho .90243718 (fraction of variance due to u_i)
sigma_e .28291241
sigma_u .8604355

_cons -6.700523 5.210845 -1.29 0.198 -16.91359 3.512547
pr -.0005373 .000145 -3.71 0.000 -.0008215 -.0002531
ver .1901518 .0211056 9.01 0.000 .1487856 .2315181
time .0033995 .0189329 0.18 0.858 -.0337083 .0405074
modal -.4722376 .2768291 -1.71 0.088 -1.014813 .0703374
hub .7570021 .2769343 2.73 0.006 .2142208 1.299783
lturc .0994031 .068599 1.45 0.147 -.0350486 .2338547
lpibc 1.394162 .3923389 3.55 0.000 .6251915 2.163132
lpop .2968109 .2511979 1.18 0.237 -.1955279 .7891497

lpax Coef. Std. Err. z P>|z| [95% Conf. Interval]

corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
Wald chi2(8) = 459.01
overall = 0.3112 max = 16
between = 0.3120 avg = 15.9
R-sq: within = 0.3456 Obs per group: min = 13
Group variable: index Number of groups = 56
Random-effects GLS regression Number of obs = 893
. xtreg lpax lpop lpibc lturc hub modal time ver pr,re
.
.
.
. est store fixed
.
.
.
F test that all u_i=0: F(55, 831) = 147.57 Prob > F = 0.0000

rho .95016172 (fraction of variance due to u_i)
sigma_e .28291241
sigma_u 1.2352909

_cons .4184767 6.223458 0.07 0.946 -11.79707 12.63402
pr -.0005012 .0001435 -3.49 0.001 -.0007828 -.0002196
ver .1898421 .0208268 9.12 0.000 .1489628 .2307214
time .0064141 .0199288 0.32 0.748 -.0327026 .0455308
modal 0 (omitted)
hub 0 (omitted)
lturc -.1059834 .0876775 -1.21 0.227 -.2780788 .0661121
lpibc 1.631179 .4075967 4.00 0.000 .8311392 2.431219
lpop -.3330704 .3207328 -1.04 0.299 -.962612 .2964712

lpax Coef. Std. Err. t P>|t| [95% Conf. Interval]

corr(u_i, Xb) = -0.2793 Prob > F = 0.0000
F(6,831) = 75.44
overall = 0.0024 max = 16
between = 0.0610 avg = 15.9
R-sq: within = 0.3526 Obs per group: min = 13
Group variable: index Number of groups = 56
Fixed-effects (within) regression Number of obs = 893
note: modal omitted because of collinearity
note: hub omitted because of collinearity
. xtreg lpax lpop lpibc lturc hub modal time ver pr,fe

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
2
7


Tabla No. 21
Estimacin de la ecuacin de precios por efectos fijos, aleatorios y test te Hausman






El test de Hausman prueba la hiptesis nula que las coeficientes estimados por el estimador
eficiente de efectos aleatorios son los mismos que los obtenidos por el estimador consistente
. est store fixed
.
F test that all u_i=0: F(55, 835) = 15.09 Prob > F = 0.0000

rho .49089168 (fraction of variance due to u_i)
sigma_e 67.820209
sigma_u 66.595802

_cons 199.5156 9.469172 21.07 0.000 180.9295 218.1018
ver 56.26341 4.835929 11.63 0.000 46.77141 65.75542
cap_madrid 4.195499 6.601476 0.64 0.525 -8.761938 17.15293
cap_barcelona -21.74991 6.579232 -3.31 0.001 -34.66368 -8.836133
compet -36.20357 8.471779 -4.27 0.000 -52.83206 -19.57509
pax -.0000273 .0000396 -0.69 0.490 -.000105 .0000503
dist 0 (omitted)

pr Coef. Std. Err. t P>|t| [95% Conf. Interval]

corr(u_i, Xb) = -0.0740 Prob > F = 0.0000
F(5,835) = 44.26
overall = 0.1218 max = 16
between = 0.0282 avg = 16.0
R-sq: within = 0.2095 Obs per group: min = 16
Group variable: index Number of groups = 56
Fixed-effects (within) regression Number of obs = 896
note: dist omitted because of collinearity
. xtreg pr dist pax compet cap_barcelona cap_madrid ver, fe
Prob>chi2 = 0.8653
= 1.28
chi2(4) = (b-B)'[(V_b-V_B)^(-1)](b-B)
Test: Ho: difference in coefficients not systematic
B = inconsistent under Ha, efficient under Ho; obtained from xtreg
b = consistent under Ho and Ha; obtained from xtreg

ver 56.26341 56.1245 .1389144 1.405934
cap_madrid 4.195499 4.702178 -.5066794 1.063014
cap_barcel~a -21.74991 -21.37205 -.3778613 1.501617
compet -36.20357 -41.01625 4.812676 4.285739
pax -.0000273 -.000022 -5.29e-06 .0000369

fixed . Difference S.E.
(b) (B) (b-B) sqrt(diag(V_b-V_B))
Coefficients
unexpected and possibly consider scaling your variables so that the coefficients are on a similar scale.
what you expect, or there may be problems computing the test. Examine the output of your estimators for anything
Note: the rank of the differenced variance matrix (4) does not equal the number of coefficients being tested (5); be sure this is
. hausman fixed
.
.
.

rho .16204036 (fraction of variance due to u_i)
sigma_e 67.820209
sigma_u 29.823538

_cons 127.1852 8.794905 14.46 0.000 109.9475 144.4229
ver 56.1245 4.627047 12.13 0.000 47.05566 65.19335
cap_madrid 4.702178 6.515327 0.72 0.470 -8.067627 17.47198
cap_barcelona -21.37205 6.405578 -3.34 0.001 -33.92675 -8.817344
compet -41.01625 7.307769 -5.61 0.000 -55.33921 -26.69328
pax -.000022 .0000141 -1.56 0.119 -.0000498 5.70e-06
dist .1143365 .009278 12.32 0.000 .096152 .1325209

pr Coef. Std. Err. z P>|z| [95% Conf. Interval]

corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
Wald chi2(6) = 377.29
overall = 0.4497 max = 16
between = 0.7468 avg = 16.0
R-sq: within = 0.2092 Obs per group: min = 16
Group variable: index Number of groups = 56
Random-effects GLS regression Number of obs = 896
. xtreg pr dist pax compet cap_barcelona cap_madrid ver, re

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
2
8

de efectos fijos. Si se obtiene un p-valor significativo habra evidencia que respaldara la
utilizacin de efectos fijos. Para la estimacin de los parmetros de los regresores de la
ecuacin de demanda la prueba de Hausman sugiere la utilizacin de efectos fijos, mientas en
el segundo caso, en la estimacin de la ecuacin de precios, podra estimarse por la
incorporacin de efectos individuales aleatorios en el trmino de error.

De acuerdo a Green (1998), los efectos fijos son adecuados cuando hay certeza de que las
diferencias entre las observaciones de corte transversal se pueden modelizar como un cambio
en el parmetro de la funcin de regresin de un individuo a otro. Este contexto es comn en
el caso de los modelos que contemplan a todos los individuos de la poblacin, o cuando el
tamao de la muestra es suficientemente extenso. Alternativamente puede suceder que los
trminos constantes especficos de cada unidad muestral, en lugar de fijos, vengan
distribuidos aleatoriamente entre las unidades de corte transversal. Por ejemplo en una
muestra de 500 individuos que pretenden representar a una poblacin de un milln de
agentes.

Por otra parte, una restriccin adicional para la utilizacin de efectos fijos radica en que los
supuestos de partida del estimador eficiente son altamente restrictivos. Recordando los
supuestos para los trminos aleatorios E|c
]
] = E|u

] = u, E|u

2
] = o
u
2
, E|c

2
] = o
c
2
, E|c
]
u

] =
u para cado i ], E(c
t
, c
]s
) = u si i ] o t s y finalmente E(u

, u
]
) = u si i ]. Por lo tanto,
el efecto individual no podr estar correlacionado con ninguna de las otras variables
explicativas.

En este, caso la ecuacin de precios cuya mejor estimacin debera emplear a los efectos
aleatorios, podra requerir la utilizacin de variables instrumentales de acuerdo a la
propuesta de Hausman y Taylor(1981). Po lo tanto, inicialmente se plantea un modelo de
efectos aleatorios considerado a todas las variables explicativas como exgenas.
Posteriormente, se relajan los supuestos de la estimacin bsica y se considera la existencia de
autocorrelacin temporal y heterocedasticidad.


xtreg pr dist pax compet cap_barcelona cap_madrid ver, re Estima la regresin con
efectos aleatorios( random effects, re) con los supuestos bsicos y ms restrictivos.

xtregar pr dist pax compet cap_barcelona cap_madrid ver, re lbi Estima la regresin
con efectos aleatorios( random effects, re) considerando autocorrelacin (aadiendo ar
al comando xtreg).

xtgls pr dist pax compet cap_barcelona cap_madrid ver, panels(heteroskedastic)
corr(ar1) Estima la regresin con efectos aleatorios considerando
heterocedasticidad y autocorrelacin.











Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
2
9

Tabla No. 21
Distintas estimaciones de efectos aleatorios para la ecuacin de precios con explicativas exgenas.



.
.

_cons 127.4984 5.693613 22.39 0.000 116.3391 138.6577
ver 41.54536 3.272664 12.69 0.000 35.13105 47.95966
cap_madrid 8.158505 5.635425 1.45 0.148 -2.886725 19.20373
cap_barcelona -27.16754 5.556928 -4.89 0.000 -38.05892 -16.27616
compet -39.99735 5.31374 -7.53 0.000 -50.41209 -29.58261
pax -.000011 5.53e-06 -2.00 0.046 -.0000219 -2.04e-07
dist .1086578 .0059911 18.14 0.000 .0969154 .1204002

pr Coef. Std. Err. z P>|z| [95% Conf. Interval]

Prob > chi2 = 0.0000
Wald chi2(6) = 646.95
Estimated coefficients = 7 Time periods = 16
Estimated autocorrelations = 1 Number of groups = 56
Estimated covariances = 56 Number of obs = 896
Correlation: common AR(1) coefficient for all panels (0.1406)
Panels: heteroskedastic
Coefficients: generalized least squares
Cross-sectional time-series FGLS regression
. xtgls pr dist pax compet cap_barcelona cap_madrid ver, panels(heteroskedastic) corr(ar1)
.
.
.
Baltagi-Wu LBI = 2.2316188
modified Bhargava et al. Durbin-Watson = 2.1134949

theta .45428127
rho_fov .11678449 (fraction of variance due to u_i)
sigma_e 68.261837
sigma_u 24.822024
rho_ar -.05941782 (estimated autocorrelation coefficient)

_cons 126.398 8.612567 14.68 0.000 109.5177 143.2784
ver 56.01292 4.441825 12.61 0.000 47.3071 64.71873
cap_madrid 5.497542 6.831119 0.80 0.421 -7.891204 18.88629
cap_barcelona -22.07281 6.728212 -3.28 0.001 -35.25987 -8.885757
compet -40.82922 7.459282 -5.47 0.000 -55.44915 -26.2093
pax -.0000206 .0000139 -1.49 0.137 -.0000478 6.57e-06
dist .1150628 .0089942 12.79 0.000 .0974344 .1326912

pr Coef. Std. Err. z P>|z| [95% Conf. Interval]

corr(u_i, Xb) = 0 (assumed) Prob > chi2 = 0.0000
Wald chi2(7) = 396.67
overall = 0.4496 max = 16
between = 0.7465 avg = 16.0
R-sq: within = 0.2092 Obs per group: min = 16
Group variable: index Number of groups = 56
RE GLS regression with AR(1) disturbances Number of obs = 896
. xtregar pr dist pax compet cap_barcelona cap_madrid ver, re lbi
.
.
.

rho .16204036 (fraction of variance due to u_i)
sigma_e 67.820209
sigma_u 29.823538

_cons 127.1852 8.794905 14.46 0.000 109.9475 144.4229
ver 56.1245 4.627047 12.13 0.000 47.05566 65.19335
cap_madrid 4.702178 6.515327 0.72 0.470 -8.067627 17.47198
cap_barcelona -21.37205 6.405578 -3.34 0.001 -33.92675 -8.817344
compet -41.01625 7.307769 -5.61 0.000 -55.33921 -26.69328
pax -.000022 .0000141 -1.56 0.119 -.0000498 5.70e-06
dist .1143365 .009278 12.32 0.000 .096152 .1325209

pr Coef. Std. Err. z P>|z| [95% Conf. Interval]

corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
Wald chi2(6) = 377.29
overall = 0.4497 max = 16
between = 0.7468 avg = 16.0
R-sq: within = 0.2092 Obs per group: min = 16
Group variable: index Number of groups = 56
Random-effects GLS regression Number of obs = 896
. xtreg pr dist pax compet cap_barcelona cap_madrid ver, re

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
3
0

Ahora se supone un modelo de efectos aleatorios (
i
es un trmino de error aleatorio) con variables
explicativas endgenas en la ecuacin de precios:

xtivreg pr dist (pax compet = pop pibc turc hub modal hha) cap_barcelona cap_madrid
ver, re Se instrumentaliza a las variables pax compet que potencialmente estn
correlacionadas con el trmino de error. Los instrumentos son: pop pibc turc hub
modal hha.


Tabla No. 21
Distintas estimaciones de efectos aleatorios para la ecuacin de precios con variables explicativas
endgenas


Ahora se pueden corregir los problemas de autocorrelacin, incorporando el retardo de la endgena
como variable explicativa, con el comando:

by index: gen lag1 = pr[_n-1]

by index: gen lag2 = pr[_n-2]

xtivreg pr dist (pax compet = pop pibc turc hub modal hha) cap_barcelona cap_madrid
ver lag2, re






Instruments: dist cap_barcelona cap_madrid ver pop pibc turc hub modal hha
Instrumented: pax compet

rho .14027334 (fraction of variance due to u_i)
sigma_e 73.627506
sigma_u 29.740445

_cons 134.074 9.070743 14.78 0.000 116.2956 151.8523
ver 56.02831 4.777263 11.73 0.000 46.66505 65.39157
cap_madrid 8.225267 6.847352 1.20 0.230 -5.195296 21.64583
cap_barcelona -18.15336 6.647768 -2.73 0.006 -31.18274 -5.123971
dist .1210661 .0094564 12.80 0.000 .102532 .1396003
compet -73.09293 18.5542 -3.94 0.000 -109.4585 -36.72736
pax -4.05e-06 .0000295 -0.14 0.891 -.0000619 .0000538

pr Coef. Std. Err. z P>|z| [95% Conf. Interval]

corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
Wald chi2(6) = 373.91
overall = 0.4402 max = 16
between = 0.7412 avg = 15.9
R-sq: within = 0.1973 Obs per group: min = 13
Group variable: index Number of groups = 56
G2SLS random-effects IV regression Number of obs = 893
. xtivreg pr dist (pax compet = pop pibc turc hub modal hha) cap_barcelona cap_madrid ver, re

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
3
1

Tabla No. 21
Estimacin de la ecuacin de precios con efectos aleatorios variables instrumentales y correcciones de
autocorrelacin.



De acuerdo a las pruebas de Levin y Lin, Wooldridge y Hausman. Para la ecuacin de demanda
es conveniente una modelizacin por efectos fijos. Adems, se recuerda que la muestra
contiene un amplio nmero de cortes, las 56 rutas areas al interior de Espaa, por lo que una
estimacin por efectos fijos podra ser adecuada. En el caso de la ecuacin de precios con
efectos aleatorios variables instrumentales y correcciones de autocorrelacin, cuyos
resultados se presentan en la Tabla No. 21, podra resultar la mejor estimacin. En
consideracin de los resultados de las pruebas de autocorrelacin, heterocedasticidad y de
Hausman, las cuales sugirieron la existencia de autocorrelacin, endogenidad y consideraron a
los efectos aleatorios preferibles ante efectos individuales fijos. Asimismo, los estadsticos de
bondad del ajuste y minimizacin de los errores se comportan mejor en este ltimo modelo
frente a los anteriores. Cabe considerar adems la naturaleza de los cortes y las series de la
ecuacin de precios que se fundamente ampliamente en promedios de la poblacin total de
viajes al interior de Espaa.





hha
Instruments: dist cap_barcelona cap_madrid ver lag2 pop pibc turc hub modal
Instrumented: pax compet

rho 0 (fraction of variance due to u_i)
sigma_e 99.33363
sigma_u 0

_cons 95.57695 8.737974 10.94 0.000 78.45084 112.7031
lag2 .2863245 .038641 7.41 0.000 .2105896 .3620594
ver 40.77706 5.73865 7.11 0.000 29.52951 52.02461
cap_madrid 11.01696 7.090676 1.55 0.120 -2.880514 24.91442
cap_barcelona -18.58112 7.380812 -2.52 0.012 -33.04724 -4.114991
dist .0811723 .0079511 10.21 0.000 .0655883 .0967562
compet -37.95219 14.90916 -2.55 0.011 -67.1736 -8.730774
pax -.0000214 .000019 -1.13 0.260 -.0000588 .0000159

pr Coef. Std. Err. z P>|z| [95% Conf. Interval]

corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
Wald chi2(7) = 692.89
overall = 0.4792 max = 14
between = 0.8423 avg = 13.9
R-sq: within = 0.2005 Obs per group: min = 11
Group variable: index Number of groups = 56
G2SLS random-effects IV regression Number of obs = 781
. xtivreg pr dist (pax compet = pop pibc turc hub modal hha) cap_barcelona cap_madrid ver lag2, re
.
.
.
r(110);
lag2 already defined
. by index: gen lag2 = pr[_n-2]
.
r(110);
lag1 already defined
. by index: gen lag1 = pr[_n-1]

Jorge Salgado Sistema de Ecuaciones STATA
P

g
i
n
a
3
2

Bibliografa:

Baum, C. (2006), An Introduction to Modern Econometrics Using Stata, Stata Press.

Baum, C., Schaffer, M., Stillman, S. (2007), Enhanced routines for instrumental
variables/generalized method of moments estimation and testing, The Stata Journal, 7,
Number 4, pp. 465506.

Cameron, C. y Trivedi, P. (2005), Microeconometrics Methods and Applications, Cambridge
University Press.

Cameron C., Trivedi P. (2009), Microeconometrics Using Stata, A Stata Press Publication

Greene W. (2003), Econometric Analysis, Prentice Hal.

You might also like