Professional Documents
Culture Documents
con .
Las razones por las cuales no se puede aplicar mnimos cuadrados ordinarios son:
se tiene que:
2.- Disear una tcnica de estimacin que garantice que las probabilidades
condicionales estimadas de estn entre 0 y 1. Los modelos Logit y
Probit garantizarn que todas las probabilidades estimadas se encuentren
entre los lmites lgicos 0 y 1.
1.2. EJEMPLO
Se escribe en el Eviews:
LS CLIENTE C EDAD PRESTAMO SEXO PERIODO
a continuacin se oprime ENTER y nos da el resultado siguiente:
CLIENTEF
==========================================================
Modified: 1 60 // fit(f=actual) clientef
1 0.417364 1.104751 0.155492 0.803627 0.554091
6 0.814965 0.515421 0.486014 0.909758 0.899076
11 0.475652 0.765374 0.770710 1.321578 0.987106
16 0.536256 0.575847 1.014905 0.341672 0.405989
21 0.230938 0.643846 0.488985 0.437800 0.606510
26 0.259805 0.262450 0.206271 0.085420 0.620479
31 0.717948 -0.136817 0.397171 0.315820 0.243069
36 0.389929 0.804237 0.755200 0.045541 0.188897
41 0.618349 0.155769 0.417060 0.830059 0.278586
46 1.075758 0.486799 0.248942 0.408926 0.518848
51 0.317095 0.186445 0.067943 0.465541 0.483412
56 0.673622 0.643638 0.507839 0.651220 0.545000
==========================================================
W
=====================================================
Modified: 1 60 // w=clientef*(1-clientef)
1 0.243171 -0.115724 0.131314 0.157811 0.247074
6 0.150797 0.249762 0.249804 0.082099 0.090738
11 0.249407 0.179577 0.176716 -0.424990 0.012728
16 0.248686 0.244247 -0.015127 0.224932 0.241162
21 0.177606 0.229308 0.249879 0.246131 0.238656
26 0.192306 0.193570 0.163723 0.078124 0.235485
31 0.202498 -0.155536 0.239426 0.216078 0.183987
36 0.237884 0.157440 0.184873 0.043467 0.153215
41 0.235993 0.131505 0.243121 0.141061 0.200976
46 -0.081498 0.249826 0.186970 0.241706 0.249645
51 0.216546 0.151683 0.063327 0.248813 0.249725
56 0.219855 0.229368 0.249939 0.227132 0.247975
=====================================================
83
Las variables edad, prstamo y periodo son significativas al 5% (Prob < 0.05) y
la variable sexo es significativa al 10 % (Prob < 0.10) y el modelo es estadsticamente
significativo al 5 % (Prob < 0.05).
84
por lo tanto, las variables explicativas de (2) contendrn variables que expliquen ambos
elementos.
mltiples mximos) y, por lo tanto, cualquier valor inicial de los parmetros ser til. Es
costumbre comenzar las iteraciones para el modelo logit y probit con los estimados del
modelo de probabilidad lineal.
Con las variables explicativas escogidas, luego de los pasos 2.1. y 2.2. se
estima el modelo en su versin logit, probit o lineal. El modelo se perfila para
dejar slo las variables con signos adecuados y estadsticamente significativas
(prob < 0.10).
A) Bondad de ajuste: La regla prctica nos dice que este valor debe
encontrarse entre 0.2 y 0.6 para considerarse
aceptable en el contexto de la modelacin de
probabilidades.
3.- Amemiya:
4.- Mc - Fadden:
6.- R2 de conteo:
5.- Criterio de Hannan Quinn (por ser una "funcin de prdida", conviene
minimizarlo frente a los modelos alternativos).
2.5. Seleccin del modelo final en base a la perfomance relativa de ste al comparar,
entre modelos alternativos, los resultados de los test sugeridos en el tem
anterior.
Lo primero que cabe destacar es que, en el caso del MLP, los efectos
marginales de las variables explicativas son constantes para todos los individuos,
mientras que en los casos del logit y el probit, estos efectos son diferentes para
cada individuo, dependiendo de los valores de las variables explicativas que lo
caracterizan.
marginales de una variable o regresor para cada individuo, a fin de tener una idea
del rango de variacin de dichos efectos y se asume que el promedio de estos
efectos individuales es una buena aproximacin al "efecto marginal global" de
la variable (si se quiere tener un nmero - resumen), lo cual, desde luego, parte
de la premisa de que se cuenta con una muestra suficientemente representativa.
2.6. Una vez elegido el modelo final, clculo de los efectos marginales respectivos
estndar.
donde
3.- La interpretacin del modelo logit es: mide el cambio en logit por un cambio
unitario en X, es decir, nos muestra cmo vara la factibilidad del logit en favor
de poseer una casa a medida que X cambia en una unidad.
(1) Para cada nivel de , se calcula la probabilidad estimada de poseer una casa
como .
(5) Establecer los intervalos de confianza y/o las pruebas de hiptesis en el marco
usual de mnimos cuadrados ordinarios, pero manteniendo en mente que todas las
conclusiones sern validas, si la muestra es razonablemente grande. Para
pequeas muestras los resultados estimados deben interpretarse cuidadosamente.
Es razonable suponer que para cada familia hay un nivel crtico o umbral del
ndice, , tal que si excede a , ocurre el evento, de lo contrario no suceder. El
93
(1) Para cada nivel de , se calcula la probabilidad estimada de poseer una casa
como .
(5) Establecer los intervalos de confianza y/o las pruebas de hiptesis en el marco
usual de mnimos cuadrados ordinarios, pero manteniendo en mente que todas las
conclusiones sern validas, si la muestra es razonablemente grande. Para
pequeas muestras los resultados estimados deben interpretarse cuidadosamente.
Amemiya sugiere multiplicar los estimados LOGIT por 1/1.6 = 0.625 porque esta
transformacin produce una aproximacin ms cercana entre la distribucin logstica y
la funcin de distribucin normal estndar. Es decir, la relacin sera:
1.1. Multinomial, se utiliza cuando los regresores del modelo hacen referencia a las
observaciones muestrales, por lo que varan entre observaciones pero no entre
alternativas.
1.2. Condicional, se utiliza cuando los regresores del modelo hacen referencia a las
alternativas, por lo que sus valores varan entre alternativas pudiendo hacerlo o
no entre observaciones.
Generalizaremos los resultados anteriores a casos en los que los individuos hacen
elecciones entre tres o ms alternativas mutuamente excluyentes.
(
P(Yi = j ) = FY X * , ; ) i = 1,2,..., n y j = 1,2,..., mi .
*
donde X y son vectores de variables independientes y parmetros respectivamente.
De esta forma, mi depende de un i en particular cuando los individuos tienen diferentes
conjuntos de eleccin. Para definir el estimador de en el modelo usualmente se
definen in = 1 (mi + 1) variables binarias, de la forma:
= 1 si Yi = j
Yij
= 0 si Yi j; i = 1,2..., n y j = 1,2,..., mi .
ln L
= 0.
P(Y = j X , ) = p S j ( )
para alguna medida de probabilidad p, sobre X y , y una secuencia finita de intervalos
sucesivos {S } que depende sobre X y tal queU
j jS j = .
En los modelos ordenados, los valores que Y toma, corresponden a una particin
sobre la lnea real. A diferencia de modelo no ordenado, donde la particin
correspondera a particiones no sucesivas sobre la lnea real o a particiones de
dimensiones mayores sobre el espacio euclidiano. En la mayora de las aplicaciones, el
modelo ordenado toma la forma:
97
( ) ( )
P(Y = j X , , ) = F j +1 X F j X ; j = 0,1,..., m; 0 = ; j j +1 ; m+1 =
donde U ij no es una funcin estocstica sino deterministica. Por otro lado, ij es el usual
trmino aleatorio de error. De esta forma, el individuo elige aquella alternativa en la que
obtiene la mayor utilidad. El multinomial logit se puede derivar del problema de
maximizar la utilidad s y slo s los ij son independientes y la funcin de distribucin
y tomar una forma parecida a la definicin del modelo logit multinomial s hacemos
i 2 i 0 = X i2 y i1 i 0 = X i1 .
Para estimar cada una de las tres ecuaciones en el modelo por mnimos cuadrados
ordinarios, no es necesario ejecutar las tres regresiones lineales de probabilidad.
Dado que las probabilidades estimadas estn restringidas para sumar 1, los
interceptos estimados para sumar 1 y los parmetros de pendiente para sumar 0.
j =0
1 e1 + 1 Xi
P0 = P0 =
1 + e1 + 1 Xi + e2 + 2 Xi 1 + e1 + 1 Xi + e2 + 2 Xi
e1 + 1 Xi
P0 =
1 + e1 + 1 Xi + e2 + 2 Xi
con P0 + P1 + P2 = 1 .
99
Existen un gran nmero de datos cuya observacin nos muestra que estn
limitados o acotados de alguna forma. Este fenmeno lleva a dos tipos de efectos: el
truncamiento y la censura.
Por otro lado, censurar es un procedimiento en el cual los rangos de una variable
son limitados a priori por el investigador; este procedimiento produce una distorsin
estadstica similar al proceso de truncamiento.
a
Pr ob( X > a ) = 1 = 1 ( )
a
donde = y ( ) es funcin de densidad acumulativa, entonces la
distribucin normal truncada ser:
1 X
2
1 ( X )
f ( X X > a) =
f (X)
=
(
2 )
2 2
e 2
2
1 ( ) 1 ( ) 1 ( )
donde ser la funcin de densidad de probabilidades normal estndar. La distribucin
normal estndar truncada con = 0 y = 1 para a igual a -0.5, 0 y 0.5, ser:
100
Si [
X N , 2 ] con constante, entonces la media vendr dada por:
E [ X truncamiento] = + ( )
y la varianza por:
var[ X truncamiento] = 2 (1 ( ))
( )
( ) = si el truncamiento ocurre en X > a
1 ( )
( )
( ) = si el truncamiento ocurre en X < a
1 ( )
n 1 n
a X i
ln L =
2
(
ln( 2 ) + ln 2
2 2
) (Yi X i )
2
ln1
i i =1
ln L n
Yi X i i
= 2 X i = 0
i =1
ln L n 1 (Yi X i ) 2 X
2
= 2 2 + 2 4 2i 2i = 0
i =1
a i X i ( i )
donde i = y i = .
1 ( i )
Y = 0 si Y * 0 Y = Y * si Y * > 0
(
Pr ob(Y = 0) = Pr ob Y * 0 =
)
= 1
La distribucin correspondiente a Y
*
(
N , 2 ) ser:
si Y * > 0 y tiene la densidad de Y * , entonces la distribucin tiene partes discretas y
102
continuas, donde la probabilidad total ser de 1como se requiere. Para lograr esto, se
asigna la probabilidad total en la regin censurada al punto de censuramiento.
y la varianza:
[
Var (Y ) = 2 (1 ) (1 ) + ( )
2
]
a
d o n d e :
= ( ) = Pr ob Y *
(
a = ; ) =
1
;
= 2 .
+ 1 xi + ui si y*i mi
yi = 0
mi si y *i < mi
en el que el valor mi es el lmite mnimo por debajo del cual la variable endgena no
puede caer. Este modelo puede considerarse como uno de eleccin binaria, en el que la
variable endgena toma valores dependientes de las exgenas o bien un mnimo que no
depende de stas.
asume que .
103
Ejemplo
2.- Si existen observaciones sobre varias personas, de las cuales slo algunas tienen
empleo, podemos especificar el modelo:
Caso salarios,
Mtodo de estimacin
el trmino de error no tiene media cero. Dado que las observaciones con
se omiten, esto supone que slo se incluyen en la muestra las observaciones para las
104
Dado el creciente uso de los modelos tipo Tobit, Amemiya realiz la laboriosa
tarea de clasificar, los modelos Tobit de acuerdo con similitudes en la funcin de
verosimilitud. La caracterizacin de los tipos de modelos Tobit es la siguiente:
105
1 CENSURADO - -
2 BINARIO CENSURADO -
3 CENSURADO CENSURADO -
4 CENSURADO CENSURADO CENSURADO
5 BINARIO CENSURADO CENSURADO