You are on page 1of 29

Capitulo 2.

Notas para la enseanza Este es el captulo en el que esperamos que los estudiantes la mayora sigue, si no todas, de las derivaciones algebraicas. En la clase me gusta para obtener al menos la insesgadez del coeficiente de la pendiente MCO, y por lo general derivar la varianza. Como mnimo, me refiero a los factores que afectan la varianza. Para simplificar la notacin, despus de destacar los supuestos en el modelo de la poblacin, y asumir al azar muestreo, al cabo de condiciones en los valores de las variables explicativas de la muestra. Tcnicamente, esto se justifica mediante un muestreo aleatorio, ya que, por ejemplo: E (ui | x1, x2,..., x n) = E (ui | xi) por muestreo independiente. Me parece que los estudiantes son capaces de centrarse en el supuesto clave SLR.3 y posteriormente tomar mi palabra acerca de cmo acondicionado en las variables independientes en la muestra es inofensivo. (Si lo prefiere, el apndice del captulo 3 hace el argumento acondicionado con cuidado.) Debido a la inferencia estadstica no es ms difcil la regresin mltiple que en la regresin simple, Puedo posponer la inferencia hasta el captulo 4. (Esto reduce la redundancia y le permite centrarse en las diferencias de interpretacin entre regresin simple y mltiple). Usted puede notar cmo, en comparacin con la mayora de otros textos, yo uso los supuestos relativamente pocos derivar el insesgamiento del estimador MCO pendiente, seguido por la frmula para su varianza. Esto se debe a que no se introducen los supuestos redundantes o innecesarios. Por ejemplo, una vez SLR.3 se supone, nada ms sobre la relacin entre U y X es necesaria para obtener el insesgamiento de la Operacin en un muestreo aleatorio.

SOLUCIONES A LOS PROBLEMAS 2.1 (i) Los ingresos, edad y antecedentes familiares (por ejemplo, nmero de hermanos) son slo algunas posibilidades. Parece que cada uno de ellos podra estar correlacionado con los aos de educacin. (Ingresos y la educacin son probablemente una correlacin positiva, con una edad y la educacin puede ser una correlacin negativa porque las mujeres en las cohortes ms recientes tienen, en la educacin media, ms, y el nmero de hermanos y la educacin son probablemente una correlacin negativa.) (II) No, si los factores que figuran en la parte (i) se correlacionan con educ. Debido a que nos gustara, tienen estos factores fijos, que son parte del trmino de error. Pero si U se correlaciona con educ a continuacin E (u | EDUC) 0, y as SLR.3 falla. 2.2 En la ecuacin y = 0 + 1x + u, sumar y restar

0 desde el lado derecho para obtener

y = (0 + 0) + 1x + (u - 0). Llame al nuevo error e = u - 0, de modo que E (e) = 0. La interseccin es nueva 0 + 0, pero la pendiente es todava 1.

yi = GPAI, xi = ACTi, y n = 8. Entonces x (media) = 25,875, y media = 3,2125, 2 x1ni= x)(y y)= 5.8125, and (x1ni= x) = 56.875. = 56,875. De la ecuacin (2.9), se i i i
2.3 (i) Sea obtiene la pendiente como una = 5.8125/56.875 0.1022, redondeado a cuatro lugares despus del punto decimal. A partir de (2.17), 0 = y -1 x 3,2125 - (0,1022) 25.875 = 0.5681. Por lo tanto podemos escribir: GPA = 0.5681 + 0.1022 ACT. n=8.

La interseccin no tiene una interpretacin til ya que la ACT no est cerca de cero para la poblacin de inters. Si la ACT es de 5 puntos por encima, se incrementa en 0,1022 (5) = 0.511. GPA (II) Los valores ajustados y los residuos - redondeado a cuatro decimales - se administran junto con la observacin nmero i y GPA en la siguiente tabla: i GPA 1 2.8 2 3.4 3 3.0 4 3.5 5 3.6 6 3.0 7 2.7 8 3.7 GPA 2.7143 3.0209 3.2253 3.3275 3.5319 3.1231 3.1231 3.6341 u .0857 .3791 -.2253 .1725 .0681 -.1231 -.4231 .0659

Usted puede verificar que los residuos, segn lo informado en la tabla, suma que - .0002, que est muy cerca de cero dado el error de redondeo inherente. (III) Cuando ACT = 20, GPA (estimado)= 0.5681 + 0.1022 (20) 2,61. (IV) La suma de los cuadrados de los residuos, (u^2) es de aproximadamente 0,4347 (redondeado a cuatro decimales), y la suma total de cuadrados, ( yi - y)^2, Es de aproximadamente 1,0288. As que el R-cuadrado de la regresin es: R^2 = 1 - SSR / SST 1 - (.4347/1.0288) 0.577. Por lo tanto, alrededor de 57,7% de la variacin en el GPA se explica por ACT en esta pequea muestra de estudiantes. 2.4 (i) Cuando cigs = 0, predijo que el peso al nacer es de 119.77 onzas. Cuando cigs = 20 = 109,49. Esto se trata de una cada de 8,6%. Bwght (II) No necesariamente. Hay muchos otros factores que pueden afectar el peso al nacer, en particular estado general de salud de la madre y la calidad de la atencin prenatal. Estos podran ser correlacionados con el tabaquismo durante el nacimiento. Por otra parte, algo as como el consumo de cafena puede afectar el nacimiento y el del peso, y tambin podra estar relacionada con el tabaquismo. (III) Si queremos un bwght previsto de 125, entonces cigs = (125 - 119,77) / (- 0.524) = -10,18, o aproximadamente -10 cigarrillos. Eso es una tontera, por supuesto, y muestra lo que sucede cuando estamos tratando de predecir algo tan complicado como el peso al nacer con slo una sola variable explicativa. El mayor peso que predijo el nacimiento es necesariamente 119,77. Sin embargo, casi 700 de los nacimientos en la muestra tena un peso al nacer superior a 119,77. (IV) 1,176 fuera de 1,388 mujeres que no fumaron durante el embarazo, u 84,7%. 2.5 (i) La interseccin implica que cuando inc = 0, se prev que cons sea negativa en $ 124,84. Esto, por supuesto, no puede ser verdad, y refleja el hecho de que esta funcin de consumo puede ser un mal predictor del consumo a muy bajos niveles de ingresos. Por otro lado, sobre una base anual, $ 124,84 no est tan lejos de cero. (II) Slo tiene que conectar 30.000 en la ecuacin: cons = -124,84 + 0,853 (30,000) = 25,465.16 dlares. (III) El MPC y la APC se muestran en el grfico siguiente. A pesar de que la interseccin es negativa, el ms pequeo de APC en la muestra es positivo. La grfica comienza en un nivel de ingresos anuales de $ 1.000 (en dlares de 1970).

2.6 (I) S. Si vive cerca de un incinerador deprime los precios de la vivienda, siendo entonces ms lejos aumenta el precio de la vivienda. (II) Si la ciudad decidi ubicar la incineradora en una zona alejada de la ms cara los barrios, entonces log (dist) se correlaciona positivamente con la calidad de la vivienda. Esto violara Estimacin de SLR.3 y OLS es sesgado. (III) Tamao de la casa, nmero de cuartos de bao, tamao del lote, edad de la casa, y la calidad del barrio (incluyendo la calidad de la escuela), son slo algunos de los factores. Como se menciona en parte (II), se trata sin duda podra estar relacionada con dist [y log (dist)]. 2.7 (I) Cuando en la condicin de inc en el clculo de la expectativa, inc se convierte en una constante. Tanto E (u | inc) = E ( inc (e) |inc) = inc E (e | inc) = inc (0) porque E(e | inc) = E (e) = 0. (II) Una vez ms, cuando en la condicin de inc en el clculo de la varianza, inc se convierte en una constante. Tanto Var (u|inc)=Var (ince|inc)=(inc) Var (u | inc) = Var( inc (e)|inc) = ( inc )^2 Var (e | inc) = ^2 inc, porque Var(e|inc) = ^2. (III) Las familias de bajos ingresos no tienen mucha discrecin sobre el gasto, por regla general, una familia de bajos ingresos tiene que gastar en comida, ropa, vivienda y otras necesidades. A mayores ingresos la gente tiene ms criterio, y algunos podran elegir ms el consumo, mientras que otros, ms ahorro de energa. Este criterio sugiere una mayor variabilidad en el ahorro de las familias de mayores ingresos.

2.8 (i) De la ecuacin (2.66),

La conexin de yi = 0 +1Xi+ Ui da

Despus de lgebra estndar, el numerador se puede escribir como

Poner esto en el denominador muestral se puede escribir como

Condicional en xi, tenemos

Por que E(Ui) = 0 para todo i. Por lo tanto, el sesgo en est dado por el primer trmino en esta ecuacin. Este sesgo es, obviamente, cero cuando 0 = 0. Tambin es cero cuando = 0, que es el mismo que = 0. En este ltimo caso, la regresin a travs del origen es idntica a la regresin con una interseccin. (ii) De la ltima expresin de , en parte, (i) que tenemos, condicionada a la X1,

(iii) A partir de (2.57), tambin,

desde

Una forma ms directa de ver esto es escribir menos que X= 0

Que es menor que

(Iv) Para un tamao de muestra, el sesgo en 1 aumenta a medida que aumenta x (titulares de la suma de la X^2i fijo). Pero a medida que aumenta x, la varianza de una aumenta en relacin con Var (1). El sesgo en 1 tambin es pequeo cuando es pequeo. Por lo tanto, si se prefiere 1 o 1 en un error cuadrtico medio base depende de los tamaos de , x, y N (en adicin al tamao de o, Xmedia, y n (en adicin al tamao de 2.9 (I) Seguimos la pista, sealando que (la media de la muestra de .

promedio de la muestra de yi) y (incluyendo una intercepcin) que utilizar la ecuacin (2.19) para obtener la pendiente:

c1Yi veces Cuando hacemos una regresin en la c1yi C2Xi

partir

de

(2.17),

obtenemos

la

ordenada

como ya que el

intercepto de la regresin Yi en Xi es (ii) Se utiliza el mismo enfoque de la parte (i), junto con el hecho de que y por lo tanto y

As que C1 y C2 por completo abandono de la frmula de la pendiente de la regresin de (C1 +Yi) el (C2 + Xi), y lo que quera mostrar. . La interseccin es que es

(iii) Simplemente se puede aplicar la parte (ii) porque log(C1) + log(Y1). En otras palabras, reemplazar a C1 con log (C1), Yi, con registro de (Yi), y el conjunto C2 = 0. (iv) Una vez ms, podemos aplicar la parte (ii) con C1 y C2 = 0 reemplazando C2 con log de (C2) y XI, con log(Xi). Si es 0 y 1 son el intercepto y la pendiente original, luego

SOLUCIONES A LOS EJERCICIOS DE INFORMTICA 2.10 (I) El prate promedio es de aproximadamente 87,36 y el mrate promedio es de 0.732. (II) La ecuacin estimada es: prate = 83.05 + 5.86 mrate n = 1.534 R^2 = 0.075. (III) La interseccin implica que, incluso si mrate = 0, la tasa de actividad predicha es 83,05%. El coeficiente de mrate implica que un aumento de un dlar en la tasa de encuentro un aumento bastante grande - se calcula que aumentar prate de 5,86 puntos porcentuales. Esto supone, por supuesto, que este cambio en prate, es posible (si, por ejemplo, prate ya est en 98, hace que esta interpretacin no tenga sentido). (IV) Si se conecta mrate = 3,5 en la ecuacin obtenemos prate = 83.05 + 5.86 (3.5) = 103.59. Esto es imposible, ya que puede tener como mximo una tasa de participacin 100%. Esto ilustra que, sobre todo cuando las variables dependientes estn acotadas, un modelo de regresin simple puede dar extraa predicciones para los valores extremos de la variable independiente. (En la muestra de 1,534 empresas, slo 34 tienen mrate 3.5). (V) mrate explica aproximadamente 7.5% de la variacin en prate. Esto no es mucho, y sugiere que muchos otros factores influyen en 401 (k) las tasas de participacin en el plan. 2.11 (I) El salario promedio es de unos 865.864, lo que significa $865,864 dlares porque el salario es en miles de dlares. La media es de aproximadamente 7.95 ceoten. (II) Hay cinco directores generales con ceoten = 0. El mandato ms largo es de 37 aos. (III) La ecuacin estimada es: Log(salary) = 6.51+0,0097ceoten n=177 R^2 = 0.013. Se obtiene el porcentaje de cambio aproximado en el salario dado ceoten = 1 multiplicando el coeficiente de ceoten por 100, 100 (0.0097) = 0.97%. Por lo tanto, un ao ms como director general se prev a aumentar el sueldo en casi un 1%.

2.12 (I) La ecuacin estimada es: sleep = 3.586.4 0.151totwrk n = 706, R^2 = 0.103. La interseccin implica que la cantidad estimada de sueo por semana para alguien que no trabaj es 3,586.4 minutos u horas 59.77 aproximadamente. Esto viene a ser alrededor de 8,5 horas por noche. (II) Si alguien trabaja dos horas ms por semana, a continuacin, totwrk = 120 (porque totwrk se mide en minutos), y as sleep = -0.151 (120) = -18.12 minutos. Esto es slo unos minutos a una noche. Si alguien fuera a trabajar una hora ms en cada uno de los cinco das hbiles, sleep = - 0.151 (300) = -45.3 minutos, o alrededor de cinco minutos cada noche. 2.13 (i) Salario promedio es de aproximadamente $ 957.95 y el coeficiente intelectual promedio es de 101.28. El estndar de la muestra de desviacin del coeficiente intelectual es de 15.05, que es bastante cerca del valor de la poblacin de 15 aos.
(II) Esto requiere un modelo de nivel de nivel: Wage = 116.99 + 8.30 IQ n = 935, R^2 = 0.096. Un aumento en el coeficiente intelectual de 15 aumentos de salario mensual prevista a las 8.30 (15) = $ 124,50 (en 1980 de dlares). IQ ni siquiera explican el 10% de la variacin de los salarios. (III) Esto requiere un modelo de registro de nivel: log(salario) = 5.89 + 0.0088 IQ n = 935 R^2= 0.099. Si IQ = 15, entonces log(Wage) = 0.0088(15) = 0.132, que es el proporcional (aproximado) cambio en el salario previsto. El porcentaje de incremento es por lo tanto, aproximadamente 13.2. 2.14 (I) El modelo de elasticidad constante es un modelo log-log: log(rd) =

0 + 1 log(ventas) + u.

Donde 1, es la elasticidad de rd con respecto a las ventas. (II) La ecuacin estimada es: log(rd) = -4.105 + 1.076 log (ventas) n = 32 R^2 = 0.910.

La elasticidad estimada de rd con respecto a las ventas es 1.076, lo que es justo por encima de uno. Un uno por ciento de aumento en las ventas se estima que aumentar en alrededor de RD 1,08%.

Capitulo 3. Notas para la enseanza


Para estudiantes de pregrado, no hago la mayor parte de las derivaciones de este captulo, al menos no en detalle. Por el contrario, me concentro en la interpretacin de los supuestos, los cuales se refieren principalmente a la poblacin. Otro que es el muestreo aleatorio, la nica hiptesis que involucra a ms de las consideraciones de la poblacin es la hiptesis acerca de ninguna colinealidad perfecta, donde la posibilidad de colinealidad perfecta en la muestra (incluso si no se produce en la poblacin) debe ser tocada. El ms importante es cuestin de colinealidad perfecta en la poblacin, pero esto es bastante fcil prescindir de a travs de ejemplos. stos vienen de mis experiencias con los tipos de problemas, las especificaciones del modelo que los principiantes tienen problemas con el. La comparacin de las estimaciones de regresin simple y mltiple basada en la muestra en particular en la mano, a diferencia de sus propiedades estadsticas - por lo general deja una fuerte impresin. A veces no me molesto con la interpretacin de regresin mltiple "fuera partialling. En cuanto a las propiedades estadsticas, observe cmo tratar el problema de la inclusin de una variable irrelevante: ninguna derivacin separada es necesaria, ya que el resultado se sigue en el teorema de la forma 3.1. Me gusta para derivar el sesgo de variable omitida en el caso sencillo. Esto no es mucho ms difcil de mostrar insesgamiento de MCO en el caso de regresin simple en los cuatro primeros supuestos de Gauss-Markov. Es importante conseguir que los alumnos se pongan a pensar en este problema desde el principio, y antes de que muchos otros (no es necesario) los supuestos se han introducido. Intencionalmente he mantenido la discusin de multicolinealidad a un mnimo. En parte, esto indica mis prejuicios, pero tambin refleja la realidad. Es, por supuesto, muy importante para los estudiantes llegar a entender en las posibles consecuencias de tener una alta correlacin variables independientes. Pero esto es a menudo ms all de nuestro control, excepto que le podemos pedir menos de nuestro anlisis de regresin mltiple. Si dos o ms variables explicativas estn altamente correlacionadas en la muestra, no debemos esperar que, precisamente, estimar sus efectos ceteris paribus de la poblacin. Me parecen tratamientos extensos de multicolinealidad, donde unas "pruebas" o de alguna manera "soluciona" el problema de multicolinealidad, para inducir a error, en el mejor de los casos. Incluso la organizacin de algunos de los textos da la impresin de que la multicolinealidad imperfecta es en cierto modo una violacin de la de Gauss-Markov supuestos: que incluyen multicolinealidad en un captulo o una parte del libro dedicado a la "violacin de los supuestos bsicos ", o algo por el estilo. He notado que los estudiantes de maestra que tienen algunos conocimientos en la econometra de pregrado se confunden a menudo sobre la cuestin de la multicolinealidad. Es muy importante que los estudiantes, no confundan la multicolinealidad entre las variables explicativas incluidas, variables en un modelo de regresin con el sesgo causado por la omisin de una variable importante. Yo no probar el teorema de Gauss-Markov. En su lugar, hago hincapi en sus implicaciones. A veces, y, ciertamente, para los principiantes avanzados, pongo un caso especial del problema 3.12 en un examen de mitad de perodo, donde hacer una eleccin particular para la funcin g(x). En vez de que los estudiantes directamente puedan comparar las variaciones, se debe de recurrir al teorema de Gauss-Markov para la superioridad del MCO a travs de cualquier otro estimador lineal e imparcial.

SOLUCIONES A LOS PROBLEMAS 3.1 (i) hsperc se define de forma que cuanto menor es, menor es la posicin del estudiante en la escuela secundaria. Manteniendo todo lo dems igual, la peor situacin es la del estudiante en la escuela secundaria, menor es su espera que la universidad del GPA. (ii) Slo tiene que conectar estos valores en la ecuacin: colgpa = 1.392

0.0135 (20) + 0.00148 (1.050) = 2.676.

(iii) La diferencia entre A y B no es ms que 140 veces el coeficiente de sat, porque hsperc es el mismo para los estudiantes. As que, A, prev contar con una puntuacin de 0.00148 (140) = 0.207 ms alto. (iv) Con hsperc fijo, colgpa = 0.00148 sat. Ahora, queremos encontrar sat de tal manera que colgpa = 0.5, por lo que 0.5 = 0.00148 (sat) o sat = 0.5 / (0.00148) = $ 338.Quizs no sea sorprendente, una gran diferencia en la puntuacin, ceteris paribus, SAT - casi dos y media desviaciones estndar es necesario para obtener una diferencia prevista en la universidad o un GPA de medio punto. 3.2 (i) S. Debido a las limitaciones presupuestarias, tiene sentido que, a ms hermanos que haya en una familia, la educacin, es menor que la de un solo hijo en la familia. Para encontrar el aumento en el nmero de los hermanos que reduce la educacin prevista por un ao, se resuelve: 1= 0.094 (sibs), por lo que sibs =1/.094 = 10.6. (ii) Manteniendo fijos feduc, un ao ms de educacin de la madre implica 0.131 aos ms de la educacin prevista. As que si una madre tiene cuatro aos ms de educacin, su hijo se prev, contar con alrededor de medio ao (0.524) ms aos de educacin. (iii) Dado que el nmero de hermanos es el mismo, pero meduc y feduc son diferentes, el coeficientes de meduc y feduc ambos tienen que tenerse en cuenta. La diferencia predicha en la educacin entre B y A es 0.131 (4) + 0.210 (4) = 1.364. 3.3 (i) Si los adultos comrcian el sueo para el trabajo, ms trabajo implica menos horas de sueo (ceteris paribus), por lo que 1 < 0. (ii) Los signos de 2 y 3 no son evidentes, al menos para m. Se podra argumentar que ms personas educadas como para sacar ms provecho de la vida, y por lo tanto, la igualdad de otras cosas, dormir menos (2 < 0). La relacin entre el sueo y la edad es ms complicada que este modelo sugiere, y los economistas no estn en la mejor posicin para juzgar esas cosas. (iii) Desde totwrk que es en cuestin de minutos, se deben convertir cinco horas en minutos: totwrk = 5 (60) = 300. Entonces el sueo se ha previsto un descenso de 0.148 (300) = 44.4 minutos. Para una semana, 45 minutos menos de sueo no es un cambio enorme. (iv) Ms de la educacin implica dormir menos tiempo previsto, pero el efecto es muy pequeo. Si suponemos que la diferencia entre la universidad y la escuela secundaria es de cuatro aos, el graduado de la universidad duerme unos 45 minutos menos por semana, permaneciendo todo lo dems constante. (V) No es sorprendente que las tres variables explicativas explican slo alrededor de un 11.3% de

la variacin en el sueo. Un factor importante en el trmino de error es la salud general. Otro es el matrimonio estatus y, si la persona tiene hijos. Salud (sin embargo se mide eso), estado civil, y el nmero y edades de los nios por lo general se correlaciona con totwrk. (Por ejemplo, menos las personas sanas tienden a trabajar menos.) 3.4 (i) Un rango ms amplio de una escuela de derecho significa que la escuela tiene menos prestigio, lo que reduce los salarios iniciales. Por ejemplo, un rango de 100 significa que hay 99 escuelas que se consideran mejor. (ii) 1> 0, 2> 0. Tanto LSAT y el GPA son medidas de la calidad de la clase entrante. No importa dnde los mejores estudiantes asisten a la escuela de derecho, esperamos que para ganar ms, en promedio. 3, 4> 0. El nmero de volmenes en la biblioteca de la ley y los costos de matrcula son las dos medidas de la escuela de calidad. (El costo es menos obvio que los volmenes de la biblioteca, sino que, debe reflejar la calidad de los profesores, y la planta fsica de la facultad, etc.) (iii) Esto es slo el coeficiente de la GPA, multiplicado por 100: 24.8%. (iv) Se trata de una elasticidad: un aumento del uno por ciento en los volmenes de la biblioteca supone un 0.095% de aumento en la partida prevista del salario medio, ceteris paribus. (V) Es definitivamente mejor para asistir a una escuela de derecho con un rango inferior. Si la escuela de derecho A tiene un puesto situndose en el nmero 20 menos que la ley de la escuela B, la diferencia prevista en el salario inicial es de 100 (0.0033) (20) = 6.6% superior a la ley de la escuela A. 3.5(I) No. Por definicin, study + sleep + work + leisure = 168. As que si cambiamos estudio, debe cambiar por lo menos una de las otras categoras de modo que la suma es todava 168. (ii) de la parte (i), podemos escribir, por ejemplo, estudiar como una funcin lineal perfecta de las otras variables independientes: estudio = 168 - el sueo - trabajo - ocio. Esto es vlido para todas las observaciones, por lo MLR.3 es violado. (iii) Simplemente coloque una de las variables independientes, por ejemplo leisure: GPA = 0 + 1 + estudio + 2 sueo 3 trabajo + u. Ahora, por ejemplo, 1 se interpreta como el cambio en el GPA cuando estudio aumenta por una hora, donde el sueo, el trabajo, y U estn mantiene fijo. Si estamos llevando a cabo el sueo y el trabajo fijo, pero cada vez mayor estudiar por una hora, entonces debemos ser la reduccin de ocio en una hora. Los parmetros de pendiente de otros tienen una interpretacin similar. 3.6 Para el acondicionamiento de los resultados de las variables explicativas, tenemos: E (1) = E (1 + 2) = E (1) + E (2) = 1 + 2 = 1. 3.7 Slo (ii), omitiendo una variable importante, puede causar sesgo, y esto slo es cierto cuando la variable omitida se correlaciona con las variables incluidas explicativas. La homocedasticidad, suposicin. MLR.5, no desempe ningn papel en demostrar que los estimadores MCO son insesgados. (La Homocedasticidad fue utilizada para obtener las frmulas de varianza estndar para la j.) Adems, el grado de colinealidad entre las variables explicativas de la muestra, incluso si se

refleja en una correlacin tan alta como 0.95, no afecta a los supuestos de Gauss-Markov. Slo si hay una relacin lineal perfecta entre dos o ms variables explicativas es MLR.4 violados. 3.8 Podemos utilizar la Tabla 3.2. Por definicin, 2 > 0, y por supuesto, Corr(x1, x2) < 0. Por lo tanto, existe una polarizacin negativa en 1: E (1) < 1. Esto significa que, en promedio, el simple estimador de regresin subestima el efecto del programa de capacitacin. Es incluso posible que E (1) sea negativa a pesar de que 1 > 0. 3.9 (i) 1 < 0 debido a que ms contaminacin se puede esperar para bajar los valores de la vivienda, tenga en cuenta que es 1 la elasticidad del precio con respecto a los nox. 2 es probablemente positivo porque las habitaciones ms o menos miden el tamao de una casa. (Sin embargo, no nos permite distinguir entre los hogares donde cada habitacin es grande de hogares donde cada habitacin es pequea.) (ii) Si asumimos que los aumentos de las habitaciones con la calidad de la casa, entonces log (nox) y las habitaciones tienen una correlacin negativa cuando los barrios ms pobres tienen ms contaminacin, algo que es suele ser cierto. Se puede utilizar la Tabla 3,2 para determinar la direccin de la polarizacin. Si 2 > 0 y Corr(x1, x2) < 0, el estimador de regresin simple 1 tiene un sesgo a la baja. Pero debido a 1 < 0, esto significa que la regresin simple, en promedio, exagera la importancia de la contaminacin. [E (1estimador) es ms negativa que 1.] (iii) Esto es lo que podemos esperar de la tpica muestra sobre la base de nuestro anlisis, en la parte (ii). La estimacin de regresin simple, -1,043, es ms negativa (mayor en magnitud) que el mltiple estimacin de regresin, -0.718. A medida que esas estimaciones son slo para una muestra, nunca podemos saber qu est ms cerca de 1. Pero si se trata de un "tpico" de la muestra, 1 est ms cerca de -0.718. 3.10 De la ecuacin (3.22) tenemos

Donde para

se definen en el problema. Como de costumbre, hay que conectar el verdadero modelo

Del numerador de esta expresin, se simplifica debido a que:

Todos estos, siguen del hecho de que

son los residuos de la regresin de

en

:y

el promedio de la muestra, tienen cero y no estn correlacionados en la muestra con Por lo tanto el numerador de 1 se puede expresar como:

Poner estos detrs sobre el denominador da:

Bajo la condicin de todos los valores de la muestra en azar, debido a su dependencia. Pero E (ui) = 0, y as:

x1, x2 y x3, slo el ltimo trmino es al

Que es lo que quera mostrar. Observe que el trmino 3 multiplicando es la regresin del coeficiente de la regresin simple de xi3 en 3.11 (i) Las acciones, por definicin, aadir a una. Si no, omitir una de las acciones luego de la la ecuacin que sufren de multicolinealidad perfecta. Los parmetros no tendra una interpretacin ceteris paribus en estas circunstancias, ya que es imposible cambiar una cuota mientras mantiene todos los otros partes fijas. (ii) Dado que cada accin es una proporcin (y puede ser a lo sumo una, cuando todas las otras acciones son cero), no tiene mucho sentido para aumentar sharep en una unidad. Si sharep aumenta

por 0.01 - que es equivalente a un aumento de un punto porcentual en la proporcin de impuestos sobre la propiedad en los ingresos totales -Sharei celebracin, acciones, y los dems factores fijos, entonces el crecimiento se incrementa por 1 (0.01). Con las otras acciones, la cuota fija excluidos, Sharef, debe caer por 0.01 cuando se aumenta en un 0.01 sharep.

3.12 (i) Por simplicidad notacional, definir esto no es bastante, la muestra de la covarianza entre Z y X debido a que no se dividen por n - 1, pero slo estamos usando para simplificar la notacin. Entonces se puede escribir como :

Esto es claramente una funcin lineal de la

yi: tomar los pesos que son


ui

. en esta ecuacin, y

Para mostrar insesgamiento, como siempre, nos conecta Yi = 0 + 1Xi + simplificar:

SZX es una funcin de la zi y Xi y el valor esperado de cada ui es cero condicional sobre todo zi y Xi en la muestra. Por lo
Donde se utiliza el hecho de que siempre. Ahora tanto, condicionada en estos valores,

Porque E (ui) = 0 para todo i.

(ii) De la cuarta ecuacin de la parte (i), tenemos (una vez ms condicionada a la i y Xi en la muestra),

Debido a la suposicin de homocedasticidad [Var(ui) = definicin de Szx, esto es lo que quera mostrar.

^2

para todo i]. Dada la

(iii) Se sabe que desigualdad en la sugerencia,

Ahora podemos reorganizar la cada de la covarianza de la muestra, y cancelamos

en todas partes, para obtener Cuando multiplicamos por mostrar. tenemos Var (1) Var( ), que es lo hemos querido

SOLUCIONES A LOS EJERCICIOS DE INFORMTICA 3.13 (i) Probablemente 2 > 0, como mayores ingresos normalmente significa una mejor nutricin para la madre y una mejor atencin prenatal. (ii) Por un lado, un aumento de los ingresos en general, aumenta el consumo de un bien, cigs y faminc podra ser una correlacin positiva. Por otro lado, los ingresos familiares son tambin ms altos para las familias con ms educacin y ms educacin y fumar cigarrillos tienden a ser una correlacin negativa. La correlacin de la muestra entre el cigs y faminc se trata de -0.173, lo que indica una correlacin negativa. (iii) Las regresiones con bwght y sin faminc son: bwght = 119.77 - 0.514 cigs n = 1, 388 R^2 = 0.023 Y bwght = 116.97 0.463cigs + 0.093faminc n = 1, 388 R^20 = 030.
El efecto de fumar cigarrillos es ligeramente ms pequeo cuando faminc se aade a la regresin, pero la diferencia no es grande. Esto es debido al hecho de que cigs y faminc no estn muy correlacionados, y el coeficiente de faminc es prcticamente pequeo. (El faminc variable se mide en miles, por lo que $ 10.000 ms en 1988 que aumenta el ingreso predijo el peso al nacer por slo 0.93 oz.) 3.14 (i) La ecuacin estimada es: price = - 19.32 + 0.128sqrft + 15.20bdrms n = 88, R^2 = 0.632. (ii) Pelculas de Holding cuadrada constante, price = 15.20bdrms, y as los aumentos de precios de 15.20, lo que significa $ 15,200. (iii) Ahora price = 0.128sqrft + 15.20bdrms = 0.128 (140) + 15.20 = 33.12, o $ 33,120. Debido a que el tamao de la casa est aumentando, este es un efecto mucho mayor que en (ii). (iv) Acerca de 63.2%. (v) El precio previsto es -19,32 + 0.128 (2,438) + 15.20 (4) = 353.544, o 353,544 dlares. (vi) De la parte (v), el valor estimado de la vivienda basado slo en superficie y nmero de dormitorios es $ 353,544. El precio de venta real fue de $ 300,000, lo que sugiere lo mal pagados

por el comprador de un cierto margen. Pero, por supuesto, hay muchas otras caractersticas de una casa (algunos que ni siquiera se puede medir) que afectan a los precios, y no hemos controlado para estos. 3.15 (i) La ecuacin de la elasticidad constante es: log(salary) = 4.62 + 0.162 log(sales) + 0.107log(mktval) n = 177, R^2 = 0.299. (ii) No podemos incluir los beneficios en forma logartmica porque los beneficios son negativos para las nueve muestras de las empresas. Cuando se agrega en los niveles de forma que obtenemos: Log (salary) = 4.69 + 0.161 log(sales) + 0.098 log (mktval) + 0.000036profits n = 177 R^2 = 0.299 El coeficiente de los beneficios es muy pequeo. Aqu, los beneficios se miden en millones, por lo que, si los beneficios aumentan en $ 1 mil millones, lo que significa profits = 1.000 - un cambio enorme - salario predicho aumenta en alrededor de slo el 3.6%. Sin embargo, recuerde que estamos llevando a cabo las ventas y valor de mercado fijo. En conjunto, estas variables (y que

podran caer los beneficios sin perder nada) explican casi el 30% de la variacin de la muestra en el log (salario). Este no es ciertamente "la mayora" de la variacin. (iii) Adicionando ceoten a la ecuacin da: log (salary) = 4.56 + 0.162 log (sales) 0.102 log (mktval) + 0.000029profits + 0.012 ceoten n = 177 R^2 = 0.318 Esto significa que un ao ms, a medida que aumenta CEO la prediccin salarial, sube aproximadamente en 1.2%. (iv) La correlacin de la muestra entre el inicio (mktval) y las ganancias es de aproximadamente 0.78, que es bastante alta. Como sabemos, esto no causa ningn sesgo en los estimadores MCO, aunque puede causar a que su varianza a sea grande. Dada la correlacin bastante sustancial entre el valor de mercado y la empresa beneficios, no es demasiado sorprendente que este ltimo no aade nada a la explicacin de los salarios del director general. Adems, los beneficios es una medida a corto plazo de cmo la empresa est haciendo mientras mktval se basa en el pasado, presente, y se espera rentabilidad futura.

3.16 (i) El mnimo, mximo y promedio de estas tres variables se dan en la siguiente tabla: Variable Atndrte priGPA ACT Promedio 81,71 2,59 22,51 Mnimo 6,25 0.86 13 Mximo 100 3,93 32

(ii) La ecuacin estimada es: atndrte = 75.70 + 17.26priGPA-1.72 ACT n = 680 R^2 = 0.291. La interseccin significa que, para un estudiante cuyo GPA antes es cero y la puntuacin en el test es cero, la tasa prevista la asistencia es del 75.7%. Pero este no es un segmento interesante de la poblacin. (De hecho, no hay estudiantes en la poblacin universitaria con priGPA = 0 y ACT = 0.) (iii) El coeficiente de priGPA significa que, si antes GPA de un estudiante es un punto por encima (Por ejemplo, de 2.0 a 3.0), la tasa de asistencia es de unos 17.3 puntos porcentuales ms. Esto el ACT fijo. El coeficiente negativo en el ACT es, tal vez al principio un poco sorprendente. Cinco puntos ms en la ACT se prev que baje la asistencia de 8,6 puntos porcentuales a un nivel dado de priGPA. Como priGPA mide el desempeo en la universidad (y, por lo menos parcialmente, podran reflejar, la asistencia ms all las tasas), mientras que ACT es una medida del potencial en la universidad, parece que los estudiantes que tenan ms npromesa (lo que podra significar ms habilidad innata) piensan que pueden llegar a funcionar con clases que faltan.
(iv) tenemos atndrte = 75.70 + 17.267 (3.65) 1.72 (20) 104,3. Por supuesto, un estudiante. No se puede tener mayor que una tasa de asistencia del 100%. Obtencin de las predicaciones de este tipo siempre es posible cuando se utilizan mtodos de regresin con los naturales lmites superiores o inferiores de la variable dependiente. En la prctica, podemos predecir una tasa de asistencia del 100% para este estudiante. (De hecho, este estudiante tuvo una tasa de asistencia de slo el 87,5%). (v) La diferencia en las tasas de asistencia previstas para A y B es 17.26 (3.1 - 2.1) - (21 -26) = 25.86. 3.17 La regresin de educ con exper y la antigedad es: educ = 13.57 0.074 exper + 0.048 tenere + n = 526, R^2 = 0.101.

Ahora bien, cuando hacemos una regresin log (salario) en log (salario) = 1,62 + 0,092 n = 526, R^2 = 0.207

obtenemos:

Como se esperaba, el coeficiente de regresin en el segundo es idntico al coeficiente de educ en la ecuacin (3.19). Observe que el R-cuadrado de la regresin anterior es menor que en (3.19). En efecto, la regresin en slo utiliza la parte de educ que no est correlacionado con exper y para explicar la tenencia de log (salario). 3.18 (i) El coeficiente de la pendiente de la regresin en educ IQ est (redondeado a cinco decimales) 1 = 3.53383. (ii) El coeficiente de la pendiente de log (salario) en la educ es = 0.05984.

(iii) Los coeficientes de la pendiente de log (salario) en educ, IQ son respectivamente. = 0.03912 y 2 = 0.00586, respectivamente.

(iv) Tenemos = 0.03912 + 3.53383 (0.00586) = 0.05983 que est muy cerca de 0.05984. (Sujeto a errores de redondeo).

CAPTULO 4 Notas para la enseanza. La estructura de este captulo le permite recordar a los estudiantes que una distribucin de error especfico no desempe ningn papel en los resultados del captulo 3. La normalidad es necesaria, sin embargo, para obtener exactamente una distribucin normal muestral (condicionada a las variables explicativas). Hago hincapi en que el conjunto completo de Supuestos CLM que se utilizan en este captulo, pero que en el captulo 5 nos relajamos la normalidad supuesto y an realizar la inferencia vlida aproximadamente. Se podra argumentar que en el modelo clsico, los resultados de un modelo lineal podran ser omitidos por completo, y que el anlisis slo se muestra grande que se necesita. Pero, desde una perspectiva prctica, los estudiantes todava tienen que saber de dnde viene la distribucin t, porque prcticamente todos los paquetes de regresin el informe estadstico t y obtener los valores de p fuera de la t distribucin. Que luego se les hace muy fcil para cubrir el captulo 5 rpidamente, con slo decir que puede caer la normalidad y seguir utilizando las estadsticas de las camisetas y los p-valores asociados como aproximadamente vlida. Adems, en ocasiones los alumnos tienen que analizar conjuntos de datos ms pequeos, especialmente si hacen sus propias pequeas encuestas para un proyecto a largo plazo. Es fundamental hacer hincapi en que ponemos a prueba las hiptesis sobre los parmetros desconocidos de la poblacin, le digo a mis estudiantes que van a ser castigados si escriben algo as como H0: 1 = 0 en un examen o, peor an, H0: 0,632 = 0. Una caracterstica til del captulo 4 es su nfasis en la reescritura de un modelo de poblacin que contiene el parmetro de inters en la prueba de una sola restriccin. Creo que esto es ms fcil, tanto terica y prcticamente, que las variaciones de cmputo que puede, en algunos casos, dependen numerosos trminos de covarianza. El ejemplo de pruebas de la igualdad de la vuelta a dos y cuatro aos de colegios ilustra el mtodo de base, y muestra que el modelo especificado puede tener una til interpretacin. Se puede utilizar una prueba de F para simples restricciones lineales en varios parmetros, pero esto es menos transparente que en la prueba y no inmediatamente producir el error estndar necesario para un intervalo de confianza o para probar una alternativa unilateral. El truco de la reescritura de la poblacin del modelo es til en varios casos, incluyendo la obtencin de intervalos de confianza para las predicciones en el Captulo 6, as como para la obtencin de intervalos de confianza para efectos marginales en modelos con interacciones (tambin en el captulo 6). El ejemplo del jugador de la liga mayor de bisbol ilustra la diferencia salarial entre el individuo y la significacin conjunta, cuando las variables explicativas (rbisyr hrunsyr y en este caso) son altamente correlacionados. Que tienden a enfatizar la forma R-cuadrado del estadstico F, ya que, en la prctica, es aplicable a un gran porcentaje del tiempo, y es mucho ms fcilmente computado. Lamento que este ejemplo tiene un sesgo hacia los estudiantes en los pases donde el bisbol se juega. Sin embargo, es uno de los mejores ejemplos de multicolinealidad que he encontrado, y los estudiantes de todos los orgenes parece que consigue el punto.

SOLUCIONES A LOS PROBLEMAS 4,1 (i) y (iii) generalmente causan las estadsticas t no tener una distribucin bajo H0. Homoscedasticidad es uno de los supuestos de CLM. Una variable importante omitida viola el supuesto MLR.3. Los supuestos CLM no contienen mencin de las correlaciones de muestras entre las variables independientes, excepto para descartar el caso en que la correlacin es una. 4.2 (i) H0: 3 = 0. H1: 3> 0. (ii) El efecto proporcional en el salario es 0,00024 (50) = 0.012. Para obtener el efecto en porcentaje, multiplicamos esto por 100: 1,2%. Por lo tanto, un aumento de 50 puntos, ceteris paribus, en el ROS se prev a aumentar el sueldo slo un 1,2%. Prcticamente hablando, esto es un efecto muy pequeo para una gran cambio en ros. (iii) El valor crtico del 10% para una prueba de una cola, con gl = , se obtiene de la tabla G.2, como 1,282. El estadstico t de ROS es .00024/.00054 0,44, muy por debajo del valor crtico. Por lo tanto, no rechazamos H0 en el nivel de significacin del 10%. (iv) En base a este ejemplo, el coeficiente estimado ros parece ser diferente de cero slo debido a la variacin de muestreo. Por otro lado, incluyendo ROS no puede causar ningn dao, sino que depende de la correlacin es con las otras variables independientes (aunque estos son muy significativa a pesar de ROS en la ecuacin). 4.3 Manteniendo profmarg fija, rdintens = 0,321 log (ventas) = (.321/100) [100] 0,00321 Por lo tanto, si %sales = 10, 0.032, o slo tres centsimas de punto porcentual. Para un porcentaje tan grande aumento de las ventas, esto parece un efecto prcticamente pequeo. rdintens log las ventas. (ii) Ho: 1 = 0 contra H1: 1 > 0, donde 1 es la pendiente de la poblacin en el registro (de ventas). El t estadstico es .321/.216 1.486. El valor crtico del 5% para una prueba de una cola, con gl = 32 - 3 = 29, se obtiene de la tabla G.2, como 1,699, por lo que no puede rechazar Ho al nivel del 5%. Pero el 10% crtico valor es 1,311; ya que el estadstico t est por encima de este valor, se rechaza Ho a favor de H1 en el 10% de significancia. (iii) En realidad no. Su estadstica t es slo 1,087, que est muy por debajo incluso del valor crtico del 10% para una prueba de una cola. 4,4 (i) H0: 3 = 0. H1: 3 0. 4.4 (i) en igualdad de circunstancias, una mayor poblacin aumenta la demanda de viviendas de alquiler, que deben aumentar los alquileres. La demanda de vivienda en general es mayor cuando el ingreso promedio es ms alto, empujando hacia arriba el costo de la vivienda, incluyendo las tarifas de alquiler. (ii) El coeficiente de log (pop) es una elasticidad. Una declaracin correcta es que "un aumento del 10% en la poblacin aumenta en alquiler por 0.066 (10) = 0.66%. " (Iv) Con gl = 64 - 4 = 60, el valor crtico al 1% para una prueba de dos colas es 2,660. El estadstico t es de aproximadamente 3,29, lo cual est muy por encima del valor crtico. As 3 es estadsticamente diferente de cero en el nivel de 1%. 4.5 (i) 0,412 1,96 (0.094), o alrededor de .228 a .596. (ii) No, porque el valor es 0.4 y el interior de la IC del 95%.

(iii) S, porque 1 est fuera del IC del 95%. 4.6 (i) Con gl = n - 2 = 86, obtenemos el valor crtico del 5% de la Tabla G.2 con gl = 90. Debido a que cada prueba es de dos colas, el valor crtico es 1.987. El estadstico t para Ho: o = 0 es de aproximadamente -0,89, que es mucho menos de 1,987 en valor absoluto. Por lo tanto, no rechazamos o = 0. El t estadstica para Ho: 1 = 1 es (0.976-1) / 0.049 - .49, que es incluso menos significativo. (Recuerde que rechazar Ho a favor de H1, en este caso slo si | t |.> 1.987) (ii) Usamos la forma SSR de la estadstica F. Estamos probando q = 2 las restricciones y los gl en el modelo sin restricciones es de 86. Se nos ha dado SSRr = 209,448.99 y 165,644.51 = SSRnr.

que es un fuerte rechazo de Ho: a partir de la Tabla G.3c, el valor de 1% de crtico con 2 y 90 grados de libertad es de 4,85. (iii) Se utilice el formulario R-cuadrado del estadstico F. Estamos probando q = 3 y no hay restricciones son 88 - 5 = 83 grados de libertad en el modelo sin restricciones. El estadstico F es [(0.829-0.820) / (1 - 0.829)] (83/3) 1.46. El valor crtico del 10% (de nuevo con 90 gl del denominador en la Tabla G.3a) es 2,15, por lo que no rechazar Ho en, incluso al nivel del 10%. De hecho, el valor de p es de 0.23. (iv) Si heteroscedasticidad estuvieron presentes, Asuncin MLR.5 seran violadas, y la F estadstica no tendra una distribucin F bajo la hiptesis nula. Por lo tanto, comparando el F estadstica en contra de los valores crticos habituales, o para obtener el valor de p de la distribucin F, se no ser especialmente significativa. 4,7 (i) Si bien el error estndar en hrsemp no ha cambiado, la magnitud del coeficiente tiene aument en un medio. El estadstico t en hrsemp ha pasado de unos -1,47 a -2,21, lo que ahora el coeficiente es estadsticamente menor que cero al nivel del 5%. (De la Tabla G.2 el valor crtico del 5% con 40 grados de libertad es -1,684. El valor crtico es del 1% -2.423, por lo que el valor de p es entre .01 y .05.) 4.7 (ii) Si sumamos y restamos registro 2 (empleo) de la mano derecha del lado y recoger los trminos, tener log (chatarra) = + 0 1 hrsemp + [log 2 (ventas) - 2 log (empleo)] + [Log 2 (empleo) + 3 log (empleo)] + u = 0 + 1 hrsemp + 2 log (ventas / empleo) + (2 + 3) registro (empleados) + u, donde la segunda igualdad se deduce del hecho de que log (ventas / empleo) = log (ventas) -log (empleo). Definicin de 3 2 + 3 da el resultado. (iii) N Estamos interesados en el coeficiente de log (empleo), que tiene en la estadstica de 0,2, que es muy pequeo. Por lo tanto, se concluye que el tamao de la empresa, medida por los empleados, no importa, una vez que controlamos para la formacin y las ventas por empleado (en una funcional logartmica forma). (Iv) La hiptesis nula en el modelo de la parte (ii) es H0: 2 = -1. La estadstica es t [- 0.951 -(-1)] / 0,37 = (1-0.951) / 0,37 0.132, lo que es muy pequeo, y no somos capaces de rechazar si se especifica una alternativa-o de dos caras. 4.8 (i) Usamos la propiedad VAR.3 del Apndice B: Var (1 - 3 2) = Var (1) + 9 Var (2) 6 Cov (1, 2). (Ii) t = (1 - 3 2 - 1) / SE (1 - 3 2), as que necesitamos el error estndar de una - 3 2.

(iii) Porque 1 = 1 - 32, podemos escribir 1 + = 1 32. Al conectar este a la poblacin modelo da y = 0 + (+ 1 32) x1 + x2 + 2 3 x3 + u = + 0 1 x1 + 2 (3x1 + x2) + 3 x3 + u. Esta ltima ecuacin es lo que se estiman mediante la regresin y el x1, 3x1 + x2 y x3. La coeficiente y error estndar de x1 es lo que queremos. 4.9 (i) Con gl = 706 - 4 = 702, se utiliza el estndar de valor normal crtico (gl = en la tabla G.2), que es 1,96 para una prueba de dos colas al nivel del 5%. Ahora t = educ = -11.13/5.88 -1,89, por lo que | t educ | = 1,89 <1,96, y no somos capaces de rechazar Ho: educ = 0 al nivel del 5%. Adems, tage 1,52, por lo que la edad es tambin estadsticamente significativa al nivel del 5%. (ii) Es necesario para calcular la forma R-cuadrado del estadstico F de significacin conjunta. Sin embargo, F = [(0.113-0.103) / (1-0.113)] (702/2) 3,96. El valor crtico del 5% en la F 2.702 de distribucin puede ser obtenido de la tabla con el denominador G.3b gl = : cv = 3,00. Por lo tanto, educ y la edad son conjuntamente significativas al nivel del 5% (3,96> 3,00). De hecho, el valor de p es de aproximadamente 0.019, y por lo educ y la edad son conjuntamente significativos al nivel del 2%.

(iii) En realidad no. Estas variables son conjuntamente significativas, pero su inclusin slo cambia el coeficiente de totwrk de - .151 a - .148. (iv) El t estndar y F estadsticas que hemos utilizado asumir Homoscedasticidad, adems de la otros supuestos CLM. Si hay heteroscedasticidad en la ecuacin, las pruebas ya no son vlidas. 4.10 (i) Es necesario para calcular el estadstico F para la significacin general de la regresin con n = 142 yk = 4: F = [0,0395 / (1-0,0395)] (137/4) 1,41. El valor crtico del 5% con 4 df del numerador y el uso de 120 para el df del numerador, es de 2,45, muy por encima del valor de F. Por lo tanto, no rechazamos H0: 1 = 2 = 3 = 4 = 0 al nivel del 10%. No explica por variable es individualmente significativo al nivel del 5%. El ms grande estadstico t absoluto es el de coronas danesas, TDKR 1,60, lo cual no es significativo al nivel del 5% contra una alternativa de dos caras. (ii) La estadstica F (con el mismo df) es ahora [0,0330 / (1-0.0330)] (137/4) 1,17, que es incluso ms baja que en la parte (i). Ninguno de los estadsticos t es significativo a un nivel razonable. (iii) Me parece muy dbil. No hay estadsticas significativas t al nivel del 5% (contra una de dos alternativa caras), y las estadsticas F son insignificantes en ambos casos. Adems, menos del 4% del variacin en la rentabilidad se explica por las variables independientes. 4,11 (i) En las columnas (2) y (3), el coeficiente de profmarg es negativa, aunque su t estadstica es slo alrededor de -1. Parece que, una vez que las ventas en firme y el valor de mercado se han controlado para el, margen de beneficio no tiene ningn efecto sobre el salario director general. (ii) Usamos la columna (3), que controla la mayora de los factores que afectan a sueldo.

El estadstico t de registro (mktval) es de aproximadamente 2,05, que es slo significativo al nivel de 5% en contra de una alternativa de dos caras. (Se puede utilizar la norma fundamental del valor normal, 1,96). Por lo tanto log (mktval) es estadsticamente significativa. Debido a que el coeficiente es una elasticidad, un aumento, ceteris paribus, un 10% del valor de mercado es prev un aumento salarial del 1%. Esto no es un gran efecto, pero no es insignificante, tampoco. (iii) Estas variables son individualmente significativos en los niveles de significacin bajo, con tceoten 3,11 y tcomten -2,79. Otros factores fijos, un ao ms como director general con la empresa aumentos salariales alrededor de 1,71%. Por otro lado, otro ao con la empresa, pero no como CEO, disminuye salarial en alrededor de 0.92%. Este hallazgo segunda a primera vista parece sorprendente, pero podra estar relacionado con el "Superestrella" efecto: las empresas que contratan a directores ejecutivos de fuera de la empresa van a menudo despus de un pequeo grupo de muy bien considerado candidatos, y los salarios de estas personas son objeto de puja. Ms no-CEO de aos con un la empresa hace que sea menos probable que la persona fue contratada como una superestrella exterior.

SOLUCIONES A LOS EJERCICIOS DE INFORMTICA

4.12 (i) La celebracin de los dems factores fijos,

donde usamos el hecho de que el 100 log () expendA expendA%. As 1 / 100 es el (ceteris paribus) variacin en puntos porcentuales en el voteA expendA cuando se incrementa en uno por ciento. (ii) La hiptesis nula es H0: 2 = - 1, lo que significa aumento de az% en el gasto por A y el aumento de az% en el gasto por B deja voteA sin cambios. Nos puede escribir de forma equivalente H0: 1 + 2 = 0. (iii) La ecuacin estimada (con los errores estndar en parntesis debajo de las estimaciones) es

El coeficiente de log (expendA) es muy significativo (estadstico t 15,92), como es el coeficiente de log (expendB) (estadstico t -17,45). Las estimaciones implican que un 10%, ceteris paribus, aumento de la pasando por el candidato A aumenta la proporcin prevista de la votacin va a la A, sobre la 0.61 puntos porcentuales. [Recordemos que, manteniendo los dems factores fijos, voteA (6.083/100) expendA%).] Del mismo modo, un aumento del 10%, ceteris paribus, en el gasto de B reduce en alrededor de 0,66 puntos porcentuales. Estos efectos ciertamente no pueden ser ignorados. Vote A Mientras que los coeficientes de registro (expendA) y log (expendB) son de

magnitudes similares (y de signo opuesto, como es de esperar), no tenemos el error estndar de una 1 + 2, que es lo que tendra que probar la hiptesis de la parte (ii). (Iv) Escribir 1 = 1 + 2, o 1 = 1 - 2. Si conecta este en la ecuacin original, y reorganizar, da = VoteA 0 + log 1 (expendA) + 2 [log (expendB) - log (expendA)] + 3 prtystrA + u, Cuando se estima esta ecuacin obtenemos $ 1 - 0.532 y SE ($ 1) 0.533. El estadstico t para la hiptesis en la parte (ii) es -.532/.533 -1. Por lo tanto, no rechazamos H 0: 2 = - 1.

4,13 (i) En el modelo log (salario) = + 0 1 LSAT + 2 PAM + 3 registro (libvol) + 4 registro (costo) + 5 rango de + u, la hiptesis de que el rango no tiene efecto sobre log (salario) es H0: 5 = 0. La ecuacin estimada (ahora con errores estndar) es = 8.34 + 0.0047 + 0.248 LSAT ACP + 0,095 log (libvol) log () salario (0,53) (.0040) (.090) (.033) + 0,038 log (costo) - 0,0033 Rango (.032) (.0003) n = 136, R2 = 0.842. El estadstico t en el rango es -11, que es muy significativo. Si rango disminuye por 10 (que es un movimiento para una escuela de derecho), salario promedio de inicio se prev que aumente en alrededor de 3,3%. (ii) LSAT no es estadsticamente significativa (estadstico t 1,18), pero GPA es muy significativa (t estadstica de 2,76). La prueba de significacin conjunta es discutible dado que la ACP es tan importante, pero para integridad el estadstico F es de 9.95 (con 2 y 130 grados de libertad) y pvalor 0.0001. (iii) Cuando aadimos clsize y la facultad de la regresin perdemos cinco observaciones. La prueba de significativa de su conjunto (con 2 y 131 - 8 = 123 gl) da F 0,95 y p-valor de 0,39. As que estos dos variables que no son conjuntamente significativos a menos que utilice un nivel de significacin muy grande. (v) Si queremos determinar con exactitud el efecto de la clasificacin numrica de la Facultad de Derecho de partida los salarios, hay que controlar otros factores que afectan a los salarios y las clasificaciones. La idea es que hay algo de aleatoriedad en el ranking, o la clasificacin puede depender en parte de factores frvolas que no afectan a la calidad de los estudiantes. Resultados del LSAT y el PAM son, quizs, un buen control de estudiante calidad. Sin embargo, si hay diferencias de gnero y la composicin racial de todo es cuelas, y el gnero y la raza sistemtica las diferencias en los salarios, tambin se podra controlar para ellos. Sin embargo, no est claro por qu estos se correlacionan con el rango. La calidad del profesorado, como tal vez medido por los registros de la publicacin, se podran incluir. Este tipo de cosas no entran los rankings de la ley las escuelas. 4.14 (i) El modelo estimado es 11.67 + 0.000379 sqrft + 0,0289 log hab () = precio

(0,10) (.000043) (.0296) n = 88, R2 = 0.588. Por lo tanto, un = 150 (.000379) + 0.0289 = 0.0858, lo que significa que un adicional de 150 metros cuadrados habitacin aumenta el precio pronosticado en alrededor de 8,6%. (ii) 2 = 1 - 150 1, y as log (precio) = + 0 1 sqrft + (1 - 150 1) hab + u = 0 + 1 (sqrft - 150 hab) + 1 hab + u.

(iii) De la parte (ii), se corre la regresin log (precio) en (sqrft - 150 hab) y hab, y obtener el error estndar en hab. Ya sabemos que una = 0.0858, y ahora tambin obtenemos s () = 0,0268. El intervalo de confianza del 95% reportado por mi paquete de software es .0326 a .1390 (O alrededor de un 3,3% a 13,9%).

4.15 El R-cuadrado de la bwght regresin en CIGS, la paridad y faminc, utilizando todos los 1388 observaciones, se trata de 0.0348. Esto significa que, si por error usar esto en lugar de 0.0364, lo que es el uso de R-cuadrado de las mismas 1.191 observaciones disponibles en la regresin sin restricciones, que obtendra F = [(0,0387 a 0,0348) / (1-0,0387)] (1185/2) 2,40, lo que da valor p .091 en una distribucin F con 2 y df 1,1185. Esto es significativo al nivel del 10%, pero es incorrecta. El estadstico F correcta se calcula como 1,42 en el ejemplo 4.9, con valor de p 0.242. 4.16 (i) Si dejamos caer rbisyr la ecuacin estimada se convierte en = 11,02 + .0677 + 0.0158 aos gamesyr log () salario (0,27) (.0121) (.0016) + 0,0014 + 0,0359 bavg hrunsyr (.0011) (.0072) n = 353, R2 = 0.625. Ahora hrunsyr es muy significativa (estadstico t 4,99), y su coeficiente ha aumentado por cerca de dos veces y media. (Ii) La ecuacin con runsyr, fldperc, y sbasesyr aadido es = 10,41 + .0700 + 0.0079 aos gamesyr log () salario (2,00) (.0120) (.0027) + 0,00053 + 0,0232 bavg hrunsyr (.00110) (.0086) + 0,0174 + 0,0010 runsyr fldperc - 0.0064 sbasesyr (.0051) (.0020) (.0052)

n = 353, R2 = 0.639. De las tres variables independientes adicionales, slo runsyr es estadsticamente significativa (t estadstica = .0174/.0051 3,41). La estimacin implica que una carrera ms por cada ao, otros factores fija, los aumentos de sueldos prevista en alrededor de 1,74%, un incremento sustancial. Las bases robadas variable, incluso tiene el "mal" con el signo de un estadstico de alrededor de -1,23, mientras que fldperc tiene un estadstico de slo 0,5. La mayora de los jugadores de grandes ligas son muy buenos jardineros, de hecho, el ms pequeo fldperc es 800 (lo que significa 0.800). Con una variacin relativamente pequea en fldperc, tal vez no sea sorprendente que su efecto es difcil de estimar. (iii) A partir de sus estadsticas t, bavg, fldperc y sbasesyr son individualmente insignificantes. El F estadstica de su significacin conjunta (con 3 y 345 grados de libertad) es de aproximadamente 0,69 con p-valor de 0,56. Por lo tanto, estas variables son conjuntamente muy in significante. 4,17 (i) En el modelo log (salario) = 0 + 1 + 2 educ exper + + u 3 la tenencia la hiptesis nula de inters es H0: = 2 3. (ii) Que 2 = 2 - 3. A continuacin, se puede estimar la ecuacin log (salario) = 0 + 1 + educ exper 2 + 3 (expe + la tenencia) + u para obtener el IC del 95% de 2. Este resulta ser de 0,0020 1,96 (0,0047), o alrededor de - .0072 a 0,0112. Puesto que el cero es en este IC, 2 no es estadsticamente diferente de cero al nivel del 5%, y no somos capaces de rechazar H0: = 2 3 al nivel del 5%. 4.18 (i) El valor mnimo es 0, el mximo es 99, y el promedio es de 56,16. (ii) Cuando phsrank se aade a (4.26), obtenemos lo siguiente: 1,459 hasta 0,0093 x + 0,0755 + 0,0049 totcoll exper + 0,00030 registro phsrank () = salario (0,024) (.0070) (.0026) (.0002) (.00024) n = 6.763, R2 = 0.223 As phsrank tiene un estadstico equivalente a slo el 1,25, no es estadsticamente significativa. Si aumentamos phsrank por 10, log (salario) se prev que aumente por (0.0003) 10 = 0,003. Esto implica un 0,3% aumento de los salarios, lo que parece un modesto incremento dado un incremento porcentual de 10 puntos en phsrank.(Sin embargo, la desviacin estndar de la muestra de phsrank es aproximadamente 24.) (iii) Adicin phsrank hace que el estadstico t en an menor JC en valor absoluto, aproximadamente 1,33, pero la magnitud coeficiente es similar a (4,26). Por lo tanto, el punto base se mantiene sin cambios: la volver a una universidad se estima en algo ms pequeo, pero la diferencia no es niveles significativos significativos y estndar. (iv) la identificacin de la variable es slo un nmero de identificacin del trabajador, que debe ser al azar asignado (al menos aproximadamente). Por lo tanto, id no debe estar

relacionada con cualquier variable de la ecuacin de regresin. Debe ser insignificante cuando se aade a (4,17) o (4,26). De hecho, su t estadstica es de 0,54. 4.19 (i) Hay 2.017 personas solteras en la muestra de 9275. (ii) La ecuacin estimada es = -43,04 + 0,799 + 0,843 aos inc $ neto FA (4,08) (.060) (.092) n = 2.017, R2 = 0.119. El coeficiente de inc indica que un dlar ms en el ingreso (edad celebracin fijo) se refleja en alrededor de 80 centavos de dlar ms en predijo nettfa, no hay sorpresa. El coeficiente de la edad significa que, la celebracin de la renta fija, si una persona recibe un ao ms viejo, l / ella nettfa se prev que aumente en cerca de $ 843. (Recuerde, nettfa es en miles de dlares.) Una vez ms, esto no es sorprendente. (iii) La interseccin no es muy interesante, ya que da la nettfa previsto para inc = 0 y la edad = 0. Claramente, no hay una con incluso cerca de estos valores en la poblacin relevante. (iv) La estadstica es t (0,843 a 1) / 0.092 -1.71. Contra el H1 alternativa unilateral: 2 <1, el p-valor es de aproximadamente 0.044. Por lo tanto, podemos rechazar H0: 2 = 1 en el nivel de significacin del 5% (frente a la alternativa de un solo lado). (v) El coeficiente de la pendiente en inc en la regresin simple es de aproximadamente 0.821, que no es muy diferente de la obtenida en la parte .799 (ii). Como resultado, la correlacin entre la edad y el inc en la muestra de personas solteras es de slo 0.039, lo que ayuda a explicar por qu el simple y las estimaciones de regresin mltiple no son muy diferentes, se refieren de nuevo a la pgina 79 del texto.

You might also like