Multicolinealidad - Econometria

UNIVERSIDAD NACIONAL AGRARIA DE LA SELVA
“PLAN DE ESTUDIO DE MERCADO DE CARAMELOS A BASE DE LICORES EXOTICOS DE

LA SELVA”
INTEGRANTES:
 BRAVO FERNANDEZ, YERSON JEAN PAUL

 GARCIA GARCIA, ALEXIS LUIS
 MARTINEZ VASQUEZ, JUNIOR
 SALDAÑA ALVARADO, MARIA DEL CARMEN
 SANCHEZ MENA, WENDY
TINGO MARÍA, PERÚ

INTRODUCCIÓN
La Econometría, es la rama de la economía, que utiliza métodos y modelos matemáticos, los

cuales son utilizados para analizar, interpretar y predecir diversos sistemas y variables
económicas, sin embargo, el mayor problema con el que se enfrenta la investigación es la
escasez de datos, los sesgos (Diferencia entre el valor esperado de un estimador y el verdadero
valor del parámetro) que pueden causar los mismos y la ausencia o insuficiencia de una teoría
económica adecuada.
Aun así, la econometría es la única aproximación científica al entendimiento de los fenómenos

económicos.
Es por ello que en este informe se quiere lograr el objetivo, a través de la econometría, de poder
estimar el modelo a través de mínimo cuadrado ordinario y hallar por distintas vías si existe
colinealidad y efectuar posibles soluciones ante ello. El modelo lineal general es un instrumento
estadístico muy eficaz y de uso amplio. Sin embargo, como en todas las aplicaciones estadísticas
la eficacia del método depende de que se cumpla las hipótesis básicas en cada aplicación
concreta (J. JOHNSTON).
El modelo utilizado en esta investigación es el de Regresión lineal, el cual considera ciertos

supuestos, los cuales corroboraremos por medio de los análisis de Multicolinealidad y
autocorrelación.
I. REVISION LITERARIA:
Generalmente en las variables económicas de un modelo econométrico existe un problema
de falta de independencia entre ellas. En el caso de que esta dependencia sea linealmente
exacta es imposible estimar al modelo por medio de los método de MCO debido a que la
matriz X’X es singular y por lo tanto no invertible. Si por el contrario la dependencia no es
exacta el problema es que no se conozca la aportación individual de las variables explicativas
para con la variable explicada.
1.1. Causas de la Multicolinealidad:
- La mala toma de información
- Restricciones del modelo o en la población objeto del modelo
- Mala especificación del modelo
- La sobredimensión o exagerado número de variables explicativas
- Errores en el uso de las unidades de medida de las variables
1.2. Consecuencias de la Multicolinealidad:
- Si existe Multicolinealidad perfecta entre las variables Xs, entonces, sus coeficientes
de regresión son indeterminados y sus errores estándares infinitos.
- Con Multicolinealidad perfecta los tc serian cero y si fuera no perfecta los tc muy
cercanos a cero, por lo que no serían significativos.
- Si la Multicolinealidad es alta pero no perfecta la estimación de los coeficientes de
regresión es posible, pero sus errores estándares tienen a ser grandes y por
consiguiente los valores poblaciones de los parámetros no pueden estimarse de
manera precisa.
1.3. Métodos de detección de Multicolinealidad:
La detección de estos problemas de colinealidad puede hacerse de varias formas:
a) Modelo globalmente bien estimado y regresores individualmente no significativos:
este es uno de los indicadores más empleados para justificar la existencia de
Multicolinealidad ya que es considerado como un “Síntoma Clásico”. Según este
análisis la Multicolinealidad se da cuando se observa un R2 alto y unos tc no
significativos.
b) Análisis de la matriz de correlaciones de los regresores: En este tipo de análisis se
puede observarlo de dos formas: si la determinante de la matriz de correlación de
los regresores es igual a cero se dice que existe correlación; tambien podemos
observar si el R2 entre los regresores es alto (Mayor a 0.8) se considera que hay
colinealidad entre dichos regresores.
c) Índice de condición de Belsley, Kuck y Welsch: Este índice se obtiene con de la
siguiente formula:
√𝝀𝒎𝒂𝒙
𝑲(𝒙) =
√𝝀𝒎𝒊𝒏
Los valores 𝝀 se obtiene a través de los auto valores de la matriz X’X que se
obtiene de la siguiente forma:
|𝑿′ 𝑿 − 𝜆𝑰| = 0
d) Índice de Klein o Factor De Inflación De La Varianza: Esta medida está basada en

regresiones auxiliares en las que se estima cada una de las variables explicativas en
función de las demás. De esta forma es posible conocer, por una parte el grade en
que cada uno de los regresores está explicado por el resto y, por otra, tener una
aproximación de la redundancia de información que se produce cuando todos
participan en conjunto en el modelo.
e) Medida de Theil: Para calcular se utiliza la siguiente expresión
𝒌
𝒎 = 𝑹 − ∑( 𝑹𝟐 − 𝑹𝟐𝒉 )
𝟐
𝒉=𝟏
1.4. Corrección de la Multicolinealidad:

a) Suprimir variables: Esto es posible cuando el coeficiente de la variable
supuestamente causante de la colinealidad se obtenga con signo contrario al
esperado y cuando la supresión de la variable no modifique significativamente el
ajuste global.
El mayor inconveniente de esta solución se plantea cuando la especificación teórica
del modelo precisa la inclusión de la variable que proporciona información
redundante.
b) Utilización de información adicional o externa: puede ser de dos tipos: información
extramuestral o restricciones en el modelo.
c) Utilización de primeras diferencias: Se desplaza un periodo las variables y se calcula
la diferencia entre dos observaciones sucesivas. El inconveniente de esta corrección
es que puede surgir autocorrelación en la perturbación del modelo.
d)
II. Resultados:
Disponemos de 20 observaciones con respecto al consumo interno (CONS), rentas salariales

agrarias (WA), rentas no salariales no agrarias (RNA) y rentas agrarias (RA), para el periodo
de 1928 – 1941 y 1945 – 1950; la razón por la que no se incluyen a los datos del periodo 1942
- 1944 es debido a los conflictos de la segunda guerra mundial que hizo que los datos no
sean idóneos para el modelo.
Obs. CONS RA WA RNA

1 55.2 4.39 39.21 17.73
2 62.2 4.6 42.31 20.29
3 58.6 3.25 40.37 18.83
4 56.6 2.61 39.15 17.44
5 51.1 1.67 34 14.76
6 51.1 2.44 33.59 13.39
7 54 2.39 36.88 13.33
8 57.2 5.08 39.27 14.67
9 62.8 3.93 45.51 17.2
10 65 5.48 46.06 15.92
11 63.9 4.37 44.16 17.57
12 67.5 4.51 47.68 18.49
13 71.3 4.9 50.79 18.49
14 76.6 6.37 57.78 19.18
15 86.3 8.42 78.97 19.12
16 95.7 9.27 73.54 19.76
17 98.3 8.87 71.92 17.55
18 100.3 9.3 74.01 19.17
19 103.2 6.95 75.51 20.2
20 108.9 7.15 80.97 22.12
MODELO INICIAL
𝑪𝑶𝑵𝑺 = 𝜷𝟏 + 𝜷𝟐 𝑹𝑨𝒊 + 𝜷𝟑 𝑾𝑨𝒊 + 𝜷𝟒 𝑹𝑵𝑨𝒊 + 𝝁𝒊
Analizando los datos con el programa Eviews tenemos obtuvimos los siguientes resultados
Dependent Variable: CONS

Method: Least Squares
Date: 06/08/18 Time: 11:22
Sample: 1 20
Included observations: 20
Variable Coefficient Std. Error t-Statistic Prob.
C 7.797043 8.898983 0.876172 0.3939

RA 0.031506 1.093757 0.028806 0.9774
WA 1.085019 0.175523 6.181621 0.0000
RNA 0.408724 0.649673 0.629122 0.5381
R-squared 0.952673 Mean dependent var 72.29000

Adjusted R-squared 0.943799 S.D. dependent var 19.25581
S.E. of regression 4.564909 Akaike info criterion 6.051531
Sum squared resid 333.4143 Schwarz criterion 6.250677
Log likelihood -56.51531 Hannan-Quinn criter. 6.090406
F-statistic 107.3583 Durbin-Watson stat 1.381412
Prob(F-statistic) 0.000000
Podemos ver con el F estadístico que las variables en conjunto son significativas para el
modelo, pero al analizar la significancia individual de cada variables explicativas podemos
observar que las Rentas Agrarias y las Rentas No Salariales no Agrarias no son significativas
para el modelo ya que al tener un 𝑅 2 y un estadístico “t” bajo puede que exista colinealidad
entre ellas por lo que utilizaremos diferentes medios para probar su existencia.
2.1. Detección de la Multicolinealidad:

a) Análisis de la matriz de correlaciones de los regresores.-
A partir de la matriz de correlaciones de los regresores Rxx puede profundizarse en

el proceso de detección de Multicolinealidad en el modelo. Si los regresores fueran
ortogonales, esto es, en ausencia de colinealidad, el determinante de esta matriz
tomaría el valor de 1.
Correlation RA RNA WA
RA 1.000000 0.604030 0.913933
RNA 0.604030 1.000000 0.703625
WA 0.913933 0.703625 1.000000
Hallando la determinante de la matriz de correlaciones obtenemos que esta es igual

a |𝑅𝑥𝑥 | = 0.0816485 lo cual nos indica la presencia de Multicolinealidad
especialmente entre las variables RA y WA ya que la correlación entre estas supera
el 0.8.
b) Medida de Belsley, Kuck y Welsch.-
Para hallar los índices de condición tenemos que hallar los auto valores (λ) máximos
y mínimos de la matriz X’X normalizada que lo obtendremos por la forma.
𝑋′𝑋𝑛 = 𝑆 ∗ (𝑋 ′ 𝑋) ∗ 𝑆
Donde “S” es una matriz diagonal cuyos elementos son la inversa de la diagonal
principal de X’X elevada a la ½.
Tenemos a la siguiente matriz:

1 4.39 39.21 17.73
1 4.60 42.31 20.29
1 3.25 40.37 18.83
1 2.61 39.15 17.44
1 1.67 34.00 14.76
1 2.44 33.59 13.39
1 2.39 36.88 13.33
1 5.08 39.27 14.67
1 3.93 45.51 17.20
𝑋= 1 5.48 46.06 15.92
1 4.37 44.16 17.57
1 4.51 47.68 18.49
1 4.90 50.79 18.49
1 6.37 57.78 19.18
1 8.42 78.97 19.12
1 9.27 73.54 19.76
1 8.87 71.92 17.55
1 9.30 74.01 19.17
1 6.95 75.51 20.20
(1 7.15 80.97 22.12)𝟒𝒙𝟐𝟎
Para poder hallar la matriz X’X Ingresamos el comando “Sym xx=@inner(grp)” lo
cual nos generó la siguiente matriz, cabe aclarar que grp es la matriz X
20.0000 105.9500 1051.680 355.8100

𝑋′𝑋 = (105.950 668.9881 6259.322 1947.471)
1051.68 6259.322 60563.16 19219.30
355.810 1947.471 19219.30 6429.645
Hallamos la raíz cuadrada de los elementos de la matriz X’X por medio del comando
“Sym m=sqr(XX)”; cabe aclarar que XX es la matriz X’X. Ahora la matriz que
tendremos será
4.472136 10.29320 32.42962 18.86293

𝑚 = (10.29320 25.86480 79.11587 44.13016)
32.42962 79.11587 246.0958 138.6337
18.86293 44.13016 138.6337 80.18507
Ahora generamos el vector de las diagonales de “m” ingresando el comando

“Vector a=@getmaindiagonal(m)” con lo cual obtendremos el siguiente vector
4.472136
𝑎 = [25.86480]
246.0958
80.18507
Luego generamos una matriz diagonal con el vector “a” ingresando el comando
“sym b=@makediagonal(a)” con lo cual obtendremos el siguiente vector
4.472136 0 0 0
𝑏=( 0 25.86480 0 0 )
0 0 246.0958 0
0 0 0 80.18507
Ahora para obtener la matriz “S” tenemos que invertir la matriz “b” ingresando el
siguiente comando “sym s=@inverse(b)” con lo cual obtendremos:
0.223607 0 0 0
𝑆=( 0 0.038663 0 0 )
0 0 0.004063 0
0 0 0 0.012471
Con esta matriz ya podemos hallar nuestra matriz X’X normalizada ingresando el
comando “Sym xxn=s*xx*s” con lo cual obtendremos.
1.000000 0.915961 0.955574 0.992224

𝑋𝑋𝑛 = (0.915961 1.000000 0.983363 0. 939006)
0.955574 0.983363 0.004063 0.973957
0.992224 0.939006 0.973957 0.012471
Por ultimo para obtener los valores propios de esta matriz ingresaremos el
comando “vector vp=@eigenvalues(xxn)” con lo cual obtendremos los siguientes
datos:
0.004582
𝑣𝑝 = [0.009412]
0.105722
3.880283
Entonces tomaremos los valores de máximos y mínimos de λ para hallar el índice
de condición
√𝝀𝒎𝒂𝒙 √3.880283
𝑲(𝒙) = = = 29.100748
√𝝀𝒎𝒊𝒏 √0.004582
Como podemos observar que 10 < 𝑲(𝒙) < 30 entonces concluimos que hay una
colinealidad media entre las variables.
c) Contraste de Multicolinealidad de Farrar – Glauber

Planteamiento
Ho: |Rxx|=1; los regresores son ortogonales entre sí; eso quiere decir ausencia de
colinealidad entre los regresores
Ha: |Rxx|≠1; los regresores son no ortogonales entre sí; eso quiere decir que existe
colinealidad entre los regresores
El estadístico es:
1
𝐺𝑒𝑥𝑝 = [𝑁 − 1 − (2𝑘 + 5)] ∗ 𝐿𝑛|𝑅𝑥𝑥|
6
𝐺𝑒𝑥𝑝 ~𝑋 2 𝑛 ; Es decir se asemeja a una distribución Chi2 donde
𝐾−1
𝑛=𝐾
2
Matriz de Correlación:
Correlation RA RNA WA
RA 1.000000 0.604030 0.913933
RNA 0.604030 1.000000 0.703625
WA 0.913933 0.703625 1.000000
La determinante de la matriz es: 0.081648714

1
𝐺𝑒𝑥𝑝 = [20 − 1 − (2(4) + 5)] ∗ 𝐿𝑛(0.081648714)
6
𝐺𝑒𝑥𝑝 = 24.4282133 ~ 𝑋 2 6𝑔𝑙
4−1
𝑛=4
2
𝑛=6
Gráfica de distribución
Chi-cuadrada, df=5
0.1 6
0.1 4
0.1 2
0.1 0
Densidad
0.08
0.06
0.04
0.02
0.05
0.00
0 11.07
X
Como el 𝐺𝑒𝑥𝑝 = 24.4282133 ~ 𝑋 2 6𝑔𝑙 se encuentran dentro de la región de

rechazo, entonces se acepta la Hipótesis alternante, los regresores son no
ortogonales entre sí; eso quiere decir que existe colinealidad entre los regresores
d) Factor de la inflación de la varianza
Para desarrollar esta metodología se requiere previamente, realizar ciertas
regresiones auxiliares, en concreto, se considera cada uno de los regresores como
función de los demás. De cada una de estas regresiones se necesita el valor de 𝑅 2
y a partir de ello pueden calcularse los aumentos de las varianzas causadas por la
Multicolinealidad midiendo el factor de inflación de la varianza según la siguiente
expresión.
2
𝜎𝑏𝑖 1
2 =
𝜎𝑏𝑜𝑟𝑡 1 − 𝑅𝑗 2
- Estimación de la primera regresión auxiliar:
Dependent Variable: RA
Date: 06/13/18 Time: 08:56
Sample: 1 20
C -0.557717 1.968667 -0.283297 0.7804

WA 0.138551 0.019639 7.054870 0.0000
RNA -0.080399 0.142736 -0.563266 0.5806

Puede calcularse el factor de inflación de la varianza:

1
=
1 − 0.838291
= 6.183948
- Estimación de la segunda regresión auxiliar:
Dependent Variable: WA
Date: 06/13/18 Time: 08:56
Sample: 1 20
C -6.775079 12.18620 -0.555963 0.5855

RA 5.379976 0.762590 7.054870 0.0000
RNA 1.734558 0.793032 2.187248 0.0430

Calculo del factor de inflación de la varianza:

1
=
1 − 0.871449
= 7.7790137
- Estimación de la tercera regresión auxiliar:
Dependent Variable: RNA

Date: 06/13/18 Time: 08:56
Sample: 1 20
C 12.34001 1.442000 8.557566 0.0000

RA -0.227877 0.404563 -0.563266 0.5806
WA 0.126610 0.057886 2.187248 0.0430

Calculo del factor de inflación de la varianza:

1
=
1 − 0.504339
= 2.0175079
Los factores multiplicativos alcanzar valores no tan elevados en los 3

casos, por lo que se considera que la varianza de los coeficientes del
modelo original se encuentran significativamente inflado.
A partir de estas regresiones podemos comparar los 𝑅𝑖 2 con el 𝑅 2de la
regresión original.
 𝑅𝑖(𝑟𝑎)2 = 0.838291
 𝑅𝑖(𝑤𝑎)2 = 0.871449
 𝑅𝑖(𝑟𝑛𝑎)2 =0.504339
Como podemos observar tenemos valores de R2 bajos; siendo el más alto
el de la variable WA aunque siguen siendo bajos.
e) MEDIDA DE THEIL: Esta medida refleja la diferencia entre la variabilidad
explicada ´por el modelo completo y la suma de cada una de las aportaciones de
los regresores del modelo
- Omitiendo la variable RA
Date: 06/09/18 Time: 10:21
Sample: 1 20
C 7.779472 8.613198 0.903204 0.3790

WA 1.089384 0.085923 12.67854 0.0000
RNA 0.406191 0.624492 0.650435 0.5241

La variable RA aporta: 0.9526763 – 0.952671 = 0.000002 valor muy

próximo a cero.
- Omitiendo la variable RNA

Date: 06/09/18 Time: 12:11
Sample: 1 20
C 12.84070 3.793381 3.385028 0.0035

RA -0.061632 1.064259 -0.057911 0.9545
WA 1.136768 0.152276 7.465172 0.0000

La variable RNA aporta: 0.9526763 - 0.951502 = 0.001171 valor también

muy próximo a cero
- Omitiendo la variable WA

Date: 06/09/18 Time: 10:31
Sample: 1 20
C 0.445954 15.74899 0.028316 0.9777

RA 5.868883 0.985544 5.954971 0.0000
RNA 2.290753 1.024885 2.235131 0.0391

La variable WA aporta: 0.9526763 -0.839644 = 0.113029 tambien muy

próximo a cero. Para calcular la medida de theil se ejecuta la siguiente
operación
0.9526763 – (0.000002 + 0.001171 + 0.113029)
= 0.838471
Calculando la medida de Theil se obtiene que este valor si dista mucho del
coeficiente de determinación de la regresión completa entonces se
puede admitir que si existe colinealidad. Aunque no sea mucho pero si
hay porque está por encima del 80%.
2.2. Corrección de la Multicolinealidad:

Como pudimos observar a través de las diferentes pruebas de Multicolinealidad, si bien
esta está presente en el modelo, el grado de la misma no es alta; por lo que no
consideramos necesario que el modelo sea corregido.

Multicolinealidad - Econometria

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Multicolinealidad - Econometria

Uploaded by

Copyright:

Available Formats

UNIVERSIDAD NACIONAL AGRARIA DE LA SELVA

“PLAN DE ESTUDIO DE MERCADO DE CARAMELOS A BASE DE LICORES EXOTICOS DE

 BRAVO FERNANDEZ, YERSON JEAN PAUL

TINGO MARÍA, PERÚ

La Econometría, es la rama de la economía, que utiliza métodos y modelos matemáticos, los

Aun así, la econometría es la única aproximación científica al entendimiento de los fenómenos

El modelo utilizado en esta investigación es el de Regresión lineal, el cual considera ciertos

d) Índice de Klein o Factor De Inflación De La Varianza: Esta medida está basada en

1.4. Corrección de la Multicolinealidad:

Disponemos de 20 observaciones con respecto al consumo interno (CONS), rentas salariales

Obs. CONS RA WA RNA

𝑪𝑶𝑵𝑺 = 𝜷𝟏 + 𝜷𝟐 𝑹𝑨𝒊 + 𝜷𝟑 𝑾𝑨𝒊 + 𝜷𝟒 𝑹𝑵𝑨𝒊 + 𝝁𝒊

Dependent Variable: CONS

Variable Coefficient Std. Error t-Statistic Prob.

C 7.797043 8.898983 0.876172 0.3939

R-squared 0.952673 Mean dependent var 72.29000

2.1. Detección de la Multicolinealidad:

A partir de la matriz de correlaciones de los regresores Rxx puede profundizarse en

Hallando la determinante de la matriz de correlaciones obtenemos que esta es igual

Tenemos a la siguiente matriz:

20.0000 105.9500 1051.680 355.8100

4.472136 10.29320 32.42962 18.86293

Ahora generamos el vector de las diagonales de “m” ingresando el comando

1.000000 0.915961 0.955574 0.992224

c) Contraste de Multicolinealidad de Farrar – Glauber

La determinante de la matriz es: 0.081648714

Como el 𝐺𝑒𝑥𝑝 = 24.4282133 ~ 𝑋 2 6𝑔𝑙 se encuentran dentro de la región de

- Estimación de la primera regresión auxiliar:

Variable Coefficient Std. Error t-Statistic Prob.

C -0.557717 1.968667 -0.283297 0.7804

R-squared 0.838291 Mean dependent var 5.297500

Puede calcularse el factor de inflación de la varianza:

Variable Coefficient Std. Error t-Statistic Prob.

C -6.775079 12.18620 -0.555963 0.5855

R-squared 0.871449 Mean dependent var 52.58400

Calculo del factor de inflación de la varianza:

- Estimación de la tercera regresión auxiliar:

Dependent Variable: RNA

Variable Coefficient Std. Error t-Statistic Prob.

C 12.34001 1.442000 8.557566 0.0000

R-squared 0.504339 Mean dependent var 17.79050

Calculo del factor de inflación de la varianza:

Los factores multiplicativos alcanzar valores no tan elevados en los 3

Variable Coefficient Std. Error t-Statistic Prob.

C 7.779472 8.613198 0.903204 0.3790

R-squared 0.952671 Mean dependent var 72.29000

La variable RA aporta: 0.9526763 – 0.952671 = 0.000002 valor muy

Dependent Variable: CONS

Variable Coefficient Std. Error t-Statistic Prob.

C 12.84070 3.793381 3.385028 0.0035

R-squared 0.951502 Mean dependent var 72.29000

La variable RNA aporta: 0.9526763 - 0.951502 = 0.001171 valor también

Dependent Variable: CONS

Variable Coefficient Std. Error t-Statistic Prob.

C 0.445954 15.74899 0.028316 0.9777

R-squared 0.839644 Mean dependent var 72.29000

La variable WA aporta: 0.9526763 -0.839644 = 0.113029 tambien muy

0.9526763 – (0.000002 + 0.001171 + 0.113029)

2.2. Corrección de la Multicolinealidad:

You might also like