You are on page 1of 11

1.

DESCRIPCION DE LAS VARIABLES:

Tabla 1: Estadísticos Descriptivos.

Fuente: Elaboración propia.

Las nueve variables son aproximadamente simétricas puesto que, el valor de asimetría es

considerablemente cercano a cero.

Se tiene que para las variables G.1, G.2, G.5, G.6, G.7, G.8 y G.9 no se puede calcular el

coeficiente de homogeneidad debido a que el coeficiente de curtosis es menor a uno. Además,

se identifica que los valores del coeficiente de curtosis son menores a 2; por lo tanto, los

datos provienen de dos poblaciones diferentes.

2.ANALISIS DE DATOS ATIPICOS:

Las variables son: G.1=alimentación, G.2= vestido y calzado, G.3= vivienda, G.4=

mobiliario doméstico, G.5= gastos sanitarios, G.6= transporte, G.7= enseñanza y cultura,

G.8= turismo y ocio, G.9= otros gastos.

2.1 Datos atípicos utilizando los gráficos Q-Q:


Las variables G.3 y G.4 son las únicas que presentan puntos considerablemente alejados de

la recta. De tal forma, habría que analizar la distancia de Mahalanobis para confirma la

presencia de datos atípicos.

Gráfico 1: Gráfico Q-Q de la variable G.3.

Fuente: Elaboración propia.

Existe un punto que se encuentra alejado del resto que podría considerarse como un dato

atípico.

La variable presenta una distribución aproximadamente normal puesto que, los puntos se

ajustan a la recta.
Gráfico 2: Gráfico Q-Q de la variable G.4.

Fuente: Elaboración propia.

La variable sigue una distribución aproximadamente normal puesto que, los puntos se ajustan

a la recta; sin embargo, existe un punto que se encuentra alejado del cual podría considerarse

como un dato atípico.

2.2Distancia de Mahalanobis para el análisis de datos atípicos:

Tabla 2: Significancia o probabilidad de la distancia de Mahalanobis.

Probabilidad_Mahalanobis
0.8616678 0.8015616 0.5376592 0.0732138 0.1565874
0.3865257 0.9198067 0.6310897 0.0746277 0.1963115
0.6943505 0.3986237 0.8791797 0.2186077 0.2234749
0.9410613 0.3465322 0.8232666 0.2654353 0.1089443
0.3642245 0.2684955 0.3085904 0.8887546 0.7876349
0.5592794 0.1340781 0.9524467 0.9721705 0.4397243
0.9077821 0.7952819 0.930972 0.2276794 0.9017813
0.7578317 0.9538587 0.753496 0.3327171 0.6942265
0.2183666 0.2008892 0.604115 0.9865446 0.6150128
0.9697821 0.7849986 0.6774319 0.9612013 0.8921156
0.1001907
Fuente: Elaboración propia.
Todas las probabilidades cumplen el supuesto de la significancia mayor a 0.0001; lo que

indica, la ausencia de datos atípicos.

3.COMPONENTES PRINCIPALES:

3.1 Usando la matriz de Covarianzas:

Tabla 3: Matriz de Covarianzas.

Fuente: Elaboración propia.

El valor del determinante es diferente de cero, por lo que se puede aplicar el análisis de

componentes principales.

Tabla 4: KMO y prueba de Bartlett.

Fuente: Elaboración propia.

En la tabla 4 se observa que el valor de la prueba de esfericidad de Bartlett es 0.000 por lo

tanto, el nivel de significancia es menor a 0.05; se confirma que es aplicable el análisis y la

matriz de correlaciones es la matriz identidad; además, se tiene que para la medida de


adecuación muestral KMO el valor es 0.910; está muy cercano a uno, lo cual indica una

excelente adecuación muestral y en consecuencia que el análisis factorial es aplicable.

Tabla 5: Comunalidades.

Fuente: Elaboración propia.

Las variables G.2 y G.9 tienen comunalidades con pesos por debajo de 0.5, de eliminarse del

análisis no se perdería información relevante; sin embargo, para el resto de las variables todas

aportas información a la solución final y de sacar una variable implicaría perder un alto

porcentaje de influencia en el análisis.


Tabla 6: Varianza Total Explicada.

Fuente: Elaboración propia.

La tabla 6 muestra que sólo son relevantes 2 componentes para resumir las variables

originales del problema, debido a que el porcentaje de varianza explicada por los dos

componentes es de 85.125% con una pérdida de un 14.875% de la información.


Gráfico 3: Gráfico de sedimentación.

Fuente: Elaboración propia.

Se confirma en el gráfico de sedimentación, que el número de componentes a tomar es de

dos; como se presentó en la tabla 6 de la varianza total explicada.

Tabla 7: Matriz de componentes.

Matriz de componentes
Bruta Reescalada
Componente Componente
1 2 1 2
G.3 102651.194 -23960.910 .955
G.7 36530.375 1215.298 .909
G.8 53508.267 -8562.665 .883
G.6 49655.726 8995.766 .827
G.4 21422.821 2431.024 .803
G.5 12799.376 983.023 .766
G.9 15572.614 4660.939 .661
G.2 24464.539 10615.557 .645
G.1 41800.478 48558.142 .736
Fuente: Elaboración propia.

El componente 1 está conformado por las variables G.2= vestido y calzado, G.3= vivienda,

G.4= mobiliario doméstico, G.5= gastos sanitarios, G.6= transporte, G.7= enseñanza y
cultura, G.8= turismo y ocio, G.9= otros gastos y el componente 2 por la variable G.1

denominada alimentación.

3.2 Usando la matriz de correlaciones:

Tabla 8: Matriz de correlaciones.

Fuente: Elaboración propia.

Determinante= 0.00040733
El determinante es diferente de cero, por lo tanto, es aplicable el análisis multivariante de
reducción de dimensiones.
Tabla 9: KMO y prueba de Bartlett.
Fuente: Elaboración propia.

Se observa que el valor de la prueba de esfericidad de Bartlett es 0.000 por lo tanto, el nivel

de significancia es menor a 0.05; se confirma que es aplicable el análisis y la matriz de

correlaciones es la matriz identidad; además, se tiene que para la medida de adecuación

muestral KMO el valor es 0.910; está muy cercano a uno, lo cual indica una excelente

adecuación muestral y en consecuencia que el análisis factorial es aplicable.

Tabla 10: Comunalidades.

Fuente: Elaboración propia.

La variable G.1 tiene un peso menor a 0.5, por consiguiente, podría eliminarse del estudio

porque no aporta información relevante. Sin embargo, utilizando la matriz de covarianzas las

variables con pesos menores a 0.5 son G.2 y G.9; las variables consideradas como no

relevantes dependerán de la matriz a utilizarse.


Tabla 11: Varianza total explicada.

Fuente: Elaboración propia.

Existe solo un autovalor mayor a uno que explica un 67.637% de la varianza, produciéndose

la pérdida de un 32.363% de la información. Tomando solo un componente se perdería

demasiada información; el grafico de sedimentación mostrará si se puede tomar en cuenta un

segundo factor que proporcione un 70% de varianza explicada o más.

Gráfico 4: Gráfico de sedimentación.

Fuente: Elaboración propia.


En el gráfico de sedimentación se ve reflejado, que el número de componentes a tomar es 2;

sin embargo, el número de componentes que fueron extraídos en la tabla de varianza

explicada es de 1.Por lo tanto, podria utilizarse 1 o dos componentes; para este caso lo

recomendable seria utilizar dos; puesto que, el porcentaje de varianza explicada con un

componente es de 67.637% que es un valor abajo del 70%.

You might also like