You are on page 1of 4

ESTADISTICA APLICADA A DATA MINING

PRACTICA No 7

Anlisis
Factorial

OBJETIVO: El propsito de este laboratorio es introducir al estudiante en la aplicacin
del ANALISIS FACTORIAL en un caso prctico. El anlisis factorial es encontrar una serie de
factores que expliquen el mximo de varianza comn de las variables originales.



FORMULACION DEL PROBLEMA:

El anlisis factorial es una tcnica que nos permite identificar un nmero relativamente
pequeo de factores el cual es utilizado para representar la relacin existente entre un
conjunto de variables intercorrelacionadas.

El modelo que sustituye esta tcnica es la regresin simple y al del anlisis discriminante,
donde cada variable aparece como combinacin lineal de una serie de factores.

El modelo se lo puede representar como:

B13 = a(sujeto) + b(externos al sujeto) + c(entorno) + UB13

Donde de la formula ya establecida se puede establecer que sujeto, externos al sujeto, y
entorno no son variables independientes si no grupos de variables desconocidas por nosotros
a priori, los cuales pueden ser factores subyacentes y que se han denominado.

SUJETO.- Son factores que engloban las variables referidas inherentes al propio sujeto.
EXTERNAS AL SUJETO.- Son los sujetos que estaran como causantes.
ENTORNO.- Representa los factores que genera el problema.


Lo cual se corrobora con la tcnica del anlisis factorial.

Xi = Ai1F1 + Ai2F2 + + AikFk + Ui

Donde:

F: Son los factores comunes a todas las variables.
U: Es el factor nico referido a la parte de la variable i que no puede ser explicada por los
factores comunes.
Ai : Son los coeficientes de cada uno de los factores.

Los factores nicos se asume que estn incorrelacionados con el resto de factores nicos y
con los factores comunes.








SECUENCIA DE COMANDOS EN SPSS


Ejercicio 1.

1.- Cargar el archivo trabajo.sav

ANALIZAR -> Reduccin de Dimensiones En el cuadro de dilogo

VARIABLES:

Marcamos b13 a b21

Marcamos sucesivamente las cinco opciones:

o Descriptivos: Marcar todo
o Extraccin: Incluir grafico de sedimentacin.
o Rotacin: Seleccionar Varimax y grfico de saturacin.
o Puntuaciones: Incluir Guardar como variables y Mostrar Matriz.
o Opciones: Incluir Ordenados por tamao.

Continuar

Aceptar

3.- Interpretar los resultados.








Anlisis Factorial

La tabla siguiente nos describe: Media, desviacin estndar y el anlisis factorial.
Lo que nos describe esta tabla es que, de los 1009 sujetos que participaron es decir que
tomaron parte de la muestra que han respondido a las nueve preguntas como son:
Crisis, Poltica de empleo, Empresarios, Comodidad, Preparacin, Ganas de trabajar,
Bsqueda, Pluriempleo, Reparto.


Descriptivos y matrices de correlacin.


Descriptive Statistics

Mean Std. Deviation Analysis N
Crisis
3,93 ,882 1009
Poltica de empleo
3,91 ,933 1009
Empresarios
3,53 1,005 1009
Comodidad
3,02 1,133 1009
Preparacin
2,92 1,086 1009
Ganas de trabajar
2,85 1,203 1009
Bsqueda
2,77 1,099 1009
Pluriempleo
3,57 1,005 1009
Reparto
3,87 ,877 1009













j i
ij
j i
ij
j i
ij
a r
r
KMO



+
=
2 2
2



El ndice KMO compara los coeficientes de correlacin de Pearson.
Si la suma de coeficientes de correlacin parcial al cuadrado es muy pequeo, KMO, ser un
ndice muy prximo a la unidad y por tanto el anlisis factorial un procedimiento adecuado.
En cambio valores pequeos en este ndice nos dan ha entender todo lo contrario.

Para Kaiser:

1>=KMO>0,90 son considerados excelentes.
0,90>=KMO>0,80 son considerados buenos.
0,80>=KMO>0,70 son considerados aceptables.
0,70>=KMO>0,60 son considerados mediocres o regulares.
0,60>=KMO>0,50 son considerados malos.
KMO<0,50 son considerados inaceptables o muy malos.



En base al procedimiento ya detallado se establece que el valor 0.712 es aceptable y por
tanto nos permite nos permite continuar con el anlisis factorial.




CONCLUSIN.

El coeficiente de correlacin de Pearson que en la mayora de los casos son
altamente significativos.
El determinante de la matriz de correlacin es de 0.240 que es un valor
relativamente bajo.
El ndice KMO = 0.712 el cual es un valor bastante aceptable.
El resumen del test de Bartlett con X2 = 1434.418 y con un valor de p = 0.000
Se determinan valores muy bajos en la matriz anti imagen.
KMO and Bartlett's Test
,712
1434,418
36
,000
Kaiser-Meyer-Olkin Measure of Sampling
Adequacy.
Approx. Chi-Square
df
Sig.
Bartlett's Test of
Sphericity
MSA (Medida Considerablemente Adecuada) Bastante alto en la diagonal de
correlacin anti-imagen.


Ejercicio en casa.

1.- Cargar el archivo Fig 15.1 15.3a.sav

ANALIZAR -> Reduccin de Dimensiones En el cuadro de dilogo

VARIABLES:

Marcamos: ACIDOURI, COLESTER, CREATINI, GLUCOSA, GOT, GPT, UREA

Marcamos sucesivamente las cinco opciones:

o Descriptivos: Marcar todo
o Extraccin: Incluir grafico de sedimentacin.
o Rotacin: Seleccionar Varimax y grfico de saturacin.
o Puntuaciones: Incluir Guardar como variables y Mostrar Matriz.
o Opciones: Incluir Ordenados por tamao.

Continuar

Aceptar

3.- Interpretar los resultados.

You might also like