You are on page 1of 4

Escuela Nacional de Estadstica e Informtica Curso: Estadstica Aplicada Docente: Willer David Chanduvi Puicon

Anlisis Factorial Introduccin El anlisis de componentes principales y el anlisis factorial tienen en comn que son tcnicas para examinar la interdependencia de variables. Difieren en su objetivo, sus caractersticas y su grado de formalizacin. Mientras que el objetivo del anlisis de componentes principales es explicar la mayor variabilidad total de un conjunto de variables con el menor nmero de componentes posibles, en el anlisis factorial, los factores son seleccionados para explicar las interrelaciones entre variables. En componentes principales se determinan los pesos o ponderaciones que tienen cada una de las variables en cada componente; es decir, las componentes principales se explican en funcin de las variables observables. Sin embargo, en el anlisis factorial las variables originales juegan el papel de variables dependientes que se explican por factores comunes y nicos, que no son observables. Por otra parte el anlisis de componentes principales es una tcnica estadstica de reduccin de datos que puede situarse en el dominio de la estadstica descriptiva, , mientras que el anlisis factorial implica la elaboracin de un modelo que requiere la formulacin de hiptesis estadsticas y la aplicacin de mtodos de inferencia. Existen dos formas fundamentales de anlisis factorial: exploratorio y confirmatorio. El anlisis factorial exploratorio (AFE) se realiza cuando el investigador no tiene hiptesis a priori sobre cules pueden ser los factores que influyan en las variables medidas. Suele realizarse en las etapas iniciales de un proyecto de investigacin. Permite identificar factores que pueden luego contrastarse en un anlisis confirmatorio. El anlisis factorial confirmatorio (AFC) se realiza, por tanto, cuando se tienen una idea clara de qu factores pueden extraerse. En general se le considera como un caso particular de los modelos de ecuaciones estructurales. El anlisis factorial consta de cuatro fases caractersticas: el clculo de una matriz capaz de expresar la variabilidad conjunta de todas las variables, la extraccin del nmero ptimo de factores, la rotacin de la solucin para facilitar su interpretacin y la estimacin de las puntuaciones de los sujetos en las nuevas dimensiones. Matriz de Correlaciones. El primer paso del anlisis consiste en la obtencin de una matriz que contienen las correlaciones entre todos los pares de variables superficiales medidas, llamada matriz de correlaciones observada. Cuando el nmero de variables medidas es muy elevado, que es lo frecuente, se hace necesario tener ndices que permitan saber si hay correlaciones altas en la matriz que permitan extraer factores. Hay varias pruebas utilizables en este sentido: el determinante de la matriz, el test de esfericidad de Bartlett, la prueba de Kaiser Meyer Olkin y la correlacin anti imagen.

Escuela Nacional de Estadstica e Informtica Curso: Estadstica Aplicada Docente: Willer David Chanduvi Puicon

Determinante de la Matriz de Correlaciones. El determinante de la matriz se emplea como ndice del tamao de las correlaciones. Cuando su valor es elevado, las correlaciones dentro de la matriz son bajas. Por el contrario, un determinante bajo indica que hay algunas correlaciones altas en la matriz. La prueba de esfericidad de Bartlett Esta prueba est diseada para contrastar la hiptesis de que los elementos de fuera de la diagonal positiva de la matriz de correlaciones son cero (las diagonales son siempre 1). Una matriz que cumple siempre esta propiedad se llama matriz identidad. Dicho de otra forma, contrasta la hiptesis nula de que la matriz de correlaciones es una matriz identidad, en cuyo caso no existira correlaciones significativas entre las variables y el modelo factorial no sera pertinente. KMO Es una medida de adecuacin muestral, que contrasta si las correlaciones parciales entre las variables son suficientemente pequeas. Permite comparar la magnitud de los coeficientes de correlacin observados con la magnitud de los coeficientes de correlacin parcial. Sus valores se encuentran entre 0 y 1. Valores pequeos indican que el anlisis factorial puede no ser una buena idea, dado que las correlaciones entre los pares de variables no pueden ser explicadas por otras variables. Los menores que 0,5 indican que no debe utilizarse el anlisis factorial con los datos muestrales que se estn analizando. Matriz Anti imagen Muestra la Matriz de covarianzas anti imagen y la matriz de correlaciones anti imagen. La matriz de covarianzas anti imagen contienen los negativos de las covarianzas parciales y la matriz de correlaciones anti imagen contiene los coeficientes de correlacin parcial cambiados de signo. En la diagonal de la matriz de correlaciones anti imagen se encuentran las medidas de adecuacin muestral para cada variable. Si el modelo factorial elegido es adecuado para explicar los datos, los elementos de la diagonal de la matriz de correlaciones anti imagen deben tener un valor prximo a la unidad y el resto de elementos deben ser pequeos.

Extraccin de Factores La extraccin de factores es un aspecto fundamental del anlisis, puesto que es precisamente donde se trata de reducir la informacin contenida en las variables superficiales a un nmero pequeo de variables latentes. a. Componentes principales: Mtodo de Extraccin en que los factores obtenidos son los autovalores de la matriz de correlaciones re escalados.

Escuela Nacional de Estadstica e Informtica Curso: Estadstica Aplicada Docente: Willer David Chanduvi Puicon

b. Mnimos cuadrados no ponderados: Mtodo de extraccin que minimiza la suma de los cuadrados de las diferencias entre las matrices de correlaciones observada y reproducida, ignorando los elementos de la diagonal. c. Mnimos Cuadrados Generalizados: Mtodo de extraccin que minimiza la suma de los cuadrados de las diferencias entre las matrices de correlaciones observada y reproducida. Este mtodo genera un estadstico de bondad de ajuste chi cuadrado que permite contrastar la hiptesis nula de que la matriz residual es una matriz nula. d. Mxima Verosimilitud: Proporciona las estimaciones de los parmetros que con mayor probabilidad han producido la matriz de correlaciones observada, asumiendo que la muestra procede de una distribucin normal multivariada. e. Ejes principales: Mtodo de estimacin iteractivo en el que, como estimacin inicial de la comunalidad, la matriz de correlaciones original se reduce sustituyendo los unos de su diagonal por las estimaciones de la correlacin mltiple al cuadrado entre cada variable y todas las dems. f. Alfa: Mtodo que considera las variables incluidas en el anlisis como una muestra del universo de las variables posibles. g. Imagen: Mtodo en el que se auto descompone la matriz de correlaciones imagen. Se asume que la comunalidad es igual al cuadrado de la correlacin mltiple entre una variable y todas las dems. Comunalidad La comunalidad de una variable es la proporcin de su varianza que puede ser explicada por el modelo factorial obtenido. Estudiando las comunalidades de la extraccin podemos valorar cuales de las variables son peor explicadas por el modelo. Con el mtodo de extraccin de componentes principales se asume que es posible explicar el 100% de la varianza observada y, por ello, todas las comunalidades iniciales son iguales a la unidad.

Rotacin de Factores Las soluciones factoriales no rotadas son muchas veces difciles de interpretar ms all de meras soluciones algebraicas. Esto debido a que los mtodos de extraccin de factores estn orientados a extraer la mxima cantidad de varianza en cada paso, de manera que a los ltimos factores les queda muy poca varianza por explicar. La rotacin consiste en una transformacin de la matriz de cargas factoriales original de forma que los ejes factoriales se aproximen lo mximo posible a las variables en las que tienen alta saturacin (alto peso). A la matriz resultante se le denomina matriz factorial rotada. Los mtodos con que se dispone son:

Escuela Nacional de Estadstica e Informtica Curso: Estadstica Aplicada Docente: Willer David Chanduvi Puicon

Varimax: Es un mtodo de rotacin ortogonal. Minimiza el nmero de variables que tienen saturaciones altas en cada factor. Quartimax: Es un mtodo de rotacin ortogonal. Minimiza el nmero de factores necesarios para explicar cada variable.

Equamax: Es una combinacin del mtodo varimax y el mtodo quartimax. Se minimizan tanto el nmero de variables que saturan alto en un factor como el nmero de factores necesarios para explicar una variable. Oblimin directo. Mtodo para la rotacin oblicua. Ejemplo Este ejemplo muestra como ejecutar el procedimiento Anlisis factorial con las especificaciones tienen establecidas por defecto. Comprobemos si es posible resumir, mediante un nmero reducido de dimensiones o factores, la informacin disponible sobre las caractersticas laborales de un conjunto de datos de banca (archivo Empleados.sav). Para ello: Analizar Reduccin de datos Anlisis factorial Seleccionar las variables educ, catlab, salario, salini, tiempemp, expprev y edad y trasladarla a la vista Variables. Extraccin Mtodo Componentes principales Analizar matriz de correlaciones. Extraer autovalores mayores que 1 Mostrar solucin factorial sin rotar grfico de sedimentacin continuar Rotacin Mtodo varimax Mostrar Solucin factorial rotada Grfico de saturaciones Continuar Aceptar

You might also like