You are on page 1of 11

Capı́tulo 2

ANÁLISIS FACTORIAL

El análisis factorial intenta identificar variables subyacentes o factores que expliquen


la configuración de las correlaciones dentro de un conjunto de variables observadas. El
análisis factorial se suele utilizar en la reducción de los datos para identificar un pe-
queño número de factores que expliquen la mayor parte de la varianza observada de un
número mayor de variables manifiestas. También puede utilizarse para generar hipóte-
sis relacionadas con los mecanismos causales o para inspeccionar las variables para
análisis subsiguientes (por ejemplo, para identificar la colinealidad antes de realizar un
análisis de regresión lineal).

El procedimiento de análisis factorial ofrece un alto grado de flexibilidad:

1. Existen siete métodos de extracción factorial disponibles.

2. Existen cinco métodos de rotación disponibles, entre ellos el oblimin directo y el


promax para rotaciones no ortogonales.

3. Existen tres métodos disponibles para calcular las puntuaciones factoriales; y las
puntuaciones pueden guardarse como variables para análisis adicionales.

Por ejemplo. ¿Qué actitudes subyacentes hacen que las personas respondan a las pre-
guntas de una encuesta polı́tica de la manera en que lo hacen? Examinando las corre-
laciones entre los elementos de la encuesta se deduce que hay una superposición signi-
ficativa entre los diversos subgrupos de elementos (las preguntas sobre los impuestos
tienden a estar correlacionadas entre sı́, las preguntas sobre temas militares también
están correlacionadas entre sı́, y ası́ sucesivamente). Con el análisis factorial, podemos
investigar el número de factores subyacentes y, en muchos casos, podremos identificar
lo que los factores representan conceptualmente. Adicionalmente, se pueden calcular
las puntuaciones factoriales para cada encuestado, que pueden utilizarse en análisis
subsiguientes. Por ejemplo, es posible construir un modelo de regresión logı́stica para
predecir el comportamiento de voto basándose en las puntuaciones factoriales.

19
20 Análisis Factorial

Entre las salidas que proporciona destaca; para cada variable el número de casos
válidos, la media y la desviación tı́pica. Para cada análisis factorial obtendremos la
matriz de correlaciones (incluidos niveles de significación), el determinante, la inversa
de las variables y la matriz de correlaciones reproducida, que incluye anti-imagen. Pro-
porciona además la solución inicial y dentro de esta las comunalidades, los autovalores
y el porcentaje de varianza explicada; la prueba KMO (medida de la adecuación mues-
tral de Kaiser-Meyer-Olkin) y prueba de esfericidad de Bartlett. La Solución sin rotar
con las saturaciones factoriales, las comunalidades y los autovalores. Si elegimos una
rotación, devuelve la solución rotada, que incluye la matriz de configuración rotada y
la matriz de transformación. Para las rotaciones oblicuas las matrices de estructura
y de configuración rotadas; la matriz de coeficientes para el cálculo de las puntuacio-
nes factoriales y la matriz de covarianza entre los factores. Por último proporciona los
gráficos de sedimentación y el gráfico de las saturaciones de los dos o tres primeros
factores.

2.1. Para obtener en análisis factorial


- Elegir en los menús:

Analizar
Reducción de datos
Análisis factorial.

- Seleccionar las variables para el análisis factorial.

Figura 2.1: menú factorial

- Las opciones que proporciona son:

a) Descriptivos.
1) Descriptivos univariados. Incluyen la media, la desviación tı́pica y el
número de casos válidos para cada variable.
2) Solución inicial. Muestra las comunalidades iniciales, los autovalores y
el porcentaje de varianza explicada.

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.


Prácticas de Análisis Multivariante con SPSS 21

3) Matriz de correlaciones. Las opciones disponibles son los coeficientes, los


niveles de significación, el determinante, la matriz inversa, reproducida,
la matriz anti-imagen y la prueba KMO y de esfericidad de Bartlett.

Figura 2.2: descriptivos factorial

b) Extracción.
1) Método. Nos permite especificar el método de extracción factorial. Los
métodos disponibles son: Componentes principales, Mı́nimos cuadrados
no ponderados, Mı́nimos cuadrados generalizados, Máxima verosimili-
tud, factorización de Ejes principales, factorización Alfa y factorización
Imagen.
2) Analizar. Para especificar o una matriz de correlaciones o una matriz
de covarianza.

Figura 2.3: extraer factorial

3) Extraer. Utilizado para retener todos los factores cuyos autovalores ex-
cedan un valor especificado o retener un número especı́fico de factores.
4) Mostrar. Permite solicitar la solución factorial sin rotar y el gráfico de
sedimentación de los autovalores.
5) Número máximo de iteraciones para convergencia. Permite especificar
el número máximo de pasos que el algoritmo puede seguir para estimar
la solución.
c) Rotación.

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.


22 Análisis Factorial

1) Método. Permite seleccionar el método de rotación factorial. Los méto-


dos disponibles son: varimax, equamax, quartimax, oblimin directo y
promax.
2) Mostrar. Para incluir los resultados de la solución rotada, ası́ como los
gráficos de las saturaciones para los dos o tres primeros factores.
3) Número máximo de iteraciones para convergencia. Especifica el número
máximo de pasos que el algoritmo puede seguir para llevar a cabo la
rotación.

Figura 2.4: rotación factorial

d ) Puntuaciones factoriales.

1) Guardar como variables. Crea una nueva variable para cada factor en la
solución final. Los métodos alternativos para calcular las puntuaciones
factoriales son regresión, Bartlett o Anderson-Rubin.
2) Mostrar matriz de coeficientes de las puntuaciones factoriales. Muestra
los coeficientes por los cuales se multiplican las variables para obtener
puntuaciones factoriales. También muestra las correlaciones entre las
puntuaciones factoriales.

Figura 2.5: puntuaciones factoriales

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.


Prácticas de Análisis Multivariante con SPSS 23

e) Opciones.
1) Valores perdidos. Permite especificar el tratamiento que reciben los valo-
res perdidos. Las alternativas disponibles son: Excluir casos según lista,
Excluir casos según pareja y Reemplazar por la media.

Figura 2.6: opciones factorial

2) Formato de visualización de los coeficientes. Permite controlar aspectos


de las matrices de resultados. Los coeficientes se ordenan por tamaño y
se suprimen aquéllos cuyos valores absolutos sean menores que el valor
especificado

2.2. Consideraciones sobre los datos.


Las variables deberı́an ser cuantitativas a nivel de intervalo o de razón. Los datos
categóricos (como la religión o el paı́s de origen) no son adecuados para el análisis
factorial. Los datos para los cuales razonablemente se pueden calcular los coeficientes
de correlación de Pearson, deberı́an ser adecuados para el análisis factorial.

Los datos han de tener una distribución normal bivariante para cada pareja de
variables, y las observaciones deben ser independientes. El modelo de análisis factorial
especifica que las variables vienen determinadas por los factores comunes (los factores
estimados por el modelo) y por factores únicos (los cuales no se superponen entre las
distintas variables observadas); las estimaciones calculadas se basan en el supuesto de
que ningún factor único está correlacionado con los demás, ni con los factores comunes.

2.3. Ejemplo
Los siguientes datos corresponden a la medición que sobre 17 humedales se ha reali-
zado en una determinada época del año. Las variables medidas han sido las siguientes:

1. X1: Conductividad eléctrica.

2. X2: Contenido en bicarbonatos.

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.


24 Análisis Factorial

3. X3: Contenido en cloruros.

4. X4: Contenido en sulfatos.

5. X5: Contenido en calcio.

6. X6: Contenido en magnesio.

7. X7: Contenido en sodio.

8. X8: Contenido en potasio.

9. X9: Contenido en fosfatos.

Obteniéndose los siguientes valores:

Humedal X1 X2 X3 X4 X5 X6 X7 X8 X9
Caja 0,315 1,6694 5 86 55 4 4 2 1,8082
Camuñas 8 3,7282 2388 7638 2123 972 1757 5 0,3228
Capacete 3,41 4,0642 732 881 218 122 379 41 74,588
Cerero 3,94 1,4585 1359 772 251 96 710 14 0,0968
Chica 2,8 4,4862 220 2510 572 20 458 7 0,0968
Dulce 1,56 2,4745 269 495 157 38 162 9 0,3228
FP Salinas 11 1,2206 3038 923 233 226 1488 11 0,0645
FP Vicaria 8,75 2,6384 4325 456 234 229 2371 11 1,1947
Grande 2,6 3,3251 840 2270 609 86 284 7 0,5166
Gualdal. May 6,37 2,5483 2320 1040 1294 192 485 23 0,4843
Hoyos1 1,18 5,1966 13 499 202 20 5 18 6,7807
Lobón 0,57 1,7494 110 42 21 12 60 6 0,5812
Marcela 3,4 2,1189 1121 866 157 115 643 4 0,7426
Ratosa 3,48 1,7207 1484 554 151 151 708 7 0,1291
Redonda 4,62 1,0357 472 2964 752 160 652 34 0,1291
Salada 3,8 0,8685 1023 2274 1946 360 430 23 0,5489
Viso 0,3 1,8567 7 15 39 3 4 2 4,4882

Hay que tener en cuenta que las variables están medidas en unidades distintas, por
lo que en su momento será necesario tipificar.

Vamos a realizar el análisis factorial por el método de componentes principales.


Para ello seleccionaremos los menús:

Analizar
Reducción de Datos
Análisis Factorial

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.


Prácticas de Análisis Multivariante con SPSS 25

E introduciremos todas las variables a analizar. El método de componentes prin-


cipales es el que realiza SPSS por defecto, para cambiarlo, hemos de pulsar el botón
de extracción y cambiar en la opción de método el de componentes principales por el
deseado.

Figura 2.7: análisis factorial

Lo primero será determinar cual será la estructura factorial necesaria, para lo cual
usaremos el método de Kaiser que determina tantos factores como autovalores mayores
que 1. Este es el método que por defecto realiza el programa (se puede cambiar en el
botón de Extracción).

Si aplicamos la regla de Kaiser nos proporcionarı́a una estructura factorial con tres
factores que explican el 81.94 % de la varianza total. Sin embargo observamos que el
cuarto autovalor, que está muy cercano a uno, proporciona un factor que determina
el 10.693 % de la varianza, por lo tanto decidimos incluirlo también en la estructura
factorial. Es decir, finalmente, nos quedarı́amos con una estructura factorial de cuatro
factores que explicarı́an el 92.010 % de la varianza.

Esta decisión la observamos también en el gráfico de sedimentación:


Otras cuestiones adicionales a la hora de tomar decisiones son estadı́sticos descrip-
tivos, las matriz de correlaciones y su inversa y la prueba de Barlett. Pero nosotros nos
vamos a centrar en las comunalidades (que muestran que porcentaje de cada variable

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.


26 Análisis Factorial

Figura 2.8: gráfico de sedimentación

es explicado por la nueva estructura factorial) y en la matriz de componentes de la


nueva estructura del problema (eliminando los valores menores de 0.3)

Las comunalidades son muy altas, lo cual implica que todas las variables están muy
bien representadas en el espacio de los factores (la comunalidad representa el coeficiente
de correlación lineal múltiple de cada variable con los factores). La estructura factorial
no está muy clara en principio, ya que diversos factores comparten variables, ya que, por
ejemplo, la variable potasio está relacionada con los factores segundo, tercero y cuarto,
la variable fosfatos aparece tanto en el segundo factor como en el tercero. Lo mismo
ocurre para las variables sulfatos y calcio respecto a los ejes primero y tercero. Para
observar esto vemos las representaciones de las variables en el plano de los factores
primero y tercero, en donde vemos que las dos últimas variables citadas forman un
ángulo próximo a 45o con cada eje, lo cual no permite asociarlas a ninguno de ellos
(las saturaciones representan en este caso las correlaciones de las variables con cada
eje y por lo tanto el coseno del ángulo que forman con ellos). Al mismo tiempo vemos
como la variable bicarbonato esta cerca del eje del coordenadas, lo cuál indica que no
está relacionada con ninguno de los dos ejes.
Todos estos resultados conducen a algunas complicaciones a la hora de interpretar
los factores, por lo que realizamos una rotación de los ejes con la idea de clarificar la
estructura factorial sin perder poder explicativo. Para rotar los ejes solo hemos de elegir

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.


Prácticas de Análisis Multivariante con SPSS 27

Figura 2.9: gráfico

el botón ROTACIÓN y elegir alguno de los métodos que nos aparecen. En nuestro caso
optaremos por una rotación varimax, que produce la siguiente matriz de componentes
(las comunalidades no varı́an):

Figura 2.10: rotación varimax

La estructura factorial se ha simplificado y queda:

1. Factor 1 : asociado a las variables conductividad eléctrica, cloruros, sodio y en


menor proporción a magnesio. Su poder explicativo es del 44.29 % de la varianza
total (este porcentaje de inercia se refiere a los ejes que se han obtenido en primer
lugar y no tiene por qué coincidir con los porcentajes de inercia una vez rotados,
aunque si coincide el total explicado, SPSS muestra este porcentaje que en la
rotación varimax son de 32.47 %, 29.3 %, 18.14 %, 12.71 %). Teniendo que:
a) La variable conductividad eléctrica, queda explicada, por el total de los
factores en un 93.6 %, mientras que el primer factor lo es solo en un 84.08 %
(89.83 % del total del espacio de los factores)
b) La estructura factorial completa determina a la variable cloruros en un
95.5 %, siendo atribuible a este factor el 94.28 % (98.31 % del total del es-
pacio de los factores)

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.


28 Análisis Factorial

c) Respecto de la variable Sodio su comunalidad es del 0.951, 95.1 % de la


varianza explicada (89.11 % por este factor y 93.7 % en el espacio de los
factores).
d ) La variable magnesio está explicada por la estructura factorial en el 92 %,
tiene menor carga que las anteriores, puesto que vale 0.447, lo que repre-
senta casi el 20 % de su varianza (21.71 % de lo que, de ella, representa la
estructura factorial)

2. Factor 2 : Asociado a las variables sulfatos, calcio y magnesio y con un poder


explicativo del 20.44 % de la inercia.

a) La variable magnesio está mas representada por este factor, su saturación


es de 0.845, lo que representa el 71.40 % de su varianza total y el 77.61 %
de la explicada por todos los factores.
b) La variable sulfatos, que tiene una comunalidad de 0.93, es explicada por
este eje en un 85.93 % (saturación 0.927), lo que es un 92.4 % en el espacio
de los factores.
c) La variable calcio, que es representada en un 91.5 %, tiene una carga factorial
de 0.939 por lo que el 88.17 % de su varianza total viene representada por
este eje (96.36 % de lo explicado por la estructura factorial total)

3. Factor 3 : asociado a potasio y fosfatos y con un porcentaje de inercia explicada


del 17.2 %

a) La variable potasio tiene una comunalidad del 0.922, y este factor aporta el
89.68 %, o sea, un 97.26 % de lo explicado por la estructura factorial
b) En cuanto a la variable fosfatos, está representada en el espacio de los fac-
tores por una comunalidad de 0.864, que atribuible al tercer factor es el
69.55 %, con una saturación de 0.834, es decir, el 80.5 % del espacio de los
factores.

4. Factor 4 : este factor está representado principalmente por la variable bicarbona-


tos, la cuál está representada por la estructura factorial en un 94.2 %, La parte
de la varianza explicada por el factor es 91.39 %, lo que equivale al 97.02 % de lo
determinado por los cuatro factores.

La estructura factorial ha quedado bastante clara y solamente la variable mag-


nesio parece que comparte parte de su varianza con dos factores. El siguiente paso
serı́a interpretar en términos geológicos el significado de los factores, o sea, intentar
resumir el porqué se unen esas variables e incluso intentar dar un nombre a cada factor.

Las gráficas bidimensionales y tridimensionales de las variables en el espacio de


los factores permiten visualizar la estructura factorial comentada (solo mostramos una
bidimensional y una tridimensional).

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.


Prácticas de Análisis Multivariante con SPSS 29

Figura 2.11: componentes 1 y 3

Figura 2.12: componentes 1, 2 y 3

Estos resultados han sido obtenidos mediante el método de componentes principales


y la rotación varimax, siendo interesante abordar otros métodos de extracción y otras
rotaciones.

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.

You might also like