Análisis factorial variables humedales

Capı́tulo 2
ANÁLISIS FACTORIAL
El análisis factorial intenta identificar variables subyacentes o factores que expliquen

la configuración de las correlaciones dentro de un conjunto de variables observadas. El
análisis factorial se suele utilizar en la reducción de los datos para identificar un pe-
queño número de factores que expliquen la mayor parte de la varianza observada de un
número mayor de variables manifiestas. También puede utilizarse para generar hipóte-
sis relacionadas con los mecanismos causales o para inspeccionar las variables para
análisis subsiguientes (por ejemplo, para identificar la colinealidad antes de realizar un
análisis de regresión lineal).
El procedimiento de análisis factorial ofrece un alto grado de flexibilidad:
1. Existen siete métodos de extracción factorial disponibles.
2. Existen cinco métodos de rotación disponibles, entre ellos el oblimin directo y el

promax para rotaciones no ortogonales.
3. Existen tres métodos disponibles para calcular las puntuaciones factoriales; y las
puntuaciones pueden guardarse como variables para análisis adicionales.
Por ejemplo. ¿Qué actitudes subyacentes hacen que las personas respondan a las pre-
guntas de una encuesta polı́tica de la manera en que lo hacen? Examinando las corre-
laciones entre los elementos de la encuesta se deduce que hay una superposición signi-
ficativa entre los diversos subgrupos de elementos (las preguntas sobre los impuestos
tienden a estar correlacionadas entre sı́, las preguntas sobre temas militares también
están correlacionadas entre sı́, y ası́ sucesivamente). Con el análisis factorial, podemos
investigar el número de factores subyacentes y, en muchos casos, podremos identificar
lo que los factores representan conceptualmente. Adicionalmente, se pueden calcular
las puntuaciones factoriales para cada encuestado, que pueden utilizarse en análisis
subsiguientes. Por ejemplo, es posible construir un modelo de regresión logı́stica para
predecir el comportamiento de voto basándose en las puntuaciones factoriales.
19
20 Análisis Factorial
Entre las salidas que proporciona destaca; para cada variable el número de casos
válidos, la media y la desviación tı́pica. Para cada análisis factorial obtendremos la
matriz de correlaciones (incluidos niveles de significación), el determinante, la inversa
de las variables y la matriz de correlaciones reproducida, que incluye anti-imagen. Pro-
porciona además la solución inicial y dentro de esta las comunalidades, los autovalores
y el porcentaje de varianza explicada; la prueba KMO (medida de la adecuación mues-
tral de Kaiser-Meyer-Olkin) y prueba de esfericidad de Bartlett. La Solución sin rotar
con las saturaciones factoriales, las comunalidades y los autovalores. Si elegimos una
rotación, devuelve la solución rotada, que incluye la matriz de configuración rotada y
la matriz de transformación. Para las rotaciones oblicuas las matrices de estructura
y de configuración rotadas; la matriz de coeficientes para el cálculo de las puntuacio-
nes factoriales y la matriz de covarianza entre los factores. Por último proporciona los
gráficos de sedimentación y el gráfico de las saturaciones de los dos o tres primeros
factores.
2.1. Para obtener en análisis factorial

- Elegir en los menús:
Analizar
Reducción de datos
Análisis factorial.
- Seleccionar las variables para el análisis factorial.
Figura 2.1: menú factorial
- Las opciones que proporciona son:
a) Descriptivos.
1) Descriptivos univariados. Incluyen la media, la desviación tı́pica y el
número de casos válidos para cada variable.
2) Solución inicial. Muestra las comunalidades iniciales, los autovalores y
el porcentaje de varianza explicada.
ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.

Prácticas de Análisis Multivariante con SPSS 21
3) Matriz de correlaciones. Las opciones disponibles son los coeficientes, los

niveles de significación, el determinante, la matriz inversa, reproducida,
la matriz anti-imagen y la prueba KMO y de esfericidad de Bartlett.
Figura 2.2: descriptivos factorial
b) Extracción.
1) Método. Nos permite especificar el método de extracción factorial. Los
métodos disponibles son: Componentes principales, Mı́nimos cuadrados
no ponderados, Mı́nimos cuadrados generalizados, Máxima verosimili-
tud, factorización de Ejes principales, factorización Alfa y factorización
Imagen.
2) Analizar. Para especificar o una matriz de correlaciones o una matriz
de covarianza.
Figura 2.3: extraer factorial
3) Extraer. Utilizado para retener todos los factores cuyos autovalores ex-
cedan un valor especificado o retener un número especı́fico de factores.
4) Mostrar. Permite solicitar la solución factorial sin rotar y el gráfico de
sedimentación de los autovalores.
5) Número máximo de iteraciones para convergencia. Permite especificar
el número máximo de pasos que el algoritmo puede seguir para estimar
la solución.
c) Rotación.

1) Método. Permite seleccionar el método de rotación factorial. Los méto-

dos disponibles son: varimax, equamax, quartimax, oblimin directo y
promax.
2) Mostrar. Para incluir los resultados de la solución rotada, ası́ como los
gráficos de las saturaciones para los dos o tres primeros factores.
3) Número máximo de iteraciones para convergencia. Especifica el número
máximo de pasos que el algoritmo puede seguir para llevar a cabo la
rotación.
Figura 2.4: rotación factorial
d ) Puntuaciones factoriales.
1) Guardar como variables. Crea una nueva variable para cada factor en la
solución final. Los métodos alternativos para calcular las puntuaciones
factoriales son regresión, Bartlett o Anderson-Rubin.
2) Mostrar matriz de coeficientes de las puntuaciones factoriales. Muestra
los coeficientes por los cuales se multiplican las variables para obtener
puntuaciones factoriales. También muestra las correlaciones entre las
puntuaciones factoriales.
Figura 2.5: puntuaciones factoriales

e) Opciones.
1) Valores perdidos. Permite especificar el tratamiento que reciben los valo-
res perdidos. Las alternativas disponibles son: Excluir casos según lista,
Excluir casos según pareja y Reemplazar por la media.
Figura 2.6: opciones factorial
2) Formato de visualización de los coeficientes. Permite controlar aspectos

de las matrices de resultados. Los coeficientes se ordenan por tamaño y
se suprimen aquéllos cuyos valores absolutos sean menores que el valor
especificado
2.2. Consideraciones sobre los datos.

Las variables deberı́an ser cuantitativas a nivel de intervalo o de razón. Los datos
categóricos (como la religión o el paı́s de origen) no son adecuados para el análisis
factorial. Los datos para los cuales razonablemente se pueden calcular los coeficientes
de correlación de Pearson, deberı́an ser adecuados para el análisis factorial.
Los datos han de tener una distribución normal bivariante para cada pareja de
variables, y las observaciones deben ser independientes. El modelo de análisis factorial
especifica que las variables vienen determinadas por los factores comunes (los factores
estimados por el modelo) y por factores únicos (los cuales no se superponen entre las
distintas variables observadas); las estimaciones calculadas se basan en el supuesto de
que ningún factor único está correlacionado con los demás, ni con los factores comunes.
2.3. Ejemplo
Los siguientes datos corresponden a la medición que sobre 17 humedales se ha reali-
zado en una determinada época del año. Las variables medidas han sido las siguientes:
1. X1: Conductividad eléctrica.
2. X2: Contenido en bicarbonatos.

3. X3: Contenido en cloruros.
4. X4: Contenido en sulfatos.
5. X5: Contenido en calcio.
6. X6: Contenido en magnesio.
7. X7: Contenido en sodio.
8. X8: Contenido en potasio.
9. X9: Contenido en fosfatos.
Obteniéndose los siguientes valores:
Humedal X1 X2 X3 X4 X5 X6 X7 X8 X9
Caja 0,315 1,6694 5 86 55 4 4 2 1,8082
Camuñas 8 3,7282 2388 7638 2123 972 1757 5 0,3228
Capacete 3,41 4,0642 732 881 218 122 379 41 74,588
Cerero 3,94 1,4585 1359 772 251 96 710 14 0,0968
Chica 2,8 4,4862 220 2510 572 20 458 7 0,0968
Dulce 1,56 2,4745 269 495 157 38 162 9 0,3228
FP Salinas 11 1,2206 3038 923 233 226 1488 11 0,0645
FP Vicaria 8,75 2,6384 4325 456 234 229 2371 11 1,1947
Grande 2,6 3,3251 840 2270 609 86 284 7 0,5166
Gualdal. May 6,37 2,5483 2320 1040 1294 192 485 23 0,4843
Hoyos1 1,18 5,1966 13 499 202 20 5 18 6,7807
Lobón 0,57 1,7494 110 42 21 12 60 6 0,5812
Marcela 3,4 2,1189 1121 866 157 115 643 4 0,7426
Ratosa 3,48 1,7207 1484 554 151 151 708 7 0,1291
Redonda 4,62 1,0357 472 2964 752 160 652 34 0,1291
Salada 3,8 0,8685 1023 2274 1946 360 430 23 0,5489
Viso 0,3 1,8567 7 15 39 3 4 2 4,4882
Hay que tener en cuenta que las variables están medidas en unidades distintas, por
lo que en su momento será necesario tipificar.
Vamos a realizar el análisis factorial por el método de componentes principales.

Para ello seleccionaremos los menús:
Analizar
Reducción de Datos
Análisis Factorial

E introduciremos todas las variables a analizar. El método de componentes prin-

cipales es el que realiza SPSS por defecto, para cambiarlo, hemos de pulsar el botón
de extracción y cambiar en la opción de método el de componentes principales por el
deseado.
Figura 2.7: análisis factorial
Lo primero será determinar cual será la estructura factorial necesaria, para lo cual
usaremos el método de Kaiser que determina tantos factores como autovalores mayores
que 1. Este es el método que por defecto realiza el programa (se puede cambiar en el
botón de Extracción).
Si aplicamos la regla de Kaiser nos proporcionarı́a una estructura factorial con tres
factores que explican el 81.94 % de la varianza total. Sin embargo observamos que el
cuarto autovalor, que está muy cercano a uno, proporciona un factor que determina
el 10.693 % de la varianza, por lo tanto decidimos incluirlo también en la estructura
factorial. Es decir, finalmente, nos quedarı́amos con una estructura factorial de cuatro
factores que explicarı́an el 92.010 % de la varianza.
Esta decisión la observamos también en el gráfico de sedimentación:

Otras cuestiones adicionales a la hora de tomar decisiones son estadı́sticos descrip-
tivos, las matriz de correlaciones y su inversa y la prueba de Barlett. Pero nosotros nos
vamos a centrar en las comunalidades (que muestran que porcentaje de cada variable

Figura 2.8: gráfico de sedimentación
es explicado por la nueva estructura factorial) y en la matriz de componentes de la

nueva estructura del problema (eliminando los valores menores de 0.3)
Las comunalidades son muy altas, lo cual implica que todas las variables están muy
bien representadas en el espacio de los factores (la comunalidad representa el coeficiente
de correlación lineal múltiple de cada variable con los factores). La estructura factorial
no está muy clara en principio, ya que diversos factores comparten variables, ya que, por
ejemplo, la variable potasio está relacionada con los factores segundo, tercero y cuarto,
la variable fosfatos aparece tanto en el segundo factor como en el tercero. Lo mismo
ocurre para las variables sulfatos y calcio respecto a los ejes primero y tercero. Para
observar esto vemos las representaciones de las variables en el plano de los factores
primero y tercero, en donde vemos que las dos últimas variables citadas forman un
ángulo próximo a 45o con cada eje, lo cual no permite asociarlas a ninguno de ellos
(las saturaciones representan en este caso las correlaciones de las variables con cada
eje y por lo tanto el coseno del ángulo que forman con ellos). Al mismo tiempo vemos
como la variable bicarbonato esta cerca del eje del coordenadas, lo cuál indica que no
está relacionada con ninguno de los dos ejes.
Todos estos resultados conducen a algunas complicaciones a la hora de interpretar
los factores, por lo que realizamos una rotación de los ejes con la idea de clarificar la
estructura factorial sin perder poder explicativo. Para rotar los ejes solo hemos de elegir

Figura 2.9: gráfico
el botón ROTACIÓN y elegir alguno de los métodos que nos aparecen. En nuestro caso
optaremos por una rotación varimax, que produce la siguiente matriz de componentes
(las comunalidades no varı́an):
Figura 2.10: rotación varimax
La estructura factorial se ha simplificado y queda:
1. Factor 1 : asociado a las variables conductividad eléctrica, cloruros, sodio y en

menor proporción a magnesio. Su poder explicativo es del 44.29 % de la varianza
total (este porcentaje de inercia se refiere a los ejes que se han obtenido en primer
lugar y no tiene por qué coincidir con los porcentajes de inercia una vez rotados,
aunque si coincide el total explicado, SPSS muestra este porcentaje que en la
rotación varimax son de 32.47 %, 29.3 %, 18.14 %, 12.71 %). Teniendo que:
a) La variable conductividad eléctrica, queda explicada, por el total de los
factores en un 93.6 %, mientras que el primer factor lo es solo en un 84.08 %
(89.83 % del total del espacio de los factores)
b) La estructura factorial completa determina a la variable cloruros en un
95.5 %, siendo atribuible a este factor el 94.28 % (98.31 % del total del es-
pacio de los factores)

c) Respecto de la variable Sodio su comunalidad es del 0.951, 95.1 % de la

varianza explicada (89.11 % por este factor y 93.7 % en el espacio de los
factores).
d ) La variable magnesio está explicada por la estructura factorial en el 92 %,
tiene menor carga que las anteriores, puesto que vale 0.447, lo que repre-
senta casi el 20 % de su varianza (21.71 % de lo que, de ella, representa la
estructura factorial)
2. Factor 2 : Asociado a las variables sulfatos, calcio y magnesio y con un poder

explicativo del 20.44 % de la inercia.
a) La variable magnesio está mas representada por este factor, su saturación

es de 0.845, lo que representa el 71.40 % de su varianza total y el 77.61 %
de la explicada por todos los factores.
b) La variable sulfatos, que tiene una comunalidad de 0.93, es explicada por
este eje en un 85.93 % (saturación 0.927), lo que es un 92.4 % en el espacio
de los factores.
c) La variable calcio, que es representada en un 91.5 %, tiene una carga factorial
de 0.939 por lo que el 88.17 % de su varianza total viene representada por
este eje (96.36 % de lo explicado por la estructura factorial total)
3. Factor 3 : asociado a potasio y fosfatos y con un porcentaje de inercia explicada

del 17.2 %
a) La variable potasio tiene una comunalidad del 0.922, y este factor aporta el
89.68 %, o sea, un 97.26 % de lo explicado por la estructura factorial
b) En cuanto a la variable fosfatos, está representada en el espacio de los fac-
tores por una comunalidad de 0.864, que atribuible al tercer factor es el
69.55 %, con una saturación de 0.834, es decir, el 80.5 % del espacio de los
factores.
4. Factor 4 : este factor está representado principalmente por la variable bicarbona-

tos, la cuál está representada por la estructura factorial en un 94.2 %, La parte
de la varianza explicada por el factor es 91.39 %, lo que equivale al 97.02 % de lo
determinado por los cuatro factores.
La estructura factorial ha quedado bastante clara y solamente la variable mag-

nesio parece que comparte parte de su varianza con dos factores. El siguiente paso
serı́a interpretar en términos geológicos el significado de los factores, o sea, intentar
resumir el porqué se unen esas variables e incluso intentar dar un nombre a cada factor.
Las gráficas bidimensionales y tridimensionales de las variables en el espacio de

los factores permiten visualizar la estructura factorial comentada (solo mostramos una
bidimensional y una tridimensional).

Figura 2.11: componentes 1 y 3
Figura 2.12: componentes 1, 2 y 3
Estos resultados han sido obtenidos mediante el método de componentes principales

y la rotación varimax, siendo interesante abordar otros métodos de extracción y otras
rotaciones.

Análisis factorial variables humedales

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Análisis factorial variables humedales

Uploaded by

Copyright:

Available Formats

Capı́tulo 2

El análisis factorial intenta identificar variables subyacentes o factores que expliquen

El procedimiento de análisis factorial ofrece un alto grado de flexibilidad:

1. Existen siete métodos de extracción factorial disponibles.

2. Existen cinco métodos de rotación disponibles, entre ellos el oblimin directo y el

2.1. Para obtener en análisis factorial

- Seleccionar las variables para el análisis factorial.

Figura 2.1: menú factorial

- Las opciones que proporciona son:

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.

3) Matriz de correlaciones. Las opciones disponibles son los coeficientes, los

Figura 2.2: descriptivos factorial

Figura 2.3: extraer factorial

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.

1) Método. Permite seleccionar el método de rotación factorial. Los méto-

Figura 2.4: rotación factorial

Figura 2.5: puntuaciones factoriales

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.

Figura 2.6: opciones factorial

2) Formato de visualización de los coeficientes. Permite controlar aspectos

2.2. Consideraciones sobre los datos.

1. X1: Conductividad eléctrica.

2. X2: Contenido en bicarbonatos.

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.

3. X3: Contenido en cloruros.

4. X4: Contenido en sulfatos.

5. X5: Contenido en calcio.

6. X6: Contenido en magnesio.

7. X7: Contenido en sodio.

8. X8: Contenido en potasio.

9. X9: Contenido en fosfatos.

Obteniéndose los siguientes valores:

Vamos a realizar el análisis factorial por el método de componentes principales.

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.

E introduciremos todas las variables a analizar. El método de componentes prin-

Figura 2.7: análisis factorial

Esta decisión la observamos también en el gráfico de sedimentación:

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.

Figura 2.8: gráfico de sedimentación

es explicado por la nueva estructura factorial) y en la matriz de componentes de la

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.

Figura 2.9: gráfico

Figura 2.10: rotación varimax

La estructura factorial se ha simplificado y queda:

1. Factor 1 : asociado a las variables conductividad eléctrica, cloruros, sodio y en

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.

c) Respecto de la variable Sodio su comunalidad es del 0.951, 95.1 % de la

2. Factor 2 : Asociado a las variables sulfatos, calcio y magnesio y con un poder

a) La variable magnesio está mas representada por este factor, su saturación

3. Factor 3 : asociado a potasio y fosfatos y con un porcentaje de inercia explicada

4. Factor 4 : este factor está representado principalmente por la variable bicarbona-

La estructura factorial ha quedado bastante clara y solamente la variable mag-

Las gráficas bidimensionales y tridimensionales de las variables en el espacio de

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.

Figura 2.11: componentes 1 y 3

Figura 2.12: componentes 1, 2 y 3

Estos resultados han sido obtenidos mediante el método de componentes principales

ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS. Curso Básico.

You might also like