You are on page 1of 88

ANLISIS FACTORIAL

La denominacin genrica de anlisis factorial agrupa diversos procedimientos


de anlisis multivariable que analizan la relacin mutua (o de interdependencia) en
tre varias variables. Como el anlisis de conglomerados, el anlisis factorial pertene
ce a la clasificacin de tcnicas de anlisis multivariable de interdependencia. o dis
tingue entre variables dependientes e independientes. Su finalidad principal no es el
anlisis de relaciones causales, sino la agrupacin de variables, en funcin de la variabilidad que cada variable comparte con otras variables. Concretamente, dos son sus
objetivos fundamentales:
1. Analizar la correlacin existente en una serie de variables, con el propsito de
descubrir si comparten alguna estructura latente (no directamente observable).
Se busca la sntesis de la informacin proporcionada por p variables
observadas (o indicadores), con la menor prdida posible de informacin, en un
nmero inferior de k variables no observadas (factores comunes o com po
nentes principales, depende de la variedad analtica que se realice). Esta serie
menor de variables latentes ha de caracterizarse por aglutinar variables emp
ricas que estn bastante correlacionadas entre s y escasamente correlacionadas
con aquellas variables empricas que conforman otra estructura latente (o di
mensin del concepto que se analice). La no correlacin entre grupos de va
riables es una propiedad importante. Significa que los indicadores miden di
mensiones diferentes en los datos.
La obtencin de un modelo factorial se fundamenta en dos principios b
sicos comunes a otros procedimientos analticos: parsimonia e interpretabilidad.
De acuerdo con el principio de parsim onia, la solucin factorial ha de ser
sencilla, compuesta por el menor nmero posible de factores o componentes. A

428

Anlisis multivariable. Teora y prctica en ia investigacin social

este principio bsico se suma la necesidad de que los factores extrados sean es
tadsticamente significativos y susceptibles de interpretacin sustantiva.
2. La obtencin de puntuaciones factoriales, variables tpicas o, en su caso, variables
sucedneas, para cada factor. stas actuarn en representacin de los factores
o componentes en anlisis posteriores.
Este segundo objetivo, a diferencia del anterior, slo se cumple cuando el plan
de anlisis de una investigacin no concluye con la obtencin de un modelo fac
torial. Al contrario, la obtencin del modelo factorial constituye un paso previo
a la aplicacin de otras tcnicas analticas multi variables, como ei anlisis de re
gresin mltiple, el anlisis discriminante o el anlisis de varianza, entre otros.
5.1. Orgenes del aislisis factorial y su relacin con oirs tcnicas roulivariables
Los antecedentes inmediatos del anlisis factorial se remontan a una publicacin
de Kar Pearson de 1901 (On lines and planes of closest fit to systems of points in space, PhiL, May, 2: 559-572). En esta publicacin se hace la primera propuesta del pro
cedimiento de anlisis de componentes principales. En 1904 Karl Spearman publi
c un artculo con el ttulo "General inteliigence objectively determined and measured
(en la revista Am erican Journal o f Psychology, 15: 201-293) que trata sobre la covariacin entre variables. Spearman parte de la hiptesis de que las distintas medidas de
inteligencia pueden sintetizarse en un factor general (llamado factor G ), comn a to
das las medidas, y un cierto nmero de factores especficos asociados a unas cuantas
medidas: capacidad de anlisis verbal, capacidad de anlisis matemtico y capacidad
de integracin espacial. Para ello observa las correlaciones entre ias distintas pun
tuaciones de tests de varios tipos. Advierte que muchas de las correlaciones observadas
pueden explicarse mediante un modelo ms simple.
Pero fue en 1933, de la mano de Hotelling, cuando se describen los mtodos de clculo
especficos al anlisis de componentes principales (Analysis of a complex of statistical variables into principal components, Journal o f Educational Psychology, 24:
417-441; 498-520). En 1947 Thurstone (en Mltiple factor analysis , The University of
Chicago Press) incorpora al anlisis factorial el lgebra matricial para el anlisis de las
correlaciones. A partir de entonces se suceden las publicaciones sobre el anlisis
factorial en cualquiera de sus variantes. Al igual que el resto de tcnicas analticas multivariables, su uso se ampla con la llegada de los ordenadores.
En los captulos precedentes se ha hecho mencin de la relacin del anlisis facto
rial con otras tcnicas multivariables. En especial, con el anlisis de regresin mltiple,
el anlisis discriminante y el anlisis de conglomerados. Con las dos ltimas tcnicas ana
lticas comparte un mismo propsito: la agrupacin de objetos (casos o variables). Si bien
se recomienda su uso complementario, con el anlisis de conglomerados en una fase pos
terior, y con el anlisis discriminante, como paso previo a su ejecucin.
El uso complementario del anlisis factorial con el anlisis de conglomerados
cumple una funcin confirmatoria. Su aplicacin se dirige a la corroboracin o con

Captulo 5: Anlisis factorial

429

firmacin de los conglomerados (o agrupaciones de objetos muy similares entre s y dis


tintos de otros grupos) obtenidos mediante el anlisis de conglomerados. Para este pro
psito se emplea preferentemente la variante del anlisis factorial confirmatoria. Es
ta variedad del anlisis factorial se expone en el captulo 6, por su configuracin
similar con el modelado de ecuaciones estructurales.
Respecto al anlisis discriminante, ya se dijo en el captulo anterior que es una tcnica
confirmatoria, no exploratoria. E anlisis discriminante necesita de una configuracin ini
cial de los datos clasificados en grupos. Esta clasificacin inicial puede obtenerse mediante
la realizacin de un anlisis de conglomerados u otra tcnica rnultivariable de interde
pendencia, como e anlisis factorial exploratorio. Adems, en la exposicin del anlisis
discriminante continuamente se han destacado aspectos comunes en la realizacin de am
bos procedimientos analticos, a cuya relectura se remite (captulo 4).
El anlisis factorial tambin puede ser la antesala a anlisis de regresin mltiple,
en ia comprobacin y bsqueda de solucin ante la existencia de una elevada multi
colinealidad (correlacin elevada entre una serie de variables independientes). El an
lisis factorial ayuda a la agrupacin de variables muy correlacionadas entre s en un n
mero menor de factores o componentes no correlacionados. En esta situacin, el
anlisis de regresin se realizar no con las variables independientes originales muy coiineales, sino con las variables 'tpicas, sucedneos de variables o puntuaciones fac
toriales que resultan de la aplicacin de un anlisis factorial exploratorio. Este proceder
se expone en el apartado 5.8, dedicado a las puntuaciones factoriales,
Por ltimo, en el anlisis de correlacin cannica tambin pueden utilizarse factores
o componentes principales en sustitucin de las variables originales. La correlacin ca
nnica es (como se ha mencionado en el captulo anterior) una tcnica rnultivariable
de dependencia que permite comprobar la existencia de interrelacin entre una serie de
variables dependientes y otra serie de variables independientes. Se busca la obtencin
de combinaciones lineales de cada serie de variables (dependientes e independientes)
que maxmicen las correlaciones entre las variables.
Cuando se realiza un anlisis factorial previo a la ejecucin de un anlisis de co
rrelacin cannica, existen dos aproximaciones posibles:
a) Efectuar un anlisis factorial en cada una de las dos series de variables y sustituir

las dos series de variables originales por los factores o componentes. Siguiendo
este procedimiento se gana en simplicidad, al tener menos coeficientes can
nicos que interpretar.
b) Realizar un nico anlisis factorial en la serie total de variables. Esta segunda
opcin permite comprobar cules son los factores o componentes que mejor re
flejan la estructura de los datos en cada una de las seres de variables.
5.2. Lto variedad de modeJos factoriales: ipologas
La denominacin genrica de anlisis factorial rene una variedad de procedi
mientos analticos que tienen un objetivo comn: sintetizar la informacin contenida

430

Anlisis multivariable. Teora y prctica en la investigacin social

.en una serie de variables empricas (u observadas) en un nmero inferior de variables


latentes. El abanico de posibilidades es el siguiente:
A ) Anlisis de componentes principales-anlisis de factor comn

El anlisis de componentes principales, (ACP) se caracteriza por analizar la varianza


total del conjunto de variables observadas. De ellas trata de determinar las dimensiones
bsicas (o componentes) que las definen. En el anlisis de factor comn (AFC) el es
tudio de las interrelaciones entre las variables se restringe, en cambio, a la varianza co
mn. Es decirla la bsqueda de un nmero reducido de factores que expresen lo que
es comn al conjunto de variables observadas.
En el anlisis de factor comn suelen diferenciarse distintos procedimientos de ex
traccin de factores (que se exponen en el subapartado 5.5.1):
-

Anlisis de factor principal o de ejes principales.


Mxima verosimilitud.
Mnimos cuadrados generalizados y no ponderados.
Factorizacin alfa.
Factorizacin imagen.

B) Anlisis factorial expo rato rio-anlisis factorial confirmatorio

La distincin entre anlisis factorial exploratorio y confirmatorio depende de


la finalidad dei anlisis y del conocimiento previo que el investigador tenga de la reali
dad que analice.
Cuando el investigador no parte de una configuracin previa de factores, sino
que, precisamente, realiza un anlisis factorial para obtener un nmero mnimo de fac
tores que sinteticen la informacin aportada por un conjunto amplio de variables, el
anlisis factorial es exploratorio. Si, por el contrario, se parte de un modelo previo so
bre la estructura latente en los datos y lo que se desea es confirmar o negar la es
tructura latente hipotetizada (y no explorar las dimensiones latentes), el anlisis fac
torial es confirmatorio. Su aplicacin se dirige a la confirmacin. De ah le viene el
nombre. Se quiere confirmar los factores hipotetizados en un modelo propuesto a
priori, a partir de una teora, de generalizaciones empricas o de la estructura latente
que el investigador espera encontrar en los datos.
El anlisis factorial confirmatorio es una tcnica de mayor sofisticacin, que sue
le emplearse en fases avanzadas del proceso de investigacin. Generalmente, tras la
aplicacin de otras tcnicas estadsticas que proporcionen el modelo de partida. Eri
cambio, el anlisis factorial exploratorio se aplica en las primeras fases del anlisis, en
el estadio exploratorio, cuando se quiere agrupar variables muy correlacionadas, co
mo un fin en s mismo, o como un paso previo y necesario a la aplicacin de otras tc
nicas analticas ojuiti variables. De su prctica resulta la obtencin de un modelo hi

Captulo 5: Anlisis factorial

431

pottico de la estructura comn latente en los datos analizados. Hasta la fecha sta ha
sido la aplicacin ms frecuente del anlisis factorial: explorar las dimensiones la
tentes en los datos ms que confirmarlas.
La explicacin del anlisis factorial realizada en el presente captulo se limita ex
clusivamente al anlisis factorial exploratorio. El anlisis factorial confirmatorio se expone
en el captulo 6, dedicado al modelado de ecuaciones estructurales. La decisin de pos
tergar la explicacin de esta variedad analtica al captulo siguiente se fundamenta en
la necesidad de conocer, previamente, la tcnica del modelado de ecuacin estructu
ral para comprender el anlisis factorial confirmatorio. Como se ver en el captulo 6,
ambos procedimientos de anlisis tienen elementos comunes, tanto en su formulacin
como en su desarrollo, razn que justifica su exposicin conjunta.

C) Anlisis factorial R-anlisis factorial Q

En 1985 Comrey propone la distincin entre el anlisis factorial tipo i? y el anlisis fac
torial tipo Q. El primero se caracteriza por tener como objetivo principal la identificacin
de un nmero reducido de dimensiones latentes en un conjunto de variables. sta es la
modalidad de anlisis factorial ms usual. En cambio, el anlisis factorial Q se ocupa de
las interrelaciones entre casos, no entre variables. Ha tenido gran aplicacin en psicolo
ga y dems ciencias de ia conducta en la elaboracin de tipologas de sujetos. Se trata de
un procedimiento de clasificacin similar al anlisis de conglomerados. Ambos persiguen un
mismo objetivo bsico: la clasificacin de un conjunto de individuos u objetos (pases, mu
nicipios, partidos polticos, colegios...) en un nmero reducido de grupos mutuamente ex
cluyanles. Los grupos han de estar formados por casos lo ms similares posible entre s y
diferentes de los integrantes de los otros grupos. Pero, como se ver en la lectura com
parada de ambas tcnicas analticas, existen amplias diferencias entre ellas.
En general, e{ anlisis de conglomerados se presenta como un anlisis ms rgidoque no permite que un mismo caso pertenezca a ms de un grupo. Ln el anlisis fae
torial Q, por el contrario, un mismo caso puede tener un peso importante en ms d
un factor. Este es uno de los inconvenientes ms frecuentemente sealado en el an
lisis factorial Q. Dillon y Goldstein (1984: 43) aaden otra limitacin importante: Las
correlaciones tipo Q eliminan diferencias atribuibles tanto a la media como a la dis
persin de los individuos. De manera que, dos individuos que muestren un mismo or
den de puntuaciones de rango y espacio relacionado correlacionarn bastante, sin con
siderar cualquier diferencia en los niveles de la media o dispersin, cuando en realidad
las diferencias de medias y varianzas entre individuos adquieren especial importancia
en cualquier agrupacin de individuos.
A estas dos variedades del anlisis factorial se suman otras, aunque de menor apli
cacin: el anlisis factorial tipo S, T, P y O. Estas variedades difieren en la dimensin
temporal que se considere, en la unidad de anlisis, los ndices de asociacin y en la des
cripcin de los factores en trminos de variables u ocasiones (vase Dillon y Goldstein,
1984; Bisquerra, 1989),

432

Anlisis multivariable. Teora y prctica en la investigacin social

D ) Anlisis factorial mtrica-anlisis factorial no mtrico

La concepcin tradicional del anlisis factorial ha sido mtrica debido a que en su


clculo intervienen estadsticos como la media y la varianza, que exigen que las variables
sean mtricas (de intervalo o de razn). Para variables no mtricas existen otras tcnicas
multivariables de interdependencia que permiten alcanzar objetivos similares al an
lisis factorial y se adecan ms a ese tipo de variables. Sea el caso, por ejemplo, del
anlisis de correspondencias o el escalamiento multidimensional no mtrico.
En los ltimos aos, sin embargo, han ido apareciendo programas, como el PRNCALS, que permiten la obtencin de un modelo factorial no mtrico. Adems, las va
riables cualitativas pueden convertirse en variables ficticias, lo que permite adems apli
car el llamado anlisis factorial booleano. ste difiere del anlisis factorial clsico (o
mtrico) en una serie de aspectos que, siguiendo a Bisquerra (1989: 335-336), se re
sumen en los siguientes:
1. En el anlisis factorial booleano se aplica el clculo del lgebra de Boole. De ah
le viene su denominacin.
2. Las puntuaciones factoriales en el anlisis factorial mtrico suelen resultar de
la combinacin de las variables que presentan saturaciones o coeficientes fac
toriales (factor loadings) elevados en los factores respectivos. En cambio, en
el anlisis factorial booleano cada caso tiene una puntuacin de 1, si tiene
una respuesta positiva (distinta de 0) para cualquiera de las variables domi
nantes en el factor. Cuando las saturaciones de las variables en los factores son
0, la puntuacin individual tambin es 0.
3, En el anlisis factorial booleano una variable puede tener saturacin de 1 en
ms de un factor. En el anlisis factorial mtrico se intenta (siguiendo el poncipio de estructura simple, que lleva a la rotacin de factores) que cada varia
ble sature fundamentalmente en un factor. Lo que fuerza a que su presencia en
los dems factores sea mnima.
4, Respecto a la bondad de ajuste, en el anlisis factorial booleano sta se comprueba
comparando ias respuestas binarias observadas con las estimadas a partir de la
multiplicacin de las saturaciones por el nmero de puntuaciones. Se consideran
tanto las discrepancias positivas (el nmero de veces que la puntuacin observada
es 1) como las negativas (cuando la puntuacin observada es 0, siendo el valor es
timado 1). En el anlisis factorial tradicional (mtrico ) se aplican otros criterios
de bondad de ajuste que se resumen en el apartado 5.7.

5.2.1. El anlisis de componentes principales

El anlisis de componentes principales (ACP) constituye una variedad de anlisis


multivariable de interdependencia cuyo objetivo principal es la bsqueda de combina
ciones de p variables observadas (o indicadores) en un nmero sustancialmente in-

Captulo 5: Anlisis factorial

433

ferior de k variables latentes (o no observadas). Medante estas ltimas se quiere re


ducir la dimensionalidad de la serie de variables Originales, pero conservando la maj
yor parte de la informacin proporcionada por las variables observadas. A las varia
bles no observadas se las denomina componentes.
En principio, pueden extraerse tantos componentes como variables observa
das. De esta forma se lograra explicar toda la variabilidad de las variables origina
les: la suma de las varianzas de todos los componentes sera igual a la suma de las va-:
rianzas de las variables originales. Aunque no se habra alcanzado el objetivo
reduccionista intrnseco a esta tcnica analtica, al haber un componente por cada in
dicador. De lo que.se trata es de explicar la mayor proporcin de varianza total de
las variables observadas con el menor nmero de com ponentes posible. Los prime
ros componentes suelen caracterizarse por extraer la mayor proporcin de varian-':
za de las variables orignales. Los componentes se hallan dispuestos en orden de
creciente. El primero se caracteriza por ser el que ms cantidad de varianza de las
variables originales extracta, mientras el ltimo componente apenas explica varia
bilidad, siendo su tamao considerablemente inferior. El investigador deber, en con
secuencia, decidir con cuntos componentes se quedar para representar la in
formacin incluida en la matriz de datos original.
Asimismo, se precisa que los componentes sean perpendiculares;.: Quiere esto de
cir, que no estn correlacionados entre s. La no correlacin entre los componentes
se convierte en una propiedad importante porque supone que los componentes miden
dimensiones diferentes en los datos. Por el contrario, las variables observadas han
de estar correlacionadas entre s para que puedan sintetizarse en un nmero reducido de
componentes que agrupen a las variables ms correlacionadas (y facilite su utilizacin
en anlisis posteriores). Si la correlacin entre las variables originales fuese nula, el n
mero de componentes coincidira exactamente con el nmero de variables originales,
con lo que no se habra alcanzado el objetivo principal del anlisis.
Cada componente principal se expresa como funcin de las p variables obser-:
vadas correlacionadas entre s, que ponderan en dicho componente, mediante las ecua-,
ciones siguientes:

c f 1= a11x 1+ a12z 2+ ... + ^

<*2=

+V*2 +... +v ,

cpk=

+ \ 2x 2 + . . . + V

Para evitar la influencia indebida que las unidades originales de medicin de las va
riables observadas pueden ejercer en la ponderacin de los componentes, generalmente
se procede a la estandarizacin de las variables originales previo a la extraccin del mo
del de componentes principales. S las variables estuviesen estandarizadas, la letra Z
sustituir a X en las ecuaciones. La letra A representa los pesos o coeficientes de
saturacin de los distintos indicadores en cada componente principal.

434

Anlisis multivariable. Teora y prctica en la investigacin social

El modelo definido por ecuaciones puede representarse de forma grfica. La figura


5.1 incluye la definicin grfica de un modelo de componentes principales formado por
tres componentes y cinco variables originales o indicadores. Estas ltimas (estanda
rizadas Z" o no estandarizadas X ) se representan mediante un cuadrado, mientras
que ios componentes (o variables latentes) figuran en un crculo.

Ei procedimiento seguido en la extraccin de un modelo de componentes princi


pales se trata en ei apartado 5.5, junto al modelo de factor comn. Aunque algunos au
tores, como Diion y Godstein (1984:24), lo consideran un mtodo de identificar las
dimensiones factoriales de los datos y no como un modelo estadstico formal. En su
opinin, e anlisis de componentes principales esencialmente toma los datos e intenta
determinarlas dimensiones que definen su varianza total. En las pginas siguientes
se da al lector oportunidad de valorar dichas afirmaciones.

5.2.2. E l anlisis de factor comn


El anlisis de factor comn (AFC) es otra tcnica analtica multivariable de in
terdependencia igualmente aplicada a la medicin de conceptos tericos. Comparte el
mismo objetivo bsico del ACP: la descripcin de un conjunto de p variables ob
servadas (o indicadores) en trminos de un nmero inferior de factores (o ndices). Es
tos ltimos se obtienen de la agrupacin de los indicadores correlacionados entre s, que
representan una misma dimensin del concepto que se mide. Estos indicadores
corresponden a las variables que presentan un coeficiente factorial ms elevado en di
cho factor. No obstante, existen tres diferencias bsicas que distinguen a AFC de ACP:

1. En ACP se considera la varianza total de la serie de variables observadas. El


propsito es maximizar la proporcin total de la varianza explicada. En cambio,
AFC est ms orientado'al anlisis de la covarianza, no de la varianza. En es
ta ltima modalidad analtica a varianza se descompone en varianza comn (o

Captulo S: Anlisis factorial

435

com unalida ) y varianza especfica. La com unalidad de cada variable (hf) ex- ;
presa la porcin de la varianza total de a variable X que es compartida con las,;
p r-1 variables observadas restantes. La varianza especfica (e) es, por el con
trario, la porcin de la varianza total de la variable que no es explicada por los
. factores comunes.. Si la variable X i se halla estandarizada, como es usual, su va
rianza total es 1: Var X i ~ l = h'f+ e. De lo que se deduce que e = 1 - hf.
En suma, el objetivo fundamental del AFC es maximizar ola varianza total,
sino la comunalidad totai, a partir de un nmero inferior de factores latentes (que
resumen la informacin contenida en un nmero superior de variables observadas).
Son los factores comunes los que contribuyen a la covariacin de los indicadores.
2. La diferencia bsica anterior entre ACP y AFC repercute en el punto de par
tida de ambos anlisis: la m atriz de correlacin. En ACP, la diagonal de la ma
triz est integrada por unos, dado que se trata de explicar la varianza total de las
variables. En AFC, que analiza la covariacin o varianza compartida, en la dj i
gonal de la matriz figuran las comunalidades. Su valor es igual a la correlacin
mltiple cuadrada de cada variable con las dems variables del anlisis, o la co
rrelacin absoluta ms alta en una fila de a matriz de correlacin (vase su
bapartado 5.4.3). El procedimiento seguido en la extraccin de las dimensiones
latentes (factores o componentes) es, no obstante, muy similar en ambas va
riedades analticas de reduccin de datos, como se ver en ei apartado 5.5.
3. En ACP los componentes principales se explican en funcin de las variables ob
servadas, determinndose los pesos o saturaciones de cada variable en cada
componente. En AFC las variables observadas o indicadores son, por el con
trario, las que actan a modo de variables dependientes en la ecuacin lineal.
stas se explican por variables no observadas: factores comunes y nicos. Re
curdese que en AFC se diferencia entre varianza comn y varianza especfica,
a diferencia de ACP, donde no se hace dicha segregacin de la varianza.

Como en ACP, el modelo analtico de AFC se asemeja a una ecuacin de regresin


mltiple. Cada variable observada X se expresa mediante una combinacin lineal de
un nmero pequeo de factores comunes latentes y un factor nico, tambin latente. Es
tos ltimos representan la parte de la varianza de la variable observada que no es ex
plicada por los factores comunes. La eleccin de la letra e para denotar al factor ni
co procede de su consideracin como trmino de erro r. Se asume que son
independientes, lo que quiere decir que no se hallan correlacionados entre s (unos fac
tores nicos con otros nicos ) ni tampoco con los factores comunes. Algebraicamen
te, el modelo de AFC puede representarse mediante las ecuaciones siguientes:

^ =V
^2

i +V

2+ - H A ^ 1

= ^21-^1 + ^2 2 ^ 2 + + ^ 2 K ^ K

+ fi2

Xp = XplFl + Xp2F2 + ... + XpKFK + ep

436

Anlisis multivariable. Teora y prctica en la investigacin social

Para cada variable X, siendo i = (1,2..., p), el modelo se resumen en:


k

Donde k representa el nmero de factores comunes y X las saturaciones o coe


ficientes factoriales (o factor loadings). Estos ltimos cuantifican la relacin de los fac
tores no observables con cada indicador. En el desarrollo del modelo se intenta que es
tos coeficientes sean o muy elevados o muy pequeos, en los distintos factores comunes.
Lo que lleva a la rotacin del modelo factorial (como se ver en el subapartado 5.5.1). La
finalidad es alcanzar un modelo factorial que sea lo ms sencillo e interpretable posible,
en el que cada indicador se relacione con un nmero mnimo de factores. Si las variables
estn estandarizadas, se representaran con la letra Z, como es habitual.
El grfico correspondiente a un modelo de factor comn, compuesto por 3 factores
comunes y 5 indicadores se incluye en a figura 5.2.

Figura 5.2. Representacin de un modelo de factor comn.


Si se comparan los modelos matemticos de AFC y ACP, ilustrados en las figuras
5.1 y 5.2, se ver que ambos difieren. En ACP las variables no observadas se expresan
en funcin de los indicadores. Lo que no equivale a expresar indicadores como funcin
de variables latentes (factor comn y nico), como sucede en AFC.
Pese a sus diferencias, ambos modelos analticos comparten las mismas reas de;
aplicacin. Incluso pueden alcanzarse resultados similares. Esto sucede cuando los va?
lores de comunalidad se aproximan a l o existe un elevado nmero de variables. En ca
so contrario, especialmente cuando las comunalidades son pequeas (prximas a 0), o
varan considerablemente, ios modelos ACP y AFC difieren bastante.

Captulo 5: Anlisis factorial

437

En paquetes estadsticos como, por ejemplo, el SPSS, ambos anlisis figuran bajo
el mismo cabecero de anlisis factorial. Especficamente ACP se incluye en los pro
cedimientos de extraccin factorial. Esto puede llevar a su consideracin errnea co
mo anlisis factorial (comn).
En la decisin de qu modalidad aplicar, ACP o AFC, intervienen aspectos varios,
como .los objetivos de investigacin y/o el conocimiento previo que se tenga de la varanza de ias variables. El modelo ACP muestra mayor adecuacin cuando se est in-;
teresado en predecir y determinar el nmero mnimo de factores necesarios para ex
plicar la mayor proporcin de varianza posible en la serie original de variables;:
observadas. Tambin se adeca a la situacin de conocimiento previo de que la varianza,especfica representa una proporcin pequea de la varianza total de las variables,- Si
no se dispone de este conocimiento, y si se tiene como objetivo principal la identifi
cacin de las dimensiones latentes de las variables, la eleccin apropiada ser efectuar
un AFC.
En la prctica, ambas variedades analticas pueden aplicarse de manera conjunta.
Puede realizarse un ACP como paso previo a un AFC, con el propsito de determinar
la dimensionalidad del espacio factorial comn. Cuando esto sucede, e! anlisis de AFC
parte de los componentes principales derivados del ACP stos se utilizan como los fac
tores originales, factores no rotados (Manly, 1990). Posteriormente se proceder a
la rotacin factorial y a la obtencin del modelo A FC
5.3. La obtencin de un modelo factorial explorativo: fases principales
La consecucin de un modelo factorial exploratorio supone el cumplimiento de una
serie de fases principales. stas pueden resumirse en cinco:
1. La fase previa de preparacin de los datos para el anlisis. Comprende la
comprobacin de los supuestos bsicos para una correcta aplicacin del anli
sis factorial. A ello se suma una serie de decisiones clave. Desde la eleccin de
variables hasta qu matriz emplear: la matriz de covarianzas o la de correla
ciones. Esta decisin est bastante determinada por las caractersticas de as va
riables incluidas en el anlisis. Si el investigador ha decidido proceder a la es
tandarizacin de las variables, con el objetivo de garantizar su equivalencia
inicial previo a la realizacin de los anlisis (el clculo de los pesos o coeficientes
factoriales en las estructuras latentes, sean factores comunes o componen
tes), la matriz elegida ser la matriz de correlaciones. En cambio, si prefiere que
las variables participen en los anlisis en su unidad de medicin original sue
le recomendarse la matriz de covarianzas.
2. La extraccin de los factores o com ponentes iniciales. Esta fase incluye dos de
cisiones clave para la obtencin de los modelos factoriales. Primero, el proce
dimiento a seguir en la extraccin de factores: componentes principales, ejes
principales, mnimos cuadrados no ponderados, mnimos cuadrados generali-

438

Anlisis multivariable. Teora y prctica en la investigacin social

zados, mxima verosimilitud, alfa e imagen. Segundo, los criterios a adoptar so


bre el nmero de factores a retener en el modelo factorial: el criterio de raz la
tente o autovalor, el porcentaje de varianza explicada, de cada, la significati
vidad estadstica y a interpretabilidad.
3. La obtencin de la matriz factorial y su interpretacin. El modelo factorial ad
quiere su forma en la matriz: factorial. sta incluye los pesos o saturaciones de
las variables observadas en cada uno de los factores o componentes no obser
vados (estructura latente). Para facilitar su interpretacin normalmente se
procede a la rotacin de ios ejes factoriales. La rotacin puede ser ortogonal (varimax, quartimax y equimax) u oblicua (oblimin -quartimin, covarimin-, oblimax y promax). Depende de la correlacin permitida entre los factores o lo que
el investigador prevea en funcin de las variables incluidas en el anlisis.
4. La evaluacin del m odelo factorial, desde la vertiente estadstica y la lgica-sus
tantiva. En caso afirmativo se puede dar por concluido el anlisis o proceder, si
se quiere, al clculo de las puntuaciones factoriales. En caso negativo, habra que
volver a las fases previas del anlisis para comprobar a qu se debe su no
adecuacin y adoptar alguna medida al respecto.
5. El clculo de las puntuaciones factoriales (para cada caso). Esta fase, a diferencia
de las precedentes, no es imprescindible para la consecucin de un modelo fac
torial exploratorio. Slo cuando los resultados del anlisis factorial van a ser ob
jeto de anlisis mediante otras tcnicas de anlisis multivariable (regresin ml
tiple, anlisis discriminante, factorial confirmatorio u otro).
La figura 5.3. recoge estas cinco fases esenciales en un anlisis factorial exploratorio
en forma de grfico. En las pginas siguientes se detalla cada uno de los integrantes de
un anlisis factorial.

5.4. Preparacin de los datos para el anlisis


Como en todo procedimiento analtico, la antesala del anlisis factorial exploratorio
es la comprobacin de la pertinencia de optar por esta modalidad analtica para cubrir
los objetivos de investigacin. Se comprueba su adecuacin tanto respecto a los ob
jetivos de estudio como a las caractersticas de los datos que se quiere analizar. Ello lle
va a verificar el cumplimiento de los supuestos bsicos para la correcta realizacin del
anlisis factorial.

5.4.1. L o s supuestos bsicos y decisiones clave

Los supuestos bsicos que garantizan el correcto desarrollo del anlisis factorial ex
ploratorio (tradicional) cabe resumirlos en cuatro:

Captulo S: Anlisis factorial

439

Figura 5.3. Fases esenciales de un anlisis factorial exploratorio.


A ) Tamao muestral elevado

El anlisis factorial, como tcnica de anlisis multivariable, exige que el tamao


muestral sea elevado. Las muestras pequeas estn ms predispuestas a estimaciones
de los coeficientes de correlacin infiables. Pero, cul es el tamao mnimo reco

440

Anlisis multivariable. Teora y prctica en la investigacin social

mendado? Comrey (1973a) propone una escala muestral gua que va desde 50 casos
(que se considera un tamao muestral muy pobre) hasta 1.000 (que representa un
tamao muestral excelente). Entre ambos extremos se sitan los tamaos mustrales
de 100 (pobres), 200 (justo), 300 (bueno) y 500 (muy bueno).;En suma, entre
200 y 300 casos se sita el tamao mnimo recomendado para un desarrollo adecuado
del anlisis factorial. Pero, como sucede en otros procedimientos analticos expuestos,
lo ms preciso es considerar el tamao muestral en relacin con el nmero de varia
bles a analizar, Tabachnck y Fidell (1989) proponen, como regla, que exista al menos
5 casos por variable. ste sera el mnimo. Cuanto ms se supere esta proporcin, me
jor porque ayuda a la obtencin de estimaciones mustrales estables.

B) N orm alidad multivariable

Todas las variables observadas y sus combinaciones lineales han de estar distribuidas
normalmente. Aunque ACP y AFC se emplean con una finalidad eminentemente
descriptiva (sintetizar las relaciones entre un conjunto amplio de variables), lo que no
demanda el cumplimiento obligatorio del supuesto de normalidad , su existencia favo
rece la obtencin de un modelo factorial ms preciso. Mxime cuando se recurre a la in
ferencia estadstica para la determinacin del nmero de factores a retener. El recur
so a procedimientos de extraccin habituales en AFC, como los llamados mxima
verosimilitud (ML) o mnimos cuadrados exige el cumplimiento del supuesto de nor
m alidad multivariable. En ACP, este segundo supuesto no es un requisito bsico para
su ejecucin, aunque la asimetra severa puede distorsionar los resultados.
En el subapartado 1.1.6 se resumen los procedimientos ms seguidos en la detec
cin del supuesto de normalidad, junto a los remedios ms aplicados ante su incum
plimiento. La salida de la normalidad se. relaciona con estimaciones sesgadas de es
tadsticos como la media, la desviacin tpica, la correlacin o la covarianza, por
ejemplo. De ah la exigencia de introducir alguna transformacin en las variables que
se distancian de la normalidad para evitar su incidencia negativa en los resultados del
anlisis. Para no redundar en temas ya tratados, se remite a la relectura del susodicho
subapartado.

C) Linealidad

La normalidad multivariable lleva a un tercer supuesto bsico: la linealidad. Las re


laciones entre pares de variables han de ser lineales. En caso contraro, se estara igual
mente ante un anlisis sesgado.
Asimismo, se asume que las relaciones entre las variables observadas y los factores
latentes, representadas en un sistema de ecuaciones, ha de ser tambin lineal. El cum
plimiento de este supuesto suele realizarse con la ayuda de los grficos referidos en el
subapartado 1.1.4, donde tambin se indican remedios ante la no linealidad. Pero, tn

Captulo 5: Anlisis factorial

441

gase presente que este supuesto, al igual que el anterior, slo se exige para la realizacin
de un anlisis factorial mtrico. En los no mtricos dicho supuesto se relaja.

D ) Correlacin entre las variables

A diferencia de otros anlisis multivariables, como regresin o discriminante, en


los anlisis factoriales la multicolinealidad no es un problema. Al contrario, se demandan
la existencia de correlacin entre las variables. Los anlisis son pertinentes slo cuan
do existe correlacin entre las variables: ai menos > ,30. Si de a inspeccin de ia ma
triz de correlacin R se observa que ninguna o muy pocas correlaciones superan el va
lor 0,30, se debera desconsiderar la aplicacin de un anlisis factorial. Las variables
apenas estn correlacionadas. Por o que, no tiene sentido 3a bsqueda de estructuras
latentes (llmense factores comunes o componentes principales), que agrupan a va
riables observadas (o indicadores), correlacionadas entre s, que expresan una misma
dimensin del concepto que se mida. En cambio, a medida que aumenta la correlacin
entre los indicadores (desde 0,30 hasta 1,0), se incrementa la probabilidad de que su
contenido (varianza) pueda sintetizarse en un nmero bastante inferior de factores o
componentes. Si bien, hay que advertir que Ja existencia de correacin elevada entre
pares de variables, por separado, no siempre garantiza la existencia de factores, como
se ver en el subapartado 5.4.3, dedicado a la matriz de correlacin.
Adems de comprobar estos cuatro supuestos mnimos, antes de proceder a la
ejecucin del anlisis factorial, se debern adoptar algunas decisiones importantes. En
tre ellas la referida al tratamiento de los casos sin respuesta: si incluirlos o eliminarlos
del anlisis. Sobre este particular, se acta siguiendo las pautas resumidas en captu
los precedentes. En especial, el subapartado 1.3.1, donde se ofrece una informacin ms
detallada del tratamiento de los casos sin respuesta.
Otra decisin clave concierne a la estandarizacin de las variables observadas. An
tes de comenzar los anlisis, ha de decidirse si las variables van a analizarse en su uni
dad original de medicin o, por el contrario, va a precederse a su estandarizacin. C o
m o ya se ha mencionado con anterioridad, la estandarizacin es una buena opcin
porque favorece la comparablidad de las variables. En el anlisis factorial, en concreto,
es la opcin ms practicada. Previo a la realizacin del anlisis, se estandarizan las va
riables observadas, dividiendo cada una de ellas por su desviacin tpica estimada. De
esta forma se evita la incidencia desigual de la unidad de medicin de las variables.
Las variables muy heterognas (con elevada varianza) logran mayores pesos en el fac
tor o componente que las homogneas (aquellas con escasa variabilidad). La cuanta de
la varianza depende de la unidad de medida de la variable. S se compara, por ejemplo,
la incidencia de la variable ingresos (medida en pesetas) con la variable edad (medida
en aos), lo normal es que la varianza de la primera variable supere a la segunda, re
percutiendo en el modelo factorial; e incluso la varianza de la misma variable ingresos
ser mayor, si se halla medida en pesetas que cuando est en dlares o en euros.

442

Anlisis multivariable, Teora y prctica en ta investigacin social

Con la estandarizacin de las variables, que quedan transformadas a unidades de


desviacin tpica, se las sita en un plano de igualdad ante los anlisis. De esta forma
se posibilita el tratamiento conjunto y comparativo de la incidencia de variables de dis
tinto grado de heterogeneidad.
La estandarizacin tiene su repercusin inmediata en la matriz input (de entrada)
a elegir para 3a obtencin de un modelo factorial. Si ei investigador decide que las va
riables se analicen en su unidad de medicin original, la matriz ser de covarianzas, La
matriz de correlacin supone que las variables estn estandarizadas.
5.4.2. L a matriz de covarianzas

Cuando las variables observadas se encuentran en mtricas similares, con varianzas


apenas divergentesen cuanta, una decisin apropiada es realizar ACP o AFC a partir
de la matriz de covarianzas. La pertinencia de esta matriz se cuestiona, cuando se ana
lizan variables de varianzas muy diferentes. Su eleccin llevara a un modelo factorial, cu
yos primeros factores o componentes estaran integrados precisamente por aquellas va
riables de mayor varianza, en menoscabo de las variables de menor varianza, lo que
puede desvirtuar la realidad que se analiza. Este hecho ha influido en el menor uso de
la matriz de covarianzas, incluso en modelos analticos como el de factor comn, desa
rrollado en trminos de varianzas-covarianzas. La mayora de los autores (Kim y Mueler, 1978a, 1978b; Di IIon y Goldstein, 1984; Dunteman, 1989) aconsejan la estandarti
zacin y el empleo consiguiente de la matriz de correlacin, tanto en ACP como en AFC.
5.4.3. L a matriz de correlacin

Cuando se procede a la estandarizacin de las variables originales, la matriz de datos


brutos (N x p; de casos x variables) se transforma en una matriz de correlaciones R (p x
p), integrada por las distintas correlaciones entre cada par de variables observadas.
"En ACP, la diagonal principal de Id m unz est integrada por unos, al analizarse to
da la variabilidad de las variables. En AFC tomo nicamente se analiza la varianza co
m n,I slporcin de varianza que cada variable comparte con el resto de variables lis
cornunalidades de cada variable forman la diagonal principal de la matriz de crrelaciones. sta es la primera diferencia importante cntu. ambas modalidades analticas.
En AFC la matriz de correlaciones suele refeurse como matriz de correlacin re
ducida, denotndose por uR" o R *, en vez de A Adopi 1 1 f >rma siguiente, con las
cornunalidades en la diagonal principal.

Captulo 5: A nlisis factorial

443

Las comunalidades ti (para X } siendo i - 1,2, 3..., p) son las correlaciones mlti
ples cuadradas de cada variable con ei resto de las variables en el anlisis. Su valor ab
soluto es el ms elevado en cada fila de la matriz de correlaciones. Los rs son los coe^
ficentes de correlacin producto-momento de Pearson usuales, que se calculan para;?
cada par de indicadores (subapartado 1.3.2). La matriz de correlaciones en ACP sera
igual salvo en la diagonal, donde figura Xen vez de ti;''.
Calculada la matriz de correlacin, se procede, en primer lugar, a su inspeccin vi
sual. La finalidad es comprobar si las variables se hallan relacionadas, y en qu grado.
El investigador espera encontrar correlaciones elevadas entre las variables, dado
que el objetivo principal del anlisis es la agrupacin de variables que comparten una
misma estructura latente. La correlacin mnima propuesta normalmente es 0,30. Si la
mayora de las correlaciones en !a matriz no excede este valor, se debera reconside
rar la pertinencia del anlisis factorial. Con correlaciones pequeas (inferiores en mag
nitud a 0,30) es improbable que las variables compartan suficiente varianza comn pa
ra constituir un factor. Por el contrario, cuando las correlaciones exceden el valor
mnimo de 0,30 (mejor cuanto ms prximas se siten del valor mximo de 1,0) pue
de, a partir de la matriz de correlaciones, preverse que las variables correlacionadas en
tre s pueden componer una misma dimensin latente.
No obstante, hay que enfatizar que se est en el plano de la conjetura, no en la ple
na certeza. Correlaciones bivariables elevadas no siempre garantizan la existencia de
factores. Es posible que las correlaciones sean entre slo dos variables y que no re
flejen procesos latentes que estn simultneamente afectando varias variables (Tabachnick y Fidell, 1989: 604). De ah la recomendacin de examinar matrices de
correlaciones parciales.
En las matrices de correlaciones parciales, las correlaciones se ajustan a pares para ios
efectos de las dems variables. Si las variables comparten factores comunes, los coeficientes
de correlacin pardal entre pares de variables deberan ser pequeos (prximos a 0,0), al
haberse eliminado los efectos lineales de las dems variables o, lo que es igual, al haberse
controlado la varianza comn. Estos coeficientes de correlacin parcial se toman como in
dicadores de la fuerza de la relacin entre las variables. Pero, a diferencia de los coefi
cientes de correlacin no parciales, ahora interesan coeficientes muy bajos.porque denotan
la presencia de factores. Se consideran estimaciones de correlacin entre factores nicos
y, como es de esperar, la varianza nica se desea que sea escasa para que pueda procederse
a la agrupacin de variables (correlacionadas) de una misma direccin latente.
Para comprobar el grado de intercorrelacin entre las variables y la presencia de
una estructura comn latente, existen unos estadsticos que se suman a los coefi
cientes de correlacin. Los de uso ms comn son:

A ) El determinante de la m atriz de correlacin

Un valor del determinante de la matriz de correlacin prximo a 0,0 expresa la


existencia de intercorrelaciones muye levadas entre las variables. n esta situacin, el

444

Anlisis multivariable. Teora y prctica en la investigacin social.

anlisis factorial es pertinente, al poderse obtener combinaciones lineales de variables


correlacionadas.

B) La prueba de la esfericidad de Barleir

En 1950 Barlet propone una prueba que ayuda a determinar si existe relacin sig
nificativa entre las variables analizadas. Esta prueba es de utilidad en el anlisis factorial,
al igual que en el anlisis de la varianza. MsdUwte ella se comprueba la correspondencia
de la matriz de correlacin con la matriz identidad. Recurdese que por matriz denu
dad se entiende aquella matriz cuya diagonal principal (que expresa la correlacin de
cada variable consigo misma) est formada por unos, mientras el resto de los trminos ^
de la matriz son ceros. El determinante de esta matriz es igual a 1 (|R = 1. Advirtase
que el determinante de la matriz de correlacin se representa entre dos barras).
0
0 1
Matriz identidad ~ I = R = 0 0

0'
0
0

0 0

En la prueba de esfericidad de Barlet la hiptesis nula (aquella que se espera re


chazar) se formula en los trminos siguientes: / / 0: ji?j 1; R - /. Significa que la matriz
de correlacin se corresponde con la matriz identidad. Las variables no estn crrela}donadas. El grfico que corresponde a esta situacin es el de una nube de puntos cuya
forma se ajusta a una esfera. La hiptesis alternativa es la opuesta: H } : ji?| & 1; R & I. Su
aceptacin supone que la matriz de correlacin difiere de la matriz identidad. Existe coiTeacin (de mayor o menor grado) entre las variables. El determinante de la matriz di
fiere de 1. Todo lo cual indica que puede realizarse un anlisis factorial.
En la prueba de esfericidad de Barlett se utiliza el determinante de la matriz de co
rrelacin de la muestra observada como estimador del determinante de la matriz de
correlacin de la poblacin a la que pertenece la muestra analizada. Su aplicacin exige el
cumplimiento del supuesto de normalidad multivariable ya referido en el subapartado 5.4.1.
Para ei contraste de hiptesis se recurre a la distribucin chi-cuadrado, con xf2
(p2 ~ p ) grados de libertad, siendo p" el numero de variables en la matriz de corre
lacin.
N -

Donde:

6(2p + 5)

Ini?

es el logaritmo neperiano dei determinante de la matriz de correlacin.


N el nmero de individuos en a muestra.

Captulo 5: Anlisis factorial

445

Como en todo contraste de hiptesis, la obtencin de un v a lo r elevado, superior


a su correspondiente valor terico (definido por los grados de libertad y el nivel de sig
nificacin elegido), supone el rechazo de la hiptesis nula. La matriz de correlacin no
se corresponde con la matriz identidad. El anlisis factorial es pertinente. En caso con
traro, habra que optar por otra tcnica de anlisis.

C) ndice KM.O (Kaiser-M eyer-Olkin)

Kaiser propone en 1970 (en A second-generation little jiffy, Psychometrika, 35:


401 415) un ndice que compara las correlaciones observadas con sus correspondien
tes correlaciones parciales. La finalidad es determinar la propiedad de hacer un an
lisis factorial. El ndice, cuyas siglas recoge la primera letra del nombre de sus pro
motores (KMO: Kaiser, Meyer y Olkin) se define en su aplicacin a variables mltiples
mediante la siguiente ecuacin:
N

X I> !
K M O = - 7r^ L = ! _ _
i=l

M M

Donde: V;." es el coeficiente de correlacin simple entre las variables i y j.


sj es el coeficiente de correlacin parcial entre las variables i y j.
De los sumatorios se excluyen los coeficientes de correlacin (simple o parcial) de
una variable consigo misma.
El rango de valores va de 0,0 a 1,0. Interesan valores elevados (prximos a 1,0) porque indican la existencia de inercorrelacin entre las variables. La suma de los coeficientes
de correlacin es relativamente grande comparada con la suma de los coeficientes de co
rrelacin parcial. El anlisis factorial es posible. Valores de KMO inferiores a 0,50 su
ponen, por el contrario, la no adecuacin del anlisis factorial, al haber poca correla
cin entre las variables. Se obtendra un modelo factorial con tantos factores o
componentes como nmero de variables observadas. Con lo que no se alcanzara el ob
jetivo fundamental del anlisis factorial: la sntesis de una serie de variables empricas
en un nmero inferior de factores o componentes.
Para mayor exactitud, Kaiser propone en 1974 (en An index of factorial simpicity, Psychometrika, 39: 31-36) la siguiente interpretacin de valores KMO: 0,90, ma
ravillosos o muy bueno; 0,80, meritorio; 0,70, medio o normal; 0,60, mediocre; 050, des
preciable o bajo; y un valor < 0,50, totalmente inaceptable.
La mayora de los programas estadsticos ofrecen el ndice KMO global (para el
conjunto de variables), calculado mediante la frmula anterior. Pero tambin se
ofrece el valor KMO para variables individuales. Este segundo ndice KMO individual
se calcula mediante la siguiente ecuacin:

446

Anlisis rnultivariable. Teora y prctica en la investigacin social

KM O

Es la suma de los cuadrados de ios coeficientes de correlacin entre ana variable


concreta y todas las dems dividido por la suma de este valor y el sumatorio de los coe
ficientes de correlacin parcial cuadrado, Pero, a diferencia del ndice KMO global, en
el individual no se considera la correlacin de la variable consigo misma. De ah el tr
mino
En el programa SPSS los valores KMO individuales se obtienen de la ma~,
triz de correlacin anti-imagen. Figuran en Ja diagonal principal de la matriz. Toda va
riable que presente un valor KMO inferior a 0,50 debera considerarse candidato a ser;
eliminado del anlisis factorial. La eliminacin de una variable supone un nuevo
clculo del ndice KMO, debido a que ste se ve afectado por la eliminacin de a va
riable. Los valores KMO individuales, para las variables no eliminadas, cambian al igual
que el ndice KMO global, cuando se elimina una variable del anlisis. Vanse los da
tos del ejemplo siguiente.

D) M edida de adecuacin de la muestra (MSA)

Esta medida de adecuacin muestral (MSA:. Measure of Sampling Adequancy)


se calcula para cada variable individual, de forma similar al ndice KMO individual. Se com
para, para cada variable por separado, un coeficiente de correlacin simple con el co
rrespondiente coeficiente de correlacin parcial Para cada variable la fmiula es a si
guiente:

MSA =

l#j\
*9+1,4
it-j

Como en el ndice KMO, en M SA se excluyen de los sumatorios los casos en que


i = j. Asimismo, interesan valores prximos a 1,0. Indican que la variable es adecuada
para su inclusin en un anlisis factorial. En cambio, valores prximos a 0,0 aconsejan
la desestimacin de la variable para el anlisis.

E) Correlacin and-imagen (AIC)

Es el negativo del coeficiente ,de correlacin parcial; De modo que interesan valores?
AIC bajos para que pueda realizarse un anlisis factorial; Recurdese que las corre
laciones parciales miden la correlacin entre dos variables cuando se ha eliminado la

Captulo 5: Anlisis factorial

447

influencia deJ resto de las variabies. Sus valores son altos (prximos a 1,0), cuando las
variables comparten variabilidad.
En la matriz de correlacin anti-imagen se observan las distintas correlaciones entre
las variables (fuera de la diagonal principal). Cuando estas correlaciones se aproximan a
0,0, se deduce que puede aplicarse un anlisis .factorial. La existencia de una elevada pro
porcin de coeficientes elevados (prximos a 1,0) desaconsejan su aplicacin.

F) E l coeficiente de correlacin mltiple cuadrado (Rj)

Una ltima medida del grado de relacin entre las variables lo proporciona el coe
ficiente de correlacin mltiple cuadrado (.&?). Las correlaciones mltiples cuadradas
han de ser elevadas, de lo contrario, se planteara la desestimacin del anlisis de las
variables con bajos coeficientes de correlacin mltiple cuadrado. Antes de proceder
a la desestimacin de estas variables se aconseja comprobar sus correspondientes va
lores de comunalidad y coeficientes factoriales. Es decir, no quedarse nicamente por
lo dicho por esta medida de correlacin.
Los valores de los coeficientes de correlacin mltiple cuadrado coinciden con las
comunalidades inicales de cada variable, salvo cuando las dimensiones latentes se.;.1
extraen mediante componentes principales.
ACP las comunalidades iniciales son 1,0,
al no diferenciarse a priori entre varianza comn y especfica (o nica). A ello se suma
que en la estimacin de las comunalidades iniciales se consideran todos los compo
nentes posibles. stos igualan al nmero de variables empricas. En la estimacin de
\m -m m u w lidade$ posteriores ya no sucede as. ste es un aspecto clave que distingue
al ACP de AFC. En AFC las estimaciones iniciales de comunalidad s reflejan varianza
comn-, la proporcin de la varianza total de X que es explicada por la regresin en las
p 1 variables restantes. Dicho con otras palabras, con correlaciones mltiples
cuadradas de cada variable observada Xt, que acta a modo de variable dependiente,
siendo las p - 1 variables restantes las independientes.
Diversos programas estadsticos, como SPSS, muestran estos coeficientes de co
rrelacin mltiple cuadrado para cada variable en una columna de la tabla de com u
nalidad o incluida en la tabla de estadsticos iniciales. La com unalidad se comentan,
adems^ el apartado 5.6.

E j e m p l o d e c o m p r o b a c i n d l a p e r t in e n c ia d e l a n l is is f a c t o r ia l

Las mismas 14 variables utilizadas en el anlisis de conglomerados jerrquico de vin


culacin simple (captulo 3) vuelven a analizarse mediante distintos procedimientos factoriales,
en busca de su validacin. Si bien, se parte de que puede haber discrepancias entre los dis
tintos modelos, principalmente, debido a que el anlisis de conglomerados realizado es "je-

448

Anlisis multivariable. Teora y prctica en la investigacin social

rrquico, o que lleva a la agrupacin de las variables por etapas, en funcin de la correlacin
existente entre ellas. En e! anlisis factorial, por ef contraro, las relaciones entre todas las va
riables se analizan simultneamente. No obstante, a lo largo del presente captulo podr com
probarse la similitud de la agrupacin de las variables obtenida en los distintos procedimientos
analticos, pudindose reafirmar el modelo de agrupacin de las variables que resulta del an
lisis de conglomerados. Para su constatacin, se recomienda comparar los resultados de los
distintos anlisis: conglomerados (captulo 3) y factorial.
Como las variables analizadas son las mismas que se han ido observando mediante dis
tintos procedimientos analticos, no se va a repetir informacin ya proporcionada en ios ca
ptulos precedentes (es el caso, por ejemplo, de a matriz de correlaciones, ya expuesta en
ei captulo 1). Los datos que van a comentarse en el presente captulo se limitan a lo espe
cfico del anlisis factorial, como io correspondiente a la comprobacin del grado de ntercorrelacin entre las variables y la presencia de una estructura latente comn que permita la
obtencin de un modelo factorial.
En el subapartado 1.3.2 figura ia matriz de correlaciones de fas 14 variables de inters,
a las que se aade una variable ahora excluida para que ios resultados puedan compararse
con los obtenidos en el anlisis de conglomerados. Se trata de la variable Xs (simpata ha
ca latinoamericano"), que fue eliminada para evitar problemas de colinealidad en la aplica
cin posterior del anlisis discriminante.
En la matriz de correlaciones puede comprobarse que, aunque las correlaciones no son
en general muy elevadas -la ms alta se da entre las variables X13 (vecino marroqu") y
(casar con marroqu"): r = ,573; seguida de a correlacin entre Xts (simpata marroqu) y
X)0 (casar con marroqu"): r = ,476-, son muchas las que superan el referente mnimo de
,30, que ndica la posibilidad de encontrar una estructura latente en los datos, que permita
ia sntesis de las 14 variables observadas en un nmero inferior de variables latentes (ll
mense factores comunes o componentes). Aunque, hay que advertir que la existencia de
correlaciones elevadas entre pares de variables (como se registra en la matriz de correla
ciones) no siempre garantiza la existencia de dimensiones latentes en ios datos. Para
constatarlo hay que proceder a la realizacin del anlisis factorial, que exige que previamente
se haya comprobado la existencia de interrelaciones mnimas entre las variables que permita
su realizacin. A tai fin, se calcula:

f
A) El determinante de la matriz de correlaciones

El valor obtenido es ,07667, un valor prximo a 0,0, que indica la existencia de intercorrelaciones muy elevadas entre las variables. Como el valor en realidad obtenido no es
exactamente 0, puede afirmarse que s existen s'ntercorrelaciones, aunque no demasiado ele
vadas entre las variables. Ello permite la realizacin del anlisis factorial. Existe suficiente va
rianza comn de las variables que ayude a su agrupacin u obtencin de combinaciones li
neales de variables correlacionadas.
B) La prueba de la esfericidad de Bartlett

Mediante ella se comprueba la W0 de que la matriz de correlaciones es una matriz


identidad (en tal caso, las variables no estaran correlacionadas) frente a Sa H, que niega la

existencia de dicha correspondencia (lo que favorece la realizacin de un anlisis factorial).

Capitulo 5: Anlisis factora!

449

La correcta realizacin de esta prueba exige e cumplimiento del supuesto de normalidad muliivarble.

El valor y? aproximado obtenido es 3.270,734, con 91 grados de libertad. Recurdese que


los grados de libertad son iguales a 1/2 (p2 - p) = 1/2 (142 - 14) = 91. Al ser ei nivel de sig
nificacin asociado pequeo (el valor
emprico supera bastante al correspondiente valor
terico), se rechaza la H0 incluso a un nivel de significacin de ,001. La matriz de correlacin
no coincide con la matriz identidad. El anlisis factorial es posible al haber correlacin suficente entre ias variables.
C) El ndice KMO (Kaiser-Meyer-OIkin)

Este ndice global compara las magnitudes de los coeficientes de correacin observa
dos con los coeficientes de correlacin parcial. Al ser el valor obtenido s821 (valor que Kai
ser calificara de meritorio), significa que puede realizarse un anlisis factorial porque las
correlaciones entre pares de variables pueden explicarse por otras variables.
Respecto a ios valores KMO individuales, stos figuran en la diagonal principal de la ma
triz de correlacin anti-imagen respectiva (tabla A).
Como todas las variables presentan un valor KMO superior a ,50 (el vaior KMO ms ba
jo es ,545, que corresponde a la variable sexo", y el ms alto es ,895, en la variabe inmi
grante delincuente), no es necesario eliminar ninguna variable antes de realizar el anlisis
factorial. Todas ias variables muestran ser idneas para participar en el anlisis.
Adems, en la matriz de correlacin anti-imagen obsrvese que los coeficientes obtenidos
son, en su mayora, valores prximos a 0,0. Lo que nuevamente indica la adecuacin de los
datos para la realizacin de! anlisis factorial. Recurdese que la correlacin anti-imagen (AIC)
se define como el negativo del coeficiente de correlacin parcial (que mide la correlacin en
tre dos variables, una vez eliminada la influencia del resto de las variables). Cuanto ms ba
jo sea su valor, ms varianza comparten las variables.
D) Coeficientes de correlacin mltiple cuadrados

Los coeficientes de correlacin mltiple cuadrados se obtienen para el anlisis de factor


comn, ai diferenciarse entre varianza comn y especfica. En la salida SPSS (versin
10.0) figuran en la tabla de comunalidades, en (a columna correspondiente a las comunalidades iniciales. La tabla B corresponde al mtodo de factorizacin de ejes principales. De ella s
lo interesa ahora las comunalidades iniciales, que son independientes del mtodo de ex
traccin de factores comunes utilizado.
Las comunalidades iniciales se corresponde con valores Ftf (coeficientes de correlacin
mltiple cuadrados) que se obtienen de regresionar las dems variables respecto de la que
se calcula su comunalidad inicial. Es como si se realizase un anlisis de regresin tomando,
a variable en cuestin como a dependiente y el resto como ias independientes. En ACP la
comunalidad inicial no es de Inters, al ser siempre 1,0, debido a que no se diferencia entre
varianza comn" y "especfica, como se hace en AFC.
En AFC, la comunalidad inicial dice la proporcin de varianza de la variable que es ex
plicada por las dems variables que participan del anlisis. Interesan valores elevados, pr
ximos a 1,0, porque indican que la variable es adecuada para incluirse en el anlisis factorial.
Por el contrario, valores prximos a 0,0 pueden ievar a considerar su eliminacin del anli-

450

Anlisis multivariable. Teora y prctica en la investigacin social

Tabla A. Matriz de correlacin anti-imagen


X1S
X,s
,x 2
X3
X*
X6
X7
xs
X9
*10

*1

X3

*6

X?

X8

X3

x ,0

,873a -,107 -,008 ,052 -,009


,119 -,069 ,054 ,044 ,69
,017
,159 -,076 ,194 -,037
,873a ,107 ,033 -.000
,793a ,048 -,093. -.053
,012 -,021 -.113 -.032
,075
,027 -,031 -.018
;545a ,017
,038
,750a ,031 -,041
,000 ,000 - 0 7 7
,878a ,098 -,043 -.047 -.025
,885a ,226 ,047 ,045
,864a ~,1.2S -.058
,884a -.041
,776a

X11
X,a

,029
-,031
-,032 -,057
-.012 -.104
-,089 -,086
,336 ,116
,093 ,110
-,063 -,013
-,010
,057
,045 ,007
-,009 -,066
,719a -,361
,708a

X 13

XK

Xf3

X ,4

,125 ,056
,038 ,092
-,002 -,.050
-.030 -0 6 3
-,023 -0 9 6
,002 -,1S1
,055 ,078
-,042 -,118
-,118 -0 3 3
-.436 -,082
-,016
,052
,005 -,012
,790a ,006
,895a

* Medida de adecuacin muestral

X,'simpata hacia norteafricano (marroqu...)' (P201); X,: "leyes inmigracin" (P16); X2: "ideologa poltica (P39); X3-, "se
xo" <P41); X4: "edad" (P42);
nmero de inmigrantes (P11); X,,: regularizar a inmigrantes" (P19); Xa: entrada inmigrantes"
(P21); X0: partido racista" (P37); X,0: casar con marroqu" (P306); X1(: ''estudios (P43a); X l2: ingresos" (P52); X,3: ve
cino marroqu-" (PSOS); Xl4: "inmigrante delincuente" (P2904).

sis porque no comparte suficiente varianza con otras variabies que permita su agrupacin en
una misma dimensin latente.
Tabla B. Comunalidades

simpata marroqu
leyes inmigracin
ideologa poltica
sexo
edad
n. inmigrantes
regularizar inmigrante
entrada inmigrante
partido racista
casar con marroqu
estudios
ingresos
vecino marroqu
inmigrante delincuente

Inicial

Extraccin

,316
,251
8,422E-02
3,300E-02
,234
.246
,232
,286
,140
,429
,351
,264
,368
,221
----1-------------

,380
,332
,335
3.429E-02
,335
,304
,312
,393
,155
,687
,611
,400
,483
,270

Mtodo de extraccin: Factorizacin de ejes principales.

En la tabla B puede observarse que hay tres variables (sexo, Ideologa poltica y par
tido racista), en especial las dos primeras, cuya variabilidad apenas se ve afectada por I res
to de variables incluidas en el anlisis (el 3%, el 8% y el 14% de su varianza, respectivamente,
es explicada por las otras variables). Puede considerarse su eliminacin, aunque antes con

Captulo S: Anlisis factorial

451

viene comprobar la solucin factorial que resulta de su inclusin en el anlisis. En cambio, fas
variables casar con marroqu (2 = ,429), vecino marroqu" (FP- = ,368) y estudios (Ff =
,351) son las tres variables cuya variabilidad puede prevenirse ms por el conjunto de las va
riables consideradas.
En general, las cornunalidades iniciales son bajas. Ninguna variable llega a sobrepasar, e
incluso obtener, la mitad de su varianza determinada por e! resto de variables. Adems, se ad
vierte que, como las cornunalidades iniciales se distancian del valor idea! de 1,0, se prev que
la solucin de factor comn (en este caso de factorizacin de ejes principales) diferir de a al
canzada mediante ACP. Las cornunalidades de extraccin se explican en el apartado 5.6.

5.5. La extraccin de factores comunes o componentes principales


Una vez comprobado que el anlisis factorial puede llevarse a efecto con las va
riables de inters y que se cumplen los supuestos necesarios para su correcta realiza
cin, la segunda fase del proceso de anlisis corresponde a la extraccin de factores o
componentes, depende de la modalidad de anlisis factorial que se elija. Esta fase in
cluye tambin decisiones clave. En este caso referidas al mtodo de extraccin de fac
tores a seguir, adems de los criterios a seguir en la determinacin del nmero de factores
que compondrn el modelo factorial. Ambos aspectos son relevantes en la resolucin
del anlisis y merecen un tratamiento detallado.

5.5.1. Procedim ientos de extraccin factorial

Los distintos programas estadsticos ofrecen una amplia variedad de mtodos


para la extraccin de factores. Los ms habituales son los siguientes:
a)
b)
c)
d)
e)
f)

Componentes principales
Ejes principales o factor principal
Mxima verosimilitud
Mnimos cuadrados no ponderados o generalizados
Factorizacin alfa
Factorizacin imagen

Exceptuando el primer procedimiento (que supone la realizacin de un ACP), los cin


co restantes se aplican en la consecucin de un modelo analtico AFC Dillon y Goldstein
(1984:73) destacan dos procedimientos, el llamado factor principal, junto al de mxima
verosimilitud, como los ms ampliamente utilizados y estudiados. El primer mtodo es el
ms antiguo de los dos y frecuentemente se confunde con el anlisis de componentes
principales. El segundo mtodo es el nico para la extraccin factorial que corrientemen
te proporciona una base estadstica razonable para comprobar la adecuacin del modelo ana
ltico de factor comn bsico. Para poder valorar estas afirmaciones, se remite al lector a

452

Anlisis rnultivariable. Teora y prctica en la investigacin social

la lectura de los rasgos definitorios de cada uno de los procedimientos de extraccin factorial
que a continuacin se detallan.
A ) Componentes principales

A las caractersticas definitorias de ACP resumidas en el subapartado 5.2.1 hay que


aadir algunas consideraciones relacionadas con el procedimiento de extraccin de
componentes principales.
ACP, al igual que AFC, trata de la combinacin lineal de una serie de variables em
pricas correlacionadas en una serie de variables latentes (no observadas) no correlacio
nadas, que reciben el nombre de componentes principales. Pero ambos modelos analticos
difieren en e estudio que hacen de la varianza de las variables. En ACP se analiza toda la
varianza, no slo la compartida como hace AFC De los componentes se pide que extracten
la mayor proporcin de varianza de la serie original de datos. El primer componente prin
cipal est integrado por aquella combinacin lineal de variables que explica la mayor can
tidad de varianza en la muestra analizada. El segundo componente rene la combinacin
lineal de variables que explica la mayor proporcin de varianza residual (la que queda sin
explicar por el primer componente principal), con la condicin de que no est correla
cionada con la primera combinacin de variables que forman el primer componente. Los
componentes posteriores tambin han de ser ortogonales (no correlacionados entre s) y
secuencialmente explican cada vez menos proporcin de varianza residual.
En principio, en ACP pueden extractarse tantos componentes como variables ob
servadas. Pero, si se quiere que el modelo analtico cumpla los objetivos de parsim o
nia y simplicidad, deber contener un nmero de componentes inferior al de variables
observadas. Su nmero lo decide el porcentaje de varianza de las variables empricas
que logren explicar, adems de otras consideraciones resumidas en el subapartado 5.5.2.
Por ltimo, aadir que ACP puede aplicarse de forma aislada o en conjuncin con
A FC Varios autores (como Tabachnick y Fidell, 1989; o Afifi y Clark, 1990) reco
miendan la aplicacin de ACP como paso previo a AFC. Este proceder favorece
que el investigador disponga de informacin previa sobre varianza compartida, nmero
de factores y su naturaleza, que ser de inters para indagaciones posteriores.
B) Ejes principales o factor principal

En trminos de mtodos de extraccin de factores iniciales, la solucin de factor


principal iterativa es el mtodo empleado con ms frecuencia por los cientficos sociales,
los principales usuarios del anlisis factorial (Afifi y Clark, 1990: 408). De hecho, la
mayora de los tratamientos de anlisis factorial identifican el modelo de factor comn
mediante un procedimiento de factorizacin de eje principal (Kim y Mueller, 1978b:
21).
A diferencia de ACP, ahora slo se analiza la varianza comn o compartida, lo que
incide en el empleo de ia matriz de correlacin reducida. La diagonal principal de es

Captulo 5: A nlisis factorial

453

ta matriz se caracteriza por estar compuesta de las estimaciones iniciales de la comunalidad de cada variable. Estas cornunalidades se derivan mediante un procedimien
to iterativo con las correlaciones mltiples cuadradas de cada variable con todas las de
ms variables empricas, empleadas como valores de partida de la interaccin. Es decir,
como algoritmo en la estimacin de los factores comunes.
A partir de la matriz de correlacin reducida se procede a la extraccin de facto
res. La condicin que se impone es que sea mxima la contribucin de cada factor a la
com unalidad total. Primero se elige el eje sobre el cual la variabilidad de las proyec
ciones de los datos es mxima. Despus, se escoge el segundo eje en el que a varia
bilidad residual (o restante) de la proyeccin sea mxima. Y as, sucesivamente,.
Una rega a considerar es extractar factores hasta que la suma de los autovalores
se aproxime a la comunalidad total (Dillon y Goldstein, 1984:74). La mayora de los
programas estadsticos generan coeficientes factoriales (A-) para cada factor de manera
que la contribucin de cada factor a-la com unalidad total sea la mayor posible.
En suma, este segundo mtodo de extraccin de factores difiere de componentes
principales en que factoriza la comunalidad total que, obviamente, es inferior a la va
rianza total. Por esta razn, no sorprende que el valor de la comunalidad total en una
salida de ACP sea superior al obtenido en la extraccin de factor principal. Asimismo,
se observa que los coeficientes factoriales (o factor loadings) calculados mediante
este segundo procedimiento dependen, a diferencia de componentes principales, del
nmero de factores extrados.
Adems, como e anlisis factorial de ejes principales parte de la matriz de correlacin
reducida (o ajustada), las cornunalidades que componen su diagonal principal pueden ser
considerablemente inferiores a 1,0. En consecuencia, cabe la posibilidad de obtener autovalores negativos, a diferencia de ACP. Ante estos autovalores negativos el proceder habitual
es incluirlos en los anlisis, junto a los factores a ellos relacionados.
Las diferencias destacadas entre ACP y ei anlisis de factor principal se agudizan
cuanto ms se distancien los valores de comunalidad de 1,0. Si las cornunalidades se apro
ximan en magnitud a la unidad, ia distancia entre ambos modelos se minimiza. Lo mismo
acontece cuando el nmero de factores extractados mediante ej procedimiento de eje
principal se aproxima al nmero de variables empricas (p). En ambas situaciones se ob
tienen resultados similares realizando ACP y un anlisis d &factor principal.

C) Mxima verosimilitud

Este tercer procedimiento de extraccin factorial tiene su desarrollo inicial en los


aos cuarenta, de a mano de Lawley. De los dos anteriores difiere en dos aspectos fun
damentales:
1. Requiere que las p variables empricas cumplan el supuesto de normalidad.
Ni ACP ni el mtodo de. factor principal precisan, para su ejecucin, de este su
puesto. Hecho que incide en que el procedimiento de mxima verosimilitud se

454

Anlisis rnultivariable. Teora y prctica en la investigacin social

convierta en una opcin deseable, slo cuando se est ante distribuciones


normales.
2. El cumplimiento del supuesto de normalidad permite la inferencia estadstica:
las pruebas de hiptesis y la estimacin de los parmetros poblacionales (in
tervalos de confianza), a partir de las estimaciones mustrales. Esta es su prin
cipal ventaja frente a los dems procedimientos de extraccin factorial.
Para ello se aplica una prueba de chi-cuadrado propuesto por Barlett en
1954, con V2 [(p - k)z ~ p k}" grados de libertad (siendo p el nmero de
variables empricas y k el nmero de factores). Mediante dicha prueba se
comprueba si el modelo factorial obtenido en la muestra logra la configura
cin exacta de los parmetros poblacionles. Es decir, si puede generalizarse
a la poblacin a la que pertenece la muestra. Para este propsito se comparan
las correlaciones calculadas en la muestra con las reproducidas a partir de los
coeficientes factoriales de cada variable emprica en cada factor del modelo
factorial.
La hiptesis nula afirma que se ha logrado extractar toda l varianza po
biacional mediante los factores obtenidos en ia muestra. La hiptesis alterna
tiva es la negacin de la anterior. Si a un nivel de probabilidad especfico (dgase
del usual a = ,05 o el ms restrictivo a = ,01), el valor y } emprico resulta sig
nificativo (superior al correspondiente valor x l terico), se rechaza la hipte
sis nula. Lo cual significa que las predicciones a partir del modelo con los
factores extractados no son buenas estimaciones de las correlaciones observadas
entre las variables. Se debera incrementar e nmero de factores en el mode
lo para lograr reproducir adecuadamente las correlaciones entre las variables
originales. Esto suele ocurrir cuando en la matriz residual an queda varianza
significativa no explicada por algn factor.
En este mtodo factorial es habitual incrementar el nmero de factores hasta al
canzar un buen ajuste del modelo a los datos, a un nivel de significacin > ,05. Este pro
ceder se convierte en su peor crtica: el confiar nicamente en la prueba de significa
tividad puede llevar a la consecucin de un modelo de factor comn con ms factores
de los deseables. Esto es ms probable que suceda en tamaos mustrales elevados, que
suelen ir acompaados de valores %2 significativos. En palabras de Kim y Mueller
(1978b: 42), la aplicacin del mtodo ha mostrado que para muestras grandes con mu
chas variables el nmero de factores retenidos tiende a ser mucho mayor que el nmero
de factores que el investigador desea aceptar. Ante ello se recomienda (Harman,
1976) no confiar exclusivamente en el test y 2. Slo debera considerarse el nmero de
factores obtenidos mediante la prueba y 2 como referente del nmero mximo de fac
tores a extractar. nicamente se retendrn aquellos factores que sean interpretables
terica y sustantivamente. Preferiblemente, despus de la rotacin de la matriz factorial,
como se ver en el subapartado 5.6.1.
El objetivo principal del mtodo de mxima verosimilitud es encontrar aquella con
figuracin exacta de los parmetros poblacionales que maximice:

Captulo 5: Anlisis factorial

455

1. La probabilidad de producir ia matriz de correlacin observada.


2. La correlacin cannica entre los k factores y las p variables empricas.
3. E determinante de la matriz de correlacin parcial.
Dependiendo de qu aspecto se prime, .se-estar ante una u otra variedad del pro
cedimiento de mxima verosimilitud-, la factorizacin cannica de Rao o actuaciones di
rigidas a incrementar jos determinantes de la matriz de correlacin parcial residual.
De nuevo, la consecucin de un modelo factorial resulta del empleo de un algo
ritmo iterativo. Adems, las correlaciones se ponderan por el inverso de la varianza ni
ca de las variables, obtenindose un modelo factorial distinto del alcanzado median
te otros procedimientos.
Aunque tambin se consideran las correlaciones mltiples cuadradas como esti
maciones de las comunalidades iniciales, dichas estimaciones de comunalidad suelen
ser inferiores a las alcanzadas mediante otros mtodos factoriales. Las vari aszas ni
cas (tratadas como varianzas de cuasi-error) sern ms elevadas. Los factores co
munes suelen explicar una proporcin inferior de la varianza entre todas las variables
empricas. Y, por ltimo, los pesos o coeficientes factoriales sern, en general, ms ele
vados en aquellos indicadores (o variables empricas) de mayor comunalidad y, por tan
to, de menor varianza nica.
En resumen, el anlisis factorial de mxima verosimilitud permite, frente a otros pro
cedimientos factoriales, comprobar la bondad de ajuste de un modelo factorial concre
to a una matriz muestral de varianza o de correlacin. En su contra est la necesidad de
especificar el nmero de factores a extractar. Este hecho incide en su mayor adecuacin
a la variedad factorial confirmatoria, aunque no restringe su aplicacin a la exploratoria.

D) M nim os cuadrados r\o ponderados y generalizados

Los procedimientos factoriales de mnimos cuadrados tuvieron un desarrollo ini


cial en los aos sesenta. Primero, de la mano de Comrey, en un artculo publicado en
1962 (The mnimum residual method of factor analysis, Psychological Reports) y, pos
teriormente, con la aportacin de Harman y Jones de 1966 (The factor analysis by minimizing residuals (Minres), Psychom etrika, 31:351-368),
Su actuacin se dirige a m inim izar la correlacin residual (de ah le viene su de
nominacin de Minres: residuo mnimo), despus de haber extractado un nmero deter
minado de factores y de asegurar el grado de ajuste entre las correlaciones cuadradas
observadas en la muestra y las reproducidas mediante el modelo factorial. Se analizan
las diferencias entre ambas matrices, o se estudia la que mejor reproduzca la matriz de
covarianzas original (si el modelo de factor comn se ha obtenido a partir de la matriz
de varianzas-covarianzas).
Los anlisis comienzan con la hiptesis de un nico factor comn para, a conti
nuacin, ir aumentando el nmero de factores hipotticos hasta que se alcance una so
lucin satisfactoria: cuando los factores logren explicar la mayora de las correlaciones

456

A nlisis multivariable, Teora y prctica en la investigacin social

observadas. Tambin se comprueba ia bondad de ajuste me xan 'e a p


en el procedimiento de mxima verosimilitud.
.
,

La extraccin factorial de mnimos cuadrados incluye dos vane


1. Mnimos cuadrados no ponderados. Consiste en la obtencin de una
1
torial para un nmero especfico de factores, de manera que sM mmi
s ma de las diferencias al cuadrado entre los elementos (exc uye
orrejacn
ponen ia diagonal principal de la matriz) de las ma ri
Mediante este
observada y a reproducida a partir de los factores ex ra^
: li is de fa c _
procedimiento factorial suelen alcanzarse resultados simi
Comprubese
t oro ejes principales, cuando se tienen las mismas cornunalidades. Comprubese

, de

torizacin de mnimos cuadrados n o ponderados las es ' tnac:


ca^a ^
cornunalidades coinciden con las correlaciones mu p es c
reesmariable con las dems variables observadas, Despues, se Pro^
aKSja
cin, considerando el modelo factorial obtenido en las ases
com unaPor lo que, nuevamente, se est ante una estimacin 1 e^ V v .
variable emldades. Se calcuan los pesos o coeficientes factoriales (X) de
co_
prica en cada factor comn para, a partir de estos va ores,c
. iterativa
munalidades que reemplacen a las iniciales. El proceso de eStimac n
de las cornunalidades prosigue hasta que no se observen vari
.
respec
lores de las cornunalidades en las dos ltimas iteraciones ( e
to a las calculadas en el paso precedente).
mrodimiento an2, Mnimos cuadrados generalizados. Aunque comparte con P
orecisaterior el mismo criterio genrico de extraccin factonal, difiere de el precisa^
mente porque pondera las correlaciones nversamen e por
^ levada va-

las variables. De manera que, a las correlaciones de las, variables con elevada va^
rianza nica se les da un peso factorial inferior al o eni
nes de las variables con baja varianza nica.

E) Factorizacin alfa

Puede verse o como una variante del modelo de factor comn o como una estrategia
alternativa (Rim y Mueller, 1978b: 11). Su desarrollo principal lo alcanza con Kaiser y
Caffrey en 1965 (Alpha factor analysis, Psychom etrika), en indagaciones en el campo
de la psicometra. En concreto, en el inters por descubrir factores comunes consisten
tes cuando se toman muestras repetidas de una misma poblacin (de variables).
A diferencia de los dems procedimientos de extraccin factorial, en la factori
zacin alfa las variables se consideran una muestra del universo de variables. En los de
ms mtodos factoriales se analiza una muestra de individuos, no de variables, al asu
mirse que stas constituyen el universo. Por esta razn, en la factorizacin alfa no se

Captulo 5: Anlisis factorial

457

aplica ninguna prueba de significatividad al modo usual, como se hace en los mtodos
de mxima verosimilitud y de mnimos cuadrados. Se considera que el anlisis incluye
la poblacin de individuos y no una muestra de ellos. La lgica es, por tanto, opuesta
al resto de ios mtodos factoriales.
En la factorizacin alfa se busca maximizar la generalidad de ios factores. Los pe
sos o coeficientes factoriales se determinan de manera que los factores comunes ex
trados tengan correlaciones mximas con los factores comunes correspondientes,
que se asume existen en el universo.
Con el mtodo de mxima verosimilitud comparte la particularidad de que las es
timaciones factoriales son independientes de la escala de medicin. Pero, difiere de l
(al igual que de otros procedimientos factoriales) en que proporciona un coeficiente
factorial
ms elevado a las variables con menor comunalidad.
Las comunalidades para cada variable no resultan de la suma de los coeficientes
factoriales al cuadrado (A?.) en cada factor comn. Igualmente, los autovaiores no se ob
tienen de la suma de los coeficientes factoriales al cuadrado de todas las variables en
cada factor comn. En la factorizacin alfa las comunalidades se estiman mediante pro
cedimientos iterativos que maximizan el coeficiente alfa para los factores.
El coeficiente alfa es una medida derivada en psicometra para comprobar la fia
bilidad (o capacidad de obtener resultados consistentes en una medicin) de una
puntuacin tomada en una variedad de situaciones. Mide la consistencia interna-de las
variables empricas (de forma global e individual), en la configuracin de una misma
dimensin de un concepto terico. Se calcula a partir de la matriz de varianzas-covarianzas. Su rango de valores posibles va de 0,00 (infiabilidad) y 1,00 (fiabilidad per
fecta). Un valor a igual o superior a 0,80 ndica que la medida es fiable.

F) Factorizacin imagen

Recibe este nombre (imagen) por la peculiaridad del procedimiento de anlisis.


En l se distribuye, entre los factores comunes, la varianza de cada variable observa
da que es reflejada por el resto de las variables consideradas. La parte comn de
cada variable (aquella que puede predecirse mediante la combinacin lineal de las de
ms variables en la serie) se llama la imagen de la variable. Su cuadrado equivale a
la comunalidad de una variable como se define en AFC: la correlacin mltiple cua
drada entre una variable y el resto. En cambio, la parte nica de la variable, la no pre
decible mediante la combinacin lineal de las dems variables, recibe el nombre de anti-imagen". Su cuadrado equivale a la varianza nica.
En este procedimiento factorial el principio que rige la extraccin de factores es ei
de la covarianza de las estimaciones de cada variable regresionada en ias dems va
riables; o sea, como si se efectuase un anlisis de regresin lineal de dicha variable con
siderando el resto de las variables. En consecuencia, interesa la parte de la varianza de
cada variable que es compartida con las otras variables. De ah su clasificacin dentro
de los procedimientos de AFC.

458

A nlisis multivariable. Teora y prctica en la investigacin social

Con ACP comparte la particularidad de ofrecer una solucin matemticamente


nica, al existir valores fijos en la diagonal principal de la matriz de correlacin. Pero,
como en todo AFC, la diagonal de la matriz se halla integrada por las comunalidades
de cada variable. stas se obtienen, igualmente, de las correlaciones mltiples cua
dradas de cada variable con el resto. Si bien difiere de los otros procedimientos de fac
tor comn en que los valores de las comunalidades no cambian; es decir, no son reestimados iterativamente , sino que permanecen fijos. ste es el nexo que le une con
ACP: el ofrecer soluciones matemticamente nicas.
En la factorizacin imagen tampoco se aplica ninguna prueba de significatividad.
Se considera que se abarca al universo de variables y a la poblacin de individuos. Aun
que sus estimaciones logran mayor consistencia conforme aumenta el nmero de
casos analizados y se incrementa el nmero de variables.

Mediante cualquiera de los seis procedimientos de extraccin factorial referidos


se pueden, en general, alcanzar resultados similares cuando:
a) Aumenta el nmero de casos y de variables en el anlisis,
b) Las comunalidades se aproximan a 1,00.

En ambas situaciones la eleccin de uno u otro procedimiento factorial adquiere


menor importancia. De manera especial -siguiendo la propuesta de Gorsuch (1974)-,
cuando ei nmero de variables supera en cuanta a 30 y las comunalidades son mayores
de 0,40.

5.5,2. Criterios de seleccin del nmero de factores

Otra decisin clave en el anlisis factorial concierne al nmero de factores comunes


o componentes principales a retener en el modelo factorial. Del modelo se quiere que
explique la mayor proporcin de varianza (ACP) o de covarianza (AFC) de los datos
analizados. Este objetivo indudablemente se alcanza cuando ei nmero de factores
iguala al de variables observadas. Aunque, procediendo de esta manera no se logra la
finalidad bsica del anlisis: la reduccin de la informacin contenida en una serie am
plia de variables en un nmero inferior de factores o componentes.
De un modelo factorial se pide que sea sim ple y parsimonioso. Ha de contener un
nmero bajo de factores, pero suficiente para explicar las correlaciones habidas entre
las variables observadas. Autores como Erei y Ruloff (1989:307) proponen que el n
mero de factores no sea en ningn caso superior a la mitad del nmero de indica
dores.
Pero de los factores tambin se exige que sean significativos e interpretables.
Todos estos aspectos han de considerarse en la decisin dei nmero de factores que
compondrn ei modelo factorial. Concretamente, los criterios ms seguidos pueden re
sumirse en cinco:

Captulo 5: Anlisis factorial

a)
b)
c)
d)
e)

45 9

Autovalores (o varianza total explicada por cada factor)


Porcentaje de varianza total atribuible a cada factor
El grfico de sedimentacin (o scree test)
Significatividad
Interpretahilidad

Estos cinco criterios suelen valorarse conjuntamente, y no de forma aislada. La de


cisin sobre el nmero de factores normalmente se fundamenta en la convergencia de la
mayora de ellos. En los paquetes estadsticos al uso esta informacin se da en una tabla
inicial, posterior a las matrices de partida (de correlaciones o de varianzas-covarianzas),
y anterior a la matriz factorial. En el programa SPSS la tabla es como se ilustra en el ejem
plo. En versiones anteriores del SPSS, en la tabla aparecan as comunalidades iniciales pa
ra cada variable (1,OQO en ACP y las correlaciones mltiples al cuadrado de cada variable
respecto a las dems en AFC). En las ltimas versiones de SPSS (versin 7.5 y posteriores)
los valores de comunalidad se recogen en una tabla propia. sta induye las comunalidades
iniciales y las resultantes de la extraccin factorial. Tambin se ofrece una tabla de esta
dsticos descriptivos univarados que muestra el nmero de observaciones vlidas, junto
a la media y desviacin tpica de cada una de las variables observadas. Esta ltima in
formacin no es especfica al anlisis factorial, sino compartida con otras tcnicas anal
ticas como el anlisis de regresin. Por esta razn se decide no volver a extractarla en el
texto, sino remitir al lector interesado al subapartado 1.3.2 para su observacin.
Una tabla que s es especfica del anlisis factorial es la relativa a la varianza total
explicada por cada factor o componente. Incluye los autovalores iniciales y las sumas
de las saturaciones al cuadrado de la extraccin previo y posterior a la rotacin de los
ejes factoriales. De cada uno de ellos se ofrece el porcentaje de la varianza y el acu
mulado para cada factor o componente. La informacin relativa a los autovalores ini
ciales protagoniza 1a decisin del nmero de factores o componentes a extractar,
como se expone seguidamente.

A) Autovalores

El criterio ms seguido en ia determinacin del nmero de factores responde al au


tovalor de cada factor o componente. Por autovalor (eigenvalue) se entiende la can
tidad de varianza explicada por cada factor comn o componente principal Tambin se
le llama raz caracterstica o latente. Su tamao describe la dispersin de los datos en
un espacio multivariable que incluye un eje para cada variable observada. .Su suma equi
vale, en ACP, al nmero de variables empricas y su producto al determinante de la ma
triz de correlacin. En el ejemplo siguiente puede verse cmo se disponen (en la tabla
de varianza total) en orden decreciente: de mayor a menor tamao. Al primer factor le
corresponde el autovalor de mayor cuanta y al ltimo factor el de menor.
El empleo de los autovalores como criterio de extraccin del nmero de factores
fue propuesto por Kaiser en varios artculos de 1958 (The varimax criterion for

460

Anlisis rnultivariable. Teora y prctica en la investigacin social

analyxc retalien in factor analysis", Psychom etrika , 23) y 1959 (The appication of
eiectronic computis to factor analysis, American Psychological Association). Su apli
cacin vara si el modelo bsico es ACP o AFC.
En ACP, el punto de corte se fija en 1,00. Tbdo componente que presente un au-
tovalor >1,00 formar parte del modelo factorial. De l se excluirn aquellos com
ponentes cuyo autovalor sea inferior a 1,00, porque ni siquiera logran explicar la va
rianza de una variable. Recurdese que en ACP se analiza la varianza total de una
variable, sin diferenciar entre varianza comn y especfica. Las variables suelen estar,
estandarizadas, siendo su varianza total igual a 1. La suma de los autovaiores de todas?
as variables observadas ser, por tanto, igual al nmero total de variables y su protmedio jgual a 1,00. De ah que sea ste el valor de referencia adoptado. Adems, ca
da autovalor puede expresarse como una proporcin de esta suma. Segn estimacio
nes de Tabachnick y Fidel! (1989:635), el nmero de componentes con autovaiores
mayores de 1 suele estar en algn lugar entre el nmero de variables dividido por 3 y
el nmero de variables dividido por 5 (por ejemplo, 20 variables deberan producir en
tre 7 y 4 componentes con autovaiores mayores de 1).
En AFC interesa slo la varianza comn de las variables, hecho que revierte en
a determinacin del punto de corte qu e decide qu factores comunes formarn el
modelo factorial. En AFC cada autovalor indica la proporcin de varianza extractada..
por el factor comn en relacin con la varianza comn total de as variables. Su s
ma expresa la varianza com n total de ias variables. sta, obviamente, no ser
igual al nmero total de variables, a diferencia de ACP. Su valor ser tanto ms ba
jo cuanto menos varianza compartan las variables analizadas. Asimismo, el punto de
corte no ser 1,00, sino un valor inferior. El inters no est en explicar la varianza to-,
tal de una variable, sino slo la compartida con otras variables. El punto de corte se"
obtiene del promedio de las estimaciones de las comunalidades iniciales de todas las *
variables.
Tambin puede seguirse la recomendacin de Harraan (1976) de parar la extrac
cin del nmero de factores antes de que la suma acumulada de los autovaiores
exceda la suma de las comunalidades estimadas. Jisascomunalidades figuran en la dia
gonal principal de la matriz de correlacin reducida R. Adems se encuentran en a ta
bla de comunalidades, que incluye las iniciales y las resultantes de la extraccin fac
torial.
El criterio del autovalor se considera sencillo (Kim y Mueller, 19878b: 43) y sue
le funcionar bien. Normalmente proporciona resultados consistentes con las expectati
vas del investigador. Pese a ello, existen voces crticas a a aplicacin nica de este criterio.
Afifi y Clark (1990) afirman que los autovaiores estn sujetos a grandes variaciones mus
trales, al ser estimaciones de varianza de cada factor o componente. Por su parte, Dunteman (1989:22) alerta ~en referencia a ACP, pero tambin exensible a AFC - del pe
ligro de desconsiderar componentes principales que, aunque pequeos, pueden ser
importantes, si se aplica rgidamente el criterio de Kaiser. Esto sucede cuando una o ms
variables no quedan suficientemente bien representadas por los componentes o facto
res con autovaiores ms elevados y s, en cambio, por aquellos ms bajos.

Captulo 5: Anlisis factorial

461

En. la literatura tambin existen propuestas de cundo este criterio es ms operativo


y fiable. Para Hair et al. (1992: 237), cuando el nmero de variables se halla com
prendido entre 20 y 50, En casos donde el nmero de variables es inferior a 20
existe la tendencia de que mediante este procedimiento se extracte un nmero con
servador de factores; cuando se hallan implicadas ms de 50 variables no es inusual que
se extraigan demasiados factores. Para Tabachnick y Fidell (1989: 635) el criterio de
autovalor es razonable, si el nmero de variables es 40 o menos, y si el tamao
muestral es grande. Cuando coinciden ambos supuestos, ei nmero de factores de
terminado siguiendo este criterio ser el correcto. En caso contrario, se estar o sobrestimando, o subestimando, el nmero real de factores en la serie de datos. En sta,
como en otras cuestiones, existen opiniones dispares. La prctica investigadora, como
es usual, se impondr en esta polmica.

B) Porcentaje de la varianza total atrihuible a cada factor

Un criterio alternativo y equivalente al anterior es el porcentaje de la varianza to-:j


tal que es explicada por cada factor comn o componente principal. Se obtiene de la
divisin de cada autovalor por la varianza total. sta es igual a la suma de los elementos
de a diagonal principal de la matriz de correlacin. En ACP, la varianza total es igual
al nmero total de variables; en AFC, a la suma de las comunalidades iniciales de ca
da variable. Pero ms que el porcentaje de varianza explicada por cada factor espe
cfico, interesa el porcentaje acumulado de varianza de factores sucesivos. ste expresa
el porcentaje de varianza que lograra explicarse con la incorporacin d ese factor o
componente y los precedentes.
A diferencia del criterio de autovalor , en ste no se ha establecido ningn punto de
corte absoluto que determine el nmero de factores a incluir, o desconsiderar, en el mo
delo factorial. El procedimiento presenta cierta arbitrariedad en la decisin de qu pro
porcin de la varianza total es suficiente para dejar de aadir factores al modelo. La
decisin normalmente depende, como destacan Batista y Martnez (1989: 53) de: el n
mero de variables originales, la magnitud de las correlaciones de R, la significatividad
estadstica de los factores y, sobre todo, del conocimiento y experiencia que el inves
tigador posea de las variables consideradas.
No obstante, se han pronunciado algunas propuestas de porcentajes acumulados
de varianza mnimos para tomar como referentes. Afifi y Clark (1990) proponen
que como mnimo se explique, con factores sucesivos, el 80% de la varianza total, Hair
et al. (1992; 1999) diferencian entre ciencias duras" y ciencias sociales. Para las
ciencias duras sugieren que la extraccin factorial no concluya hasta que se logre al
menos explicar el 95% de la varianza total con los factores retenidos, o hasta que el l
timo factor explique slo una pequea proporcin (menos del 5%), En las ciencias so
ciales el porcentaje mnimo desciende hasta el 60% de la varianza total y, a veces, in
cluso menos. Esta apreciable reduccin porcentual la justifican por la menor
precisin de la informacin que suele analizarse en las ciencias sociales.

462

A nlisis multivariable. Teora y prctica en la investigacin social

E j$ M P L Q .D E ? L t C !Q N D E C B IJ ]E

(A UTO VAl.ORES) EN LA DECISIN DEL NMERO DE FACTORES


COMUNES O DE COMPONENTES PRINCIPALES A EXTRACTAR

En ia salida deS programa SPSS, los autovalores iniciales figuran en ia iabla conjunta
llamada varianza total explicada, junto a las sumas de las saturaciones ai cuadrado previo
y posterior a la rotacin factorial. La tabla siguiente corresponde al procedimiento de com
ponentes principales, la variedad analtica factorial ms popular y de ms fcii realizacin. Re
curdese que una prctica usual en la investigacin social es realizar un ACP para determinar
en cuntas dimensiones latentes pueden agruparse las variables de inters. Despus, pue
de realizarse un AFC conociendo ya el nmero de factores a extractar.
Las tablas de varianza total explicada en AFC proporcionan la misma informacin so
bre los autovalores Iniciales (la variabilidad previa a la extraccin factorial) que en ACP. Por
esta razn se evita su exposicin repetida. En lo que difieren es en nombrar factores y no
componentes" y, obviamente, en las sumas de Sas saturaciones a! cuadrado. Pero, como en
la decisin sobre el nmero de factores o componentes a retener el protagonista comn son
los autovalores, la exposicin se limita a su intervencin en esta fase del proceso de anli
sis. Lo referido a las sumas de las saturaciones se posterga al apartado 5.6. En dicho
apartado s se ejemplifican distintos mtodos de extraccin factorial, al constatarse diferen
cias en sus resultados. En general, los distintos procedimientos factoriales van a describirse
slo cuando sus resultados no coincidan con ACP.
Varianza total explicada
Autovalores iniciales

Sumas de las saturaciones


ai cuadrado de la extraccin

Suma de las saturaciones


al cuadrado de la rotacin

Compon.

1
2
3
4
5
6
7
8
9
10
11
12
13
14

Total

% d e ta
varianza

%
acumulado

3,619
1,665
1,114
1,015
,950
,868
,752
,736
,673
,600
,574
,S59
,470
,404

25,849
11,891
7,958
7,253
6,786
6,199
5,372
5,259
4,805
4,283
4,103
3,994
3,361
2,887

25,849
37,740
45,698
52,951
59,737
65,936
71,308
76,567
81,373
85,656
89,758
93,752
97,113
100,000

Moto de extraccin: Anlisis

Total

% dla
varianza

%
acumulado

Total

3,619
1,665
1,114
1,015

25,849
11,891
7,958
7,253

25,849
37,740
45,698
52,951

2,416
2,046
1,861
1,090

% d e la
%
varianza acumulado

17,260
14,611
13,290
7,789

17,260
31,871
45,162
52,951

componentes principales.

La tabla recoge tantos componentes principales como variables, aunque se quiere reducir
sensiblemente su nmero. En ACP e! criterio ms aplicado es que los componentes ai menos

Captulo 5: Anlisis factorial

463

presenten un autovalor igual a 1. De! componente se pide que explique ms variabilidad que la
correspondiente a una variable. Recurdese que el autovalor indica la cantidad de varianza to
tal explicada por cada componente principal. Como las variables estn expresadas en su for
ma estandarizada (para simplificar la informacin y, sobre todo, para evitar la influencia inde
bida de las unidades de medicin en la ponderacin de los componentes), su varianza es 1. Al
ser 14 as variables analizadas, la varianza totales 14; Puede constatarse que la suma de to
dos los autovaiores de la tabla es igual al nmero de variables. Exactamente, 3,619 + 1,665 +
1,114 + ... + ,404 = 13,999 (14). Asimismo, el producto de todos los autovaiores (3,619 x 1,665
x 1,114 x ... x ,404) es igual al determinante de la matriz de correacin: ,07667.
Los autovaiores figuran ordenados por su tamao. El primer componente se halla inte
grado por la combinacin lnea! de variables que ms varianza explica: 3,619. Respecto a la
variabilidad total (13,999), se traduce a un 25,85% de varianza explicada (3,619/13,999 x
100). En cambio, el ltimo componente apenas extracta varianza de las variables originales:
,404; que, en relacin con la varianza total, tan slo representa ei 2,9%. En general, los au
tovaiores de los ltimos factores o componentes se aproximan a cero, cuando las correla
ciones entre las variables son muy elevadas. Esta situacin no se da en este ejemplo. Las co
rrelaciones son leves, a excepcin de cuatro variables, a decir por sus comunalidades
'iniciales", como se vio en el subapartado 5,4.3.
La tabla corrobora asimismo fa afirmacin de Tabachnick y Fidell (1989) de que en
ACP el nmero de componentes con autovaiores mayores de 1 suele ser un nmero com
prendido entre ei nmero tota) de variables dividido entre 3 y dividido entre 5. En este ca
so, 14 / 3 = 4,667 y 14 / 5 = 2,8. Entre 5 y 3 componentes estara la decisin. En realidad,
son 4 los componentes a extractar porque presentan autovaiores mayores o iguales a 1.
El primer componente explica ei 25,85% de a varianza total de ias variables mientras que
el cuarto componente slo explica el 7,25%. En total, con la combinacin de las 14 va
riables en 4 componentes logra explicarse el 52,95% de la varianza (porcentaje acumu
lado, que ndica el porcentaje de varianza atribuible a un factor o componente y a aque
llos que le preceden en la tabla). Este porcentaje es importante en magnitud, aunque
ligeramente inferior al mnimo ideal en las ciencias sociales: el 60% de la varianza total.
S bien, distintos autores (Hair et a i, 1992; 1999) reconocen que la menor precisin de
la informacin en las ciencias sociales influye en que se acepten soluciones factoriales que
logren explicar incluso un menor porcentaje de varianza que el aqu obtenido. Explicar el
60% de la varianza total supone incrementar a 5 el nmero de componentes. Pero antes
de aumentar el nmero de componentes, hay que valorar otros criterios que despus se
exponen. Aqu slo se seala que e! componente 5 presenta un autovalor prximo a 1
(,950), permitiendo su incorporacin al modelo factorial.

C) E l grfico de sedimentacin (o scree test)

En 1966 Cateli propone (en The scree test for the number of factors, Multivaria
te Behavioral Research , 1:245-276) el empleo de un grfico, que denomina scree, en
la decisin de cuntos factores incluir en un modelo factorial. n este grfico s repre
sentan las autovaiores correspondientes a cada factor en el eje vertical, y los factores o
componentes, en su orden de extraccin, en el eje horizontal. D la conjuncin de cada

464

Anlisis mull variable. Teora y prctica en. la investigacin social

factor con. su correspondiente autovalor resulta una curva decreciente que conecta
puntos sucesivos. La curva siempre es decreciente, en consonancia con la disposicin de
ios autovalores. Al primer factor o componente siempre le corresponde el autovalor ms
elevado, mientras que e ltimo factor se caracteriza por tener el de menor cuanta.
Cateli escoge el trmino, aplicado en geologa, scree (traducido al castellano como
"desmoronamiento, escombros...) por a semejanza del grfico a los escombros que se
forman al pie, o en la parte inferior, de una pendiente de una montaa rocosa. Los au
tovalores grandes forman el acantilado y los pequeos los escombros o cascotes.
De acuerdo con este criterio, el nmero de factores o componentes est delimitado
por el punto de inflexin de la trayectoria de cada de la pendiente, Es decir, cuando
la pendiente descendiente comienza a nivelarse, Catell sugiere que se tomen todos
aquellos factores o componentes situados antes del punto de inflexin.
En la prctica, la aplicacin de este criterio supone la incorporacin al modelo fac
torial de 1 y, a veces, incluso 2 o 3 factores ms de los seleccionados siguiendo exclu
sivamente el criterio de los autovalores (Hair et a l, 1992; 1999).

je m p l o d e g r f ic o d e s e d im e n t a c i n

ES recurso al grfico de sedimentacin adquiere mayor relevancia cuando varios autovalores se aproximan a 1, como sucede en el ejemplo presente, y quiere comprobarse st se
pueden extractar menos componentes o factores de los inicalmente elegidos siguiendo el cri
terio de los autovalores.

Grfico de sedimentacin

Captulo 5; Anlisis factorial

465

Este grfico, tambin amado de fa "varianza total asociada a cada factor", intervie
ne igualmente en la decisin del nmero de componentes o factores a retener. Lo indica
el punto de inflexin de la curva descendente, donde sta comienza a nivelarse. La ni
velacin empieza a producirse, en este ejemplo, en el punto correspondiente al autova
lor del tercer componente (1,114), muy prximo al autovalor del componente cuatro
(1,015). Esto significa que la aplicacin de la prueba de desmoronamiento (o scree test)
lleva a la solucin de agrupar las 14 variables en 3 componentes principales. En contra de
la afirmacin de Hair et a!. (1992; 1999), su aplicacin en los datos aqu analizados no in
crementa el nmero de componentes, sino lo reduce.

Este tercer criterio de seleccin de factores es calificado, negativamente de arbitrario y subjetivo-. Kaiser (1970) lo considera ambiguo adems de subjetivo;' Es
tos calificativos se deben al hecho de que puede haber ms de una interpretacin de
la trayectoria de cada, e, incluso la misma consideracin de la pendiente como pro
nunciada o no pronunciada puede ser arbitraria. Dillon y Goldstein (1984)
comparten estas crticas y advierten, adems, de algunas complicaciones que pueden
suscitar la prctica de este criterio, aparentemente sencillo. Puede que no haya ningn
punto de inflexin claro u obvio, en cuyo caso esta prueba no sera concluyente. Pero,
tambin, puede darse la situacin contraria: la existencia de varios puntos de inflexin
(por ejemplo, en la primera mitad de los autovalores), que provoquen indecisin
sobre cul de los puntos de inflexin refleja el nmero correc);o de factores que com
pondrn el modelo factorial.
En caso de duda, la recomendacin usual es efectuar varios anlisis factoriales es
pecificando, cada vez, un nmero de factores diferentes. S los residuos (que figuran en
la matriz de correlacin residual) son pequeos, el anlisis factorial realizado se con
sidera bueno. La presencia de varios residuos moderados (de ,05 o ,10) o grandes
(> ,10) sugiere la necesidad de incorporar otro factor ms al modelo analtico (Tabachnick y Fidell, 1989).
La aplicacin del criterio de desmoronamiento mejora, no obstante, cuando con
fluyen varios elementos: tamao muestral elevado, altas comunalidades y coeficientes
factoriales prximos a 1 en varias variables en cada factor o componente (Gorsuch,
1983). Cuando coinciden estas situaciones, es ms probable que su aplicacin resulte
menos ambigua y, en consecuencia, ms clara.

D ) Significatividad

El criterio de significatividad estadstica slo se aplica cuando el procedimiento fac


torial es de mxima verosim ilitud o de m nim os cuadrados. Como ya se dijo en el su
bapartado 5.5.1, ambos procedimientos de extraccin factorial aplican, para comprobar
la significatividad del modelo, la prueba de contraste chi-cuadrado con 1/2 [(p - k)2
- p -- k] grados de libertad. Su uso suele relacionarse con la obtencin de un nme

466

Anlisis rnultivariable. Teora y prctica en la investigacin social

ro de factores superior al indicado por otros criterios. De manera especial, cuando el


tamao de la muestra es elevado y se incluyen muchas variables en el anlisis
Tambin se puede hacer uso del test de Barlett, en la evaluacin de los factores, de
manera conjunta y por separado. El procedimiento es similar al descrito en el sub~
apartado 5.4.3. L' hiptesis nula (H 0) niega la existencia de factores en la serie de da
tos analizada, mientras que la alternativa (Hj) la afirma. Para dicho contraste de hi
ptesis se acude, asimismo, a la distribucin chi-cuadrado, pero con 1/2 (p2 - p )
grados de libertad.
Como complemento de las pruebas de significacin referidas se propone el criterio
de significatividad sustantiva (KJm y Muelier, 1978b). ste se aplica con posterioridad a
la significatividad estadstica. Una vez que se ha comprobado que los factores extrados
son estadsticamente significativos, puede precederse a aumentar o a disminuir el nmero
de factores para, de esta forma, asegurarse que tiene el nmero mnimo de factores que
es compatible con sus datos. El incremento del nmero de factores suele producirse si los
datos se desvan significativamente del modelo asumido. La disminucin sucede, en cam
bio, cuando el modelo inicial se acepta como adecuado.

E j e m p l o d e a p l ic a c i n d e l c r it e r io d e s ig n if ic a t iv id a d e s t a d s t i a

La prueba de bondad de ajuste %2 se realiza cuando el procedimiento de extraccin de


factores es mxima verosimilitud y mnimos cuadrados generalizados. Adems, su uso exi
ge el cumplimiento del supuesto de normalidad rnultivariable, siendo sensible incluso a leves
incumplimientos de dicho supuesto. Se aplica una vez obtenida ia matriz factorial (apartado
5.6) y previo a la rotacin de los ejes factoriales. Mediante ella se comprueba ta adecuacin
del modelo factorial en la identificacin de las dimensiones latentes de las variables: si con
el nmero de factores comunes extrados logran explicarse tas correlaciones de Sa serie de
variables observadas.
En ambos procedimientos factoriales se (lega a una agrupacin similar de las 14 varia
bles en 4 factores comunes, como se ver en el apartado 5.6. igualmente, se logra un por
centaje acumulado de varianza explicada similar: 40,376% en mxima verosimilitud y
40,651% en mnimos cuadrados generalizados. Ambos porcentajes son inferiores a los
obtenidos en ACP: 52,951%.
Respecto a la prueba x2, sta resulta bastante significativa en ambos procedimientos fac
toriales (p < ,0005). La significatividad dei estadstico %2 lleva ai rechazo de H0 , que afirma
que se ha logrado extractar toda la varianza poblacional mediante los 4 factores extrados
de la muestra analizada. El rechazo de dicha hiptesis lleva, en consecuencia, a considerar
la conveniencia de incrementar el nmero de factores para, de esta forma, poder reproducir
adecuadamente las correlaciones entre las variables observadas. A decir por la prueba, las
predicciones del modelo con 4 factores comunes no son muy buenas estimaciones de di
chas correlaciones.
La aplicacin de ta prueba %2 confirma su principal crtica: el llevar a modelos con ms
factores comunes de los deseables con la finalidad de mejorar ei ajuste del modelo a los

Captulo 5: Anlisis factorial

Mtodo de extraccin
Mxima verosimilitud
Mnimos cuadrados generalizados

Chi-cuadrado

g.t.

Sig.

91,942
89,328

41
41

,000
,000

467

* Los grados de libertad son iguales a 1/2 { [p - kja- p - k ) = 1/2 ( [1 4 -4]3 - 14 - 4) = 41.

datos. Especialmente, en muestras grandes como la presente (2.492 casos), debido a que
el valor %2 es directamente proporcional al tamao muestral. Tambin afecta el nmero de
variables que el modelo incluya. En suma, puede llevar a ir incrementando el nmero
de factores a extraer hasta alcanzar un ajuste razonablemente bueno (p > ,05), que lle
ve a la aceptacin de H0. Pero, como ya se ha dicho antes, en la decisin de incremen
tar el nmero de factores tambin intervienen criterios anteriormente descritos, adems
de la llamada significatividad sustantiva. La solucin factorial ante todo ha de tener sig
nificado lgico que facilite su interpretacin. Esto lleva, necesariamente, a la lectura de la
matriz factorial, preferiblemente la rotada". A la vista de la composicin de cada factor pue
de decidirse su inclusin o exclusin del modelo final.

E) Interpretabilidad

A diferencia del criterio de significatividad, el de interpretabilidad se aplica en to


da la variedad de procedimientos factoriales. Una vez que se ha decidido el nmero de
componentes o factores que compondrn el modelo factorial, y antes de proseguir con
los anlisis, debe comprobarse si los factores extractados tienen significado sustantivo .
De los factores se pide, ante todo, que sean interpretables, que tengan significado l
gico desde alguna perspectiva terica. En caso contrario, debera replantearse su in
corporacin al modelo factorial.
Este ltimo criterio de seleccin de factores concierne a la capacidad de asignar un
significado a los factores. Complementa a los criterios anteriores e, incluso, puede pro
vocar el replanteamiento del modelo factorial en su conjunto. El modelo factorial ha
de ser interpretable desde alguna perspectiva terica, adems de parsimonioso. Los fac
tores carentes de significado sustantivo conforman una estructura latente sin un nexo
de unin lgico entre las variables empricas que lo integran (aunque su correlacin o
covarianza sea elevada).
La composicin de cada factor, junto con la variabilidad explicada, se ofrece en la
matriz factorial. A partir de sus componentes (preferiblemente de la matriz rotada) se
procede a la lectura e interpretacin del modelo factorial. Si se observa que un factor
ha quedado pobremente definido al incluir slo una variable con un peso o coeficiente
factorial bajo, puede considerarse la exclusin del factor del modelo analtico y repetir
los anlisis sin dicho factor. Lo mismo puede acontecer cuando el factor carezca de in
terpretacin lgica por la entidad de las variables que lo forman.

468

Anlisis mulvarable. Teora y prctica en la investigacin social

5-6. La matriz factorial y su interpretacin


Elegido el procedimiento de extraccin factorial y el nmero de factores que
formarn el modelo analtico, se procede al clculo de la matriz factorial (tambin lla
mada pattern matrix). Para ello se parte de la matriz de correlacin, o la de varianzacovarianza, dependiendo de cul haya sido la seleccionada.
La m atriz factorial bsica contiene los factores o componentes y las variables
empricas o indicadores que los integran. Los factores o componentes suelen estar ubicados
en las columnas de la matriz. Las variables empricas se sitan en las filas. Adems se
incluyen los pesos o coeficientes factoriales X. (factor loadings en AFC y component
loadings en ACP). Estos coeficientes tienen una interpretacin anloga a los coefi
cientes de regresin estandarizados , Recurdese que en ACP los componentes prin
cipales se explican en funcin de las variables observadas, mientras en AFC cada va
riable emprica acta, como la dependiente en la ecuacin lineal y los k factores;
comunes como las independientes o predictoras.
Cuando los factores o componentes no se hallan correlacionados entre s (quiere
esto decir que son ortogonales') y las variables empricas estn estandarizadas, como es
usual, los. pesos o coeficientes factoriales equivalen a correlaciones de cada variable X f
con cada factor o componente j. En esta situacin de incorrelacin de estructuras la
tentes, la m atriz factorial coincide con la de estructura. Esta ltima incluye las corre
laciones entre variables y factores.
El cuadrado de los coeficientes factoriales (Xj) se interpreta de forma anloga al
cuadrado de los coeficientes de correlacin: proporcin de varianza explicada de la va
riable X por cada factor (AFC) o proporcin de varianza explicada de los componentes
a partir de las variables que lo integran (ACP). En el ejemplo ilustrado a continuacin,
el coeficiente factorial de la variable X en el factor 1 es igual a 0,725. Elevado al cua
drado (0/7252 - ,53), y multiplicado por 100, significa que el 53% de'la varianza de la
variable X i es explicada por el factor 1. Lo mismo se hara con todos los coeficientes
factoriales de cada variable en los factores del modelo, lo que ayuda en la valoracin
de lo bien que el modelo factorial describe a las variables observadas.
Los autovalores (eigenvalues) para cada factor se obtienen de la suma de los cua
drados de los coeficientes factoriales (A|) de cada variable emprica en ese factor. Expresan
la cantidad de la varianza total en los datos que representa cada factor. Como la varianza
total explicada por un componente o factor es igual a la suma de cuadrados de los coe
ficientes para la columna correspondiente, los coeficientes de componentes principales se
rn ms altos, en general, que los coeficientes de factor comn (Dunteman, 1989:62).
De la divisin de cada autovalor entre la varianza total y multiplicada por 100 se cal
cula ei porcentaje de varianza explicada por cada factor. Cuando los factores o com
ponentes no se hallan correlacionados, puede conocerse la varianza total explicada por
el modelo factorial de la suma de los distintos autovalores. Tomando los datos del ejem
plo, se observa que el modelo factorial compuesto por dos factores comunes logra ex
plicar el 71,4% de a varianza total de las cinco variables empricas. Como es usual, el
primer factor explica el mayor porcentaje de varianza. Exactamente, el 42,4%.

Captulo 5: Anlisis factorial.

469

La suma de los (Xj.) para cada variable en todos los factores o componentes pro
porciona su comunalidad (hf). sta expresa la proporcin de la varianza de cada va
riable
que es explicada por los factores o componentes en el modelo. En la matriz
factorial del ejemplo se obtiene que el 84,1% de la varianza de la variable X 1 queda ex
plicada por ios dos factores juntos. Si a (la varianza total de la variable estandarizada)
se le resta la comunalidad, se obtiene la proporcin de varianza especfica (u = 1 - lif).
Es decir, la proporcin de varianza de cada variable que la solucin factorial no logra
explicar. El modelo de dos factores comunes del ejemplo logra explicar una proporcin
considerable de la varianza de las variables, salvo en las variables X 3 y X 4.
En general, valores de com unalidad bajos (prximos a 0,0) expresan que la
variable no ha quedado bien definida por el modelo factorial. Esto puede deberse a
la exclusin en el modelo de un factor (o componente) de gran relevancia en la ex
plicacin del fenmeno que se analiza; o bien, a que la variable iene una baja
proporcin de varianza com n con otras variables. Lo que revierte en una mayor
cuanta de varianza nica.

E j e m p l o d e m a t r iz f a c t o r ia l "n o r o t a d a %

Variables
x,

*3

*5
Autovalores
(suma de cuadrados)

Factor 1
0.725(a)*

Factor 2

Comunalidad (If)

Especificidad (u?)

0,562

0,841 (b)

0,159 (c)

0,648

-0,739

0,966

0,034

0,545*

-0,432

0,484

0,516

0,487

-0,526*

0,514

0,486

0,798*

0,354

0,762

0,238

2,12 (d)

1,45

3,57

1,43

% varianza total

42,4 (e)

29,0

% varianza comn

59,4 (g)

40,6

71.4(f)

28,6

* Factor en ei que ms satura las variables.


(a)
coeficiente factorial de la variable X, en el factor 1. Es la correlacin de dicha variable
con el factor 1:
= 0,7252 = 0,526. La proporcin de la varianza de la variable X, ex
plicada por el factor 1.
k
(b) i?: comunalidad de la variable X, = ^ A, = G,7252 + 0.5622 = 0,841. Porcin
de la varianza de la variable X1 explicada por los factores comunes.

470

Anlisis rnultivariable. Teora y prctica en la investigacin social

(c) lF: especificidad de la variable X1 ~ 1 - 0,841 = 0,159. Proporcin de ia varianza de


la variable X, no explicada por los factores comunes,
(d) Autovalor para el factor 1 =
p

A* = 0,72S2 + 0,648a + 0,5452 + 0,4872 + 0,7982 = 2,12


M
(e) % de varianza entre todas las variables que es explicada por ei factor 1 =
Autovalor / p X100 = (2,12/5) X 100 = 42,4.
(f) % de varianza entre todas las variables que es explicada por los dos factores (3,57/5) X 100 = 71,4.
(g) Varianza entre todas ias variables que es explicada por el factor 1 como un porcentaje
de la que es explicada por todos los factores =

La m atriz factorial del ejemplo incluye los integrantes bsicos: las variables em
pricas, los factores y los coeficientes factoriales. A stos se aaden las comunalidades,
as especificidades, los autovaiores y los porcentajes de varianza explicada por la so
lucin factorial. En la mayora de los paquetes estadsticos, como el programa SPSS,
estos ltimos valores figuran en tablas aparte de la matriz factorial: los autovaiores y
los porcentajes de varianza explicados por la solucin factorial en la tabla varian2 a to
tal explicada, las comunalidades en una tabla que rene las comunalidades iniciales
y las posteriores a la extraccin factorial. Ello facilita la comparacin entre ambas
comunalidades. De inters, sobre todo en AFC, donde as comunalidades iniciales ex
presan varianza comn. Indican la correlacin mltiple cuadrada de cada variable ob
servada X (que acta a modo de variable dependiente) respecto a las p - 1 variables
restantes (las independientes o predictoras); es decir, la proporcin de ia varianza to
tal en X que es explicada por las dems variables.
Los comunalidades finales suelen diferir, en cuanta, de las iniciales. Tanto en
ACP como AFC, sus valores corresponden a las correlaciones mltiples cuadradas d
cada variable X-t (la dependiente), pero ahora respecto a los factores actuando como
las variables independientes en una ecuacin de regresin mltiple. Representan la pro
porcin de la varianza de cada variable que logra predecirse por la estructura latente.
Estas comunalidades suelen estimarse mediante procedimientos iterativos, de ajuste
continuo entre las matrices de correlacin observada y la reproducida.
La matriz de correlacin reproducida contiene, en su diagonal principal, las estima
ciones de comunalidad a partir de la suma de los cuadrados de los coeficientes factoria
les en los factores retenidos para cada fila de !a matriz factorial. A partir de esta matriz se
procede a un nuevo anlisis factorial, que genera nuevas estimaciones de comunali
dad. El procedimiento concluye cuando convergen las matrices de coeficientes factoriales.
Por ltimo, hay que advertir que, cuando las comunalidades son pequeas (pr
ximas a 0,0) y/o varan considerablemente, los coeficientes factoriales de componentes

Captulo 5: Anlisis factorial

471

principales sern considerablemente ms grandes que los correspondientes a AFC


(Dunteman, 1989).

jem plo d e ma

m iz

d e c o r r e l a c i n r e p r o d u c id a .

Para ilustrar lo dicho sobre la matriz de correlaciones reproducidas {tabia A), se selecciona
la correspondiente al ACP. Adems, se aade la tabla de comunalidades (tabla B) para que
pueda constatarse que !a diagonal de la susodicha matriz est formada por las estimaciones
de la comunalidad despus de haberse producido ia extraccin factorial.
Tabla A. Matriz de correlaciones reproducidas
X15
*15

,531b

X,
xa

X,
X6

X,

X2

X3

x,

x6

,302 -061 -,083 -1 3 2 -2 7 9


,465b -,249 -,133 -,132 -.426
,766b -2 8 7
,089
,214
,448b -.282
,058
,507* ,231
,417b

X7

Xa

X9
x !0
x Sf
Xa
X,3
X,4

X?

x8

,352 -3 7 0
,426 -,465
-1 2 3
,197
,177
-1 9 4
-,092 ,102
-,385 ' ,418
,421b -,449
,484'

x9

X,o

.296
-.248
,318
-,087
,136
,232
,224
,261
,274

-,588
,221
,119
-,055
,181
,216
-3 1
,301
,352
,731b

Xi*

X|3

xM

,130 ,052 ,570 -,306


,216 ,166 ,189 ,419
,013 ,127
,060 ,210
,186 ,114 ~,G2 a ,093
-,554 -,488
,153 ,168
-3 2 0 -,266
,183 ,395
,176 ,136 - 5 8 -,389
-,179 -,128
,272 ,422
,099 -0 1 3
,319 ,239
",115 -,004
,708 ,249
,673b ,630 -,089 -,242
,619 ,010 -,189
,691b ,219

.sss11

Residuoa
X,s
Xt
X2
X3
X4
X6
x7

Xe
X9
x,0
X
x ia
X,3
xM

000

,054
,068

,032
,099
,256

,019
,003
,029
,225

-,017 -.070 ,076 ,081


,113
,089 -.140 ,097 ,106 -0 2 5
-,074
,012 -,060 -,148 ,028
-,086
,155 -.131
,108 ,030
-,090
,003 ,015 -,004 -,019
,102 -,143 -,049 ,017
,060 ,025 ,015
-.003 -,010
,113

,010
-,032
-,064
-,105
,113
,066
-,001
,025
-,028
,000

,005
-0 1 0
-,090
-,006
,198
,044
-,018
-,011
-.056
-.019
-,159

,174
-,038
,057
,054
-,028
,011
,009
-,006
-,058
-,136
-.006
-,051

,038
,129
-,061
-,038
,033
-.078
,121
-.113
-,060
,021
,038
,071
-,011

Mtodo da extraccin: Anlisis de componentes principales.


a Los residuos se caSctiian entre las correlaciones observadas y las reproducidas, Hay 46 (50%) de residuos no redundantes
con valores absolutos > ,05.
6 Comunalidades reproducidas,
X15siropata hacia norteafrieano (marroqu...); X, "leyes inmigracin'; X;, ideologa poltica; Xs "sexo"; X4 "edad"; X6 n
mero de inmigrantes"; X7reguarizar a inmigrantes"; Xa entrada inmigrantes"; Xg partido racista; X10casar con marroqu1;
X, | estudios ; X !2 ingresos; X ,3 vecino marroquP*; X M "inmigrante delincuente".

472

Anlisis multivariable. Teora y prctica en la investigacin social

Obsrvese que enja. matriz de correlaciones reproducidas se :SLa.er tos residuos. En el


anlisis factorial stos s definen cmo la diferencia entre ei coeficiente de correlacin ob
servado y el reproducido o estimado desde el modelo obtenido. Por ejemplo, el residuo de l
variable leyes de inmigracin" (Xt) respecto a la variable 'simpata hacia marroqu (X1S) es
igual a ,000; valor nulo porque ambas correlaciones coinciden. En la matriz de correlaciones
(subapartado 1,3.2) puede comprobarse que la correlacin observada entre ambas variables
es ,302. Este valor coincide con la correlacin reproducida (,302) -tabla A-, La menor coin
cidencia entre ambas correlaciones se produce precisamente en las dos variables que, de
cir por sus cornunalidades, menor varianza comparten con el resto de las variables: sexo" (X3)
e ideologa poltica (X2). La correlacin observada entre ambas variables es -,031, mientras
que la reproducida es -,287, Su residuo es igual a ,256 (-,031 - -,287]). Le sigue la corre
lacin entre las variables sexo1' y edad: correacin observada - ~,058; correlacin re
producida = -2 8 2 ; residuo = ,225.
Tabla B. Cornunalidades

Inicia1
Simpata marroqu
Leyes inmigracin
ideologa potsca
Sexo
Edad
N. inmigrantes
Regularizar inmigrante
Entrada inmigrante
Partido racista
Casar con marroqu
Estudios
Ingresos
Vecino marroqu
inmigrante delincuente

1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000

Extraccin
,531
,465
,766
,448
,507
,417
,421
,484
,274
,731
,673
,619

,691
,385

Mtodo de extraccin: AnSisis de com ponentes principales.

En la tabla A se dice que la mitad de los residuos son no redundantes, al ser su valor absoluto superior a ,05. Como en la mayora de los anlisis estadsticos, en el anli
sis factorial interesa que los residuos sean bajos porque indica que el ajuste dei modelo
es bueno. En caso contrario, debera reconsiderarse el modelo. Para ms informacin,
vase el apartado 5.7.

5.6.1. La rotacin de factores

La matriz factorial muestra la relacin, habida entre las variables y los factores o com
ponentes, pero su interpretacin no suele ser sencilla. Es frecuente que varias variables
presenten coeficientes factoriales elevados en ms de un factor, cuando lo que interesa
es que la mayor parte de su variabilidad quede explicada por un solo factor y no por va
rios. Esto lleva al desarrollo del principio de estructura simple, segn el cual las

Captulo 5: A nlisis factorial

473

variables han de saturar bsicamente en un factor. Quiere esto decir que sus coeficientes factoriales han de ser elevados en un solo factor o componente y bajos en el resto. Un
coeficiente factorial prximo a 0,0 indica inexistencia de relacin entre la variable emprica
y el factor. Un valor elevado (positivo o negativo), cercano a 1,0, expresa lo contrario.
El principio de estructura simple fue propuesto por Thu-rstone en 1947 (Mlti
ple Factor Analysis, Chicago University Press). En el anlisis factorial booleano este
principio no es tan exigido. Una variable puede tener un coeficiente factorial elevado
(prximo a 1,0) en ms de un factor, lo cual elimina la necesidad de efectuar una ro
tacin factorial. Salvo esta excepcin, en la generalidad de ios anlisis factoriales se demanda el principio de estructura simple. ste incluye los supuestos siguientes:
a) Cada factor o componente ha de tener unos pocos coeficientes factoriales

elevados y los dems prximos a cero.


b) Cada variable emprica ha de presentar un coeficiente factorial elevado slo en

un factor.
c) Los factores o componentes no han de tener la misma distribucin. Deben mos

trar un modelo diferente de coeficientes factoriales elevados y bajos.


Tanto en ACP como en AFC lo habitual es que el primer factor sea un factor general,
que agrupe la mayora de las variables observadas. Casi todas ellas presentan coeficientes
factoriales elevados en dicho factor, lo que determina que ste sea el factor que mayor
proporcin de varianza explique. Los factores o componentes siguientes explican cada
vez menor variabilidad. Esto guarda relacin con el decreciente nmero de variables con
coeficientes elevados. Adems, estos factores tambin suelen caracterizarse por ser
bipolares. Es decir, por incluir coeficientes factoriales positivos y negativos.
Si el investigador busca simplificar la estructura factorial, tendr que proceder a la
rotacin de la matriz factorial. La rotacin consiste en girar los ejes factoriales para que,,
stos se aproximen a las variables empricas. La finalidad es facilitar la interpretacin de
la matriz factorial, forzando a las variables a definirse ms en una dimensin latente, con
preferencia a otras. De esta manera se obtiene una mayor diferenciacin entre los factores
que logran un perfil ms definido. El nmero de factores o componentes se mantiene in
mutable, al igual que el porcentaje de varianza total explicada por el modelo factorial ini-.:,
cial y las comunalidades de las variables. Lo que vara es la composicin de los factores,
al cambiar los coeficientes factoriales de cada variable en cada factor. Esto tambin alte
ra la proporcin de variabilidad explicada por cada factor. No se olvide que con la rota
cin se redistribuye la varianza entre todos los factores.

Iz j M P L O DE MATRIZ FACTORIAL/ROTADA^

Para ilustrar en qu consiste la rotacin factorial, a continuacin se incluye a repre


sentacin grfica y la matriz factorial rotada que corresponde al primer ejemplo expuesto a
principio del apartado 5.6.

474

Anlisis multivariable. T eora y prctica en a investigacin social

a) El grfico (figura A) incluye la representacin de os coeficientes factoriales en una se


rie de coordenadas cuyos ejes (o forman ios dos factores del modelo. Los coeficientes
factoriales se representan en los ejes respectivos, tomando las puntuaciones obtenidas

en cada factor. De la interseccin de ambas puntuaciones se obtiene ta posicin de


las variables empricas respecto de Sos ejes factoriales.
Este grfico difiere de los convencionales en que cada punto representa una va
riable y los ejes su factor comn o componente principal. En los grficos convencio
nales, los puntos representan casos individuales y cada eje una variable. Estos
grficos corresponden al anlisis de variables. Cuando se est interesado en el
anlisis de casos, son ios casos (y no las variables) los que se representan en los ejes
factoriales. Las coordenadas de cada caso vienen dadas por sus correspondientes
puntuaciones factoriales.
Con la rotacin de os ejes factoriales (en el sentido de las agujas del reloj) se per
sigue a aproximacin de los ejes a los indicadores. Estos nuevos ejes se seleccionan
para que atraviesen os conglomerados de ios puntos que representan a los distintos
indicadores. El grfico a continuacin ilustra cmo se procede en la rotacin ortogonal.
Advirtase que el nuevo eje, que representa al factor rotado 1 atraviesa el conglo
merado compuesto por las variables empricas X2, X3 y X4. El eje para el factor 2 se
aproxima a las variables X1 y X5. Ambos ejes son perpendiculares entre s, como es
caracterstico de ia rotacin ortogonal. Este procedimiento de rotacin, como despus
se ver, se asienta en el supuesto de inexistencia de correlacin entre los factores.
Como se trata de ejes no correlacionados, ia distancia entre ellos ha de ser de
90, tanto antes como despus de la rotacin. Tras fa rotacin lo que se obtiene es una
mejor definicin de ios factores.

Factor 2 no roturado
Factor 2 roturado
A 1,0

Factor 1
no roturado
1,0

Factor 1 roturado
Figura A.

Capitulo 5: Anlisis factorial

A l5

b) Los paquetes estadsticos ofrecen tambin otros grficos para la solucin factorial ro

tada, cuyas coordenadas se corresponden con los coeficientes factoriales para la ma


triz factorial rotada. En dicho grfico de coeficientes factoriales tras la rotacin (en es
te caso ortogonal varimax), puede igualmente comprobarse el xito de la rotacin
hecha.
En la figura B puede observarse la existencia de dos conglomerados de variables
situados en los extremos de los ejes factoriales. El conglomerado que componen las
variables X2, X3 y X4 se sita en el extremo positivo del factor 1, mientras que el con
glomerado integrado por las variables X, y X5 se ubica en el extremo positivo del fac
tor 2. Todo lo cual expresa que con la rotacin ortogonal se ha alcanzado una es
tructura simple8. Las variables han quedado localizadas al final de cada eje, al
presentar coeficientes factoriales elevados en slo un factor. Ninguna se sita en el
origen (0,0), lo que indicara, por el contrario, la existencia de bajos coeficientes fac
toriales en ambos factores. Cuando esto sucede, significa que las variables no estn
asociadas a ningn factor.
En general, una hilera de puntos a lo largo de los ejes factoriales indica que el fac
tor no ha quedado claramente definido por las variables que en l saturan. Asimismo,
si los conglomerados de variables se hubiesen situado a medio camino entre los dos
ejes factoriales, significa que se precisa realizar una rotacin oblicua, porque los ejes
factoriales se encuentran correlacionados entre s. Esta localizacin de los conglo
merados de variables tambin puede deberse a la presencia de otro factor que habra
que incorporar al modelo factoriai. En ambas situaciones el investigador deber in
troducir modificaciones y realizar de nuevo los anlisis.
1,0
X1

0,5

X .3

o
<
t

*4

-0,5
-

1,0

-1,0

-0,5

0,0

0,5

1,0

Factor 1
Figura B. Grfico de coeficientes factoriales tras la rotacin ortogonal varimax.

c) La matriz factora/ rotada. Si se compara con la obtenida antes de la rotacin, pueden

advertirse las diferencias en la solucin factorial antes y despus de la rotacin. La es


tructura factorial incluida en la matriz no rotada est menos definida que la alcanza
da tras la rotacin. Si antes de la rotacin, la mayora de las variables empricas pre
sentan coeficientes factoriales elevados (todos superiores a 0,30) en ei factor 1,

476

Anlisis multivariable. Teora y prctica en la investigacin social

despus de la rotacin dos variables (X, y X5) quedan ms definidos en el factor 2.


Sus coeficientes factoriales en el factor 1 dejan de ser significativos (inferiores a 0,30).
Asimismo, se observa una alteracin notoria en la composicin de ios factores.
Las variables que presentan un mayor peso o coeficiente factorial, previo a la rotacin,
en el factor 1 son X,,X3 y X5. Despus de la rotacin ortogonal, el factor 1 queda cla
ramente configurado por las variables X2, X3 y X4, La ponderacin de estas variables
en el factor 2 es escasa. De manera especial, la variable X2 , con un coeficiente en el
factor 2 de 0,072. El factor 2 queda definido por las variables X, y X5, solucin nada
coincidente con la configuracin previa a la rotacin factorial. Con la rotacin se ha lo
grado una mayor definicin y diferenciacin entre los factores, al forzarse a los indi
cadores a definirse ms por un factor que por otro.
Tabla A. Matriz factorial rotada por el procedimiento ortogonal varimax
Variable s

Factor 1

Factor 2

Comunalidad (If)

Especificidad (uf)

0,167

0,902 *

0,841

0,159

0,980 *

0,072

0,966

0,034

^3

0,659 *

0,224

0,484

0,516

x*

0,709 *

-0,108

0,514

0,486

x5

0,258

0,834 *

0,762

0,238

Autovalores
(suma de cuadrados)

1,992

1,576

3,57

1,43

% varianza total

39,8

31,5

% varianza comn

55,8

44,2

71,4

28,6

* Factor en el que ms satura las variables.


De la comparacin entre ambas matrices factoriales tambin puede constatarse la va
riacin en varianza explicada por cada factor. S antes de la rotacin el factor 1 presentaba
un autovalor de 2,12, que supona ei 42,4% del total de varianza explicada (71,4%), despus
de ia rotacin su autovalor desciende a 1,992, que traducido a varianza explicada se queda
en el 39,8%. Este descenso en varianza del factor 1 es consecuencia de una mayor defini
cin del factor 2 tras la rotacin. Este factor queda claramente configurado por slo dos va
riables {X, y X5), aunque con una saturacin muy elevada: Xs con un coeficiente factorial de
0,834 y X 1de 0,902, Este factor pasa de explicar el 29% de la varianza total al 31,5%.
En suma, la rotacin ha ocasionado una redistribucin de la varianza total entre ios fac
tores, sin alterar la proporcin tota! de varianza explicada por ei modelo de dos factores.
Tampoco se han modificado las comunalidades; es decir, ia proporcin de la variabilidad
de cada variable emprica que explica ei modelo factorial de dos factores comunes.

Captulo 5: Anlisis factorial

A ll

El ejemplo anterior corresponde a un procedimiento especfico de rotacin: la ro


tacin ortogonal y, dentro de ella, a la variedad ms popular llamada varimax. Pe
ro, aunque sta sea la opcin ms popular, no quiere decir que sea la nica posible. En
el cuadro 5.1 se resumen los principales procedimientos de rotacin. Se diferencia en
tre rotacin ortogonal y la oblicua.
CUADRO 5.1. P ro ced im ien to s de rotacin fa cto ria l
A. ROTACIN ORTOGONAL:
1. Varimax
2. Quartimax
3. Equamax

B. ROTACIN OBLICUA:
1.
2.
3.
4.
5.

Oblimin
Quarimin
Bquartimin o covarimin
Oblimax
Promax

A ) Rotacin ortogonal

Parte del supuesto de incorrelacin entre las dimensiones latentes. Todo factor co
mn o componente principal es independiente de los dems, lo que determina que los
ejes factoriales se mantengan perpendiculares entre s, formando un ngulo de 90. Es
ta variedad genrica incluye los tres procedimientos principales siguientes:
A .l. Varimax
Es el procedimiento de rotacin factorial ortogonal ms empleado y el que se apli
ca, por defecto, en la mayora de los programas estadsticos. Fue propuesto por Kaiser
en 1958 (en The varimax criterion for analytic rotation in factor analysis, Psychometrika, 23:187-200). Su finalidad es simplificar la estructura factorial maximizando la
varianza de los coeficientes factoriales cuadrados (A|) para cada factor. De ah le vie
ne el nombre varimax, acorde con su objetivo principal: que la VARIanza se MAXlmice para ayudar a 1a interpretacin de los factores.
La simplificacin mxima se alcanza cuando en cada columna de la matriz facto
rial (donde se sitan los factores) existen slo unos y ceros (coeficientes factoriales muy
elevados en unas variables y muy bajos en el resto).
En la aplicacin de la rotacin varimax pueden emplearse coeficientes factoriales bru
tos o normalizados. Lo habitual es utilizar coeficientes factoriales normalizados (o

478

Anlisis multivariable. Teora y prctica en la investigacin social

estandarizados) para equilibrar la influencia de variables con distintas cornunalidades en


la solucin factorial. Para ello se aplica el criterio de normalizacin de Kaiser que consiste
en ajustar los coeficientes factoriales dividiendo, cada uno, por ia raz cuadrada de la co
munalidad de la variable correspondiente. O, igualmente, dividiendo cada coeficiente fac

torial cuadrado por la comunalidad de la variable respectiva.


La aplicacin de los coeficientes factoriales norm alizados proporciona a cada
variable emprica igual peso en la rotacin. De esta forma se evita que aquellas va
riables con cornunalidades ms elevadas influyan ms en ia solucin factorial final.
Cuando se aplique este criterio, se est ante una rotacin varimax normalizada. sta,
se muestra muy adecuada cuando las variables presentan cornunalidades muy dispa
res (elevadas en unas variables y muy bajas en otras), o
A,2. Quartimax
En vez de simplificar las columnas de la matriz factorial (como sucede en la ro
tacin varimax), busca la simplificacin de las filas (variables) de la matriz; Esto lleva
a maximizar la varianza de los coeficientes factoriales cuadrados para cada variable:1Ca
da variable deber tener una correlacin elevada en unos pocos factores y baja en el
resto, de manera que sea mnimo el nmero de factores necesarios para explicar su va
riabilidad.
Analticamente quartimax es ms sencillo que varimax. Si bien, varimax ofrece
una separacin ms clara de los factores (Ktm y Mueler, 1978b; Dilon y Goldstein, 1984;
Hair e ta l, 1992; 1999). En quartimax muchas variables pueden presentar coeficientes fac
toriales elevados en un mismo factor, al buscar la simplificacin de las filas. En cada fi
la debe haber slo un coeficiente factorial elevado, el resto ha de situarse prximo a ce
ro. Esto puede provocar el efecto no deseado de que muchas variables presenten
coeficientes factoriales elevados en un mismo factor. Habra un nico factor general in
tegrado por la mayora de las variables que ponderan mayoriariamente en este factor.

A.3. Equimax
Este tercer procedimiento de rotacin ortogonal se presenta como una sntesis de
los dos anteriors. Busca tanto la simplificacin de las filas (variables) como de las co
lumnas (factores) de la matriz factorial. Pese a ello no ha tenido el desarrollo esperado,
siendo de los tres procedimientos de rotacin el menos aplicado en la prctica.

B) Rotacin oblicua

Muestra mayor adecuacin a Situaciones muy habituales de interrelacin entre d i-3


mensiones latentes. Al permitirse la correlacin entre los factores o componentes, los

Captulo 5: Anlisis factorial

479

ejes factoriales no son perpendiculares, pudiendo estar separados por un ngulo inferior
a 90. Ei coseno de ngulo muestra la correlacin entre los dos ejes factoriales que se
relacionan. La consideracin de dimensiones latentes interrelacionadas comporta
una mayor complejidad en ia interpretacin de la solucin factorial, aunque sta sea
terica y empricamente ms realista.
La correlacin mutua entre los factores introduce modificaciones importantes en
la matriz factorial. En primer lugar, los coeficientes factoriales no pueden ya inter
pretarse como coeficientes de correlacin simple, como sucede en la rotacin ortogonal,
sino slo como coeficientes de regresin de cada variable emprica X t en funcin de fac
tores mutuamente relacionados. De la matriz factorial no rotada derivan dos matrices'
diferentes: la matriz de los coeficientes factoriales (o la matriz de configuracin: pat- :
tern matrix) y la matriz de correlaciones entre los factores y las variables (la matriz
de estructura: structure matrix). En la rotacin ortogonal ambas matrices coinciden,
en la oblicua difieren. Adems, las correlaciones entre las variables empricas (indi
cadores) y las dimensiones latentes pueden estar infladas por el solapamiento entre los
factores o componentes. Las variables pueden correlacionar con unos factores direc
tamente y con otros indirectamente, a travs de su correlacin con otro factor a l co
rrelacionado.
Para conocer el grado de correlacin entre los factores o componentes, la gene
ralidad de los programas estadsticos ofrecen una matriz de correlaciones entre los fac
tores (factor correlation matrix). sta permite comprobar el grado de intercorrelacin entre los factores. Informacin de inters en la decisin de qu modalidad de
rotacin aplicar con la finalidad de mejorar la solucin factorial.
La interrelacin entre los factores tambin altera la interpretacin de las co munadades de las variables y de la proporcin de varianza explicada por cada fac
tor. Las com unalidades no coinciden con la suma de los coeficientes factoriales al
cuadrado de cada variable en cada factor o componente. Tampoco la proporcin de
varianza explicada por el factor se obtiene a partir de la suma de los coeficientes
cuadrados de las variables que saturan en dicha dimensin latente. Los factores
estn correlacionados, lo que entorpece la interpretacin de la suma de los coefi
cientes factoriales cuadrados rotados oblicuamente en trminos de proporcin de
varianza.
La rotacin oblicua incluye igualmente una amplia variedad de alternativas. stas
pueden sintetizarse en las siguientes:

B.l. Oblimin
Es uno de los procedimientos de rotacin oblicua ms populares, ai estar incluido
en ia mayora de los programas estadsticos, como el SPSS. Suele aplicarse con coefi
cientes factoriales normalizados, obtenidos de la divisin del coeficiente factorial al cua
drado por la raz cuadrada de la com unalidad de la variable respectiva.
Este procedimiento de rotacin resulta de la combinacin de dos criterios:

480

Anlisis rnultivariable. Teora y prctica en la investigacin social

Quartimin: que se asemeja al quariinuix en la rotacin ortogonal. Minimiza la su

ma de los productos de los coeficientes factoriales y produce factores de mayor


oblicuidad.
- Covarimin: minimiza la covarianza de los coeficientes factoriales cuadrados. Tien
de a generar factores menos oblicuos y, como los dos criterios anteriores, tam
bin suele utilizar coeficientes factoriales norm alizados.

B.2. Qblimax
Se presenta como un criterio alternativo al quartimin (el equivalente oblicuo del
quartimax ). Persigue la simplificacin de la estructura factorial, aumentando (maxi
mizando) el nmero de coeficientes factoriales elevados y bajos. En cambio, disminuye
los de rango medio.
B.3. Promax
Es uno de los procedimientos de rotacin oblicua ms novedosos, incorporndo
se a las ltimas versiones de programas como el SPSS. Se caracteriza por conseguir la
solucin oblicua aplicando algunas funciones de la solucin ortogonal, como la matriz
target: aquella que el investigador tiene en mente o cree que existe.
La razn detrs de la rotacin promax es que las soluciones ortogonales suelen
aproximarse a la solucin oblicua, y reduciendo los coeficientes ms pequeos a coefi
cientes de casi cero, se puede obtener una matriz target de estructura simple razona
blemente buena. Entonces, encontrando los factores oblicuos que mejor ajusten
(aplicando el criterio de mnimos cuadrados) a esta matriz target, se obtiene la solucin
oblicua deseada (Kim y Mueller, 1978b: 40-41).
Este tercer criterio de rotacin oblicua suele utilizarse cuando se quiere compro
bar la congruencia de una estructura factorial con otra que se conoce.

j e m p l o d e d is t in t o s p r o c e d im ie n t o s d e r o t a c i n

o r t o g o n a l y o b l ic u a

EN ACP

Para que pueda mejor comprenderse la lgica de la rotacin, se decide aplicar las dis
tintas opciones de rotacin a un mismo mtodo de extraccin factorial: el anlisis de com
ponentes principales. Los mtodos de factor comn se ejemplifican en el apartado 5.8.
Primero, se expone ta matriz de componentes "no rotada" (tabla A). Punto de referencia
para comprobar ta mejora lograda con la rotacin. En la salida origina! del programa SPSS
(versin 10.0) dicha matriz incluye nicamente ias variables, os componentes extractados y
las saturaciones o coeficientes factoriales (component loadings). La informacin sobre co-

Capitulo 5: Anlisis factorial

481

munalidady los autovalores se da en tablas aparte. Los autovalores en la tabla comn llamada
varianza total explicada (subapartado 5.5.2). Las cornunalidades en una tabla especfica ya
expuesta en el segundo ejemplo de! apartado 5.6.
En la matriz no rotada (tabla A) se observa una estructura poco definida de los compo
nentes, al haber 8 variables (de las 14 analizadas) con saturaciones significativas en
ms de un componente. Se toma el referente ms habitual de X ^ ,30. Supone que al me
nos un 9% (,30 = ,09) de la varianza de la variable ha quedado explicada por eScomponente.
Dicho referente puede incluso reducirse ligeramente a las cantidades expuestas en el su
bapartado 5.6.2, dado el elevado tamao muestral.
Por ejemplo, ia variable casar con marroqu" presenta una correlacin significativa
con tres componentes: 1 (,639), 3 (,442) y 2 (,330). Su correlacin con el componente 4 es,
en cambio, negativa y ms leve (,133). En este ltimo componente la variable que ms pon
dera es ideologa poltica (,815), seguida a distancia por ia variable sexo" (-,394). La pre
sencia de las dems variables en este ltimo componente no es significativa. Por el contra
rio, e! componente 1 se presenta, como es usual, como un componente general. En l
saturan significativamente (X a ,30) la generalidad de las variables, con la nica excepcin de
a variable sexo. Lo que concuerda con la informacin de los autovalores dada en e! su
bapartado 5.5.2.

Tabla A. Matriz de componentes?


Componente

1
casar con marroqu
simpata marroqu'
entrada inmigrante
vecino marroqu
leyes inmigracin
n. inmigrantes
inmigrante delincuente
regularizar inmigrante
partido racista
ingresos
estudios
edad
sexo
ideologa poltica

,639
,626
,618
,589
-,586
,582
,571
-,570
,449
-,329
-4 5 2
,388
9.040E-03
,301

2
,330
-2 7 3
,113
,341
-2.02E-02
,123
1.20E-02
9,74E-02
,138
,690
,674
-,536
,279
,110

3
,442
-1 6 3
-,2 9 8
,439
,336
-,243
-,238
,285
,106
7.246E-03
8,15E-02
,261
-,464
- 1 ,85E-03

4
-,133
,193
2.78E-03
-,189
8,51 E-02
6,367E~02
4,811 E-02
7,394E-02
,206
,184
9,128E-02
3,929E-02
-,394
,815

Mtodo de exiraccin: Anlisis de componentes principales.


aA componentes extrados.

Previo a la rotacin factorial, el primer componente presenta un autovalor (suma de las


saturaciones al cuadrado tras la extraccin factorial: ,6392 + (-,626)2 + ,6182 + ... + ,301a) igual
a 3,619, que supone un 25,85% de varianza explicada (3,619/14 x 100). El segundo com
ponente expiica el 11,89% de la varianza, al ser la suma de sus saturaciones igual a 1,665.

482

Anlisis multivariable. Teora y prctica en la investigacin social

Ei tercer componente presenta un autovalor iguai a 1>114, que se traduce a un 7,96% de la


varianza total explicada. Por ltimo, el componente 4 es el que menor cantidad de varianza
explica: 1,015, es decir, el 7,25%. Recurdese que la agrupacin de las 14 variables en 4 com
ponentes principales logra explicar el 52,95% de la varianza total (vase la tabla varianza to
tal explicada en el subapartado 5.5.2).
Advirtase que en ACP, a diferencia de AFC, las medidas de varianza iniciales y
posteriores a ia extraccin factorial no varan. Pero s tras producirse a rotacin, como des
pus se ver.
Respecto a ias comunalidades, ya se vio, en el apartado 5.6, que al ser un ACP, las comortalidades iniciales son siempre igual a 1,0. Las de inters son las posteriores a la ex
traccin factorial. stos se obtienen de la suma de as saturaciones al cuadrado de la variable
en ei conjunto de ios componentes extractados. Su valor expresa ia proporcin de varianza
d las variables respectivas que logra explicarse mediante ta conjuncin de ios componen
tes. Las tres variables cuya variabilidad logra ser mejor explicada son Ideologa poltica (hf
= ,766 = ,301a + ,110a + 001847]2 + ,8152), casar con marroqu- (t? = ,731 = ,639a + ,330a
+ ,442a-!- [,1331a) Y Vecino marroqu {"t? = ,691 = ,5892 + ,3412 + ,439a + [~-,189]2). En cam
bio, slo el 27,4% de ia varianza de la variable partido racista ha quedado explicada por la
solucin de cuatro componentes principales y el 38,5% de Savariable Inmigrante delincuente.
En estas dos ltimas variables la mayor parte de su varianza queda sin explicar (especifici
dad}: el 72,6% y el 61,5%, respectivamente.
En busca de una mejor definicin de los componentes se prueban distintos procedi
mientos de rotacin. Primero, se aplica la variedad ms usual, varimax (tabla B), que per
sigue maximizar las saturaciones de una variable en un componente y minimizara en el res
to. Para evitar la desigual influencia de variables con diferentes comunalidades, se aplica
adems el criterio de normalizacin de Kaiser. Tras seis iteraciones (aunque se fij ei n
mero mximo de iteraciones utilizadas por defecto en el programa SPSS: 25. stos son los
pasos que puede seguir el algoritmo para realizar la rotacin) se obtiene la matriz incluida
en la tabla B.
Si previo a la rotacin ocho variables presentan coeficientes significativos en ms de un
componente, tras la rotacin ortogonal varimax el nmero de variables que ponderan en ms
de un componente se reduce a dos: las variables sexo (con X ,30 en tres componen
tes) y simpata marroqu (en dos componentes). Las doce variables restantes quedan cla
ramente definidas en un componente. La definicin perfecta se produce cuando la variable
presenta un coeficiente muy elevado (prximo a 1,00) en un componente y muy bajo (prximo
a ,00) en el resto.
El primer componente principa! queda ms definido por la combinacin linea! de cinco va
riables relacionadas con la poltica inmigratoria: leyes inmigracin, "entrada inmigrantes,
regularizar inmigrantes, nmero de inmigrantes e inmigrante delincuente.
El segundo componente por cuatro indicadores usuales de simpata hacia los inmi
grantes (en concreto, hacia los marroques): casar con marroqu, vecino marroqu, sim
pata marroqu y partido racista.
E tercer componente por variables sociodemogrficas relacionadas con !a "posicin so
cial: estudios, "ingresos y edad. En especial, las dos primeras.
E! cuarto componente por dos variables que muestran estar relacionadas: ideologa po
ltica" y sexo.
Si se compara a presente agrupacin de variables con ta obtenida mediante el anlisis'
de conglomerados (captulo 3), puede constatarse que ambas coinciden, aunque la variable

Captulo 5: Anlisis factorial

483

Tabla B. Matriz de componentes rotados3


Componente

1
leyes inmigracin
entrada inmigrante
regularizar inmigrante
n. inmigrantes
inmigrante delincuente
casar con marroqu
vecino marroqu
simpata marroqu
partido racista
estudios
ingresos
edad
ideologa poltica
sexo

-6 6 0
,659
-,610
,579
,576
,177
,141
-,351
,275
-,207
-1 7 3
5.780E-02
,276
,325

-,110
,217
-,210
,111
,160
,830
,818
-6 3 6
,332
4,00E-02
6.978E-02
,143
4,828E~03
-6,25 E~02

9.350E-02
-4.25E-02
5.204E-02
-,246
-,146
5.54E-02
-3,41 E-02
4.038E-02
-3,32E-02
,793
,754
-,675
9,794E-02
,310

-9,15E-02
2,200-02
5,012E-02
9.453E-02
7,861 E-02
8.724E-02
2.472E-02
4,251 E-02
,295
-9,31 E-03
,122
,168
,825
-,493

Mtodo de extraccin: Anlisis de componentes principales.


Mtodo de rotacin: Normaizactn varimax con Kaiser.
aLa rotacin ha convergido en 6 iteraciones.

ideologa poltica" finalmente no se incluyese en dicho aniisis por las razones expuestas en
dicho captulo.
Tras la rotacin, ni ias comunalidades ni el porcentaje global de la varianza tota! explicada
(52,95%) varan. Lo que s cambia es la varianza explicada por cada componente, al variar ias
saturaciones de las van'abies en cada componente. La rotacin produce una redistribucin de la
varianza que ocasiona una prdida de la variabilidad explicada por el primer componente,
con el aumento consiguiente en los dems componentes. El componente 1 pasa de un autovalor
de 3,619 a 2,416 (un 17,26% de la varianza total); el componente 2, de 1,665 a 2,046 (14,61%
de la varianza total); e! componente 3, de 1,114 a 1,861 (el 13,29%); y el componente 4, de 1,015
a 1,090 (7,79%). Vase la tabla de Varianza total explicada" en subapartado 5.5.2.
La tabia C incluye la matriz de rotacin para transformar los coeficientes de la matriz de
componentes no rotados a rotados: la matriz de transformacin de los componentes.
Tabla C. Matriz de transformacin de las componentes

Componente
1
2
3
4

,720
,084
-,686
,059

,576
.440
,636
-,265

-.351
,894
-.247
,128

,163
-0 0 3
,253
,954

Mtodo de extraccin: Anlisis de componentes principales.


Mtodo de rotacin: Normalizacin varimax con Kaiser.

484

Anlisis multivariable. Teora y prctica en la investigacin social

Despus se prueban otros procedimientos de rotacin ortogonal: quartimax (tabla D) y


equamax (tabla E). Quartimax busca la simplificacin de las filas de la matriz, en vez de las
columnas. Si se compara la tabla D con la tabla B, puede observarse que salvo ia variable
partido racista (que queda ms definida en el componente 1 que en el 2), el resto de las va
riables saturan en los mismos componentes en ambos procedimientos de rotacin ortogonal.
El nmero de variables con coeficientes significativos en ms de un componente aumenta a
tres: "sexo, simpata marroqu" y partido racista".

Tabla D. Matriz de componentes rotados1


Componente

entrada inmigrante
leyes inmigracin
regularizar inmigrante
n,0 inmigrantes
inmigrante delincuente
partido racista
casar con marroqu
vecino marroqu
simpata marroqu
estudios
ingresos
edad
ideologa poltica
sexo

,681
~,675
-,628
,603
,600
,326
,275
,234
-,419
-,248
-,194
,114
,310
,276

,141
-3.59E-02
-,140
4.496E-02
9.423E-02
,300
,805
,798
-,592
- 1 ,52E-02
9.054E-02
,136
-2,21 E-02
-,100

3
-9.97E-03
6.164E-02
2,152E-02
-,218
,118
2,02E-02
-4,41 E-02
2,43E-02
2,078E-02
,782
,745
-,671
,170
,328

4
-1.27E-02
-5,73E-02
8,236E-02
6.317E-02
4.768E-02
,278
6.956E-02
9.159E-03
6,641 E-02
7.208E-03
,135
,159
,811
-,505

Mtodo de extraccin: Aniisis da componentes principales.


Mtodo de rotacin; Normalizacin quartimax con Kaiser.
aLa rotacin ha convergido en 6 iteraciones.

Las cornunalidades no varan respecto a la solucin de rotacin varmax, pero s la pro


porcin de varianza explicada por cada componente, debido a a pequea alteracin producida
en su composicin. Aunque contina explicndose el 52,95% de la varianza total, aumenta
la aportacin del componente 1 en detrimento de los otros componentes, que ven disminuida
su aportacin a la varianza tota! explicada.
La aplicacin del procedimiento de rotacin equamax (tabla E) provoca, en cambio, una
redistribucin de la varianza tota! explicada por ios componentes ms equitativa. El primer
componente explica el 15,75% de la varianza (autovalor igual a 2,205); el componente 2, el
15,31% (2,143); e! componente 3, el 13,59% (1,903); y el componente 4, el 8,304% (1,163).
Si se comparan ia tabla E con la D y a B, puede observarse que la combinacin lineai de va
riables que forman cada componente en la solucin equamax se asemeja, en general,
ms a la obtenida mediante la rotacin varimax. Aunque aumenta a cuatro las variables con
coeficientes significativos en ms de un componente: sexo", "ideologa poltica, simpata ma
rroqu" y partido racista.

Captulo 5: Anlisis factorial

485

Tabla E Matriz cte componentes rotadosa


Componente

entrada inmigrante
leyes inmigracin
regularizar inmigrante
n.p inmigrantes
inmigrante delincuente
casar con marroqu
vecino marroqu
simpata marroqu
partido racista
estudios
ingresos
edad
ideologa poltica
sexo

,640
-,640
-,597
,554
,553
,120
9.077E-02
-.315
,230
-,174
-,157
1,134E-02
,214
,376

,251
-,143
-,244
,138
,188
,835
,824
,655
,338
-4,89E-02
5.869E-02
,140
-3,95E-03
-2.98E-02

3
-6.68E-02
,117
7,497E~02
-,267
-,167
-6.16E-02
~3,94E-02
5.382E-02
-4,15 E-02
,800
,761
,675
9,300E-02
,295

4
7,918E-02
-,146
-3,31 E-03
,143
,128
,122
5,601 E-02
-1 ,03E-03
,324
-2.93E-02
,107
,178
,844
-.468

Mtodo de extraccin: Anlisis de componentes principales.


Mtodo de rotacin: Normalizacin equamax con Kaiser.
a La rotacin ha convergido en 6 iteraciones.

Por ltimo, se comprueba si distintos procedimientos de rotacin oblicua logran una mayor
definicin de as variables en ios componentes. Se parte de la hiptesis de que los componentes
pueden estar intercorrelacionados. Primero, se prueba el procedimiento de rotacin oblicua ms
popular, oblimin, y despus el procedimiento promax. stas son las dos opciones de rotacin
oblicua dadas en el programa SPSS. Las tablas F (matriz de configuracin^ y G (matriz de es
tructura) corresponden a la rotacin oblicua oblimin, con el criterio de normalizacin de Kaiser.
Recurdese que en la rotacin oblicua ambas matrices varan, a diferencia de la rotacin or
togonal, Como el procedimiento oblimin permite controlar la extensin de ia "oblicuidad" medante
delta (<?'), ste se fija en 0, siguiendo la recomendacin de Harman (1976) de que delta sea 0.
La oblicuidad es mayor cuando delta es 0 y menor cuando es negativo.
La matriz de estructura (tabla G) muestra las correlaciones entre ias variabies y ios com
ponentes. Se obtiene multiplicando la matriz de configuracin por la matriz de correlaciones de
los componentes. Recurdese que una caracterstica que distingue a la rotacin oblicua es que,
al permitir que los componentes estn intercorrelacionados, los coeficientes dejan de ser simples
coeficientes de correlacin de la variable con e! componente, sino coeficientes de regresin de
cada variable emprica respecto a los componentes que estn mutuamente relacionados.
De la comparacin de las matrices con las obtenidas con la rotacin ortogonal puede con
cluirse que la composicin de los componentes principales no difiere, en general, de los mo
delos precedentes; si bien, ha logrado una definicin ms ciara de los componentes, ai ha
ber menos variabies que saturen de forma significativa en ms de un componente. La
diferencia principa! es el intercambio en ta composicin de ios componentes 2 (ahora ca
racterizado por la combinacin de las variables "estudios, "ingresos y edad) y 3 (casar con
marroqu', "vecino marroqu , simpata marroqu y partido racista).

486

Anlisis rnultivariable. Teora y prctica en la investigacin social

Tabla F. Matriz de configuracin11


Componente

leyes inmigracin
entrada inmigrante
regularizar inmigrante
n, inmigrantes
inmigrante delincuente
estudios
ingresos
edad
casar con marroqu
vecino marroqu
simpata marroqu
partido racista
ideologa poltica
sexo

-661
,644
-5 9 6
,563
,557
-,142
-,140
-3.74E-02
-1.36E-02
4.43E-02
-,223
,198
,26?
,408

4,666E-02
5,982E-03
1.140E-Q2
-.206
-1 0 3
,794
,770
-,667
- 1 ,69E-03
1.352E-02
-6,26E-03
1.610E-02
,168
,301

8.862E-03
,113
-,119
2,171 E-03
5,938E-Q2
1,333E-02
,115
,116
,858
,857
,626
,287
-,104
-8.24E-02

4
9.55E-02
1.834E-02
5.669E-02
8,480E-02
7.125E-02
4.728E-02
,168
,109
1.085E-02
5,12E-02
9.649E-02
,275
,856
-,463

Mtodo de extraccin: Anlisis de componentes principales.


Mtodo de rotacin'. Normalizacin obfmin con Kaiser.
aLa rotacin ha convergido en 8 iteraciones.

Tabla G. Matriz de estructura


Componente

entrada inmigrante
leyes inmigracin
regularizar inmigrante
n. inmigrantes
inmigrante delincuente
estudios
ingresos
edad
casar con marroqu
vecino marroqu
simpata marroqu
partido racista
ideologa poltica
sexo

,687
",673
-,639
,603
,602
-,260
-.207
,121
,314
,276
-,453
,324
,259
,295

--,114
,165
,113
-,309
-2 1 0
,808
,752
~~,693
- ,ita
8,29E'02
9.597E-02
-9.40E-02
1.055E-02
,317

3
,360
-.266
-,337
,259
,298
-,135
7.0GE-03
,209
,855
,829
-,693
,411
,133
-5.22E-02

4
8,633E-Q2
-,150
-1.16E-02
,158
,139
-8,07 E-02
6.298E-02
,229
,169
' ,102
-3,55E-02
,340
,831
-,493

Mtodo de extraccin: Anlisis de componentes principales.


Mtodo de rotacin: Normalizacin obimin con Kaiser.

Al permitirse que los componentes estn correlacionados, ias sumas de ios cuadrados
de as saturaciones no se pueden aadir para obtener la varianza total, a diferencia de ios pro
cedimientos de rotacin ortogonales. Slo se informa de ios autovaiores totales: componente
1 = 2,822, componente 2 = 2,030, componente 3 = 2,618 y componente 4 = 1,227.

Captulo 5: Anlisis factorial

487

La interreiadn de los componentes tambin altera la interpretacin de las cornunalidades,


cuyo valor no coincide con la suma de las saturaciones al cuadrado de la variable en cada
componente. La divergencia es mayor, cuanto ms correlacionados estn los componentes.
Para constatarlo, calclense las cornunalidades y comprense con las expuestas en el
apartado 5.6, que son las proporcionadas por el programa para todo ACP, indistintamente del
mtodo de rotacin aplicado.
Las correlaciones de los componentes aparecen en la tabla H. Dicha matriz no coincide con
ia matriz identidad {caracterizada por tener a diagonal principal integrada por unos y el resto por
ceros), aunque las correlaciones no son elevadas. Ello explica la poca variacin en la composicin
de ios componentes respecto a la rotacin ortogonal. Los componentes ms correlacionados son
el 1 y el 3 (,380) y tos menos el 1 con el 4 (,07455). Estos dos ltimos componentes son casi or
togonales al estar escasamente correlacionados. El solapamiento en ia varianza de ambos es
casi nula (,07455a = ,0056 - 5,6%) mientras que el solapamiento en la varianza de os componentes
1 y 3 aicanza el 14,44% (,3802). Advirtase que en la mayora de las situaciones la inexistencia
de correlacin entre los componentes es una propiedad deseable porque supone que los
componentes extrados realmente miden dimensiones diferentes en los datos.
Tabla H. Matriz de correlaciones de los componentes
Componente

1
2
3
4

1,000
-,159
,380
7,455E-02

-,159
1,000
-,130
-151

,380
-,130
1,000
,186

7,455E-02
-.151
,186
1,000

Mtodo <Je extraccin: Anlisis de componentes principales.


Mtodo de rotacin: Normalizacin obiimin con Kaiser.

La escasa correlacin de los componentes puede llevar a reconsiderar ia conveniencia


de proceder a la rotacin oblicua. Se prueba la rotacin promax, obtenindose correlaciones
ligeramente superiores entre los componentes. La ms elevada (tabla l) se da entre ios com
ponentes 1 y 2 (,418) y la ms baja entre los componentes 1 y 4 (,113), Ello se debe a que
mediante a rotacin promax se obtiene una composicin similar de los componentes a la con
seguida mediante los procedimientos ortogonales. El componente 2 est mayoritariamente
integrado por la combinacin lineal de las cuatro variables que miden simpata" hacia los in
migrantes y el componente 3 por los indicadores de "posicin social. Si se comparan las ta
blas J y K con las correspondientes a la rotacin obiimin (tablas F y G) se observar que am
bos componentes estn intercambiados en ambas soluciones factoriales.
Tabla I. Matriz de correlaciones de los componentes
Componente

1
2
3

1,000
,418
-1 8 7
,113

,418
1,000
-,145
,198

~,187
-1 4 5
1,000
-,142

,113
,198
,142
1,000

Mtodo de extraccin: AnMsis de componentes principales.


Mtodo de rotacin: Normalizacin promax con Kaiser.

488

Anlisis multivariable. Teora y prctica en la investigacin social

Tabla J. Matriz de configuracina


Componente

leyes inmigracin
entrada inmigrante
regularizar inmigrante
n," inmigrantes
inmigrante delincuente
vecino marroqu
casar con marroqusimpata marroqu
partido racista
estudios
ingresos
edad
ideologa poltica
sexo

-,675
,659
-.611
,573
,569
-3,81 E-02
-7,68E-03
-,235
,200
,140
-,140
-4,41 E-02
,254
,426

4.205E-02
8,098E-Q2
-9.05E-02
-2,74E-02
3,086E-02
,858
,856
-,615
,275
2.578E-02
,126
,112
-,121
9.66E-02

3,795E-02
1,581 E-02
1.893E-03
-,199
-~9r55E-02
2,006E-02
5,008E-03
1,49E-2
2.002E-02
,793
,769
-,668
,167
,308

-8,83E-02
1.075E-02
6.372E-02
8.036E-02
6.586E-02
5,05E-02
1.154E-02
9.907E-02
,273
4.123E-02
,163
,117
,853
-,472

Mtodo de extraccin: Anlisis de componentes principales.


Mtodo de rotacin: Normalizacin protnax con Kaiser.
a La rotacin ha convergido en 6 iteraciones.

Tabla K. Matriz de estructura

Componente

entrada inmigrante
leyes inmigracin
regularizar inmigrante
n.0 inmigrantes
inmigrante delincuente
casar con marroqu
vecino marroqu
simpata marroqu
partido racista
estudios
ingresos
edad
ideologa poltica
sexo

,691
-6 7 4
-,642
,608
,607
,351
,311
-,478
,342
~,273
-,212
,141
,269
,275

,357
-2 6 3
-",334
,257
,296
,855
,829
-,691
,410
-,140
-1.16E-02
,214
,130
-5.66E-02

-,120
,170
,120
-,314
-2 1 6
-1 2 0
-9,02 E-02
,104
-9,61 E-02
,810
,754
-,693
1,580E-02
,310

9,884E-02
-,161
-2.34E-02
,168
,150
,180
,113
-4.72E-02
,347
-8.23E-02
6,265E-02
,229
,834
-,487

Mtodo de extraccin: Anlisis de componentes principales.


Mtodo de rotacin: Normalizacin prornax con Kaiser.

Captulo 5: A nlisis factorial

489

Con cualquiera de los procedimientos de rotacin puede cubrirse el objetivo de


lograr un modelo factorial ajustado al principio de estructura simple, integrado por
dimensiones latentes claramente definidas mediante los indicadores utilizados. Si
bien, la rotacin ortogonal, en general, y el procedimiento varimax, en particular, son
los ms aplicados en la investigacin emprica. Y ello pese a que la rotacin oblicua se
ajusta ms a situaciones habituales de dimensiones latentes interrelationadas.?
El xito de los procedimientos de rotacin ortogonal en gran parte se debe a su am
plia difusin en a generalidad de los programas estadsticos. Tambin ha contribuido
su mayor sencillez de realizacin y de interpretacin. Mientras en la rotacin ortogonal
el modelo factorial se obtiene de la interpretacin de la matriz factorial, en la rotacin
oblicua se precisa conocer las matrices factoriales, de estructura y la de correlacin en
tre factores. Adems, la sola interpretacin de la m atriz factorial es ms compleja, al
estar sus datos referidos a factores o componentes interrelacionados,
A las ventajas destacadas de la rotacin ortogonal hay que aadir su mayor ade
cuacin, cuando el anlisis factorial se aplica como paso previo a otros anlisis multivariabes. Sirva de ejemplo su aplicacin para eliminar la multicolinealidad en anlisis co
mo el de regresin. Para este propsito se precisa obtener dimensiones latentes
ortogonales (no correlacionadas), que agrupen a indicadores muy correlacionados entre
s. Lo mismo sucede cuando se quiere formar grupos (de sujetos o variables) muy
cohesionados entre s y diferentes de los otros grupos. En estas situaciones la rotacin or
togonal se convierte en la mejor opcin, al adecuarse a los propsitos del anlisis. En cam
bio, la rotacin oblicua se adeca ms cuando el analista simplemente est interesado
en obtener constructos o dimensiones tericamente significativos porque, como afirman
Hair etal. (1992: 234-235), es terica y empricamente ms realista.
En situaciones de indecisin en la eleccin del procedimiento de rotacin, lo
ms conveniente es seguir la recomendacin, destacada por Tabachnick y Fidell
(1989: 637), de solicitar la rotacin oblicua con el nmero deseado, de factores y ob
servar las correlaciones entre los factores. Si stas exceden de ,30, existe un 10% (o
ms) de solapamiento en la varianza entre los factores. Esta varianza se considera su~..:
ficiente para garantizar la rotacin oblicua, a menos que existan razones apremiantes
para la rotacin ortogonal.
Este proceder convierte a la observacin de la matriz de correlacin factorial en cla
ve en la decisin de qu modalidad de rotacin realizar. Si esta matriz coincide con la
matriz identidad, significa que los factores no se hallan correlacionados entre s, lo que
favorece el uso de la rotacin ortogonal. Por el contrario, cuando las correlaciones entre los factores son > ,30, la rotacin oblicua se convierte en la opcin deseable en la
consecucin de una estructura factorial ms ajustada a la realidad observada.

5.6.2. Lectura e interpretacin de la matriz factorial

De ia matriz factorial (preferiblemente la rotada) se obtiene la configuracin del


modelo factorial: las variables empricas que conforman cada dimensin latente. Es-

490

Anlisis rnultivariable. Teora y prctica en la investigacin social

a informacin la dan los pesos o coeficientes factoriales (los actor loadings o


component loadings) de cada variable emprica en cada factor o componente. La
magnitud de dicho coeficiente es lo que define la composicin de cada dimensin, que
agrupa a las variables que ponderan en ella. Normalmente las variables empricas se
integran en aquella dimensin latente en la que mayor coeficiente factorial presenten.
Pero la asignacin de variables empricas (o indicadores) a factores o componentes ni
es siempre sencilla, ni se halla libre de polmica.
Primero, ha de decidirse a partir de qu valor el coeficiente factorial se considera.;
significativo. O. dicho en otros trminos, qu cantidad mnima de la varianza de una
variable ha de ser explicada por un factor o componente. La propuesta ms compar
tida es tomar como valor mnimo ,30. Todo coeficiente factorial > ,45 se estima
significativo y a partir de ,50, como muy significativo;.Cuanto ms se aproxime el
coeficiente factorial a 1,00, mayor es la relacin de la variable con el factor. Comrey
(1973) califica a los coeficientes > ,70 (50% de varianza que se superpone) de ex
celentes; los > ,63 (40% de varianza) de muy buenos; > ,55 (30% de varianza)
bueno; > ,45 (20% de varianza) justo; y > ,32 (10% de varianza) pobre, aun
que suficiente. Tabachnick y Fidell (1989) slo sealan como regla interpretar las va
riables con coeficientes factoriales > ,30.
En tamaos mustrales superiores a 100 casos, estos referentes pueden reducirse; En
muestras inferiores deben, en cambio, aumentarse. Pero, en la decisin de qu punto de
corte adoptar en la valoracin de un coeficiente factorial como significativo no slo in
terviene el tamao muestral. Tambin ha de considerarse el nmero de variables emp
ricas. El aumento del nmero de variables, al igual que el incremento del tamao mues
tral, permite rebajar la cuanta mnima del coeficiente para considerarlo significativo.
Hair et al. (1992; 239-240) incluyen ambos aspectos en su propuesta:
- Para tamaos mustrales > 50 casos, los coeficientes factoriales > ,30 son sig-:
nificativos; > ,40, importantes; y > ,50, muy significativos.
- Para tamaos mustrales de 100 casos, se recomiendan coeficientes factoriales
> ,19 y.> ,26 para niveles de significacin de ,05 y ,01, respectivamente. Si la
muestra es de 200 casos, los coeficientes recomendados son ligeramente infe
riores; > ,14 y > ,18; Cuando la muestra es superior a 300 casos, los coefi
cientes factoriales de referencia descienden an ms; > ,'J.l y > ,15;para los
niveles de significacin de ,05 y ,01.
- Si se considera adems el nmero de variables y de factores o componentes, los
coeficientes factoriales de referencia tambin varan. El pasar del primer factor
a los posteriores ha de suponer, igualmente, un incremento del nivel aceptable
para que el coeficiente se considere significativo. As, por ejemplo, para un ta
mao muestral de 100 unidades y un nivel de significacin de ,05, un coeficiente
factorial significativo en el factor nmero 5, con 20 variables empricas, es >
,2.16; pero, con 50 variables empricas, desciende ligeramente a > ,202. Para el
factor dcimo* con 20 variables, el coeficiente mnimo necesario aumenta a >
,261; y con 50 variables desciende a > ,214.

Capitulo 5: Anlisis factorial

491

En resumen, los incrementos en el tamao de la muestra y en el nmero de va


riables empricas repercuten, directamente, en un ligero descenso en la cuanta del .
coeficiente factorial para que se juzgue significativo. Por el contrario, el au
mento del nmero de factores supone un incremento en la magnitud de los coefi
cientes en los ltimos factores para que puedan considerarse significativos. Slo
se valora la cuanta del coeficiente para conocer el grado de relacin de la variable
emprica con la dimensin latente. Los signos se interpretan como en cualquier co-;
eficiente de correlacin. Indican la direccin de la relacin entre el indicador y la
dimensin latente. El signo p ositivo expresa que la relacin es positiva: ambas
variables, la observada y la latente, avanzan en la misma direccin; el aumento o dis
minucin del valor de una de ellas provoca el aumento o disminucin de la otra. El
signo negativo expresa, en cambio, que la relacin es negativa: al aumento de una
variable le sigue una disminucin en el valor de la otra, en la cuanta expresa en el
coeficiente, y, a la inversa, la disminucin de una de ellas supone el aumento de la
otra.
Es habitual que una misma dimensin latente incluya coeficientes factoriales po
sitivos en unas variables y negativos en otras. Cuando esto sucede, se dice que el fac
tor o componente es bipolar.
Una vez decidida la cuanta mnima para que el coeficiente factorial sea signifi
cativo, se procede a la lectura comparativa de los coeficientes factoriales de cada va
riable en cada factor. Para cada variable se destaca (subrayndolo, rodendolo con un
crculo, poniendo un asterisco, o como se quiera) el coeficiente de mayor magnitud en
valor absoluto. Si alguna de las variables empricas no presenta ningn coeficiente l'actorial que sea significativo, puede considerarse su eliminacin del modelo factorial.
Esta decisin suele adoptarse cuando la variable presenta, adems, una baja com u
nalidad o se considera irrelevante para los objetivos de investigacin (Tabachnick y Fdell, 1989). El adoptar esta decisin conlleva la repeticin de los anlisis, excluyendo
las variables eliminadas. Salvo que el investigador decida, deliberadamente, interpretar
la matriz factorial original (que incluye variables con coeficientes factoriales no sig
nificativos), sin introducir ninguna modificacin; es decir, ignorando aquellas variables
con coeficientes factoriales no significativos.
Para facilitar la interpretacin de los factores se puede proceder, en tercer lugar,
a agrupar las variables empricas con coeficientes factoriales elevados para cada fac
tor. El significado sustantivo de un factor lo dan las variables con mayor coefi
ciente factorial. Se debe buscar qu significado comn comparten estas variables
para, posteriormente, asignar un nombre o etiqueta al factor. La etiqueta ha de reflejar
el significado comn de las variables que ponderan en el factor. Obviamente, las va
riables con mayor coeficiente factorial sern las que ms influyan en el nombre del
factor.
sta es la fase del anlisis factorial de mayor subjetivismo. El investigador es li
bre de asignar el nombre que quiera al componente o factor. La nica condicin que
se impone es que la etiqueta elegida refleje y sintetice el contenido comn de las va
riables que ponderen en dicha dimensin latente.

492

Anlisis multivariable. Teora y prctica en la investigacin social

DE INTERPRETACION DE DISTINTOS MODELOS. AFC

Expuestos los modelos ACP, queda describir las soluciones de factor comn (AFC). Pa
ra abreviar la exposicin, sio se interpreta e! modelo final obtenido tras aplicar e procedi
miento de rotacin de los ejes factoriales ms popular: varimax. La tabla A corresponde a la
matriz de factores rotados para el mtodo de e/e o factor principal. ste es el mtodo de ex
traccin factorial de mayor aplicacin en AFC, junto a! de mxima verosimilitud (Kim y
Muelier, 1978b; Diilon y Godstein, 1984; Afifi y Clark, 1990). Como su realizacin ha sido pos
terior a ACP, se ha seguido el mismo criterio de extractar 4 dimensiones latentes (ahora lla
madas factores comunes) que expliquen las correlaciones de una serie de variables ob
servadas. Como se dijo en e! subapartado 5.2.2, en AFC se diferencia entre varianza
comn y especfica, de modo que cada variable observada queda definida por ia conjuncin
de factores comunes y "nicos". Tambin se busca un modelo sencillo e interpretable. Lo
que ileva a la rotacin para que cada variable se relacione con el menor nmero de factores
posible.
Tabla A. Matriz efe factores rotados3

Factor

entrada inmigrante
ieyes inmigracin
regularizar inmigrante
n. inmigrantes
inmigrante delincuente
partido racista
casar con marroqu
vecino marroqu
simpata marroqu
estudios
ingresos
edad
sexo
ideologa poltica

,593
-,541
-,523
,497
,451
,266
,214
,223
-,385
-,244
-,232
,107
8,615E-02
,162

,196
-,143
-,192
,136
,180
,238
,794
,656
-,479
4.14E-02
4,845E-02
,123
1.068E-03
8.049E-02

-1,61 E-02
7.588E-02
2.934E-02
-1 8 2
-.127
-5.80E-02
-5,12E-02
-2,51 E-02
2,121 E-02
,741
,565
-,536
,161
-2,83E-02

5,744E-02

116

-1,31 E-02
7.120E-02
,136
,156
8.784E-02
4.879E-02
3,54E-02
1,698E-02
,155
,143
-3,01 E-02
,549

Mtodo de extraccin: Factorizacin del eje principal.


Mtodo de rotacin: Normalizacin varimax con Kaiser.
a La rotacin ha convergido en 6 iteraciones.

En la rotacin se ha aplicado, igualmente, el criterio de normalizacin de Kaiser y han


convergido 6 iteraciones. Si se compara esta solucin con la obtenida mediante ACP con
ia rotacin varimax {subapartado 5.6.1), puede observarse que ia composicin de los fac
tores es similar a la de ios componentes con dos excepciones evidentes: una, la variable
"sexo, que no presenta ningn coeficiente factora! significativo en alguno de los cuatro fac

Captulo 5: A nlisis factorial

493

tores (el coeficiente ms elevado es ,161 y corresponde al factor 3); y dos, la variabie par
tido racista, con coeficientes algo ms elevados, pero tambin inferiores al referente ha
bitual ( ,30).
En busca de una explicacin, se analizan las comunalidades (expuestas en el sub
apartado 5.4,3). En AFC, las comunalidades iniciales difieren de 1,0, al analizarse slo la
varianza comn de cada variable y no la total como en ACP. Sus estimaciones de las co
munalidades iniciales son, en cada variable, R2 mltiple que resulta de regresionar el resto
de las variables con la considerada. En la susodicha tabla puede comprobarse que la variable
casar con marroqu es, de as 14 consideradas, la que mayor proporcin de su varianza lo
gra ser explicada por la combinacin de las 13 variables restantes (,429 = 42,9% de su va
rianza), Le sigue la variable vecino marroqu" (,368) y estudios (,351). Por el contrario, Sas
variables ideologa poltica (,08422) y sexo" (,033) apenas tienen varianza compartida con
las dems variables. Et conocimiento del valor de las otras variables no ayuda a su predic
cin. Recurdese que en el anlisis de conglomerados (captulo 3) la variable ideologa po
ltica fue la ltima en unirse a la agrupacin de las variables en conglomerados; la variable
sexo, la penltima.
Como las comunalidades iniciales se distancian de 1,00, se prev que ia solucin de fac
torizacin de ejes principales difiera de a obtenida con ACP.
Tras ia extraccin factorial se vuelven a estimar las comunalidades considerando
ahora los coeficientes factoriales. Las nuevas estimaciones de ias comunalidades reempiazan
a las antiguas y prosigue ei proceso iterativo de estimacin de ios factores comunes. ste con
cluye cuando apenas cambian ias estimaciones de comunalidad.
Como se prevea, tras la extraccin factorial, las comunalidades finales tambin difieren
de las obtenidas en ACP. Los resultados confirman la tendencia habitual a conseguir co
munalidades en general inferiores en la factorizacin de ejes principales respecto a ACP. La
razn est en que slo se factoriza la varianza comn.
Tras la extraccin factorial las comunalidades indican la proporcin de la varianza de las
variabies que puede ser explicada por los factores comunes. El valor 1,00 expresa que toda
la varianza de ia variable logra ser explicada por los factores comunes; el valor ,00, que su
variabilidad no se consigue explicar. La varianza no explicada por los factores comunes se
atribuye ai componente "nico o varianza especfica" de la variable.
La nula comunalidad de la variable "sexo (vase la tabla B del ejemplo del subaparta
do 5.4.3) lleva a considerar la necesidad de eliminarla de los anlisis y volver a estimar el mo
delo factorial, en busca de su mejora. Mxime cuando dicha variable no presenta ningn coe
ficiente factorial significativo en alguno de los factores comunes. Adems, su relevancia para
los objetivos del estudio es escasa.
Tambin puede considerarse la eliminacin de la variable partido racista, con coeficientes
algo superiores, pero igualmente no significativos. Asimismo, su comunalidad tras la "ex
traccin es baja: slo el 15,5% de su varianza queda explicada por los cuatro factores co
munes. Pese a ello, su eliminacin no es tan evidente, a diferencia de ia variable "sexo, al
haber quedado muy definida en un factor: el factor 4, con un coeficiente factorial de ,549 (ta
bla A), que supone el 30,1% (,5492) de su variabilidad. En general, se recomienda valorar la
eliminacin de las variables cuya comunalidad sea inferior a ,50 porque su variabilidad no que
da suficientemente explicada por el modelo factorial. Si su valor es inferior a ,30, la eliminacin
de la variable se convierte en imperiosa.
La tabla B ofrece los datos de varianza total explicada por la factorizacin de ejes prin
cipales. El porcentaje de varianza total explicada por la conjuncin de los cuatro factores co-

494

Anlisis multivariabis. Teora y prctica en la investigacin social

mues (35,937%) es bastante inferior al obtenido en ACP (52,951%). Comprense los por
centajes de varianza de las dos mtodos factoriales.

Tabla B. Varianza tolaI explicada


Sumas de las saturaciones
a i cuadrado de la extraccin

Autovaiores iniciales

Suma de las saturaciones


el cuadrado de la rotacin

Factor

1
2
3
4
5
6
7
8
9
10

11
12

13
14

Total

% dla
varianza

%
acumulado

Total

% d e la
varianza

%
acumulado

Total

3,619
1,665
1,114
1,015
,950
,868
,752
,736
,673
,600
,574
,SS9
,470
,404

25,849
11,891
7,958
7,253
6,786
6,195
5,372
5,259
4,80S
4,283
4,103
3,994
3,361
2,887

25,849
37,740
45,698
52,951
59,737
65,936
71,308
76,567
81,373
86,656
89,758
93,752
97,113
100,000

3,022
1,137
,541
,331

21,588
8,122
3,864
2,363

21,588
29,709
33,574
35,937

1,842
1,520
1,247
,423

% d e ta
%
varianza acumulado

13,154
10,854
8,904
3,024

13,154
24,003
32,912
35,937

Mtodo de extraccin: Factorizacin <e ejes principales.

La aplicacin del mtodo de mxima verosimilitud logra elevar hasta 40,376 el por
centaje de varianza total explicada (tabla C) con una composicin similar en sus factores
(tabla D). Como en ACP, la proporcin de varianza explicada en cada factor se obtiene de
la suma de ias saturaciones al cuadrado de todas las variables. De nuevo, las correlaciones
son ponderadas por ei inverso de ta varianza nica de as variables mediante un proceso
iterativo.

Tabla C. Varianza total explicada


Sumas de tas saturaciones
a.1cuadrado de la extraccin

Suma de las saturaciones


el cuadrado de la rotacin

Factor

2
3
4

Total

% de la
varianza

%
acumulado

Total

% d e la
varianza

%
acumulado

1,203
2,735
1,131
,584

8,592
19,532
8,081
4,171

8,592
28,124
36,205
40,376

1,876
1,502
1,263
1,005

13,400
10,73t
9,065
7,181

24,131
33,196
40,376

Mtodo {fe exiraccin: Mxima verosimiliiud.

13,400

Captulo 5: Anlisis factorial

495

Tabla D. Matriz de factores rotados 3


Factor

1
entrada inmigrante
leyes inmigracin
regularizar inmigrante
n. inmigrantes
inmigrante delincuente
partido racista
casar con marroqu
vecino marroqu
simpata marroqu
estudios
ingresos
edad
sexo
ideologa poltica

,599
-.547
-.526
,495
,456
,283
,225
,239
,390

,231
-.214
,114
9.529E-02
,166

2
,186
-,141
-.179
,132
,186
,227
,809
,638
,474
2,68E-02
6.269E-02
,125
- 1 ,80E-02
7,487E-02

2.24E-02
8.037E-02
4.674E-02
-,186
-.131
-6,55 E-02
-5,68E-02
-3.23E-02
3.749E-02
,769
,550
-,529
,153
3,76E~02

2.245E-02
-7.79E-02
-8.40E-03
4.206E-02
5,530 E-02
,105
4,767E-02
2.895E-02
-1.39E-02
1,792E-02
9,Q00E"02
7.109E-02
-4,00E-02
,982

Mtodo de extraccin: Mxima verosimilitud.


Mtodo de rotacin: Normalizacin varimax con Kaiser.
aLa rotacin ha convergido en 6 iteraciones.

Para abreviar la exposicin de los resultados slo se informa de ias matrices factoriales
rotadas de los cuatro mtodos de factorizacin restantes: mnimos cuadrados generalizados
(tabla E), mnimos cuadrados no ponderados (tabla F), factorizacin alfa (tabla G) e imagen
(tabla H). Comprense los cuatro modelos factoriales y calclense las comunalidades y el por
centaje de la varianza total explicada por cada factor. Excepto en la factorizacin alfa, que se
distingue porque ni las comunalidades ni los autovalores son exactamente !a suma de los coe
ficientes factoriales al cuadrado. En cambio, la factorizacin imagen se diferencia porque as
comunalidades no varan, al no ser iterativamente reestimadas.
El considerar que se analiza a a poblacin de individuos y/o variables tambin afecta
a que en la factorizacin alfa no se realicen pruebas de significacin, a diferencia de m
xima verosimilitud y mnimos cuadrados generalizados. Asimismo, a diferencia del mto
do de mxima verosimilitud, en la factorizacin alfa es frecuente que las variables con me
nor comunalidad obtengan coeficientes factoriales ms elevados que mediante otros
mtodos factoriales como mxima verosimilitud. Para comprobar dichas afirmaciones se
proporcionan las comunalidades (tabla I) y la varianza total explicada (tabla J) mediante la
factorizacin alfa.
Como muestra de la similitud de la agrupacin de variables, comprense los grficos de
saturaciones en el espado rotado de ACP (figura A) y AFC de ejes principales (figura B). En
ambos grficos las coordenadas se corresponden con los pesos o coeficientes factoriales de
la solucin obtenida tras la rotacin varimax. Estos grficos 3-D son la ilustracin usual cuan
do son tres o ms ios componentes o factores extrados. En nuestro caso son cuatro. El gr
fico incluye los coeficientes de os tres primeros componentes (ACP) o factores comunes
(AFC). La disposicin de las variables en el espacio rotado es muy similar y son varias las va-

496

Anlisis rnultivariable. Teora y prctica en a investigacin social

Tabla E. Matriz de factores rotados3


Factor

entrada inmigrante
leyes inmigracin
regularizar inmigrante
n. inmigrantes
inmigrante delincuente
partido racista
casar con marroqu
vecino marroqu
simpata marroqu
estudios
ingresos
edad
sexo
ideologa poltica

,606
-,543
-,521
,489
,450
,278
,214
,230
-,382
-,188
-,184
8,118E-2
,105
,156

,189
-,146
-,185
,138
,191
,231
,813
,644
--,479
-4,16E-02
5,301 E-02
,136
1,96E-02
7,628E-02

-4,81 E-02
,106
7.158E-02
-,211
-,151
7,36E-02
5,46E"02
-3.40E-02
5.037E-02
,776
,570
-,536
,149
- 1 .99E-02

2.677E-02
-8.43E-02
-1,42E-02
S,017E-02
6.206E-02
,109
5.119E-02
3.194E-02
-1.83E-02
-3.73E-03
7,419E-02
8.569E-02
-4,31 E-02
,984

Mtodo de extraccin: Mnimos cuadrados generalizados.


Mtodo de rotacin: Normalizacin varimax con Kaiser.
8 La rotacin ha convergida en 6 iteraciones.

Tabla F. Matriz de factores rotadosa


Factor

entrada inmigrante
leyes inmigracin
regularizar inmigrante
n. inmigrantes
inmigrante delincuente
partido racista
casar con marroqu
vecino marroqu
simpata marroqu
estudios
ingresos
edad
sexo
ideologa poltica

,599
-,545
-,523
,499
,461
,275
,224
,233
-,392
-2 3 5
-,214
,119
8.913E-02
,164

,189
-.142
-,183
,134
,183
,242
,600
,649
,473
-3,77E-02
5.666E-02
,128
-2,81 E-03
8.005E-02

-1.98E-G2
8,011 E-02
3,555E-02
-,186
-1 2 8
-5.88E-02
-5,16E-02
2.58E-02
2,453E-02
,762
,556
-,521
,161
3.80E-02

2.553E-02
-7,41 E-02
-6.86E-03
4,159 E-02
6,135E~02
,100
4.556E-02
2,636E-02
-1.32E-02
1.940E-02
8,935E-02
7,101 E-02
-3.39E-02
,982

Mtodo de extraccin: Mnimos cuadrados no ponderados.


Mtodo de rotacin: Normalizacin varim ax con Kaiser.
a La rotacin ha convergido en 6 iteraciones.

Captulo 5: Anlisis factorial

Tabla G. Matriz de factores rotados3


Factor

entrada inmigrante
leyes Inmigracin
regularizar inmigrante
inmigrante delincuente
n. inmigrantes
partido racista
casar con maroqu
vecino marroqu
simpata marroqu
estudios
ingresos
edad
sexo
ideologa poltica

,594
-,529
-,509
,507
,455
,279
,205
,248
-,420
,237
-,158
,140
,109
,165

,191
-,123
-,185
,143
,144
,239
,804
,665
-,449
-4.30E-02
3.336E-02
,105
-4.05E-03
8.517E-02

-4.53E-02
,104
5.29E-02
-.111
-,243
-4,95 E-02
9,45E-02
- 1 .64E-02
1.503E-02
,718
,646
-,457
,174
-3.47E-02

5,082E"02
~7,98E-02
-1.75E-02
5,830-02
9.117E-02
,116
8.424E-02
3.016E-02
-3,25E-03
2.256E-02
8,312E-02
7.188E-02
-5.42E-02
,740

Mtodo de extraccin: Factorizacin alfa.


Mtodo de rotacin: Normalizacin varimax con Kaiser.
0 La rotacin ha convergido, en 5 iteraciones.

Tabla H. Matriz de factores rotadoss


Factor

casar con marroqu


vecino marroqu
simpata marroqu
partido racista
entrada inmigrante
leyes inmigracin
n. inmigrantes
regularizar inmigrante
inmigrante delincuente
ideologa poltica
estudios
ingresos
edad
sexo

,574
,539
-4 5 7
,261
,281
-,236
,216
-,260
,244
,145
-8.65E-02
-2.29E-03
,128
1.336E-02

,219
,189
-,292
,217
,419
-,403
,380
,378
,354
,167
-,218
-,180
,132
5.488E-02

-4.17E-02
-2,81 E-02
4,519E-02
-6,15 E-02
-7.18E-02
,107
-184
7,323E-02
-,135
2,00E~02
,495
,436
-.400
,123

3,064E-02
2,008E~02
-6,41 E-03
6.135E-02
1.793E-02
-2.25E-02
1.144E-02
1.530E-03
5.058E-02
,120
-2,00E-03
4,238E-02
5.239E-02
-6,06E-03

Mtodo de extraccin: Factorizacin imagen.


Mtodo de rotacin: Normalizacin varimax con Kaiser.
3 La rotacin ha convergido en 8 iteraciones.

497

498

Anlisis multivariable. Teora y prctica en la investigacin social

Tabla I. Comunalidades
Extraccin

simpata marroqu
leyes inmigracin
ideologia poltica
sexo
edad
n inmigrantes
regularizar inmigrante
entrada inmigrante
partido racista
casar con marroqu
estudios
ingresos
vecino marroqu
inmigrante delincuente

,378
,313
,583
4.497E-Q2
,244
,295
,296
,394
,151
,704
,575
,451
,505
,294

Mtodo de extraccin: Factorizacin alfa.

Tabla J. Varianza total explicada


Suma de las saturaciones
al cuadrado de ia extraccin

Suma de las saturaciones


a l cuadrado de la rotacin

Factor

1
2
3
4

Total

% da la
varianza

%
acumulado

Total

% dla
varianza

%
acumulado

3,006
1,030
,631
,559

21,473
7,357
4,510
3,991

21,473
28,830
33,340
37,331

1,854
1,495
1,273
,605

13,241
10,679
9,090
4,321

13,241
23,920
33,010
37,331

Mtodo de extraccin: Factorizacin alia.

riables que convergen en un mismo punto. Su disposicin por encima o por debajo del pun
to 0,0 depende de ia correlacin de la variable con el componente o factor: positiva (por en
cima) o negativa (por debajo). El ideal es que las variables se agrupen a! fina! de los ejes o
en su interseccin. Ello significa que se ha alcanzado la finalidad perseguida con la rotacin:
la obtencin de una estructura simple. Pero, una interpretacin grfica ms detallada exi
ge grficos de cada dos componentes o factores por separado, como el incluido en el
ejemplo del subapartado 5.8.1. Aunque con dichos grficos se pierde a visin de conjunto,
la representacin a modo de sntesis del modelo. Por esta razn, se ha optado por los gr
ficos 3-D.

Captulo 5: Anlisis factorial

499

Factor 2

Factor 1

"

Factor 3

Figura B. Grfico de saturaciones factorial rotado.

5.7. La evaluacin del modelo factorial


En la evaluacin del modelo factorial no slo interviene la significatividad esta
dstica, a semejanza de las dems variedades analticas. Tambin se valora la signi
ficatividad sustantiva. Esta ltima es genrica a todo modelo factorial. Hace referencia
a la obtencin de un modelo estadstico que tenga significado sustantivo. Esto

500

Anlisis rnultivariable. Teora y prctica en la investigacin social

quiere decir que el modelo sea interpretable desde alguna perspectiva terica; que ten
ga sentido lgico. En cambio, la significatividad estadstica del modelo se valora en
unos modelos factoriales concretos: de mxima verosimilitud y de mnimos cuadrados
generalizados.

Como se dijo en el subapartado 5.5.2, a aplicacin del contraste chi-cuadradQ exi


ge el cumplimiento del supuesto de normalidad rnultivariable. Adems, su valor se ve
muy afectado por el tamao muestral, A medida que aumenta el tamao de la mues
tra, se incrementa la probabilidad de que el contraste de hiptesis medante x2 resul
te significativo. La no significatividad estadstica, a un nivel de significacin su
ficientemente bajo (<, 05, al menos), lleva a replantear todo el modelo analtico, a su
modificacin y posterior repeticin de los anlisis. Puede, por ejemplo, que la no
significatividad se deba a la no consideracin de un factor relevante, lo que puede
provocar que se decida aadir un nuevo factor al modelo factorial. Esto revierte ne
gativamente en una prdida de parsimonia.
El efecto negativo del contrate x2en tamaos mustrales elevados incide en su des
consideracin como criterio principal en la evaluacin del modelo factorial. En la ma
yora de las situaciones la comprobacin de la adecuacin del modelo factorial, a los
datos empricos, se restringe al contraste de las diferencias entre las correlaciones ob
servadas en la muestra con las estimadas a partir del modelo factorial obtenido. Estas
diferencias de correlaciones (observadas y estimadas) son los residuos, Su magnitud se
utiliza para afirmar o negar la adecuacin del modelo. El modelo factorial se considera
vlido cuando los residuos son pequeos, porque significa que el ajuste del modelo a
los datos es bueno. Por el contrario, residuos > ,05 indican que el modelo factorial derivado
no refleja la variabilidad de los datos observados, ante lo cual habra que proceder a
su reconsideracin.
La mayora de los programas estadsticos proporciona informacin de los residuos
en la matriz de correlacin residual, sta se obtiene de la diferencia entre as matrices
de correlacin observada y la reproducida, desde los factores extractados, como se ilus
tr en el segundo ejemplo del apartado 5.6. Lo que el investigador debe decidir es a
partir de qu valor el residuo es grande o pequeo. El valor adoptado con mayor
frecuencia como referente es 0,05: El residuo se considera pequeo, cuando su cuan
ta es inferior a dicha cantidad. Asimismo, se deja a juicio del investigador la concre
cin del porcentaje mximo de residuos elevados que llevan a la aceptacin o, en su
caso, rechazo del modelo factorial.
Por ltimo, aadir que en la variedad factorial llamada anlisis factorial booleano el ajuste del modelo se mide, igualmente, comparando las respuestas binarias o b
servadas con las estimadas. El nmero total de discrepancias se obtiene de la suma de
las diferencias de cada puntuacin original
respecto de sus correspondientes valores
estimados X . (Bisquerra, 1989: 344):

Captulo 5: Anlisis factorial

501

5.8. Lsss puntuaciones factoriales

El anlisis factorial no siempre concluye con la interpretacin del modelo analtico


y la asignacin posterior de etiquetas a las dimensiones latentes, puede proseguir con
el clculo de las puntuaciones factoriales. Esto acontece, por ejemplo, cuando se quiere,
a partir de los resultados factoriales, aplicar otras tcnicas analticas multivariables (como regresin mltiple, el anlisis discriminante o el de conglomerados). En ellas las
puntuaciones factoriales actuarn corno variabies, en representacin de los valores de los
factores o componentes. Pero, qu se entiende por puntuaciones factoriales?
Las puntuaciones factoriales pueden definirse como medidas compuestas de cada
factor comn o componente principal. Informan de la posicin de cada caso concreto
(variables, individuos, pases, municipios, universidades...) en cada factor o componente.:
Hay tantas puntuaciones como factores para cada caso.
En la matriz factorial (preferiblemente la rotada) puede extraerse, de cada factor,
una variable que lo represente en anlisis estadsticos posteriores. Esta variable tpi
ca suele coincidir con la que presenta el mayor coeficiente factorial en dicho factor. Jolliffe (1986) propone que sea aquella de mayor coeficiente factorial entre las que pre
sentan un valor A > ,70. Cuando existen dos o ms variables que comparten un
mismo coeficiente elevado, la eleccin de la variable tpica depende, adems, del sig
nificado sustantivo de las variables. La variable elegida suele coincidir con aquella que
mejor representa, desde la vertiente lgico-sustantiva, la dimensin latente identificada.
AI investigador tambin se le ofrece otra posibilidad: el clculo de variables su
cedneas. Especialmente, cuando es difcil la eleccin de una nica variable en re
presentacin del factor. En la obtencin de variables sucedneas participan todas las
variables con coeficientes factoriales elevados en el mismo factor. De ellas se calcula su
total o promedio como representacin del factor. Aunque, como advierten Hair et al.
(1992; 1999), la obtencin de variables sucedneas (surrogate variate) nicamente es
posible cuando se realiza una rotacin ortogonal. sta garantiza que los factores
sean ortogonales; es decir, incorrelacionados entre s. Lo que concuerda con la fi
nalidad principal perseguida con la realizacin de un anlisis factorial previo a la eje
cucin de otras tcnicas analticas multivariables (de dependencia o de interdepen
dencia). Por ejemplo, el buen desarrollo de un anlisis de regresin mltiple exige, como
se vio en el captulo 1, ausencia de multicolineaUdad entre las variables predictoras. Si,
en vez de emplear la serie amplia de variables originales, el investigador decide re
emplazarlas por un nmero inferior de variables compuestas, obtenidas del modelo fac
torial, estas nuevas variables no debern, asimismo, estar correlacionadas entre ellas.
Por esta razn se demanda que los ejes factoriales se roten ortogonalmente.
Si, por el contrario, se desea que, en representacin de cada dimensin latente, in
tervengan todas las variables que ponderan en ella con un coeficiente factorial signi
ficativo, se tendr que proceder al clculo de las puntuaciones factoriales.
Una manera sencilla de obtener puntuaciones factoriales consiste en sumar los pro
ductos de cada coeficiente factorial que satura en el factor por el valor de la variable
en cada caso. Al estar las variables estandarizadas (Z), se evita que aquellas de mayor

502

A nlisis multivariable. Teora y prctica en la investigacin social

heterogeneidad contribuyan ms en el clculo de las puntuaciones factoriales. As, en


el ejemplo ilustrado en el apartado 5.6 de un modelo factorial de dos factores y cinco
variables empricas, las puntuaciones factoriales, a partir de la matriz factorial rotada
son, para cada caso, la suma de los productos del coeficiente por el valor estandarizado
de a variable que satura significativamente en el factor: factor 1 - 0,980 Z2 + 0,659 X,
+ 0,709 Z4; factor 2 = 0,902 Z x + 0,834 Z y Este clculo de las puntuaciones factoriales
se considera selectivo porque nicamente incluye las variables que definen al factor,
al saturar significativamente en l. Las puntuaciones indican la ubicacin espacial de
cada unidad de anlisis (caso o variable) en cada factor. Permiten conocer su dispo
sicin, si coincide o se distancia de la generalidad de las unidades analizadas.
En el anlisis factorial booleano cada caso tiene la puntuacin factorial de 1, si pre
senta una saturacin distinta de cero en cualquiera de las variables en el factor. En ca
so contrario, su puntuacin ser 0.
La mayora de los programas estadsticos convencionales ofrece otras opciones pa
ra calcular puntuaciones factoriales'. La opcin ms habitual es el llamado procedi
miento de regresin. Supone el clculo de una serie de ecuaciones de regresin
mltiple; una por cada dimensin latente. En cada ecuacin, los factores o componentes
actan como la variable dependiente y los indicadores o variables empricas como las
independientes. De ia intercorrelacin de cada variable con su correspondiente coe
ficiente factorial (preferiblemente rotado) resulta una serie de coeficientes de re
gresin parciales. En el anlisis factorial, estos coeficientes se denominan coeficientes
de puntuaciones factoriales. Su interpretacin es anloga a los coeficientes de regresin
parcial estandarizados. Recurdese que las variables se prefieren estandarizadas.

K =
Donde: Z es el valor estandarizado de la variable i en el caso j.
Wk es el coefic. de la puntuacin factorial para el factor K y la variable i.
Estos coeficientes de puntuaciones factoriales para cada variable en cada factor se ex-
traen de la m atriz de coeficientes de puntuaciones factoriales. Cada uno de ellos se l!
multiplica por el valor estandarizado de la variable en el factor. Se suman ios productos
y se obtiene la puntuacin factorial para cada caso.
Como las variables estn estandarizadas, la puntuacin media para cada dimensin
latente es igual a 0. Por esta razn, las puntuaciones negativas (las inferiores a 0) se in
terpretan como puntuaciones bajas, situadas por debajo de la media.
Adems del procedimiento de regresin, suelen ofertarse otros dos mtodos alter
nativos para calcular puntuaciones factoriales, aunque de uso ms restringido. Se trata del:
a) M todo de Anderson-Rubin. Se caracteriza por proporcionar puntuaciones

factoriales no correlacionadas, aunque los factores originales estn correla


cionados, lo cual no siempre sucede con el procedimiento de regresin. De es-

Captulo 5: Anlisis factorial

503

te ltimo puede resultar la obtencin de puntuaciones factoriales correlacio


nadas, aunque ios factores sean ortogonales. sta es una de las razones que ha
cen que esta opcin sea deseable, cuando se busca la obtencin de puntuacio
nes factoriales no correlacionadas.
b) Mtodo Barlett. Aplica el procedimiento de mxima verosimilitud, que exige que
los factores se ajusten a una distribucin normal.
En ACP, con cualquiera de los tres procedimientos mencionados, se obtienen las mis
mas puntuaciones factoriales.. Puntuaciones que no se consideran estimadas, sino
exactas. En AFC, por el contrario, no es posible ninguna solucin exacta para los fac
tores. En todo caso se est ante estimaciones (Dillon y Goldstein, 1984; Nourisis, 1994).

- ^ E j e m p l o d e :p u n t u a c io n e s f a c t o r ia l e s

---------------- --------------------------

Para !a obtencin de ias puntuaciones factoriales se ha utilizado el procedimiento ms


usuai y aplicado por defecto en ei programa SPSS: e! procedimiento de regresin. En l, los
factores o componentes actan como variable dependiente (en cada ecuacin iineai) y las va
riables observadas como ias independientes. Las tablas A y B corresponden a las matrices
de los coeficientes por los que se multiplican, en cada caso, los valores de ias variables (es
tandarizadas) para el clculo de las puntuaciones en ACP (tabla A) y AFC (tabla B). La op
cin elegida de AFC es ejes principales por ser el mtodo ms popular.
Tabla A. Matriz de coeficientes para el clculo de las puntuaciones en las componentes
Componente

simpata marroqu
leyes inmigracin
ideologia poltica
sexo
edad
n. inmigrantes
regularizar inmigrante
entrada inmigrante
partido racista
casar con marroqu
estudios
ingresos
vecino marroqu
inmigrante delincuente

- r027
-,330
,114
,279
,108
,263
-.290
,312
,043
-,136
,000
-,024
-1 4 7
,262

-.315
,115
-,137
-,087
,059
-,095
,027
-,041
,115
,476
,036
,086
,484
-.061

-,025
-,039
,133
,202
37 8
-,060
-,051
,067
,034
,000
,435
,424
,005
-,003

Mtodo de extraccin: Anlisis de componentes principales.


Mtodo de rotacin: Normalizacin varimax con Kaiser.
Puntuaciones de componentes.

4
,117
-,030
,778
-,476
,115
,031
,109
-,043
,237
,003
,046
,158
-,053
,017

504

Anlisis multivariable. Teora y prctica en la investigacin social

Tabla A. Matriz de coeficientes para el clculo de las puntuaciones factoriales


Factor

simpata marroqu
leyes inmigracin
ideologa poltica
sexo
edad
n. inmigrantes
regularizar inmigrante
entrada inmigrante
partido racista
casar cor marroqu
estudios
ingresos
vecino marroqu
inmigrante delincuente

-,116
-,236
,011
,048
-,062
,197
-,228
,300
,053
-1 3 0
-.023
-,070
-,024
,161

-,128
,057
-,040
-.001
,026
-,042
,022
-.044
,035
,611
,028
,050
,296
-,025

-0 4 8
-,038
-,008
,064
-.240
-0 1 7
-0,65
,082
,007
-,020
,541
,259
,014
,000

4
,046
-,047
,510
-,029
,135
,014
,052
-,020
,085
,005
,040
,171
-,032
,067

Mtodo de extf acin: Factorizacin del eje principal.


Mtodo de rotacin: Normalizacin vrimax con Kaiser.

5.8.1. Su contribucin en la deteccin de atpicos

Las puntuaciones factoriales cumplen otras funciones en el anlisis factorial. Des


taca su utilidad en la deteccin de atpicos, en a bsqueda de conglomerados y, en ge
neral, para comprender la estructura de los datos.
Los atpicos se identifican con variables de escasa correlacin mltiple cuadrada con
las dems variables y que presentan, asimismo, coeficientes factoriales prximos a ce
ro en todos los factores. Los grficos de puntuaciones factoriales para cada par de fac
tores ayudan a a deteccin de estos atpicos. En dichos grficos, las puntuaciones factoriales
se sitan en los ejes y los puntos representan los casos concretos. Los atpicos coinci
den con los puntos que se ubican en los extremos del grfico, como ilustra el ejemplo
a continuacin.
Como las puntuaciones factoriales se hallan estandarizadas, se considera atpico to
do aquel que supere el valor 2,0, indistintamente de su signo (positivo o negativo). El
valor de referencia puede incluso elevarse a 2,5 o 3,0, depende del tamao de la
muestra. Cuando el signo es positivo, significa que el caso se sita a ms de dos uni
dades de desviacin tpica por encima de la media. Si es negativo, que est a ms de dos
unidades de desviacin tpica por debajo de la media.
Cuando la rotacin de los ejes factoriales ha sido ortogonal, la nube de puntos
suele adoptar una forma circular. Dicha forma se convierte en elipse, si la rotacin es
oblicua.

Captulo 5: Anlisis factorial.

505

La deteccin concreta de los atpicos puede adems realizarse mediante el listado


de los casos extremos, con puntuaciones factoriales superiores a 2,0, e incluso mayor,
a-semejanza de otros procedimientos analticos.

E j e m p l o d e d e t e c c i n d e a t p ic o s m e d a n t e
LOS GRFICOS DE PUNTUACIONES FACTORIALES

Para ilustrar ei uso de los grficos de puntuaciones factoriales en ia identificacin de at


picos, se han seleccionado los grficos para los factores obtenidos mediante ACP. Se incluyen
dos grficos que ilustran dos formas distintas. El grfico para el par integrado por los com
ponentes 3 y 4 (figura B) se ajusta a la forma habitual de una nube de puntos circular. Por el
contraro, e grfico de las puntuaciones para los componentes 1 y 2 (figura A) presenta una
nube de puntos ms elptica. En ambos grficos, todo punto por encima del referente usual
de 2,0 se considera un posible atpico. Por encima de 3,0, el atpico es ms evidente.

REGR factor score

1 for analysis 1

Figura A. Grfico de puntuaciones factoriales.

REGR factor score 3 for analysis 1

Figura B. Grlco de puntuaciones factoriales.

LECTURAS COMPLEMENTARIAS
Batista Foguet, X M, (1984). Componentes principales y anlisis factorial (exploratorio
y confirmatorio), en Snchez Carrion, J. X (ed,): Introduccin a las tcnicas de an
lisis multivariable aplicadas a las ciencias sociales, Madrid, CIS (Centro de Inves
tigaciones Sociolgicas): 23-74.
Calvo Gmez, E (1992). Anlisis factorial y las puntuaciones factoriales calculadas por
el mtodo selectivo, Estudios de D eusto , 40 (1): 71-95.

506

Anlisis multivariable. Teora y prctica en la investigacin social

Comrey, A. L. (1985). Manual de anlisis factorial, Madrid, Ctedra.


Dunteman, G. H. (1989). Principal components analysis, Newbury Park, California, Sage.
Fernndez Santana, J. O. (1988). Comprensin y manejo del anlisis factorial, Revista
Internacional de Sociologa , 46 (1): 7-35.
Gorsuch, R. L, (1983). Factor analysis, Hillsdale, N. J., Erlbaum,
Gorsuch, R. L. (1990). Common factor analysis versus component analysis: some well
and little known facts, Multivariate Behavioral Research, 25: 33-39.
Jolliffe, I. T. (1986). Principal com ponent analysis, Nueva York, Springer-Verlag.
Kim, J. y Mueller, Ch.W. (1978). Factor analysis: statistical methods and practical issues,
Beverly Hills, Sage
Velicer, W. E y Jackson, D. N. (1990). Component analysis versus common factor
analysis: some issues on selecting an appropiate procedure, Multivariate Behavioral
Research, 25: 1-28.
Yela, M. (1997). La tcnica del anlisis factorial. Un m todo de investigacin en p si
cologa y pedagoga, Madrid, Biblioteca Nueva.

EJERCICIOS PROPUESTOS
1. En la misma muestra se vuelve a realizar un anlisis de componentes principales
excluyendo la variable ideologa poltica. Interprtense los resultados si
guientes y comprense con los expuestos a lo largo del captulo. Adems, cal
clense las comunalidades.
Varianza total explicada
Autovalores iniciales

Sumas de las saturaciones


al cuadrado de la extraccin

Suma de tas saturaciones


el cuadrado de la rotacin

Compon.
Total
X

2
3
4
5

6
?
a
9

10
11
12
13

3,552
1,659
1,114
,957
,874
,770
,749
,690
,619
,581
,560
,470
,404

% de la
%
varianza acumulado
27,322
12,765
8,570
7,363
6,724
5,921
5,762
5,304
4,765
4,472
4,304
3,619
3,110

27,322
40,086
48,656
56,019
62,743
68,664
74,426
79,730
84,494
88,966
93,270
96,890

Total

% de la
varianza

%
acumulado

Total

3,552
1,659
1,114

27,322
12,765
8,570

27,322
40,086
48,656

2,304
2,150
1,871

100,000

Mtodo de extraccin: Anlisis de componentes principales.

% de la
%
varianza acumulado
17,725
16,540
14,391

17,725
34,265
48,656

Captulo 5: Anlisis factorial

Grfico de sedimentacin
K M O y prueba de Bartlett
Medida de adecuacin muestral de
Kaiser-Meyer-Olkin
Prueba de esfericidad
de Bartlett

,821

Chi-cuadrado
aproximado
gl
sig.

3.159,521
78

,000

Matriz de componentesa
Componente

1
casar con marroqu
simpata marroqu
entrada inmigrante
vecino marroqu
n. inmigrantes
[eyes inmigracin
regularizar inmigrante
inmigrante delincuente
partido racista
ingresos
estudios
edad
sexo

,640
-,630
,620
,592
,584
-,583
-,574
,570
,442
-3 4 3
-,460
,388
l,207E-02

2
,341
-,287

,121
,354
-,117
-2,24E-02
-108
-7.94E-03
,136
,678
,667
-,538
,286

Mtodo de extraccin: Anlisis de componentes principales,


a 3 componentes extrados

3
,442
-1 6 2
-,299
,438
-,243
,336
,285
-,238
,106
7,543E-03
-8.14E-02
,261
-,464

Anlisis multivariable. Teora y prctica en la investigacin social

M atriz de co m p o n e n te s ro ta d o s 0

Componente

entrada inmigrante
leyes inmigracin
regularizar inmigrante
n. inmigrantes
inmigrante delincuente
casar con marroqu
vecino marroqu
simpata marroqu
partido racista
estudios
ingresos
edad
sexo

,653
-,648
,610
,573
,567
,152

,246
-1 5 3

,122
-,341
,241
~,223
-,205
5,228E-02
,357

-,220
,149
,194
,833
,807
-.624
,402
-2,67E-02
,107
,157
-,157

3
~3,53E-Q2
9,852E-02
3,429E-02
-,249
-,149
-6,OOE-02
-2,99E-02
2,459E-02
-7,22E-02
,783
,724
-.693
,381

Mtodo de extraccin: Anlisis de componentes principales.


Mtodo do rotacin: Normalizacin varimax con Kaiser.
BLa rotacin ha convergido en iteraciones.

Cornunalidades

simpata marroqu
ieyes inmigracin
sexo
edad
n. inmigrantes
regularizar inmigrante
entrada inmigrante
partido racista
casar con marroqu
estudios
ingresos
vecino marroqu
inmigrante delincuente

Inicial

Extraccin

,316
,243
3,078E-02
,227
,244
,232
,286
,129
,428
,351
,256
,368
,219

,377
,328
3.180E-02
,303
,298
,309
,395
,139
,712
,655
,347
,465
,263

Mtodo de extraccin: Mxima verosimilitud.

Captulo

.5.*Anlisis factorial

509

M atriz de configuracina

Factor

1
casar con marroqu
vecino marroqu
simpata marroqu
estudios
ingresos
edad
sexo
entrada inmigrante
leyes inmigracin
regularizar inmigrante
n. inmigrantes
inmigrante delincuente
partido racista

,841
,649
-435
5,927E-02
,144
8,903E-02
-3,53E~02
7,481 E-02
-3/74E-02
8,11 E-02
3,162E-02

,101
,189

3
-8.70E-03
-7,52E-02
,283
,177

8,538E-03
2,254E-02
-1.37E-G2
,774
,548
-.515
,157
2,372E-02
3,935E-02
7,662E-03
-,151
-9,21E-02
3,27E-02

,200
-5.01E-02

-,120
-,596
,547
,514
-,484
-,434
-,239

Mtodo de extraccin: Mxima verosimilitud.


Mtodo de rotacin: Normalizacin oblimin con Kaiser.
"La rotacin ha convergido en ]8 iteraciones.

Matriz de estructura
Factor

casar con marroqu


vecino marroqu
simpata marroqu
estudios
ingresos
edad
sexo
entrada inmigrante
leyes inmigracin
regularizar inmigrante
n. inmigrantes
inmigrante delincuente
partido racista

,844
,679
-,560
-,143
-3.25E-02
,194
-7,O0E-03
,337
-,288
-312
,272
,310
,301

-,128
-9,42E-02
,104
,794
,559
-,538
,142
-8.92E-02
,138
,108
-,238
-182
-,104

-,383
-,361
,475
,281
,228
-,177
-7,74E-02
-,625
,570
,551
-,524
-,495
-,329

Mtodo de extraccin: Mxima verosimilitud.


Mtodo de rotacin: Normalizacin oblimin con Kaiser.
P rueba de la b o n dad de ajuste

Chi-cuadrado

gi

Sig.

90,679

42

,000

510

Anfisis multivariable. Teora y prctica en ta investigacin social

Varianza total explicada


Autovalores iniciales

Sumas de as saturaciones
al cuadrado de la extraccin

Suma de las
saturaciones

Factor

1
2
3
4
5
6
7
8
9

10
n

12
13

Total

% de la
varianza

%
acumulado

3,552
1,659
1,114
,957
,874
,770
,749
,690
,619
,581
,560
,470
,404

27,322
12,765
8,570
7,363
6,724
5,921
5,762
5304
4,765
4,472
4,304
3,619
3,110

27,322
40,086
48,656
56,019
62,743
68,664
74,426
79,730
84,494
88,966
93,270
96,890

Total

% dla
varianza

%
acumulado

Total

2,905
1,134
,587

22,344
8,722
4,517

22,344
31,066
35,583

2,099
1,428
2,319

100,000

Mtodo de extraccin: Mxima verosimilitud.


aCuando los factores estn correlacionados, no se pueden sumar las sumas de ios cuadrados de las
saturaciones para obtener una varianza total.

Matriz de correlaciones entre los factores


Factor

1
2
3

1,000

-,160

-,160
-,446

1,000

-,446
,170

,170

1,000

Mtodo de extraccin: Mxima verosimilitud.


Mtodo de rotacin: Normalizacin obiimin con Kaiser.

2, En la investigacin de Vzquez Alonso, ngel (1991) Anlisis predictivo del


rendimiento acadmico en bachillerato y COU (Revista de Educacin, 295:
429-462) se realiz un anlisis factorial de componentes principales y de mxima
verosimilitud (rotacin varimax) con variables que miden el rendimiento de los
alumnos: as calificaciones en las asignaturas troncales de cada curso, la inteli
gencia, las aptitudes acadmicas (razonamiento abstracto, verbal y numrico).
Se quiere descubrir la estructura interna del conjunto de variables que indican
la capacidad de los alumnos. La muestra est integrada por 985 alumnos de pri
mer curso, 735 de segundo, 412 de tercero y 409 de COU, pertenecientes a nue

Captulo 5: Anlisis factorial

511

ve centros pblicos de Mallorca (curso 1986/87). Interprtense los siguientes re


sultados que corresponden a los alumnos de COU y realcese el grfico de se
dimentacin.
Varianza total explicada
Factor Autovalor

1
2
3
4
5
6
7
8
9
10
11
12
13
14

7,10180
2.28210
,86514
,66108
,57240
,56075
,50085
,34923
,28636
,26384
,21674
,15524
,12277
,06171

Matriz factorial rotada (3 iteraciones)

% varianza

% acum.

Variables

Factor 1

Factor 2

Comunalidad

50,7
16,3
6,2
4,7
4,1
4,0
3,6
2,5
2,0
1,9
1,5
1,1
,9
,4

50,7
67,0
73,2
77,9
82,0
86,0
89,6
92,1
94,1
96,0
97,6
98,7
99,6
100,0

Qumica
Lengua/literatura
Biologa
Fsica
Geologa
Filosofa
Matemticas
Dibujo
Idioma extranjero
Inteligencia general
Razonamiento numrico
Razonamiento verbal
Razonamiento abstracto
PCOR*

,89740
,89357
,86052
,85478
,84700
,84589
,84326
,80905
,80846
,06911
,15529
,17212
-,08510
,27574

,20198
,10278
,22547
,23176
-,21056
,09945
,21507
,06362
,21172
,76020
,75482
,71926
,62877
,59108

,80904
,72542
,69844
,75734
,78436
,84613
,79133
,76174
,65861
,58268
,40260
,54696
,59386
,42540

* Puntuacin corregida de ias pruebas objetivas de Fsica y Qumica.

3. En el Informe Tcnico de la Consejera de Salud y Bienestar Social de la Co


munidad de Madrid de 1986, titulado Zonificacin socio-sanitaria, bases p a
ra una regionatizacin de servicios (M apa de salud y servicios sociales. C o
m unidad d e M adrid ), bajo la direccin de Alfonso Calv y Armando Peruga

y la coordinacin de Benjamn Gonzlez, se utilizaron las puntuaciones fac


toriales obtenidas tras la realizacin de un anlisis factorial de componentes
principales para realizar tipologas de municipios, zonas bsicas y distritos.
Compltese la matriz factorial rotada (clculo de las comunalidades y ios au
tovalores) e interprtese. Los datos figuran en la primera tabla a continuacin
(tabla A).
4. En el estudio de X Ignacio Cano, Jos M. Ruiz Olano y Miguel S. Valles
(1988). El desarrollo social de los pequeos municipios en la Comunidad de M a
drid, Asamblea de Madrid, coleccin Estudios Parlamentarios se comprueba la
adecuacin de indicadores clsicos en la medicin de distintas dimensiones (de
mogrfica, de accesibilidad y socioeconmica) del concepto desarrollo sociaFacudiendo a distintas tcnicas multivariables: anlisis factorial, de con
glomerados y discriminante. Analcese y compltese la matriz factorial (ACP;
rotacin varimax) para el conjunto de ios indicadores elegidos (tabla B, pgina
siguiente).

512

Anlisis rnultivariable. Teora y prctica en la investigacin social

Tabla A (3. ejercicio)


Variables
Personas por familia
Tasa de actividad
Desocupacin
Tasa participacin poltica
Crecimiento 75/81
'Nmero de bancos
Comercios alimentacin
Poblacin 0-14 aos
Poblacin 25-64 aos
Fecundidad
ptimo fecundo
Indice envejecimiento
Tasa de dependencia
Pob. con bachiller. Sup.
Pobl. analfabeta
Log Pob*
TRF. Secundario
TRF. Agrcola
TRF. Servicios
Log densidad*

Factor 1

Factor 2

Factor 3

Factor 4

Factor 5

,882
,059
-,072
-,334
,274
-,744
-,073
,791
-,147
,394
-,247

,038
,085
-,137
-,318
,834
-,062
,016
,563
-,162
,797
,794
-,257
,655
-,273
-,173
,005

-273
,870
-.093
-,199

-,006

,003
-,037
,885
-.653

-,886
,164
-,146
-,015
,140
-,256
-,268

-,122
,345

-,011

-,445
-,564
,077
,643

,000

,173
-,174
-,316
,295
-,050
,547
-,692
-,525
,346
,338

-,120
-0 6 3
-,346
,575

,212

-,004
-,346
,096
,030
-,295
-,023
,383
-,130
-,170
,043
-,123
,818
-,927
,538
-,035
-,615
,761
,263

-,122
-,300
-,489

,022

-,161
,066
,072

-,012
-,065
,081
,033
,496
-,563'
-,389
,273
,183

* Transformadas tomando e logaritmo de los valores de cada variable.

Tabla B (4.a ejercicio)


Variable

Factor 1

Factor 2

Factor 3

Factor 4

Factor 5

Factor 6

Distancia a Madrid
Dist. carretera nacional
Dist. ncieo > 20.000hab.
Tasa de jvenes
Tasa de viejos
Tasa de paro
Dist. centros educativos
Servicios
Agricultura
Estudios
Viviendas secundarias
Razn de masculinidad
Dist. a la farmacia
Transporte pblico
Razn actividad-dependencia
Incremento pobl. 1970-1975
Incremento pobl. 1975-1981
Incremento pobl. 1970-1981
Industria-construccin
Telfonos por habitante
Dficit educativo
Transporte pblico por pobl.

-,87081
-,36347
-,80487
,86281
-,85242
,01964
-,80565
,57049
-,77789
,57727
-,35000
-,31261
-,62409
,55759
,1.331.9
,76002
,65282
,76985
,38214
,45465
,29174
,43396

,29295
-,02524
,38022
-,10459
,14609
-,45701
,26735
,59034
,02683
,54517
,58294
,04129
,29992
,23299
-,08035
,20943
,37877
,37868
-,68767
,25233
-,01323
,22883

-,03455
-,29794
-,01885
-.04098
,08853
,10234
,04882
-,08715
,12958
-,04569
-,23530
-,07289
,12392
,67680
-,08598
-,17123
-,24803
-,23504
-,07260
,08474
-,35065
,78844

,01409
,08209
-,01730
-,18048
-,26919
,02682
-,02800
,08344
-,14953
,03318
,25980
,48860
-,03574
-,05057
,821.06
-,08430
-,18131
-,18463
,10269
,38809
-,17044
,10887

-,04419
-,55653
-,01614
-,09926
-,04620
,29928
,31.650
,05014
-,03862
,10464
-25762
,28554
,35634
,03849
,27727
-.10515
,25365
,14445
-,00508
-.39308
,34083
-.06900

-,04707
,33518
-,16850
-,03697
,01540
,28748
-.22629
-,13339
,25476
,19163
-,17301
,26789
,17426
,01741
,03795
,15984
,23088
,25509
-,18467
-,21708
-,60121
-,09462

Captulo 5: Anlisis factorial

51.3

5. Otro ejemplo de la utilizacin del anlisis factorial en la tipologizacin de la


estructura espacial es la clasificacin de distintos barrios de Vitoria-Gasteiz
realizada por Flix Calvo Gmez y Cristina Lavia Martnez, publicada en
1993, en e artculo El mtodo selectivo factorial en el anlisis de tipologas
urbanas (Estudios de Deusto, 41 (1): 99-121), En l se aplica una alternativa
(el mtodo selectivo) al clculo tradicional de las puntuaciones factoriales,
que consiste en calcularlas slo en las variables que saturen significativamente
en cada factor. En los anlisis preliminares se realiz un ACP con rotacin va
rimax para las 22 variables que mostraron ser ms relevantes en la clasifica
cin de los barrios. Interprete la matriz factorial y las puntuaciones factoria
les promedio.

M atriz factorial rolada


Variables
Tasa juventud
Tasa vejez
Tasa analfabetismo
% pobl. estudios primarios
% pobl. estudios superiores
% emigrantes
% emigr. llegados tltmos 5 aos
% emigr. llegados entre 5-10 aos
% emigr. llegados hace ms de 10 aos
Tamao medio de la vivienda
% ocupados industria
% ocupados construccin
% ocupados servicios
Tasa de vascoparlantes
Tasa de paro
% ntcleo familiares con hijos
% mdeos familias numerosas
% mujeres ocupadas
% mujeres amas de casa
% ocupados dase alta
% ocupados clase media
% ocupados clase baja
% varianza explicada

Factor 1
,227
-,204
,317
,621
-,782
,568
,344
-,108
,253
-826
,637
,421
-,652
-,677
,183
,052
-,590
-,269
,326
-,832
-058
,757
25,85

Factor 2

Factor 3

Factor 4

-.252
,018
,141
,378
-,463
,190
-,774
-,751
,901
-,411
,472
,283
-,472
,090
,481
,136
,405
-,739
,723
-,421
-,067
,405

,878
-,902
,206
,309
-2 4 2
,532
-,133
,366
-,170
,008
,523
,181
-511
-,140
-,341
,954
,316

-,017

22,06

-,001
,750
,350

-.121
.437
-0 1 6
-,172

,121
-,196
,054
,627
-,190
-,498

,686
-,054
,507
-,367
,359

-,201
,210
-,201

~,202

-,039
,189

-,586
,379

18,73

14,43

5X4

Anlisis multivariable. Teora y prctica en la investigacin social

Puntuaciones factoriales prom edio para algunos barrios (Vitoria-Gasiez, 1989)


Barrios
Casco viejo
Ensanche
Lovajna
Coronacin
E] Pilar
Gazalbide
Txagorritxu
San Martn
Zaramaga
ElAnglo
Sierras
Saotiago
Arambizkarra
Arana
Desamparadas
Judizinendi
Santa Luca
Errekaeor
Adurza
San Cristbal

Factor I

Factor 2

Factor 3

,782
-1,630
-9 9 0
-,244
,574
-1,609
-308
-,612
,121
-,158
,709
,330
,824
,213
-,685
,232
1,016
,645
,774
,408

-,452
-794
-,468
,776
,465
,540

-1,691
-1,147
-,963
-.384
,821
1,318
,148
,406
,481
-,388
,810
,267

,1 1 2

-2,133
1,058
,791
-,456
-,560
-,718
,495
-,327
,427
-1,390
-,248
,241
,266

Factor 4
,910

. 3 4 9

-155
-,341
-,368
-,502
-,712
-,536
,513
-1,478
-,829
-1,162
-,392
,335
-,595

1 ,1 1 2

,441
-684
-626
,531
-,715
,336
,136

- .2 2 0

-,327
3,425
,272
-214

You might also like