Professional Documents
Culture Documents
Anlisis Factorial
* Potente tradicin en Psicologa (inteligencia)
* Resuelve cuestiones de inters, la tcnica permite ordenar cuando hay alta complejidad
reduciendo variables en factores (variables subyacentes)
En el anlisis, uno parte de una matriz de correlaciones y se hace 2 preguntas: Qu
hay?, Qu subyace a la interdependencia de variables? Esto se resuelve aplicando factores
>> en la matriz existen relaciones solapadas o variables subyacentes. Se asume que la
realidad puede ser aprendida por medio de nmeros y el factorial es una forma de hacer
eso. Lo que hace el factorial es poner en evidencia el patrn d organizacin de la
informacin: conocer, poner orden, mostrar estructuras en situaciones donde hay alto
nivel de interaccin entre las variables.
Ej: en las notas de cualquier lugar del mundo se forman 3 factores: letras, ciencias y
auxiliares
Factor: variable subyacente resultado de otras variables
Factor letras: resultado de variables castellano, historia, etc.
Uso de factorial: validacin de cuestionarios >> si una encuesta est construida a partir de 3
items, al aplicar factorial a los resultados deberamos obtener 3 factores >> eso significa
que las variables estaban midiendo los items que deberan medir.
* Ocurre que los factores son variables latentes que mantienen la misma informacin
* Los factores (o dimensiones subyacentes), son descubiertos o inventados? Se defienden
ambas posiciones:
Inventados: Son producto de la aplicacin de un algoritmo a la matriz de correlaciones
Descubiertos: ej. Utilizacin en psicologa: la inteligencia ha sido medida por 500 variables
y se concluye que hay 8 factores que la determinan >> eso significa que la inteligencia
emocional, lgico matemtica, etc. son factores que estaban dentro de nosotros y haba que
descubrirlos.
* (Segn Vivanco) Es indudable que un uso abusivo de los algoritmos del factorial conduce
a creer que los factores existan previamente >> el factorial es la aplicacin sucesiva de
pasos matemticos: son inventados, o mejor dicho, construidos. (Uso abusivo: sin marco
terico)
* Factorial estudia interdependencia, interaccin
* Existen tantos factores como variables
* En la solucin factorial ingresan los factores que tienen lamda mayor que 1; por lo tanto =
se pierde informacin
* En la solucin, los factores se ordenan jerrquicamente
* Espacio de factor: particularidad de que los factores que se forman mantienen la mxima
informacin.
Matrices: Matriz individuos por variables >> Matriz de correlaciones >> Matriz de
Saturaciones >> Matriz de puntuaciones factoriales
Matriz de Correlaciones:
* Carcter exploratorio v/s confirmatorio del anlisis factorial >> distintas formas de
extraer los factores.
Anlisis Factorial >> sperman y pearson: se fijan solo en la comunalidad, se deja de lado lo
especfico de cada variable; por eso es exploratorio, porque trabaja solo con una parte de la
realidad.
- no se pueden establecer hiptesis (por eso se usa poco)
- en la matriz de correlaciones, la comunalidad es la diagonal y va de 0 a1
* No confundir: la tcnica se llama anlisis factorial, pero el SPSS hace anlisis de
componentes principales y al hacerlo utiliza ejes principales (si queremos anlisis factorial,
tenemos que pedrselo) >> ninguno de esto conceptos son lo mismo.
Anlisis de Comp. Principales >> utiliza ejes principales, se fija en comunalidad y
especificidad (utiliza toda la informacin), por eso es de carcter confirmatorio
- ac s se pueden establecer hiptesis
- en este anlisis la diagonal de la matriz de correlaciones es 1
Por qu la diferencia de las diagonales?
Lo que se pone en la diagonal es la varianza de las variables estandarizadas. La diagonal es
la informacin asociada a cada variable (entiendo que esto es: los cruces explican la
correlacin de una variable con la otra, o sea, la explicacin que de una variable se explica
por la otra). Cuando se utiliza comunalidad y unicidad se esta utilizando toda la
informacin, por eso da 1 (lo que explica V1 de V1 = todo); en cambio, cuando se utiliza
solo comunalidad, no toda la informacin de una variable es explicada por s misma.
Nota: esto no lo entend muy bien y me tinca que Vivanco lo puede preguntar, as que si
alguien pudiera explicarlo mejor, se lo agradecera.
Lo comn de anlisis factorial y anlisis de comp. Principales
1. Cuntos factores entran en la solucin?: los que tengan lamda mayor que 1
2. Hay que bautizar los factores, para esto hay que conocer las variables asociadas a l
(a esto Vivanco le llama sentido)
3. Importancia de los factores: son jerrquicos (recordar que en principio existen
tantos factores como variables, pero a la solucin entran pocos que explican bien >>
principio de parsimonia)
Matriz de Saturacin:
De la matriz de correlaciones, pasamos a la matriz de saturacin que es una matriz de
variables v/s factores. Los valores van del -1 al +1 y revelan asociacin: aqu el signo no
importa, solo importa si el valor es cercano a (+-) 1, porque eso significa que la variable
est muy asociada al factor:
V1
V2
* V3
Vn
F1 F2
F1: muy asociado con V1 y V2
0.8 0.1
F2: muy asociado con V3 y Vn
0.9 0.2
0.1 0.7 Recordemos que la funcin discriminante se usaba para determinar que
discriminaban ms; ac el objetivo es encontrar los factores,
0.1
0.9 variables
Se analizan
las variables y se bautizan los factores
que son variables subyacentes >> por eso se bautizan
* Matriz de saturaciones es central para entender lo que pasa con los factores
F1 F2
2
ai
=
V1 comunalidad
V2
V3
Vn
ai 2 = i
F1
V1 0.8
V2 0.1
V3 0.9
F2
0.0
0.8
0.1
F3
0.1Esto es una matriz de saturacin que
0.1muestra una solucin factorial simple.
0.1
F2
V4
*
V3
*
V1
*
F1
V1
V2
V3
V4
F1
F2
0.7 -0.14
0.05 -0.63
0.98 -0.02
0.02 0.84
2.1
1
V2
*
* Puntuaciones factoriales son las puntuaciones que obtendran los individuos de medirse
los factores directamente.
28/Abril/2006
Aplicacin de anlisis factorial: En la investigacin se deben tomar en cuenta
simultneamente los criterios estadsticos y los criterios sustantivos (perspectiva del
investigador cuando toma las decisiones)
Vivanco distingue 7 usos del factorial (parece que aqu me empec a dormir un poco)
1. Interdependencia y encontrar factores: En la matriz existen relaciones latentes que el
factorial puede desentraar >> De lo que se trata es de encontrar el orden en bases que son
puro desorden. 2 formas:
- Medir constructos no medibles (inteligencia)
- Validar instrumentos de medida
2. Simplificar o reducir datos: Sintetizar, hay 2 momentos: la doble reduccin
- Primero se reducen los individuos a la matriz individuos/ variables; esta
reduccin se hace al recoger las encuestas
- Despus reducimos la informacin a factores, los factores no conservan toda la
informacin de la matriz original, al reducir las variables, desconocen algo de
informacin >> esto se hace actuando bajo el principio de la parsimonia
3. Estructura: Uso exploratorio del factorial permite estructurar la informacin: descubrir
las lneas primarias e independientes que estructuran una realidad de la que no se nada. >>
Se define concepto segn la aplicacin del instrumento? Esto remite nuevamente a la
discusin respecto de si los factores son un descubrimiento o una invencin (resultado de la
aplicacin sucesiva de algoritmos matemticos >> la decisin sobre que algoritmos utilizar
es del investigador, en ese sentido inventados)
Rumel (o Remel, Rimel, Romel): factorial es tan importante en ciencias sociales como la
invencin del clculo diferencial integral (?) en ciencias, porque permite analizar temas
tan complejos como la inteligencia.
4.
5.
6.
7.
proceso debera ser al revs: cuando se crea el cuestionario debe tomarse en cuenta el plan
de anlisis y por lo tanto se deben generan variables de intervalo o dicotmicas a propsito.
Dificultades de aplicacin e interpretacin de factorial: existen dificultades objetivas y
subjetivas que generan resultados distintos.
* Objetivas:
1. Anlisis factorial o de componentes principales?: cada procedimiento de
extraccin de factores genera resultados distintos
2. Qu tipo de rotacin utilizamos?
3. La pulcritud de los mecanismos matemticos de aplicacin de algoritmos no es tal
* Subjetivas:
1. Se interpreta distintamente la matriz de saturaciones, sobretodo en variables
complejas
variables complejas no son un error (s es un error elegir pocas
variables o variables poco relaciones o variables muy relacionadas)
2. Kayser: a la solucion factorial entran los factores con mayor que 1, pero uno
puede cambiar esto. (SPSS por defecto introduce factores con mayor que 1 y esto
tiene un fundamento).
3. Anlisis exploratorio o confirmatorio? Factorial mejor para exploratorio (excluye
especificidad) y Componentes Principales mejor para confirmatorio (incluye
comunalidad y especificidad)
04/Mayo/2006
Anlisis de Tipologas y Anlisis Factorial: Se busca acceder a la realidad, pero se
condiciona esta realidad. Se generan resultados distintos de acuerdo a:
- utilizacin de algoritmos
- decisiones del investigador
Tipologas: Busca la similaridad entre los elementos, pero similaridad no esta definido,
se define por la utilizacin de algoritmos: =/= algoritmos; =/= distancias.
Factorial: tambin se eligen procesos de extraccin de factores, procesos de rotacin >> se
generan resultados distintos.
1 generacin de resultados: lo que entrega el PC
utilizar estos resultados de manera ingenua.
Trabaja con el principio de parsimonia: pocas variables (factores) que conserven la mayor
informacin posible.
3. Condiciones de aplicacin:
- Variables de intervalo o razn: pueden ser tambin dicotmicas, pero hay que
evitarlo porque su interpretacin es poco clara.
- Tienen que haber variables correlacionadas entre s (parte de una matriz de
correlaciones)
- No puede haber multicolinialidad: variables no pueden estar muy corelacionadas
- No deben haber correlaciones espreas: variables que correlacionan a partir de una
tercera variable. Se cree que dos variables correlacionan mucho, pero en realidad es
una tercera variable la que las est correlacionando
- La matriz no debe ser singular (identidad): singular es cuando la diagonal tiene 1s y
el resto son 0s. Matriz identidad: la variable se correlaciona consigo misma.
- La muestra debe ser grande, 300 casos mnimo, 500 ptimo.
- Los valores ausentes hay que reemplazados por la media
- Los valores aberrantes (valores exageradamente extremos) hay que eliminarlos.
(disparan las varianzas)
Por qu la varianza se asimila a informacin?
Todos los anlisis factoriales buscan maximizar la varianza: una variable no puede entregar
mayor informacin que su varianza (varianza es el coeficiente que ms informacin tiene).
Interesa maximizar porque es resumir manteniendo lo ms importante de la informacin.
4. Etapas:
1.- Clculo de matriz de correlaciones.
2.- Seleccionar un procedimiento de extraccin de factores: Abstraer varianzas.
Qu es un factor?
Caractersticas relevantes de los factores:
Ortogonales: Independientes entre s.
Jerrquicos: El primero explica ms que el segundo y as sucesivamente.
Funcin (combinacin lineal de variables), eje (tienen un lugar en el hiperplano) y
variables (en cada factor se puede sacar una puntuacin).
El factor que mejor explica es aquel que mejor se proyecta en los ejes.
Cada variable tiene una varianza, y esa varianza tiene dos partes: comunalidad y
especificidad (parte de la varianza que se debe exclusivamente a la variable. Se compone de
unicidad y error)
Hay dos mtodos de extraccin de factores:
- Anlisis factorial: confirmatorio >> Lo que tienen en comn los factores.
3.- Numero de Factores en la solucin: utilizamos el criterio de Kaiser: nunca debera entrar
a la solucin un factor cuyo auto valor sea menos a 1. Si vale menos que 1 explica menos
que una variable.
4.- Rotacin de los ejes factoriales: es una maa matemtica, su objetivo es simplificar la
interpretacin. Lo que hace es maximizar an ms la varianza para hacer ms fcil la
interpretacin. Se mueven los ejes y se mantiene la misma varianza, pero se maximizan los
valores. Lo que se maximiza la saturacin, no la correlacin.
Hay dos tipos de rotaciones:
La ortogonal: Los ejes son independientes entre s; hay tres tipos:
- Varimax: Maximiza las columnas (los factores). Esta utiliza SPSS por defecto
- Quartimax: maximiza las filas
- Equimax: maximiza filas y columnas
La oblicua: no la utilizamos.
5.- Evaluar ajuste del modelo: ver la concordancia entre datos observados y valores tericos
>> si hay mucha diferencia, el ajuste no es bueno.
6.- Clculo de puntuaciones factoriales: qu valores tendran los individuos si midiramos
directamente los factores?
7.- Matriz de saturacin: presenta factores en las columnas y variables en las filas. Los
coeficientes de la matriz son las saturaciones: miden la relacin variable/factor. Mientras
ms cercano a uno la relacin de explicacin es ms ptima.
Auto valor: suma al cuadrado de cada factor >> a mayor auto valor, ms explica cada
factor.
Comunalidad: suma al cuadrado de las filas, explica cunto de la dispersin de la variable
es explicada por los factores en general.