Professional Documents
Culture Documents
Definizione operativa
Factor analysis can be broadly characterized as a set of
multivariate statistical methods for data reduction and for
reaching a more parsimonious understanding of measured
variables by determining the number and nature of common
factors needed to account for the patterns of observed
correlations (Fabrigar, Wegener, MacCallum,&
Strahan,1999)*.
Introdotta da Spearman (1904), perfezionata da Thurston (1930) e
completata da Kaiser (1960) e Cattel (1966)
20.000 occorrenze in Psychinfo (Pruzek, 2005)
*Hayton, J. C., Allen, D. G., & Scarpello, V. (2004). Factor retention decisions in exploratory factor
analysis: a tutorial on parallel analysis. Organizational Research Methods, 7(2), 191-205.
Funzioni principali
Scomporre la varianza.
Critiche
Trova variabili artificiali, aleatorie, possibile rintracciarne un numero
infinito.
Elementi di soggettivit legati alle scelte del decisore
Ruolo
indiscusso:
Assunti dellAF
Esiste una normale variabilit nei valori degli individui in
relazione ai punteggi assunti dagli attributi di superficie.
La variabilit dei punteggi rispecchia la differenze individuali
espresse attraverso gli attributi di superficie.
Gli attributi di superficie possono correlare tra loro: alcuni
presentano alte correlazioni altri basse/nulle correlazioni.
Il sistema di correlazioni reciproche non caotico, ma viene
governato da un sistema di relazioni sottostanti gli attributi di
superficie attributi interni
Gli attributi interni (=variabili latenti o costrutti) sono
caratteristiche individuali non osservabili direttamente, ma
derivabili dalla valutazione degli attributi di superficie
(=comportamenti manifesti)
Postulati teorici
Al centro dellAF vi la relazione che esiste tra attributi
di superficie e attributi interni gli attributi interni
influenzano gli attributi di superficie in un modo
sistematico e ripetibile
Ci implica che quando si misura un attributo di
superficie, almeno in parte si sta anche misurando
linfluenza che lattributo sottostante esercita (come il
magnetismo e la gravit) .
Rispondenti seriali
Numerosit campione (50 very poor, 100 poor, 200 fair, 300 good, 500
very good and 1000+ excellent, Comrey and Lee, 1992)*
* Comrey, A. L. and Lee, H. B., (1992), A first course in factor analysis, Hillsdale, New Jersey: Erlbaum
Terminologia
Fattore variabile (costrutto) che non direttamente osservabile ma
deve essere inferito attraverso variabili osservate.
Factor Loading (saturazione) il coefficiente di correlazione che
mostra limportanza (peso) di ogni variabile nel definire un fattore
Eigenvalue (autovalore) rappresenta la quota di varianza delle
variabili spiegata dal fattore
Soluzione fattoriale il set di fattori e di relazioni tra variabili e fattori
che rappresenta la soluzione al problema fattoriale
Come funziona FA
Come funziona FA
Matrice di correlazione
La logica dellAF
Considerando tutti gli indicatori (item, parole, variabili) si spiega il 100% della
varianza dei dati osservati per studiare il fenomeno oggetto di indagine
La factor analysis consente di identificare n fattori, capaci di sintetizzare in
modo efficiente gli indicatori empirici e di ridurne la complessit; i fattori, per,
spiegano una quantit di varianza inferiore al 100%
Quindi, con lanalisi fattoriale, si decide di sacrificare una parte della varianza
spiegata a favore di una maggiore semplicit intepretativa
comunque auspicabile che i fattori spieghino, in termini cumulati, almeno il
60-70% della varianza totale
10
Logica dellAF
11
Come funziona FA
Scelta dellalgoritmo
Per ridurre la complessit preservando la maggior parte della varianza e
cercando relazioni uniche tra variabile e fattore analisi delle componenti
principali (ACP)
Per analisi di concetti di interesse teorico (costrutti) massima
verosimiglianza (ML) Lavora per approssimazioni successive e stima
12
Logica dellAF
13
Soluzioni ortogonali
Ipotizza che i fattori siano statisticamente indipendenti (quindi non correlati)
Lalgoritmo di generazione fattoriale mette a zero tutte le correlazioni tra
fattori.
Diverse tecniche di rotazione (almeno 12).
Tre ortogonali:
Varimax la pi utilizzata, cerca di semplificare (=ridurre) il numero delle
colonne, cio le variabili che generano la matrice di correlazione, semplifica
alinterpretazione del fattore
Quartimax cerca di semplificare il numero delle righe (=osservazioni),
semplifica linterpretazione delle variabili
Equimax cerca di trovare un bilanciamento tra la semplificazione delle righe
e delle colonne.
14
Soluzioni oblique
Ipotizza che i fattori siano statisticamente dipendenti tra loro (quindi correlati)
Lalgoritmo di generazione fattoriale calcola tutte le possibili correlazioni tra
fattori.
Diverse tecniche di rotazione (almeno 12)
Due oblique:
Oblimin Rotazione obliqua che cerca di adattare i fattori agli item e li correla.
Promax E un metodo pi diretto che cerca la rotazione che meglio si adatta a
rappresentare i fattori con un singolo item e lo fa direttamente.
15
Come funziona FA
16
Tabelle di output
Tabella comunalit
Valutazione adeguatezza AF
17
Approx. Chi-Square
df
Sig.
,891
2166,885
276
,000
Tabelle di comunalit
La comunalit esprime la proporzione della varianza di ogni variabile
riprodotta da un certo numero di componenti. Essendo una proporzione,
essa varia tra zero e uno. Quindi ci dice quanta varianza perdiamo di
ciascuna variabile, tenendo conto le componenti che abbiamo deciso di
utilizzare.
Le comunalit indicano la parte di varianza spiegata di ogni indicatore,
considerando il modello fattoriale stimato
Notazione h2
Vanno tendenzialmente tenuti in considerazione item o variabili che
abbiano un valore di comunalit di almeno .500
18
Iniziale
1,000
Estrazio
ne
,947
1,000
,937
1,000
1,000
,532
,958
1,000
,533
1,000
,947
1,000
1,000
,543
,379
1,000
,549
1,000
1,000
1,000
,947
,516
,549
1,000
,562
Autovalori (Eigenvalue)
Varianza Cumulata
Varianza Totale
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Autovalori iniziali
% di
%
Totale
varianza cumulata
4,707
19,613
19,613
3,848
16,032
35,645
1,814
7,560
43,205
1,219
5,080
48,284
1,114
4,641
52,925
,996
4,150
57,075
,944
3,934
61,009
,881
3,672
64,682
,789
3,288
67,969
,745
3,103
71,073
,729
3,037
74,110
,652
2,716
76,826
,608
2,534
79,359
,583
2,428
81,788
,555
2,313
84,100
,533
2,222
86,323
,530
2,206
88,529
,493
2,052
90,581
,476
1,985
92,566
,427
1,780
94,346
,395
1,645
95,991
,370
1,540
97,531
,324
1,349
98,880
,269
1,120 100,000
Come funziona FA
20
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Autovalori iniziali
% di
%
Totale
varianza cumulata
4,707
19,613
19,613
3,848
16,032
35,645
1,814
7,560
43,205
1,219
5,080
48,284
1,161
4,641
52,925
4,150
57,075
1,004
,944
,881
,789
,745
,729
,652
,608
,583
,555
,533
,530
,493
,476
,427
,395
,370
,324
,269
3,934
3,672
3,288
3,103
3,037
2,716
2,534
2,428
2,313
2,222
2,206
2,052
1,985
1,780
1,645
1,540
1,349
1,120
61,009
64,682
67,969
71,073
74,110
76,826
79,359
81,788
84,100
86,323
88,529
90,581
92,566
94,346
95,991
97,531
98,880
100,000
21
???
??
22
23
Tab.4
Comparison between actual and generated eigenvalues.
Dimensions
F1
F2
F3
F4
F5
F6
Real
Mean
95th
percentile
eigenvalues
PA
eigenvalues
PA
eigenvalues
1,3
1,25
1,22
1,19
1,16
1,14
1,34
1,3
1,24
1,22
1,18
1,16
4,707
3,848
1,814
1,219
1,161
1.004
24
Come funziona FA
Interpretare i fattori
Linterpretazione dei fattori avviene a partire dai coefficienti di
saturazione degli item sul fattore identificato
Il coefficiente di saturazione il coefficiente di correlazione che mostra
limportanza (peso) di ogni variabile nel definire un fattore definisce anche
la quota di varianza di quellindicatore spiegata dal fattore
Ogni indicatore (item variabile) presenta una certa correlazione con
ogni fattore litem ideale presenta correlazione 1 con il fattore che
misura e correlazione 0 con tutti gli altri fattori
25
Componente
1
,785
10)This parent never relinquishes control of the child and wants to protect
him/her against all dangers.
21) This parent is very concerned about the health of the child
,769
,764
,619
,611
,801
,768
,680
,468
,720
,717
,674
,646
,672
,559
,553
,461
,507
,471
,501
1)As teacher you feel compelled to take sides with one of the parents.
,641
,558
,466
,418
,426
Costruire i fattori
Un buon fattore:
1) ha senso,
2) semplice da interpretare,
3) 3) ha una struttura semplice
Inserire nel fattore soltanto item che presentano valori di saturazione superiori
a .40
Ogni fattore deve includere almento due variabili con valori di saturazione
superiori a .60.
Per interpretare il fattore (=dare un nome) si parte dallanalisi delle dimensioni
con valori superiori a .60. (Everaert, 2007)
26
Componente
1
,785
10)This parent never relinquishes control of the child and wants to protect
him/her against all dangers.
21) This parent is very concerned about the health of the child
,769
,764
F1
,619
,611
9)This parent expresses the intention to co-operate, but does not follow
through
13)This parent promises you as a teacher to help the child at home, but
does not do it
5) This parent failed to follow through with an agreement about supervising
the child's homework
2) This parent doesn't accept responsibility for the consequences of a
particular decision
14)This parent says he/she thinks you are a bad teacher
,801
,768
,680
F2
,468
,720
,717
,674
F3
,646
,672
,559
F4
,553
,461
,507
,471
,501
1)As teacher you feel compelled to take sides with one of the parents.
,641
,558
,466
,418
F5
,426
27
28
Esplorativa
Generazione di teorie
Confermativa
Test di teorie
Assunti CFA
Dimensione del campione: 15 casi per variabile osservata.
Adeguatezza del modello: le relazioni tra le variabili devono essere
specificate a priori.
Variabili di output: Continue e normalmente distribuite.
Gestione missing: non ci devono essere missing.
Giustificazione teorica del modello: le metodologie SEM devono avere un
modello teorico ben definito a priori
29
EFA su 2 fattori
30
CFA a 2 fattori
31
Esempio output
Degrees of Freedom = 63
Minimum Fit Function Chi-Square = 195.94 (P = 0.00)
Normal Theory Weighted Least Squares Chi-Square = 197.73
(P = 0.00)
Estimated Non-centrality Parameter (NCP) = 134.73
90 Percent Confidence Interval for NCP = (96.07 ; 181.01)
Minimum Fit Function Value = 0.52
Population Discrepancy Function Value (F0) = 0.36
90 Percent Confidence Interval for F0 = (0.26 ; 0.48)
Root Mean Square Error of Approximation (RMSEA) =
0.076
90 Percent Confidence Interval for RMSEA = (0.064 ;
0.088)
P-Value for Test of Close Fit (RMSEA < 0.05) = 0.00026
Expected Cross-Validation Index (ECVI) = 0.75
90 Percent Confidence Interval for ECVI = (0.65 ; 0.88)
ECVI for Saturated Model = 0.56
ECVI for Independence Model = 12.52
Chi-Square for Independence Model with 91 Degrees of
Freedom = 4655.09
Independence AIC = 4683.09
Model AIC = 281.73
Saturated AIC = 210.00
Independence CAIC = 4752.07
Model CAIC = 488.66
Saturated CAIC = 727.33
32
Conclusioni
1)Scegliere se utilizzare EFA o CFA
2)Identificazione dei passi centrali per condurre
EFA
3)Leggere ed interpretare EFA
4)Cenni di CFA
33