You are on page 1of 14

Volumul_10_nr_01.

qxd

4/17/2012

1:10 PM

Page 102

Folosirea analizei factoriale exploratorii n cazul itemilor:


Aspecte specifice i recomandri
Paul Srbescu1

Abstract
In Romania, the use of exploratory factor analysis (EFA) in the development or cultural adaptation of psychological tests is a phenomenon that gained a very large ampleness in recent years. Many of the recommendations that apply when using EFA for variables will lead to erroneous results if EFA is used for items. The purpose
of this article is to provide relevant information about issues to be taken into account when EFA is used for items.
Basically, this article presents a series of recommendations about decisions on determining the need to implement
EFA, the sample used, choosing a factor extraction method, selecting the optimal number of factors, factor rotation and identifying false factors. Finally, a synthesis of recommendations made throughout the article is presented, along with the main techniques for forming item parcels and a guide for conducting a parallel analysis using
SPSS syntax.
Keywords: Exploratory factor analysis, item parcels, parallel analysis

Rsum
En Roumanie, lutilisation de lanalyse factorielle exploratoire (EFA) dans le procs de dveloppement ou
dadaptation culturelle des preuves psychologiques reprsente un phnomne qui a pris un grand essor pendant
les dernires annes. Beaucoup de recommandations valables pour lutilisation de la EFA pour les variables vont
mener des rsultats errons dans le cas de lutilisation de la EFA pour les items. Le but de cet article cest de
fournir des informations signifiantes sur les aspects qui doivent tre pris en considration lors quil sagit dutiliser la EFA pour les items. Pratiquement, le prsent article vient illustrer une srie de recommandations lies aux
dcisions concernant la dtermination du besoin dapplication de la EFA, lchantillon utilis, le choix dune
mthode dextraction des facteurs et lidentification des faux facteurs. A la fin, il y a une synthse des recommandations mentionnes tout au long de larticle, en prsentant les principales techniques pour la formation des parcelles ditems aussi bien quun guide pour la ralisation dune analyse parallle dans la syntaxe du logiciel SPSS.
Mots-cls: lanalyse factorielle exploratoire, parcelles ditems, analyse parallle

Rezumat
Utilizarea analizei factoriale exploratorii (eng. exploratory factor analysis sau EFA) n procesul de dezvoltare sau de adaptare cultural a probelor psihologice reprezint un fenomen ce a cptat o foarte mare
amploare n ultimii ani, n Romnia. Multe dintre recomandrile care sunt valabile pentru utilizarea EFA n cazul
variabilelor vor duce la rezultate eronate n cazul utilizri EFA pentru itemi. Scopul acestui articol este de a oferi
informaii relevante despre aspectele care trebuie luate n calcul atunci cnd EFA este utilizat n cazul itemilor.
Practic, acest articol prezint o serie de recomandri legate de deciziile privind determinarea necesitii de a aplica EFA, eantionul utilizat, alegerea unei metode de extracie a factorilor, selectarea numrului optim de factori,
rotirea factorilor i identificarea factorilor fali. La final este realizat o sintez a recomandrilor fcute pe par-

Universitatea de Vest din Timioara.


Adres de coresponden: paul.sarbescu@gmail.com
102

Volumul_10_nr_01.qxd

4/17/2012

1:10 PM

Page 103

Folosirea analizei factoriale exploratorii n cazul itemilor: Aspecte specifice i recomandri

cursul articolului, sunt prezentate principalele tehnici pentru formarea pachetelor de itemi, ct i un ghid pentru
realizarea unei analize paralele din sintaxa programului SPSS.
Cuvinte-cheie: Analiza factorial exploratorie, pachete de itemi, analiza paralel

Introducere
Analiza factorial exploratorie (EFA) este
una dintre cele mai utilizate tehnici statistice din
tiinele sociale. Scopul principal al acesteia
este identificarea numrului i a naturii factorilor care stau la baza unui set de variabile manifeste (Little, Cunningham, Shahar i Widaman,
2002; Bandalos, 2008; Sava, 2011).
Cu toate c tehnica a fost dezvoltat acum
mai bine de un secol i a fost aplicat constant
n diverse scopuri (dezvoltarea unor teorii ale
personalitii, construirea unor instrumente psihometrice), muli autori au criticat modalitatea
de aplicare a EFA (Armstrong, 1967; Gould,
1981). De asemenea, unele revizuiri ale
cercetrilor publicate n literatura de specialitate
ce folosesc EFA au scos la iveal carene evidente la nivelul deciziilor luate de autori n
derularea acestei tehnici statistice (Ford, MacCallum i Tait, 1986; Fabrigar, Wegener, MacCallum, i Strahan, 1999).
n cazul utilizrii analizei factoriale exploratorii pentru dezvoltarea/adaptarea cultural a
unor instrumente psihometrice, exist mai multe
aspecte ce trebuie luate n considerare, pentru a
evita obinerea unor rezultate distorsionate. Utilizarea EFA n cazul itemilor n acelai fel ca n
cazul variabilelor poate conduce, destul de des,
la obinerea unor structuri factoriale inadecvate.
Acest lucru se datoreaz, n principal, particularitilor specifice ale itemilor (Gorsuch, 1997).
Articolul de fa cuprinde o trecere n
revist a aspectelor specifice ale folosirii EFA n
cazul itemilor, urmat de o analiz a deciziilor
ce trebuiesc luate n cazul utilizrii EFA cu
itemi. Acest decizii sunt legate de: determinarea
necesitii de a aplica EFA, eantionul utilizat,
alegerea unei metode de extracie a factorilor,
selectarea numrului optim de factori, rotirea
acestora i identificarea factorilor fali. La final
sunt prezentate cteva informaii legate de formarea pachetelor de itemi, iar ncheierea este
format dintr-un set de concluzii i recomandri.

Aspecte specifice ale folosirii analizei factoriale exploratorii n cazul itemilor


Utilizarea EFA n cazul itemilor trebuie
fcut innd cont de faptul c itemii au proprieti diferite fa de scale, i necesit astfel
tehnici specifice, pentru evitarea obinerii unor
rezultate eronate. Prezentm n continuare principalele diferene dintre itemi i scale, ce pot
influena rezultatele unei analize factoriale
exploratorii (Gorsuch, 1997):
a) Itemii au o fidelitate mai sczut dect
scalele; combinarea unui set de itemi cu fidelitate sczut reduce eroarea itemilor prin combinarea varianei comune. Astfel, este mult mai
dificil de lucrat cu corelaiile dintre itemi,
deoarece acestea sunt mai sczute dect corelaiile dintre scale. Din aceast cauz, factorii
sunt mai instabili n cazul utilizrii EFA cu itemi
dect n cazul utilizrii EFA cu scale.
b) Itemii conin deseori varian strin
constructului care este msurat. Aproape orice
item din orice scal conine o fraz sau un
cuvnt care poate fi interpretat de cineva ntr-o
manier idiosincratic. Scalele diminueaz
aceste erori minore prin nsumarea confuziilor
aferente itemilor, astfel normalizndu-le.
c) Distribuiile itemilor difer frecvent
unele de altele, de multe ori n mod intenionat.
Pentru a putea surprinde toate variaiile unui
construct este necesar prezena unor itemi cu
medii care variaz de-a lungul scalei de rspuns.
Itemii cu mediile situate la extreme au, n general, distribuii asimetrice; aceste distribuii influeneaz corelaiile dintre itemi deoarece o corelaie poate fi puternic i pozitiv doar dac
itemii care sunt corelai au aceeai distribuie.
Astfel, prezena diferitelor distribuii reduce
valoarea corelaiilor dintre itemi. Scalele sunt
formate prin nsumarea unor itemi, normaliznd
astfel distribuiile; deci, scalele prezint n general corelaii mai ridicate dect itemii.
d) Rspunsurile la itemi sunt aproape tot
timpul formate dintr-o serie de categorii (dihotomice sau scale de tip Likert cu 5-7 variante), i

103

Volumul_10_nr_01.qxd

4/17/2012

1:10 PM

Page 104

Folosirea analizei factoriale exploratorii n cazul itemilor: Aspecte specifice i recomandri

foarte rar dintr-o scal de valori continu. Din


cauza faptului c valorile nu au o amplitudine
mai mare (ex. de la 0 la 50), rspunsurile la un
item pot reflecta doar diferene majore ntre
indivizi, privind constructul msurat (ex. chiar
dac 40 de persoane obin valoarea 4 la un anumit item, vor exista anumite diferene ntre ei,
privind constructul msurat, iar aceste diferene
ar putea fi identificate de un alt item). Deoarece
scorurile scalelor reprezint suma itemilor componeni, scalele funcioneaz mai degrab ca o
variabil continu, avnd astfel o mai bun posibilitate de difereniere ntre indivizi.
Din cauza acestor diferene, realizarea unei
analize factoriale exploratorii pe un set de itemi
n acelai fel ca pe un set de variabile va duce,
foarte des, la obinerea unor rezultate distorsionate. Sugestiile din literatura de specialitate pentru folosirea EFA n cazul itemilor (mai ales
atunci cnd distribuiile itemilor deviaz substanial de la normalitate) sunt urmtoarele
(Bernstein i Teng, 1989; Panter, Swygert,
Dahlstrom i Tanaka, 1997; OConnor, 2000):
pentru datele dihotomice, este recomandat
efectuarea analizei factoriale folosind matricea
corelaiilor de tip tetrachoric dintre itemi, n
locul matricii de corelaii Pearson. Pentru itemii
ce folosesc scale de tip Likert, este recomandat
efectuarea analizei factoriale folosind matricea
corelaiilor de tip polychoric dintre itemi, n
locul matricii de corelaii Pearson.
Corelaiile de tip tetrachoric i polychoric se
bazeaz pe presupunerea c toate categoriile de
rspuns (dihotomice sau scal de tip Likert) sunt
de fapt indicatori pentru variabile latente, care au
o distribuie normal. Analizele factoriale a matricelor de corelaie de tip tetrachoric sau polychoric sunt, n esen, analize factoriale a relaiilor dintre variabilele care stau la baza datelor
brute, i care se presupune c sunt continue i au
o distribuie normal (Panter i colab., 1997). Din
pcate, SPSS-ul nu ofer posibilitatea realizrii
EFA asupra unor astfel de matrici de corelaie.
n schimb, alte programe precum FACTOR*
(Lorenzo-Seva i Ferrando, 2006) ofer posibili-

tatea realizrii EFA pe matrici de corelaie de tip


tetrachoric i polychoric.
O alt recomandare pentru situaia n care
avem de-a face cu date dihotomice (dar nu
numai) este formarea pachetelor de itemi. Prin
intermediul acestei metode se grupeaz i se
analizeaz mai muli itemi mpreun, renunndu-se astfel la utilizarea itemului n sine ca unitate de msur (Bandalos, 2008; Sava, 2011).
Mai multe informaii despre situaiile cnd este
recomandat formarea pachetelor de itemi, ct
i despre principalele tehnici de formare a acestora, vor fi oferite ctre finalul acestui articol.

Principalele decizii n cazul folosirii


analizei factoriale exploratorii
Determinarea necesitii
de a aplica EFA
nainte de a trece efectiv la aplicarea EFA,
orice cercettor ar trebui s fie sigur c aceast
tehnic statistic este cea necesar pentru atingerea obiectivelor studiului (Fabrigar i colab.,
1999). Astfel, n cazul dezvoltrii unui nou
instrument psihometric, utilizarea EFA este
necesar pentru a identifica unidimensionalitatea sau multidimensionalitatea setului de itemi
supus analizei, i implicit structura factorial a
probei. De asemenea, n cazul adaptrii culturale a unui test, EFA poate fi utilizat la primele
aplicri ale probei, pentru a verifica n ce
msur structura factorial originar a probei
este reprodus pe populaie romneasc; de asemenea, ulterior aplicrii EFA este necesar i
aplicarea analizei factoriale confirmatorii (eng.
confirmatory factor analysis sau CFA), pentru
confirmarea modelului factorial al probei
respective. n schimb, n cazul n care o prob a
fost adaptat cu succes i utilizat intensiv,
folosirea EFA nu mai are foarte mare relevan,
n aceste situaii fiind mult mai indicat utilizarea CFA, pentru a verifica invariana instrumentului respectiv (Sava, 2011).

* Programul i instruciunile de utilizare sunt disponibile gratuit pe internet la adresa: http://psico.fcep.urv.es/utilitats/


factor/index.html.
104

Volumul_10_nr_01.qxd

4/17/2012

1:10 PM

Page 105

Folosirea analizei factoriale exploratorii n cazul itemilor: Aspecte specifice i recomandri

Eantionul utilizat
Pentru selectarea unui eantion adecvat trebuie avute n vedere dou aspecte: caracteristicile i volumul su (Gorsuch, 1997). Legat de
caracteristicile eantionului, soluia optim ar
consta n selectarea unui lot de omogenitate
medie, deoarece eantioanele foarte omogene
sau foarte eterogene pot conduce la obinerea
unor soluii factoriale incorecte. De asemenea,
foarte important este i similaritatea dintre
lotul utilizat i populaia int pe care va fi aplicat proba (ex. dac testul va fi aplicat pe femei
de peste 50 de ani, atunci lotul utilizat pentru
dezvoltarea/adaptarea cultural a probei ar trebui s fie format din femei de peste 50 de ani;
dac testul urmeaz s fie aplicat elevilor de
liceu, atunci lotul utilizat ar trebui s fie format
din elevi de liceu). Din pcate, n majoritatea
studiilor de acest gen sunt utilizate eantioane
formate din studeni, n special cei de la tiine
sociale, probabil din cauza gradului mare de
accesibilitate (ITC, 2010). Eantioanele astfel
construite au n general anumite caracteristici
(vrste ntre 19 i 25 de ani, preponderena
genului feminin etc.), care nu sunt ntotdeauna
adecvate pentru dezvoltarea/adaptarea oricrui
tip de instrument psihometric.
Legat de volumul eantionului, trebuie
menionat faptul c orice regul fix nu este valabil i nici foarte folositoare (Gorsuch, 1997;
MacCallum, Widaman, Zhang i Hong, 1999).
Att numrul minim de participani, ct i raportul minim participani-itemi necesare pentru a
asigura o analiz optim variaz n funcie de
anumite caracteristici ale itemilor inclui n
studiu; mai exact, acestea variaz n principal n
funcie de nivelul comunalitii itemilor, care se
afl ntr-o relaie invers proporional cu volumul eantionului. n cazul utilizrii EFA cu variabile (care au de obicei un nivel al comunaliti
mai ridicat dect itemii), soluii factoriale
optime au fost identificate pe eantioane mai
mici de 100 de persoane, avnd un raport participani-variabile de numai 3:1. n cazul utilizrii
EFA cu itemi, sunt n general necesare
eantioane mai mari (minim 100 de participani,
preferabil peste 200), i un raport participaniitemi de cel puin 5:1 (MacCallum i colab.,
1999; de Winter, Dodou i Wieringa, 2009;
Sava, 2011). Evident, dup cum menionam

anterior, aceste indicaii nu trebuie interpretate


ca nite reguli rigide, peste care nu se poate
trece sub nici o form (ex. structura factorial a
unui test de 12 itemi ce msoar 2 faete ale
aceluiai factor, are mari anse s fie reprodus
cu succes chiar i pe un eantion de 70-80 de
participani; de asemenea, structura factorial a
unui test multidimensional de 110 itemi este
foarte probabil s fie identificat pe un lot de
400 de participani, adic la un raport participani-itemi mai mic de 4:1)
Alegerea unei metode de extracie
a factorilor
Una dintre cele mai importante diferene
care trebuie menionat atunci cnd discutm
despre metodele de extracie a factorilor este
aceea dintre analiza componentelor principale
(eng. principal component analysis sau PCA)
i analiza factorilor comuni (AFC; eng. common factor analysis). O prim diferen dintre
cele dou se observ la nivelul modului de analiz a datelor. AFC identific trei surse ale variaiei datelor: factorii comuni, factorii specifici i
erorile de msurare, gruparea ultimelor dou formnd variana unic. n opoziie, PCA nu diferenieaz ntre variana comun i variana unic,
dispersia datelor avnd la baz dou surse: dispersia explicat i cea datorat erorilor de
msurare. De asemenea, teoria de la baza PCA
nu specific existena unor factori comuni,
folosind ca substitut termenul de component
principal (Fabrigar i colab., 1999; Sava, 2011).
O alt diferen dintre cele dou metode este
identificat la nivelul scopului fiecreia. Dac
obiectivul AFC este de a explica corelaiile dintre o serie de variabile manifeste prin determinarea unui numr restrns de factori care s le
influeneze, scopul PCA este de explica ct mai
mult din totalul dispersiei variabilelor manifeste
prin identificarea unui numr restrns de componente principale (Hogarty, 2005; Sava, 2011).
Astfel, avnd n vedere faptul c obiectivul
PCA nu este acela de a identifica factori comuni care s influeneze o serie de variabile manifeste, iar componentele principale nu sunt variabile latente, putem afirm faptul c PCA nu
este o metod de analiz factorial i, n consecin, nu ar trebui utilizat atunci cnd dorim

105

Volumul_10_nr_01.qxd

4/17/2012

1:10 PM

Page 106

Folosirea analizei factoriale exploratorii n cazul itemilor: Aspecte specifice i recomandri

realizarea unei analize factoriale exploratorii*


(Fabrigar i colab., 1999).
Cele mai utilizate metode de extragere
specifice EFA sunt analiza factorilor principali
(eng. principal axis factoring), factorizarea
Alpha (eng Alpha factoring) i analiza factorial bazat pe estimarea verosimilitii maxime
(eng. maximum likelihood factor analysis sau
ML FA). Prima prezint avantajul de a nu fi
foarte pretenioas n ceea ce privete prezena
unei distribuii multivariate normale a datelor;
cea de-a doua este orientat pe maximizarea
fidelitii ( Cronbach), iar cea de-a treia, dei
sensibil la forma distribuiei datelor, prezint
marele avantaj de a testa gradul de semnificaie
statistic a saturaiei factorilor i corelaiei dintre factorii extrai (Fabrigar i colab., 1999,
Sava, 2011). Din pcate, din multitudinea de
indicatori descriptivi pe care metoda i poate
oferi, SPSS-ul ofer doar testul de estimare a
raportului verosimilitii (eng. likelihood ratio
test sau LRT), bazat pe o distribuie , foarte
sensibil la volumul eantionului, care tinde s
supraestimeze numrul de factori care trebuie
extrai (Hayashi, Bentler i Yuan, 2007). n
schimb, programul CEFA** (Browne, Cudeck,
Tateneni i Mels, 2008) ofer toi indicatorii
afereni acestei metode, fiind astfel indicat n
cazul n care dorim s folosim metoda ML FA.
Selectarea numrului optim de factori
Probabil cea mai cunoscut i utilizat
metod pentru selectarea numrului de factori
este criteriul lui Kaiser. Metoda presupune
selectarea unui numr de factori comuni egal cu
numrul de eigenvalue mai mari dect 1. Chiar
dac metoda funcioneaz acceptabil atunci
cnd EFA este folosit n cazul variabilelor, n
cazul utilizrii EFA pentru itemi metoda va produce n majoritatea situaiilor soluii eronate,
supraestimnd numrul de factori care trebuie
selectai (Fabrigar i colab., 1999; Henson,
2006). Astfel, folosirea acestei metode atunci

cnd utilizm EFA pentru dezvoltarea/adaptarea


cultural a unor probe este contraindicat.
O alt metod la fel de cunoscut este criteriul grafic al lui Cattel. n aceast procedur,
valorile eigenvalue calculate sunt reprezentate
grafic n ordine descresctoare, iar graficul este
inspectat pentru a se identifica ultima scdere
substanial a intensitii eigenvalue (aa-numitul punct de cotitur), dup care se selecteaz
un numr de factori comuni egal cu numrul de
eigenvalue situai deasupra punctului de cotitur
(Fabrigar i colab., 1999). Metoda funcioneaz
bine n situaiile n care factorii comuni prezeni
sunt foarte bine reprezentai. Dezavantajele ei
apar atunci cnd punctul de cotitur nu este
foarte evident, sau n momentul n care exist
mai multe scderi brute ale intensitii eigenvalue, deoarece nu exist o explicaie obiectiv
a ceea ce nseamn o scdere substanial n
intensitate (Sava, 2011).
Una dintre cele mai precise metode pentru
selectarea numrului optim de factori este metoda analizei paralele (Horn, 1965). Aceasta se
bazeaz pe compararea intensitii eigenvalue
dintre datele reale i un set de date aleatoare,
urmat de selectarea unui numr de factori comuni egal cu numrul valorilor eigenvalue reale care
sunt mai mari dect valorile eigenvalue aleatoare
(Hayton, Allen i Scarpello, 2004). Chiar dac
metoda ofer rezultate valide n majoritatea situailor, exist i anumite situaii particulare (ex.
numr foarte mare de itemi, multe comunaliti
foarte sczute: < .30) cnd analiza paralel tinde
s supraestimeze uor numrul de factori care trebuie selectai (Buja i Eyuboglu, 1992). Un dezavantaj major legat de accesibilitatea analizei paralele este reprezentat de faptul c metoda nu se
poate realiza din programul SPSS fr apelul la
sintax (Anexa 1 prezint un ghid simplificat
pentru realizarea unei analize paralele folosind
sintaxa SPSS-ului).
O metod care ctig din ce n ce mai mult
teren n faa abordrilor clasice este selectarea

* Programul SPSS nu permite realizarea PCA n varianta clasic; sub denumirea de principal component method programul realizeaz o analiz factorial a componentelor principale. Diferena dintre cele dou este minim, opiunea din SPSS
introducnd o surs suplimentar de eroare, lucru ce o face i mai puin dezirabil.
** Programul mpreun cu manualul de utilizare sunt disponibile gratuit pe internet la adresa: http://faculty.psy.ohiostate.edu/browne/software.php.
106

Volumul_10_nr_01.qxd

4/17/2012

1:10 PM

Page 107

Folosirea analizei factoriale exploratorii n cazul itemilor: Aspecte specifice i recomandri

numrului de factori n funcie de indicatorii


descriptivi oferii de analiza factorial bazat pe
estimarea verosimilitii maxime (ML FA).
Aceast metod ofer indicatori prezeni i n
analiza factorial confirmatorie. Cel mai potrivit indicator absolut este RMSEA (eng. root
mean squared error of aproximation), care
reprezint o estimare a discrepanei dintre modelul testat i datele folosite, pe gradele de libertate ale modelului (Sass, 2009). n plus, este
oferit i un interval de ncredere pentru valoarea
calculat. Interpretarea sa se face n felul urmtor: dac limita maxim a intervalului nu
depete 0.08 avem un model bun, dac nu
depete 0.10 avem un model acceptabil, iar
dac depete 0.10 avem un model deficitar
(Fabrigar i colab., 1999). Un alt indicator este
ECVI (eng. expected cross validation index),
care estimeaz gradul de generalizare al soluiei
obinute la alte eantioane. Dei nu exist valori
absolute pentru interpretarea ECVI, acesta este
util n compararea modelelor alternative, valorile mai mici artnd un grad de generalizare
mai ridicat. Un indicator considerat problematic
i, n consecin, contraindicat pentru selectarea
numrului de factori, este testul de estimare a
raportului verosimilitii (LRT), din cauza
supraestimrii numrului de factori care trebuie
selectai (Hayashi, Bentler i Yuan, 2007).
Prezentm n continuare o situaie practic
n care criteriul lui Kaiser supraestimeaz

numrul de factori ce trebuie extrai, n timp ce


criteriul grafic al lui Cattel i analiza paralel
sugereaz soluia optim. Exemplul este extras
din procesul de validare al Scalei de ndeplinire
a nevoilor la locul de munc (Need Satisfaction
at Work Scale NSWS; Van den Broeck,
Vansteenkiste, De Witte, Lens & Soenens, 2010)
n Romnia. Autorii scalei au identificat o structur factorial format din trei factori: nevoia de
autonomie, de competen i de relaionare.
Primele 5 valori eigenvalue extrase sunt:
5.31, 2.53, 1.93, 1.27 i 0.97. Scree plot-ul obinut este prezentat n figura 1, iar rezultatele analizei paralele sunt prezentate grafic n figura 2.
Dup cum se poate observa n cazul scree
plot-ului, punctul de cotitur este situat dup
cel de-al treilea factor. De asemenea, analiza
paralel arat c primele trei valori eigenvalue
reale sunt mai mari dect valorile eigenvalue
aleatoare. Astfel, ambele metode sugereaz o
soluie cu trei factori. n schimb, criteriul lui
Kaiser sugereaz o soluie cu patru factori
(supraestimnd numrul de factori care trebuie
extrai), deoarece exist patru valori eigenvalue
mai mari dect 1. Un ultim aspect ce trebuie discutat se refer la situaiile cnd este selectat un
numr greit de factori. n literatura de specialitate exist un consens cu privire la acest aspect:
subestimarea numrului de factori este o eroare
mult mai grav dect supraestimarea acestora
(Fava i Velicer, 1992; Wood, Tataryn i Gor-

Figura 1. Scree plot-ul pentru NSWS

107

Volumul_10_nr_01.qxd

4/17/2012

1:10 PM

Page 108

Folosirea analizei factoriale exploratorii n cazul itemilor: Aspecte specifice i recomandri

Figura 2. Rezultatele analizei paralele pentru NSWS

such, 1995). Cnd se produce subestimarea, factorii selectai vor conine un nivel de eroare considerabil, deoarece itemii care ar fi trebuit s
ncarce factorii care nu au fost extrai pot ncrca incorect factorii extrai. De asemenea, nivelul de saturaie al itemilor care ar ncrca n mod
normal factorii extrai poate fi afectat. Astfel,
nivelul de eroare regsit n model crete direct
proporional cu numrul de factori subestimai.
n schimb, cnd se produce supraestimarea,
nivelul de saturaie pentru factorii autentici
conine, n general, mai puin eroare dect n
cazul subestimrii. De asemenea, supraestimarea cu doi, trei sau chiar patru factori induce
aproximativ la fel de mult eroare n model ca i
supraestimarea cu un singur factor (Wood i
colab., 1995).
Rotirea factorilor
Pentru a ajunge la o structur factorial ct
mai adecvat trebuie utilizat criteriul structurii
simple definit de Thurstone. Acest lucru nseamn c din multitudinea de rotaii posibile, cea
care va avea cea mai bun structur simpl va
avea o semnificaie psihologic real, va fi cea
mai uor de interpretat i de replicat. Practic,
structura simpl se refer la o soluie n care
fiecare item obine saturaii ridicate ntr-un singur factor i saturaii reduse n ceilali factori
(Fabrigar i colab., 1999).
Pentru obinerea structurii simple au fost
dezvoltate o serie de rotiri ale factorilor. Cea

108

mai important distincie ntre acestea le


mparte n rotiri ortogonale i rotiri oblice
(Browne, 2001). Rotirile ortogonale constrng
factorii s rmn necorelai, pe cnd rotirile
oblice permit factorilor s coreleze ntre ei.
Din categoria rotirilor ortogonale, rotirea
Varimax este de departe cea mai popular i cea
mai des utilizat. Cu toate c n foarte multe
situaii aceast rotire a produs rezultate adecvate, folosirea ei (i a oricrei rotiri de tip ortogonal) n situaia utilizrii EFA n cazul itemilor
nu este indicat (Gorsuch, 1997). Principalul
motiv care conduce la aceast recomandare este
legat de faptul c, n general, factorii msurai
de un anumit instrument pihometric tind s
coreleze ntre ei. Chiar i n situaiile n care factorii au o anumit independen, tot exist corelaii de magnitudini sczute (pn la .30) ntre
acetia. De aceea, este mult mai indicat utilizarea rotirilor de tip oblic pentru a ajunge la
cea mai simpl structur factorial.
Spre deosebire de rotirile ortogonale, nu
exist nici o rotire oblic care s domine n
cercetrile psihologice. Cele mai utilizate rotiri
oblice sunt: Direct Quartimin, Promax i rotirea
orto-oblic Harris-Kaiser (Fabrigar i colab., 1999;
Browne, 2001). Rotirile Promax i Harris-Kaiser
se regsesc n SPSS n mod direct, iar rotirea
Direct Oblimin (din SPSS) cu valoarea delta
prestabilit la zero corespunde unei rotiri Direct
Quartimin. Att programul CEFA ct i programul
FACTOR ofer o gam mult mai larg de rotiri.

Volumul_10_nr_01.qxd

4/17/2012

1:10 PM

Page 109

Folosirea analizei factoriale exploratorii n cazul itemilor: Aspecte specifice i recomandri

Mai trebuie menionat faptul c utilizarea


unei rotiri oblice nu necesit ca factorii s fie
corelai. Dac soluia cu cea mai bun structur
simpl implic factori ortogonali, o rotire oblic
va oferi valori ale corelaiilor dintre factori
apropiate de zero i va produce o soluie factorial apropiat de cea a unei rotiri ortogonale (Fabrigar i colab., 1999). Deci, n cazul utilizrii
EFA pentru dezvoltarea/adaptarea cultural a
unei probe este mult mai indicat folosirea unei
rotiri de tip oblic, dect a uneia de tip ortogonal.
Identificarea factorilor fali
n situaia n care dup efectuarea rotirii
apar factori fali, acetia trebuie identificai i
respini. n prezent, nu exist reguli clare pentru
identificarea acestor factori fali; totui, prezentm patru indicii care v-ar putea ajuta n luarea
unei decizii legate de autenticitatea factorilor
extrai (Wood i colab., 1995):
a) gradul de saturaie al itemilor este mult
mai probabil ca factorii n care itemii sunt puternic saturai s fie autentici, dect factorii ce
prezint saturaii sczute ale itemilor;
b) valorile corelaiilor dintre itemii care
ncarc ntr-un factor este foarte probabil ca un
factor s fie autentic dac itemii care l ncarc
sunt corelai ntre ei;
c) semnificaia factorului dac itemii care
sunt puternic saturai ntr-un factor prezint
asemnri evidente ntre ei, atunci este mult mai
probabil ca factorul s fie autentic, dect dac
similaritile ntre itemii respectivi sunt aproape
inexistente;
d) replicabilitatea factorului dac un factor apare n mai multe analize factoriale realizate pe eantioane diferite, este destul de probabil ca acesta s fie autentic. Factorii fali ar
trebui s fie instabili n eantioane diferite, pe
cnd factorii autentici ar trebui s fie replicai.
Practic, dac nici unul dintre elementele
prezentate mai sus nu este prezent, atunci este
foarte probabil ca factorul respectiv s fie fals, i
trebuie eliminat. Dac cel puin dou elemente
sunt prezente, factorul are anse foarte mari de a
fi autentic, i ar trebui reinut. Dac doar un singur element este prezent, atunci factorul respectiv
ar trebui etichetat ca fiind discutabil, necesitnd cercetri ulterioare (Wood i colab., 1995).

Formarea pachetelor de itemi


O tehnic foarte des utilizat, att n cazul
analizei factoriale exploratorii ct i n cazul
celei confirmatorii, este formarea pachetelor de
itemi. Aceasta presupune gruparea mai multor
itemi mpreun dup anumite criterii, i
folosirea ulterioar a acestora ca variabile manifeste n EFA sau CFA (Little i colab., 2002;
Sava, 2011). Formarea pachetelor de itemi
depinde n exclusivitate de obiectivele studiului
i de instrumentele folosite. Dac scopul
cercetrii este de a identifica efectele unei variabile latente la un nivel superior de generalitate,
atunci formarea pachetelor de itemi poate
reduce sau neutraliza efectele perturbatoare ale
factorilor aflai la un nivel inferior de generalitate. n aceste situaii, formarea pachetelor de
itemi este indicat, poate chiar necesar. n
schimb, dac scopul studiului este de a verifica
particularitile constructului msurat la nivelul
itemilor individuali, atunci minimizarea
efectelor de nivel inferior ar tinde s ascund
exact efectele dorite a fi studiate. n aceste situaii, formarea pachetelor de itemi este contraindicat (Little i colab., 2002).
n cazul n care pentru atingerea obiectivelor
studiului este necesar formarea pachetelor de
itemi, exist un aspect foarte important care trebuie luat n considerare: dimensionarea setului
de itemi trebuie determinat naintea formrii
pachetelor (Little i colab., 2002). Att n cazul
adaptrii culturale a unui test, i cu att mai mult
n cazul dezvoltri unui nou instrument psihometric, este necesar aplicarea unei analize factoriale exploratorii pentru a determina dac setul de
itemi este unidimensional sau multidimensional.
Acest lucru este important deoarece tehnicile de
formare a pachetelor de itemi difer n funcie de
dimensionarea setului de itemi supui analizei.
Vom prezenta n continuare cinci tehnici de formare a pachetelor de itemi, primele trei fiind
pentru seturi unidimensionale de itemi, iar
ultimele dou pentru seturi multidimensionale de
itemi (Little i colab., 2002):
a) Repartizarea aleatoare const n distribuirea fiecrui item, ntr-un mod aleator, ctre
unul dintre pachete. Aceast tehnic ar trebui s
duc la formarea unor pachete care conin, n

109

Volumul_10_nr_01.qxd

4/17/2012

1:10 PM

Page 110

Folosirea analizei factoriale exploratorii n cazul itemilor: Aspecte specifice i recomandri

aproximativ aceeai msur, dispersie datorat


factorului comun.
b) Ponderarea item-construct are ca scop
construirea unor pachete echilibrate, din punct
de vedere al relaiei item-construct. Se realizeaz n felul urmtor: presupunem c avem un
set unidimensional de 12 itemi, i dorim s formm 3 pachete; folosind nivelul de saturaie al
itemilor ca i criteriu, se aleg primii trei itemi cu
cel mai ridicat nivel de saturaie (ex. itemii 5, 8
i 11) i se distribuie (n ordine) celor trei
pachete (itemul 5 pachetului 1, itemul 8
pachetului 2 i itemul 11 pachetului 3). Se continu prin selectarea urmtorilor trei itemi (ex.
itemii 1, 7 i 12) i distribuirea lor n cele trei
pachete, dar n ordine invers (itemul cu saturaia cea mai ridicat se distribuie pachetului ce
coninea itemul din seria anterioar cu saturaia
cea mai sczut: itemul 1 pachetului 3, itemul 7
pachetului 2 i itemul 12 pachetului 1). Algoritmul continu pn la epuizarea numrului de
itemi analizai.
c) Reducerea erorii de aprobare const n
gruparea n acelai pachet a unor itemi formulai
pozitiv cu itemi formulai negativ, dup ce
acetia din urm au fost codai invers (ex. dac
avem un set unidimensional de 16 itemi, dintre
care 8 sunt formulai pozitiv i 8 negativ, i
dorim s formm 4 pachete, vom include n
fiecare pachet 2 itemi formulai pozitiv i 2 formulai negativ). Scopul acestei tehnici este
reducerea bias-ului negativ vs. pozitiv, legat de
constructul care este msurat.
d) Abordarea consistenei interne const
n crearea pachetelor folosind faetele constructului msurat ca i criteriu de grupare, i se realizeaz astfel: presupunem c avem un set multidimensional de 16 itemi ce conine 4 faete (A,
B, C i D), fiecare msurat prin 4 itemi (A: 1 4, B: 5 - 8, C: 9 - 12, D: 13 - 16); primul pachet
ar reflecta faeta A, i ar fi format din itemii 1, 2,
3 i 4; cel de-al doilea pachet ar reflecta faeta B,
i ar fi format din itemii 5, 6, 7 i 8, .a.m.d..
e) Abordarea domeniului caracteristic
const n combinarea itemilor ce aparin unor
faete diferite pentru a forma pachete (folosind
exemplul anterior, fiecare pachet ar conine cte
un item din fiecare faet msurat: primul
pachet ar conine itemii 1, 5, 9 i 13, cel de-al

110

doilea itemii 2, 6, 10 i 14, etc.). Aceast tehnic


ncearc s explice multidimensionalitatea prin
crearea unor pachete care cuprind nu numai variana comun (ca n abordarea consistenei
interne), dar i variana aferent faetelor unice
ale multiplelor dimensiuni.
ncheiem aceast seciune prin menionarea
unor aspecte complementare legate de formarea
pachetelor de itemi: numrul de itemi afereni
unei pachet poate varia ntre 3 i 6 (Little i
colab., 2002; Bandalos, 2008). Alegerea
numrului de pachete ce urmeaz a fi formate
depinde att de numrul total de itemi utilizai,
ct i de raportul itemi factori. De exemplu, nu
ar avea nici un sens ca pentru un test unidimensional de 12 itemi s formm 6 pachete a cte 2
itemi fiecare, fiind mult mai indicat s formm
3 pachete a cte 4 itemi fiecare. De asemenea,
pentru un test multidimensional de 40 itemi
cte 10 pentru fiecare faet, am putea: a) s
folosim abordarea consistenei interne, i am
forma 8 pachete cte dou pentru fiecare
faet, fiecare fiind compus din 5 itemi; b) s
folosim abordarea domeniului caracteristic, i
atunci am putea forma cte pachete dorim, dar
ar trebui s ne asigurm c fiecare pachet
conine itemi din fiecare faet i, preferabil,
fiecare faet este prezent n fiecare pachet n
aceeai msur (Little i colab., 2002).
De asemenea, mai trebuie s menionm
faptul c tehnicile pentru seturi multidimensionale de itemi pot fi aplicate n condiiile n care
instrumentul msoar faete ale aceluiai construct (ex. agresivitatea msurat prin faetele
agresivitate fizic, verbal, furie i ostilitate). n
cazul n care instrumentul msoar factori care
au o anumit independen (ex. un test care
msoar factorii modelului Big Five de personalitate, fr a msura ns i faetele lor), se
recomand folosirea unor tehnici de formare a
pachetelor unidimensionale pentru itemii afereni fiecrui factor n parte. n schimb, n cazul
unui test ce msoar i faetele modelului Big
Five, se poate aplica una dintre tehnicile multidimensionale de formare a pachetelor pentru
fiecare factor (cu faetele aferente), dup modelul prezentat n exemplul anterior.

Volumul_10_nr_01.qxd

4/17/2012

1:10 PM

Page 111

Folosirea analizei factoriale exploratorii n cazul itemilor: Aspecte specifice i recomandri

Concluzii
Scopul acestui articol a fost oferirea de
informaii relevante despre aspectele care trebuie luate n considerare atunci cnd analiza
factorial exploratorie este utilizat n cazul
itemilor. Toate informaiile i sugestiile prezentate au ca scop mbuntirea calitii utilizrii
EFA, n procesul de adaptare cultural sau dezvoltare a testelor. Astfel, acest articol poate fi
folositor att cercettorilor care se ocup cu dezvoltarea sau adaptarea cultural a instrumentelor
psihometrice pe populaie romneasc, ct i
studenilor (n principal masteranzi sau doctoranzi) a cror teme de disertaie/doctorat includ
astfel de analize.
La finalul acestui articol prezentm un set
de recomandri sub form de ghid, bazat pe
informaiile anterioare, legat de modalitatea optim de aplicare a EFA n cazul dezvoltrii/ adaptrii culturale a instrumentelor psihometrice:
1. Verificai dac EFA este tehnica statistic
de care avei nevoie pentru atingerea obiectivelor studiului.
2. Selectai un eantion care s respecte att
criteriile legate de volum (un raport participaniitemi de minim 5:1) ct i legate de caracteristici (omogenitate medie i similaritate ntre
eantion i populaia int a probei).
3. Verificai (pentru precauie) valorile
Skweness i Kurosis ale itemilor nainte de a
ncepe analiza. Dac valorile indic pentru mai
muli itemi distribuii ce deviaz substanial de
la normalitate, putei continua analiza din programul SPSS (asumndu-v riscul de a obine o
structur factorial neadecvat), sau putei apela
la programul FACTOR.
4. Realizai o EFA din programul SPSS,
urmnd urmtoarele recomandri: metod de
extracie analiza factorilor principali; metod
de selecie criteriul lui Kaiser (dei nu este o
soluie adecvat, se poate folosi n cazul realizrii unei EFA incipient, doar pentru a verifica
ci factori selecteaz programul fr nici o constrngere); rotire Direct Oblimin (cu valoarea
zero pentru delta).
5. Verificai scree plot-ul obinut i apoi
realizai o analiz paralel din sintaxa programului SPSS, folosind ghidul din Anexa 1. Dac
soluia indicat de analiza paralel este susinut

i de scree plot, putei fi destul de sigur c e


soluia corect. Dac cele dou difer, vei alege
soluia care are cel mai ridicat grad de interpretabilitate. n cazul n care ambele soluii au
un nivel sczut de interpretabilitate, putei ncerca realizarea EFA utiliznd unul dintre programele indicate n seciunile anterioare.
6. Realizai din nou o EFA, selectnd de
aceast dat numrul de factori indicat de
soluia aleas anterior. Matricea structurii factoriale va conine structura pe care o vei analiza.
7. Nu uitai ca n momentul n care vei
raporta rezultatele obinute s menionai toate
alegerile fcute, incluznd o justificare succint
pentru fiecare.

Bibliografie
Armstrong, J. S. (1967). Derivation of theory by means
of factor analysis or Tom Swift and his electric
factor analysis machine. The American Statistician, 21(1), 17-21.
Bandalos, D. L. (2008). Is Parceling Really Necessary?
A Comparison of Results From Item Parceling and
Categorical Variable Methodology. Structural
Equation Modeling: A Multidisciplinary Journal,
15(2), 211-240.
Bernstein, I. H., Teng, G. (1989). Factoring items and
factoring scales are different: Spurious evidence
for multidimensionality due to item categorization. Psychological Bulletin, 105, 467-477.
Browne, M. W. (2001). An Overview of Analytic Rotation in Exploratory Factor Analysis. Multivariate
Behavioral Research, 36(1), 111-150.
Browne, M. W., Cudeck, R., Tateneni, K. & Mels G.
(2008). CEFA: Comprehensive Exploratory Factor
Analysis, Version 3.03 [Computer software and
manual]. Gsit la adresa: http://faculty.psy.ohiostate.edu/browne.
Buja, A., & Eyuboglu, N. (1992). Remarks on parallel
analysis. Multivariate Behavioral Research, 27,
509-540.
Dinno, A. (2009). Exploring the Sensitivity of Horns
Parallel Analysis to the Distributional Form of
Random Data. Multivariate Behavioral Research,
44(3), 362-388.
Fabrigar, L. R., Wegener, D. T., MacCallum, R. C., &
Strahan, E. J. (1999). Evaluating the use of
exploratory factor analysis in psychological
research. Psychological Methods, 4(3), 272-299.
Fava, J. L., & Velicer, W. F. (1992). The effects of
overextraction on factor and component analysis.
Multivariate Behavioral Research, 27, 387-415.

111

Volumul_10_nr_01.qxd

4/17/2012

1:10 PM

Page 112

Folosirea analizei factoriale exploratorii n cazul itemilor: Aspecte specifice i recomandri

Ford, J.K., MacCallum, R.C. & Tait, M. (1986). The


Application of Exploratory Factor Analysis in
Applied Psychology: A Critical Review and Analysis. Personnel Psychology, 39(2), 291-314.
Gorsuch, R. L. (1997). Exploratory Factor Analysis: Its
Role in Item Analysis. Journal of Personality
Assessment, 68(3), 532-560.
Gould, S. J. (1981). The mismeasure of man. New York:
Norton.
Hayashi, K., Bentler, P. M., & Yuan, K.-H. (2007). On
the Likelihood Ratio Test for the Number of Factors in Exploratory Factor Analysis. Structural
Equation Modeling: A Multidisciplinary Journal,
14(3), 505-526.
Hayton, J. C., Allen, D. G., & Scarpello, V. (2004). Factor Retention Decisions in Exploratory Factor
Analysis: a Tutorial on Parallel Analysis. Organizational Research Methods, 7(2), 191-205.
Henson, R. K. (2006). Use of Exploratory Factor Analysis in Published Research: Common Errors and
Some Comment on Improved Practice. Educational and Psychological Measurement, 66(3),
393-416.
Hogarty, K. Y. (2005). The Quality of Factor Solutions
in Exploratory Factor Analysis: The Influence of
Sample Size, Communality, and Overdetermination. Educational and Psychological Measurement, 65(2), 202-226.
Horn, J. L. (1965). A rationale and technique for estimating the number of factors in factor analysis.
Psychometrika, 30, 179-185.
International Test Commision (2010). International Test
Commision Guideliness for Translating and Adapting Tests. Gsit la adresa: http://www.intescom.org.
Little, T. D., Cunningham, W. A., & Shahar, G. (2002).
To Parcel or Not to Parcel : Exploring the Question, Weighing the Merits. Structural Equation
Modeling: A Multidisciplinary Journal, 9(2),
151-173.

112

Lorenzo-Seva, U., & Ferrando, P. J. (2006). FACTOR:


a computer program to fit the exploratory factor
analysis model. Behavior research methods, 38(1),
88-91.
MacCallum, R.C., Widaman, K.F., Zhang, S. & Hong.,
S. (1999). Sample size in factor analysis. Psychological Methods, 4(1), 84-99.
OConnor, B. P. (2000). SPSS and SAS programs for
determining the number of components using parallel analysis and velicers MAP test. Behavior
research methods, instruments, & computers,
32(3), 396-402.
Panter, A. T., Swygert, K. A., Dahlstrom, W. G., &
Tanaka, J. S. (1997). Factor analytic approaches to
personality item-level data. Journal of Personality
Assessment, 68, 561-589.
Sass, D. (2009). Factor Loading Estimation Error and
Stability Using Exploratory Factor Analysis. Educational and Psychological Measurement, 70(4),
557-577.
Sava, F.A. (2011). Analiza datelor n cercetarea psihologic. Cluj-Napoca: Editura ASCR.
De Winter, J. C. F., Dodou, D. & Wieringa, P.A. (2009).
Exploratory Factor Analysis With Small Sample
Sizes. Multivariate Behavioral Research, 44(2),
147-181.
Van den Broeck, A., Vansteenkiste, M., De Witte, H.,
Soenens, B., Lens, W. (2010). Capturing autonomy, competence, and relatedness at work: construction and initial validation of the Work-related
Basic Need Satisfaction scale. Journal of Occupational and Organizational Psychology, 83 (4),
981-1002.
Wood, J. M., Tataryn, D. J., & Gorsuch, R. L. (1996).
Effects of under- and overextraction on principal
axis factor analysis with varimax rotation. Psychological Methods, 1(4), 354-365.

Volumul_10_nr_01.qxd

4/17/2012

1:10 PM

Page 113

Folosirea analizei factoriale exploratorii n cazul itemilor: Aspecte specifice i recomandri

Anexa 1: Ghid pentru realizarea unei analize paralele folosind sintaxa


programului SPSS
Prezentm n continuare 10 pai simpli pentru a realiza o analiz paralel folosind sintaxa programului SPSS*:
Pasul 1: Dup deschiderea programului, accesai sintaxa fcnd click pe: File New Syntax.
Pasul 2: Copiai urmtoarele comenzi n fereastra aferent sintaxei:
set mxloops=9000 printback=off width=80 seed = 1953125.
matrix.

Pasul 3: Introducei numele i locaia fiierului ce conine datele pe care dorii s le analizai
(fiierul trebuie s fie realizat n SPSS), dup comanda FILE = (ex. FILE = C:\Date\studiu.sav).
Dac specificai FILE = * , programul va analiza fiierul SPSS care este deschis n acel moment,
acest lucru fiind mult mai la ndemn. De asemenea, trebuie s specificai variabilele din baza de date
ce vor fi folosite pentru analiz (ex. dac ai numerotat itemii pe care dorii s-i analizai cu it1, it2,
it3,...., it20, atunci vei scrie VAR = it1 to it20). Comanda aferent descrierii de mai sus este:
GET raw / FILE = * / missing=omit / VAR = it1 to it20.

Pasul 4: Introducei numrul seturilor de date paralele ce dorii s fie analizate (n general, 1000
de seturi sunt suficiente; n cazul n care soluia obinut nu este ndeajuns de clar, putei utiliza mai
multe seturi de date):
compute ndatsets = 1000.

Pasul 5: Introducei valoarea percentilului dorit pentru realizarea analizei (de obicei, percentilul
95):
compute percent = 95.

Pasul 6: Alegei metoda de extracie a factorilor pe care dorii s o utilizai (1 pentru analiza
componentelor principale, sau 2 pentru analiza factorilor principali). Indiferent de metoda de
extracie pe care ai folosit-o, vei selecta opiunea 1, deoarece selectarea celei de-a doua opiuni tinde
s supraestimeze numrul de factori care trebuie extrai (Buja i Eyuboglu, 1992; Dinno, 2009):
compute kind = 1.

Pasul 7: Alegei modalitatea de generare a seturilor de date paralele (1 pentru generarea unor
date aleatoare cu distribuie normal, sau 2 pentru permutarea datelor brute). Alegei prima variant
n cazul n care itemii supui analizei au distribuii ncadrate n limitele normalitii. Cea de-a doua
variant este foarte precis n situaiile n care datele brute nu au o distribuie normal, dar dureaz mai
mult timp. Dac itemii utilizai n analiz ncalc condiiile de normalitate, realizai mai nti o analiz
paralel folosind prima metod (pentru a avea un punct de reper), iar apoi folosii cea de-a doua
metod.
compute randtype = 1.

* Ghidul a fost inspirat din indicaiile Prof. Univ. Dr. Brian OConnor despre analiza paralel, disponibile pe internet la
adresa: https://people.ok.ubc.ca/brioconn/nfactors/nfactors.html.
113

Volumul_10_nr_01.qxd

4/17/2012

1:10 PM

Page 114

Folosirea analizei factoriale exploratorii n cazul itemilor: Aspecte specifice i recomandri

Pasul 8: Introducei urmtoarele comenzi n fereastra aferent sintaxei:


compute ncases = nrow(raw).
compute nvars = ncol(raw).
do if (kind = 1 and randtype = 1).
compute nm1 = 1 / (ncases-1).
compute vcv = nm1 * (sscp(raw) - ((t(csum(raw))*csum(raw))/ncases)).
compute d = inv(mdiag(sqrt(diag(vcv)))).
compute realeval = eval(d * vcv * d).
compute evals = make(nvars,ndatsets,-9999).
loop #nds = 1 to ndatsets.
compute x = sqrt(2 * (ln(uniform(ncases,nvars)) * -1) ) &*
cos(6.283185 * uniform(ncases,nvars) ).
compute vcv = nm1 * (sscp(x) - ((t(csum(x))*csum(x))/ncases)).
compute d = inv(mdiag(sqrt(diag(vcv)))).
compute evals(:,#nds) = eval(d * vcv * d).
end loop.
end if.
do if (kind = 1 and randtype = 2).
compute nm1 = 1 / (ncases-1).
compute vcv = nm1 * (sscp(raw) - ((t(csum(raw))*csum(raw))/ncases)).
compute d = inv(mdiag(sqrt(diag(vcv)))).
compute realeval = eval(d * vcv * d).
compute evals = make(nvars,ndatsets,-9999).
loop #nds = 1 to ndatsets.
compute x = raw.
loop #c = 1 to nvars.
loop #r = 1 to (ncases -1).
compute k = trunc( (ncases - #r + 1) * uniform(1,1) + 1 ) + #r - 1.
compute d = x(#r,#c).
compute x(#r,#c) = x(k,#c).
compute x(k,#c) = d.
end loop.
end loop.
compute vcv = nm1 * (sscp(x) - ((t(csum(x))*csum(x))/ncases)).
compute d = inv(mdiag(sqrt(diag(vcv)))).
compute evals(:,#nds) = eval(d * vcv * d).
end loop.
end if.

114

Volumul_10_nr_01.qxd

4/17/2012

1:10 PM

Page 115

Folosirea analizei factoriale exploratorii n cazul itemilor: Aspecte specifice i recomandri

compute num = rnd((percent*ndatsets)/100).


compute results = { t(1:nvars), realeval, t(1:nvars), t(1:nvars) }.
loop #root = 1 to nvars.
compute ranks = rnkorder(evals(#root,:)).
loop #col = 1 to ndatsets.
do if (ranks(1,#col) = num).
compute results(#root,4) = evals(#root,#col).
break.
end if.
end loop.
end loop.
compute results(:,3) = rsum(evals) / ndatsets.
print /title=PARALLEL ANALYSIS:.
do if (kind = 1 and randtype = 1).
print /title=Principal Components & Random Normal Data Generation.
else if (kind = 1 and randtype = 2).
print /title=Principal Components & Raw Data Permutation.
end if.
compute specifs = {ncases; nvars; ndatsets; percent}.
print specifs /title=Specifications for this Run:
/rlabels=Ncases Nvars Ndatsets Percent.
print results
/title=Raw Data Eigenvalues, & Mean & Percentile Random Data Eigenvalues
/clabels=Root Raw Data Means Prcntyle /format f12.6.
compute root = results(:,1).
compute rawdata = results(:,2).
compute percntyl = results(:,4).
save results /outfile=* / var=root rawdata means percntyl .
end matrix.
TSPLOT VARIABLES= rawdata means percntyl /ID= root /NOLOG.

Pasul 9: Executai sintaxa fcnd click pe: Run All.


Pasul 10: Alegei numrul optim de factori ce trebuie reinui, comparnd valorile eigenvalue din
datele reale cu cele din datele aleatoare. Trebuie s menionm faptul c, n varianta original a procedurii (Horn, 1965), valorile eigenvalue medii din datele aleatoare erau utilizate pentru comparaie. O
recomandare curent este utilizarea valorilor eigenvalue din datele aleatoare ce corespund percentilului ales (OConnor, 2000).

115

You might also like