You are on page 1of 9

Analiza de variant,

a uni-factorial
a
(Anova One-Way)
Asist. drd. Adrian Gorbanescu
15 Decembrie 2014

Introducere

Atunci cand am dorit sa comparam nivelul de deschidere al student, ilor (anul I s, i


anul III) am utilizat testul t pentru es, antioane independente. Totus, i, n analiza
statistica ar putea fi introduse s, i datele student, ilor de anul II. Astfel, ne plasam n
situat, ia n care trebuie sa comparam trei medii. T, inand cont de cunos, tint, ele pe
care le avem, putem evident, ia diferent, ele dintre cele trei grupuri prin compararea
grupurilor doua cate doua. O simpla analiza ne dovedes, te ca o astfel de strategie
aduce mai multe erori:
1. Fiecare aplicarea testului t pentru es, antioane independente pentru a compara grupurile doua cate doua vine cu o eroare de tip I asumata de 0,05.
Astfel, daca am realiza trei comparat, ii vom face o eroare de tip I de 0,15.
2. Pentru un numar mai mare de niveluri ale variabilei independete ar trebui
realizate mai multe comparat, ii, iar numarul calculelor ar deveni prea mare.
3. Intr-un astfel de studiu ne intereseaza efectul global al variabilei independente (prin intermediul tuturor nivelurilor sale) asupra variabilei dependente.
Prin urmare ne intereseaza utilizarea unui singur test, care sa studieze acest
efect global.
Testul statistic care reus, es, te sa elimine aceste erori este analiza de variant, a. In
es, ent, a, analiza de variant, a este utilizata n situat, iile n care ne dorim sa comparam
mediile provenite de la mai mult de doua grupuri (cel put, in trei grupuri).
In contextul analizei de variant, a factoriale variabila independenta se numes, te
factor. Valorile pe care le poate lua acesta se numesc niveluri. Variabila independeta este masurata pe scala categoriala (nominala sau ordinala), n timp ce
variabila dependenta este masurata pe scala de interval/raport.
Atunci cand avem un design experimental cu un singur factor ne aflam n
situat, ia n care vom folosi analiza de variant, a unifactoriala. Nu trebie sa omitem
faptul ca factorul trebuie sa aiba cel put, in trei niveluri. Cand cercetarea pe care o
construim are doua variabile independente (doi factori) avem de-a face cu analiza
de variant, a mltifactoriala. In acest caz, variabila independenta trebuie sa aiba cel
put, in doua niveluri.
Exemple de analiza de variant, a unifactoriala:
efectul fumatului (nefumator, 1-10 t, igari, 11-20 t, igari) asupra nivelului de
asumare a riscului.
atitudinea fat, a de viitor n funct, ie de starea civila (casatorit, divort, at, vaduv).
1

Exemple de analiza de variant, a multifactoriala:


efectul genului (masculin, feminin) s, i al varstei (15-19 ani, 20-24 ani s, i 25-29
ani) asupra timpului de react, ie.
efectul genului (masculin, feminin) s, i al liceului absolvit (real, uman) asupra
atitudinii fat, a de statistica.
Analiza exemplelor de mai sus ne evident, iza faptul ca un factor poate avea
doua niveluri atunci cand este utilizat n analiza de variant, a multifactoriala. Astfel, n ultimul exemplu avem doi factori, fiecare cu cate doua niveluri. Un astfel de
model experimental presupune compararea a patru grupuri (numarul de niveluri
al factorului 1 * numarul de niveluri al factorului 2).
Presupunem ca dorim sa realizam o cercetare n care dorim sa evident, iem
diferent, ele la nivelul atitudinii fat, a de viitor n funct, ie de nivelul de s, colarizare
(liceal, universitar s, i postuniversitar). Ipoteza cercetarii va afirma ca exista diferent, e
semnificative n ceea ce prives, te atitudinea fat, a de viitor n funct, ie de nivelul
de s, colarizare. Cu alte cuvinte, ipoteza cercetarii afirma ca cele trei tipuri de
s, colarizare fac parte din populat, ii diferite, cu niveluri distincte ale atitudinii fat, a
de viitor.
Ipoteza de nul sust, ine ca nu exista diferent, e semnificative la nivelul atitudinii
fat, a de viitor n funct, ie de s, colarizare, adica cele trei es, antioane fac parte dintr-o
populat, ie unica, cu o viziune similara a viitorului.
Spre deosebire de testele t, ANOVA nu compara mediile celor trei es, antioane
n mod direct, ci se foloses, te de dispersiile lor. Cu cat cele trei es, antioane sunt
mai diferite unul fat, a de celalalte, cu atat distribut, ia lor are o variant, a (dispersie)
mai mare.
Pentru a verifica ipoteza cercetarii ANOVA parcurge urmatoarele etape:
calculeaza dispersia n interiorul fiecarui es, antion (dispersia intragrup).
calculam dispersia mediei fiecarui grup fat, a de media mare (media aritmetica
a mediilor celor trei gurpuri). Astfel obt, inem dispersia intergrup. Media
mare este simbolizata cu M.
Facem raportul dintre dispersia intergrup s, i dispersia intragrup. Cu cat
valoarea acestui raport este mai mare, cu atat mai mult cele trei es, antioane
vor proveni din populat, ii diferite. Rezultatul obt, inut (F) este raportat la o
distribut, ie teoretica (diferita de distribut, ia normala).
Valorile lui F se distribuie n distribut, ia Fisher. Aceasta este o distribut, ie
particulara s, i are urmatoarele proprietat, i:
Valoarea minima este 0, deoarece este raportul dintre doua dispersii (dispersiile se obt, in prin ridicarea la patrat s, i nu pot fi negative). Prin urmare
raportul dintre doua valori pozitive este, de asemenea, pozitiv.
Poate lua valori oricat de mari, tinzand spre infinit.
Asimetrie pozitiva - tendint, a valorilor de a se grupa n zona stanga.
Forma distribut, iei depinde de o pereche de grade de libertate (numarul de
grupuri s, i numarul de subiect, i).
2

F =

s2intergrup
s2intragrup

Grafic 1 - Distribut, ia F

Analiza de variant,
a unifactorial
a n SPSS

Reamintim faptul ca n contextul analizei de variant, a, variabila independenta este


masurata pe scala categoriala, n timp ce variabila dependenta este masurata pe
scala de interval/raport.
Presupunem ca dorim sa verificam ipoteza conform careia rezistent, a la accelerat, ia
gravitat, ionala la pilot, i n funct, ie de tipul de avion pilotat (avion de lupta, avion
de acrobat, ii s, i avion de linie). Cele trei es, antioane de subiect, i sunt egale, avand
cate 10 subiect, i.
In cazul cercetarii noastre, variabila independenta este tipul de avion pilotat
(1 = avion de lupta, 2 = avion de acrobat, ii s, i 3 = avion de linie) s, i este masurata
pe scala nominala. Variabila dependenta, rezistent, a la accelerat, ia gravitat, ionala
este masurata pe scala de interval/raport.
Pentru a aplica analiza de variant, a unifactoriala trebuie sa respectam urmatoarele
condit, ii:
Distribut, ia fiecarui es, antion trebuie sa respecte condit, ia de normalitate. Verificarea acestei condit, ii este realizata prin intermediul procedurii Explore
(Plots Normality Plots with Tests) sau prin analiza valorilor skewness s, i
kurtosis. In condit, iile n care es, antioanele au un volum mare de subiect, i,
ANOVA nu mai este sensibil la nerespectarea condit, iei de normalitate.
Masurarea variabilei dependente pentru un es, antion nu trebuie sa fie afectata
de evaluarea efectuala la nivelul celorlalte es, antioane.
Omogenitatea variant, ei la nivelul fiecarui grup. Impas, tierea valorilor variabilei dependente n interiorul es, antioanelor trebuie sa fie egala. Nerespectarea
acestei condit, ii nu afecteaza validitatea testului ANOVA, nsa ne atent, ioneaza
asupra existent, ei valorilor extreme.
Realizarea bazei de date
Baza de date n SPSS va cont, ine doua variabile: factorul s, i variabila dependenta. Vom defini o variabila masurata pe scala categoriala (nominala sau ordinala) care va primi codurile cu care am etichetat nivelurile factorului. In cazul
nostru tipurile de avion pilotat: 1, 2 s, i 3. Vom introduce s, i o variabila masurata
3

pe scala I/R care va primi valorile variabilei dependente.

Dupa ce am realizat baza de date, vom verifica ndeplinirea condit, iei de normalitate la nivelul fiecarui es, antion. Astfel, vol folosi procedura Analyze Descriptive
Statistics Explore, iar n zona Factor List vom introduce variabila independenta
(tip avion).

In Output ne vor fi prezentate rezultatele testelor de noramlitate KolmogorovSmirnov s, i Shapiro-Wilk. Deoarece es, antioanele noastre au mai put, in de 50 de
subiect, i, vom citi rezultatele testului Shapiro-Wilk.

Dupa cum putem observa, pentru fiecare es, antion avem un p > 0, 05 ceea ce
ne face sa afirmam ca distribut, ia este normala la nivelul fiecarui grup.
Lansarea testului ANOVA presupune parcurgerea urmatoarelor etape:
1. Analize - Compare Means - One-Way ANOVA

2. Se va deschide o caseta de dialog unde variabila dependenta este mutata n


zona Dependent List, iar variabila independenta este mutata n zona Factor.

In Post Hoc vom bifa testele Bonferoni (pentru omogenitatea variant, elor) s, i
Tamhane T2 (pentru lipsa de omogenitate a variant, elor).

In Options vom bifa opt, iunile Descriptive, Homogeneity of variance test s, i


Means Plot.

3. In zona de afis, are a rezultatelor vor aparea patru table.


Descriptives prezinta indicatorii descriptivi ai variabilei dependente la nivelul
fiecarui factor. Spre deosebire de testele t, tabelul Descriptives este mai cuprinzator,
oferind s, i intervalul de ncredere al mediei.

Test of Homogeneity of Variances ofera rezultatele testului Levene pentru


omogenitatea variant, elor.

Levene Statistic - prezinta valoarea calculata a testului Levene (n cazul


nostru, 0,80).
df1 - reprezinta numarul de grade de libertate intergrup (numarul de grupuri
- 1).
df2 - reprezinta numarul de grade de libertate intragrup (numarul cumulat
de subiect, i - numarul de grupuri).
p(sig) - reprezinta probabilitatea asociata testului Levene. Daca p>0,05 vom
accepta omogenitatea variant, elor s, i vom realiza analiza post hoc cu testul
Bonferoni. Atunci cand p 0, 05 respingem omogenitatea variant, elor s, i
folosim n analiza post hoc testul Tamhane. In cazul nostru, p(0,45)>0,05 s, i
concluzionam ca variant, ele sunt omogene.
Tabelul ANOVA cuprinde rezultatele testului de analiza de variant, a unifactoriala. In acest tabel pe linia Between Groups sunt prezentate rezultatele
intergrup. Pe linia Within Groups sunt afis, ate rezultatele la nivel intragrup.

df - numarul de grade de libertate intergrup (2), respectiv intragrup (27).


Mean Square - reprezinta dispersia intergrup (5,12), respectiv dispersia intragrup (0,63).
F - reprezinta valoarea calculata a testului ANOVA.
p(sig) - este probabilitatea asociata testului F. Daca p>0,05 acceptam ipoteza
de nul s, i afirmam ca nu exista diferent, e semnificative la nivelul rezistent, ei
la accelerat, ia gravitat, ionala n funct, ie de avionul pilotat. Daca p 0, 05
respingem ipoteza de nul s, i afirmam ca exista diferent, e semnificative statistic ntre mediile celor trei es, antioane. In cazul nostru p(0, 002) 0, 05 s, i
concluzionam ca exista diferent, e semnificative statistic la nivelul rezistent, ei
accelerat, iei gravitat, ionale n funct, ie de tipul de avion pilotat.

Testul ANOVA ne informeaza asupra faptului ca exista un efect global semnificativ statistic al variabilei independente asupra variabilei dependente. In aceste
condit, ii nu putem preciza nimic despre semnificat, ia diferent, elor dintre mediile
es, antioanelor comparate doua cate doua. Analiza Post Hoc ne informeaza asupra
semnficat, iei diferent, ei dintre es, antioane luate doua cate doua.
Tabelul Multiple Comparisons prezinta rezultatele comparat, iilor multiple.

Pe prima coloana a tabelului sunt prezentate cele trei grupuri. Pe coloana a


doua este afis, ata diferent, a dintre mediile es, antioanelor analizate, iar pe coloana
a patra (sig) este prezentata semnificat, ia pentru diferent, a dintre medii. Analiza rezultatelor ne indica faptul ca pilot, ii avioanelor de lupta au o rezistent, a la
accelerat, ia gravitat, ionala semnificativ statistic mai mare decat cea a pilot, ilor de
acrobat, ii (p = 0,034), dar s, i fat, a de pilot, ii de linie (p = 0,002). In acelas, i timp, nu
exista diferent, e semnificative statistic la nivelul rezistet, ei accelerat, iei gravitat, ionale
ntre pilot, ii avioanelor de acrobat, ii s, i pilot, ii avioanelor de lupta (p = 0,71).

Exemplu de calcul ANOVA

In tabelul de mai jos este prezentata rezistent, a pilot, ilor la accelerat, ia gravitat, ionala.
X1
5,60
5,80
6,30
3,98
3,51
4,45
3,98
4
4,51
4
1.
2.
3.
4.
5.

X2
4,55
3,80
5
2,74
2,90
3,87
2,70
3,63
3,81
3,47

X3
3,58
3
4
2,17
2,58
3,96
3,40
3
3,98
2,49

Xi m1
0,99
1,19
1,69
-0,63
-1,10
-0,16
-0,63
-0,61
-0,10
-0,61

(Xi m1 )2
0,98
1,42
2,86
0,40
1,21
0,03
0,40
0,37
0,01
0,37

Formulat, i ipoteza cercetarii


Formulat, i ipoteza de nul
Stabilit, i Fcritic
Stabilit, i decizia statistica
Calculat, i marimea efectului

Xi m 2
0,91
0,16
1,36
-0,90
-0,74
0,23
-0,94
-0,01
0,17
-0,17

(Xi m2 )2
0,83
0,03
1,85
0,81
0,55
0,05
0,88
0,00
0,03
0,03

Xi m 3
0,37
-0,21
0,79
-1,04
-0,63
0,75
0,19
-0,21
0,77
-0,72

(Xi m3 )2
0,14
0,04
0,62
1,08
0,40
0,56
0,04
0,04
0,59
0,52

1) H1 : Exista diferent, e semnificative statistic la nivelul rezistent, ei la accelerat, ia


gravitat, ionala n funct, ie de avionul pilotat.
2) H0 : Nu exista diferent, e semnificative statistic la nivelul rezistent, ei la accelerat, ia
gravitat, ionala n funct, ie de avionul pilotat.
3) Pentru a stabili Fcritic vom citi tabelul valorilor critice ale lui F (Anexa
3). Valoarea critica se cites, te la intersect, ia dintre numarul de grade de libertate
intergrup s, i numarul de grade de libertate intragrup.
dfintergrup = Ngrupuri 1 dfintergrup = 3 1 dfintergrup = 2.
dfintragrup = Nsubiect, i Ngrupuri dfintragrup = 30 3 dfintragrup = 27.
Astfel, vom citi Fcritic la intersect, ia 2 grade de libertate intergrup cu 27 grade
de libertate intragrup. Valoarea Fcritic = 3, 35.

4) Pentru a lua decizia statistica avem nevoie de o valoare calculata F pe care


sa o comparam cu valoarea critica (tabelara).
In prima etapa vom calcula mediile celor trei es, antioane, pe care le vom numi
generic m1 , m2 s, i m3 . Astfel, observam urmatoarele medii ale celor trei es, antioane:
m1 = 4, 61 m2 = 3, 64 s, i m3 = 3, 21.
Pe baza acestor medii putem calcula media mare (M), media aritmetica a medim1 + m2 + m3
. Astfel, M = 3,82.
ilor celor trei es, antioane M =
3
F =

s2intergrup
s2intragrup

s2intragrup =
s2intergrup

s21 + s22 + s23


3

N1 (m1 M 2 ) + N2 (m2 M 2 ) + N3 (m3 M 2 )


=
dfintergrup

In acest moment, avem nevoie de dispersiile celor trei es, antioane.


8

s21
s22

(Xi m1 )2
8, 05
s21 =
s21 = 0, 89.
N1 1
9

(Xi m2 )2
5, 06
s22 =
s22 = 0, 56.
N2 1
9

=
=

(Xi m3 )2
4, 03
=
s23 =
s23 = 0, 44.
N3 1
9
Astfel, putem calcula dispersia intragrup
s23

0, 89 + 0, 56 + 0, 44
1, 89
s21 + s22 + s23
s2intragrup =
s2intragrup =
s2intragrup = 0, 63.
3
3
3
Dispersia intergrup devine:

s2intragrup =

s2intergrup

s2intergrup

N1 (m1 M )2 + N2 (m2 M )2 + N3 (m3 M )2


=
dfintergrup

10 (4, 61 3, 82)2 + 10 (3, 64 3, 82)2 + 10 (3, 21 3, 82)2


=
s2intergrup = 5, 12.
2

s2intergrup
5, 12
F = 2
F =
F = 8, 12
sintragrup
0, 63
Cum F = 8, 12 > Fcrit = 3, 35, ipoteza de nul este respinsa s, i afirmam ca
rezistent, a la accelerat, ia gravitat, ionala este influent, ata de tipul de avion pilotat.
5) Pentru testul ANOVA exista doi indici de marime a efectului: 2 s, i f.
dfintergrup F
2 8, 12
16, 24
2 =
2 =
2 =
2 = 0, 34
dfintergrup F + dfintragrup
2 8, 12 + 27
16, 24 + 27
Conform grilei lui Hopkins, indicile de marime a efectului obt, inut este de intensitate medie.
s
r
p
2
0, 34
f=

f
=

f
=
0, 51 f = 0, 71.
1 2
0, 66
Conform grilei lui Cohen, indicile de marime a efectului f (0,71) este de intensitate mare.

Vacant,
a pl
acut
a!!!