You are on page 1of 36

1 Analiza de varianță (ANOVA) -Recapitulare

 Testul t pentru mai mult de 2 eșantioane independente


 Analiza de varianță simplă
 Variabilitatea inter-grup
 Variabilitatea intra-grup
m3
m2
E3
2 m1 E2
E1 x31
x21
x11 x32
x22
x12 x33
x23
x13
x34
x24
x14

P x3k
x2k
x1k
3
f
Cazul ideal este atunci când avem
aceeași variabilitate în esantioane

m
m1 m2 μ m3
S1
S2
S3
4
f
Cazul ideal este atunci când avem
aceeași variabilitate în esantioane

m
m1 m2 μ m3
S1
S2
S3 S1= S2 = S3 = S
5
f
În general însă avem variabilitate
diferită în eșantioane

S1≠ S2 ≠ S3

m1 m2 μ m3 m
S1
S2
S3
Sir Ronald Aylmer Fisher (17 February 1890 – 29 July 1962) statistician englez,
6 recunoscut pentru contribuții importante în statistică, inclusiv analiza de varianță
(ANOVA)
Prima mențiune a ANOVA a fost făcută în 1921, On the "Probable Error" of a
Coefficient of Correlation Deduced from a Small Sample. Ronald A. Fisher. Metron,
1: 3-32 (1921)
De remarcat faptul că datorită unor deficiențe de vedere Ronald Fisher a fost instruit
fără creion și hârtie, fapt ce a contribuit la capacitatea sa de vizualizare aproape
geometrică a termenilor și conceptelor.

Analiza varianță (ANOVA) este o colecție de modele statistice utilizate pentru analiza
diferențelor dintre mediile eșantioanelor (variabilitatea inter-grupuri) raportată la
variabilitatea intra-grupuri asociată. Procedeul a fost creat și dezvoltat de R.A. Fisher.

Motivele elaborării ANOVA au fost tocmai limitele testului t pentru eșantioane


independente. Aplicarea în mod repetat a acestuia conduce la o creștere a șanselor de
comitere a erorii de tip I, la fiecare noua aplicare. Pentru 3 eșantioane, testul t trebuie
aplicat de 3 ori. Astfel în loc de 0,05 probabilitate de eroare de tip I, am putea ajunge la
max. 3x0,05=0,15 probabilitate de eroare de tip I
Tipuri de modele ANOVA
7
•ANOVA unifactorială (One-way ANOVA) utilizată pentru a testa
diferențele dintre 2 sau mai multe eșantioane independente. Atunci
când ANOVA este utilizată pentru a compara doar 2 eșantioane
independente testul-t și testul-F (ANOVA) sunt echivalente, relația dintre
acestea fiind F = t2.

•ANOVA factorială (Factorial ANOVA) utilizată atunci când se caută


efectul interacțiunii între variabile.

•ANOVA pentru măsurători repetate (Repeated measures ANOVA)


utilizată atunci se fac studii longitudinale pe un eșantion de subiecți.

•ANOVA multivariată (Multivariate analysis of variance) (MANOVA)


utilizată atunci când avem mai mult de o variabilă dependentă.
Graficul distribuției F (Fisher)
8

Distribuția este pozitivă, F ≥ 0


Distribuția depinde de perechile gradelor de libertate (intragrup și intergrup)
Pentru df intragrup > 100 și df intergrup > 100, se apropie de distribuția normalită
9
Familia de distribuții F (Fisher)
ANOVA univariată (One-way ANOVA) este utilizată pentru testarea
10 diferențelor dintre 2 sau mai multe eșantioane independente.

F= ,F =

Pentru volume inegale: F= = ∑ ∗

2 ∑ ⋯
= =

2 ⋯
=

2 ∑ ∗ ⋯
= =
∑ ( )

2 ⋯
=

Pentru volume egale:
11

F= = ∑ ∗

2 ∑ ⋯
= =

2 ⋯
= (dispersia mediilor)

2 ∑ ∗ ⋯ ⋯ ( ⋯ )
= = = ⋯
= ∗

2 ( ⋯ )
= (media dispersiilor)
Pentru volume inegale:
12


F= = ⋯

Pentru volume egale:


F= = ( ⋯ )
13

Condiții de aplicare ANOVA:

1. Independența grupurilor/observațiilor.
2. Observațiile să nu se depărteze major de la normalitate
3. Omogenitatea de varianță a grupurilor
14
Exemplu:
------------------------------
N=3 grupuri

N1=9
N2=8
N3=11

α = 0,05
------------------------------

dfintergrup = N-1= 3-1=2


dfintragrup = (N1-1)+ (N2-1)+ (N3-1)=
= (9-1)+ (8-1)+ (11-1) = 25

Fcritic = F(α; df-intergroup; df-intragrup)= F(0,05; 2; 25) = 3,39


15 ANOVA se poate aplica și pentru compararea a 2 eșantioane independente,
situație în care în mod uzual folosim testul t (Student).
În acest caz al comparării celor două eșantioane independente, testul t și
ANOVA (coeficientul F) trebuie să conducă spre aceeași rezultat. De fapt F = t2.
Distribuția teoretică a lui F este aceeași cu distribuția teoretică a lui t2.

Astfel dacă luăm N1=9 și N3=11 (de ex.) și α =0,05


Aplicând testul t pentru eșantioane independente avem
df = N1-1+ N3 -1 = 8+10 =18
tcritic = t (α, df) = t (0,05, 18) = 2,10

Aplicând ANOVA pentru 2 eșantioane independente avem


df intergrup = N-1= 2-1 =1
df intragrup = N1-1+ N3 -1 = 8+10 =18
Fcritic = F (α, df_inter, df_intra) = F (0,05, 1, 18) = 4,41= (2,10)2 = t2
16
17
N1=9
N3=11
α = 0,05
------------------------------

dfintergrup = N-1= 2-1=1


dfintragrup = (N1-1)+ (N3-1) = (9-1)+ (11-1) = 18

Fcritic = F(α; df-intergroup; df-intragrup)= F(0,05; 1; 18) = 4,41


Exemplu de aplicare ANOVA

18

La una dintre serii, rezultatele la evaluarea de


la statistică pentru studenții din 3 grupe sunt
redate în tabelul de mai jos. Au fost luați
aleatoriu 10 studenți din fiecare grupă, din
cele 3 menționate (GrA, GrB, GrC).

Să se exploreze statistic posibilele diferențe


de performanță între cele 3 grupe. (α=0,05)
19
20
21
22
23
24

Atentie! testele
Brown si Welch
25
26
27 Concluzii

F = 17,44 la un nivel de semnificație sig.< 0,001. Prin urmare și la


un α =0,05 avem semnificație statistică.

Testul Levene, indică o încălcare a omogenității la un α =0,041.


Din fericire ANOVA poate fi utilizată în continuare, fiind o
procedură robustă la încălcarea acestei condiții, urmând ca la
testele post-hoc să alegem un test pentru inegalitatea de varianță,
la fel ca și la testul t.

Așadar există cel puțin un eșantion care face parte din altă
populație de punctaje. Pentru a identifica acest/aceste eșantioane
verificăm testele post-hoc.

La testele Tamhane, observăm că eșantionul diferit este gupa C.


28 Mărimea efectului în cazul ANOVA:


η2 = =

η2 =

η2
f=
η2
29 Mărimea efectului în cazul ANOVA:

∗ , ,
η2 = = = == = 0,56
∗ , , ,

η2 , ,
f= = = = 1,12
η2 0,56 ,

Mărimea efectului este mare, rezultatul este semnificativ și de luat în


considerare.
30
Raportarea

A fost analizată performanţa la o probă de statistică a trei grupuri de


studenți an I. Mediile performanţei pentru cele trei grupuri au fost
mA=14,15, mB=14,90, respectiv mC=8,60. Analiza de varianţă
unifactorială a relevat o diferenţă semnificativă între aceste medii, F
(2, 27)=17,44; p < 0.05. Mărimea efectului apreciată cu indicele eta
pătrat indică un efect mare (η2 = 0.56), indicele f al lui Cohen
indică tot un efect mare f=1.12.
31

MĂRIMEA EFECTULUI f (Cohen) η2


0,40 0,26
Mare
0,25 0,13
Mediu
0,10 0,019
Slab
Familia ANOVA

1. Analiza de varianță
2. Analiza de covarianță
3. Analiza de varianță factorială
4. Analiza de covarianță factorială
5. Analiza multivariată de varianță simplă
6. Analiza multivariată de covarianță simplă
7. Analiza multivariată de varianță factorială
32
8. Analiza multivariată de covarianță factorială
ANALIZA DESCRIPTIVĂ A DATELOR (DDA)

33
Analiza de varianță simplă este utilizată atunci când avem:

1. IV (2+ categorii) diferența dintre grupuri


1. DV(cantitativă)

Ex. IV= nivelul de școlarizare, DV= motivația,

Analiza de covarianță simplă este utilizată atunci când avem:

1. IV (2+ categorii) diferența dintre grupuri


1. DV(cantitativă)
1+. Covarianți

Ex. IV= nivelul de școlarizare, DV= motivația, Cov.= venitul familial


ANALIZA DESCRIPTIVĂ A DATELOR (DDA)

34
Analiza de varianță factorială, utilizată atunci când avem:

2+. IVs (2+ categorii) diferența dintre grupuri


1. DV (cantitativă)

Ex. IVs= nivelul de școlarizare, genul, DV= motivația

Analiza de covarianță factorială, utilizată atunci când avem:

2+. IVs (2+ categorii) diferența dintre grupuri


1. DV (cantitativă)
1+. Covariante

Ex. IVs= nivelul de școlarizare, genul, DV= motivația, Cov.= venitul familial
ANALIZA DESCRIPTIVĂ A DATELOR (DDA)

35 Analiza multivariată de varianță simplă, utilizată atunci când avem:

1. IV (2+ categorii) diferența dintre grupuri


2+. DVs (cantitativă)

Ex. IV= nivelul de școlarizare, DVs= motivația, încrederea în sine

Analiza multivariată de covarianță simplă, utilizată atunci când avem:

1. IV (2+ categorii) diferența dintre grupuri


2+. DVs (cantitativă)
1+. Covariante

Ex. IV= nivelul de școlarizare, DVs= motivația, încrederea în sine, Cov.= venitul familial
ANALIZA DESCRIPTIVĂ A DATELOR (DDA)

36
Analiza multivariată de varianță factorială, utilizată atunci când avem:

2+. IVs (2+ categorii) diferența dintre grupuri


2+. DVs (cantitativă)

Ex. IVs= nivelul de școlarizare, genul, DVs= motivația, încrederea în sine

Analiza multivariată de covarianță factorială, utilizată atunci când avem:

2+. IVs (2+ categorii) diferența dintre grupuri


2+. DVs (cantitativă)
1+. Covariante

Ex. IVs= nivelul de școlarizare, genul, DVs= motivația, încrederea în sine, Cov.= venitul familial

You might also like