You are on page 1of 47

ANOVA

alisys f riance

Análise de Variância
ANOVA
Tratamento
Repetição 1 2 ... i ... k
1 y11 y21 ... yi1 yk 1
2 y12 y22 ... yi 2 ... yk 2
... ... ... ... ... ... ...
j y1 j y2 j ... yij ... yk j

... ... ... ... ... ... ...


ni y1n1 y2n2 ... yini ... yknk

y = f (Tratamento )
ANOVA
Talhão VARIEDADE
=
A B C D
Repetição
1 30 33 32 34

2 28 35 37 36

3 33 32 34 36

4 31 33 34 33

Delineamento balanceado ou equilibrado

Todos os tratamentos têm o mesmo número de repetições


ANOVA
Talhão VARIEDADE
=
A B C D
Repetição
1 30 33 32 34
2 28 35 37 36
3 33 32 34 36
4 31 34

Delineamento não balanceado ou não equilibrado

Nem todos os tratamentos têm o mesmo número de repetições


ANOVA

H 0 : x1 = x2 = x3 = ... = xk = µ H1 : xi ≠ x j , algum (i,j)

H0:Não existem diferenças significativas entre os tratamentos

H1: Existem diferenças significativas entre os tratamentos


ANOVA
Dois gradientes de variabilidade:

Talhão Tratamento = Variedade


=
A B C D
Repetição
1 30 33 32 34
2 28 35 37 36
3 33 32 34 36
4 31 33 34 33

y1. = 30.5 y2. = 33.25 y3. = 34.25 y4. = 34.75

y.. = 33.1875
ANOVA
Talhão VARIEDADE
=
A B C D
Repetição
1 30 33 32 34
2 28 35 37 36
3 33 32 34 36
4 31 33 34 33

(30 − 33.1875) = (30.5 − 33.1875) + (30 − 30.5)

Variabilidade Variabilidade Variabilidade


total explicada pelo residual
tratamento
ANOVA
Talhão VARIEDADE
=
A B C D
Repetição
1 30 33 32 34
2 28 35 37 36
3 33 32 34 36
4 31 33 34 33

(30 − 33.1875) = (30.5 − 33.1875) + (30 − 30.5)

(30 − 33.1875) = [ (30.5 − 33.1875) + (30 − 30.5) ]


2 2
ANOVA
• cada uma das k amostras ( tratamentos) provém de
uma população normal
• as variâncias das k amostras são homogéneas, e
constantes ⌦
• Os erros ou resíduos ε i j têm distribuição normal
• Os erros ou resíduos ε i j têm variância finita e
constante (esta propriedade denomina-se por
homoscedasticidade)
• Os resíduos ε i j são independentes
Tratamentos com variâncias homogéneas
Tratamentos com variâncias não homogéneas
Tratamentos com variâncias homogéneas

A B C D
Tratamentos com variâncias não homogéneas

A B C D
Tratamentos com variâncias homogéneas
Tratamentos com variâncias não homogéneas


ANOVA
yij = µ i + ε ij = µ + τ i + ε ij

Efeito do tratamento Erro experimental

yij = µ + µi − µ + yij − µi
ANOVA
Modelo teórico:

yij − µ = µi − µ + yij − µi

Estimativas amostrais:

yij − y.. = yi. − y.. + yij − yi.


ANOVA
2
= ( yi. − y.. ) + yij − yi. 
2
yij − y..

k ni k ni k ni

∑∑ ( y − y.. ) =∑∑ ( yi. − y.. ) + ∑∑ ( yij − yi. )


2 2 2
ij
i =1 j =1 i =1 j =1 i =1 j =1

SSTotal = SSTratamentos + SSerro


ANOVA

SSTotal = SSTratamentos + SSerro

T H E
ANOVA
Origem da Graus de Soma de Média da Soma F p − value
variação Liberdade Quadrados de Quadrados
SS MS H
Tratamentos k −1 SS H MS H = H F= Pr ( F > F )
k −1 MS E

N−k SS E SS E
Erro MS E =
N −k

Total N −1 SST

Decisão:  FC alc < F(α ; k −1; N − k )



Aceitar H0 se  ⇔
 p − value > α

ANOVA – Metodologia de Cálculo
Tratamento
Repetição 1 2 ... i ... k
1 y11 y21 ... yi1 yk 1
2 y12 y22 ... yi 2 ... yk 2
... ... ... ... ... ... ...
j y1 j y2 j ... yij ... ykj

... ... ... ... ... ... ...


ni y1n1 y2n2 ... yini ... yknk
Total n1 n2 ... ni ... nk k ni
T1. = ∑ y1 j T2. = ∑ y2 j Ti. = ∑ yij Tk . = ∑ ykj T.. = ∑∑ yij
j =1 j =1 j =1 j =1 i =1 j =1

Média T1. T2. Ti. Tk . T..


y1. = y2. = yi. = yk . = y.. =
n1 n2 ni nk N
ANOVA

ni ni 2
k
2
k
T
SST = yij − y.. = y −
2
ij
..

i =1 j =1 i =1 j =1 N

(Definição) (Cálculo)
ANOVA

ni 2 2
k K
T T
( yi. − y.. )
2
SS H = = −
i. ..

i =1 j =1 i =1 ni N

(Definição) (Cálculo)
ANOVA
2 2
TK
T
SS H = − i. ..

i =1 ni N
Observação: Se é um delineamento equilibrado:
k
2
T i. 2
T
SS H = i =1
− ..

ni N
ANOVA

E T H
ANOVA
Talhão VARIEDADE
=
A B C D
Repetição
1 30 33 32 34

2 28 35 37 36

3 33 32 34 36

4 31 33 34 33

Totais T1. = 122 T2. = 133 T3. = 137 T4. = 139 T.. = 531
Médias y1. = 30.5 y2. = 33.25 y3. = 34.25 y4. = 34.75 y.. = 33.1875
k ni

∑∑ ij
y 2
= 30 2

i =1 j =1
+ 28 2
+ ... + 36 2
+ 332
= 17703
ANOVA

ni 2 2
k
T 531
SST = ∑∑ y − 2
ij = 17703 −
..
= 80.4375
i =1 j =1 N 16
ANOVA

K
Ti.2 T..2 1222 + 1332 + 137 2 + 1392 5312
SS H = ∑ − = − =
i =1 ni N 4 16
= 43.1875

SS E = SST − SS H = 80.4375 − 43.1875 = 37.25


ANOVA

Origem da Graus de Soma de Média da soma


F p-value
variação liberdade quadrados de quadrados

Tratamentos 3 43.1875 14.3958 4.638 0.0224

Erro 12 37.25 3.1042

Total 15 80.4375

F( 0.05;3;12) = 3.49
p − value = Pr(F > 4.638) = 0.0224
ANOVA

ANOVA

Producao
Sum of
Squares df Mean Square F Sig.
Between Groups 43,188 3 14,396 4,638 ,022
Within Groups 37,250 12 3,104
Total 80,438 15
ANOVA
Testes de Comparações Múltiplas

Objectivo:
DECIDIR, na sequência de uma análise de variância onde
se concluiu existirem diferenças entre os tratamentos,
QUAIS SÃO OS TRATAMENTOS
QUE SÃO DIFERENTES ENTRE SI.
Testes de Comparações Múltiplas

Least Significant Difference – Diferença Mínima Significativa


Tuckey
Scheffé
Duncan
Dunnett
Newman-Keuls
Bonferroni
...
Teste LSD
i) Calcular as diferenças para todos os pares de médias yi − y j
Médias ordenadas da maior até à segunda
...
yk yk −1 yk −2 y2
y1 yk − y1 yk −1 − y1 yk −2 − y1 ...
y2 − y1
Médias ordenadas
da menor até à

y2 yk − y2 yk −1 − y2 yk −2 − y2 ...
penúltima

... ... ...

yk −1 yk − yk −1
Teste LSD
i) Calcular as diferenças para todos os pares de médias yi − y j

y4 = 34.75 y3 = 34.25 y2 = 33.25


y1 = 30.5 y4 − y1 = 4.25 y3 − y1 = 3.75 y2 − y1 = 2.75

y2 = 33.25 y4 − y2 = 1.50 y3 − y2 = 1.00

y3 = 34.25 y4 − y3 = 0.50
Teste LSD
ii) Calcular a estatística de teste:

2 × MSE
LSDα = t(α ; N − k ) .
ni
Graus de liberdade do erro

Nota: ni Nº de repetições
Teste LSD
ii) Calcular a estatística de teste:

2 × MSE
LSDα = t(α ; N − k ) .
ni

sx
Teste LSD
ii) Calcular a estatística de teste
Nota: Se ni ≠ n j para um par (i,j) de tratamentos:

1 1
LSDα = t(α ; N − k ) . MSE ×  + 
n n 
 i j 
Teste LSD
iii) Decisão
As médias yi e y j diferem significativamente se:

yi − y j > LSDα
Teste LSD
Obs: Alguns programas estatístico fazem o teste LSD :

yi − y j yi − y j
= ∼ t(α ; N − k )
2 × MSE sx
ni
Teste LSD
ii) Calcular a estatística de teste:
Para α=5%, t( 0.05;12) = 2.179

2 × MSE
LSDα = t(α ; N − k ) .
ni
2 × 3.1042
= 2.179 × = 2.715
4
Teste LSD
iii) Decisão

Diferenças entre tratamentos Decisão

y4 − y1 = 4.25 Diferem significativamente


y4 − y2 = 1.50 Não diferem
y4 − y3 = 0.50 Não diferem
y3 − y1 = 3.75 Diferem significativamente
y3 − y2 = 1.00 Não diferem
y2 − y1 = 2.75 Diferem significativamente
Teste LSD

Grupos homogéneos

Tratamentos Grupos

A y1 = 30.5 × a
B y2 = 33.25 × b
C y3 = 34.25 × b
D y4 = 34.75 × b
Teste LSD
Multiple Comparisons

Dependent Variable: Producao


LSD

Mean
Difference 95% Confidence Interval
(I) Variedade (J) Variedade (I-J) Std. Error Sig. Lower Bound Upper Bound
A B -2,75000* 1,24583 ,048 -5,4644 -,0356
C -3,75000* 1,24583 ,011 -6,4644 -1,0356
D -4,25000* 1,24583 ,005 -6,9644 -1,5356
B A 2,75000* 1,24583 ,048 ,0356 5,4644
C -1,00000 1,24583 ,438 -3,7144 1,7144
D -1,50000 1,24583 ,252 -4,2144 1,2144
C A 3,75000* 1,24583 ,011 1,0356 6,4644
B 1,00000 1,24583 ,438 -1,7144 3,7144
D -,50000 1,24583 ,695 -3,2144 2,2144
D A 4,25000* 1,24583 ,005 1,5356 6,9644
B 1,50000 1,24583 ,252 -1,2144 4,2144
C ,50000 1,24583 ,695 -2,2144 3,2144
*. The mean difference is significant at the .05 level.
Teste LSD
Teste LSD
Grupos Homogéneos
Homogeneous Subsets

Producao

Subset for alpha = .05


Variedade N 1 2
Scheffe A 4 30,5000
B 4 33,2500 33,2500
C 4 34,2500 34,2500
D 4 34,7500
Sig. ,072 ,700
Means for groups in homogeneous subsets are displayed.

You might also like