You are on page 1of 10

Pompeu 25/02/2016

Tema 5. ANOVA

Llibre de Newbold:
- Secci 11.3

NDEX
Anlisis de la varincia (ANOVA)

1. Introducci
2. ANOVA dun 1 factor

1
Pompeu 25/02/2016

1. Introducci

Objectiu
Proposar models per realitzar comparacions, el ms homognies
possible, que permetin identificar si un FACTOR influeix en la
resposta dun fenomen que ens interessa estudiar.

Comparaci de poblacions
La tcnica estadstica coneguda com Anlisis de la Varincia
(ANOVA) es preocupa de determinar si un fenomen, que
podem quantificar, t el mateix comportament en tots els
grups duna poblaci, els quals els diferencien entre si per
algun FACTOR.

1. Introducci
Exemples
La producci dun cultiu depn del tipus de fertilitzant?
Les emissions de gasos defecte hivernacle depenen del
nivell de desenvolupament dun pas?
L'impacte en les vendes duna campanya de publicitat
basada en emissores de radio, de TV o tanques publicitries
s diferent?
Hi ha diferncies entre el preu del gasoil segons la
ubicaci de la benzinera?

El que farem ser comparar la mitjana de la resposta de cada


grup.

2
Pompeu 25/02/2016

1. Introducci

3 grups amb mitjanes iguals

1. Introducci

3 grups amb mitjanes diferents

3
Pompeu 25/02/2016

2. Comparaci de K poblacions (ANOVA 1 F)


Les dades
Mitjanes Desv. Est. Tamany

Mostra 1 x11 x12 x1n1 x1 S1 n1


Mostra 2 x21 x22 x2n2 x2 S2 n2

Mostra k xk 1 xk 2 xk n k xk Sk nk
x n

nj
1 1
nj
2
xj xij S 2j xij xj per j 1,..., k
nj i 1 nj 1 i 1
k nj
1
x xij
n j 1 i 1

2. Comparaci de K poblacions (ANOVA 1F)


Exemple 1
Un diari conclou al final dun reportatge que existeixen grans
diferncies entre la renta dels afiliats dels tres partits poltics
majoritaris (A, B, C). Com podem saber si s veritat?

Partit A 126 179 248 235 346


Partit B 157 134 145 567 327
Partit C 234 111 245 123 231

4
Pompeu 25/02/2016

2. Comparaci de K poblacions (ANOVA 1F)


Test ANOVA H0: 1 = 2 = ... = k
H1: almenys dues mitjanes sn diferents
Idea: comparar la
Variabilitat entre els grups amb la Variabilitat dins dels grups
(entre) (dins)

1 k n (x x)2 1 k nj
MSG j j MSW ( xij x j ) 2
k 1j 1 n k
j 1i 1

SSG SSW

2. Comparaci de K poblacions (ANOVA 1F)


Test ANOVA H0: 1 = 2 = ... = k
H1: almenys dues mitjanes sn diferents

Per evitar que la variabilitat depengui de les unitats de mesura es


calcula el quocient: estadstic de contrast
2
k 1
MSG k 1
F 2
Fk 1, n k
MSW n k
n k
F-Fisher

10

5
Pompeu 25/02/2016

2. Comparaci de K poblacions (ANOVA 1F)


Test ANOVA H0: 1 = 2 = ... = k
H1: almenys dues mitjanes sn diferents
A la taula ANOVA es representa la idea de que la varincia es pot
descompondre en les diferents fonts que loriginen.
Font de variaci GL Suma Quadrats F P
Quadrats Mitjans

Factor (Entre) k -1 SSG MSG =SSG/(k-1) p-valor


F=MSG/MSW
Error (Dins) n k SSW MSW=SSW/(n-k)

Total n 1 SST
Conclusi:
Amb un nivell de significaci , si F > Fk-1,n-k, o b si p-valor<
Rebutgem H0.
11

2. Comparaci de K poblacions (ANOVA 1F)


Test ANOVA H0: 1 = 2 = 3
H1: almenys dues mitjanes sn diferents
2. Boxplot
boxplot(dades)
1. Entrem les dades a R

A<-c(126,179,248,235,346)
B<-c(157,134,145,567,327)
C<-c(234,111,245,123,231)
dades<-list(A=A,B=B,C=C)
dades
$A
[1] 126 179 248 235 346

$B
[1] 157 134 145 567 327

$C
[1] 234 111 245 123 231

12

6
Pompeu 25/02/2016

2. Comparaci de K poblacions (ANOVA 1F)


Test ANOVA 3. Modifiquem les dades perqu ho entengui R
dades<-stack(dades)
names(dades)<-c("rendes", "partits")
rendes partits
1 126 A
2 179 A
3 248 A
4 235 A
5 346 A
6 157 B
7 134 B
8 145 B
9 567 B
10 327 B
11 234 C
12 111 C
13 245 C
14 123 C
15 231 C
13

2. Comparaci de K poblacions (ANOVA 1F)


Test ANOVA
4. Executem lANOVA

oneway.test(rendes~partits, data=dades,
var.equal=TRUE)

One-way analysis of means

data: rendes and partits


F = 0.4891, num df = 2, denom df = 12, p-value =
0.6249
No RH0 amb un 95% de
> anova(lm(rendes~partits, data=dades)) confiana, per tant no hi
Analysis of Variance Table ha prou evidncies per
lafirmaci del diari.
Response: rendes p-valor
Df Sum Sq Mean Sq F value Pr(>F)
partits 2 14901 7450.4 0.4891 0.6249 > 0,05
Residuals 12 182804 15233.6
14

7
Pompeu 25/02/2016

2. Comparaci de K poblacions (ANOVA 1F)

Hiptesis prvies

LANOVA s en realitat un model lineal,


X= +
per tant cal analitzar que les K mostres compleixin les segents
hiptesis:

Homocedasticitat (tenen la varincia igual)


Normalitat
Independncia

15

2. Comparaci de K poblacions (ANOVA 1F)


Exemple 2
Volem realitzar un estudi comparatiu sobre el
preu del litre de benzina a les benzineres
situades en rees comercials, residencials i
zones industrials. Per realitzar lestudi shan
escollit a latzar un determinat nombre de
benzineres a cada zona (0 = comercial, 1 =
residencial i 2 = industrial) i shan apuntat el preu
mitj setmanal (), del litre de benzina. Podem
afirmar que existeixen diferncies significatives
en el preu de la benzina de les diferents zones?
Nivell de significaci 2,5%.

16

8
Pompeu 25/02/2016

2. Comparaci de K poblacions (ANOVA 1F)


BOXPLOT

2. Comparaci de K poblacions (ANOVA 1F)

RESOLUCI AMB R

>zona<-c(0,0,0,0,0,0,0,1,1,1,1,2,2,2,2,2,2)
>Preu<- c(1.097,1.122,1.105,1.119,1.089,1.102,1.095,1.158,
1.145,1.161,1.153,1.138,1.176,1.159,1.093,1.124,1.089)
>oneway.test(Preu~zona, var.equal=TRUE)

One-way analysis of means

data: Preu and zona


F = 6.4577, num df = 2, denom df = 14, p-value = 0.0103 < 0.025

RH0, hi ha evidncies estadstiques


que alguna de les mitjanes s diferent

9
Pompeu 25/02/2016

EXERCICI
Dades dels nutrients servits en el dinar de tres escoles diferents

S1, n=25 S2, n=25 S3, n=25 P-value


Calcium (mg) Mean 117.8 158.7 206.5 0.000
SD 62.4 70.5 86.2
Iron (mg) Mean 2.0 2.0 2.0 0.854
SD 0.6 0.6 0.6
Folate (g) Mean 26.6 38.7 42.6 0.000
SD 13.1 14.5 15.1
Zinc (mg) Mean 1.9 1.5 1.3 0.055
SD 1.0 1.2 0.4

Construu la taula ANOVA, per comparar el contingut en CALCI de les tres escoles.

SOLUCI

Mean Sum of
Source of d.f. Sum of squares Squares F-statistic p-value
variation
2 98,113 49.056 <.05
Between 9

5.431
Within 72 391,066

Total 74 489,179

10

You might also like