You are on page 1of 45

Cuando se contrasta la hiptesis

de que dos medias poblacionales


son iguales, utilizamos el rbol
para contrastes, de modo que en
l encontramos las diferentes
alternativas, dependiendo de las
suposiciones de normalidad,
homocedasticidad, independencia
etc.
Ho:
A
=
B
NORMALES
Muestras
pequeas
Varianzas
desconocidas
Iguales
Test Tc
Distintas
T de Welch
Varianzas
conocidas
Test Z
Muestras grandes
Varianzas
conocidas
o desconocidas
Test Z
Este test permite contrastes de igualdad
de medias para el caso particular que
dispongamos en el estudio de varios
grupos experimentales (ms de dos).
1 2 3
: ...
i
Ho = = =
: Ha no todas iguales
0
0,2
0,4
0,6
0,8
1
R
i
e
s
g
o

t
i
p
o

I
0 5 15 25 35 45 55 65 75 85 95 105 115 125
comparaciones
gr upos compar aci ones r i esgo t i po I
2 1 0, 05
3 3 0, 1426
4 6 0, 2649
5 10 0, 4013
6 15 0, 5367
7 21 0, 6594
8 28 0, 7622
9 36 0, 8422
10 45 0, 9006
11 55 0, 9405
12 66 0, 9661
13 78 0, 9817
14 91 0, 9906
15 105 0, 9954
El anlisis de la varianza (ANOVA) nos permite:
El anlisis de la varianza de un conjunto de muestras permite
contrastar la hiptesis nula todas las medias poblacionales de
las que provienen las muestras son iguales contra la hiptesis
alternativa no todas las medias son iguales con un nivel de
significacin prefijado.
1 2 3
: Ho = =
: Ha no todas iguales
5% o =
Conviene sealar que el ANOVA es una prueba a nivel
global. Nos habla de si existen o no diferencias a nivel
global entre las medias pero no nos dice entre cuales se
produce la diferencia.
Slo cuando se obtenga una significacin de la prueba
global se proceder por distintos mtodos a comprobar
que medias son las responsables de la significacin.
Consideraciones generales
El nombre se debe al mtodo empleado y no al objetivo
conseguido.
El mtodo se basa en la pregunta: habr mayor variacin
entre las medias de los distintos grupos que entre los
grupos mismos?.
Una diferencia entre las medias ha de ser grande con
respecto a la variabilidad inherente a los grupos para que
sea significativa.
Como todas las tcnicas estadsticas la actual est basada en
ciertas hiptesis que han de verificarse para que la tcnica sea
vlida.
Ahora las condiciones son que se disponga de r muestras aleatorias
independientes, normales de medias y varianzas desconocidas
pero iguales (homoscedsticas).
( , )
i i
A N o
1 2 3 i r
X
11
X
21
X
31
X
i1
X
r1

X
12
X
22
X
32
X
i2
X
r2

X
13

.
X
1j
X
2j
X
3j
X
ij
X
rj

X
1n1
X
2n2
X
3n3
X
ini
X
rnr

n
1
n
2
n
3
n
i
n
r
N
x
x1. x2. x3. xi. xr.
i = n de grupos ; j = ndice de observacin en cada grupo
ni = n de observaciones en la muestra i ; N = Tamao global
xi. = media del grupo i ; = Media global
x
Ejemplo base: La tabla siguiente ofrece datos de las
disminuciones de actividad de r = 4 grupos de ratas tras
la aplicacin de 4 sustancias distintas. Las 24 ratas
totales eran homogneas y fueron divididas al azar en 4
grupos de 6 ratas.
1 2 3 4
64 78 75 55
72 91 93 66
68 97 78 49
77 82 71 64
56 85 63 70
95 77 76 68
x1.= 72 x2.= 85 x3.= 76 x4. =62

La idea base :
La variabilidad total de los datos (Q) es suma de dos
variabilidades: la variabilidad de los datos dentro de
cada muestra (que se debe slo al azar (QD) y la
variabilidad existente entre las muestras (que se debe al
azar y si la hiptesis alternativa es cierta a que las
muestras provienen de poblaciones con distintas
medias(QE).
2
1 1
( )
i
n
r
ij
i j
Q x x
= =
=

2
.
1 1
( )
i
n
r
D ij i
i j
Q x x
= =
=

2
.
1
( )
r
E i i
i
Q n x x
=
=

A
X
B
X
C
X
X
--
X
--
A
X
B
X
C
X
ESTIMULANTE(t rat ami ent o)
A B C D E
1,53 3,15 3,89 8,18 5,86
1,61 3,96 3,68 5,64 5,46
3,75 3,59 5,7 7,36 5,69
2,89 1,89 5,62 5,33 6,49
3,26 1,45 5,79 8,82 7,81
1,56 5,33 5,26 9,03
7,1 7,49
8,98
Total 13,04 15,60 30,01 47,69
56,81
163,15
Media 2,61 2,60 5,00 6,81
7,10
5,10
Datos reales:
Tratamiento
I
n
s
u
l
i
n
a
l
i
b
e
r
a
d
a
media global
Qu observamos?
Variabilidad en las observaciones
Por qu?.
Es debida al azar.???
o a que no todos los tratamientos
producen el mismo efecto???
Qu observamos?
Variabilidad en las observaciones
Por qu?.
Es debida al azar.???
o a que no todos los tratamientos
producen el mismo efecto???
2
1 1
( )
i
n
r
ij
i j
Q x x
= =
=

2
.
1 1
( )
i
n
r
D ij i
i j
Q x x
= =
=

2
.
1
( )
r
E i i
i
Q n x x
=
=

Datos reales: Diagrama de


dispersin
Tratamiento
I
n
s
u
l
i
n
a
l
i
b
e
r
a
d
a
media global
- -
y y
ij
- -
y
2
1 1
( )
i
n
r
ij
i j
Q x x
= =
=

2
.
1 1
( )
i
n
r
D ij i
i j
Q x x
= =
=

2
.
1
( )
r
E i i
i
Q n x x
=
=

Datos reales: Diagrama de


dispersin
Tratamiento
I
n
s
u
l
i
n
a
l
i
b
e
r
a
d
a
media global
-
=
i ij ij
y y e
- -
y
- -
y y
ij
2
1 1
( )
i
n
r
ij
i j
Q x x
= =
=

2
.
1 1
( )
i
n
r
D ij i
i j
Q x x
= =
=

2
.
1
( )
r
E i i
i
Q n x x
=
=

Tratamiento
I
n
s
u
l
i
n
a
l
i
b
e
r
a
d
a
media global
-
=
i ij ij
y y dentro e
- -
y
- -
y y
ij
- - -
= y y entre e
i ij
Para obtener variabilidades promedio es
preciso dividir cada suma de cuadrados por sus
grados de libertad, obtenindose as la
varianza dentro y la varianza entre.
2
D
D
Q
S
N r
=

2
1
E
E
Q
S
r
=

2
o
?
Estadstico de contraste
El cociente entre la variabilidad entre y la variabilidad dentro, una
vez que se han hecho comparables, sigue una distribucin F de
Snedecor con r-1 y N-r grados de libertad.
2
2
Dentro
Entre
exp
S
S
F =
Regla de decisin
Al comparar la variabilidad entre y la variabilidad dentro:
Rechazaremos la hiptesis nula siempre que la variabilidad entre sea
grande, pero utilizando como patrn de comparacin la variabilidad
dentro.
Es decir, aceptaremos un efecto de los tratamientos siempre que estos
produzcan mayores diferencias en las unidades experimentales que las que
habra sin la aplicacin de los mismos.
2
2
Dentro
Entre
exp
S
S
F =
Regla de decisin
Si el valor experimental F
exp
supera el valor crtico de una F de Snedecor con r-1 y N-r
g.l. al nivel de significacin elegido, se rechazar la Ho de igualdad de medias
poblacionales y se aceptar la alternativa de que al menos algn par de medias es
diferente.
pvalor <o Rechazo Ho
Contraste Unilateral
superior
F
o (r
1;
N
r)
o
1
o
Si F
exp.
Rechazo
Ho
2 2
0
2 2
:
:
D E
a E D
H
H
o o
o o
=
>
0.05 o =
2
1,
2

E
r N r
D
S
F
S

Como se trata de un contraste unilateral superior:


RC :
RA:
{ }
( 1, )
/
r N r
F F F
o
>
{ }
( 1, )
/
r N r
F F F
o
<
1 2 i r
= = =
notodaslasmedias soniguales
Por ello la hiptesis
1 2
......
r
= = =
es equivalente a
2 2 2
0
:
E D
H o o o = =
y la alternativa Ha: No todas son iguales es equivalente a
2 2
E D
o o >
y as el test de comparacin de medias se convierte en un test unilateral
superior.
Presentacin de resultados
Cuadro del ANOVA
La informacin completa del anlisis se resume en forma de tabla,
denominada tabla del ANOVA y resume toda la informacin necesaria
para realizar el correspondiente contraste
ANOVA
Fuente
Sumas de
Cuadrados
g.l. Estimadores Fexp.
Entre r-1
Residual N-r
Total N-1
( )
2
1
r
Entre i i
i
Q n x x
-
=
=

( )
2
1 1
i
n
r
Dentro ij i
i j
Q x x
-
= =
=

2
/ 1
Entre Entre
S Q r =
F
exp
=
S
Entre
2
S
Dentro
2
2
Dentro Dentro
S Q N r =
( )
2
1 1
i
n
r
Total ij
i j
Q x x
= =
=

Existen frmulas abreviadas equivalentes que


facilitan enormemente los clculos y evitan errores
de redondeo:
2
2
.
2
ij
i j
i
E
i
i
ij
i j
Q x C
T
Q C
n
x
Siendo C
N
=
=
| |
|
\ .
=


Ejemplo base: La tabla siguiente ofrece datos de las
disminuciones de actividad de r = 4 grupos de ratas tras
la aplicacin de 4 sustancias distintas. Las 24 ratas
totales eran homogneas y fueron divididas al azar en 4
grupos de 6 ratas.
1 2 3 4
64 78 75 55
72 91 93 66
68 97 78 49
77 82 71 64
56 85 63 70
95 77 76 68
x1.= 72 x2.= 85 x3.= 76 x4. =62


1 2 3 4
64 78 75 55
72 91 93 66
68 97 78 49
77 82 71 64
56 85 63 70
95 77 76 68
n
1
=6 n
2
=6 n
3
=6 n
4
=6 N=24
T
1.
= 432 T
2.
=510 T
3.
= 456 T
4.
= 372 1770
ij
ij
x =


2
1.
1
31104
T
n
=
2
2.
2
43350
T
n
=
2
3.
3
34656
T
n
=
2
4.
4
23064
T
n
=
2
.
132274
i
i
i
T
n
=

2
1770
130537, 5
24
C = =
2
.
1636, 5
i
i
i
E
T
C Q
n
= =

Q = 64
2
++68
2
-C= 3654,5
QD =3654,5-1636,5 = 2118
El objetivo es comparar si todos los tratamientos
tienen igual efecto o no:
1 2 3 4
: Ho = = =
: Ha no todas iguales
3654, 5 2018, 0 1636, 5
D E
Q Q Q = +
= +
2
2
2
2
2018, 0

100, 9
20
1636, 5

545, 5
1 3

5, 41

D
D
E
E
E
D
Q
S
N r
Q
S
r
S
F
S
= = =

= = =

= =
5%(3,20)
1%(3,20)
3,10
5, 85
F
F
=
=
Generalmente los resultados se expresan en forma
de tabla de la forma:
Fuente
variaci
n
Suma de
cuadrados
Grados
libertad
Estimadores F experim
Entre
2
.
1636, 5
i
E
i
i
T
Q C
n
= =


r-1=3
2

5 5,
1
4 5
E
E
Q
S
r
= =


2
2
5 1

, 4
E
D
S
F
S
= =

Dentro
D E
Q Q Q = = 2118

N-r =20
2
100,

9
D
D
Q
S
N r
= =



Total
3654, 5 Q=

N-1= 23

I mpor t ant e!!
ELANOVAes una prueba de significacin a nivel global
Nos dice si hay diferencias, pero no donde estn las diferencias
(es decir que par(es) de medias es (son) diferente(s))
Necesitamos realizar contrastes tras el ANOVA para
encontrar dichas diferencias
(es decir, para encontrar las causas de la significacin)
Contrastes tras el ANOVA
Sin control riesgo tipo I:..LSD
Tamaos iguales: TUKEY
Todas las comparaciones
Tamaos distintos: BONFERRONI
Con control riesgo tipo I
Comparar con un control: DUNNET
(test de la diferencia significativa mnima)
a) Hiptesis estadstica:
H0 : = ( ; i, j = 1, ..., r)
Ha:
b) Nivel de significacin (usuales) 0,05 y 0,01
c) Estadgrafo de Contraste, :
d) Regin crtica =
e) Regin de aceptacin =
i

i j
=
2
1 1
i j
N r
D
i j
x x
t
s
n n

| |
+
|
|
\ .
; ;
/
N r N r
t t t t
o o
s s
;
/
N r
t t t
o
>
, i j

Si n = n
= n i, j; (i, j = 1, 2, ...r )
j i
t
exp =
Si
Llamando LSD =
Por tanto, la cantidad LSD es la mnima diferencia que tenemos que encontrar
entre las medias muestrales de dos tratamientos (niveles del factor) Para
concluir que las medias son diferentes en sus respectivas poblaciones.
,
2
1 1
i j
N r
D
x x
t
s
n n
o

>
| |
+
|
\ .
Cte=C
( )
0
, * Re
i j N r
X X t C chazoH o

>
,
*
N r
t C
o
Rechazo H0
No es ms que una t de Student (corregida ya que utilizamos un mejor estimador
de la nica varianza poblacional) de modo que al realizar muchas
comparaciones se incrementa el riesgo tipo I.
'
K
o
o =
H 0 : ( ; i, j = 1, ..., r)
Se elige k= r (nmero de grupos a comparar), de forma que se
rechaza H0 para cada comparacin si texp >Tukey
El test de Tukey exige que todos los grupos tengan el mismo
tamao muestral. Se consigue un
, N r k
0.05 o =
, i j i j
=
i j
= Ha:
b) Nivel de significacin (usuales) 0,05 y 0,01
c) Estadgrafo de Contraste:
,
2
1 1
i j
N r K
D
x x
t
s
n n
K r

| |
+
|
\ .
=
H 0 : ( ; i, j = 1, ..., r)
Se elige k= r(r-1)/2 (nmero de todas las comparaciones por
parejas), de forma que se rechaza H0 para cada comparacin si
t
exp
> t
Bonferroni
(N r ,k ). Consigue un
0.05 o s
, i j i j
=
i j
= Ha:
b) Nivel de significacin (usuales) 0,05 y 0,01
c) Estadgrafo de Contraste:
( )
,
2
1
1 1
2
i j
N r K
D
i j
x x
t
r r
s
n n
K


| |
+
|
|
\ .
=
Si las unicas comparaciones con sentido son los de los
diferentes tratamientos con el control. Se elige k=(r-1)
(numero de grupos menos uno).
Se rechaza la H0 si texp > tDunnett (N r, k ).
Es conveniente que todos los grupos tengan el mismo
tamao muestra.
Test de Newman-Keuls
Se trata de una modificacin del test de TUKEY que reduce progresivamente el
nmero de grupos a comparar y que evita la realizacin de todas las comparaciones
por parejas.
1. Se ordenan los grupos segn la magnitud de sus medias
A B C D
x
A
s x
B
s x
C
s x
D
2. Utilizando el test de Tukey, comparamos A con D, si no hay diferencias
significativas hemos terminado, si las hay comparamos los dos grupos de
3, es decir, Acon C y B con D.
3. Cada vez que encontremos dos grupos iguales podemos subrayar los
grupos extremos, de forma que en la comparacin siguiente no es
necesario contrastar aqullos unidos por una lnea. (Subrayado de
Duncan)
A B C D
Test de Newman-Keuls
4. En cada paso se va corrigiendo r (para encontrar el valor crtico en la tabla
de Tukey correspondiente). Se considerarn diferentes aquellas poblaciones
que no estn unidas por una lnea continua.
5. VENTAJA: En cada paso el nmero de medias comparadas va
disminuyendo, el valor de r tambin y, consecuentemente el valor crtico. Va
siendo, por tanto, ms probable encontrar una significacin.
6. Si el ANOVA resulta significativo, las dos medias ms extremas las
declararemos significativas aunque el test t no lo demuestre.
Relacin penalizaciones

You might also like