Professional Documents
Culture Documents
ApuntesdeBioestadstica
-1-
Para usar el modelo ANOVA debe poder suponerse que son vlidas una serie de
condiciones:
La variabilidad de todas las muestras debe ser similar. sta es la
condicin ms importante.
Las muestras deben tener una distribucin aproximadamente normal.
Cierto alejamiento de esta hiptesis no es muy problemtico.
Los tamaos de las muestras no deben ser muy dispares. Esta condicin
en realidad no es estrictamente necesaria, y adems es controlable al
realizar un experimento. Pero, si se sospecha una cierta heterogeneidad
en la variabilidad en los diferentes grupos (como es razonable esperar en
la prctica), el tener grupos desequilibrados en tamao slo puede
empeorar las cosas. Esta condicin simplifica el poder interpretar los
resultados.
Si se dan las dos primeras condiciones, el modelo ANOVA traduce la hiptesis nula de
que en todos los grupos se obtienen valores similares de las variables por una
condicin equivalente: Que las medias (como parmetros) en los diferentes grupos son
iguales.
5
F.J.BarnLpez./F.TllezMontiel. ApuntesdeBioestadstica
- 30 -
biolgico, con frecuencia tiene sentido hacer un cambio de variable logartmico, que
habitualmente normaliza las observaciones e iguala varianzas.
Ejemplo: Se realiz un experimento para comparar tres mtodos de aprendizaje de
lectura. Se asign aleatoriamente los estudiantes a cada uno de los tres mtodos. Cada
mtodo fue probado con 22 estudiantes (experimento equilibrado). Se evalu mediante
diferentes pruebas la capacidad de comprensin de los estudiantes, antes y despus
de recibir la instruccin. Las puntuaciones antes de recibir la enseanza eran de media
muy similares y aproximadamente normales. La prueba ANOVA con dichas
puntuaciones no mostr diferencia estadsticamente significativa (p=0.45). La prueba
de Levene para la igualdad de varianzas confirm que se poda asumir la igualdad de
varianzas para las pruebas de lectura antes (p=0.738). Es decir, los estudiantes de
los tres grupos tenan habilidades medias similares, como sera de esperar al haber
hecho la distribucin aleatoriamente.
Prueba de homogeneidad de varianzas
Antes
Estadstico
de Levene
,305
gl1
gl2
2
Sig.
,738
63
ANOVA
Antes
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados
7,826
292,739
300,564
gl
2
63
65
Media
cuadrtica
3,913
4,647
F
,842
Sig.
,436
20
22
N=
22
22
Descriptivos
Diferencia
Grupo
Control
Tcnica I
Tcnica
II
Media
Mediana
Varianza
Amplitud intercuartil
Asimetra
Curtosis
Media
Mediana
Varianza
Amplitud intercuartil
Asimetra
Curtosis
Media
Mediana
Varianza
Amplitud intercuartil
Asimetra
Curtosis
Estadstico
9,8712
9,5000
7,156
4,1667
,288
,121
13,5000
14,0000
9,381
5,7500
-,161
-1,344
Error tp.
,57032
13,0909
13,5833
5,613
4,1250
-,222
-,961
,50511
,491
,953
,65300
,491
,953
,491
,953
gl1
gl2
2
Sig.
,251
63
ANOVA
Diferencia
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados
173,814
465,148
638,962
gl
2
63
Media
cuadrtica
86,907
7,383
F
11,771
Sig.
,000
65
Esto quiere decir que efectivamente aceptamos que hay diferencia estadsticamente
significativa entre los resultados de las tres tcnicas (las diferencias no han sido
causadas por el azar). Por tanto nos gustara saber entre qu grupos se ha producido la
diferencia. Una aproximacin ingenua sera la de hacer directamente los contrastes no
planeados, como si no tuvisemos ninguna hiptesis de qu grupo debe ser diferente al
resto. Esto no es muy sensato, pues cuando hacemos un experimento no lo hacemos por
que no tengamos nada mejor que hacer. Seguramente tendremos alguna sospecha. En
cualquier caso, las pruebas de Scheff y Tukey encuentran diferencias estadsticamente
significativas para las combinaciones (grupo de control, tcnica I), (grupo de control,
tcnica II), y no encuentra diferencias entre los grupos (tcnica I, tcnica II).
Comparaciones mltiples
Variable dependiente: Diferencia
HSD de Tukey
(I) Grupo
Control
Tcnica I
Tcnica II
Scheff
Control
Tcnica I
Tcnica II
(J) Grupo
Tcnica I
Tcnica II
Control
Tcnica II
Control
Tcnica I
Tcnica I
Tcnica II
Control
Tcnica II
Control
Tcnica I
Diferencia de
medias (I-J)
Error tpico
-3,62879*
,81927
-3,21970*
,81927
3,62879*
,81927
,40909
,81927
3,21970*
,81927
-,40909
,81927
-3,62879*
,81927
-3,21970*
,81927
3,62879*
,81927
,40909
,81927
3,21970*
,81927
-,40909
,81927
Sig.
,000
,001
,000
,872
,001
,872
,000
,001
,000
,883
,001
,883
Intervalo de confianza al
95%
Lmite
superior
Lmite inferior
-5,5953
-1,6623
-5,1862
-1,2532
1,6623
5,5953
-1,5574
2,3756
1,2532
5,1862
-2,3756
1,5574
-5,6828
-1,5748
-5,2737
-1,1657
1,5748
5,6828
-1,6449
2,4631
1,1657
5,2737
-2,4631
1,6449
1,000
Control
22
Tcnica II
22
Tcnica I
22
Sig.
13,0909
13,5000
22
,872
9,8712
13,0909
13,5000
1,000
,883
Junto a las pruebas anteriores, SPSS nos muestra una tabla formada por uniones de
grupos que presentan valores de las medias parecidos.
En este caso se aprecia que el grupo formado por los resultados de los individuos
que han seguido las tcnicas I y II formaran un grupo homogneo (sus medias
son muy similares, y un contraste de diferencia de medias resulta muy
claramente muy no significativo (p=0,872 para la prueba de Tukey y p=0,883)
para la prueba de Scheffe). Todo esto lo apreciamos en la columa etiquetada
como 2. La columna etiquetada como 1, solo contiene un grupo, que por
supuesto no presenta diferencias consigo mismo (faltara ms). SPSS lo muestra
simplemente para que apreciemos la diferencia entre la media de ese grupo, con las
cantidades que aparecen en la columna 2.
Por ltimo, recordemos que nuestra hiptesis de partida
era bastante fina; Pensbamos (antes de recoger los
Grupo
Control
Tcnica I
Tcnica
II
Contraste
datos),
que el grupo control obtendra resultados
1
1
-,5
-,5
diferentes a los que siguieron las tcnicas I y II. Es
legtimo entonces no hacer
comparaciones tan genricas como las post-hoc, y hacer exactamente esa. Esto lo
podemos realizar haciendo una comparacin planeada. Asignamos coeficientes 1, -0.5
y
-0.5 (juntos suman cero) respectivamente a los grupos Control, Tcnica I y Tcnica II,
pulsando en el botn contrastes de la prueba ANOVA de un factor de SPSS. Los
resultados resultan muy significativos para confirmar nuestra hiptesis (tanto
suponiendo varianzas iguales como diferentes).
Diferencia
Asumiendo igualdad
de varianzas
No asumiendo
Contraste
1
1
Valor del
contraste
Error tpico
gl
Sig. (bilateral)
-3,4242
,70951
-4,826
63
,000
-3,4242
,70403
-4,864
42,556
,000
Estadsticos de contrastea,b
Chi-cuadrado
gl
Sig. asintt.
Diferencia
18,042
2
,000
a. Prueba de Kruskal-Wallis
b. Variable de agrupacin: Grupo
La significacin del contraste es prcticamente nula, es decir hay una gran evidencia
estadstica en contra de que los resultados obtenidos por las tres tcnicas sean
similares.