Professional Documents
Culture Documents
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
* joaquin.aldas@uv.es
■ Análisis de la varianza
► Cómo deben estar medidas las variables?
▬ El factor debe ser una variable nominal
▬ La variable dependiente debe ser métrica
► Formulación de la hipótesis nula:
H 0 : x f = xnf = xd
► ¿Cuál es la hipótesis alternativa? Importancia para las pruebas post hoc
► Cálculo del estadístico F (veremos su lógica… solo esta vez!)
► Rechazo o no de la hipótesis nula
▬ Significatividad p
Ygi − Y
► Esa diferencia puede escribirse:
Desviación residual
Desviación explicada por el factor
► Elevamos al cuadrado:
SCT SCF
Variabilidad total Variabilidad explicada por el factor
Between groups
SCR
Variabilidad residual
Within groups
SCF
MCF G − 1
F= =
MCR SCR
n−G
► Es decir cuanto más importante sea el efecto del factor, más grande será
el estadístico.
► La división por de las sumas de cuadrados por sus grados de libertad, lo
que las convierte en lo que llamamos media cuadrática, solo pretende
ajustar el hecho de que no hay el mismo número de elementos
generadores de variabilidad en numerador y denominador
SCF 171,37
MCF G − 1
F= = = 3 − 1 = 59,16
MCR SCR 344, 72
n − G 241 − 3
■ Homoscedasticidad
► La varianza de la variable dependiente no debe ser significativamente
distinta en los grupos que hace el factor
► Algunos autores afirman que el que no se cumpla no afecta mucho al
estadístico F si las muestras de cada grupo son del mismo o similar
tamaño (Stevens, 1996).
► Ver siempre los descriptivos
► Test de Levene (recordar que la H0 es igualdad de las varianzas)
► ¿Y si no?...
▬ Transformación de la variable dependiente, aunque hoy en día hay
alternativas…
▬ Estadísticos robustos ante la ausencia de homoscedasticidad (Brown-
Forsythe, Welch)
SCF 171,37
R2 = = = 0,33
SCT 516,10
Si la varianza más
grande está en el
grupo más grande SCR
se hincha
SI
DISTINTOS
NO
2
SI
MISMOS
NO
NO
MET 1
MET
SI One way ANOVA
DISTINTOS
1 NO
+2
SI
MISMOS
NO
SI
MET MISMOS
NO
NO NO
1 DISTINTOS
MET MET
* joaquin.aldas@uv.es
■ Normalidad
► Ante violaciones de la homoscedasticidad hemos visto que tenemos
alternativas bastante robustas para el estadístico F (Brown-Forsythe,
Welch), pero ¿y si se viola el supuesto de normalidad?
► La alternativa es una Anova no paramétrico llamado Anova de Kruskal-
Wallis o simplemente test de Kruskall-Wallis (Kruskall y Wallis, 1952).
■ Ejemplo (soya1.sav). Ilustraremos el procedimiento de cálculo con un ejemplo,
una vez más simpático, de Field (2005) porque está basado en pocos casos, y
es más sencillo explicar los pasos uno a uno.
► Este autor leyó que los menores niveles de esperma en los varones
occidentales está asociado al escaso consumo de soja.
► Diseñó un experimento (datos ficticios, claro) con cuatro grupos de 20
individuos cada uno en función de su nivel de consumo de soja (ningún
consumo-control, una comida a la semana, cuatro a la semana y todos los
días). Al final del año se efectuó un recuento de esperma (variable
dependiente).
► ¿Es la media de esperma significativamente distinta en cada grupo?
12 k
Ri2
H= " ! 3( N + 1)
N ( N + 1) i =1 ni
► En nuestro ejemplo:
■ Resultados
El método asintótico es
exacto con muestras
grandes, pero con
muestras pequeñas o
con datos muy poco
normales, es mejor
Monte Carlo, que
genera una muestra
similar a la nuestra y
extrae muchas
submuestras (10.000)
con las que calcula el
valor medio de la
significatividad y del
intervalo de confianza
▬ αcrítico =0.05/3=0.0167
Larger Smaller
! = 0.05 z Portion Portion y
k=4 2.62
2.63
.99560
.99573
.00440
.00427
.0129
.0126
!
2.64 .99585 .00415 .0122
0.05
= = 0.00417 2.65 .99598 .00402 .0119
k ( k " 1) 4 # 3
2.66 .99609 .00391 .0116
2.67 .99621 .00379 .0113
2.68 .99632 .00368 .0110
z0.00417 = 2.64 2.69 .99643 .00357 .0107
2.70 .99653 .00347 .0104 z
Test Statistic
Ru Rv Ru ! Rv
Ru Rv Ru ! Rv Ru ! Rv
Rv Ru ! RvRu ! Rv
Ru ! Rv Ru ! Rv
Ru ! Rv
► Y el valor crítico con el que hay que comparar las diferencias de rangos es:
Sperm counts were significantly affected by eating soya meals (H(3)=8.66, p<.05).
Mann-Whitney tests were used to follow up this finding. A Bonferroni correction
was applied so all effects are reported at a .0167 level of significance. It
appeared that sperm counts were no different when one soya meal (U=191, r=-.04)
or four soya meals (U=188, r=-.05) were eaten per week compared to none. However,
when seven soys meals were eaten per week, sperm counts were significanly lower
than when no soya was eaten (U=104, r=-.41). We can conclude that is soya is
eaten every day it significantly reduces sperm counts compared to eating none;
however eating soya less than every day has no significant impact on sperm
counts.
All effects reported at p<.05. Sperm counts were significantly affected by eating
soya meals (H(3)=8.66). Jonckheere’s test revealed a significant trend in the
data: as more soya was eaten, the median sperm count decreased, J=912, z=-2.48,
r=-.28
SI
DISTINTOS
NO
2
SI
MISMOS
NO
NO
MET 1
MET
SI
DISTINTOS
1 NO Kruskall-Wallis Anova
+2
SI
MISMOS
NO
SI
MET MISMOS
NO
NO NO
1 DISTINTOS
MET MET
* joaquin.aldas@uv.es
Acuerdo
Acuerdo l Hombres
n Mujeres
l l l Hombres
l
Opinión
Opinión
n
n n n Mujeres
l
n
Desacuerdo Desacuerdo
l Hombres Acuerdo
Acuerdo
n Mujeres
l
Opinión
Opinión
l l l Hombres
n n n Mujeres
n
l
Desacuerdo Desacuerdo
n
Acuerdo
l Hombres
Opinión
l
n Mujeres
n
l
n
Desacuerdo
Factor 1: Fumar
SCFA MCFA
Factor A SCF A G-1 MCFA=
G-1 F= MCR
SCFB MCFB
Factor B SCF B J-1 MCFB=
J-1 F=
MCR
SCF AxB MCFAxB
Interacción SCFAxB (G-1)(J-1) MCFAx B=
(G-1)(J-1)
F=
MCR
SCR
Residual SCR n-GJ MCR=
n-GJ
SCT
Total SCT n-1 MCT=
n-1
■ Homoscedasticidad
SI Independent t-test
DISTINTOS
NO Mann-Whitney /Wilcoxon rank
2
SI Related samples t-test
MISMOS
NO Wilcoxon matched-pairs test
NO
MET 1
MET
SI One way ANOVA
DISTINTOS
1 NO Kruskall-Wallis Anova
+2
SI One way repeated measures anova
MISMOS
NO Friedman’s Anova
SI Pearson correlation
MET MISMOS
NO Spearman o Kendall’s tau