Anova PDF

Análisis de Datos Avanzados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Análisis de la varianza de un factor
Joaquín Aldás Manzano

Universitat de València
* joaquin.aldas@uv.es
Doctorado Interuniversitario en Marketing 1

Construcción de un modelo multivariante
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Definir el problema y decidir la técnica

■  Desarrollo del plan de análisis
►  Tamaños muestrales mínimos
►  Escalas adecuadas
■  Condiciones de aplicabilidad
►  Comprobación de hipótesis subyacentes a los modelos
■  Estimación del modelo y ajuste global
■  Interpretación de los resultados
■  Validación (resultados generalizables a la población)

Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Análisis de la varianza (tabaco1.sav)

►  Sirve para determinar si una variable determinada toma valores medios
iguales o distintos en los grupos que forma otra variable.
▬  Retomando el ejemplo sobre el tabaco, ¿condiciona el hábito de fumar
o no el ser más o menos favorable a que se suban los impuestos
sobre este bien?
►  VARIABLE DEPENDIENTE (impuesto), es la que queremos saber si toma
valores medios iguales o distintos.
▬  ¿Deben subirse los impuestos sobre el tabaco? 1=Totalmente en
desacuerdo a 5=Totalmente de acuerdo
►  FACTOR (fuma) es la variable que supuestamente ejerce una influencia
sobre la variable dependiente (establece los grupos)
▬  ¿Fuma usted? 1=No, nunca he fumado, 2=No, lo he dejado; 3=Sí
►  Se analizará también el análisis de la varianza de dos factores, donde se
considera la influencia conjunta sobre la dependiente de dos variables
independientes (factores).

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Análisis de la varianza
►  Cómo deben estar medidas las variables?
▬  El factor debe ser una variable nominal
▬  La variable dependiente debe ser métrica
►  Formulación de la hipótesis nula:
H 0 : x f = xnf = xd
►  ¿Cuál es la hipótesis alternativa? Importancia para las pruebas post hoc
►  Cálculo del estadístico F (veremos su lógica… solo esta vez!)
►  Rechazo o no de la hipótesis nula
▬  Significatividad p

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Lógica del estadístico F

►  Cada individuo, fumador o no, tendrá una opinión que diferirá en mayor o
menor medida de la opinión del conjunto de la muestra:
Ygi − Y
►  Esa diferencia puede escribirse:
Ygi − Y = (Yg − Y ) + (Ygi − Yg )
Desviación residual
Desviación explicada por el factor
►  Elevamos al cuadrado:
(Ygi − Y ) = (Yg − Y ) + (Ygi − Yg ) + 2 (Yg − Y )(Ygi − Y )

2 2 2

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

►  Como no tenemos un solo grupo sino G y en cada uno de ellos no hay un
solo individuo, sino ng sumamos para todos ellos:
SCT SCF
Variabilidad total Variabilidad explicada por el factor
Between groups
SCR
Variabilidad residual
Within groups

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

►  Cuanto más parte de la variabilidad total la explique pertenecer a un grupo
u otro (factor) y menos la variabilidad interna de cada grupo, más seguros
estaremos de que el efecto del factor es relevante. Por eso parece lógico
construir el estadístico de este modo:
SCF
MCF G − 1
F= =
MCR SCR
n−G
►  Es decir cuanto más importante sea el efecto del factor, más grande será
el estadístico.
►  La división por de las sumas de cuadrados por sus grados de libertad, lo
que las convierte en lo que llamamos media cuadrática, solo pretende
ajustar el hecho de que no hay el mismo número de elementos
generadores de variabilidad en numerador y denominador

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
SCF 171,37
MCF G − 1
F= = = 3 − 1 = 59,16
MCR SCR 344, 72
n − G 241 − 3

Condiciones de aplicabilidad
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Homoscedasticidad
►  La varianza de la variable dependiente no debe ser significativamente
distinta en los grupos que hace el factor
►  Algunos autores afirman que el que no se cumpla no afecta mucho al
estadístico F si las muestras de cada grupo son del mismo o similar
tamaño (Stevens, 1996).
►  Ver siempre los descriptivos
►  Test de Levene (recordar que la H0 es igualdad de las varianzas)
►  ¿Y si no?...
▬  Transformación de la variable dependiente, aunque hoy en día hay
alternativas…
▬  Estadísticos robustos ante la ausencia de homoscedasticidad (Brown-
Forsythe, Welch)

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

Estimación del modelo
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Significatividad del estadístico F

►  Con base en esta información decidimos si es plausible el rechazo de la
hipótesis nula
►  Concluimos que el efecto del factor es significativo, pero ¿es intenso?, es

decir, ¿cuál es el tamaño del efecto?
►  Debemos reportar el R2, que no es sino una medida de qué parte de la
varianza total es explicada por el factor:
SCF 171,37
R2 = = = 0,33
SCT 516,10

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  F de Brown-Forsythe (Brown y Forsythe, 1974)

►  Cuando los grupos tienen distintos tamaños muestrales y la varianza más
grande están en los grupos con mayor tamaño, esto sesga el estadístico F
provocando que sea muy conservador:
Si la varianza más
grande está en el
grupo más grande SCR
se hincha
►  Brown y Forsythe (1984) proponen la siguiente corrección:
La varianza de cada grupo está ahora

multiplicado por un factor que es más pequeño
cuanto más grande es el tamaño del grupo. Este
estadístico se evalúa con un número de grados
de libertad corregido para el denominador

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  F de Brown-Forsythe (Brown y Forsythe, 1974)
Grados de libertad del

denominador corregidos

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  ¿Pero cuál era la hipótesis alternativa? Pruebas post hoc

►  Sólo podemos decir que la media en algún grupo es diferente a las demás,
pero ¿cuáles son diferentes de cuáles?
►  Para poder concluir algo al respecto tenemos una batería de distintas
pruebas post hoc o pruebas a posteriori
►  También existen pruebas post hoc específicas para situaciones de
ausencia de homoscedasticidad
■  ¿Por qué pruebas específicas? ¿Por qué no comparar las medias dos a dos
mediantes pruebas t?
►  Ejercicios de simulación de Montecarlo demuestran que la probabilidad de
que las pruebas t encadenadas encuentren alguna diferencia significativas
donde no las hay se incrementa con el número de comparaciones (5
grupos, 10 comparaciones, 29%; 10 grupos, 45 comparaciones, 63%)
►  Las pruebas específicas ajustan el nivel de significación necesario en
función del número de comparaciones. Cuanto más comparaciones, mayor
tiene que ser la diferencia para ser considerada significativa.
►  Por ejemplo, Bonferroni, una de las más sencillas, si se realizan c
comparaciones, exige un nivel de significación crítico de a/c para poder
rechazar cada comparación

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Pruebas post hoc

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  ¿qué pruebas post hoc elegir?

►  Puede consultarse Toothaker (1993) o Klockars y Sax (1986) para una
argumentación detallada, pero tengamos en cuenta que SPSS produce
hasta 18 tests
►  Como guía apuntamos la síntesis de las recomendaciones de Field (2005):
▬  Si tenemos muestras iguales por grupo y estamos bastante seguros
de que las varianzas son parecidas:
●  REGWQ o Tukey tienen un buen equilibrio entre poder y control
del error tipo I
●  Bonferroni es conservador pero asegura control sobre el error
tipo I
▬  Si los tamaños muestrales son ligeramente distintos: Gabriel
▬  Si los tamaños muestrales son muy distintos: Hochberg GTD
▬  Si hay dudas sobre la homogeneidad de varianzas: Games-Howell

Interpretación de los resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Results were analyzed using a one-way ANOVA, between-groups

design. This analysis revealed a significant effect for
smoking habit, F(2,238)=59.16; p <.01. The sample means are
displayed in Figure X. Tukey’s HSD test showed that subjects
who have always been non-smokers or that have given up
smoking are significantly more favorable to increase tobacco
taxes than smokers (p <.05) while there were no significant
differences between them.

Guía para la elección del test más adecuado
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Tipo Tipo # =o≠
#VD # VI Paramétrico TEST
VD VI niveles participantes
SI
DISTINTOS
NO
2
SI
MISMOS
NO
NO
MET 1
MET
SI One way ANOVA
DISTINTOS
1 NO
+2
SI
MISMOS
NO
SI
MET MISMOS
NO
NO NO
1 DISTINTOS
MET MET

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Análisis de la varianza de un factor no paramétrico

Test de Kruskal-Wallis


■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Normalidad
►  Ante violaciones de la homoscedasticidad hemos visto que tenemos
alternativas bastante robustas para el estadístico F (Brown-Forsythe,
Welch), pero ¿y si se viola el supuesto de normalidad?
►  La alternativa es una Anova no paramétrico llamado Anova de Kruskal-
Wallis o simplemente test de Kruskall-Wallis (Kruskall y Wallis, 1952).
■  Ejemplo (soya1.sav). Ilustraremos el procedimiento de cálculo con un ejemplo,
una vez más simpático, de Field (2005) porque está basado en pocos casos, y
es más sencillo explicar los pasos uno a uno.
►  Este autor leyó que los menores niveles de esperma en los varones
occidentales está asociado al escaso consumo de soja.
►  Diseñó un experimento (datos ficticios, claro) con cuatro grupos de 20
individuos cada uno en función de su nivel de consumo de soja (ningún
consumo-control, una comida a la semana, cuatro a la semana y todos los
días). Al final del año se efectuó un recuento de esperma (variable
dependiente).
►  ¿Es la media de esperma significativamente distinta en cada grupo?

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Rango para el total de casos n=80

Estimación
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Cálculo del estadístico

►  Los datos de toda la muestra se ordenan simultáneamente y se les asigna
un orden (ranking), en nuestro caso 1-80, pues n=80.
►  Después de ordenados se separan por grupos.
►  Se suma los rangos de cada grupo (Ri).
►  Se calcula el estadístico H equivalente al F del Anova:
12 k
Ri2
H= " ! 3( N + 1)
N ( N + 1) i =1 ni
►  En nuestro ejemplo:
12 " 927 2 8832 8832 547 2 %

H= + + + ( 3 ! 81 = 8.65
80 ! 81 $# 20 20 20 20 '&
►  Estadístico que se distribuye según una X2 con k-1 grados de libertad

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  ¿Tiene sentido hacer un test de Kruskal-Wallis?

Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Resultados
El método asintótico es
exacto con muestras
grandes, pero con
muestras pequeñas o
con datos muy poco
normales, es mejor
Monte Carlo, que
genera una muestra
similar a la nuestra y
extrae muchas
submuestras (10.000)
con las que calcula el
valor medio de la
significatividad y del
intervalo de confianza

Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Análisis post hoc

►  No existen pruebas específicas
►  Podemos comparar los grupos de dos en dos con pruebas de Mann-Whitney, pero esto
incrementa el error tipo I
►  Por ello, si lo hacemos, tendremos que hacer alguna corrección, como la de Bonferroni
(utilizar como significatividad 0.05/número de tests)
►  Esto obliga a hacer solo los contrastes imprescindibles, puesto que si no el nivel crítico para
la significatividad sería muy pequeño
►  Otra alternativa es la propuesta por Siegel y Castellan (1988)
Los descriptivos parece mostrar

medias muy similares, salvo para
el último grupo, pero para estar
seguros de esta apreciación
necesitamos las pruebas a
posteriori

Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

►  Veamos Mann-Whitney con corrección de Bonferroni
►  Limitaremos las pruebas a:
▬  3: grupo de control frente a los otros tres
▬  αcrítico =0.05/3=0.0167
0 vs 1 comida 0 vs 4 comidas 0 vs 7 comidas
Parece que comer soja no

aumenta la cantidad de
esperma, pero comer mucho sí
que la reduce

Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

►  Veamos la propuesta de Siegel y Castellan (1988)
►  El estadístico para cada comparación es la diferencia en valor absoluto entre la media de los
rangos
►  El valor crítico de comparación es un z-score corregido por el número de comparaciones que
se hacen y una constante basada en el tamaño muestral total y el tamaño muestral de los
grupos que se comparan:
N ( N + 1) $ 1 1 ' Sin complicarse, en Excel

Ru ! Rv " z# / k ( k !1) &% n + n )(
=INV.NORM.ESTAND(0,00417)
=2,6379
12 u v
Larger Smaller
! = 0.05 z Portion Portion y
k=4 2.62
2.63
.99560
.99573
.00440
.00427
.0129
.0126
!
2.64 .99585 .00415 .0122
0.05
= = 0.00417 2.65 .99598 .00402 .0119
k ( k " 1) 4 # 3
2.66 .99609 .00391 .0116
2.67 .99621 .00379 .0113
2.68 .99632 .00368 .0110
z0.00417 = 2.64 2.69 .99643 .00357 .0107
2.70 .99653 .00347 .0104 z
Test Statistic

Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Análisis post hoc Ru

►  Veamos la propuesta de Siegel y Castellan (1988)
Rv de datos:
Ru de la tabla
►  Los rangos de todas las comparaciones salen
Ru Rv Ru ! Rv
Ru Rv Ru ! Rv Ru ! Rv
Rv Ru ! RvRu ! Rv
Ru ! Rv Ru ! Rv
Ru ! Rv
►  Y el valor crítico con el que hay que comparar las diferencias de rangos es:
Solo hay un valor crítico para todas las

N ( N + 1) # 1 1 &
Ru ! Rv = z" / k ( k !1) %$ n + n (' = comparaciones porque los tamaños
critica
12 u v muestrales de todos los grupos son iguales.
80 ) 81 # 1 1& Todas las diferencias son inferiores al valor
= 2.64 %$ + ( crítico, luego ninguna es significativa, aquí se
12 20 20 '
ve la ventaja de ser selectivo con el número de
= 2.64 540 ( 0.1) comparaciones, si se compara el resultado
= 19.40 con el de Mann-Whitney

Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Testando tendencias: El test de Jonckheere-Terpstra

►  Este test (Jonckheere, 1954; Terpstra, 1952) hace lo mismo que el test de Kruskal-Wallis,
pero, además evalúa si hay un patrón ordenado en las medianas, es decir, si el orden de los
grupos aporta algún patrón significativo al orden de las medianas
►  Parte de la base de que el orden en el que se codifican los grupos, implica el orden en que se
espera la ordenación de medianas (aunque puede ser positivo o negativo indicando +/+ o +/-)
►  No entraremos en los cálculos, pero para más de 8 casos por grupo el estadístico se
distribuye como una normal y se puede obtener fácilmente su z-score.
El estadístico muestra una tendencia

significativa para las medianas y su signo es
negativo, es decir, cuando se pasa de no
tomar a tomar cada vez más soja, el recuento
de espermatozoides cae

Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Tamaño del efecto

►  El estadístico de Kruskal-Wallis, se distribuye como una chi cuadrado y, desafortunadamente, no
es fácil convertir una chi cuadrado de más de un grado de libertad a un tamaño de efecto r.
►  Por eso, recomendamos seguir a Field (2005) cuando sugiere calcular los tamaños de efecto
para cada uno de los test de Mann-Whitney que se realizaron en las pruebas post hoc.
►  Recordemos que el tamaño del efecto se calculaba:
z
r=
N
►  Solo tener cuidado con que N hace referencia a la suma de los dos grupos comparados (40)
!0.243 !0.325 !2.597

r= = !.04 r= = !.05 r= = !.41
40 40 40
!0.476
-2
r= = !.28
80 Para el test de Jonckheere, téngase en
cuenta que usa todos los datos (N=80)

Presentando resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Escribiendo los resultados en un artículo

►  Alternativa 1: Kruskal-Wallis + análisis post hoc
Sperm counts were significantly affected by eating soya meals (H(3)=8.66, p<.05).
Mann-Whitney tests were used to follow up this finding. A Bonferroni correction
was applied so all effects are reported at a .0167 level of significance. It
appeared that sperm counts were no different when one soya meal (U=191, r=-.04)
or four soya meals (U=188, r=-.05) were eaten per week compared to none. However,
when seven soys meals were eaten per week, sperm counts were significanly lower
than when no soya was eaten (U=104, r=-.41). We can conclude that is soya is
eaten every day it significantly reduces sperm counts compared to eating none;
however eating soya less than every day has no significant impact on sperm
counts.
►  Alternativa 2: Test de Jonckheere
All effects reported at p<.05. Sperm counts were significantly affected by eating
soya meals (H(3)=8.66). Jonckheere’s test revealed a significant trend in the
data: as more soya was eaten, the median sperm count decreased, J=912, z=-2.48,
r=-.28

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Tipo Tipo # =o≠
SI
DISTINTOS
NO
2
SI
MISMOS
NO
NO
MET 1
MET
SI
DISTINTOS
1 NO Kruskall-Wallis Anova
+2
SI
MISMOS
NO
SI
MET MISMOS
NO
NO NO
1 DISTINTOS
MET MET

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Análisis de la varianza de dos factores


■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Análisis de la varianza de dos factores

►  Pretendemos ahora analizar el efecto de dos variables independientes (no
métricas) sobre una dependiente (métrica)
▬  Retomando el ejemplo sobre el tabaco, ¿condiciona el hábito de fumar
o no el ser más o menos favorable a que se suban los impuestos
sobre este bien? ¿Lo condiciona el género? ¿Puede existir un efecto
interacción entre ambos factores?
►  Efectos principales y efecto interacción.
▬  Diremos que hay un efecto principal significativo de un factor cuando
las medias de la variable dependiente sean significativamente distintas
en los grupos que conforma ese factor (igual que en el ANOVA de un
factor)
▬  Diremos que hay un efector interacción significativo entre los factores
cuando la relación entre la variable dependiente y un factor es distinta
para los distintos niveles del otro factor

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Acuerdo
Acuerdo l Hombres
n Mujeres
l l l Hombres
l
Opinión
Opinión
n
n n n Mujeres
l
n
Desacuerdo Desacuerdo
Fumador Dejado No fumador Fumador Dejado No fumador

Factor 1: Fumar
Factor 1: Fumar
Efecto principal hábito: significativo Efecto principal hábito: no significativo

Efecto principal sexo: no significativo Efecto principal sexo: significativo

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
l Hombres Acuerdo
Acuerdo
n Mujeres
l
Opinión
Opinión
l l l Hombres
n n n Mujeres
n
l
Desacuerdo Desacuerdo
n
Fumador Dejado No fumador Fumador Dejado No fumador

Factor 1: Fumar Factor 1: Fumar
Efecto principal hábito: significativo Efecto principal hábito: no significativo

Efecto principal sexo: significativo Efecto principal sexo: no significativo
No hay efecto interacción

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Acuerdo
l Hombres
Opinión
l
n Mujeres
n
l
n
Desacuerdo
Fumador Dejado No fumador
Factor 1: Fumar
Efecto principal hábito: significativo

Efecto principal sexo: significativo
Efecto interacción significativo

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
►  Es absolutamente análoga a la del ANOVA de un factor
Fuente de Suma de Grados de Media Estadístico

variación cuadrados libertad cuadrática F
SCFA MCFA
Factor A SCF A G-1 MCFA=
G-1 F= MCR
SCFB MCFB
Factor B SCF B J-1 MCFB=
J-1 F=
MCR
SCF AxB MCFAxB
Interacción SCFAxB (G-1)(J-1) MCFAx B=
(G-1)(J-1)
F=
MCR
SCR
Residual SCR n-GJ MCR=
n-GJ
SCT
Total SCT n-1 MCT=
n-1

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Homoscedasticidad

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Examinar siempre los descriptivos

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Significatividad de los efectos
►  Comenzaremos siempre por el efecto interacción pues condiciona la forma

de evaluar los efectos principales

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Pruebas post hoc

Interpretación de los resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Results were analyzed using a two-way ANOVA, with two

between-groups design. This analysis revealed a significant
effect for smoking habit, F(2,235)=57.90; p <.01. The sample
means are displayed in Figure X. Tukey’s HSD test showed that
subjects who have always been non-smokers or that have given
up smoking are significantly more favorable to increase
tobacco taxes than smokers (p <.05) while there were no
significant differences between them. The main effect for sex
proved to be nonsignificant, F(1,235)=1,82; p=.178. The
interaction between sex and habit also proved to be
nonsignificant F(2,235)=0.862; p=.424

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Tipo Tipo # =o≠
SI Independent t-test
DISTINTOS
NO Mann-Whitney /Wilcoxon rank
2
SI Related samples t-test
MISMOS
NO Wilcoxon matched-pairs test
NO
MET 1
MET
SI One way ANOVA
DISTINTOS
1 NO Kruskall-Wallis Anova
+2
SI One way repeated measures anova
MISMOS
NO Friedman’s Anova
SI Pearson correlation
MET MISMOS
NO Spearman o Kendall’s tau
NO NO Pearson Chi Square

1 DISTINTOS
MET MET

Anova PDF

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Anova PDF

Uploaded by

Copyright:

Available Formats

Análisis de Datos Avanzados

Análisis de la varianza de un factor

Joaquín Aldás Manzano

Doctorado Interuniversitario en Marketing 1

■ Definir el problema y decidir la técnica

Doctorado Interuniversitario en Marketing 2

■ Análisis de la varianza (tabaco1.sav)

Doctorado Interuniversitario en Marketing 3

Doctorado Interuniversitario en Marketing 4

■ Lógica del estadístico F

Ygi − Y = (Yg − Y ) + (Ygi − Yg )

(Ygi − Y ) = (Yg − Y ) + (Ygi − Yg ) + 2 (Yg − Y )(Ygi − Y )

Doctorado Interuniversitario en Marketing 5

■ Lógica del estadístico F

Doctorado Interuniversitario en Marketing 6

■ Lógica del estadístico F

Doctorado Interuniversitario en Marketing 7

■ Lógica del estadístico F

Doctorado Interuniversitario en Marketing 8

Doctorado Interuniversitario en Marketing 9

Doctorado Interuniversitario en Marketing 10

■ Significatividad del estadístico F

► Concluimos que el efecto del factor es significativo, pero ¿es intenso?, es

Doctorado Interuniversitario en Marketing 11

■ F de Brown-Forsythe (Brown y Forsythe, 1974)

► Brown y Forsythe (1984) proponen la siguiente corrección:

La varianza de cada grupo está ahora

Doctorado Interuniversitario en Marketing 12

■ F de Brown-Forsythe (Brown y Forsythe, 1974)

Grados de libertad del

Doctorado Interuniversitario en Marketing 13

■ ¿Pero cuál era la hipótesis alternativa? Pruebas post hoc

Doctorado Interuniversitario en Marketing 14

Doctorado Interuniversitario en Marketing 15

■ ¿qué pruebas post hoc elegir?

Doctorado Interuniversitario en Marketing 16

Results were analyzed using a one-way ANOVA, between-groups

Doctorado Interuniversitario en Marketing 17

Doctorado Interuniversitario en Marketing 18

Análisis de la varianza de un factor no paramétrico

Joaquín Aldás Manzano

Doctorado Interuniversitario en Marketing 19

Doctorado Interuniversitario en Marketing 20

Doctorado Interuniversitario en Marketing 21

■ Cálculo del estadístico

12 " 927 2 8832 8832 547 2 %

► Estadístico que se distribuye según una X2 con k-1 grados de libertad

Doctorado Interuniversitario en Marketing 22

■ ¿Tiene sentido hacer un test de Kruskal-Wallis?

Doctorado Interuniversitario en Marketing 23

Doctorado Interuniversitario en Marketing 24

■ Análisis post hoc

Los descriptivos parece mostrar

Doctorado Interuniversitario en Marketing 25

■ Análisis post hoc

0 vs 1 comida 0 vs 4 comidas 0 vs 7 comidas

Parece que comer soja no

Doctorado Interuniversitario en Marketing 26

■ Análisis post hoc

N ( N + 1) $ 1 1 ' Sin complicarse, en Excel

Doctorado Interuniversitario en Marketing 27

■ Análisis post hoc Ru

■  Definir el problema y decidir la técnica

■  Análisis de la varianza (tabaco1.sav)

■  Lógica del estadístico F

■  Lógica del estadístico F

■  Lógica del estadístico F

■  Lógica del estadístico F

■  Significatividad del estadístico F

►  Concluimos que el efecto del factor es significativo, pero ¿es intenso?, es

■  F de Brown-Forsythe (Brown y Forsythe, 1974)

►  Brown y Forsythe (1984) proponen la siguiente corrección:

■  F de Brown-Forsythe (Brown y Forsythe, 1974)

■  ¿Pero cuál era la hipótesis alternativa? Pruebas post hoc

■  ¿qué pruebas post hoc elegir?

■  Cálculo del estadístico

►  Estadístico que se distribuye según una X2 con k-1 grados de libertad

■  ¿Tiene sentido hacer un test de Kruskal-Wallis?

■  Análisis post hoc

■  Análisis post hoc

■  Análisis post hoc

■  Análisis post hoc Ru

■  Testando tendencias: El test de Jonckheere-Terpstra

■  Tamaño del efecto

■  Escribiendo los resultados en un artículo

►  Alternativa 2: Test de Jonckheere

■  Análisis de la varianza de dos factores

■  Significatividad de los efectos

►  Comenzaremos siempre por el efecto interacción pues condiciona la forma