You are on page 1of 44

Análisis de Datos Avanzados

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

Análisis de la varianza de un factor

Joaquín Aldás Manzano


Universitat de València

* joaquin.aldas@uv.es

Doctorado Interuniversitario en Marketing 1


Construcción de un modelo multivariante
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Definir el problema y decidir la técnica


■  Desarrollo del plan de análisis
►  Tamaños muestrales mínimos
►  Escalas adecuadas
■  Condiciones de aplicabilidad
►  Comprobación de hipótesis subyacentes a los modelos
■  Estimación del modelo y ajuste global
■  Interpretación de los resultados
■  Validación (resultados generalizables a la población)

Doctorado Interuniversitario en Marketing 2


Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Análisis de la varianza (tabaco1.sav)


►  Sirve para determinar si una variable determinada toma valores medios
iguales o distintos en los grupos que forma otra variable.
▬  Retomando el ejemplo sobre el tabaco, ¿condiciona el hábito de fumar
o no el ser más o menos favorable a que se suban los impuestos
sobre este bien?
►  VARIABLE DEPENDIENTE (impuesto), es la que queremos saber si toma
valores medios iguales o distintos.
▬  ¿Deben subirse los impuestos sobre el tabaco? 1=Totalmente en
desacuerdo a 5=Totalmente de acuerdo
►  FACTOR (fuma) es la variable que supuestamente ejerce una influencia
sobre la variable dependiente (establece los grupos)
▬  ¿Fuma usted? 1=No, nunca he fumado, 2=No, lo he dejado; 3=Sí
►  Se analizará también el análisis de la varianza de dos factores, donde se
considera la influencia conjunta sobre la dependiente de dos variables
independientes (factores).

Doctorado Interuniversitario en Marketing 3


Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Análisis de la varianza
►  Cómo deben estar medidas las variables?
▬  El factor debe ser una variable nominal
▬  La variable dependiente debe ser métrica
►  Formulación de la hipótesis nula:

H 0 : x f = xnf = xd
►  ¿Cuál es la hipótesis alternativa? Importancia para las pruebas post hoc
►  Cálculo del estadístico F (veremos su lógica… solo esta vez!)
►  Rechazo o no de la hipótesis nula
▬  Significatividad p

Doctorado Interuniversitario en Marketing 4


Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Lógica del estadístico F


►  Cada individuo, fumador o no, tendrá una opinión que diferirá en mayor o
menor medida de la opinión del conjunto de la muestra:

Ygi − Y
►  Esa diferencia puede escribirse:

Ygi − Y = (Yg − Y ) + (Ygi − Yg )

Desviación residual
Desviación explicada por el factor

►  Elevamos al cuadrado:

(Ygi − Y ) = (Yg − Y ) + (Ygi − Yg ) + 2 (Yg − Y )(Ygi − Y )


2 2 2

Doctorado Interuniversitario en Marketing 5


Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Lógica del estadístico F


►  Como no tenemos un solo grupo sino G y en cada uno de ellos no hay un
solo individuo, sino ng sumamos para todos ellos:

SCT SCF
Variabilidad total Variabilidad explicada por el factor
Between groups

SCR
Variabilidad residual
Within groups

Doctorado Interuniversitario en Marketing 6


Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Lógica del estadístico F


►  Cuanto más parte de la variabilidad total la explique pertenecer a un grupo
u otro (factor) y menos la variabilidad interna de cada grupo, más seguros
estaremos de que el efecto del factor es relevante. Por eso parece lógico
construir el estadístico de este modo:

SCF
MCF G − 1
F= =
MCR SCR
n−G
►  Es decir cuanto más importante sea el efecto del factor, más grande será
el estadístico.
►  La división por de las sumas de cuadrados por sus grados de libertad, lo
que las convierte en lo que llamamos media cuadrática, solo pretende
ajustar el hecho de que no hay el mismo número de elementos
generadores de variabilidad en numerador y denominador

Doctorado Interuniversitario en Marketing 7


Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Lógica del estadístico F

SCF 171,37
MCF G − 1
F= = = 3 − 1 = 59,16
MCR SCR 344, 72
n − G 241 − 3

Doctorado Interuniversitario en Marketing 8


Condiciones de aplicabilidad
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Homoscedasticidad
►  La varianza de la variable dependiente no debe ser significativamente
distinta en los grupos que hace el factor
►  Algunos autores afirman que el que no se cumpla no afecta mucho al
estadístico F si las muestras de cada grupo son del mismo o similar
tamaño (Stevens, 1996).
►  Ver siempre los descriptivos
►  Test de Levene (recordar que la H0 es igualdad de las varianzas)
►  ¿Y si no?...
▬  Transformación de la variable dependiente, aunque hoy en día hay
alternativas…
▬  Estadísticos robustos ante la ausencia de homoscedasticidad (Brown-
Forsythe, Welch)

Doctorado Interuniversitario en Marketing 9


Condiciones de aplicabilidad
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

Doctorado Interuniversitario en Marketing 10


Estimación del modelo
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Significatividad del estadístico F


►  Con base en esta información decidimos si es plausible el rechazo de la
hipótesis nula

►  Concluimos que el efecto del factor es significativo, pero ¿es intenso?, es


decir, ¿cuál es el tamaño del efecto?
►  Debemos reportar el R2, que no es sino una medida de qué parte de la
varianza total es explicada por el factor:

SCF 171,37
R2 = = = 0,33
SCT 516,10

Doctorado Interuniversitario en Marketing 11


Estimación del modelo
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  F de Brown-Forsythe (Brown y Forsythe, 1974)


►  Cuando los grupos tienen distintos tamaños muestrales y la varianza más
grande están en los grupos con mayor tamaño, esto sesga el estadístico F
provocando que sea muy conservador:

Si la varianza más
grande está en el
grupo más grande SCR
se hincha

►  Brown y Forsythe (1984) proponen la siguiente corrección:

La varianza de cada grupo está ahora


multiplicado por un factor que es más pequeño
cuanto más grande es el tamaño del grupo. Este
estadístico se evalúa con un número de grados
de libertad corregido para el denominador

Doctorado Interuniversitario en Marketing 12


Estimación del modelo
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  F de Brown-Forsythe (Brown y Forsythe, 1974)

Grados de libertad del


denominador corregidos

Doctorado Interuniversitario en Marketing 13


Estimación del modelo
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  ¿Pero cuál era la hipótesis alternativa? Pruebas post hoc


►  Sólo podemos decir que la media en algún grupo es diferente a las demás,
pero ¿cuáles son diferentes de cuáles?
►  Para poder concluir algo al respecto tenemos una batería de distintas
pruebas post hoc o pruebas a posteriori
►  También existen pruebas post hoc específicas para situaciones de
ausencia de homoscedasticidad
■  ¿Por qué pruebas específicas? ¿Por qué no comparar las medias dos a dos
mediantes pruebas t?
►  Ejercicios de simulación de Montecarlo demuestran que la probabilidad de
que las pruebas t encadenadas encuentren alguna diferencia significativas
donde no las hay se incrementa con el número de comparaciones (5
grupos, 10 comparaciones, 29%; 10 grupos, 45 comparaciones, 63%)
►  Las pruebas específicas ajustan el nivel de significación necesario en
función del número de comparaciones. Cuanto más comparaciones, mayor
tiene que ser la diferencia para ser considerada significativa.
►  Por ejemplo, Bonferroni, una de las más sencillas, si se realizan c
comparaciones, exige un nivel de significación crítico de a/c para poder
rechazar cada comparación

Doctorado Interuniversitario en Marketing 14


Estimación del modelo
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Pruebas post hoc

Doctorado Interuniversitario en Marketing 15


Estimación del modelo
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  ¿qué pruebas post hoc elegir?


►  Puede consultarse Toothaker (1993) o Klockars y Sax (1986) para una
argumentación detallada, pero tengamos en cuenta que SPSS produce
hasta 18 tests
►  Como guía apuntamos la síntesis de las recomendaciones de Field (2005):
▬  Si tenemos muestras iguales por grupo y estamos bastante seguros
de que las varianzas son parecidas:
●  REGWQ o Tukey tienen un buen equilibrio entre poder y control
del error tipo I
●  Bonferroni es conservador pero asegura control sobre el error
tipo I
▬  Si los tamaños muestrales son ligeramente distintos: Gabriel
▬  Si los tamaños muestrales son muy distintos: Hochberg GTD
▬  Si hay dudas sobre la homogeneidad de varianzas: Games-Howell

Doctorado Interuniversitario en Marketing 16


Interpretación de los resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

Results were analyzed using a one-way ANOVA, between-groups


design. This analysis revealed a significant effect for
smoking habit, F(2,238)=59.16; p <.01. The sample means are
displayed in Figure X. Tukey’s HSD test showed that subjects
who have always been non-smokers or that have given up
smoking are significantly more favorable to increase tobacco
taxes than smokers (p <.05) while there were no significant
differences between them.

Doctorado Interuniversitario en Marketing 17


Guía para la elección del test más adecuado
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Tipo Tipo # =o≠
#VD # VI Paramétrico TEST
VD VI niveles participantes

SI
DISTINTOS
NO
2
SI
MISMOS
NO
NO
MET 1
MET
SI One way ANOVA
DISTINTOS
1 NO

+2
SI
MISMOS
NO

SI
MET MISMOS
NO

NO NO
1 DISTINTOS
MET MET

Doctorado Interuniversitario en Marketing 18


Análisis de Datos Avanzados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

Análisis de la varianza de un factor no paramétrico


Test de Kruskal-Wallis

Joaquín Aldás Manzano


Universitat de València

* joaquin.aldas@uv.es

Doctorado Interuniversitario en Marketing 19


Condiciones de aplicabilidad
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Normalidad
►  Ante violaciones de la homoscedasticidad hemos visto que tenemos
alternativas bastante robustas para el estadístico F (Brown-Forsythe,
Welch), pero ¿y si se viola el supuesto de normalidad?
►  La alternativa es una Anova no paramétrico llamado Anova de Kruskal-
Wallis o simplemente test de Kruskall-Wallis (Kruskall y Wallis, 1952).
■  Ejemplo (soya1.sav). Ilustraremos el procedimiento de cálculo con un ejemplo,
una vez más simpático, de Field (2005) porque está basado en pocos casos, y
es más sencillo explicar los pasos uno a uno.
►  Este autor leyó que los menores niveles de esperma en los varones
occidentales está asociado al escaso consumo de soja.
►  Diseñó un experimento (datos ficticios, claro) con cuatro grupos de 20
individuos cada uno en función de su nivel de consumo de soja (ningún
consumo-control, una comida a la semana, cuatro a la semana y todos los
días). Al final del año se efectuó un recuento de esperma (variable
dependiente).
►  ¿Es la media de esperma significativamente distinta en cada grupo?

Doctorado Interuniversitario en Marketing 20


Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Rango para el total de casos n=80

Doctorado Interuniversitario en Marketing 21


Estimación
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Cálculo del estadístico


►  Los datos de toda la muestra se ordenan simultáneamente y se les asigna
un orden (ranking), en nuestro caso 1-80, pues n=80.
►  Después de ordenados se separan por grupos.
►  Se suma los rangos de cada grupo (Ri).
►  Se calcula el estadístico H equivalente al F del Anova:

12 k
Ri2
H= " ! 3( N + 1)
N ( N + 1) i =1 ni

►  En nuestro ejemplo:

12 " 927 2 8832 8832 547 2 %


H= + + + ( 3 ! 81 = 8.65
80 ! 81 $# 20 20 20 20 '&

►  Estadístico que se distribuye según una X2 con k-1 grados de libertad

Doctorado Interuniversitario en Marketing 22


Condiciones de aplicabilidad
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  ¿Tiene sentido hacer un test de Kruskal-Wallis?

Doctorado Interuniversitario en Marketing 23


Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Resultados

El método asintótico es
exacto con muestras
grandes, pero con
muestras pequeñas o
con datos muy poco
normales, es mejor
Monte Carlo, que
genera una muestra
similar a la nuestra y
extrae muchas
submuestras (10.000)
con las que calcula el
valor medio de la
significatividad y del
intervalo de confianza

Doctorado Interuniversitario en Marketing 24


Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Análisis post hoc


►  No existen pruebas específicas
►  Podemos comparar los grupos de dos en dos con pruebas de Mann-Whitney, pero esto
incrementa el error tipo I
►  Por ello, si lo hacemos, tendremos que hacer alguna corrección, como la de Bonferroni
(utilizar como significatividad 0.05/número de tests)
►  Esto obliga a hacer solo los contrastes imprescindibles, puesto que si no el nivel crítico para
la significatividad sería muy pequeño
►  Otra alternativa es la propuesta por Siegel y Castellan (1988)

Los descriptivos parece mostrar


medias muy similares, salvo para
el último grupo, pero para estar
seguros de esta apreciación
necesitamos las pruebas a
posteriori

Doctorado Interuniversitario en Marketing 25


Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Análisis post hoc


►  Veamos Mann-Whitney con corrección de Bonferroni
►  Limitaremos las pruebas a:
▬  3: grupo de control frente a los otros tres

▬  αcrítico =0.05/3=0.0167

0 vs 1 comida 0 vs 4 comidas 0 vs 7 comidas

Parece que comer soja no


aumenta la cantidad de
esperma, pero comer mucho sí
que la reduce

Doctorado Interuniversitario en Marketing 26


Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Análisis post hoc


►  Veamos la propuesta de Siegel y Castellan (1988)
►  El estadístico para cada comparación es la diferencia en valor absoluto entre la media de los
rangos
►  El valor crítico de comparación es un z-score corregido por el número de comparaciones que
se hacen y una constante basada en el tamaño muestral total y el tamaño muestral de los
grupos que se comparan:

N ( N + 1) $ 1 1 ' Sin complicarse, en Excel


Ru ! Rv " z# / k ( k !1) &% n + n )(
=INV.NORM.ESTAND(0,00417)
=2,6379
12 u v

Larger Smaller
! = 0.05 z Portion Portion y

k=4 2.62
2.63
.99560
.99573
.00440
.00427
.0129
.0126

!
2.64 .99585 .00415 .0122
0.05
= = 0.00417 2.65 .99598 .00402 .0119

k ( k " 1) 4 # 3
2.66 .99609 .00391 .0116
2.67 .99621 .00379 .0113
2.68 .99632 .00368 .0110
z0.00417 = 2.64 2.69 .99643 .00357 .0107
2.70 .99653 .00347 .0104 z
Test Statistic

Doctorado Interuniversitario en Marketing 27


Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Análisis post hoc Ru


►  Veamos la propuesta de Siegel y Castellan (1988)
Rv de datos:
Ru de la tabla
►  Los rangos de todas las comparaciones salen

Ru Rv Ru ! Rv
Ru Rv Ru ! Rv Ru ! Rv
Rv Ru ! RvRu ! Rv
Ru ! Rv Ru ! Rv
Ru ! Rv

►  Y el valor crítico con el que hay que comparar las diferencias de rangos es:

Solo hay un valor crítico para todas las


N ( N + 1) # 1 1 &
Ru ! Rv = z" / k ( k !1) %$ n + n (' = comparaciones porque los tamaños
critica
12 u v muestrales de todos los grupos son iguales.
80 ) 81 # 1 1& Todas las diferencias son inferiores al valor
= 2.64 %$ + ( crítico, luego ninguna es significativa, aquí se
12 20 20 '
ve la ventaja de ser selectivo con el número de
= 2.64 540 ( 0.1) comparaciones, si se compara el resultado
= 19.40 con el de Mann-Whitney

Doctorado Interuniversitario en Marketing 28


Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Testando tendencias: El test de Jonckheere-Terpstra


►  Este test (Jonckheere, 1954; Terpstra, 1952) hace lo mismo que el test de Kruskal-Wallis,
pero, además evalúa si hay un patrón ordenado en las medianas, es decir, si el orden de los
grupos aporta algún patrón significativo al orden de las medianas
►  Parte de la base de que el orden en el que se codifican los grupos, implica el orden en que se
espera la ordenación de medianas (aunque puede ser positivo o negativo indicando +/+ o +/-)
►  No entraremos en los cálculos, pero para más de 8 casos por grupo el estadístico se
distribuye como una normal y se puede obtener fácilmente su z-score.

El estadístico muestra una tendencia


significativa para las medianas y su signo es
negativo, es decir, cuando se pasa de no
tomar a tomar cada vez más soja, el recuento
de espermatozoides cae

Doctorado Interuniversitario en Marketing 29


Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Tamaño del efecto


►  El estadístico de Kruskal-Wallis, se distribuye como una chi cuadrado y, desafortunadamente, no
es fácil convertir una chi cuadrado de más de un grado de libertad a un tamaño de efecto r.
►  Por eso, recomendamos seguir a Field (2005) cuando sugiere calcular los tamaños de efecto
para cada uno de los test de Mann-Whitney que se realizaron en las pruebas post hoc.
►  Recordemos que el tamaño del efecto se calculaba:
z
r=
N
►  Solo tener cuidado con que N hace referencia a la suma de los dos grupos comparados (40)

!0.243 !0.325 !2.597


r= = !.04 r= = !.05 r= = !.41
40 40 40
!0.476
-2
r= = !.28
80 Para el test de Jonckheere, téngase en
cuenta que usa todos los datos (N=80)

Doctorado Interuniversitario en Marketing 30


Presentando resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Escribiendo los resultados en un artículo


►  Alternativa 1: Kruskal-Wallis + análisis post hoc

Sperm counts were significantly affected by eating soya meals (H(3)=8.66, p<.05).
Mann-Whitney tests were used to follow up this finding. A Bonferroni correction
was applied so all effects are reported at a .0167 level of significance. It
appeared that sperm counts were no different when one soya meal (U=191, r=-.04)
or four soya meals (U=188, r=-.05) were eaten per week compared to none. However,
when seven soys meals were eaten per week, sperm counts were significanly lower
than when no soya was eaten (U=104, r=-.41). We can conclude that is soya is
eaten every day it significantly reduces sperm counts compared to eating none;
however eating soya less than every day has no significant impact on sperm
counts.

►  Alternativa 2: Test de Jonckheere

All effects reported at p<.05. Sperm counts were significantly affected by eating
soya meals (H(3)=8.66). Jonckheere’s test revealed a significant trend in the
data: as more soya was eaten, the median sperm count decreased, J=912, z=-2.48,
r=-.28

Doctorado Interuniversitario en Marketing 31


Guía para la elección del test más adecuado
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Tipo Tipo # =o≠
#VD # VI Paramétrico TEST
VD VI niveles participantes

SI
DISTINTOS
NO
2
SI
MISMOS
NO
NO
MET 1
MET
SI
DISTINTOS
1 NO Kruskall-Wallis Anova

+2
SI
MISMOS
NO

SI
MET MISMOS
NO

NO NO
1 DISTINTOS
MET MET

Doctorado Interuniversitario en Marketing 32


Análisis de Datos Avanzados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

Análisis de la varianza de dos factores

Joaquín Aldás Manzano


Universitat de València

* joaquin.aldas@uv.es

Doctorado Interuniversitario en Marketing 33


Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Análisis de la varianza de dos factores


►  Pretendemos ahora analizar el efecto de dos variables independientes (no
métricas) sobre una dependiente (métrica)
▬  Retomando el ejemplo sobre el tabaco, ¿condiciona el hábito de fumar
o no el ser más o menos favorable a que se suban los impuestos
sobre este bien? ¿Lo condiciona el género? ¿Puede existir un efecto
interacción entre ambos factores?
►  Efectos principales y efecto interacción.
▬  Diremos que hay un efecto principal significativo de un factor cuando
las medias de la variable dependiente sean significativamente distintas
en los grupos que conforma ese factor (igual que en el ANOVA de un
factor)
▬  Diremos que hay un efector interacción significativo entre los factores
cuando la relación entre la variable dependiente y un factor es distinta
para los distintos niveles del otro factor

Doctorado Interuniversitario en Marketing 34


Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

Acuerdo
Acuerdo l Hombres
n Mujeres

l l l Hombres

l

Opinión
Opinión

n

n n n Mujeres
l
n

Desacuerdo Desacuerdo

Fumador Dejado No fumador Fumador Dejado No fumador


Factor 1: Fumar
Factor 1: Fumar

Efecto principal hábito: significativo Efecto principal hábito: no significativo


Efecto principal sexo: no significativo Efecto principal sexo: significativo

Doctorado Interuniversitario en Marketing 35


Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

l Hombres Acuerdo

Acuerdo

n Mujeres

l

Opinión
Opinión

l l l Hombres
n n n Mujeres
n

l

Desacuerdo Desacuerdo
n

Fumador Dejado No fumador Fumador Dejado No fumador


Factor 1: Fumar Factor 1: Fumar

Efecto principal hábito: significativo Efecto principal hábito: no significativo


Efecto principal sexo: significativo Efecto principal sexo: no significativo
No hay efecto interacción

Doctorado Interuniversitario en Marketing 36


Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

Acuerdo
l Hombres

Opinión
l

n Mujeres

n

l
n
Desacuerdo

Fumador Dejado No fumador

Factor 1: Fumar

Efecto principal hábito: significativo


Efecto principal sexo: significativo
Efecto interacción significativo

Doctorado Interuniversitario en Marketing 37


Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Lógica del estadístico F
►  Es absolutamente análoga a la del ANOVA de un factor

Fuente de Suma de Grados de Media Estadístico


variación cuadrados libertad cuadrática F

SCFA MCFA
Factor A SCF A G-1 MCFA=
G-1 F= MCR

SCFB MCFB
Factor B SCF B J-1 MCFB=
J-1 F=
MCR
SCF AxB MCFAxB
Interacción SCFAxB (G-1)(J-1) MCFAx B=
(G-1)(J-1)
F=
MCR
SCR
Residual SCR n-GJ MCR=
n-GJ

SCT
Total SCT n-1 MCT=
n-1

Doctorado Interuniversitario en Marketing 38


Condiciones de aplicabilidad
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Homoscedasticidad

Doctorado Interuniversitario en Marketing 39


Estimación del modelo
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Examinar siempre los descriptivos

Doctorado Interuniversitario en Marketing 40


Estimación del modelo
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■  Significatividad de los efectos

►  Comenzaremos siempre por el efecto interacción pues condiciona la forma


de evaluar los efectos principales

Doctorado Interuniversitario en Marketing 41


Estimación del modelo
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■  Pruebas post hoc

Doctorado Interuniversitario en Marketing 42


Interpretación de los resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

Results were analyzed using a two-way ANOVA, with two


between-groups design. This analysis revealed a significant
effect for smoking habit, F(2,235)=57.90; p <.01. The sample
means are displayed in Figure X. Tukey’s HSD test showed that
subjects who have always been non-smokers or that have given
up smoking are significantly more favorable to increase
tobacco taxes than smokers (p <.05) while there were no
significant differences between them. The main effect for sex
proved to be nonsignificant, F(1,235)=1,82; p=.178. The
interaction between sex and habit also proved to be
nonsignificant F(2,235)=0.862; p=.424

Doctorado Interuniversitario en Marketing 43


Guía para la elección del test más adecuado
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Tipo Tipo # =o≠
#VD # VI Paramétrico TEST
VD VI niveles participantes

SI Independent t-test
DISTINTOS
NO Mann-Whitney /Wilcoxon rank
2
SI Related samples t-test
MISMOS
NO Wilcoxon matched-pairs test
NO
MET 1
MET
SI One way ANOVA
DISTINTOS
1 NO Kruskall-Wallis Anova

+2
SI One way repeated measures anova

MISMOS
NO Friedman’s Anova

SI Pearson correlation
MET MISMOS
NO Spearman o Kendall’s tau

NO NO Pearson Chi Square


1 DISTINTOS
MET MET

Doctorado Interuniversitario en Marketing 44

You might also like