You are on page 1of 7

III Analysis of Variance and Covariance IIIa Analysis of Variance Explicacin

En el anlisis One-way Anova y t de Student se examina cmo la media de dos grupos en una variable independiente dicotmica vara en relacin a una variable dependiente cuantitativa. Este es caso ms simple de anlisis, el que se complejiza en la medida que se incluyen otras variables en el problema de investigacin. Cuando nos encontramos frente a dos o ms variables nominales u ordinales independientes en relacin a una variable dependiente cuantitativa la tcnica de anlisis apropiada es two-way Anova. As, en el caso de incluir slo una variable independiente categrica el en anlisis debemos realizar one-way anova con su correspondiente t de Student test. En el caso de two-way Anova1, el test correspondiente ser una derivacin del t test conocida como F test. Junto a los efectos de cada una de las variables independientes por separado sobre la variable dependiente, tambin se espera un efecto conjunto conocido como efecto de interaccin, es decir, el efecto de cada una de las categoras de una de las variables independiente vara a travs de las categoras de la otra(s) variable independiente. El nmero de combinaciones entre ambas variables independientes ser el producto de sus categoras (que generar n grupos). Si existe una diferencia significativa de las medias de cada uno de estos grupos en la variable dependiente quiere decir que estamos frente a un efecto de interaccin. As, tres variables son incluidas en el anlisis, dos independientes categricas y una dependiente cuantitativa. Su diagrama Causal es el siguiente:

X1

X2

Las flechas representan el efecto causal directo de las variables independientes sobre las dependientes. La flecha bifurcada representa el efecto de interaccin o efecto de la combinacin de X1 con X2. Cuando adems de la(s) variable(s) categrica(s) tenemos otra(s) variable(s) independiente(s) pero medida a nivel cuantitativo, el anlisis se transforma en Ancova (que al igual que Anova puede o no tener efecto de interaccin).

Para el caso de n variables independientes el anlisis adecuado ser n-way Anova

Cuando no existe el efecto de interaccin, decimos que el modelo es aditivo, es decir, una suma ponderada de las variables se puede hacer para determinar el efecto conjunto de las variables independientes (como se realiza en el Anlisis de Regresin Mltiple). En el caso del diagrama causal para Anova, el modelo se define como no aditivo (o multiplicativo).

Anlisis
Para entender la lgica tras el Anlisis de Varianza, es importante entender que se trata de un procedimiento que se basa en el anlisis de la variacin entre los grupos de las distintas categoras y entre los individuos o variacin dentro de los grupos definiendo una variacin total como la suma de ambas, es decir, Total=Entre+Dentro. Por ejemplo, la variable X2 del diagrama es tricotmica. Por lo tanto, hay tres grupos o categoras con un nmero determinado de individuos y con una media de puntuaciones para cada uno de los tres grupos. La forma en que cada individuo difiere entre si es expresada como la suma de las deviaciones cuadradas (variacin) de sus puntuaciones en Y respecto a la media del grupo en esa variable. Esta es la variacin dentro del grupo y habr tres de ellas, una para cada grupo. Tambin, podemos examinar las diferencias entre los grupos sin tener consideracin por los individuos. Para hacer esto, tomamos las medias de los grupos en Y y calculamos la suma de las desviaciones a esas medias respecto a la Gran Media. Luego esta variacin es multiplicada por el tamao del grupo y obtenemos la variacin entre los grupos. De esta manera, el anlisis de varianza realiza una comparacin entre las diferencias entre los grupos y las diferencias dentro de los grupos. La variacin entre los grupos indica la parte de las diferencias que se debe exclusivamente a los grupos. Al dividir esta variacin por los grados de libertad (df=nmero de grupos-1) obtenemos la varianza entre grupos. La variacin dentro del grupo indica la parte de las diferencias en Y que se debe exclusivamente a los individuos. Al dividir esta variacin por los grados de libertad (df=nmero de grupos (nmero de individuos-1)) obtenemos la varianza dentro de los grupos. El cociente de la varianza entre grupos y dentro de los grupos es la puntuacin F que ser usada luego en la prueba F (varianza entre grupos en el numerador y dentro de los grupos en el denominador). Cuando la diferencia entre y dentro de los grupos difiere de la misma forma, F ser igual a 1 y podemos concluir que esta variable independiente no tiene un efecto significativo en Y. Este efecto slo existe cuando en numerador (between) es mayor que el denominador (within), es decir, F>1. As, decimos que el procedimiento tiene tres paso importantes, la descomposicin de la variacin de las puntuaciones de Y entre variacin entre y dentro de los grupos2, la divisin de las variaciones por los grados de libertad para obtener las varianzas y el clculo del radio entre/dentro para confrontar las diferencias entre grupos con las diferencias entre individuos. Siguiendo la misma lgica realizamos una prueba F para cada variable independiente. En el caso de que exista efecto de interaccin, introducimos el concepto de variacin de la Interaccin y su injerencia en el sistema que ahora ser entonces: Total=EntreX1+EntreX2+Interaccin+Dentro. Para cada prueba F utilizaremos la varianza Dentro en el denominador y cada una de las otras partes en el numerador. Este mismo anlisis podra ser realizado mediante una regresin mltiple entre las variables independientes transformndolas en Dummy y agregando variables extras para los efectos de interaccin.
2

Tal como en GLM (General Linear Model) de la regresin consideramos la variacin total descompuesta entre lo atribuible a regresin y lo atribuible al error

En Anova es nfasis es puesto ms en la prueba que en el descripcin. La tcnica tiene los siguientes objetivos: 1.- Evaluar si existe una diferencia significativa en las puntuaciones de los grupos de X1 en la media de Y sin considerar X2. Y si existe una diferencia significativa en las puntuaciones de los grupos de X1 en la media de Y controlando X23. 1.- Evaluar si existe una diferencia significativa en las puntuaciones de los grupos de X2 en la media de Y sin considerar X1. Y si existe una diferencia significativa en las puntuaciones de los grupos de X2 en la media de Y controlando X1 3.- Evaluar si existe un efecto de interaccin significativo. En otras palabras, si es que existe una diferencia significativa en las medias de Y de los grupos de X1 para cada uno de los grupos de X2. 4.- Analizar si el modelo propuesto es el mejor de acuerdo a la realidad o si los efectos mencionados deben o no ser incluidos en el modelo. Una prueba F para el modelo global demostrar su pertinencia. Para alcanzar estos objetivos, y siguiendo el ejemplo del diagrama causal, se debera realizar una prueba t (one-way Anova) para el caso de evaluar la relacin entre la variable dicotmica X1 y su nivel de significancia. Luego, de forma independiente se realizar una prueba F para el caso de la variable tricotmica X2 con su correspondiente nivel de significancia (o aprobar o rechazar la hiptesis nula que indica que las diferencias en las medias se deben al azar y que no son, por tanto, significativas). A continuacin, los efectos de cada variable independiente controlando la otra independiente ms la evaluacin del impacto del efecto de interaccin deben ser analizados (two-way Anova). Lo que nos encontramos ac sern cuatro tipos de medias de Y: - Una para cada grupo de X1 sin considerar X2 - Una para cada grupo de x2 sin considerar X1 - Una para cada combinacin de X1 con X2 - Slo una gran media.

Para esto, la variacin total se descompone de la siguiente manera: SSB(X1) o variacin entre grupos de X1+SSB(X2) o variacin entre grupos de X2+SSI o variacin del efecto de interaccin+SSW o variacin within. As, analizamos la variacin de X1 controlando X2, X2 controlando X1 y la variacin del efecto de interaccin, cada uno de los tres anlisis con su correspondiente prueba F.

Output en SPSS
Para llevar a cabo este anlisis en SPSS podemos realizar dos pruebas independientes en Anova de un Factor. Luego para las tres pruebas con X1, X2 y el efecto de interaccin utilizamos una Anova Factorial, en Modelo Lineal General Univariante, seleccionando las variables independientes en factores fijos. Siempre debemos agregar una prueba para homogeneidad de las varianzas en las opciones que SPSS ofrece.
3

Desde el punto de vista de la Regresin, esto sera la bsqueda de la recta que mejor represente la relacin de las variables independientes y su efecto de interaccin en la explicacin de la variable dependiente.

El anlisis para las variables de forma independiente debe arrojar el siguiente output:

El estadstico de Levene nos indica la presencia o ausencia de Homocedasticidad. Cuando su nivel es significativo, quiere decir que las varianzas de la variable dependiente calculada para cada nivel de la variable independiente son diferentes entre s, o que estamos frente a un problema de Heterocedasticidad. Diferentes soluciones para la violacin de homogeidad pueden ser llevadas a cabo: - Una transformacin de la variable dependiente. Podemos calcular la raz cuadrada de la variable o calcular su log natural (variable+1). - Reagrupar alguna de las categoras de la variable independiente para obtener igual nmero de casos o grupos - Incluir otras variables en el modelo La Media Cuadrtica del recuadro nos indica la varianza entre grupos e inter grupo. El valor de F (radio Entre/Intra) con su correspondiente p value o nivel de significancia nos permite aceptar o rechazar la hiptesis nula que plantea que las diferencias en las medias de la variable Y a partir de la influencia de X es azarosa y por lo tanto no existe relacin significativa entre ellas. Como en este caso sig<0.05 (e.i. la prob de que la H0 sea cierta es muy baja), no podemos aceptar la H0 y concluimos que existe una relacin significativa entre X e Y. Para el anlisis de los efectos de las variables independientes con control y el efecto de interaccin podemos seleccionar tambin los estadsticos descriptivos y la prueba para homogeneidad de las varianzas. El recuadro con estadsticos descriptivos nos mostrar la media para cada uno de los grupos de X1 a travs de X2 adems de la gran media. Este es el primer dato que podemos analizar para deducir que existe una diferencia entre los grupos de las distintas variables independientes. Analizamos, mediante una simple resta, si existe una diferencia significativa entre las medias a travs de los diferentes grupos de Y.

Obtenemos adems el cuadro con las pruebas de significancia F. El valor de la Media cuadrtica del error (1,556) es la varianza total inter- sujetos o within. La media cuadrtica de X1 es la varianza entre grupos de X1, lo mismo para X2 (y analiza el efecto de cada variable independiente cuando la otra es controlada). Observaremos tambin la varianza entre grupos del efecto combinado o de interaccin entre X1 y X2. Podemos comprobar que F en cada caso se refiere al radio entre la varianza entre/intra grupos. El modelo corregido se refiere a todos los efectos del modelo tomados juntos (el efecto de los dos factores, el de interaccin y el de la interseccin). El nivel crtico asociado al estadstico (p=.000 <.05) nos est diciendo que el modelo explica una parte significativa de la variacin observada en la variable dependiente. El valor de R2 (.788) indica que los tres efectos incluidos en el modelo (X1, X2 y X1*X2) estn explicando el 78% de la varianza de la variable dependiente. La interseccin informa sobre la constante del modelo. Este valor forma parte del modelo y es importante para obtener las estimaciones de las medias de las casillas. Adems, permite contrastar, en el caso que tenga sentido, la H de que la media total de la variable dependiente vale cero en la poblacin. Las siguientes dos filas recogen los efectos principales, es decir, los efectos individuales de las dos variables incluidas en el modelo. La siguiente fila contiene la informacin sobre el efecto de interaccin. La fila Error ofrece informacin relacionada con la fuente de variacin error o residual. La media cuadrtica error (que es el divisor de cada cociente F) es un estimador insesgado de la varianza de los grupos

estudiados.

Este mismo anlisis puede ser realizado mediante un Anlisis de Regresin transformando las variables independientes en variables Dummy (el nmero de variables Dummy es siempre el nmero de categoras en un variable 1). Se deben hacer entonces dos regresiones simples (una para cada variable independiente) y luego una Regresin Mltiple que incluya el producto de ambos factores (D4=D1D2; D5=D1D3). Queda as comprobado que ambas tcnicas son variaciones dentro de Modelo Lineal General.

IIIa Analysis of Covariance


Si una o varias de las variables independientes incluidas en un diseo Anova estn medidas a nivel intervalar, entonces estas variables reciben el nombre de covariable y la tcnica a realizar sern entonces el Anlisis de Covarianza (ANCOVA).

You might also like