You are on page 1of 29

1.

MODELO DE DISEO DE EXPERIMENTOS (UN FACTOR)


Objetivo: Proponer modelos para realizar comparaciones, lo ms homogneas posibles, que permitan identificar si un FACTOR influye en la respuesta de un fenmeno que nos interesa estudiar

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Principales conceptos estadsticos que revisaremos

Modelo unifactorial de comparacin de poblaciones y tratamientos Metodologa, estimacin del modelo, tabla ANOVA y coeficiente de determinacin Diferencias entre las medias: comparaciones mltiples y test de Bonferroni Anlisis de casos prcticos con SPSS

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Modelos de diseo de experimentos

Referencias
Pea Snchez de Rivera, D. Regresin y Diseo de Experimentos. Alianza Editorial. 2001 Townend, J. Practical Statistics for Environmental and Biological Scientists. John Wiley. 2002 Quinn, G.P. y Keough, M.J. Experimental Design and Data Analysis for Biologists. Cambridge University Press. 2002 Scheiner, S.M. y Gurevitch, J. Design and Analysis of Ecological Experiments. Chapman and Hall. 1993 Pardo, A. y Ruz, M.A. Anlisis de datos con SPSS 13. McGraw-Hill. 2005

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Modelos lineales

Control de un fen fenmeno mediante su relaci relacin con otras variables

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Modelos lineales

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Modelos lineales

APLICACIONES DE LOS MODELOS LINEALES Entender Intervenir Predecir

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Modelos lineales de diseo de experimentos

Elementos del diseo de experimentos Variable respuesta, o explicada, o dependiente: Variable asociada al fenmeno que nos interesa estudiar Variables experimentales o factores: Conjunto de variables que influyen en la respuesta y que se fijan a ciertos niveles antes del experimento Unidades experimentales: Individuos que intervienen en el experimento y que son observados a un nivel determinado de cada uno de los factores Tamao del experimento: Nmero unidades experimentales en el experimento
Ana Justel Justel Eusebio - 2007
Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

total

de

Comparacin de poblaciones

La tcnica estadstica conocida como AN ANLISIS DE LA VARIANZA (ANOVA) trata de cmo determinar si un fenmeno, que podemos cuantificar, tiene el mismo comportamiento en todos los grupos de una poblacin, que se diferencian entre s por algn FACTOR Ejemplos:

A. Queremos ver si la produccin de un cultivo depende del


tipo de fertilizante

B. Si las emisiones de gases de efecto invernadero dependen


del nivel de desarrollo de los pases

C. Si el porcentaje de cianobacterias entre las algas de un


embalse depende del punto de muestreo

Se comparan los niveles medios de respuesta en cada grupo

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Caso ms sencillo de comparacin

A. Comparamos UN tratamiento en DOS poblaciones B. Comparamos DOS tratamientos en UNA poblacin

Tablas de contingencia

MannMann-Whitney, Whitney, Wilcoxon


Ana Justel Justel Eusebio - 2007
Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

A. Comparamos K tratamientos en UNA poblacin B. Comparamos UN tratamiento en K poblaciones

MannMann-Whitney, Whitney, Wilcoxon MannMann-Whitney, Whitney, Wilcoxon


Ana Justel Justel Eusebio - 2007
Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

COMPARACIN DE K POBLACIONES o TRATAMIENTOS

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

Sorteo Grupos

3 1 2 2

2 1 3 1 3

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

o s rte So zante i r ti l Fe

FA FA FB FB FC FC

G G11 G G22 G G33

C A B B A C B A C

Comparacin de poblaciones

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

El diseo se dice que es EQUILIBRADO o BALANCEADO cuando, para cada nivel del factor, se mide la variable respuesta en el mismo nmero de individuos

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones Se someten 24 muestras de agua a 4 tratamientos de descontaminacin diferentes y asignados al azar. Para cada muestra se mide un indicador de la calidad del agua (cuanto ms alto est el indicador, mayor es la calidad del agua)
T1 T2 T3 T4

62 60 63 59

63 67 71 64 65 66

68 66 71 67 68 68

Media

61

66

68

56 62 60 61 63 64 63 59 61

En este experimento, el ms efectivo es el TRATAMIENTO 3, pero estamos seguros de que los tratamientos no son iguales?
Ana Justel Justel Eusebio - 2007
Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

HIPTESIS QUE ASUMIMOS QUE CUMPLEN LOS DATOS

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

HIPTESIS QUE ASUMIMOS QUE CUMPLEN LOS ERRORES


Decir que los datos cumplen las hip hiptesis es lo mismo que decir que los errores son:

HIP HIPTESIS DEL MODELO

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

Hay alguna Hay alguna evidencia evidencia CLARA CLARA en contra de de alguna de las hip tesis del modelo que hemos asumido? hiptesis

Para responder a esta pregunta disponemos de: Datos CONOCIMIENTO Para mirar a los datos disponemos de las herramientas gr grficas y de los tests

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

INDEPENDENCIA DE LOS DATOS


El resultado de la variable observada en un individuo cualquiera no afecta a los resultados que observamos en los otros individuos

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

INDEPENDENCIA DE LOS DATOS


Ejemplos de PSEUDIOREPLICACI PSEUDIOREPLICACIN: 1. Cuando utilizamos los mismos pacientes para aplicarles distintos tratamientos 2. Hacemos muestreos en los mismos cuerpos de agua a lo largo del tiempo

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

INDEPENDENCIA DE LOS DATOS


Soluciones para el problema de la PSEUDIOREPLICACI PSEUDIOREPLICACIN: 1. Mejorar la toma de datos con un correcto sistema de aleatorizaci aleatorizacin. Las r rplicas del experimento deben ser medidas de la misma variable observadas en distintos individuos 2. Si esto no es posible, utilizar dise diseos anidados 3. Si las medidas sobre el mismo individuo se toman en distintos momentos del tiempo, utilizar dise diseos de medidas repetidas
Ana Justel Justel Eusebio - 2007
Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

INDEPENDENCIA DE LOS DATOS


Ejemplos de PSEUDIOREPLICACI PSEUDIOREPLICACIN: 1. Cuando utilizamos los mismos pacientes para aplicarles distintos tratamientos

Aplicar s slo un tratamiento a cada paciente

El paciente es un factor

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

INDEPENDENCIA DE LOS DATOS


Ejemplos de PSEUDIOREPLICACI PSEUDIOREPLICACIN: 1. Cuando utilizamos los mismos pacientes para aplicarles distintos tratamientos 2. Hacemos muestreos en los mismos cuerpos de agua a lo largo del tiempo

Dise Diseo de medidas repetidas

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

HOMOCEDASTICIDAD DE LOS DATOS


La variabilidad de los datos debe ser la misma en todos los niveles niveles Se estudia con: BOXBOX-PLOTS m mltiples Diagramas de dispersi dispersin Barras de error

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

HOMOCEDASTICIDAD DE LOS DATOS


Ejemplo de HETEROCEDASTICIDAD: HETEROCEDASTICIDAD:

El caso m ms habitual es cuando la variabilidad crece al aumentar los niveles de respuesta observada
Ana Justel Justel Eusebio - 2007
Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

HOMOCEDASTICIDAD DE LOS DATOS


Soluciones para el problema de la HETEROCEDASTICIDAD: 1. Cuando la variabilidad crece al aumentar los niveles de respuesta observada, la mejor soluci solucin es la transformaci transformacin logaritmo neperiano de la respuesta 2. Probar otras transformaciones de la variable respuesta 3. Localizar posibles outliers (datos at atpicos) 4. Utilizar test no param paramtricos de homogeneidad de poblaciones

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

HOMOCEDASTICIDAD DE LOS DATOS


Soluci Solucin para el problema de HETEROCEDASTICIDAD: HETEROCEDASTICIDAD:

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

LINEALIDAD DE LOS DATOS


En cada nivel los datos var varan en torno a un nico valor, que no tiene por que coincidir entre niveles Se estudia con: Diagramas de dispersi dispersin Histograma

Soluciones cuando hay problemas de LINEALIDAD: 1. Separar los individuos en ms niveles 2. Localizar posibles outliers (datos at atpicos) 3. Proponer un modelo con m ms factores controlados

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

NORMALIDAD DE LOS DATOS


La distribuci distribucin de los datos de cada nivel debe ajustarse a una normal, no necesariamente la misma entre niveles Histograma Gr Grfico probabil probabilstico normal Se estudia con: (Q(Q-Q o PP-P plot) plot) Test de normalidad
(KolmogorovKolmogorov-Smirnov o ShapiroShapiro-Wilk) Wilk)

Problemas de NORMALIDAD:

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

NORMALIDAD DE LOS DATOS


La distribuci distribucin de los datos de cada nivel debe ajustarse a una normal, no necesariamente la misma entre niveles Histograma Gr Grfico probabil probabilstico normal Se estudia con: (Q(Q-Q o PP-P plot) plot) Test de normalidad
(KolmogorovKolmogorov-Smirnov o ShapiroShapiro-Wilk) Wilk)

Soluciones cuando hay problemas de NORMALIDAD: 1. Cuando la distribuci distribucin es asim asimtrica, transformar la variable respuesta 2. Cuando se observa una distribuci distribucin bimodal, dividir los datos en dos niveles 3. Utilizar test no param paramtricos de homogeneidad de poblaciones
Ana Justel Justel Eusebio - 2007
Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

ESTIMACIN DE LOS PARMETROS DEL MODELO

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

ESTIMACIN DE LOS PARMETROS DEL MODELO

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

ESTIMACIN DE LOS PARMETROS DEL MODELO

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

ESTIMACIN DE LOS PARMETROS DEL MODELO

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones Se someten 24 muestras de agua a 4 tratamientos de descontaminacin diferentes y asignados al azar. Para cada muestra se mide un indicador de la calidad del agua (cuanto ms alto est el indicador, mayor es la calidad del agua)

Para elegir el mejor tratamiento, lo primero que hacemos es estimar los tiempos medios con cada tratamiento y la variabilidad del experimento.
T1 T2 T3 T4

62 60 63 59

63 67 71 64 65 66

68 66 71 67 68 68

Media

61

66

68

56 62 60 61 63 64 63 59 61

En este experimento, el ms efectivo es el TRATAMIENTO 3, pero estamos seguros de que los tratamientos no son iguales?
Ana Justel Justel Eusebio - 2007
Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Unos ejemplos arreglados

G1 G2 G3

G1 G2 G3

Los grupos son diferentes


Medias

Los grupos son semejantes

Las diferencias entre las medias son grandes comparadas con las diferencias entre los datos dentro de cada grupo?

Idea del test ANOVA: Comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro de cada grupo)
Ana Justel Justel Eusebio - 2007
Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de varios grupos

Test ANOVA
H0: Las respuestas medias son iguales en todos los grupos H1: Las respuestas medias son distintas en al menos dos grupos
Comparamos la variabilidad entre las medias con la variabilidad en el experimento

Para evitar que la variabilidad dependa de las unidades de medida, se calcula el cociente

Idea del test ANOVA: Comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro de cada grupo)
Ana Justel Justel Eusebio - 2007
Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de varios grupos

Test ANOVA
H0: Las respuestas medias son iguales en todos los grupos H1: Las respuestas medias son distintas en al menos dos grupos

Enla latabla tablaANOVA ANOVAse serepresenta representala laidea ideade deque quela lavarianza varianzase se En puededescomponer descomponeren enlas lasdistintas distintasfuentes fuentesque quela laoriginan originan puede

Para comparar dos poblaciones, coincide con el test-t (tienen el mismo p-valor)
Ana Justel Justel Eusebio - 2007
Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de varios grupos

Descomposici Descomposicin de la variabilidad del experimento

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de varios grupos

Test ANOVA
H0: Las respuestas medias son iguales en todos los grupos H1: Las respuestas medias son distintas en al menos dos grupos

ANOVA Riesgo Suma de cuadrados . . . gl . . . Media cuadrtica . . F . Sig. p-valor.

Inter-grupos Intra-grupos Total

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

La tabla ANOVA en los ejemplos arreglados

H0: Las respuestas medias son iguales en los tres grupos H1: Las respuestas medias son distintas en al menos dos grupos
ANOVA Los grupos son diferentes Suma de cuadrados 32,000 4,000 36,000 gl 2 9 11 Media cuadrtica 16,000 ,444 F 36,000 Sig. ,000

Rechazamos H0

Inter-grupos Intra-grupos Total

ANOVA Los grupos son similares Suma de cuadrados Inter-grupos 32,000 Intra-grupos 2852,000 Total 2884,000 gl 2 9 11 Media cuadrtica 16,000 316,889 F ,050 Sig. ,951

No Rechazamos H0

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de varios grupos

Coeficiente de determinaci determinacin Cmo evaluamos si el modelo propuesto sirve para explicar la variabilidad en la respuesta? no sirve porque depende de las unidades de medida

es la proporci proporcin de la variabilidad observada en los datos que queda explicada por el modelo

COEFICIENTE DE DETERMINACIN

R2=SCE/SCT

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

R2 en los ejemplos arreglados


ANOVA Los grupos son diferentes Suma de cuadrados 32,000 4,000 36,000 gl 2 9 11 Media cuadrtica 16,000 ,444 F 36,000 Sig. ,000

Inter-grupos Intra-grupos Total

R2 = 0,8888 ( SCE / SCT = 32 / 36)

El porcentaje de variabilidad explicada por el modelo es del 88,8 %


ANOVA Los grupos son similares Suma de cuadrados Inter-grupos 32,000 Intra-grupos 2852,000 Total 2884,000 gl 2 9 11 Media cuadrtica 16,000 316,889 F ,050 Sig. ,951

R2 = 0,0111 (SCE / SCT = 32 / 2884)

El porcentaje de variabilidad explicada por el modelo es del 1,1 %


Ana Justel Justel Eusebio - 2007
Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

La tabla ANOVA en el ejemplo de descontaminacin En principio creemos que el tratamiento ms efectivo es el 3,


T1 Media Varianza 61 3,33 T2 66 8 T3 68 2,8 T4 61 6,85

pero no estamos seguros de que los indicadores medios sean realmente distintos. Para asegurarnos hacemos un test ANOVA
Audiencia Suma de cuadrados 228,000 112,000 340,000 gl 3 20 23 Media cuadrtica 76,000 5,600 F 13,571 Sig. ,000

Inter-grupos Intra-grupos Total

Hemos encontrado evidencia para rechazar H0 y afirmar que no todos los tratamientos son iguales Qu Qu tratamientos son distintos?
Ana Justel Justel Eusebio - 2007
Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Comparacin de poblaciones

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Pruebas dos a dos

Comparaciones m mltiples Cuando se rechaza con el test ANOVA, se busca qu grupos son distintos entre s haciendo COMPARACIONES M MLTIPLES (pruebas Post hoc) hoc) dos a dos. Existen varias opciones y la que ms se usa es con CORRECCI CORRECCIN DE BONFERRONI

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Pruebas dos a dos

Comparaciones m mltiples Si hay evidencia para rechazar la hiptesis nula podemos preguntarnos son iguales los niveles medios de los grupos i y j?

OJO!!! no son el mismo contraste e intervalo que para la diferencias de medias habitual

La varianza se estima con los datos de los 2 grupos y de los otros grupos, utilizamos la varianza residual Cambian los grados de libertad, que son n I
Ana Justel Justel Eusebio - 2007
Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Pruebas dos a dos

Comparaciones m mltiples Si hay evidencia para rechazar la hiptesis nula y queremos encontrar qu grupos se diferencian entre si, debemos realizar tests para comparar todos los pares de medias

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Pruebas dos a dos

Comparaciones m mltiples

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Pruebas dos a dos

Comparaciones m mltiples

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Pruebas dos a dos

Comparaciones m mltiples

Ana Justel Justel Eusebio - 2007


Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

Pruebas dos a dos en el ejemplo de descontaminacin En principio creemos que el tratamiento ms efectivo es el 3

Los tratamientos m ms efectivos son el 2 y el 3


Ana Justel Justel Eusebio - 2007
Mtodos Estad Estadsticos Licenciatura en Biolog Biologa

You might also like