You are on page 1of 26

Análisis

• Tomar datos sin anticipar cómo se analizarán los datos es un


problema común por lo cuál fracasan muchos estudios.

• Si no sabes qué vas a hacer con los datos – no los tomes!

• Es fácil tomar datos que no sirven…

• ¡Pero también es fácil tomar datos que sirven!


La santísima trinidad

El Hijo

El Padre El Espíritu Santo


Fit Y by X

respuesta ~ factores

Si usted entiende esto ya tiene la mitad del camino recorrido…


Fit Y by X

Si la X es nominal
(categórica) y la Y
también….

Tablas de Contingencia

- Tanto la X como la Y puede


tener dos o más niveles.
• Hagamos una práctica con los datos de la “tabla cualquiera”

Observación: un pescador le cuenta a usted – un biólogo marino - que


los machos de róbalos (nombre común de dos especies: R. tigriuns y R.
rubicolis) frecuentan más las playas, mientras que las hembras
prefieren los manglares donde las crías están más protegidas.

Luego de realizar un estudio balanceado y randomizado, determine si


existe diferencia en la frequencia de capturas entre machos y
hembras de róbalos entre playas y manglares.
Fíjense que este tipo de análisis, si se extiende a más especies, sirve
para medir diferencias entre las estructuras de dos o más comunidades
de organismos.

¿Qué limitaciones tienen las tablas de contingencia?

- Las Tablas de Contingencia no consideran las réplicas


- Sólo miden diferencias puntuales
- Limitadas para inferir tendencias generales
Fit Y by X
Si la X es nominal
(categórica) y la Y es
numérica….

t-test y ANOVAs

t-test: compara dos promedios

Anova (Oneway): compara > dos promedios


**asumen distribución Gaussiana del error**
t-test y ANOVAs

**asumen distribución Gaussiana del error**

But ecological data looks


more like this almost all the
time
• Volvamos a los datos de la “tabla cualquiera”

- Usemos t-test para ver si hay diferencia en el tamaño de los peces


entre playas y manglares. Eso después de ver si los datos son
Gaussianos (normales).

- También entre tamaños de hembras y machos o entre las dos


especies

- Otra cosa para la que podamos usar t-test con la tabla cualquiera?
• Ahora comparemos los tamaños de los peces entre los distintos
lugares de muestreo (La Parguera, Lajas, Guánica y Cabo Rojo).

• Como son mas de dos categorías, la prueba será una ANOVA


(oneway)

• ANOVA = Analysis of Variance


• Si sus datos son muy “anormales”, entonces deberá confiar en el
resultado de una prueba no-paramétrica:

• T-test = Wilcoxon Signed Rank Test


• ANOVA = Kruskall-Wallis
Si la X es numérica
Fit Y by X (continua) y la Y
también….

Regresión:
- Simple: La X como la Y puede sólo
tienen un nivel
• Ahora comparemos los tamaños de los peces entre los distintos como
función de la profundidad de captura

¿Existe correlación entre el tamaño del pez y la profundidad de


captura?
Fit Model
Regresión :

- Múltiple: hay más de una X


continua (efectos)

- ANCOVA: si hay mezcla de


variables X continuas y
categóricas.
• Analizar los datos “por pedazos” es siempre el primer paso, pero con
un diseño jerárquico, se pueden hacer modelos mucho más
poderosos que revelan relaciones ocultas en las simples pruebas “t y
Oneway ANOVA”
• Ahora realicemos un análisis más elegante

• Regresión Mínimo Cuadrado (LS):


- Ajuste el tamaño del pez como función de el ‘hábitat”, ‘sexo’ y ‘sitio”
- Repita el análisis con todas las interacciones posibles
• Ahora realicemos un análisis más elegante

• Generalized Linear Model


- Ajuste el tamaño del pez como función de el ‘hábitat”, ‘sexo’ y ‘sitio”
- Especifique la distribución “Poisson” de error.
- Incluya las interacciones

- Repitamos este último análisis en R cuando ya lo sepamos hacer en JMP.


Mi amigo el GLM
(Generalized Linear Models)
Las medidas ecológicas son feas
(Gausianamente hablando)
• Muchos zeros
• Proporciones (y muchos zeros)
• Conteos (y muchos zeros)
• Multimodales
• Colas largas
GLM permite ajustar una gran variedad de familias de error:

• Gaussian
• Poisson
• Binomial
• Binomial Negativa
• Exponencial
• Quasi - para tablas con muchos zeros:

• Quasibinomial
• Quasipoisson
Efectos ‘fijos’ (Fixed Effects) vs. Efectos aleatorios (Random Effects)

• Efectos fijos – factores principales o ’tratamientos’

• Efectos aleatorios –importantes como fuentes de variabilidad, pero de


poco o ningún interés en un análisis particular
Efectos ‘fijos’ (Fixed Effects) vs. Efectos aleatorios (Random Effects)

• Efectos fijos – factores principales o ’tratamientos’

Ejemplos:
-
-
-
-
-
Efectos ‘fijos’ (Fixed Effects) vs. Efectos aleatorios (Random Effects)

• Efectos aleatorios –importantes como fuentes de variabilidad, pero de


poco o ningún interés en un análisis particular

Ejemplos:
-
-
-
-
-
Y ~ X1 + X2 + X3 + (1|X4) + (1|X5) + X1:X2 + X1:X3 + X2:X3 + X1:X2:X3

• Y = respuesta (variable dependiente)


• X1 + X2 + X3 = factores fijos (fixed effects)
• (1|X4) + (1|X5) = factores aleatorios (random effects)
• X1:X2 + X1:X3 + X2:X3 = interacciones de dos vías
• X1:X2:X3 = interacción de tres vías (threesome)
Interacciones en el modelo…
• X1:X2 + X1:X3 + X2:X3 = interacciones de dos vías
• X1:X2:X3 = interacción de tres vías

• Las interacciones se añaden sólo si son de interés para el investigador

• A veces el único propósito de realizar el estudio y el análisis es examinar las


interacciones

• Las interacciones sin sentido se pueden ignorar y dejar fuera del modelo
con toda tranquilidad

You might also like