Professional Documents
Culture Documents
Manual
ECOLOGA NUMRICA Y ESTADSTICA
APLICADA A LA BIOLOGA DE LA
CONSERVACIN CON PAST 2.17
Hctor Aponte Ubills
2014
1
http://bpcosac.wix.com/webp
http://capacitacionvirtualbp.com/
http://capacitacionvirtualbp.com/
2
Presentacin
Sin entrar a los detalles tcnicos matemticos, el presente manual intenta que los estudiantes den
un vistazo rpido a los test estadsticos presentados, as como al procesamiento y al anlisis de
los resultados a partir de ejemplos enmarcados en la Biologa de la Conservacin. Como
consecuencia, en esta gua usted encontrar los pasos seguidos para hacer los anlisis, ms no la
base matemtica de los mismos. Para mayor detalle de los mismos recomiendo la lectura de
algunos textos (citados en la bibliografa) que le permitirn adquirir conocimientos ms
profundos de estadstica y modelamiento, si as lo desea (Norman et al. 1996, Dytham 2011,
Emden 2012). Invito tambin a los interesados en aprender ms sobre el PAST a revisar la
pgina web del programa (http://folk.uio.no/ohammer/past/) donde encontrarn tutoriales,
manuales e informacin adicional.
Que prohibida la reproduccin total o parcial de este manual sin la autorizacin de los autores.
Contenido
Presentacin ........................................................................................................................ 3
4
ndices de diversidad Beta ........................................................................................................... 30
Caso 14: Foraminferos en una gradiente medio ambiental (Hammer, 2011.) ...........40
5
La plataforma PAST 2.17
La Barra de herramientas (de izquierda a derecha) contiene todas las pestaas mostradas
en la figura 2, de las cuales utilizaremos:
6
Archivo (File): En ella encontrar las opciones para guardar, abrir, crear e
imprimir un archivo.
Editar (Edit): Aqu se encuentran todas las opciones para copiar, pegar, remover
o transponer los datos, insertar o eliminar columnas. PAST permite tambin
retroceder (undo) o rehacer (redo) las acciones, pero estas son limitadas.
Transformar (Transform): Esta pestaa tiene todas las opciones necesarias para
transformar los datos (por ejemplo logartmicamente o transformar los datos a
presencia/ausencia).
Grficos (Plot): Permite hacer grficos de doble entrada, grficos de cajas e
histogramas entre otros grficos.
Estadsticos (Statistics): Aqu se encuentran las opciones para realizar anlisis
estadsticos univariados.
Multivariados (Multivar): Aqu se encuentran las opciones para realizar anlisis
estadsticos multivariados, incluyendo los anlisis de agrupamiento (Cluster
analysis).
Modelamiento (Model): Contiene algunas herramientas bsicas para hacer
modelamiento como modelos lineales y modelos lineales generalizados.
Diversidad (Diversity): Contiene las herramientas que utilizaremos para hacer
un anlisis estadstico de la diversidad alfa y beta.
Cladstica (Cladistics): Permite hacer un anlisis cladstico (de agrupamiento) a
partir de datos morfolgicos o de DNA.
7
PARTE I: ESTADSTICA DESCRIPTIVA Y UNIVARIADA
En los ltimos aos, las poblaciones de palmeras han sido afectadas por la
deforestacin y el uso de tierras, principalmente con fines ganaderos y agropecuarios.
Astrocaryum perangustatum es una palmera endmica del Per, y su territorio se ha
visto afectado por actividades antrpicas como las mencionadas. El hbitat de esta
especie (conocida como huicungo y masanke) comprende un mosaico de zonas
deforestadas y relictos de bosque que recubre el bosque premontano. En estos
ecosistemas ocupa el sotobosque, pues se trata de un rbol con un tamao promedio de
6 metros de altura. Es una especie resistente a la deforestacin y se le observa tambin
en campos agrcolas y ganaderos (Figura 3).
8
Figura 3. Hbitat de Astrocaryum perangustatum en Pozuzo en zonas boscosas
(izquierda) y deforestadas (derecha).
Usted cuenta con la base de datos de las parcelas analizadas (EJ1 ASTROCARYUM) y
se le pide responder a las siguientes preguntas:
9
Anlisis Descriptivo Univariado y grficos descriptivos
Los anlisis descriptivos utilizan algoritmos bsicos para tener una idea de lo que est
sucediendo con la o las especies en estudio. Para iniciar este anlisis procederemos de la
siguiente manera.
10
Una vez que los datos han sido introducidos, procederemos con el anlisis univariado de
la siguiente manera:
PAST realiza los anlisis nicamente en las casillas seleccionadas, por ello es
muy importante seleccionar las casillas antes de demandar un anlisis. Puede
hacerlo haciendo click sobre los ttulos de las columnas que desea evaluar
(figura 5a) o dando click en la celda de la esquina superior izquierda (figura 5b),
esto ltimo si lo que se desea es evaluar todas las columnas presentes en la hoja.
a) b)
Figura 5. Datos seleccionados por columna (a) o en toda la hoja de clculo.
Ahora vamos a pedir al PAST que nos d un anlisis univariado de los datos. Siga la
siguiente ruta: Statistics > Univariate. PAST nos dar una tabla que indica las
principales caractersticas de cada columna, incluyendo el promedio, valores mximos y
mnimos, desviacin estndar y otros estadsticos descriptivos tiles (figura 6). Los
datos pueden ser copiados (para pegar en Excel o en cualquier programa de Office) o
impresos directamente con las opciones de la barra de herramientas debajo de las tablas.
11
Figura 6. Anlisis univariado de los datos introducidos al PAST.
Estos datos nos permiten tener una primera idea de qu es lo que ha pasado con las
poblaciones en las dos zonas muestreadas. Otra forma interesante de analizar lo
sucedido es haciendo un grfico de cajas. Para ello basta con seleccionar los datos como
fue indicado anteriormente y seguir la ruta Plot>Barchart/Boxplot. De inmediato
obtendr un grfico de cajas que le permitir interpretar los datos (Figura 7). Los
grficos pueden ser copiados (para pegar en Power Point o en cualquier programa de
Office) o impresos directamente con las opciones de la barra de herramientas debajo de
las tablas. Para editar los grficos usted cuenta con diferentes barras de herramientas de
acuerdo al tipo de grfico. Otras opciones de fuentes y colores podrn encontrarse al
hacer click derecho en el grfico.
Otro grfico muy til cuando se hacen comparaciones es hacer histogramas con los dos
juegos de datos al mismo tiempo. Para ello, seleccione los datos y siga la ruta
Plot>histogram. Obtendr un grfico en dos colores al cual usted puede aadirle una
curva normal para cada grupo de datos (Figura 8).
12
http://bpcosac.wix.com/webp
Uno de los primeros pasos para saber que tipo de prueba estadstica utilizar consiste en
verificar que los datos sigan una distribucin normal. Para ello se utilizan diferentes
pruebas estadsticas que te indican si los grupos de datos cumplen con este requisito.
PAST da el resultado y un valor p para cinco pruebas estadsticas. Para realizar este
anlisis siga la ruta Statistics>Normality tests (figura 9).
13
Figura 9. Resultados de los anlisis de Normalidad
Como podemos apreciar, la mayora de los tests indican que los datos no cumplen con
una distribucin normal. Cuando esto ocurre una forma de cumplir con esta formalidad
estadstica es transformando los datos a su logaritmo. Para ello siga la ruta
Transform>Log. Vuelva a aplicar el test de normalidad para saber si cumple con el
requisito de tener una distribucin normal.
Frente a esta situacin no podemos aplicar el clsico test de ANOVA, ya que no cumple
con la normalidad, lo que nos obliga a utilizar test no paramtricos como los de Mann
Wittney (para dos muestras) o el de Kruskall Wallis (para ms de dos muestras). Para
ello, seleccione los datos y siga la ruta: Statistics>Mann Whitney o Statistics>Kruskal
Wallis segn sea el caso.
14
Ahora que ya comprob que existen diferencias significativas en los adultos, intente
comprobar si en los otros estadios de la poblacin se cumple el mismo patrn.
El p valor (p value) es la probabilidad de que dos valores sean iguales habiendo hecho
un anlisis estadstico cualquiera. Permite rechazar o aceptar las hiptesis. Por ejemplo
en una prueba de Normalidad (Normality test) si el p valor es menor que 0.05 significa
que no sigue una distribucin normal (se compara la distribucin normal con la
variable). Si en una comparacin de dos tratamientos (prueba de hiptesis con ANOVA,
Mann Wittney, Kruskal Wallis o cualquier otro test) el p valor es menor de 0.05
significa que los tratamientos son diferentes (se comparan ambos tratamientos).
Otro de los efectos de la deforestacin sobre las especies vegetales es el cambio de las
condiciones ambientales donde estas viven, y la consecuente expresin de estos
cambios en los caracteres morfolgicos.
15
Existe algn efecto de la deforestacin sobre el tamao de las hojas?
Existe compensacin entre los parmetros morfolgicos analizados?
Haga un anlisis descriptivo para tener una idea de la situacin de los datos en campo.
Una vez realizado el anlisis, verifique la normalidad de los datos. De poder verificarse
la normalidad Aplique ANOVA, siguiendo la ruta statistics>One-way Anova. Si no
procede, utilice los anlisis estadsticos descritos en la seccin anterior.
16
Por inspeccin del grfico, se puede apreciar que no hay relacin alguna entre las
variables. Para cerciorarse de ello es importante hacer un test de correlacin. Para ello
siga la ruta Statistics>Correlation table. La Tabla de Correlacin le permitir tener los
resultados del anlisis de correlacin (valor bajo la curva) acompaados de un valor p
(valor sobre la diagonal) para cada anlisis (Figura 12).
17
ESTADSTICO IMPORTANTE: Correlaciones y Coeficiente de regresin
Los anlisis de correlacin te indican si hay una correlacin entre dos variables. Cuando
los valores son negativos, significa que la relacin es inversamente proporcional.
Cuando los valores son positivos indica que la relacin es directamente proporcional.
Siempre verificar el p valor (si p valor < 0.05 hay una correlacin estadsticamente
significativa, si no se verifica, no hay correlacin).
El coeficiente de regresin (R2) nos indica cuan cerca a los puntos se encuentra la lnea
fruto de la regresin. Si el R2 es 0 significa que no se acerca a los puntos, es decir, que
no explica la distribucin de los puntos en el plano. Si el R2 es 1 significa que la lnea
pasa por todos los puntos; es decir, que explica la distribucin de los puntos en el plano.
18
Existen diferencias significativas en la cobertura segn la orientacin de la
ladera? Cul es la zona ms vulnerable?
Si tuviera que transplantar individuos para la revegetacin de un tillandsial
afectado: Qu orientacin sera la mejor para revegetar? De qu zona (del
Tillandsial Piedra Campana) escogera las plantas?
Pruebas Post-Hoc
PAST automticamente realiza las pruebas Post Hoc cuando la variable tiene ms de
tres formas. Cuando se aplica un estadstico paramtrico (Anova) realiza el anlisis de
Tukey. Cuando la prueba es no paramtrica aplica la U de Mann Whitney (Figura 14).
Las diferencias entre los grupos son arrojadas como p-valores sobre la diagonal.
19
ESTADSTICO IMPORTANTE: p valores en las pruebas Post Hoc
Las pruebas Post-Hoc son pruebas que permiten (una vez realizada la prueba de
hiptesis inicial) revisar entre cul de las formas de las variables (tratamientos, zonas,
en nuestro caso orientacin) existe diferencias significativas. Ello nos permite inclusive
formar grupos, los mismos que se representan usualmente con una letra como subndice
(a por ejemplo). Los valores p en las pruebas post Hoc reciben la misma interpretacin
que los valores p para las pruebas de hiptesis (cuando es < 0.05 hay diferencias
estadsticamente significativas).
Basado en (Aponte & Pacherres 2013). Limnobium laevigatum es una planta acutica
flotante distribuda en el Per en ambientes amaznicos y algunos humedales costeros
(Figura 15). Esta planta ha demostrado tener una gran capacidad como agente
biorremediador y como complemento alimenticio para especies forrajeras. Con la
finalidad de conocer sus requerimientos nutricionales en laboratorio se hicieron
experimentos a fin de determinar la mejor concentracin de nutrientes (basado en una
mezcla comercial de los mismos) a la que se debe realizar la propagacin. Para ello se
realiz un experimento de 21 das en los cuales se midieron mltiples parmetros; entre
20
ellos, la biomasa. Usted cuenta con los datos de produccin de biomasa al da 21
(Ejercicio 4). Realice los anlisis respectivos e indique:
21
PARTE II: ANLISIS DE DIVERSIDAD Y ESTUDIOS COMUNITARIOS
Basado en Aponte & Ramrez (2011): Los Humedales de La Costa central del Per:
Comunidades Vegetales y Conservacin. Rev. Ecol. Apl. 10(1): 3139.
Usted cuenta con datos de dos localidades: Las Albuferas de Medio Mundo
(Vgueta, no impactado intensamente) y los Humedales de Santa Rosa
(Chancay, impactados por ganadera y agricultura) (Ej 6 Humedales). Realice
los anlisis que le permitan evidenciar y explicar el efecto de la ganadera sobre
las comunidades vegetales.
22
http://capacitacionvirtualbp.com/
Usted cuenta con los datos de los transectos (ej. 7 Ventanilla). Hallar:
23
ndices de diversidad Alfa
Entendemos por diversidad al conjunto de especies, sus genes y los hbitats donde
viven estas especies. Dado que esto es prcticamente inmedible se utilizan los datos
disponibles para tratar de comprender mejor la diversidad biolgica que hay en un
determinado lugar. Una de las formas de abordarlo es a partir de la cuantificacin de
ndices de diversidad alfa. La diversidad alfa se concentra en medir la riqueza,
abundancia y equitabilidad de las especies en un determinado lugar; en consecuencia,
los ndices de diversidad alfa medirn estos parmetros. Para ello, estos ndices se basan
en la teora de las probabilidades. Veamos un ejemplo. Imaginemos que tenemos tres
bolsas con canicas de diferentes colores (A, B y C en la figura 17). Es posible apreciar
que, si yo metiera mi mano a la bolsa A y sacara una canica al azar, podra salir
cualquiera de los colores (existe equitabilidad, la misma abundancia de cada color).
24
Aquellos que aumentan conforme aumenta la dominancia (visto de otra manera,
disminuyen conforme aumenta la diversidad). Entre ellos tenemos al ndice de
Dominancia de Simpson, Eveness y Berger-Parker.
Utilice los datos de diversidad total en cada tipo de zona (crioturbado o hbitat
asociado) para obtener los ndices de diversidad para cada zona. Puede hacerlo tambin
Por cada parcela por separado y obtener un promedio. La ruta es Diversity>Diversity
ndices. Obtendr una tabla con todos los ndices para cada parcela o para el total segn
el anlisis que haga usted (Figura 18). Para hacer el anlisis simultneamente entre dos
columnas debe tener todas las casillas llenas (las puede rellenar con ceros).
25
otros factores edficos y climticos, hacen que la vegetacin que colonizan estos suelos
sea diferente a la encontrada en hbitats circundantes, principalmente respecto a su
diversidad, estructura, fisiologa y ecologa (Figura 19).
26
Perfiles de diversidad
Figura 20. Perfiles de diversidad para las parcelas evaluadas en Suelos Crioturbados y
Asociados.
27
http://capacitacionvirtualbp.com/
Otra forma de hacer esta comparacin es haciendo un Test-T de diversidad con el ndice
de Shanon-Wienner. Se puede realizar fcilemente con la opcin Diversity T-Test
(Figura 22).
28
Anlisis SHE
Figura 23. Ejemplo de anlisis SHE con los datos de las parcelas hechas en suelos
crioturbados.
29
Figura 24. Quadrat Richness de datos provenientes de Suelos Crioturbados
PAST calcula 8 ndices de diversidad Beta y los muestra en una tabla. Para ello es
necesario una matriz con datos de presencia y ausencia. Luego siga la ruta
Diversity>Beta Diversity (figura 25). Es posible pedirle al PAST que haga
comparaciones por pares seleccionando el ndice que se desea (lado superior derecho de
la pantalla emergente).
30
Figura 25. Anlisis de Diversidad Beta para los suelos crioturbados
Usar los ndices de diversidad es muy sencillo (los clculos se obtienen de inmediato
con PAST), pero, al mismo tiempo, tiene sus lmites. No es necesario depender de los
ndices de diversidad para hacer los anlisis de diversidad. Por ejemplo, intente
comparar la riqueza entre suelos crioturbados y hbitat asociados: Hubiera tenido el
mismo resultado? Se hubiera discutido de la misma forma?
El uso de los ndices de diversidad est ampliamente difundido aunque muchas veces
pocos entienden los resultados, o inclusive lo calculan de diferente manera (por
ejemplo, el logaritmo no siempre usa la misma base en cada paquete estadstico); por
ello es muy importante comprender no solo el valor, sino ir ms all y averiguar el
algoritmo utilizado para el clculo.
31
sido realizados con el mismo esfuerzo, el mismo especialista y el mismo mtodo cosa
que muy pocas veces se cumple. Ello lleva a errores de interpretacin.
An as los ndices de diversidad son muy tiles, pero deben ser considerados como
relativos para la toma de decisiones de conservacin y deben evaluarse de la mano con
datos de importancia ecosistmica de las especies o, inclusive, listado de especies
endmicas o invasoras.
Curvas de Rarefaccin
Las curvas de rarefaccin tienen diferentes usos. Uno de ellos es comparar la diversidad
en dos muestras de diferente tamao. Las curvas de rarefaccin permiten analizar el
nmero mnimo de parcelas que se deben realizar para poder hacer un muestreo
suficientemente exhaustivo (por ejemplo en un monitoreo constante. Hay dos clases de
curvas:
Permite medir el nmero de individuos que debo muestrear como mnimo para
monitorear toda la diversidad. Para preparar esta curva se requieren datos de abundancia
total. La ruta es Diversity>Individual Rarefaction (figura 26).
Esta curva permite calcular el nmero mnimo de parcelas que se deben realizar para
muestrear la diversidad total de una localidad. Para ello se necesitan datos de presencia
y ausencia en una localidad. Luego seguir la ruta Diversity>Sample Rarefaction (Figura
27). Inclusive los datos obtenidos para la curva de rarefaccin pueden modelarse
siguiendo el modelo de Mikaelis-Menten.
32
Figura 26. Curva de Rarefaccin por individuo de los suelos crioturbados
33
PARTE III. ANLISIS DE SIMILITUD
Medidas de similitud
Mahnattan
Grower
Mahalanobis
Distancia Euclideana
34
Chord Correlacin
Cosine
Raup Crick
BrayCurtis
Ochiai
35
Morisita
Horn
Ahora que ya conocemos las frmulas, es importante saber cundo utilizar cada tipo de
distancia. Por ejemplo, las distancias entre vectores nos permitirn ubicar estos vectores
en un espacio multidimensional, es decir, son distancias que, sin importarles el contenido
numrico de los vectores, nos van a permitir colocarlos en el espacio. Algunas de estas
distancias son muy similares, por ejemplo, la distancia Euclideana y la distancia de Chord
se diferencian en la normalizacin que tiene esta ltima. La distancia de Mahalanobis
utiliza la matriz varianza covarianza entre los datos. Otras medidas matemticas son las de
Por otro lado tenemos las medidas de similitud comunitaria. Aqu se encuentran aquellas
medidas que consideran como los componentes de un vector a especies, en consecuencia
los valores deben ser positivos. Estos ndices trabajarn con valores de abundancia o de
presencia ausencia. Por ejemplo los ndices de Sorenssen, Jaccard, Kuklinski, Ochiay,
Simpson y Raup-Crick utilizarn valores binarios de presencia ausencia. De ellos,
Sorenssen y Jaccard son similares, pero Sorenssen valora ms las especies comunes. Otros
ndices como Bray-Curtis, Morisita y Horn utilizan datos de abundancia. De estos ltimos
Morisita tiene mayor aplicabilidad que Horn, ya que este ltimo aplica logaritmos
(imposible con abundancia 0), adems es ms sensitivo a las especies dominantes. Wolda
(1981) compar 22 ndices, indicando que Morisita da mayor ventaja dado que es
independiente de la talla de la muestra y de la diversidad. Sin embargo indica que es muy
sensible a cambios en la abundancia de las especies dominantes, por lo que conviene
utilizar transformaciones logartmicas de sus abundancias. Por otro lado Bray-Curtis es
muy utilizado en anlisis de Biologa Marina, por lo que resulta importante utilizarlo en
este campo para comparaciones.
Es conocido que una imagen habla ms que mil palabras, por ello es de mucha utilidad
expresar la matriz de similitud en un grfico; a este proceso se le llama Clustering. El
producto es un dendrograma construido a partir del agrupamiento de los puntos segn su
similitud y distancia entre los vectores (que en caso del anlisis biolgico son
comunidades).
Muchas veces se confunde el uso de las medidas de similitud como una medida directa de
la diversidad Beta, lo cual es inadecuado. Los ndices de similitud (como su nombre lo
dice) miden la similitud. Sin embargo, si contamos con la similitud entre los transectos de
un rea especfica, podremos tener una medida indirecta de la diversidad Beta (recambio
de especies).
Utilizando el grupo de datos del Ejemplo 7 y 12, se le pide a usted que indique
Cul de las comunidades presenta mayor diversidad Beta? Todos los ndices
indican lo mismo? Cmo afectara ello sus decisiones de conservacin?
Ejemplo proporcionado por el web site de PAST. Los foraminferos con protozoarios que
cuentan con una proteccin calcrea (Figura 7). Este esqueleto intraectoplsmico es la
caracterstica ms sobresaliente de los foraminferos, y el motivo de que sean susceptibles
de fosilizar con relativa facilidad. Esta caracterstica permite encontrarlos en los
sedimentos y utilizarlos como indicadores climticos y estatigrficos.
Usted cuenta con los datos de las especies de foraminferos en un transecto longitudinal
realizado en una baha perpendicular a la costa (Ejemplo 14). Con los datos que usted
cuenta intente responder: