You are on page 1of 13

https://issuu.com/fundatun/ https://issuu.

com/fundatun/
docs/2018_11_rev_cofa docs/2019_03_rev_cofa

CRITERIOS CONFIABLES PARA LA CONSTRUCCIÓN DEL MODELO DE


MÁXIMA ENTROPÍA (MAXENT)
ORIENTADOS A LA PESQUERÍA CON RED DE CERCO EN EL PACÍFICO ORIENTAL
CRITERIOS CONFIABLES PARA LA CONSTRUCCIÓN DEL MODELO DE MÁXIMA ENTROPÍA -
MAXENT - (PARTE 1)
Manuel Correia – FUNDATUN (23 de octubre de 2018)
En anteriores boletines de COFA, se ha mencionado que especies, y esto no permitiría obtener una imagen fiel de
los Modelos de Distribución de Especies (MDE) se están las condiciones sobre las que pueden vivir las especies
convirtiendo en una herramienta cada vez más cuestionadas (Deputié y col., 2014). Las consecuencias de
importante en la gestión y conservación pesquera actual, la falta de calidad de los datos primarios pueden afectar
así como en la planificación futura. Los MDE son las interpretaciones sobre lo que realmente muestran las
programas matemáticos o estadísticos que permiten representaciones gráficas o estadísticas, destinados a no
representar una información sobre el diagnóstico actual y conocer la influencia del cambio climático sobre las
predictivo, que sintetiza las relaciones entre especies y distribución adecuada de las especies.
variables ambientales que serían difíciles de interpretar o
Dentro de los criterios para la construcción de un MDE,
incluso de apreciar por otros medios (Mateo y col., 2011).
las variables predictoras ambientales seleccionadas
En términos generales, los MDE indican la idoneidad del deben pasar primero por una revisión y prueba para
hábitat (Nicho) para el desarrollo de poblaciones de una evaluar posibles correlaciones entre ellas. Todo esto,
especie concreta o de una comunidad, calculada a partir antes de validar la calidad de los datos de localización de
de observaciones de campo y una serie de variables una especie determinada.
ambientales que actúan como predictores. El modelado
Los MDE basados únicamente en presencias (BIOCLIM,
basado en correlaciones gana cada día más espacio y peso
DOMAIN, GARP y MAXENT, entre otros) representan
en la literatura, tanto por su facilidad operativa como a la
generalmente la distribución espacial del nicho ecológico
no dependencia de datos fisiológicos, demográficos o
fundamental de la especie, definido por todas las
ecológicos que permitan realizar predicciones basadas en
condiciones ambientales permiten la existencia de la
resultados empíricos (Lobo, 2015).
especie.
¿QUÉ TAN CONFIABLES SON LOS DIFERENTES Los modelos basados en presencia-ausencia (GLM y
MODELOS DE DISTRIBUCIÓN DE ESPECIES? GAM) indican de modo más aproximado la distribución
Muchos modelos, muchos nombres, muchos algoritmos del nicho ecológico realizado, definido por la porción del
tienden a crear dudas en sectores escépticos de la nicho fundamental donde la especie no es limitada por
administración pesquera que desconocen probablemente factores bióticos; es decir, por condiciones ajenas al
los enfoques y objetivos de los modelos de predicción. ambiente como la competencia, la depredación,
Todos los modelos son representaciones simplificadas de enfermedades y/o barreras naturales, entre otros.
la realidad, pero con un propósito determinado. Si se Para tomar una decisión en cuál algoritmo usar, primero
examina la distribución de la mayoría de las especies, se hay que saber el tipo de datos se tienen, luego se debe
puede observar varios detalles que suelen ser comunes en conocer el funcionamiento del modelo seleccionado
muchas representaciones gráficas de sus distribuciones. (Tabla 1).
Por ejemplo, la densidad de puntos con los que se suelen
reflejar las localidades, en donde se ha
observado una especie, es desigual. Tabla 1. Clasificación de los métodos para modelar la distribución de las
Evidentemente, la densidad de esos puntos especies.
no necesariamente refleja la frecuencia de ALGORITMO ONTOGENIA
TIPO DE DATOS DE
ENTRADA
aparición de dicha especie, sino que
Bioclim, Aquamaps, Envelope
probablemente sigue criterios de Score, SVM, Surface range
Envolturas ambientales Sólo Presencia
oportunidad relacionados con el esfuerzo de Euclidiana, Mahalanobis,
Distancias ambientales Sólo Presencia
recolecta diferencial realizado en distintas Manhattan, Chebishev
regiones por distintos investigadores. Esto Regresiones Logit, GLM, GAM,
Regresiones y clasificaciones Presencia/Ausencia
puede inducir el criterio que los datos MARS, CART
Redes Neuronales (ANN), BRT,
disponibles sobre la distribución geográfica Inteligencia Artificial Presencia/Ausencia
Algoritmos genéticos, SVM
de la mayoría de los organismos están Presencia/Pseudo-
sesgados. Que cuando se consideran GARP Algoritmos Genéticos
ausencia
conjuntamente, los mapas obtenidos ENFA, Climate Space Model (PCA), Estadística multivariada:
Presencia/Entorno
pudieran reflejar básicamente, el esfuerzo de Multiple Discriminant Analysis Estructura de varianzas
recolecta y no la distribución de la riqueza de MAXENT Máxima Entropía Presencia/Entorno

13
Hay varios estudios en donde comparan el desempeño de distribución uniforme; sujeta a las limitaciones impuestas
los algoritmos (Meynard y Quinn, 2007; Gritti y col, 2013). por la información disponible sobre la distribución
A la fecha no existe un algoritmo que sea mejor que los observada de las especies y las condiciones ambientales
demás para todos los tipos de datos. Algunos funcionan en el área de estudio. La información disponible, acerca
mejor cuando el número y la calidad de registros es baja de la distribución de destino, por sí misma se presenta
y otros cuando la calidad de los datos mejora y son más como un conjunto de covariables conocidas como
robustos. “características” y se esperan restricciones en cada
característica que debe corresponder a los valores
Es práctica común que la decisión del método de
medios de la muestra.
modelación se base en criterios ajenos a los datos; ya sea
por moda, por escuela, por dogma o por (in)habilidades Ya que MAXENT se utiliza para modelar la distribución de
personales. La modelación de nichos y distribuciones no especies con sólo registros de presencia, los píxeles del
es como una técnica de laboratorio en donde se tienen área de estudio se convierten en el espacio en el que se
protocolos, dosis o recetas ya estandarizados. delimita la distribución de probabilidad. Los píxeles para
registrar las ocurrencias de especies conocidas son los
La selección del método de modelación es un paso crítico
puntos de muestreo, las características son las
en el proceso conocer o predecir las distribuciones
covariables de clima, topografía, suelos, vegetación y
idóneas de las especies. Para tomar una decisión es
otras covariables ambientales. MAXENT se configura solo
necesario conocer el tipo de datos con los que se cuenta y
con los registros de presencia de la especie, por lo que
el funcionamiento de los algoritmos de modelado. Probar
esos puntos de ocurrencia de cada especie se dividirán en:
el desempeño de más de un método es una buena práctica,
registros de entrenamiento (75 %) y validación (25 %)
pero hay que ser cuidadosos en el proceso de evaluación
del modelo. En otras palabras, estima o predice las
(Elith y col, 2006; Pearson y col, 2006).
distribuciones que deben de estar de acuerdo con todo lo
REDESCUBRIENDO EL CONCEPTO DE MÁXIMA que se conoce (aunque sea de manera incompleta) de la
ENTROPÍA A TRAVÉS DEL MAXENT información inferida, de las condiciones ambientales y de
las localidades de ocurrencia.
Partiendo del concepto básico propuesto por Shannon en
1948, basado en la teoría de la información que indica que La ventaja de las modelizaciones de especies, con
tan aleatorio es “algo”, al medir la incertidumbre de ese MAXENT y sus entornos, reside en la posibilidad de
“algo”, se estaría hablando de la entropía de la modelar situaciones futuras con muestras de datos
información, similar a la entropía física. Dado un conjunto parciales o “incompletos”; es decir, que con un volumen de
de probabilidades, su cálculo es el mismo que el índice de datos representativos se puede tratar de extrapolar la
diversidad de Shannon (EC.1), donde pi es el número de información, advirtiendo datos complementarios. Como
individuos por especie (S): resultado de estos análisis, se obtienen mapas predictivos
𝑆 en los que se puede visualizar la distribución potencial de
´ las especies bajo el entorno actual o futuro.
𝑬𝑪. 𝟏 𝐻𝑆ℎ𝑎𝑛𝑛𝑜𝑛 =− 𝑝𝑖 𝑥 𝑙𝑜𝑔𝑏𝑎𝑠𝑒 𝑝𝑖
𝑖=1
Antes de ejecutar la modelización, es necesario establecer
previamente las coordenadas de distribución geográfica a
Unos de los programas más empleados para el modelado ser evaluada. El modelo predictivo será llevado a cabo con
de la distribución potencial de las especies, dentro del base a las variables ambientales seleccionadas para la
mundo de los Sistemas de Información Geográfica, es el creación del modelo. Es importante tener en cuenta que
MAXENT. El principio o método de Máxima Entropía estas variables deberán ser variables dependientes de
(MAXENT) es un procedimiento para generar la especie. Siempre será recomendable emplear
distribuciones de probabilidad de forma sistemática y variables escasas, pero concisas, que complicar el modelo
objetiva. con variables que no aporten gran información a la
Requisitos para correr el MAXENT: distribución de la especie o estén vinculadas con su
1) Datos Biológicos: Archivo con los lugares de biología.
presencia de la especies (“muestras”). En la fase inicial de construcción del modelo de MAXENT,
2) Datos geográficos: Un directorio (carpeta) que con la obtención de las variables ambientales
contenga las variables ambientales. descriptivas, se debe crear o editar las mismas en función
Las coberturas ambientales son en formato raster, o ASCII (formato .asc). de los recursos y aptitudes cartográficas que se
Todas deben tener la misma extensión geográfica y tamaño de píxel. Se
carga el directorio completo en formato ASCII.
encuentren disponibles (Tabla 2). La premisa
fundamental que permite analizar estas variables bajo el
3) Directorio (carpeta) de salida.
entorno de MAXENT es que todas las variables deben
El modelo de MAXENT trata de encontrar la distribución presentar los mismos valores de resolución, así como
de probabilidad de máxima entropía cercana a la límites espaciales (Figura 1). El formato de archivo
14
Tabla 2. Portales de internet con acceso libre para descargar diferentes bases de datos de variables ambientales
FORMATO
PORTAL DIRECCIÓN INTERNET VARIABLES UNIDADES PERÍODO
DATOS
Temperatura Supercial del Mar (SST) ⁰C
Concentración de Clorofila a (Chl-a) mg/m3
Central Producción Primaria Neta (NPP) mgC/m2 /d ASCII, HDF, 1999-2013
http://centralentropy.com
Entropy Fracción Exportable de la Tasa de LAN, JPG
mgC/m2 /d
Carbono (ef_fraction)
Batimetría m
Temperatura ⁰C
Salinidad PSS
Velocidad de Corriente m-1
Espesor del hielo m
Concentración de hielo marino Fraction
Nitratos mol.m-3
Fosfatos mol.m-3
Silicatos mol.m-3
http://www.bio- Oxigeno molecular disuelto mol.m-3 ASCII, Tiff
Bio-Oracle oracle.org/downloads-to- 2000-2014
email.php Hierro µmol.m-3 raster file
Clorofila mg.m-3
Fitoplancton µmol.m-3
Productividad Primaria g.m-3 .day-1
Calcita mol.m-3
pH -
Radiación Disponible para Fotosintesis E.m-2 .day-1
Atenuación difusa m-1
Cobertrura de Nubes %
Temperatura ⁰C
Salinidad psu
https://www.aquamaps.org/
Aquamaps main/envt_data.php
Profundidad m ASCII 2001-2010
Productividad Primaria mgC·m-
Concentración de hielo marino Fraction
Temperatura Supercial del Mar (SST) ⁰C Hierarchical
Concentración de Clorofila a (Chl-a) Data Format
Ocean https://oceancolor.gsfc.nasa Network
Carbón Orgánico Particulado (POC) mg m-3 1978-2018
Color Web .gov/ Common
Data Form 4
Carbón Inorgánico Particulado (PIC) mol m-3 (netCDF4)

reconocido por el programa para estas variables es el En este ejercicio académico se consideran las siguientes
formato ASCII (Código Estándar para el Intercambio de variables climáticas (Figura 1): Temperatura superficial
Información). Se trata de un patrón de codificación que del mar (TSM), Clorofila-a (Chlo-a), salinidad (S o/oo),
se emplea en el ámbito de la informática, no pudiendo corrientes superficiales (CS), coeficiente de acidez (pH),
recurrir a variables descriptivas en otro formato oxígeno disuelto superficial (ODS), bajadas del portal de
vectorial. Es posible conseguir la información en otros internet BIO-ORACLE (Tyberghein y col., 2012; Assis y
formatos de almacenamiento, en esos casos deben ser col., 2017).
transformados a formato ASCII para el programa
No existen límites en el análisis de las variables para este
MAXENT. Se puede utilizar la plataforma original del
software predictivo. Sin embargo, las gráficas de las
programa MAXENT o ejecutarlo desde el programa de
variables pueden ser difíciles de interpretar si se tienen
libre acceso llamado “R”.
variables fuertemente correlacionadas; ya que el modelo
A través de un sencillo entorno visual se puede analizar puede depender de las correlaciones en formas que no
estadísticamente diversas variables territoriales u son evidentes en las curvas. En otras palabras, si dos
oceánicas (pendiente, temperatura, vegetación, altitud, variables altamente correlacionadas tienen curvas de
humedad, corrientes superficiales, clorofila-a, pH, respuesta aproximadamente opuestas la una de la otra,
oxígeno disuelto, etc.), junto a la distribución inicial de la entonces el efecto combinado de ambas variables será
especie. bajo para muchos píxeles cuando se corra el modelo.
15
Durante cada iteración del algoritmo de entrenamiento o resultados, se corre el modelo.
validación de los datos se puede rastrear cuáles son las
MAXENT soporta 3 formatos de resultados para los
variables ambientales que contribuyen en mayor medida
valores del modelo, el resultado por defecto es logístico;
al modelo.
ya que es el más fácil de conceptualizar y da una
En este ejercicio, el ODS y la TSM tienen una alta estimación entre 0 y 1 de la probabilidad de presencia. En
correlación (Figura 2), para evitar falsos positivos al un próximo boletín COFA se describirá el proceso final
aplicar el modelo; por lo que una de ellas o ambas de este ejercicio de Máxima Entropía, con ejemplos de
variables deben ser omitidas antes de ejecutar el datos de la captura incidental en la pesquería de
MAXENT. túnidos tropicales con red de cerco en el Pacífico
Oriental.
Una vez que se han cargado las capas, definido los
parámetros y los directorios de almacenamiento de los

SST (⁰C) Chlo-a (mg/m3) S (0/00)

50
2,5 35
25
2,0
30
0 20 1,5
1,0 25
15
0,5
20
-50

pH Vel_Corr (m-1) ODS (mg m-3)

50
8,3 1,2 280
8,2 1,0
8,1 260
0,8
0 8,0 0,6 240
7,9 0,4
220
7,8 0,2
7,7 200
-50

-140 -120 -100 -80 -140 -120 -100 -80 -140 -120 -100 -80

Figura 1- Distribución de los valores promedios superficiales de 6 variables ambientales (Temperatura superficial del mar <SST>,
Clorofila-a <Chlo-a>, salinidad <S>, velocidad de las corrientes <CS>, coeficiente de acidez <pH>, velocidad de corriente <Vel_Corr>y
oxígeno disuelto <ODS>) en el Océano Pacífico Oriental, utilizando MAXENT en plataforma del programa “R” (elaboración propia).

16
0,0 1,5 7,8 8,1 200 240 280

30
SST (⁰C)

0,99

20
0,25 0,33 0,025 0,40

10
Chlo-a (mg/m3 )
1,5

0,36 0,079 0,19 0,24


0,0

S (0 /00 )

30
0,27 0,049 0,40

20
pH
8,1

0,071 0,054
7,8

1,2
Vel_Corr (m-1 )

0,6
0,39

0,0
240 280

ODS (mg m-3 )


200

10 20 30 20 30 0,0 0,6 1,2

Figura 2- Representación gráfica de la correlación entre las 6 variables ambientales (Temperatura superficial del mar <SST>,
Clorofila-a <Chlo-a>, salinidad <S>, velocidad de las corrientes <CS>, coeficiente de acidez <pH>, velocidad de corriente <Vel_Corr>y
oxígeno disuelto <ODS>) en el Océano Pacífico Oriental, utilizando MAXENT en plataforma del programa “R” (elaboración propia).
ARTÍCULOS REVISADOS: Meynard, C. y J. Quinn. (2007) Predicting species distributions: a critical
Anderson, R., D. Lew, y A. Peterson. (2003) Evaluating predictive models of comparison of the most common statistical models using artificial species.
species distributions: criteria for selecting optimal models. Ecol. Model, Journal of Biogeography, 34: 1455-1469. doi:10.1111/j.1365-
v.162, p.211–232. 2699.2007.01720.x
Assis J, L. Tyberghein, S. Bosch, H. Verbruggen, E. Serrão, O. De Clerck. (2017) Pearson, R. , W. Thuiller, M. Araújo, E. Martinez‐Meyer, L. Brotons, C.
Bio-ORACLE v2.0: Extending marine data layers for bioclimatic modelling. McClean, L. Miles, P. Segurado, T. Dawson, y D. Lees. (2006) Model‐based
Global Ecol Biogeogr. 2018;27:277–284. uncertainty in species range prediction. Journal of Biogeography, 33:
https://doi.org/10.1111/geb.12693 1704-1711. doi:10.1111/j.1365-2699.2006.01460.x
Duputié, A., N. Zimmermann, y I. Chuine. (2014) Why we need better species Phillips, S., R. Anderson y R. Schapire (2006) Maximum entropy modeling of
distribution data. Global Ecology and Biogeography, 23: 457-467. species geographic distributions Ecological modelling 190:231-259
doi:10.1111/geb.12118 Phillips S., M. Dudík, J. Elith, C. Graham, A. Lehmann, J. Leathwick, y S. Ferrier.
Gritti E., C. Gaucherel, M. Crespo-Perez, y I. Chuine. (2013) How Can Model (2009) Sample selection bias and presence-only distribution models:
Comparison Help Improving Species Distribution Models? PLoS ONE 8(7): implications for background and pseudo-absence data Ecological
e68823. https://doi.org/10.1371/journal.pone.0068823 Applications 19:181-197
Elith, J., C. Graham, R. Anderson, M. Dudík, S. Ferrier, A. Guisan, R. Hijmans, F. Senay S., S. Worner, y T. Ikeda. (2013) Novel three-step pseudo-absence
Huettmann, J. Leathwick, A. Lehmann, J. Li, L. Lohmann, B. Loiselle, G. selection technique for improved species distribution modelling PloS one
Manion, K. Richardson, R. Scachetti‐Pereira, R. Schapire, J. Soberón, S. 8:e71218
Williams, M. Wisz y N.. Zimmermann. (2006) Novel methods improve Scott, J., P. Heglund, M. Morrison, J. Haufler, M. Raphael, W. Wall, y F. Samson.
prediction of species’ distributions from occurrence data. Ecography, 29: (2002) Predicting Species Occurrences: Issues of Accuracy and Scale.
129-151. doi:10.1111/j.2006.0906-7590.04596.x Washington: Island Press.
Lobo, J. (2015) Los Bosques y la Biodiversidad frente al Cambio Climático: Tyberghein L, H. Verbruggen, K. Pauly, C. Troupin, F. Mineur, O. De Clerck.
Impactos, Vulnerabilidad y Adaptación en España. Herrero, A. y M. Zavala, (2012) Bio-ORACLE: A global environmental dataset for marine species
editores Ministerio de Agricultura, Alimentación y Medio Ambiente, distribution modelling. Global Ecology and Biogeography, 21, 272–281.
Madrid. pp 407-417
Mateo, R., Felicísimo, A. y J. Muñoz. (2011). Modelos de distribución de
especies: Una revisión sintética. Revista chilena de historia natural, 84(2),
217-240. https://dx.doi.org/10.4067/S0716-078X2011000200008

17
CRITERIOS CONFIABLES PARA LA CONSTRUCCIÓN DEL MODELO DE MÁXIMA ENTROPÍA (MAXENT)
(SEGUNDA PARTE)
Manuel Correia- FUNDATUN (20 de Enero 2019)
En ediciones anteriores del boletín se ha mencionado que El enfoque de los algoritmos del programa consiste en
existe un debate, hasta cierto grado semántico, sobre el encontrar la distribución de probabilidad de entropía
nombre correcto para la actividad de modelar áreas de máxima, que es la más cercana a la distribución
distribución; ya sea como Modelado de Nicho Ecológico uniforme, condicionada por las restricciones
(MNE), Modelo de Distribución de Especies (MDS) o impuestas por la información disponible sobre la
Modelado de Hábitat Preferencial (MHP). La mayor distribución observada de la especie y las condiciones
parte de sus resultados se presentan sobre una doble ambientales del área de estudio. Se trabaja con el
perspectiva, la geográfica (G) o la ambiental (E). supuesto que las variables ambientales determinan el
Si se intenta modelar las áreas potenciales, lo cual nicho ecológico. No se consideran las interacciones
esencialmente implica localizar en la geografía las bióticas ni los procesos de dispersión de las especies.
regiones favorables a una especie (o sea, contenidas en su Consideración de fuentes de sesgo y error
nicho fundamental existente, o aquellas en el nicho
Los resultados del modelo van a ser tan confiables como
realizado pero que ocurren en otras regiones no ocupadas)
confiables son los datos utilizados para construirlos.
entonces lo lógico sería usar el término MNE. En la mayor
parte de la literatura estas distinciones no se hacen y los • Los recuentos de ausencias no están disponibles en
términos MNE y MDS se consideran sinónimos. muchos casos, no existen, o pueden no ser fiables.
• Las ausencias de una especie en aquellos lugares en
Dejando a un lado los problemas semánticos, se debe
que sí se dan las condiciones favorables se llaman
tener claras tres cosas:
“falsas ausencias”.
1) Existen al menos tres clases de nichos • La inclusión de falsas ausencias en el modelo puede
Grinnelianos (el fundamental, el fundamental sesgar seriamente el análisis, por lo que los datos de
existente y el realizado), ausencia se deben manejar con mucho.
2) Existen al menos tres áreas de interés (la ocupada, • Incorrecta identificación de las especies.
la potencial y la invadible), y
• Incorrecta referencia espacial.
3) Modelar nichos no es igual a modelar áreas, al
• Poca correspondencia entre las características de los
menos por la obvia razón de que los nichos son
datos y las suposiciones estadísticas que hacen los
subconjuntos de E y las áreas son subconjuntos de
algoritmos.
G.
El MAXENT es de código libre bajo licencia del Instituto
En la primera parte de este artículo (Correia, 2018), se
Tecnológico de Massachusetts (MIT); está programado
explicó de forma muy general el fundamento del Modelo
como una aplicación “Java” independiente y tiene una
de Máxima Entropía, conocido por su software como
“Interfase Gráfica de Usuario” para la importación de
MAXENT.
datos de registros y retículas de capas del medio físico
En otras palabras, el software de MAXENT presenta sus (Figura 1), lo que permite modelar distribuciones
análisis predictivos basados en forma de píxeles o celdas geográficas de las especies. Prácticamente el
en una retícula geográfica (ráster), y a veces sobre los procedimiento de proceso de datos es automático y se
ambientes. Se ha mencionado también que utiliza los generan las retículas de idoneidad/abundancia de
archivos cartográficos en un formato y características especies así como reportes del método de procesamiento
específicas, así mismo emplea un archivo de entrada de y ajuste de la simulación.
coordenadas de distribución de especies que es evaluado,
MAXENT puede ser descargado del internet, junto con la
junto con un grupo de variables ambientales, para dar
literatura asociada con instrucciones precisas al respecto.
como resultado la posible distribución potencial de una
Además de la aplicación antes mencionada, también, en
especie con determinada cantidad de datos de presencia,
programación de R se puede ejecutar gran parte de la
al respecto existe abundante literatura que explica los
funcionalidad de la modelación de MAXENT en Java,
fundamentos estadísticos y matemáticos (Peterson y col,
conocido en el internet como “maxnet”. Este repositorio
2011).
de código abierto permite a la comunidad de científica
usar y contribuir al código fuente de Java para MAXENT.

8
R es un lenguaje y entorno de programación cuya métricas de capacidad de acarreo, provistos por los
característica principal es que forma un entorno de gobiernos miembros de la CIAT que han operado en el
análisis estadístico para la manipulación de datos, su Océano Pacífico Oriental (OPO) durante el período
cálculo y la creación de gráficos; con la particularidad que 1993-2016, y registrados en el mar por observadores a
es un software de libre acceso y disponible para funcionar bordo. Se incluye también la información sobre el número
en varios ambientes (Windows, Linux o Unix) o como de lances combinados por año, mes, pabellón o tipo de
archivos binarios precompilados. Junto con R se incluyen lance en una resolución 1°x1° (latitud/longitud);
ocho bibliotecas o paquetes (bibliotecas estándar), adicional a que los registros de las capturas incidentales
existiendo paquetes adicionales que están disponibles a las especies están asentadas en número de individuos. El
través de Internet. procesamiento de datos se hizo a partir del año 2005,
porque fue en ese año que la CIAT expandió la resolución
taxonómica de la base de datos de captura incidental o
“bycatch”.
El término captura incidental (bycatch) ha tomado diferentes
connotaciones según el juicio particular de algunos autores, siendo
considerada en algunos casos, como la porción de la captura que se
descartó muerta o se supuso que moriría como resultado de la
operación de pesca (Davies y col., 2009; Hall y Roman, 2013).
Variables descriptivas. Es importante tener en cuenta
que las mismas deberán ser variables dependientes de la
especie (como las ambientales) que aporten información
a la distribución de la especie o estén vinculadas con su
biología. Estas variables deben ser creadas o editadas en
función de los recursos y aptitudes cartográficas que se
encuentren disponibles. La premisa fundamental que
permite analizar estas variables bajo el entorno de
Figura 1.- Interfase gráfica del usuario al correr el programa
MAXENT es que todas las variables deben presentar los
MAXENT
mismos valores de resolución, así como iguales límites
El lenguaje y entorno de programación R fue creado en 1993 por Ross
Ihaka y Robert Gentleman del Departamento de Estadística de la espaciales. El formato de archivo reconocido para estas
Universidad de Auckland. variables es el formato ASCII no pudiendo recurrir a
Pasos previos a la ejecución del programa variables descriptivas en formato vectorial u otros
desde la aplicación formatos ráster similares. (revisar publicación anterior).
Existen varios portales de internet que facilitan la tarea
Coordenadas de distribución. Para poder realizar el de obtener datos ya transformados de los sensores
“modelado” posterior, es necesario partir de coordenadas satelitales de la Administración Nacional de la
de distribución. El formato de entrada de coordenadas de Aeronáutica y del Espacio (NASA) y la Administración
distribución reconocido por MAXENT es un formato de Nacional Oceánica y Atmosférica (NOAA),
archivo con valores separados por comas (extensión de respectivamente (BIO-RACLE, AQUAMAPS, OCEAN
archivo “CSV”, Comma Separated Values) donde se debe COLOR WEB, entre otros).
indicar en cada renglón de la fila el nombre de la especie,
la ordenada (Y) y la abscisa (X) del sistema de Ejecución del programa
coordenadas empleado (latitud y longitud en grados o en Una vez indicados los parámetros necesarios e
metros). introducidos los datos, de distribución y variables
Para el ejercicio aquí desarrollado se tomaron los datos ambientales, bastará para correr el programa. Éste
de los registros de captura incidental que provienen de comenzará a analizar los datos y generará el modelo. En
los ficheros de dominio público de la Comisión caso que alguna capa temática presente fallos de formato
Interamericana del Atún Tropical (CIAT) en su sitio en de resolución, de límites distribución o las coordenadas
internet; así como la información sobre los códigos de análisis se encuentren fuera de la zona territorial
usados y las normas aplicadas en la compilación y analizada, el programa ofrecerá mensajes de error
presentación de los datos. Los archivos contienen datos advirtiendo de ello y describiendo el tipo de error. Es
de captura incidental de varias especies, registrados por importante corregir estos errores para generar el modelo
buques atuneros cerqueros con más de 363 toneladas sin problema alguno.
9
Evaluación y validación del modelo
Existen dos tipos de errores comunes en este modelo, uno
es de omisión y el otro de comisión (Figura 2):
• Error de omisión: predice la “no-presencia” de la
especie donde realmente está; entendiéndose como
Falso Negativo. Pudiendo no predecir los lugares de
presencia que pueden ser de importancia para la
supervivencia de la población.
• Error de comisión: predice la “presencia” de la
especie donde no está, entendiéndose como Falso
Positivo. Puede ser real o aparente, ya que un “falso
positivo” puede significar una “sobre-predicción” del
modelo o una predicción de nicho potencial de la Figura 3.- Muestra cómo las omisiones calculadas a partir de los
puntos de entrenamiento y el área predicha como favorable
especie.
varían según el valor límite cumulativo.
La gráfica de omisión y área pronosticada consta de tres
líneas:
1. Omisión en datos de entrenamiento (en inglés
omission on training samples, línea azul) muestra las
fracciones de los puntos de presencia ubicados por
fuera del área potencial con base en el modelo de
MAXENT (fraction value) por los valores del umbral
de probabilidad (de bajo a alto) que limita el área
pronosticada en el umbral acumulativo (cumulative
threshold).
2. Las muestras de entrenamiento (training simples,
Figura 2.- Cuantificación del componente de error con una matriz
línea negra) se usan como sinónimo de “puntos de
de confusión.
presencia”.
Casi todas las técnicas de evaluación de modelos de 3. Las muestras (aleatorias) de fracciones de los
distribución de especies se centran en detectar errores de puntos de fondo (fraction of background predicted,
omisión, o sea falsos negativos. línea roja) del área de estudio incluidos en el área
Resultados del análisis. predicha, usando diferentes umbrales acumulativos
Cuando MAXENT finaliza el análisis, se genera un informe (Cumulative thresholds).
Curva de Característica Operativa Relativa (ROC, de su
con los resultados de la aplicación. El archivo principal,
que ofrece la información técnica del análisis, se nombre en inglés Receiver Operating Characteristic): es
presentará en formato HTML y con el mismo nombre de una curva que describe la tasa de identificación correcta
la especie que analizamos. Ejecutando este archivo se de presencias (sensibilidad= fracción de verdaderos
positivos, en las y) contra la tasa de falsas alarmas
pueden advertir gráficas descriptivas, pesos de variables,
(especificidad= fracción de verdaderos negativos, en las x)
éxitos del modelo y mapas de distribución (Figuras 3 a 7).
Tasa de Omisión: es una estadística que indica el para los mismos datos (figura 4). Teniendo en cuenta que
rendimiento del modelo de MAXENT. La figura 3 muestra la especificidad se define utilizando el área prevista, en
la tasa de omisión y el área pronosticada en función del lugar de la verdadera comisión. Cuando se obtienen estos
umbral acumulativo. La tasa de omisión se calculó tanto números para un intervalo de valores de umbral (para
en los registros de presencia de entrenamiento como en decidir si un punto se debe calificar como ausencia o
los registros de prueba. La tasa de omisión debe estar presencia), se traza la ROC, que es la línea roja en la
cerca de la omisión predicha, debido a la definición del figura. La línea negra es la que se obtendría si para
umbral acumulativo. diferentes valores del umbral se utilizara un clasificador
enteramente aleatorio. Esta gráfica será más intuitiva
desde el punto de vista de comprensión, ya que describe

10
como el modelo genera un mayor éxito en la predicción simbolizan la probabilidad de encontrar a nuestra especie
de zonas. en el territorio (figura 5).

Figura 4.- Curva operacional (curva ROC en rojo), para grupo de


datos de entrenamiento, que representa el ajuste del modelo, así
como el área debajo de la curva ROC denominada como AUC
(área bajo la curva).
La idea de la ROC a su vez da origen al estadístico llamado
AUC (Area Under the Curve), que es el área total bajo la Figura 5.- Hábitat potencial de la Especie_X para el Océano
curva roja. Un clasificador aleatorio tiene una AUC de 0.5, Pacífico Oriental en el presente
un muy buen clasificador tiene un área muy cercana a 1. MAXENT dispone de tres formatos de creación de modelo
MAXENT evalúa los aciertos y fracasos que ha conseguido en función de la metodología de valores de predicción que
en el modelo aportando un valor de AUC que indicará asigne a cada píxel. Estos formatos son representados
cuan preciso es nuestro modelo (mostrará valores entre 0 como salidas: logística, valores crudos o valores
y 1). Esto implica que el AUC alcanzable máximo es menor acumulativos. MAXENT asigna la probabilidad por
que 1. Si los datos de prueba se extraen de la distribución defecto de 0.5 como salida logística y no se recomienda
de MAXENT, entonces la AUC de prueba máxima posible cambiarlo en la mayoría de los casos.
sería 0,893 en lugar de 1; en la práctica, el AUC de prueba ¿Qué variables ambientales importan más? Durante el
puede exceder este límite. proceso, MAXENT va generando una distribución de
En este caso, los puntos de presencia no tienen valores de probabilidad sobre los píxeles de las retículas o
probabilidad mayores que las celdas de la retícula cuadrículas, empezando por una distribución uniforme y,
(ráster) donde están ubicados los puntos generados de forma iterativa, mejorando el ajuste de la distribución
aleatoriamente, y el modelo generado por MAXENT no a los datos de muestreo. Al final del proceso, el valor de la
tiene ninguna capacidad de predecir. Esta situación se ganancia (gain) indica como de ajustado está el modelo
refleja en el gráfico en la línea de referencia (Random a las muestras de presencia.
Prediction). Araújo y col (2005) recomiendan la siguiente El programa asigna el incremento en la ganancia (gain)
interpretación del AUC para los modelos generados: a las variables ambientales de las que depende la especie.
Convirtiendo dichos valores a porcentajes, al final del
Excelente si el AUC>0.90 Buena si 0.80>AUC<0.90
proceso de modelado se obtiene una tabla de
Aceptable si 0.70>AUC<0.80 Mala si 0.60>AUC<0.70 contribuciones (Tabla I)
No válida si 0.50>AUC< 0.60 Tabla I.- Análisis de contribución de las 6 variables ambientales
consideradas en el ejercicio
Quizá, la información más llamativa y atractiva para No VARIABLES AMBIENTALES
PORCENTAJE DE IMPORTANCIA DE
CONTRIBUCIÓN LA PERMUTACIÓN
nuestro análisis se encuentre en la sección del archivo 1 Temperatura Superficial del Mar 59.8 65.6
denominada “Figuras del Modelo”. A través de esta sección 2 Clorofila-a 26.7 20.5
se visualiza un mapa que muestra los resultados de 3 Ph 6.2 4.6
4 Salinidad 4.6 5.1
nuestro análisis por medio de una representación gráfica 5 Oxígeno Disuelto 2.1 3.3
de degradados de color. Estos degradados de color 6 Corriente Superficial 0.6 1

11
La ganancia (gain) es una medida de la bondad de ajuste muestra aleatoria de observaciones para calcularla. La
relacionada con la desviación de los valores, empezando idea básica detrás del estimador jackknife radica en
en el valor cero (0) y va aumentando asintóticamente volver a calcular sistemáticamente la estimación
durante el modelado. La probabilidad asignada por el estadística omitiendo una observación a la vez del
modelo a cada píxel es muy pequeña, dado que la suma de conjunto de muestras. A partir de este nuevo conjunto de
los valores de cada cuadrícula debe ser 1. "observaciones" para la estadística, se puede calcular una
MAXENT proporciona dos métricas para determinar la estimación del sesgo, así como una estimación de la
importancia de las variables de entrada en el modelo varianza de la estadística. Ambos métodos estiman la
final: porcentaje de contribución e importancia de variabilidad de una estadística a partir de la variabilidad
permutación. Esta función extrae ambas métricas de la de esa estadística entre submuestras, más que a partir de
ranura de resultados de un objeto de modelo MAXENT y suposiciones paramétricas. El jackknife es una técnica
las coloca en un marco de datos (data.frame), que viene menos general que el bootstrap, y explora la variación de
siendo una hoja de datos, en los que cada fila corresponde la muestra de manera diferente. Sin embargo, este
a un sujeto y cada columna a una variable. La estructura método es más fácil de aplicar a esquemas de muestreo
de un marco de datos (data.frame) es muy similar a la complejos, como el muestreo de múltiples etapas con
de una matriz; con la diferencia que se puede incluir diferentes pesos de muestreo. El bootstrap arrojará
también datos alfanuméricos mientras que una matriz resultados ligeramente diferentes cuando se repita con
sólo admite valores numéricos. los mismos datos, mientras que Jackknife arrojará
exactamente el mismo resultado cada vez.
La importancia de la permutación debe ser la elección
en los análisis, no el porcentaje de contribución. Según
Phillips (2006), "La medida de la importancia de la
permutación depende solo del modelo final de MAXENT,
no del camino utilizado para obtenerla. La contribución
para cada variable se determina permutando
aleatoriamente los valores de esa variable entre los puntos
de entrenamiento (tanto la presencia como los
antecedentes) y midiendo la disminución resultante en el
entrenamiento AUC. Una gran disminución indica que el
modelo depende en gran medida de esa variable. Los
valores se normalizan para dar porcentajes".
Figura 6.- Ganancia de entrenamiento regularizada de la prueba
En este caso, la Temperatura Superficial del Mar y la de Jackknife para la Especie_X
Clorofila-a, serían las dos variables que más importancia
Curvas de respuesta. Las curvas de respuesta del
tienen en la distribución de la Especie_X revisada en este
MAXENT de las variables seleccionadas de acuerdo con
ejercicio, confirmada por estimación de jackknife (figura
los resultados de Jackknife que indican cuáles son
6).
aquellas variables que más afectan a la distribución de las
Estimaciones de jackknife. Las estimaciones de especies en estudio (Figura 7). En el eje “X” indica la
Jackknife implican calcular la estadística de interés para variación del valor ambiental y el eje “Y” indica la
todas las combinaciones de datos donde uno (o más) de probabilidad de hallar la Especie_X en el área de estudio.
los puntos de datos originales se eliminan (figura 6). En el grupo superior de las gráficas se considera el efecto
El Jackknifing, es similar al bootstrapping (remuestreo), de todas las variables y en el grupo inferior sólo se
se usa en la inferencia estadística para estimar el sesgo y considera el valor de la variable correspondiente.
el error estándar en una estadística, cuando se utiliza una

12
Figura 7.- Curvas de respuesta del MAXENT de las variables ambientales (Clorofila-a, Corrientes superficiales, Salinidad superficial,
Temperatura superficial del mar, Coeficiente de acidez) utilizadas para generar los modelos de distribución geográfica potencial de
Especie_X en el OPO.

REFERENCIAS CONSULTADAS Y RECOMENDADAS. Hijmans, R. y J. Van Etten. (2012). raster: Geographic Analysis and Modeling
Araújo, M. (2011). Ecological niches and geographic distributions. Princeton with Raster Data. R package version, Vol. 1, 9–92
University Press, Princeton. 328 pp Peterson, A., J. Soberón, R. Pearson, R. Anderson, E. Martínez-Meyer, M.
Araújo, M., R. Pearson, W. Thuiller y M. Erhard. (2005). Validation of species– Nakamura y M.. Phillips, S. (2006) A brief tutorial on Maxent. AT&T
climate impact models under climate change. Global Change Biology 11: Research. Available at:
1504–15 http://www.cs.princeton.edu/~schapire/maxent/tutorial/tutorial.doc
Correia M (2018). “Criterios confiables para la construcción del Modelo de Phillips, S., R. Anderson y R. Schapire. (2006). "Maximum entropy modeling of
Máxima Entropía - MAXENT - (PARTE 1)”. Boletín COFA convivencia species geographic distributions." Ecological Modelling 190(3): 231-259.
pesquera (Noviembre 2018). FUNDATUN. Caracas – Venezuela. 24 p Phillips, S. y M. Dudik. (2008). Modeling of species distributions with Maxent:
https://issuu.com/fundatun/docs/2018_11_rev_cofa/a/93161 new extensions and a comprehensive evaluation: Ecography. Vol. 31, no. 2,
Davies, R., S. Cripps, A. Nickonson y G. Porter. (2009). Defining and estimating pp. 161-175.
global marine fisheries bycatch. Marine Policy, 33(4), 661-672.
doi:10.1016/j.marpol.2009.01.003
Elith, J., M. Kearney y S. Phillips. (2010), The art of modelling range‐shifting ENLACES DE DESCARGAS DE PROGRAMAS E INFORMACIÓN
species. Methods in Ecology and Evolution, 1: 330-342. doi:10.1111/j.2041- MAXENT https://biodiversityinformatics.amnh.org/open_source/maxent/
210X.2010.00036.x MAXNET https://github.com/mrmaxent/maxnet
Hall, M. y M. Roman. 2013. Bycatch and non-tuna catch in the tropical tuna Java https://www.java.com/es/download/
purse seine fisheries of the world. FAO, Fisheries and Aquaculture Technical R (Software) y otros muchos paquetes http://www.r-project.org
Paper Nº 568. Rome, FAO. 249 pág. Comisión Interamericana del Atún Tropical (CIAT). “Ficheros públicos”
Hijmans, R., S. Phillips, J. Leathwick, J. Elith, y M. Hijmans. (2013). Package https://www.iattc.org/PublicDomainData/IATTC-Catch-by-species1.htm
‘dismo’, Circles Vol. 9. R. software.

13
SÍGUENOS EN LAS REDES SOCIALES: CONTÁCTANOS POR EL CORREO ELECTRÓNICO

@fundatun

fundatuncofa
VERSIONES DIGITALES ANTERIORES EN ISSUU.COM:

FUNDATUN COFA convivencia pesquera fundatun

Dolphin
Safe

Celebramos el cumplimiento de las normas para la pesca del Atún y conservación


de los Delfines en la zona del Océano Pacífico Oriental contenidas en el
“Acuerdo sobre el Programa Internacional para la Conservación de los Delfines (APICD)”
en vigor desde febrero de 1999

You might also like