You are on page 1of 6

UNA COMPARACIN DE DOS ENFOQUES DE MODELACIN DE

NICHO ECOLGICO: MXIMA ENTROPA (MAXENT) Y PESOS


DE EVIDENCIA (DINAMICA EGO)
Jean-Franois MAS1, Michelle FARFAN1, Carolina GUILEN-LIMA2, Thiago CARVALHO-LIMA2 y
Britaldo SOARES-FILHO2
1

Centro de Investigaciones en Geografa Ambiental, Universidad Nacional Autnoma de Mxico, Antigua Carretera
a Ptzcuaro 8701, Col. Ex-Hacienda de San Jos de La Huerta C.P. 58190 Morelia Michoacn Mxico, email:
jfmas@ciga.unam.mx
2
Centro de Sensoriamento Remoto, Universidade Federal de Minas Gerais, Av. Antnio Carlos 6627, Belo
Horizonte, MG 31270-901, Brasil

RESUMEN
Los modelos de nicho ecolgico y/o de distribucin geogrfica de las especies, se han convertido en una
herramienta importante en estudios ecolgicos y geogrficos. Su elaboracin ha estado dominada por
programas como GARP y MaxEnt. Ambos se sustentan en un enfoque basado en los datos, donde es
difcil integrar el conocimiento experto de la especie. El objetivo del presente estudio es comparar el
mtodo de los pesos de evidencia, un enfoque abierto implementado en el programa Dinamica EGO, con
MaxEnt para modelar la distribucin potencial de Bradypus variegatus. Para MaxEnt se sigui el mtodo
propuesto por Phillips et al. (2006) y en Dinamica EGO se opt por un enfoque automatizado basado slo
en los datos. En este, se calculan estadsticamente los pesos de evidencia y el mapa de probabilidad de
presencia sin integracin de conocimiento experto. Los modelos se evaluaron mediante anlisis ROC y el
clculo de la tasa de omisin. Los resultados indican que aunque MaxEnt permite una mejor coincidencia
con las altas probabilidades de presencia que los pesos de evidencia, los mapas umbralizados de
presencia/ausencia poseen una fiabilidad similar. Una ventaja de Dinamica EGO, aun no evaluada, es la
posibilidad de integrar conocimiento experto durante el proceso de modelacin.
Palabras clave: Modelacin de nicho, MaxEnt, Dinamica EGO, pesos de evidencia, anlisis ROC.

1 INTRODUCCIN

umbralizando los valores de probabilidad para


determinar un rea de presencia y otra de ausencia.

La modelacin de nicho ecolgico permite elaborar


mapas de distribucin potencial
y/o de
distribucin geogrfica de las especies. En
trminos generales se emplean registros
georeferenciados de ocurrencia y mapas digitales
de los factores ambientales (clima y topografa)
que condicionan la presencia de la especie. Con
estos insumos se construye una representacin del
nicho ecolgico que se puede definir como un
hipervolumen de n dimensiones, donde cada una
corresponde a uno de los factores ambientales. La
caracterizacin de este nicho, permite expresar
espacialmente la probabilidad de encontrar la
especie. Con base en estos mapas de probabilidad,
es posible elaborar mapas de distribucin potencial

Los enfoques ms comunes utilizados para


modelar el nicho (algoritmos genticos de GARP y
mxima entropa de MaxEnt) se sustentan en un
enfoque basado en los datos. Por tanto, es difcil
utilizar conocimiento experto sobre la especie, si
no es modificando el mapa de distribucin a
posteriori; es decir, una vez que la modelacin ha
sido terminada. No obstante, con Dinamica EGO,
que utiliza el mtodo de los pesos de evidencia
basado en el clculo de la probabilidad
condicional, es posible su visualizacin y edicin
permitiendo la integracin del conocimiento
experto.
El presente trabajo presenta la
implementacin del mtodo de los pesos de
evidencia para la modelacin del nicho ecolgico.

2 MATERIAL Y MTODO
2.1 MATERIAL
Se emplearon 116 registros de ocurrencia
(Anderson y Handley, 2001) del perezoso
(Bradypus variegatus) para modelar su nicho.
Adems se utiliz un modelo digital de elevacin
(USGS, 2001) y datos bioclimticos (IPCC; New
et al., 1999) que incluyen la nubosidad anual, el
rango de temperatura diurna anual, la frecuencia de
heladas anual, la presin de vapor anual, la
precipitacin anual, el mximo, mnimo y
promedio anual de la temperatura. Se sigui el
mtodo de particin de los datos de Philips et al.
(2006), por lo que fueron divididos los datos de
ocurrencia aleatoriamente en dos subconjuntos: 81
registros de entrenamiento y 35 de prueba para
evaluar el modelo, repitiendo este muestreo
aleatorio diez veces para elaborar diez rplicas de
datos de entrenamiento y de evaluacin.
Para la modelacin, se utilizaron dos programas:
MaxEnt
(versin 3.3.3a) y Dinamica EGO
(versin 2.0.10). El primero, es un programa
diseado para la modelacin del nicho ecolgico
basado en un algoritmo de mxima entropa
ampliamente utilizado en la modelacin de la
distribucin de las especies. El segundo es una
plataforma de modelacin que ha sido
principalmente utilizada para modelar cambios de
cobertura/uso del suelo e incluye herramientas
como el mtodo de los pesos de evidencia basados
en la probabilidad condicional y los algoritmos
genticos para entrenar los modelos (Soares-Filho
et al., 2002 y 2009). La evaluacin de los modelos
se hizo con la herramienta para el anlisis ROC
elaborada por Mas et al. (2013).
2.1 MTODO
2.1 Elaboracin de los mapas de
distribucin de Bradypus variegatus
Se elaboraron diez modelos y diez mapas de
probabilidad de presencia de B. variegatus
utilizando el mtodo de mxima entropa (MaxEnt)
y los pesos de evidencia (Dinamica) utilizando las
diez rplicas de datos de entrenamiento.
MaxEnt es un programa que implementa un
algoritmo de mxima entropa que genera la
distribucin de probabilidad sobre los pixeles

presentes en el rea de estudio. El principio de


mxima entropa considera que en la estimacin de
una distribucin de probabilidad desconocida, la
solucin menos sesgada es aquella que maximiza
su entropa, sujeto a algunas limitantes (la
asociacin entre las localidades de presencia y las
variables ambientales). Para ms detalles sobre los
fundamentos tericos de Maxent referimos al
lector a los trabajos de Phillips et al. (2006) y
Phillips y Dudk (2008). La configuracin de
MaxEnt se hizo de acuerdo con Phillips et al.
(2006): convergence threshold = 105, maximum
iterations = 1000, regularization value =104.
Por otra parte, el mtodo de los pesos de evidencia
se basa en las probabilidades condicionales, que
son probabilidades de que un evento ocurra
habindose cumplido ya otro. El peso positivo de
evidencia w+ asociado al evento O y a la presencia
de la condicin C se calcula segn la ecuacin (1).
w !
= ln

! !!
! !

(1)

donde P(CO) es la probabilidad que un sitio


presente cierta condicin (por ejemplo un tipo de
clima) sabiendo que se report la presencia de la
especie. En trminos prcticos es la proporcin de
los pixeles de ocurrencia que se encuentran en las
reas que presentan la condicin y, P(C|) es la
probabilidad que un sitio presente cierta condicin
sabiendo que no se report la presencia de la
especie, lo cual se calcula como la proporcin de
los pixeles de pseudo-ausencia que se encuentran
en las reas que presentan la condicin.
Cuando el cumplimiento de la condicin tiende a
aumentar la probabilidad de ocurrencia de la
especie, el valor del peso w+ es positivo. Al
contrario, cuando la condicin tiende a disminuir la
probabilidad del evento, el peso w+ es negativo. El
clculo de la probabilidad condicional tomando en
cuenta varias condiciones se basa en la suma de los
pesos de evidencia asociados a estas condiciones
con el supuesto que los factores ambientales no
presentan correlacin entre ellos. Una descripcin
ms detallada del mtodo de los pesos de evidencia

y su implementacin en Dinamica se encuentra en


Soares Filho et al. (2010).

etapa, se elabora un mapa de probabilidad de


ocurrencia de la especie.

Para modelar el nicho en DINAMICA EGO, se


construy un modelo usando una secuencia de
operadores de geoprocesamiento llamados
functores ver Figura 1.

2.1 Evaluacin de los mapas de distribucin

Figura 1. Flujo de operaciones organizado en cuatro


etapas para la modelacin del nicho ecolgico en
Dinamica EGO.

Este flujo de operaciones puede dividirse en


cuatro etapas. En la primera etapa se incorporan
los insumos del modelo que son las variables
espaciales: los mapas de ocurrencia y pseudoausencia de la especie B. variegatus y los mapas
correspondientes a cada factor ambiental (variables
explicativas) todo en formato raster. En la segunda
etapa, se llev a cabo el clculo de los rangos para
la transformacin de las variables continuas en
categricas debido a que los pesos de evidencia se
calculan para categoras. En esta etapa el modelo
selecciona, para cada variable, los intervalos ms
idneos para la transformacin de las variables. En
la tercera etapa, se determinan los pesos de
evidencia. En esta etapa, es posible visualizar la
relacin entre las variables explicativas y los pesos
de evidencia y eventualmente editar (modificar)
sus valores. De esta manera es posible ajustar el
nivel de integracin del conocimiento experto
desde un enfoque totalmente estadstico basado en
los datos (sin modificar los valores de los pesos
calculados de forma automtica) a un enfoque
completamente basado en conocimiento experto de
la especie en cuestin (modificacin importante o
total de los pesos por los expertos). En el presente
estudio, para fines comparativos con MaxEnt, se
utiliz el enfoque basado en los datos nicamente,
es decir el valor de los pesos se determin
estadsticamente de forma automtica sin
incorporar conocimiento ecolgico sobre las
preferencias de la especie. Finalmente en la cuarta

Los mapas de probabilidad fueron evaluados


utilizando el anlisis ROC con los 35 registros de
ocurrencia que no fueron considerados en la etapa
de entrenamiento de los modelos. Este anlisis
permite evaluar la coincidencia entre los datos de
presencia y pseudo-ausencia de la especie y las
probabilidades de presencia elaboradas por el
modelo. Para ello, se grafican la tasa de falsos
positivos (eje horizontal) y de verdaderos positivos
(eje vertical) que son respectivamente, para
diferentes niveles de umbralizacin en el valor de
probabilidad, la proporcin de celdas de ausencia
identificas como presencia y de celdas de presencia
identificadas como tal. Con base en la grfica,
llamada curva ROC, se puede calcular el rea
Bajo la Curva (ABC, rea debajo de la lnea negra
en la figura a continuacin) (Figura 2).

Figura 2. Curva ROC, ABC y ABC parcial.


Un modelo con un alto poder predictivo tendr un
valor de ABC de uno o cercano a uno, un modelo
sin poder predictivo (modelo con un valor
constante o con valores aleatorio) tendr un valor
de ABC de 0.5. Un valor inferior a 0.5 indica un
modelo sistemticamente errneo en el cual los
valores de probabilidad altos tienden a asociarse
con la ausencia y los bajos con la presencia de la
especie.
El ABC puede calcularse para porciones
especficas de la curva ROC (ABC parcial). Se

calcul el AUC parcial para el rango 0.95-1 en el


eje de la tasa de falsos positivos, es decir para las
bajas probabilidades de acuerdo a las
recomendaciones de Peterson et al. (2008). El
ABC parcial se normaliz para poder interpretarse
de la misma forma que el ABC. En la comparacin
de dos modelos se pueden emplear pruebas
basadas en un mtodo de remuestreo o bootstrap
en ingls para evaluar si la diferencia de los
valores de ABC es estadsticamente significativa.
Por otra parte se evalo tambin la tasa de
omisin para ambos enfoques de modelacin
usando los mapas de probabilidad umbralizados en
el valor de probabilidad ms bajo que corresponde
a un sitio de ocurrencia de los puntos de
entrenamiento. Para ellos se determin, con base
en un primer modelo, el rea mnima de presencia
que permite incluir todos los sitios de ocurrencia
con los cuales fue entrenado el modelo (ajuste de
la superficie de presencia para cero omisin).
Despus se ajust esta rea al segundo modelo y se
midi la tasa de omisin.
Por ejemplo, se
determin el rea mnima de distribucin para
obtener cero omisin con base en el mapa de
probabilidad de MaxEnt. Posteriormente, se
umbraliz el mapa de probabilidad de DINAMICA
EGO para obtener la misma superficie y se evalu
la proporcin de los puntos de ocurrencia dentro
del rea mapaeada con de presencia. Este proceso
fue repetido invirtiendo el papel de los mapas
obtenidos por ambos mtodos.

3 RESULTADOS
La figura 3 representa el mapa de probabilidad de
la presencia de Bradypus variegatus para la
primera rplica y ambos modelos. Los resultados
indican que las predicciones de ambos modelos
fueron significativamente mejores que el azar, con
valores promedios de AUC de 0.8251 y AUC
parcial de 0.9779 y para MaxEnt de 0.8882 y
0.9527 respectivamente. Como se puede observar
en las Tablas 1 y 2, los valores de ABC obtenidos
por MaxEnt son significamente superiores a los de
los pesos de evidencia (p < 0.05) en nueve de las
diez rplicas. En cambio, hay una diferencia
significativa para el ABC parcial solo para una
rplica.

Figura 3. Mapas de probabilidad de B. variegatus


para la primera rplica en ambos modelos.
Tabla 1. Valores de ABC y ABC parcial de los
modelos obtenidos con el mtodo de los pesos de
evidencia (Dinamica) y mxima entropa (MaxEnt)
Particin
datos

1
2
3
4
5
6
7
8
9
Promedio

Pesos de evidencia
(Dinamica)
ABC
PARCIAL

0.9837
0.9651
0.9848
0.9609
0.9722
0.9820
0.9804
0.9835
0.9836
0.9779

ABC

0.8428
0.8286
0.8218
0.8216
0.8049
0.8329
0.8173
0.8167
0.8490
0.8159

Maxima Entropa
(MaxEnt)
ABC
PARCIAL

0.9332
0.9727
0.9286
0.9758
0.9254
0.9342
0.9439
0.9722
0.9568
0.9851

ABC

0.8905
0.8982
0.8771
0.8926
0.8768
0.8770
0.8883
0.8908
0.8815
0.9100

Tabla 2. Nivel de significancia de p en la prueba


estadstica sobre la diferencia de los valores de ABC y
ABC parcial de los dos modelos comparados.
Particin datos

ABC
p-value

ABC PARCIAL
p-value

1
2
3
4
5
6
7
8
9
10

0.0032
0.0035
0.0000
0.0000
0.0064
0.0942
0.0000
0.0032
0.0323
0.0001

0.1208
0.7445
0.0137
0.3424
0.0593
0.0702
0.3701
0.1587
0.0609
0.9523

En general, MaxEnt presenta tasas de omisin


menores. Sin embargo, las altas tasas de omisin
de Dinamica EGO se deben a un mal ajuste de la
superficie (rea inferior a la de MaxEnt) (Tablas 3
y 4). Esto es debido a que Dinamica EGO no tiene
valores de probabilidad continuos ya que estas de
obtienen a partir de mapas categricos.
Tabla 3. Tasa de omisin del mapa obtenido con el
programa MaxEnt ajustado a la superficie del mapa
obtenido con los pesos de evidencia (esto va al re.
Particin
datos

MaxEnt
Ajustado a Dinamica en cero omisin
rea (pixeles)
Dinamica

1
2
3
4
5
6
7
8
9
10

378369
479902
427395
449416
458764
389468
463836
462688
370741
480501

MaxEnt

Diferencia

331131
436315
382287
402928
416409
342364
419730
422558
375999
437888

-0.12
-0.09
-0.11
-0.10
-0.09
-0.12
-0.10
-0.09
0.01
-0.09

%
Omisin

1.23
0
0
1.23
1.23
0
0
0
0
0

Tabla 4. Tasa de omisin del mapa obtenido con los


pesos de evidencia y ajustado a la superficie del mapa
obtenido con MaxEnt.
Particin
datos

Dinamica EGO
AJUSTADO A MaxEnt CERO OMISION
rea (pixeles)
Dinamica

1
2
3
4
5
6
7
8
9
10

485813
463911
439186
271237
218342
407041
214473
475721
345764
358733

MaxEnt

Diferencia

%
Omisin

427751
415161
382619
443573
487442
352578
499835
420936
338291
309127

0.14
0.12
0.15
-0.39
-0.55
0.15
-0.57
0.13
0.02
0.16

1.23
1.23
0
9.87
13.58
0
14.81
9.87
1.23
1.23

4 DISCUSIN Y CONCLUSIN
Los resultados de este estudio muestran que los
modelos de MaxEnt presentan un ABC ms alta
que los obtenidos por el mtodo de los pesos de
evidencia, sin embargo no se encontr diferencia
significativa en las ABC parciales de ambos
modelos.
Si bien MaxEnt permite elaborar mapas donde las
altas probabilidades coinciden ms con los puntos
de ocurrencia, cuando se umbraliza el mapa en
funcin de las probabilidades ms bajas para
generar los mapas de presencia, existe poca
diferencia entre ambos modelos.
Una prctica comn en la modelacin del nicho
ecolgico es la elaboracin de los mapas de
probabilidad con un enfoque totalmente basado en
los datos (GARP o MaxEnt). Posteriormente el
mtodo implica su umbralizacion para generar un
mapa de presencia y finalmente la edicin (recorte)
de estos mapas con base en conocimiento experto.
Por lo que la integracin del conocimiento experto
interviene hasta el final del proceso ya que es
difcil, sino imposible, integrarla durante la
proceso de modelacin. En el mtodo de los pesos
de evidencia, se puede visualizar la relacin entre
los factores ambientes y los valores de los pesos de
evidencia y eventualmente editar (modificar) sus
valores. De esta manera es posible integrar
conocimiento experto de forma explcita durante el
proceso de modelacin y en el espacio de los
factores ambientales y no en la edicin del mapa.
Este enfoque es ms cercano a los conceptos de
nicho ecolgico y ser el objeto de futuras
investigaciones.
En este estudio de caso, los pesos de evidencia
permitieron la obtencin de mapas de probabilidad
comparables con los obtenidos a travs de
herramientas muy reconocidas en la modelacin
del nicho ecolgico (MaxEnt). Presenta la ventaja
adicional de poder integrar conocimiento experto
de forma sencilla, por lo cual podra ser un mtodo
de modelacin complementario a un enfoque como
MaxEnt.
An queda por evaluar el desempeo de Dinamica
EGO en diferentes situaciones (umbrales de corte,

uso de vegetacin potencial, con pocos de registros


de ocurrencia y registros sesgados) as como el
aporte del conocimiento experto.

AGRADECIMIENTOS
Este estudio se llev a cabo en el mbito del
proyecto Elaboracin y Aplicacin de modelos
prospectivos de cambio de cobertura/uso del suelo
(Programa de Apoyo a Proyectos de Investigacin
e Innovacin Tecnolgica PAPIIT-UNAM clave
RR113511).

REFERENCIAS
Anderson, R.P., Handley Jr., C.O., 2001. A new species
of threetoed sloth (Mammalia: Xenarthra) from
Panama, with a review of the genus Bradypus. Proc.
Acad. Biol. Soc. Wash. 114: 1-33.
New, M., Hulme, M., Jones, P., 1999. Representing
twentiethcentury space-time climate variability. Part
1.Development of a 196190 mean monthly
terrestrial climatology. J. Clim. 12: 829-856.
Phillips, S.J., Anderson, R.P., Schapire, R.E., 2006
Maximum entropy modeling of species geographic
distributions. Ecol. Model. 190: 231-259.

Peterson, A.T., Pape, M., Sobern, J. 2008. Rethinking


receiver
operating
characteristic
analysis
applications in ecological niche modelling. Ecol.
Model.213:63-72.
Mas, JF, B. Soares Filho, R.G. Pontius Jr, M. Farfn y
H. Rodrigues, 2013, A suite of tools for ROC
analysis of spatial models ISPRS Int. J. Geo-Inf.,
disponible en www.mdpi.com/journal/ijgi/
Soares-Filho, B.S.; Pennachin, C.L; Cerqueira, G. 2002.
Dinamicaa stochastic cellular automata model
designed to simulate the landscape dynamics in an
Amazonian colonization frontier. Ecol. Model. 154:
217235.
Soares-Filho, B.S.; Moutinho, P.; Nepstad, D.;
Anderson, A.; Rodrigues, H.; Garcia, R.; Dietzsch,
L.; Merry, F.; Bowman, M.; Hissa, L.; Silvestrini,
R.; Maretti, C. 2010. Role of Brazilian Amazon
protected areas in climate change mitigation. Proc.
Natl. Acad. Sci. U. S. A. (PNAS). 107: 1082110826.
Soares-Filho, B.S.; Rodrigues, H.O.; Costa, W.L.S.
2009. Modelamiento de Dinmica Ambiental con
Dinamica EGO, Centro de Sensoriamento
Remoto/Universidade Federal de Minas Gerais. Belo
Horizonte, Brazil. 4 de octubre 2010. Online:
http://www.csr.ufmg.br/dinamica/

You might also like