You are on page 1of 31

Una Breve Gua Didctica sobre MaxEnt

Por Steven Phillips, AT T !esearch

Esta "ua didctica da una introducci#n bsica para el uso del MaxEnt, pro"ra$a para el $odelado de la distribuci#n "eo"r%ica de las especies en base a la $xi$a entropa, escrito por Steven Phillips, Miro Dudi& ' !ob Schapire, con el apo'o de los laboratorios de investi"aci#n de AT T, la Universidad de Princeton ' el (entro para la Biodiversidad ' (onservaci#n del Museo A$ericano de )istoria *atural+ Para $s detalles sobre la teora del $odelado en base a $xi$a entropa, as co$o sobre la descripci#n de los datos e$pleados ' los tipos principales de anlisis estadsticos usados a,u, veaSteven .+ Phillips, !obert P+ Anderson and !obert E+ Schapire, Maximum entropy modeling of species geographic distributions+ Ecological Modelling, /ol 0123456 pp 7405781, 7229+ Un se"undo artculo, el cual describe las caractersticas a"re"adas $s reciente$ente al pro"ra$a MaxEnt esSteven .+ Phillips and Miroslav Dudi&, Modeling of species distributions with Maxent: new extensions and a comprehensive evaluation+ Ecography, to appear+ :os datos a$bientales ,ue usare$os consisten en datos cli$ticos ' de elevaci#n de Suda$;rica, ade$s de una capa de ve"etaci#n potencial+ *uestra especie de $uestra ser Bradypus variegatus, la Pere<a de Tres Dedos+ Esta "ua didctica asu$ir ,ue todos los archivos de datos estarn locali<ados en el $is$o directorio co$o archivos del pro"ra$a MaxEnt= de otro $odo, Usted deber usar la ruta >i+e+, c-?data?$axent?tutorial@ delante de los no$bres de los archivos e$pleados a,u+

(o$en<ando
Descar"ando
El programa consiste de un archivo jar, maxent.jar, el cual puede ser usado en cualquier computador que tenga Java versin 1.4 o posterior. Maxent puede ser descargado, junto con la literatura asociada, desde www.cs.princeton.edu/ schapire/maxent! el am"iente de tiempo de ejecucin de Java puede o"tenerse desde Aava+sun+co$3Aavase3doBnloads. #i $sted est% usando &indows 'como asumimos(, $sted de"er)a descargar tam"i*n el archivo maxent."at + guardarlo en el mismo directorio de maxent.jar. El sitio we" tiene un archivo llamado ,readme.txt-, el cual contiene instrucciones para instalar el programa en su computador.

Cniciando
Si Usted est usando Microso%t DindoBs, si$ple$ente ha"a clic sobre el archivo $axent+bat+ De otro $odo, escriba EAava 5$x807$ 5Aar $axent+AarE en una ventana de co$andos >donde E807E puede ree$pla<arse por la cantidad de $e"ab'tes de $e$oria ,ue Usted ,uiera poner a disposici#n del pro"ra$a@+ Aparecer la si"uiente pantalla-

Para e%ectuar una corrida, Usted deber proporcionar un archivo ,ue conten"a las localidades de presencia >F$uestrasG@, un directorio ,ue conten"a las variables a$bientales ' un directorio de salida+ En nuestro caso, las localidades de presencia estn en el archivo Fsa$ples?brad'pus+csvG, las capas a$bientales estn en el directorio Fla'ersG, ' las salidas irn en el directorio FoutputsG+ Usted puede in"resar estas localidades $anual$ente, o nave"ando para buscarlas+ Mientras est nave"ando para buscar las variables a$bientales, recuerde ,ue Usted est buscando el directorio ,ue las contiene, no necesita nave"ar hasta lle"ar a los archivos en dicho directorio+ El pro"ra$a se ve as una ve< in"resados los archivos para Bradypus-

El archivo Fsa$ples?brad'pus+csvG contiene las localidades de presencia en %or$ato +csv+ :as pri$eras lneas son co$o si"uenspecies,longitude,latitude "rad+pus.variegatus,/01.4,/12.3433 "rad+pus.variegatus,/01.3433,/12.3433 "rad+pus.variegatus,/01.1333,/10.4 "rad+pus.variegatus,/03.0005,/15.41 "rad+pus.variegatus,/03.41,/15.4

Pueden haber $Hltiples especies en el $is$o archivo de $uestras, en cu'o caso $s especies aparecern en el panel Aunto con Bradypus+ Se pueden usar siste$as de coordenadas di%erentes a latitud ' lon"itud, sie$pre ' cuando se considere ,ue los archivos de $uestras ' las capas a$bientales usen el $is$o siste$a de coordenadas+ :a coodenada FxG >lon"itud, en nuestro caso@ debe venir antes de la coordenada F'G >latitud@ en el archivo de $uestras+ Si los datos de presencia tienen re"istros duplicados >$Hltiples re"istros de la $is$a especie en la $is$a cuadrcula@, ;stos pueden ser eli$inados haciendo clic en el bot#n FSettin"sG >F(on%i"uraci#nG@ ' seleccionando FDelete duplicatesG >FBorrar duplicadosG@+

El directorio Fla'ersG >FcapasG@ contiene un nH$ero de cuadrculas >raster "rids@ en AS(CC >en el %or$ato +asc de ES!C@, cada uno de los cuales describe una variable a$biental+ Todas las cuadrculas deben tener los $is$os l$ites "eo"r%icos ' ta$aIo de celda >i+e+ todos los encabe<ados de los archivos AS(CC deben coincidir per%ecta$ente unos con otros@+ Una de nuestras variables, Fecore"G, es una variable cate"#rica ,ue describe los tipos de ve"etaci#n portenciales+ :as cate"oras deben ser indicadas por nH$eros, $s ,ue por letras o palabras+ Usted debe decirle al pro"ra$a cuales variables son cate"#ricas, co$o se ha hecho anterior$ente en el cuadro+

E%ectuando una corrida


Si$ple$ente presione el bot#n F!unG >F(orrerG@+ Un $onitor de pro"reso describe los pasos ,ue estn siendo to$ados+ Despu;s de ,ue las capas a$bientales estn car"adas ' los pri$eros pasos se han to$ado, el pro"reso hacia el entrena$iento del $odelo de $axent se $uestra as-

:a "anancia se relaciona estrecha$ente con la desviaci#n, una $edida de precisi#n de aAuste usada "eneral$ente tanto en $odelos aditivos co$o lineales+ (o$ien<a en cero e incre$enta hacia una asntota durante la corrida+ Durante este proceso, Maxent "enera una distribuci#n de probabilidad de los pxeles en la cuadrcula, co$en<ando desde la distribuci#n uni%or$e $eAorando reiterada$ente el aAuste de los datos+ :a "anancia se de%ine co$o la probabilidad lo"art$ica pro$edio de la $uestras de presencia, $enos una constante ,ue hace ,ue la distribuci#n uni%or$e ten"a cero "anancia+ Al %inal de la corrida, la "anancia indica ,u; tan concentrado est el $odelo alrededor de las $uestras de presencia= por eAe$plo, si la "anancia es dos, esto si"ni%ica ,ue la verosi$ilitud pro$edio de las $uestras de presencia es exp>7@ J K,6 veces $s alta ,ue un pxel aleatorio de %ondo+ *ote ,ue Maxent no est calculando directa$ente la Fprobabilidad de ocurrenciaG+ :a probabilidad ,ue el pro"ra$a le asi"na a cada pxel es tpica$ente $u' pe,ueIa, dado ,ue los valores deben su$ar uno entre todos los pxeles en la cuadrcula >aun,ue nosotros re"resare$os a este punto cuando co$pare$os %or$atos de salida@+ :a corrida produce $Hltiples archivos de salida, de los cuales el $s i$portante para anali<ar su $odelo es un archivo ht$l lla$ado Fbrad'pus+ht$lG+ Parte de este archivo proporciona los ndices para las otras salidas, co$o esto-

Mirando una predicci#n


Para ver otras salidas >$s interesantes@ ,ue pueda haber en brad'pus+ht$l, activare$os un par de opciones ' correre$os nueva$ente el $odelo+ Presione el bot#n FMa&e pictures o% predictionsG >F)acer una i$a"en de las prediccionesG@, lue"o ha"a clic en FSettin"sG, ' escriba F78G en la entrada F!ando$ test percenta"eG >FPorcentaAe de prueba aleatorioG@+ :ue"o, presione nueva$ente el bot#n F!unG+ :ue"o de co$pletada la corrida, el archivo brad'pus+ht$l contiene una i$a"en co$o esta-

:a i$a"en usa los colores para indicar la probabilidad ,ue las condiciones son adecuadas, el roAo indica una alta probabilidad de condiciones adecuadas para la especie, verde indica las condiciones tpicas de a,u;llos lu"ares donde la especie se encuentra, ' so$bras $s tenues de a<ul indican una baAa probabilidad de condiciones adecuadas+ Para el caso de Bradypus, ve$os ,ue las condiciones adecuadas predichas co$o alta$ente probables abarcan la $a'or parte de las tierras baAas de (entroa$;rica, las tierras baAas hH$edas del noroeste de Suda$;rica, la cuenca del A$a<onas, islas del (aribe ' "ran parte de la %oresta Atlntica en el sureste de Brasil+ El indicado es un archivo de i$a"en >+pn"@ al cual Usted puede si$ple$ente hacerle clic >en DindoBs@ o

abrir en la $a'ora de los pro"ra$as de procesa$iento de i$"enes+ Si Usted ,uiere copiar estas i$"enes o si ,uiere abrirlas con otro pro"ra$a, encontrar a los archivos +pn" en el directorio lla$ado FplotsG ,ue ha sido creado co$o una salida durante la corrida+ :os puntos de prueba son una $uestra aleatoria to$ada de las localidades de presencia de la especie+ :a $is$a $uestra aleatoria es usada cada ve< ,ue Usted corre Maxent sobre el $is$o conAunto de datos, a $enos ,ue Usted seleccione la opci#n Frando$ seedG en el $enH de con%i"uraci#n+ De $odo alterno, datos de prueba alternos para una o $s especies pueden proveerse en un archivo aparte, dndole el no$bre de FTest sa$ple %ileG >FArchivo de $uestra de pruebaG@ en el $enH de con%i"uraci#n+

Formatos de salida
Maxent sustenta tres %or$atos de salida para los valores del $odelo- crudo, cu$ulativo ' lo"stico+ Pri$ero, la salida cruda la constitu'e el $odelo exponencial de Maxent per se+ Se"undo, el valor cu$ulativo correspondiente a un valor crudo de r es el porcentaAe de la distribuci#n de Maxent cu'o valor crudo es al $enos r+ :a salida cu$ulativa se interpreta $eAor en t;r$inos de la tasa de o$isi#n predicha- Si con%i"ura$os un u$bral cu$ulativo de c, la predicci#n binaria resultante tendr una tasa de o$isi#n de cL sobre las $uestras deducidas a partir de la $is$a distribuci#n de Maxtent ' podre$os predecir una tasa de o$isi#n si$ilar para $uestras deducidas a partir de la distribuci#n de la especie+ Tercero, si c es el exponencial de la entropa de la distribuci#n de Maxent, entonces el valor lo"stico correspondiente a un dato crudo de r es cr3>0Mcr@+ Esta es una %unci#n lo"stica, por,ue los valores crudos son una %unci#n exponencial de las variables a$bientales+ :os tres %or$atos de salida estn relacionados de $anera $on#tona, pero estn a escalas di%erentes ' tienen di%erentes interpretaciones+ :a salida por de%ecto es lo"stica, lo cual es $s %cil de conceptuali<ar- Proporciona un esti$ado entre cero ' uno de probabilidad de presencia+ *ote ,ue la probabilidad de presencia depende de detalles del diseIo de $uestreo, tales co$o el ta$aIo de la parcela ' >para or"anis$os alta$ente $#viles@ tie$po de observaci#n= la salida lo"stica esti$a la probabilidad de presencia asu$iendo ,ue el diseIo de $uestreo es tal ,ue las localidades de presencia tpicas tienen una probabilidad de presencia de alrededor de 2,8+ :a i$a"en antes expuesta del $odelo de Bradypus usa el %or$ato lo"stico+ (o$parativa$ente, se obtiene la si"uiente i$a"en cuando se usa el %or$ato crudo-

*ote ,ue he$os usado una escala lo"art$ica para los colores+ Una escala lineal proporcionara una i$a"en $a'or$ente a<ul con unos pocos pxeles roAos >Usted puede veri%icar esto deseleccionando F:o"scale picturesG en el $enH de con%i"uraci#n@ pues el %or$ato crudo tpica$ente le otor"a valores relativa$ente altos a un pe,ueIo nH$ero de lu"ares N lo cual puede pensarse co$o un arte%acto de la salida cruda dada por una distribuci#n exponencial+

Al e$plear el %or$ato cu$ulativo se obtiene la si"uiente i$a"en-

(o$o en el caso de la salida cruda, he$os usado una escala lo"art$ica para colorear la i$a"en para resaltar las di%erencias entre los valores $s baAos+ :a salida cu$ulativa puede ser interpretada co$o una predicci#n de las condiciones adecuadas para la especie por arriba de un u$bral en el ran"o aproxi$ado de 0572 >o del a$arillo al naranAa en ;sta i$a"en@, dependiendo del nivel de o$isi#n predicho ,ue es aceptable para la aplicaci#n+

Anlisis estadstico
El F78G ,ue introduAi$os en el Frando$ test percenta"eG le indica al pro"ra$a ,ue debe esco"er de $anera aleatoria ' apartar el 78L de los re"istros de $uestras para usarlos en la prueba+ Esto per$ite al pro"ra$a e%ectuar al"unos anlisis estadsticos si$ples+ :a $a'or parte de los anlisis e$pleados usan un u$bral para hacer una predicci#n binaria, estando las condiciones adecuadas por arriba de dicho u$bral ' las inadecuadas por debaAo+ :a pri$era "r%ica $uestra co$o la o$isi#n de prueba ' la de entrena$iento as

co$o el rea predicha varan con la esco"encia del u$bral cu$ulativo, co$o se v; en la si"uiente "r%ica-

A,u ve$os ,ue la o$isi#n sobre las $uestras de prueba se aAusta $u' bien a la tasa de o$isi#n predicha, la tasa de o$isi#n para los datos de prueba de la distribuci#n de Maxent por s $is$a+ :a tasa de o$isi#n predicha es una lnea recta, de%inida por el %or$ato de salida cu$ulativo+ En al"unas situaciones, la lnea de la tasa de o$isi#n se ubica por debaAo de la lnea de o$isi#n- Una ra<#n co$Hn para ello es ,ue los datos de prueba ' aprendi<aAe no sean independientes, por eAe$plo si ;stos derivan de los $is$os datos de presencia autocorrelacionados espacial$ente+ :a si"uiente "r%ica nos $uestra la curva operada por el receptor >!O(, por sus si"las en in"l;s@ tanto para los datos de entrena$iento co$o para los de prueba, $ostrada abaAo+ Ta$bi;n se proporciona el rea baAo la curva >AU(, por sus si"las en in"l;s@ !O(= si ha' datos de prueba disponibles, el error estndar del AU( para ;stos se darn posterior$ente en la p"ina Beb+

:as lneas a<ul ' roAa sern id;nticas si Usted usa los $is$os datos para el entrena$iento ' para la prueba+ Si Usted divide los datos en dos porciones, una para el entrena$iento ' otra para la prueba, es nor$al ,ue la lnea roAa >entrena$iento@ $uestre una $a'or AU( ,ue la lnea a<ul >prueba@+ :a lnea roAa >entrena$iento@ $uestra el FaAusteG del $odelo a los datos de entrena$iento ' es la aut;ntica prueba de la capacidad ,ue tienen los $odelos de predecir+ :a lnea tur,uesa $uestra lo ,ue Usted esperara si su $odelo no %uese $eAor ,ue el a<ar+ Si la lnea a<ul >la lnea de prueba@ se ubicase por debaAo de la lnea tur,uesa, entonces esto indicara ,ue su $odelo se dese$peIa peor de lo ,ue lo hara un $odelo aleatorio+ Mientras $s cerca se encuentre la lnea a<ul del tope superior i<,uierdo, $eAor ser el $odelo para predecir las presencias contenidas en la $uestra de prueba de los datos+ :a si"uiente es una buena re%erencia de inicio para obtener in%or$aci#n $s detallada sobre las estadsticas relacionadas con las AU(- Pieldin", A+)+ Bell, .+P+ >722K@ A revieB o% $ethods %or the assess$ent o% prediction errors in conservation presence3 absence $odels+ Environ$ental (onservation 76>0@- 4Q561+ Dado ,ue nosostros conta$os sola$ente con datos de presencia ' no con datos de ausencia, F%ractional predicted areaG >Fel rea %raccionada predichaG o la %racci#n del total del rea de estudio predicha presentes@ es e$pleada en lu"ar de la tasa $a'or$ente usada >la %racci#n de ausencias predichas presentes@+ Para pro%undi<ar en la discusi#n sobre esta alternativa, vea el artculo aparecido en Ecolo"ical Modellin" $encionado en la pri$era p"ina de esta "ua+ Es i$portante notar ,ue los valores de las AU( tienden a ser $a'ores para especies con ran"os estrechos en relaci#n al rea estudiada descrita por los datos a$bientales+ Esto no necesaria$ente indica ,ue los $odelos sean $eAores= por el contrario, este co$porta$iento es un arte%acto de las estadsticas de las AU(+

Si los datos de prueba estan disponibles, el pro"ra$a auto$tica$ente calcula la si"ni%icancia estadstica de la predicci#n, usando una prueba bino$ial de o$isi#n+ Para Bradypus, esta da-

Para in%or$aci#n $s detallada sobre la estadstica bino$ial, vea el artculo aparecido en Ecolo"ical Modellin" arriba $encionado+

R(ules variables i$portan $sS


Una aplicaci#n natural del $odelado de la distribuci#n de especies es contestar la pre"unta de Rcules son las variables $s i$portantes para la especie cu'a distribuci#nes est siendo $odeladaS )a' $s de una $anera para contestar esto= a,u delineare$os las $aneras posibles en las cuales Maxent puede ser usado para ello+

Mientras se est entrenando al $odelo Maxent, pode$os rastrear cules son las variables a$bientales ,ue contribu'en en $a'or $edida al $odelo+ (ada paso del al"orit$o de Maxent incre$enta la "anancia del $odelo $ediante la $odi%icaci#n del coe%iciente para una Hnica caracterstica= el pro"ra$a asi"na el incre$ento en la "anancia a la>s@ variable>s@ a$biental>es@ de las cuales depende dicha caracterstica+ )aciendo una conversi#n a porcentaAes al %inal del proceso de entrena$iento, obtene$os la si"uiente tabla-

Estos valores de contribuci#n porcentual Hnica$ente estn de%inidos de $anera heurstica- ellos dependen de la ruta particular ,ue usa el c#di"o Maxent para obtener la soluci#n opti$a ' un al"orit$o di%erente podra obtener la $is$a soluci#n por $edio de una ruta distinta, lo cual resultara en valores de contribuci#n porcentual di%erentes+ Ms aun, cuando ha' variables a$bientales alta$ente correlacionadas, las contribuciones porcentuales deberan ser interpretadas con precauci#n+ En nuestro eAe$plo de Bradypus, la precipitaci#n anual est alta$ente correlacionada con la precipitaci#n de octubre ' Aulio+ Aun,ue la tabla arriba expuesta $uestra ,ue Maxent us# la variable Fprecipitaci#n de octubreG $s ,ue cual,uier otra, pero us# $u' poco a la precipitaci#n anual, esto no necesaria$ente i$plica ,ue la precipitaci#n de octubre sea $ucho $s i$portante para la especie ,ue la precipitaci#n anual+

A %in de esti$ar cuales son las variables $s i$portantes en el $odelo, pode$os correr ta$bi;n una prueba de Aac&&ni%e seleccionando FDo Aac&&ni%e to $easure variable i$portantG >F)acer un Aac&&ni%e para $edir la i$portancia de la variableG@ en la casilla de veri%icaci#n+ (uando presiona$os nueva$ente el bot#n F!unG, se crea un conAunto de $odelos+ En cada oportunidad se exclu'e una variable ' se crea un $odelo con las re$anentes+ Entonces se crea un $odelo usando cada variable de $anera aislada+ Adicional$ente, se crea un $odelo usando todas las variables, tal ' co$o se hi<o anterior$ente+ :os resultados de la prueba de Aac&&ni%e aparecen co$o tres "r%icos de barras en los archivos Fbrad'pus+ht$lG ' el pri$ero de ;stos es $ostrado abaAo+

/e$os ,ue si Maxent usa sola$ente pre9012Tl0 >precipitaci#n pro$edio de enero@ casi no obtiene "anancia, as ,ue la variable no es >por s $is$a@ Htil para esti$ar la distribuci#n de Bradypus+ Por otra parte, la precipitaci#n de octubre >pre9012Tl02@ per$ite un aAuste ra<onable$ente bueno a los datos de entrena$iento+ :as barras a<ul claro su"ieren ,ue nin"una variable contiene una cantidad sustancial de in%or$aci#n Htil, ,ue no est; contenida en las otras variables, dado ,ue no decrece de $anera considerable la "anancia del entrena$iento cuando se o$ite una variable dada+ El archivo brad'pus+ht$l tiene dos "r%icas adicionales de Aac&&ni%e, las cuales prueban la "anancia o el AU( en lu"ar de la "anancia del entrena$iento, co$o se $uestra abaAo+

:a co$paraci#n de las tres "r%icas de Aac&&ni%e plots puede ser $u' in%or$ativa+ :a "r%ica correspondiente al AU( $uestra ,ue la precipitaci#n anual >pre9012Tann@ es la variable ,ue por si sola predice de $anera $s e%ectiva la distribuci#n de los datos de %recuencia ,ue %ueron puestos de lado para usarlos co$o prueba, cuando el dese$peIo para la predicci#n es $edido $ediante el AU(, aun cuando apenas %ue usado por el $odelo construido usando todas las variables+ :a i$portancia relativa de la precipitaci#n

anual ta$bi;n incre$enta en la "r%ica de la "anancia de la prueba+ Adicional$ente, en las "r%icas de la "anancia de la prueba ' de AU(, al"unas de las barras a<ul claro >especial$ente a,uellas ,ue representan las variables de precipitaci#n $ensual@ son $s lar"as ,ue la barra roAa, indicando ,ue el dese$peIo para la predicci#n $eAora cuando las variables correspondientes no son usadas+ Esto nos dice ,ue las variables de precipitaci#n $ensual a'udan a ,ue Maxent obten"a un buen aAuste a los datos de entrena$iento, pero la variable precipitaci#n anual "enerali<a $eAor, dando resultados co$parativa$ente $eAores sobre los datos de prueba puestos aparte+ Dicho de otra $anera, los $odelos hechos con las variables de precipitaci#n $ensual parecen ser $enos trans%eribles+ Esto es i$portante si nuestro obAetivo es trans%erir el $odelo, por eAe$plo aplicndolo a variables cli$ticas %uturas a %in de esti$ar su distribuci#n %utura baAo el escenario de ca$bio cli$tico+ Tiene sentido ,ue los valores de precipitaci#n $ensuales sean $enos trans%eribles- las condiciones potencial$ente adecuadas para Bradypus no dependern de los valores precisos de la precipitaci#n en deter$inados $eses, sino en la precipitaci#n $edia anual ' ,ui<s en la consistencia de las precipitaciones o la carencia de periodos prolon"ados de se,ua+ (uando $odela$os a una escala continental, probable$ente ocurrirn ca$bios en los lapsos precisos de los patrones de estacionalidad de la precipitaci#n, a%ectando la precipitaci#n $ensual pero no las condiciones adecuadas para Bradypus+ En "eneral, es $eAor usar variables ,ue probable$ente sean $s relevantes para la especie estudiada+ Por eAe$plo, el sitio Beb de Dorldcli$ >BBB+Borldcli$+or"@ provee las variables FBCO(:CMG, inclu'endo variables derivadas tales co$o Fprecipitaci#n en el tri$estre $s hH$edoG, $s ,ue valores $ensuales+ Una Hlti$a nota sobre las salidas de Aac&&ni%e- la "r%ica de la "anancia de la prueba $uestra ,ue el $odelo hecho sola$ente con la precipitaci#n de enero >pre9012Tl0@ "enera una "anancia ne"ativa de la prueba+ Esto si"ni%ica ,ue el $odelo es li"era$ente peor ,ue un $odelo nulo >i+e+, una distribuci#n uni%or$e@ para predecir la distribuci#n de las presencias puestas aparte para la prueba+ Esto puede considerarse co$o una evidencia $s de ,ue los valores de precipitaci#n $ensuales no son la $eAor opci#n co$o variables para la predicci#n+

R(#$o depende la predicci#n de las variablesS


Ahora presione F(reate response curvesG >F(rear curvas de respuestaG@, deseleccione la opci#n Aac&&ni%e ' corra el $odelo nueva$ente+ Esto produce la si"uiente secci#n a ser aIadida al archivo Fbrad'pus+ht$lG-

(ada una de las i$"enes $iniatura puede ser seccionada >haciendo clic sobre ellas@ para obtener una "r%ica $s detallada ' si Usted desea copiar o abrir estas "r%icas con otro pro"ra$a, los archivos +pn" pueden encontrarse en el directorio FplotsG+ Mirando a vap9012Tann, ve$os ,ue la respuesta es baAa para valores de vap9012Tann en el ran"o de 05722, pero alta para valores en el ran"o de 7225422+ El valor $ostrado en el eAe de las F'G es la probabilidad predicha de condiciones %avorables, tal ' co$o es dada en el

%or$ato de salida lo"stico, con todas las de$s variables con%i"uradas a su valor pro$edio calculado en base a las localidades de presencia+ *ote ,ue si las variables a$bientales estn correlacionadas, co$o lo estn a,u, las curvas de respuesta $ar"inal pueden ser inconducentes+ Por eAe$plo, si dos variables alta$ente correlacionadas tienen curvas de respuesta aproxi$ada$ente opuestas la una de la otra, entonces el e%ecto co$binado de a$bas variables ser baAo para $uchos pxeles+ Otro eAe$plo, ve$os ,ue la disponibilidad predicha esta ne"ativa$ente correlacionada con la precipitaci#n anual >pre9012Tann@, si $antienen %iAas a las de$s variables+ En otras palabras, una ve< ,ue el e%ecto de todas las de$s variables ha'a sido considerado, el e%ecto $ar"inal de au$entar la precipitaci#n anual debe dis$inuir la disponibilidad predicha+ Sin e$bar"o, la precipitaci#n anual est alta$ente correlacionada con las variables de precipitaci#n anual, as ,ue en realidad no pode$os $antener %cil$ente %iAos los valores $ensuales $ientras varan los valores anuales+ En este caso el pro"ra$a produce un se"undo conAunto de curvas de respuesta, en el cual cada una de las curvas es hecha $ediante la "eneraci#n de un $odelo usando s#lo la variable correspondiente, The pro"ra$ there%ore produces a second set o% response curves, in Bhich each curve is $ade b' "eneratin" a $odel usin" onl' the correspondin" variable, sin to$ar en cuenta las otras variables-

En contraste con la respuesta $ar"inal a la precipitaci#n anual observada en el pri$er conAunto de curvas de respuesta, ve$os ahora ,ue la disponibilidad predicha "eneral$ente au$enta con el incre$ento de la precipitaci#n anual+

Tipos de caractersticas y curvas de respuesta


:as curvas de respuesta nos per$iten ver la di%erencia entre tipos de caractersticas+ Deseleccione Fauto %eaturesG >F(aractersticas auto$ticasG@, seleccione FThreshold %eaturesG >Fcaractersticas de u$bralG@ ' presione el bot#n F!unG de nuevo+ Observe los per%iles de las caractersticas resultantes N se dar cuenta ,ue son %unciones en escalera, co$o esta de pre9012Tl02-

Si se e%ectHa la $is$a corrida usando sola$ente caractersticas claves, el per%il resultante de la caracterstica se ve as-

:os contornos de a$bos per%iles son si$ilares, pero ellos di%ieren por,ue tipos de caractersticas distintos per$iten per%iles di%erentes de curvas de respuesta+ El exponente en un $odelo MaBent es la su$atoria de las caractersticas ' una su$a de las caractersticas de u$bral es sie$pre una %unci#n en escalera, de tal $odo ,ue la salida lo"stica es ta$bi;n una %unci#n en escalera >co$o lo son las salidas crudas ' cu$ulativas@+ En co$paraci#n, una su$atoria de caractersticas clave sie$pre es una %unci#n lineal por tra$os+ Esto explica la secuencia de se"$entos de lnea conectadas en la se"unda curva de respuesta $ostrada arriba >*ote ,ue las lneas son li"era$ente curvadas, especial$ente hacia los valores extre$os de la variable= esto es debido a la salida lo"stica aplica una %unci#n si"$oidea al exponente de Maxent@ Usando todas las clases Auntas >la opci#n por de%ecto en caso de tener $uestras su%icientes@ per$ite $uchas respuestas co$pleAas para ser cuidadosa$ente $odeladas+Una explicaci#n $s pro%unda de los diversos tipos de caractersticas puede encontrarse haciendo clic en el bot#n de a'uda+

El %or$ato SDD
Otro %or$ato de entrada puede ser $u' Htil, especial$ente cuando sus cuadrculas a$bientales sean $u' "randes+ A %alta de un no$bre $eAor, es lla$ado Fsa$ples Bith dataG >$uestras con datosG@ o si$ple$ente SDD+ :a versi#n SDD de nuestro archivo Bradypus, lla$ada Fbrad'pusTsBd+csvG, co$ien<a del si"uiente $odospecies,lon"itude,latitude,cld9012Tann,dtr9012Tann,ecore",%rs9012Tann,hTde$,pre9012Tann,pre9012Tl02,pre9012Tl0, pre9012Tl6,pre9012TlK,t$n9012Tann,t$p9012Tann,t$x9012Tann,vap9012Tann brad'pusTvarie"atus,598+6,502+4Q44,K9+2,026+2,02+2,7+2,070+2,69+2,60+2,Q6+2,86+2,4+2,017+2,799+2,44K+2,7K1+2 brad'pusTvarie"atus,598+4Q44,502+4Q44,K9+2,026+2,02+2,7+2,070+2,69+2,62+2,Q6+2,86+2,4+2,017+2,799+2,44K+2,7K1+2 brad'pusTvarie"atus,598+0444,509+Q,8K+2,006+2,02+2,0+2,700+2,98+2,89+2,071+2,8Q+2,46+2,062+2,766+2,470+2,770+2 brad'pusTvarie"atus,594+999K,50K+68,8K+2,007+2,02+2,4+2,494+2,49+2,44+2,K0+2,7K+2,04+2,048+2,771+2,42K+2,727+2 brad'pusTvarie"atus,594+Q8,50K+6,8K+2,004+2,02+2,4+2,424+2,41+2,48+2,KK+2,71+2,08+2,046+2,771+2,429+2,727+2

Puede ser usado en lu"ar de un archivo de datos nor$al+ :a di%erencia radica Hnica$ente en ,ue el pro"ra$a no necesita $irar en las capas de variables a$bientales >los archivos AS(CC@ para obtener los valores de las variables en los puntos de $uestra, en lu"ar de eso lee los valores de las variables a$bientales directa$ente de la tabla+ As, las capas a$bientales son Hnica$ente usadas para leer los datos a$bientales de los pxeles de %ondo, es decir a,uellos pxeles donde la especie no necesaria$ente ha sido detectada+ De hecho, los pxeles de %ondo ta$bi;n pueden ser especi%icados en un archivo con %or$ato SDD+ El archivo Fbac&"round+csvG contiene 02+222 datos de punto de %ondo+ :os pri$eros de ellos se ven del si"uiente $odobac&"round,590+KK8,9+0K8,92+2,022+2,02+2,2+2,K6K+2,88+2,76+2,8K+2,68+2,Q0+2,0Q7+2,741+2,422+2,747+2 bac&"round,599+2K8,8+478,9K+2,009+2,02+2,4+2,024Q+2,K8+2,09+2,9Q+2,96+2,068+2,0Q0+2,769+2,440+2,746+2 bac&"round,581+QK8,579+478,6K+2,071+2,1+2,0+2,K4+2,40+2,64+2,47+2,64+2,02+2,1K+2,70Q+2,441+2,0Q1+2 bac&"round,59Q+4K8,508+4K8,8Q+2,007+2,02+2,66+2,7241+2,44+2,9K+2,40+2,42+2,9+2,020+2,0Q0+2,780+2,044+2 bac&"round,59Q+878,6+KK8,K7+2,18+2,02+2,2+2,98+2,K7+2,09+2,98+2,91+2,044+2,70Q+2,7K0+2,469+2,7Q1+2

Pode$os correr Maxent con Fbrad'pusTsBd+csvG co$o archivo de $uestras ' Fbac&"round+csvG >a$bos locali<ados en el directorio FsBdG@ co$o archivo de capas a$bientales+ Trate de correrlo ' se dar cuenta ,ue corre $ucho $s rpido, debido a ,ue no tiene ,ue car"ar las "randes cuadrculas a$bientales+ Otra ventaAa es ,ue Usted puede asociar di%erentes re"istros con condiciones a$bientales de di%erentes periodos de tie$po+ Por eAe$plo, dos re"istros obtenidos a 022 aIos de di%erencia el uno del otro en una $is$a celda de la cuadrcula probable$ente re%leAan una variaci#n considerable en las condiciones a$bientales, pero a $enos ,ue Usted use el %or$ato SDD, a$bos re"istros recibirn los $is$os valores de variables a$bientales+ El inconveniente es ,ue no puede elaborar i$"enes o cuadrculas co$o salidas, por,ue no tienen todos los datos a$bientales+ El $odo de sortear este inconveniente es usando una Fpro'ecci#nG, co$o se describe $s adelante+

(orrida de lotes >FBatch runnin"G@


En ocasiones usted necesita "enerar $Hltiples $odelos, ,ui<s con li"eras variaciones en los par$etros de $odelado o en las entradas+ :a "eneraci#n de $odelos puede ser auto$ati<ada con ar"u$entos tipo co$ando, obviando la necesidad de hacer clic ' escribiendo repetida$ente en la inter%ase del pro"ra$a+ :os ar"u$entos de lnea de co$ando pueden o bien ser dados desde una ventana de co$ando >ta$bi;n conocida co$o F%icheroG NFshellG N @, o pueden ser de%inidos en un archivo de lotes >FbatchG@+ D;le un vista<o al archivo FbatchExa$ple+batG >por eAe$plo, ha"a clic con el bot#n derecho en el archivo +bat en DindoBs Explorer ' bralo usando *otepad@+ (ontiene la si"uiente lneaAava 5$x807$ 5Aar $axent+Aar environ$entalla'ersUla'ers to""lela'ert'peUecore" sa$ples%ileUsa$ples?brad'pus+csv outputdirector'Uoutputs redoi%exists autorun El e%ecto es decirle al pro"ra$a donde encontrar capas a$bientales ' archivos de $uestras ' donde poner las salidas, o indicar ,ue la variable ecore" es cate"#rica+ El indicador FautorunG >Fcorrida auto$ticaG@ le dice al pro"ra$a de iniciar la corrida in$ediata$ente, sin esperar a ,ue el bot#n F!unG sea presionado+ Ahora intente darle doble clic en el archivo para ver ,ue es lo ,ue hace+ Muchos aspectos del pro"ra$a Maxent pueden ser controlados por ar"u$entos de lnes de co$ando+ Presione el bot#n F)elpG para ver todas las posibilidades+ MHltiples corridas pueden aparecer en el $is$o archivo ' pueden ser corridos si$ple$ente una despu;s de la otra+ Usted puede ca$biar el valor por de%ecto de $uchos de los par$etros a"re"ando ar"u$entos de lnea de co$andos al archivo F$axent+batG+ Muchos de los ar"u$entos de lneas de co$andos ta$bi;n tienen abreviaciones, as la corrida descrita en batchExa$ple+bat podra ta$bi;n ser iniciada usando este co$andoAava 5$x807$ 5Aar $axent+Aar Ne la'ers Nt eco Ns sa$ples?brad'pus+csv No outputs Nr 5a

Regularizacin+
El par$etro F$ultiplicador de re"ulari<aci#nG >Fre"ulari<ation $ultiplierG@ ubicado en el panel de con%i"uraci#n in%lu'e el nivel de en%o,ue o cuan cercana$ente se aAusta la distribuci#n de salida obtenida+ Un valor $enor ,ue el valor por de%ecto de 0,2 producir una distribuci#n de salida $s locali<ada la cual se aAusta estrecha$ente a los re"istros de presencia dados, pudiendo ser un aAuste excesivo >aAustndose tan cercana$ente a los datos de entrena$iento ,ue el $odelo no "enerali<a bien para identi%icar los datos de prueba independientes@+ Un $ultiplicador de re"ulari<aci#n $a'or producir una predicci#n $s extendida, $enos locali<ada+ Cntente ca$biar el $ultiplicador ' exa$ine las i$"enes producidas ' los ca$bios en las AU(+ (o$o eAe$plo, con%i"urando el $ultiplicador a tres hace ,ue la si"uiente i$a"en $uestre una distribuci#n $ucho $s di%usa ,ue la presentada anterior$ente-

El potencial de aAustar en exceso se incre$enta en la $edida ,ue la co$pleAidad del $odelo se incre$enta+ Pri$ero intente con%i"urar el $ultiplicador con un valor $u' baAo >i+ e+ 2,20@ con el conAunto de caractersticas por de%ecto para ver un $odelo alta$ente aAustado en exceso+ :ue"o intente usar el $is$o $ultiplicador de re"ulari<aci#n Hnica$ente con caractersticas cuadrticas ' lineales+

)aciendo pro'ecciones
Un $odelo entrenado con un conAunto de capas a$bientales >o archivo SDD@ puede ser Fpro'ectadoG al aplicrsele otro conAunto de capas a$bientales >o archivo SDD@+ :as situaciones en las cuales se re,uiere de pro'ecciones incl'en el $odelado de la distribuci#n de las especies baAo las condiciones cli$ticas ca$biantes, la aplicaci#n de un $odelo de distribuci#n nativa a una especie invasora para explorar el ries"o de invasi#n en rea "eo"r%icas di%erentes, o si$ple$ente evaluar el $odelo baAo un conAunto de localidades de prueba con la %inalidad de e%ectuar anlisis estadsticos $s pro%undos+ A,u va$os a llevar a cabo una pro'ecci#n con un obAetivo $u' si$pleElaborar una cuadrcula en %or$ato AS(CC ' su %i"ura asociada co$o salida cuando las $uestras ' el %ondo estn en %or$ato SDD+ Escriba, o nave"ue, T'pe in, los archivos de $uestras FsBd?brad'pusTsBd+csvG ' las capas a$bientales en FsBd?bac&"round+csvG, lue"o in"rese el directorio capas >Fla'ersG@ en el FProAection :a'ers Director'G >FDirectorio de (apas de Pro'ecci#nG@, cpo$o se $uestra en la si"uiente %i"ura+

El directorio de capas de pro'ecci#n >o archivo SDD@ debe contener variables con los $is$os no$bres ,ue las variables e$pleadas para el entrena$iento del $odelo, pero describiendo unas condiciones di%erentes >i+e+, una re"i#n "eo"r%ica di%erente o $odelo cli$tico di%erente@+ Para a$bos conAuntos de datos, los de entrena$iento ' los de pro'ecci#n, el no$bre de cada variable es o bien el ttulo de la colu$na >si se est usando un archivo en %or$ato SDD@ o el no$bre del archivo pero sin la ter$inaci#n +asc >si se est usando un directorio de cuadrculas@+ (uando usted presiona F!unG, se entrena un $odelo usando los datos SDD el cual es posterior$ente pro'ectado sobre cuadrculas AS(CC en el directorio Fla'ersG+ :a cuadrcula de salida en %or$ato AS(CCC se lla$a Fbrad'pusTvarie"atusTla'ers+ascG ' en lneas "enerales el no$bre del directorio es aIadido al no$bre de la especie, con el %in de distin"uirlo de la salida estndar >no pro'ectada@+ Si se selecciona F$a&e pictures o% predictionsG >Fhacer %i"uras de las prediccionesG@, aparecer una %i"ura del $odelo pro'ectado en el archivo Fbrad'pus+ht$lG+

Anali<ando la salida de Maxent en !


Maxent produce un cierto nH$ero de archivos de salida en cada corrida+ Al"unos de ;stos archivos pueden ser i$portados por otros pro"ra$as si Usted ,uiere e%ectuar sus propios anlisis de las predicciones+ A,u de$ostra$os el uso del pa,uete estadstico "ratuito ! con salidas de MaxEnt- Se entiende ,ue esta secci#n est diri"ida a usuarios con experiencia en el uso de !+ Usare$os el si"uiente par de archivos producidos por Maxentbrad'pusTvarie"atus+csv brad'pusTvarie"atusTsa$plePredictions+csv El pri$ero de ;stos se produAo cuando los datos de %ondo son dados en %or$ato SDD ' el se"undo se produce en todos los casos+ Ase"Hrese ,ue Usted dispone de datos de prueba >por eAe$plo, con%i"urando el porcentaAe aleatorio de prueba en 78@= estare$os evaluando las salidas de MaxEnt usando los $is$os datos de prueba ,ue us# Maxent+ Pri$ero, inicia$os ! e instala$os al"unos pa,uetes >asu$iendo ,ue estas es la pri$era ve< ,ue lo esta$os usando@ ' entonces los car"a$os escribiendo >o pe"ando@install+pac&a"es>E!O(!E, dependenciesUT!UE@ install+pac&a"es>EvcdE, dependenciesUT!UE@ librar'>!O(!@ librar'>vcd@ librar'>boot@

A trav;s de ;sta secci#n usare$os texto a<ul para $ostrar los c#di"os ' co$andos de ! ' verde para $ostrar las salidas de !+ Se"uida$ente nos diri"i$os hacia el directorio donde estn las salidas de MaxEnt, por eAe$plosetBd>Fc-3$axent3tutorial3outputsG@ ' lue"o lea en las predicciones de Maxent en los puntos de presencia ' de %ondo, ' extrai"a las colu$nas ,ue necesita$ospresence V5 read+csv>Fbrad'pusTvarie"atusTsa$plePredictions+csvE@ bac&"round V5 read+csv>Fbrad'pusTvarie"atus+csvE@ pp V5 presenceW(u$ulative+prediction X "et the colu$n o% predictions testpp V5 ppYpresenceWTest+or+trainUUEtestEZ X select onl' test points trainpp V5 ppYpresenceWTest+or+trainUUEtrainEZ X select onl' test points bb V5 bac&"roundWMaxent+cu$ulative+values+at+bac&"round+points Ahora pode$os poner los valores de la predicci#n en el %or$ato re,uerido por !O(!, el pa,uete ,ue usare$os para hacer al"unos anlisis !O( ' "enere la curva !O(co$bined V5 c>testpp, bb@ X co$bine into a sin"le vector label V5 c>rep>0,len"th>testpp@@,rep>2,len"th>bb@@@ X labels- 0Upresent, 2Urando$ pred V5 prediction>co$bined, label@ X labeled predictions per% V5 per%or$ance>pred, EtprE, E%prE@ X True 3 %alse positives, %or !O( curve plot>per%, colori<eUT!UE@ X ShoB the !O( curve per%or$ance>pred, EaucE@['+valuesYY0ZZ X (alculate the AU( El co$ando "ra%icar proporciona el si"uiente resultado-

Mientras ,ue el co$ando Fper%or$anceG >Fdese$peIoG@ proporciona un AU( de 2,Q9KKK81, el cual es consistente con el AU( reportada por MaxEnt+ A continuaci#n, co$o un eAe$plo de las pruebas disponibles en ! pero no as en MaxEnt, llevare$os a cabo un esti$ado de la desviaci#n estndar del AU( $ediante reiteraciones >FbootstrapG@+ AU( V5 %unction>p,ind@ \ pres V5 pYindZ co$bined V5 c>pres, bb@ label V5 c>rep>0,len"th>pres@@,rep>2,len"th>bb@@@ predic V5 prediction>co$bined, label@ return>per%or$ance>predic, EaucE@['+valuesYY0ZZ@ ]

b0 V5 boot>testpp, AU(, 022@ X do 022 bootstrap AU( calculations b0 X "ives esti$ates o% standard error and bias Esto proporciona la si"uiente salidaO!DC*A!^ *O*PA!AMET!C( BOOTST!AP (allboot>data U testpp, statistic U AU(, ! U 022@ Bootstrap Statistics ori"inal bias std+ error t0_ 2+Q9KKK81 52+2224K7604Q 2+271K7804 ' ve$os ,ue el esti$ado por reiteraciones del error estndar >2,271K7804@ es cercano al error estndar calculado por MaxEnt >2,27Q@+ :os resultados de las reiteraciones ta$bi;n pueden ser e$pleadas para deter$inar los intervalos de con%ian<a para las AU(boot+ci>b0@ dados los si"uientes cuatro esti$ados N vea la secci#n de recursos al %inal de ;sta "ua para re%erencias ,ue de%inen ' co$paran estos esti$ados+ Cntervals :evel *or$al Basic 18L > 2+Q211, 2+1796 @ > 2+Q026, 2+1710 @ :evel Percentile B(a 18L > 2+Q296, 2+1787 @ > 2+KKQ9, 2+1010 @ A,uellos ,ue est;n %a$iliari<ados con el uso de las reiteraciones notarn ,ue a,u esta$os reiterando sola$ente los valores de presencia+ Podra$os ta$bi;n reiterar los valores de %ondo, pero los resultados no ca$biaran $ucho, dado ,ue ha' un "ran nH$ero de valores de %ondo >02222@+ (o$o un eAe$plo %inal, investi"are$os el clculo de las estadsticas bino$ial ' `appa de (ohen para al"unas re"las de u$bral de eAe$plo+ Pri$ero, el si"uiente c#di"o ! calcula el ndice `appa para el u$bral dado se"Hn la predicci#n de presencia $ni$acon%usion V5 %unction>thresh@ \ return>cbind>c>len"th>testppYtestppaUthreshZ@, len"th>testppYtestppVthreshZ@@, c>len"th>bbYbbaUthreshZ@, len"th>bbYbbVthreshZ@@@@ ] $'&appa V5 %unction>thresh@ \ return>`appa>con%usion>thresh@@@ ]

$'&appa>$in>trainpp@@ el cual da un resultado de 2,22K7+ Si ,uere$os usar el u$bral ,ue $ini$i<a la su$atoria de la sensibilidad ' de la especi%icidad en base a los datos de prueba, pode$os hacer lo si"uiente, usando los valores de la tasa positiva verdadera ' de la tasa positiva %alsa del obAeto Fdese$peIoG >Fper%or$anceG@ usado arriba para "ra%icar la curva !O(%pr U per%[x+valuesYY0ZZ tpr U per%['+valuesYY0ZZ $axsu$ U 2 %or >i in 0-len"th>per%[alpha+valuesYY0ZZ@@ \ su$ U tprYYiZZ M >05%prYYiZZ@ i% >su$ a $axsu$@ \ $axsu$ U su$ cuto%% U per%[alpha+valuesYY0ZZYYiZZ index U i ] ] $'&appa>cuto%%@ esto da un valor de `appa de 2,2066+ Para deter$inar las probabilidades bino$iales de estos dos valores de u$bral pode$os hacer lo si"uiente$'bino$ial V5 %unction>thresh@ \ con% V5 con%usion>thresh@ trials V5 len"th>testpp@ return>bino$+test>con%YY0ZZYY0ZZ, trials, con%YY0,7ZZ 3 len"th>bb@, E"reaterE@@ ] $'bino$ial>$in>trainpp@@ $'bino$ial>cuto%%@ esto da valores de p de 8,1K1e521 ' 7,41Ke500 respectiva$ente, los cuales son li"era$ente $a'ores ,ue los valores de p dados por MaxEnt+ :a ra<#n de ;sta di%erencia radica en el hecho de ,ue el nH$ero de $uestras de prueba es $a'or ,ue 78, el u$bral por arriba del cual MaxEnt usa una aproxi$aci#n nor$al para calcular valores de p bino$ios+

!ecursos de !
Al"unos buenos $ateriales introductorios sobre el uso de ! puede encontrarse enhttp6//spider.stat.umn.edu/7/doc/manual/7/intro.html, + otras p%ginas en el mismo sitio. http6//www.math.ilstu.edu/dh8im/7stu99/7tutor.html

You might also like