You are on page 1of 11

ESTADSTICA ESPACIAL

ESPECIALIZACIN EN SISTEMAS DE INFORMACIN GEOGRFICA 2015 II

ANLISIS DE PATRONES PUNTUALES


ESPACIALES PARA DATOS DE RELMPAGOS
DE UNA TORMETA EN HOUSTON TEXAS NORTEAMRICA
Juan Manuel Carrillo Garca1
Cristian Enrique Mora Cortez2
Diego Armando Rodrguez lvarez3

RESUMEN

Para la elaboracin de este estudio se utilizaron datos de relmpagos correspondientes al da 9 de


mayo de 2013 en un rea al noroeste de la ciudad de Houston, Texas. A partir de un anlisis
exploratorio de los datos estimando la intensidad del patrn puntual sobre la ventana de inters y la
presencia de dependencia espacial. Se determin la no existencia de Completa Aleatoriedad Espacial
(CRS) mediante la implementacin de las funciones G, F, K y L con el uso del paquete Spatstat de R.
Adicionalmente se gener el ajuste de un modelo de proceso no homogneo de Poisson junto con
una simulacin del patrn generado por este modelo. Se utilizaron tcnicas estadsticas de modelado
espacial y en la metodologa descrita en este documento se presenta la secuencia lgica de
procedimientos aplicados.
Palabras Claves: Patrones puntuales espaciales, relmpagos
Abstract:
For this study we were used lightning data for the day May 9 of 2013 in an area northwest of the city
of Houston, Texas. For the exploratory data analysis we were estimated the intensity of the point
pattern on the window of interest and the presence of spatial dependence. It was determined the
existence of complete spatial randomness (CRS) through the implementation of the G, F, K and L
functions with the use of spatstat package R. In addition, it was generated the adjustment of a model
inhomogeneous Poisson process with a simulation of the pattern generated by this model. We were
used techniques of Statistics and spatial modeling that are described in the methodology of this
document whit the logical sequence of procedures applied.
Key Words: spatial point pattern, lightning strikes

Estudiante del programa de Especializacin en sistemas de informacin geogrfica de la Universidad Distrital Francisco Jos de Caldas
Cdigo: 20142094023
2 Estudiante del programa de Especializacin en sistemas de informacin geogrfica de la Universidad Distrital Francisco Jos de Caldas
Cdigo: 20151094012
3 Estudiante del programa de Especializacin en sistemas de informacin geogrfica de la Universidad Distrital Francisco Jos de Caldas
Cdigo: 20151094015
1

1|P g i n a

03 de noviembre de 2015

ESTADSTICA ESPACIAL
ESPECIALIZACIN EN SISTEMAS DE INFORMACIN GEOGRFICA 2015 II

INTRODUCCIN

El sur-este de Norteamrica es una de las zonas ms afectadas por fenmenos de relmpagos tal y
como lo evidencia el monitoreo del impacto de los mismos que ha logrado ser cartografiado por
diversas entidades encargadas e interesadas en el tema como lo es el caso de la NASA - National
Aeronautics and space administration y que con base en los sensores de bandas entre los 700 y 800
nanmetros registran estos eventos atmosfricos. En la Figura 1 se presenta la densidad de eventos
registrados anualmente por unidad de rea (relmpagos/km2/ao).

Figura 1. Densidad de eventos ocurridos anualmente.


Fuente: http://science.nasa.gov/science-news/science-at-nasa/2001/ast05dec_1/

Sin embargo el monitoreo terrestre de este fenmeno a partir de sensores de radiofrecuencia


proporcionan mediciones locales de alta calidad, como lo son las mediciones de las redes United
States and North American Precision Lightning Networks, administradas por la WSI divisin
profesional de la TWC (the weather company), que en tiempo real y gracias a los aproximadamente
170 sensores instalados recopilan las caractersticas de los eventos ocurridos.
Debido al nmero de eventos que ocurren diariamente, cerca de 8,6 millones alrededor del mundo,
se seleccionaron registros de un da de tormenta con el objeto de establecer si la localizacin de los
relmpagos obedece a una distribucin aleatoria o si por el contrario sigue algn patrn en su
distribucin espacial. Adicional a la localizacin de cada evento se cuenta con la duracin del mismo
expresada en milisegundos y el amperaje pico de polaridad positiva o negativa.
El monitoreo de este fenmeno adicionalmente es registrado con el objeto de estudiar su
comportamiento, particularmente existen centros de investigacin que adems de su localizacin,
realizan procesos de georreferenciacin con el objeto de identificar patrones a escala global. En la
Figura 2 se observan los eventos ocurridos en Norteamrica para el da de la tormenta objeto de
estudio.

2|P g i n a

03 de noviembre de 2015

ESTADSTICA ESPACIAL
ESPECIALIZACIN EN SISTEMAS DE INFORMACIN GEOGRFICA 2015 II

Figura 2. Eventos ocurridos para la tormenta del 9 de mayo de 2013.


Fuente: http://www.lightningmaps.org/blitzortung/america/index.php?

El anlisis de patrones puntuales espaciales sirve no solo para la identificacin de algn tipo de
agregacin sino que va ms all pues busca mejorar la comprensin de estos eventos en la
climatologa global y dar pautas de agregaciones espaciales y temporales que buscan fortalecer la
toma de decisiones que permitan evaluar el riesgo que existe ante fenmenos de cambio climtico
cuya ocurrencia y magnitud afectan cada vez ms a un nmero mayor de poblacin.
El anlisis se apoyar en la aplicabilidad de funciones implementadas en la herramienta R V. 3.1.2,
proyecto para la estadstica computacional y particularmente el uso de sus paquetes de estadstica
espacial como spatstat y splancs, para el anlisis y visualizacin de datos espaciales y entre ellos
patrones espaciales puntuales en una regin bidimensional como lo es la zona de estudio
comprendida en Houston Texas (Baddeley, Rubak, & Turner, Spatial Point Patterns: Methodology
and Applications with R, 2005).

METODOLOGA

Para el presente anlisis se tomaron los datos de relmpagos en el rea de estudio, sin embargo si
bien se conocen los registros de cada evento, no se conocen las dems condiciones que permiten
obtener dichos registros como lo son las condiciones climticas y de carga elctrica en la atmosfera.
A continuacin se describen los datos empleados as como el procedimiento desarrollado y los
mtodos aplicados.
Datos de eventos registrados:
De las series de registros de relmpagos es importante mencionar que al ser un fenmeno
atmosfrico su ocurrencia no es por si aleatoria pues como se mencion obedecen a la presencia de
tormentas y cambios en la carga elctrica de la atmosfera y es por ello que la escala del anlisis debe
ser relativamente menor acorde con la escala de los eventos de tormenta (Schabenberger &

3|P g i n a

03 de noviembre de 2015

ESTADSTICA ESPACIAL
ESPECIALIZACIN EN SISTEMAS DE INFORMACIN GEOGRFICA 2015 II

Gotway, 2009); para el anlisis se han seleccionado eventos ocurridos durante una hora, entre las
8:27 am y las 9:27 am del da 9 de mayo de 2013.
Determinacin de patrn espacial:
Para evaluar el posible patrn espacial que presentan los datos puntuales se realizara el anlisis
exploratorio de los mismos el cual consiste en la visualizacin, la estimacin de la densidad y
dependencia espacial, para lo cual se seguirn y aplicaran los siguientes mtodos:
Mtodo de los cuadrantes (densidad): Este mtodo permite estimar la intensidad de los eventos en
subregiones de igual tamao definidas como una divisin del rea de estudio; posteriormente el
mtodo requiere el conteo de los eventos en cada subregin con el objeto de calcular la intensidad
como la relacin entre el nmero de eventos y el rea de la subregin. Para validar la hiptesis de
completa aleatoriedad espacial (CSR), se requiere determinar la proporcin varianza media (VMR),
cuya prueba de significancia es realizada bajo una distribucin chi-cuadrado.
Mtodo Densidad de Kernel: La estimacin kernel permite conocer la densidad de eventos dentro
de un radio de bsqueda especfico alrededor de cada punto o evento. Se define como una funcin
matemtica que pondera las distancias entre vecinos del rea de influencia determinada por el
ancho de banda o los parmetros utilizados para definir la forma del kernel. Segn los parmetros
la funcin de densidad de Kernel puede tener el ancho de banda fijo (Kernel fijo) o el nmero de
eventos dentro del rea de influencia fijo (Kernel adaptativo). As mismo se requiere determinar el
ancho de banda ptimo caso para el cual se estableci mediante el uso del error medio cuadrtico
(Minarro, 1998).
Distancias de vecinos ms cercanos y Funcin K (dependencia): para las evaluaciones de
dependencia se realiza una simulacin CSR con el objeto de identificar visualmente si la grfica de
eventos presenta un comportamiento tpico de un patrn aleatorio. La Funcin G estudia la
distribucin acumulada del nmero de parejas de vecinos en la medida en que se va incrementando
el umbral de distancia entre ellos hasta llegar al par de vecinos ms cercanos que se hallan a mayor
distancia. La Funcin F genera un nmero aleatorio de ubicaciones al interior del rea de inters,
luego se observa la mnima distancia entre cada uno de estos puntos y el evento ms cercano.
Considerando que en este mtodo los pares se forman entre puntos aleatorios y eventos, es
comprensible que la funcin tenga un comportamiento opuesto al de la funcin G
Por su parte, la Funcin K tiene en cuenta los efectos de agregacin a varias escalas sobre la base
de todas las distancias entre los eventos asumiendo isotropa en la regin de estudio. Evala el
patrn espacial mediante el conteo de eventos al interior de un crculo con radios definidos
aleatoriamente, haciendo lo mismo para todos los puntos en el rea de estudio. Se controla el
resultado mediante la modificacin del parmetro h o rezago espacial. Finalmente se presenta la
funcin L como una estandarizacin de esta ltima.

4|P g i n a

03 de noviembre de 2015

ESTADSTICA ESPACIAL
ESPECIALIZACIN EN SISTEMAS DE INFORMACIN GEOGRFICA 2015 II

Estimacin de los modelos:


La aplicacin de un modelo terico resulta de gran utilidad para comprender mejor el
comportamiento as como la posible interaccin espacial con otras variables an no observadas o
consideradas.
Uno de los beneficios de obtener este modelo es predecir la intensidad del patrn en locaciones de
inters y de esta forma hacer inferencias acerca del patrn en sitios no completamente
muestreados.
El paquete a utilizar para la generacin del modelo es spatstat. En este paquete se utiliza la funcin
Ajuste de Modelo de Proceso Puntual a Datos (Fit Point Process Model to Data), la cual recibe
como parmetros un objeto del tipo parn puntual y una funcin con la que se espera modelar una
posible tendencia (trend) presente en los datos. En este caso de estudio se utiliza una funcin lineal
de x e y, que corresponde a un plano en el espacio tridimensional. La funcin calcula cules seran
los coeficientes para construir un plano mediante el mtodo de mxima verosimilitud, que busca
obtener como resultado el modelo ptimo que ms se asemeje a los datos observados.

RESULTADOS

Conforme a la metodologa presentada, a continuacin en la Figura 3 se muestran los eventos


considerados as como el resumen de las caractersticas del objeto ppp que es la clase definida en
la herramienta R para representar patrones puntuales en dos dimensiones.

Figura 3. Esquema y resumen de los eventos considerados.

Como se puede observar existen unos lmites de los eventos definidos como se indica en la Figura 2
seguramente contenidos por los ncleos de precipitacin de la tormenta.
Por otra parte, como anlisis exploratorio de las caractersticas de los eventos considerados se
presentan los histogramas y diagramas de cajas de las dos variables disponibles que obedecen a la
duracin y al amperaje mximo registrado.

5|P g i n a

03 de noviembre de 2015

ESTADSTICA ESPACIAL
ESPECIALIZACIN EN SISTEMAS DE INFORMACIN GEOGRFICA 2015 II

Figura 4. Anlisis exploratorio - variables amps mximo y duracin.

Es importante observar las distribuciones, una en forma de campana y la otra uniforme, que
presentan las dos variables, que si bien no son objeto de anlisis del presente estudio, son tiles en
la descripcin e interpretacin del fenmeno.
Adicionalmente se presenta la distribucin de los eventos en las coordenadas este y norte,
observando principalmente comportamientos bimodales.

Figura 5. Anlisis exploratorio - histogramas coordenadas este y norte.

Una vez revisados los datos y las variables de estudio, se procedi a determinar la densidad de los
eventos a partir de la aplicacin del mtodo de cuadrantes descrito anteriormente; El p-valor de la
prueba de significancia obtenido sobre una distribucin a dos colas, indica claramente que se
6|P g i n a

03 de noviembre de 2015

ESTADSTICA ESPACIAL
ESPECIALIZACIN EN SISTEMAS DE INFORMACIN GEOGRFICA 2015 II

rechaza la hiptesis nula. Por lo anterior es posible afirmar que los datos conforman un patrn
puntual agregado. A continuacin se presenta el grafico de los cuadrantes definidos con base en el
rea recomendada de cada uno as como el resultado del test aplicado.

Figura 6. Mtodo de cuadrantes conteo y resumen del test.

Continuando con la evaluacin de densidad, se aplic el kernel tanto fijo como adaptativo; para el
primero de ellos se requiri de la definicin del ancho de banda ptimo a partir del error medio
cuadrtico cuyos resultados indican un ancho de banda de 1,5 km.

Figura 7. Kernel fijo ancho de banda 1.5 km.

Figura 8. Kernel adaptativo.

Como se puede observar las zonas identificadas por ambos tipos de kernel son similares, la
diferencia varia en el suavizado de la superficie que genera un kernel fijo.

7|P g i n a

03 de noviembre de 2015

ESTADSTICA ESPACIAL
ESPECIALIZACIN EN SISTEMAS DE INFORMACIN GEOGRFICA 2015 II

Los resultados de las pruebas de dependencia a travs de las funciones definidas anteriormente
comparan las funciones esperadas para la hiptesis de completa aleatoriedad espacial con los
resultados observados. A continuacin se presentan las funciones obtenidas para los eventos
considerados.

Figura 9. Funciones de dependencia espacial.

Dado que la funcin G presenta un rpido crecimiento con la distancia, se establece que existe una
agrupacin de los datos, debido a que a distancias ms cortas existe mayor cantidad de eventos. De
manera opuesta, para la funcin F, una gran cantidad de distancias menores indica agrupacin, por
lo tanto la curva crece lentamente por debajo de la simulacin. En la funcin K o su estandarizacin
L, los patrones agregados presentan un crecimiento rpido por encima de la curva de simulaciones
que representa CSR.
Por consiguiente se puede concluir que los relmpagos ocurridos en la maana del 9 de mayo en
Houston Texas, no cumplen la hiptesis de completa aleatoriedad espacial y se valida que presentan
un patrn espacial agregado.
El siguiente paso despus de analizar el comportamiento del patrn puntual desde diferentes
puntos de vista, es ajustar un modelo terico que represente el patrn observado.

8|P g i n a

03 de noviembre de 2015

ESTADSTICA ESPACIAL
ESPECIALIZACIN EN SISTEMAS DE INFORMACIN GEOGRFICA 2015 II

El modelo resultante corresponde a un proceso no homogneo de Poisson; se obtienen el


intersecto y los coeficientes que describen el plano que subyace al modelo estimado.

Figura 10. Resultados proceso no homogneo de Poisson.

Al examinar las caractersticas del modelo se analizan los intervalos de confianza al 95% para los
coeficientes, encontrando que ninguno de ellos contiene el valor cero. Lo anterior ratifica que los
coeficientes son significativos y efectivamente el plano describe una tendencia espacial en la
intensidad del patrn observado.

Figura 11. Resultados errores de lo modelo.

En la izquierda de la Figura 11 se observa el modelo ajustado para la tendencia de la intensidad, con


la sobre posicin de los eventos observados y en la derecha se observa el error estndar estimado
para la prediccin de la intensidad en el rea de estudio con el uso del modelo de proceso no
homogneo de Poisson.
Se puede ver cmo el error estndar es mayor en el borde noroccidental del rea de estudio,
mientras que para la zona suroriental la prediccin para la intensidad del patrn es
considerablemente mejor.

Figura 12. Histogramas de predicciones y errores del modelo.

9|P g i n a

03 de noviembre de 2015

ESTADSTICA ESPACIAL
ESPECIALIZACIN EN SISTEMAS DE INFORMACIN GEOGRFICA 2015 II

En la Figura 12 se compara el histograma de la intensidad en el patrn observado (izquierda) y el


histograma del error estndar observado contra la prediccin obtenida del modelo. La gran parte
de los errores se encuentran por debajo de 0.02, valor significativamente inferior respecto del
intervalo de variacin de la intensidad observada en el patrn original.
Finalmente se procede a generar una simulacin del patrn puntual mediante el uso del modelo
ajustado de proceso no homogneo de Poisson.

Figura 13. Eventos registrados evaluados vs predicciones del modelo de ajuste.

En la Figura 13 se observa a la izquierda el patrn observado y a la derecha el patrn simulado con


base en el modelo de proceso no homogneo de Poisson. Visualmente se evidencia similitud entre
los dos patrones, sin embargo persisten algunas agregaciones en el patrn observado que el modelo
no logra representar completamente.

CONCLUSIONES

El anlisis exploratorio de los datos permite evaluar las diferentes distribuciones que presentan las
variables de un fenmeno climtico como los relmpagos, los cuales, para unos mismos registros,
pueden presentar comportamientos completamente diferentes como lo son distribuciones de
campana o distribuciones uniformes.
Si bien dentro de un rea de baja extensin como la analizada, una serie de relmpagos puede
parecer aleatoria sin un patrn definidos, se pudo concluir que este fenmeno, particularmente el
ocurrido en la maana del 9 de mayo en Houston Texas, presenta un patrn espacial agregado,
potencialmente atribuible a los ncleos de precipitacin de los frentes de tormenta.
Si se evaluasen tormentas diferentes en un rea de mayor extensin el patrn de agregacin
espacial sera ms notorio pues es ampliamente conocido dentro de la ciencia hidrolgica que la
precipitacin presenta una distribucin en el espacio y no es uniforme en toda la extensin de una
cuenca hidrogrfica.
Mediante el uso de una funcin de ajuste por el mtodo de mxima verosimilitud se logr modelar
satisfactoriamente la intensidad del patrn puntual observado, obteniendo como modelo un
proceso no homogneo de Poisson.

10|P g i n a

03 de noviembre de 2015

ESTADSTICA ESPACIAL
ESPECIALIZACIN EN SISTEMAS DE INFORMACIN GEOGRFICA 2015 II

BIBLIOGRAFA

Baddeley, A., Rubak, E., & Turner, R. (2005). Spatial Point Patterns: Methodology and Applications
with R.
Baddeley, A., Rubak, E., & Turner, R. (2005). spatstat: An R Package for Analyzing Spatial Point
Patterns. Journal of Statistical Software.
Cressie, N. (1993). Statistics for Spatial Data. Jhon Wiley & Sons.
Minarro, A. (1998). Estimacin no paramtrica de la funcin de densidad. Barcelona.
Schabenberger, O., & Gotway, C. (2009). Statistical Methods for Spatial Data Analysis. Florida: Taylor
& Francis.

11|P g i n a

03 de noviembre de 2015

You might also like