You are on page 1of 20

A ANLISE EXPLORATRIA

DE DADOS ESPACIAIS:
breve introduo
Jos Irineu Rangel Rigotti
A anlise de dados espaciais pode ser
empreendida sempre que as informaes
estiverem espacialmente localizadas e
quando for preciso levar em conta,
explicitamente, a importncia do arranjo
espacial dos fenmenos na anlise ou na
interpretao de resultados desejados.
O objetivo da anlise espacial aprofundar a
compreenso do processo, avaliar evidncias
de hipteses a ele relacionadas, ou ainda
tentar prever valores em reas onde as
observaes no esto disponveis (Bailey e
Gattrel, 1995).
Como salientaram Bailey e Gattrel (1995),
basicamente, pode-se distinguir entre os
vrios mtodos:
aqueles que so essencialmente voltados
visualizao dos dados espaciais;
aqueles que so exploratrios, investigando e
resumindo relaes e padres mapeados;
e ainda aqueles que contam com a
especificao de um modelo estatstico e a
estimao de parmetros
A visualizao grfica uma etapa
fundamental da anlise espacial. Atravs dela
possvel identificar padres espaciais nos
dados, gerando hipteses testveis, bem como
avaliar o ajuste de modelos propostos, ou
ainda a validade das previses resultantes. De
fato, h uma srie de questes que podero
justificar uma visualizao criteriosa dos
dados, tais como:
- H variveis com valores extremos
(muito altos ou muito baixos)?
- As observaes se dividem em grupos
distintos?
- Existem associaes entre as variveis?
As questes acima podem ser respondidas com
o auxlio de mtodos grficos ou estatsticas
descritivas. Estas tcnicas so conhecidas
como Anlise Exploratria de Dados Espaciais,
podendo ser classificadas em Univariadas ou
Multivariadas, dependendo do nmero de
variveis envolvidas. Dentre as tcnicas
Univariadas, destacam-se os histogramas,
mapas, estimativas de densidade e boxplots;
enquanto entre as tcnicas Multivariadas
podero ser empregadas as matrizes de
disperso, grficos ligados aos mapas (linked
plots), grficos de coordenadas paralelas, etc
Anlise de variveis espaciais de reas
Uma das tcnicas mais utilizadas no estudo
de fenmenos areais a Anlise de
Autocorrelao Espacial. Esta tcnica
permite identificar a estrutura de correlao
espacial que melhor descreve o padro de
distribuio dos dados. A idia bsica
estimar a magnitude da Autocorrelao
Espacial entre as reas, evidenciando como
os valores esto correlacionados no espao.
Neste caso, as tcnicas so utilizadas
para estimar quanto do valor observado
de um atributo numa regio
dependente dos valores dessa mesma
varivel, nas localizaes vizinhas.
Enquadra-se nesta categoria o ndice
Global de Moran, o ndice de Geary e o
Variograma.
Os indicadores globais de autocorrelao
espacial, como o ndice de Moran, fornecem
um nico valor como medida da associao
espacial para todo o conjunto de dados, o
que til na caracterizao da regio de
estudo como um todo. No entanto, quando se
lida com um grande nmero de reas,
muito provvel que ocorram diferentes
regimes de associao espacial e que
apaream locais em que a dependncia
espacial ainda mais pronunciada.
Atravs das anlises locais ou modelagens
locais, busca-se testar a presena de
diferenas espaciais, ao invs de assumir
que estas no existem. Estas anlises
desagregam as estatsticas globais segundo
seus constituintes locais, concentrando-se
mais nas excees locais do que na busca
por regularidades globais (Fotheringham et
al., 2000).
Dentre as tcnicas univariadas aplicadas
anlise local existem as abordagens grficas
e aquelas voltadas para o desenvolvimento
formal de estatsticas univariadas locais.
Dentre as abordagens grficas, busca-se,
prioritariamente, identificar excees locais
s tendncias gerais na distribuio dos
dados e nas relaes entre variveis.
Trabalha-se, neste sentido, com o auxlio de
histogramas, grficos de disperso e grficos
em trs dimenses
As tcnicas grficas mais complexas para
demonstrar relaes locais em bancos de
dados univariados incluem o Spatial Lagged
Scatterplot, o Variogram Cloud Plot e o
Moran Scatterplot. Destaca-se, nesta lista, o
Moran Scatterplot, que alm de permitir a
identificao de grupos de valores, tambm
permite a identificao de valores extremos
na distribuio, alm de apresentar uma
visualizao do nvel de autocorrelao
espacial existente.
O uso do Geoda para a verificao da
existncia de Autocorrelao espacial e
identificao de Clusters e Valores
Extremos
O software Geoda 0.9.5-i, de autoria de Luc
Anselin, permite a verificao da existncia
de correlao espacial entre as variveis das
unidades geogrficas estudadas
Todas as informaes, incluindo a disponibilidade
do software para download, podem ser
encontradas no stio
http://sal.agecon.uiuc.edu/Geoda_main.php#about
O coeficiente multivariado de
autocorrelao espacial entre duas variveis
aleatrias z
k
e z
l
pode ser definido como:
Esta seo sintetiza conceitos extrados do trabalho
Visualizing Multivariate Spatial Correlation with
Dynamically Linked Windows, de autoria de Luc
Anselin, Ibnu Syabri e Oleg Smirnov. Este artigo, por sua
vez, foi elaborado a partir de trabalho anterior, Anselin et
al. (2002), na pgina:
http://agec221.agecon.uiuc.edu/users/anselin/papers.html.
m
kl =
z

k
W
s
z
l
(1),
z
k
= [x
k barra
- x
k
] /
k
e z
l
= [x
l barra
- x
l
] /
l
so padronizadas, possuindo mdia 0
(zero) e desvio padro 1 (um), e W
s
uma
matriz espacial de pesos, tambm
padronizada
Este conceito de autocorrelao espacial
mensura em que medida o valor de uma
varivel observada em uma dada unidade
geogrfica apresenta uma associao
sistemtica (no aleatria) com o valor da
varivel observada nas localidades vizinhas
Em outras palavras, testa-se a existncia de
associao linear entre o valor da varivel no
local i, (z
i
k
) e o correspondente intervalo
espacial (spatial lag) para a mesma varivel,
[W
zz
]
i
Neste caso, a padronizao atravs das linhas
da matriz de peso espacial permite uma
interpretao do intervalo espacial como
sendo uma mdia dos valores vizinhos
O produto cruzado pode tambm ser re-
escalado dividindo-o pela soma dos quadrados
da varivel. Generalizando, a contrapartida
multivariada da estatstica de autocorrelao
espacial, conhecida como ndice de Moran
pode ser expressa da seguinte forma:
I
kl
= z

k
W
zl
/ z

k
z
k
(2)
I
kl
= z

k
W
zl
/ n (3)
Sendo n o nmero de observaes e Wa matriz
espacial de pesos padronizados atravs das linhas
(row-standardized). A soma de quadrados no
denominador constante e igual a n,
independentemente de z
k
ou z
l
utilizados
Significncia Estatstica
A significncia estatstica pode ser testada
atravs de permutaes. Nestas, os valores
para uma das variveis so realocados
aleatoriamente nas diversas localidades e a
estatstica computada novamente.
Observa-se, ento, o nvel de significncia
(geralmente 5% ou 1%)
H quatro tipos de associao espacial,
dependendo da correspondncia entre z
k
e o
intervalo espacial para z
l
. Relativamente
mdia, com os valores padronizados, so
possveis duas classes de correlao espacial
positiva clusters espaciais (alto-alto, baixo-
baixo) e duas classes de associao negativa
outliers espaciais (alto-baixo, baixo-alto)
As contribuies individuais de cada
observao podem ser estimadas atravs da
equao (2), como j havia sido proposto por
Anselin (1995) no seu desenvolvimento de um
Indicador Local de Associao Espacial (LISA)
a verso local foi denominada Local Moran
Sua generalizao multivariada pode ser
definida como:
I
i
kl
= z
i
k
W
ij
z
j
l
(4), com as mesmas notaes
usadas anteriormente.
Esta estatstica fornece uma indicao do
grau de associao linear (positiva ou
negativa) entre o valor de uma varivel em
dada localidade i e a mdia de uma outra
varivel nas localidades vizinhas
Referncias bibliogrficas sugeridas
Bailey, T. C., Gatrell, T.C. Interactive Spatial Data Analysis. London:
Prentice Hall, 1995.
Cmara, Gilberto; Carvalho, Marcia; Cruz, Oswaldo; Correa, Virgnia.
Anlise Espacial de reas, in Drunck, S.; Carvalho, M.; Cmara, G.;
Monteiro, C., Anlise Espacial de Dados Geogrficos. Planaltina, DF:
Embrapa, 2004. pp. 157-204.
Fotheringham, A.S., Brunsdon, C., Charlton, M. Quantitative
Geography: Perspectives on Spatial Data Analysis. London: Sage
Publications, 2000.
Rigotti, J. I. R.; Vasconcellos, I. R. P. Uma anlise espacial
exploratria dos fluxos populacionais brasileiros nos perodos
1986-1991 e 1995-2000. (Trabalho apresentado no IV Encontro
Nacional sobre Migraes da ABEP de 2005. Disponvel para Download
em www.abep.org.br).

You might also like