You are on page 1of 11

29 de Octubre de 2010

Evaluacin curso Introduccin a la Geo-estadstica

Alumno: Rafael Adrian Maddio

DNI: 30.272.690

Programa:____________________________________________________________

En el archivo de texto adjunto (formato csv) se presentan datos


espaciales del contenido de sales en la Ba. Kattegat que une el Mar
del Norte con el Mar Bltico entre Dinamarca y Suecia.

En base al mismo realice un anlisis


descriptivo y exploratorio detallado de
la informacin cruda para luego
producir un mapa predictivo y su
incertidumbre respectiva mediante
alguna variante de las tcnicas de
interpolacin que considere adecuada
de acuerdo con la estructura de los
datos. Justifique claramente todas
sus decisiones.

La evaluacin es estrictamente individual y debe ser entregada


impresa en la Escuela para graduados de la Fac. de Agronoma UBA
o enviada por correo electrnico en formato doc o pdf. En ambos
casos el envo debe ser dirigido a Pablo A. Cipriotti
(cipriott@agro.uba.ar) antes del 15 de Noviembre de 2010
indicando en el tema del correo Evaluacin Geoestadstica
SU_APELLIDO.

EVALUACIN
1. Anlisis exploratorio de datos espaciales

El diagrama de caja de la concentracin de sal no present valores extremos, y


el histograma mostr una distribucin bimodal (Figura 1). Se encontraron
evidencias para rechazar el supuesto de normalidad de la prueba de
normalidad de Shapiro-Wilk (Tabla 3).

Tabla 1. Medidas de resumen.


Min 1st Medi Mea 3rd Ma
. Qu. an n Qu. x. SD
16.2 41.9 78. 17.2
1 25.76 33.8 9 59.4 9 3

Tabla 2. Momentos de orden.


1 2 3 4 G1 G2
2.05E+0 1.12E+0 6.53E+0 1.30E-05 3.70E-07
41.99 3 5 6

Tabla 3. Pruebas de normalidad de Shapiro-Wilk.


Sqrt[Sal
Shapiro-Wilk [Sal] log[Sal] ]
1.005E- 4.811e- 2.275e-
p-value 09 09 09

Figura 1. Histograma de frecuencias y diagrama de caja de la concentracin de sal.

Los diagramas de dispersin evidenciaron una discontinuidad a la


concentracin de 40 (Figura 2).
Figura 2. Diagramas de dispersin.

De manera exploratoria se decidi dividir el conjunto de datos en dos,


realizando un corte al valor de concentracin de sal igual 40, considerando que
podran corresponder a muestreos de distintas fechas. Se obtuvieron medidas
de resumen para los subconjuntos (Tabla 4). En ambos conjuntos de datos las
distribuciones son simtricas y mesocrticas (Tabla 5) (Figura 3). Se encontr
evidencias para aceptar el supuesto de normalidad de conjunto de datos de
concentraciones menores a 40, y se rechazo el supuesto de normalidad del
conjunto de datos de concentraciones mayores a 40 (Tabla 5) (Figura 4).

Tabla 4. Medidas de resumen.


1st Medi Mea 3rd
Ma
Min. Qu. an n Qu.
x. SD
[Sal] 16.2 38.6
<40 1 23.7 25.98 26.77 29.25 7 4.61
[Sal] 45.4
>40 9 56.2 60.24 59.37 62.39 78.9 6.42

Tabla 5. Momentos de orden.


1 2 3 4 G1 G2
[Sal]<4 2.09E+0 6.11E+0
0 26.77 737.8 4 5 5.20E-05 2.06E-06
[Sal]>4 3.56E+0 2.17E+0 1.33E+0
0 59.37 3 5 7 4.81E-06 8.28E-08

Tabla 6. Pruebas de normalidad de Shapiro-Wilk.


[Sal]<4 [Sal]>4 log[Sal] sqrt[Sal]
Shapiro-Wilk 0 0 >40 >40
0.00392
p-value 0.08059 0.01012 1 0.008014
Figura 3. Histogramas y diagramas de caja de las concentraciones de sal.

Figura 4. QQ-plot de las concentraciones de sal.

El segundo conjunto de datos fue descartado del anlisis por no cumplir con el
supuesto de normalidad, dado que las metodologas geoestadsticas son
ptimas solo si la funcin aleatoria es normal.

Se realizaron grficos de dispersin y se obtuvo la matriz de correlacin del


conjunto de datos de concentraciones menores para detectar tendencias entre
los valores de X e Y y las concentraciones de sal. Se encontr una correlacin
lineal positiva con la longitud y una correlacin lineal negativa con la latitud
(Tabla 6) (Figura 5).
Tabla 6. Matriz de correlacin para concentraciones de sal menores a 40.
X Y [Sal]
X 1
-
Y 0.52 1
-
[Sal] 0.69 0.66 1

Figura 5. Diagramas de dispersin del conjunto de datos de concentraciones menores a 40.

2. Variograma experimental

Se calcul variogramas omnidireccionales y direccionales experimentales


considerando la tendencia respecto de x e y (Figura 6, 7 y 8) (Tabla 7 y 8).
Figura 6. Variograma omnidireccional experimental para concentraciones de sal menores a 40.

Mediante los diagramas de cajas para los pares de puntos se observ valores
extremos que sera recomendable remover.
Figura 7. Variogramas direccionales.

Tabla 7. Nmero de pares de puntos utilizados para el clculo de los variogramas.


Direcci
n 1 2 3 4 5 6 7 8 9 10 11 12 13
15 11 11 13 11 10 12 10 10
Omni 6 50 95 2 9 0 99 7 6 96 2 7 5
0 4 15 22 29 27 27 24 24 25 26 39 28 24
45 3 14 27 27 34 36 23 30 28 17 23 21 21
90 13 23 27 27 35 37 32 30 19 25 26 25 25
135 2 10 19 27 25 29 21 33 33 29 34 33 35

Dado el bajo nmero de pares de puntos en el primer punto de los


variogramas, se estableci el nmero mnimo de 15 pares de puntos y se
recalcularon todos los variogramas direccionales.
Figura 8. Variogramas direccionales con nmero mnimo de pares de puntos (15).

Tabla 8. Nmero de pares de puntos utilizados para el clculo de los variogramas.


Direcci
n 1 2 3 4 5 6 7 8 9 10 11 12
0 26 21 26 28 19 21 20 25 25 36 25
45 24 28 28 29 33 18 26 24 16 22 22
90 19 27 23 34 29 28 30 24 19 23 22 21
135 17 18 27 26 23 20 29 31 27 27 34

Se observo una mayor dependencia espacial en el variograma en la direccin


este (90). El resto de los variogramas direccionales no presentaron estructura
espacial clara, y se podran considerar como efecto pepita puro. Las marcadas
diferencias entre los variogramas direccionales manifiestan condiciones de
anisotropa geomtrica (variaciones en el rango respecto de la direccin).

Los paquetes R gstat y geoR no permiten definir la tolerancia entre pares de


puntos, esta opcin fue explorada mediante S-GeMS (Tabla 9) (Figura 9).

Tabla 9. Parmetros del variograma omnidireccional.


N de Separac Toleranc
lags in de ia de los
los lags lags
12 10 1
12 10 2
12 10 3
12 10 4

Figura 7. Variogramas omnidireccionales con distintas tolerancias.

Se observ que el aumento en la tolerancia estructura y suaviza el variograma


disminuyendo los saltos bruscos en los valores de la varianza. Tambin se
detect un posible efecto hoyo alrededor de los 50 m de distancia en el
variograma, lo que podra indicar regularidad en la distribucin espacial de las
concentraciones.

3. Ajuste del variograma terico

Se ajust un variograma terico al variograma experimental de direccin 90


mediante el comando fit.variogram de gstat (Tabla 10) (Figura 10).

Tabla 8. Variograma terico.


Modelo Meseta Rango
1 Pepita 2.26 0
2
Esfrico 8.73 52.3
Figura 10. Ajuste del variograma terico.

Se realiz una validacin cruzada para evaluar la bondad del ajuste del modelo
de variograma elegido (Figura 11). El error medio de estimacin (MEE) fue de
-0.0001, y el error cuadrado medio (ECM) de 0.106.

R = 0.6376

Figura 11. Diagrama de dispersin de datos y predichos.

4. Krigeado

Se construy una grilla de prediccin de 76 filas y 92 columnas, con un tamao


de pxel de 2.5. Se asumi que se producan fluctuaciones locales en la media
y se realiz un krigeado ordinario (Figura 12).
Figura 12. Krigiado ordinario.

Como puede observarse este tipo de krigeado presenta valores de varianza


relativamente bajos sobre toda la superficie.

You might also like