You are on page 1of 11

Approccio esplorativo

Processi Spazio-Temporali
Quando interessa una
temporale che spaziale.

modellazione

congiunta

sia

Si distinguono le analisi in due categorie: quelle


geostatistiche (Kyriakidis e Journel, 1999) e quelle
basate su modello.
Lapproccio geostatistico basa lanalisi del processo sotto
studio prevalentemente sullo studio della funzione di
covarianza spazio-temporale (considerando il dominio
spazio-temporale CONTINUO) e mira ad effettuare
previsioni nel tempo e nello spazio.
Il secondo approccio si basa sullo studio di processi
stocastici. Generalmente la funzione di covarianza non ha
espressioni semplici da trattare. Sviluppi anche bayesiani

- Si considera una struttura dati semplice dove ci


sono:
- n siti spaziali si, i=1,,n;
- T istanti di tempo;
- I dati Yij raccolti in una matrice nxT; matrice Y.

- Linsieme delle medie di riga della matrice Y


produce un processo spaziale mediato sul tempo.
- Dopo avere centrato ogni colonna, T YrYr ' una
matrice di covarianza empirica spaziale.
1

- Linsieme delle medie di colonna di Y produce una


serie storica mediata sul dominio spaziale.
1

- Dopo avere centrato ogni riga, n YcYc ' una matrice


di autocovarianza temporale empirica.

Un Modello generale

Sia Y(s,t) una misurazione al sito s al tempo t.


Una estensione del modello geostatistico al caso spaziotemporale Y(s,t)=(s,t)+e(s,t).
La struttura media (s,t) pu essere scritta come:
(s,t)=x(s,t)T(s,t)

Alcuni esempi di modellazione della media:


(s,t)=
(s,t)= (t) coefficienti che variano nel tempo
(s,t)= (s) coefficienti che variano nello spazio
La parametrizzazione spesso dipende dalla natura del trend e dalle
covariate nel modello

Generalmente e(s,t)~N(0,e2)

I residui e(s,t) possono essere scritti come:


e(s,t)=(t)+(s)+(s,t) struttura additiva (non c interazione spaziotemporale)
e(s,t)=s(t)+(s,t) forma potenzialmente differente dellevoluzione
temporale ad ogni sito
e(s,t)=(t)+(s)+(s,t) processo spaziale potenzialmente differente
ad ogni istante
3

Quando i dati sono costituiti da pochi siti e molti tempi


Due principali forme per la struttura temporale:
s(t)= s,t cio variabili temporali dicotomiche;
s(t+1)= s(t)+ s(t) dove s(t) sono v.c. iid.

Sia (t)=(s1(t),, sn(t)) con =((1),, (T))


Sia Y=++
Y| ,,2~N(+,2I)
Oppure Y| ,2, 2, ~N(,2A() IT+ 2ITn)

Quando i dati sono riferiti a pochi istanti temporali ma


sono molto ricchi di siti
Due principali forme per la struttura temporale:
wt(s)=ws,t sono variabili dummy spaziali
wt(s) un processo spaziale a media zero.

Sia w(t)=(wt(s1),, wt(sn)) con w=(w1,, wn)


Sia Y= +w+

Y| ,w,2~N(+w,2I)
Oppure Y| ,2, w2, ~N(,IT w2H() +2ITn)

Siano =((1),, (T)) e w=(w1,, wn)

La matrice di covarianza di Y

Sia Y=+ 1n+1T w+

Y| ,,w,2 ~N(+ 1n+1T w+, 2I)


Oppure Y| ,2, 2, , w2, ~
N(,2A() 1n1n+ w21T1T H() + 2ITn)

Si supponga di voler generalizzare al caso s 2 e t +


Un modello generale Y(s,t)= (s,t)+(s,t) ancora valido,
sebbene ora (s,t) sia un processo spazio-temporale.
Per processi gaussiani, sufficiente considerare la
funzione di covarianza spazio-temporali, cio
Cov(Y(s,t),Y(s,t))=c(s-s,t-t)=c(||s-s||,|t-t|) (isotropico)
Una forma separabile data da:
Cov(Y(s,t),Y(s,t))=2 1(s-s;) 2(t-t;)
5

Condizione di separabilit

Y ( 2 , , ) = 2 H S ( ) H t ( )

dove:
-Hs() una matrice di covarianza IxI con elementi
1(si-sj;)
-Ht() una matrice di covarianza JxJ con elementi
2(ti-tj;)
Y definita positiva poich il prodotto di Kronecker di
matrici definite positive definito positivo.

La forma additiva e la funzione di covarianza separabile


sono scelte spesso fatte di convenienza per semplicit e
interpretazione, ma sono ovviamente limitanti in quanto
non modellano linterazione spazio-temporale.
Alcune forme di covarianza spazio-temporale non
separabili sono state proposte in ambiti di
rappresentazione spettrale (Fourier)
Una classe di modelli spazio-temporali relativamente
semplici ha la forma

Ci sono vantaggi computazionali per usare la forma


separabile
La log-verosimiglianza per Y

c( s s ' , t t ' ) = 2 (| t t ' | +1) 1

ma

exp( || s s ' || (| t t ' | +1) 2 )


2 la varianza del processo
(compreso tra 0 e 1) rappresenta il parametro di interazione
spazio-temporale

e
7

Approccio geostatistico

Modelli spazio-temporali CAR

I dati di questo tipo dovrebbero rappresentare


qualche sorta di sequenza temporale per ogni
sito del lattice (es. conteggi di malattia per anno
in comuni)
Per dati gaussiani
Per dati non gaussiani
Possibili modelli per it

Spazio annidato nel tempo, cio it = it


Assegnare ai vicini temporali pesi diversi per vicini nel
tempo o nello spazio
CAR multivariato

Appartengono a questo approccio due tipi di modellazioni:


1)
quelle che considerano un modello casuale spazio-temporale.
Si considera una dipendenza congiunta spazio-temporale tra le
osservazioni. Si cerca di unire le conoscenze fisiche e quelle
statistiche per modellare il processo che si vuole studiare.
PROBLEMA: Linferenza sulla legge del processo spazio-temporale
richiede replicazioni nelle componenti spazio-temporali spesso non
disponibili
2) quelle che considerano vettori di funzioni spaziali o vettori di serie
storiche.
Si considera inizialmente il processo nella dimensione dominante e
poi spesso non si uniscono le componenti spazio-temporali.
Es. confronto di mappe nel tempo oppure confronti tra serie
storiche nello spazio.
Si scompone il processo spazio-temporale in semplici modelli
condizionati. Spesso poi modellati con approccio bayesiano.

Approccio basato su modello


-

10

Modelli gerarchici spazio-temporali


Wikle, Berliner e Cressie (2003)

Modelli gerarchici spazio-temporali:


Si scompone il processo spazio-temporale in semplici modelli
condizionati. Spesso poi modellati con approccio bayesiano.

Modelli dinamici
Si assume che lo stato immediatamente precedente del
processo influenzi lo stato corrente. Si include la componente
spazio temporale in modelli dinamici.

Hidden Markov Models


Si considera la struttura congiunta spazio-temporale come
condizionata su un processo latente (o nascosto)

11

12

Modelli gerarchici spazio-temporali

Modelli gerarchici spazio-temporali


Wikle, Berliner e Cressie (2003) applicazione sulla temperatura
massima

2)

Generalmente si definisce la distribuzione [Z|Y,1] come


distribuzione Gaussiana: Gau(Y(s,t),2s,t)
(si modellano variazioni di piccola e larga scala)

3)

Struttura spaziale e (ipotesi di indipendenza tra le componenti)

1)

3)
4) A priori sui parametri

5)
Poi si utilizzano procedure di Gibbs-sampling
13

Per la equazione di misurazione:

Modelli dinamici spazio-temporali


Si consideri una estensione della formulazione modelli
dinamici in cui:
zt un vettore mt dimensionale di osservazioni negli mt siti
spaziali;
Yt un vettore m-dimensionale che rappresenta un processo di
stati non osservabili spazio-temporali in alcune reti fisse di siti
s1,,sn al tempo t.

Il modello si pu scrivere:

z t = K t yt + t

(equazione di osservazione o misura)

yt = Hyt 1 + t

(equazione di stato o di transizione)

14

Kt una matrice mt x n nota che mappa i dati zt nel processo yt;


t a media zero, incorrelato nel tempo e gaussiano con una
matrice di covarianza Rt di dimensione mt x mt .

Per lequazione di stato:

H una matrice di transizione;


t rappresenta gli errori del sistema che sono spazialmente
dipendenti, temporalmente indipendenti, gaussiani a media 0 con
matrice di varianza e covarianza Q.

La forma di H spesso motivata dal problema scientifico


che si sta trattando.
Le possibili matrici di covarianza per tali modelli includono

cov[ t ] = 2 I

per t=1,,T
15

cov[t ] = 2C ( )

dove C() costruito per mezzo di una funzione di


covarianza spaziale esponenziale.
I modelli possono essere stimati mediante algoritmo EM
16
oppure usando MCMC.

Modelli dinamici

Stroud, Muller, Sans (applicazione sulle piogge tropicali in Venezuela)

Dove la prima equazione modella la dipendenza spaziale

Questa dinamica viene modellata attraverso:

17

18

La seconda equazione si collega attraverso i coefficienti alla precedente.

Limportanza della funzione di covarianza


spazio-temporale
Sotto lipotesi di normalit distributiva del
processo in esame si ricorda come esso possa
essere rappresentato in maniera esaustiva dai
sui primi due momenti. Per questo il valore
atteso e la funzione di covarianza vengono
generalmente presi in esame:
-quando interessa il trend spazio-temporale ci
si concentra sul valore atteso (s;t)=E(Z(s;t));
-quando lo scopo lo studio della evoluzione su
piccola scala si studia la funzione di covarianza
K(s,r;t,u)=Cov(Z(s;t),Z(r;u)).
19

Stazionariet (Kyriakidis e Journel, 1999)


zStazionariet in senso stretto: un processo spaziotemporale Z(t,s) si dice stazionario in senso stretto nel
dominio spazio-temporale TxS se le sue leggi distributive
(FdR) sono invarianti per traslazione.

Propriet molto difficile da testaresi restringe ai


primi due momenti:
zStazionariet debole del secondo ordine: un processo
spazio-temporale si dice stazionario del secondo ordine se la

La media costante per ogni sS, t T


La covarianza del tipo Cov(Z(t,x),Z(t+h,x+d)=C(h,d)
per ogni x S e t T dove h e d sono le distanze nello
spazio e nel tempo
20

Stazionariet Intrinseca

Assunzione di separabilit

Notazione: Si definisce p=(s,t)DxT come riferimento


spazio temporale
Si ha stazionariet intrinseca quando:
La media delle differenze prime del processo nulla
E(Z(p)-Z(p))=0

La varianza delle differenze prime una funzione


della sola distanza tra due punti osservati
Var(Z(p)-Z(p))=2(h), per ogni p, p DxT

21

Un modello spazio-temporale si dice separabile se la sua


funzione di covarianza spazio-temporale (o il suo
variogramma) pu essere scritto come somma o prodotto
di due funzioni di covarianza una puramente spaziale e una
puramente temporale
Lutilit nel postulare questa ipotesi sta nella diminuzione
del numero di parametri da stimare. Infatti se, ad
esempio, si dispone di s siti e p tempi. La stima della
matrice di varianza sp(sp+1)/2 parametri. Se c
indipendenza nel tempo s(s+1)/2 parametri, se
analogamente c indipendenza nello spazio p(p+1)/2
parametri. Ed infine nel caso di separabilit, visto che la
matrice finale calcolata come prodotto di Kronecker
delle due matrici di covarianza (una solo spaziale e una
solo temporale), il numero di parametri si riduce a
s(s+1)/2+p(p+1)/2-1.
22

Modelli separabili

Assunzione di separabilit
La riduzione del numero di parametri da stimare
utile anche perch nel caso in cui si vogliano
fare previsioni spaziali pi semplice in quanto si
necessita di calcolare linversa della matrice di
varianza-covarianza e

C(h;v)=Cs(h)CT(v)
C(h;v)=exp(-a||h||-b|v|)

C(h;v)=Cs(h)+CT(v)
Questo tipo di covarianza pu generare matrici di
var-cov. singolari (Myers and Journel 1990)
Non prevedono interazione tra spazio e tempo
In generale, una funzione di covarianza spazio-temporale
stazionaria separabile se esistono due funzioni
stazionarie una puramente temporale e una spaziale, tali
che vale la seguente condizione:

23

24

Modelli non separabili

Approccio di Gneiting (2002)

Primi tentativi di trattare la non-separabilit come


variazione della forma:
w(s; t) = w1(s; t) + w2(s; t)
per mezzo del mixing. Per esempio, si suppone che
con w1 e w2 processi indipendenti, ognuno con funzione
di covarianza separabile:
Quindi la funzione di covarianza per w(s,t) la somma
ed non separabile. Il difetto principale connesso al
fatto che produce una esplosione di parametri da
stimare.

25

Propone un approccio non dipendente dalle


trasformate di Fourier e introduce una classe
generale di modelli per le covarianze spaziotemporali
|| h ||2
2

C (h , u ) =

(| u |2 ) d / 2 (| u |2 )

Struttura
spaziale

Struttura temporale

dove (t ), t 0 una funzione completamente


monotona, e (t ), t 0 una funzione positiva
con derivata completamente monotona.
Gneiting T. (2002). Nonseparable, stationary covariance26
functions for space-time data. JASA, 97: 590-600.

Alcune applicazioni

Approccio di Gneiting (2002)

La scelta delle prime funzioni della tabella porta ad avere


una funzione di covarianza stazionaria:

c( s s' , t t ' ) =

27

(a | t t ' |2 +1) d / 2

c || s s ' ||2

exp
2

(a | t t ' | +1)
a,c sono parametri di scala non negativi relativamente del
tempo e dello spazio. I parametri di smoothness e
assumono valori compresi tra 0 e 1. 2 la varianza del
processo spazio-temporale.
Ruolo cruciale il parametro che rappresenta linterazione
spazio-temporale.
La funzione di covarianza puramente spaziale C(s-s,0) di
forma esponenziale mentre quella puramente temporale
C(0,t-t) appartiene alla classe di Cauchy.
28

Confronti grafici

Confronti grafici

29

30

Correlazioni spazio-temporali empiriche

Applicazione di Gneiting
Si considerano dati di vento in Irlanda (Haslett e Raftery,
1989)che consistono in medie giornaliere di velocit del
vento in 11 siti nel periodo 1961-1978.
1)Passano alla radice quadrata per ridurre la variabilit
2)Assumono le distribuzioni marginali
approssimativamente normali.
3)Si stima leffetto stagionale calcolando la media delle
radici quadrate delle medie giornaliere in tutti gli anni e
le stazioni per ogni giorno dellanno e quindi si
regrediscono il risultato su un andamento armonico.
4)Restringe la sua attenzione alla struttura di covarianza
per lag temporali da 0 a 4
31

Struttura spaziale di forma esponenziale


32

Quindi struttura spaziale

Test per saggiare la separabilit

Struttura temporale utilizza un modello fisico


del tipo (famiglia piuttosto generale)

Mitchell (2002) come caso specifico


del lavoro di dutilleul
Fuentes (2003) nellimpostazione
spettrale

Il prodotto

Che corrisponde al modello generale in cui


=0
33

Mitchell et al.
Parte con il considerare lipotesi nulla nel caso pi
generale:

34

La separabilit consiste nellosservare la struttura


temporale uguale in tutti i siti e la struttura spaziale la
stessa in tutti gli istanti di tempo.
Mitchell propone un test di separabilit, applicabile quando
c un processo multivariato iid, che usa la statistica del
rapporto della verosimiglianza basata sulla stima del
prodotto di kronecker di due matrici non strutturate vs la
stima di una matrice di var-cov non strutturata.

Questa semplificabile nel caso di un processo


stazionario del secondo ordine

Per campioni grandi la distribuzione della statistica test


pu essere approssimata con una distribuzione chiquadrato.

In termini di funzione di correlazione

Si ipotizza una distribuzione gaussiana dei dati, il test che


segue non richiede tuttavia che il processo sia stazionario
del secondo ordine e isotropico.
35

36

Limite:

spesso il numero di replicazioni pari a


1 e questo test non pu essere applicato. Molti
processi sono ricchi nel tempo e poveri nello
spazio, dunque la ricchezza nel tempo che pu
permettere di spezzare I dati in modo che
possano sembrare pseudo-replicazioni.

Tuttavia tali pseudo-replicazioni necessitano


una stessa struttura di varianza e
covarianza, quindi si necessita di assumere
stazionariet del secondo ordine nel tempo
37

Si saggia lipotesi

vs

nella condizione in cui U e V sono assunte ignote,


simmetriche.
Notazione r: dimensione campionaria, s: numero di siti, p
numero di tempi.
In generale la log-verosimiglianza di una normale
multivariata

Che in questo caso significa


Che stimato significa

38

Fuentes (2003)

Test finale (Mitchell)

Test presentato in un approccio spettrale. In


particolare esso riconducibile ad una analisi
della varianza a due vie.
Lipotesi generale
per i=1,,k e j=1,,n. I parametri
rappresentano gli effetti principali dello spazio
e i fattori legati alle frequenze. Lipotesi di
separabilit corrisponde al caso di j=0 e quindi:

Per lipotesi alternativa

Quindi il rapporto di verosimiglianze sar

39

40

Applicazione ai dati di qualit dellaria

Applicazione ai dati di qualit dellaria

Struttura spazio-temporale di un processo Z relativo a


flussi di ozono medi orari nel giugno 1996.

Si dispone di 72 osservazioni nel tempo.


1. Si rimuove il trend spazio-temporale
Trend spaziale: ozono-media del tren nel tempo per
ogni stazione;
Trend temporale: applicazione di sin e cosin con
periodo di 24 ore. (il ciclo giornaliero comune a
tutti i siti)
2.Si stimano
per mezzo delle funzioni cross
spettrali proposte in Fuentes (2005) per la coppia a,b nel
dominio D

dove
rappresenta il periodogramma del secondo ordine e W e g
sono due filtri.
La funzione f pu essere interpretata come una media
della energia totale del processo contenuto entro una
banda di frequenze in una regione di w e una regione nello
spazio nel vicinato di a e b

41

Applicazione ai dati di qualit dellaria


Quindi per ottenere stime approssimativamente
incorrelate, le frequenze wj e le coppie ai,bi
dovrebbero essere scelte opportunamente
(wj>/6 e distanza tra coppie a,b almeno di 5.5
punti griglia).
I risultati del test di separabilit usando 6 coppie
corrisponde a:

Evidenzia non separabilit!


43

42

Bibliografia
Banerjee, Carlin e Gelfand (2004), Hierarchical
Modeling and Analysis for Spatial Data, Chapman and
Hall.
Presentano una buona trattazione in una prospettiva Bayesiana
con molti riferimenti bibliografici.

Gneiting (2002), Nonseparable, stationary, covariance


functions for space-time data, JASA, 97, 590-600.
Kyriakidis e Journel (1999), Geostatistical space-time
models: a review, Mathematical Geology, 31, 651-684.
Xu e Wikle (2004), Estimation of parametrized spatiotemporal dynamic models,
www.stat.missouri.edu/~wikle/pub_new.html
44

You might also like