Note CPinf1112 - Antonella Calzolari

Modelli stocastici a valori discreti
Note del corso di CP per la L.M. in Informatica

A.Calzolari
1
Indice
1 Catene di Markov a tempo discreto 4
1.1 Richiami sullindipendenza stocastica
per eventi e variabili aleatorie . . . . . . . . . . . . . . . . . . 4
1.2 Denizione di catena di Markov . . . . . . . . . . . . . . . . . 6
1.3 Esempio di due successioni di variabili aleatorie
relative ad un unico esperimento di cui una Markov e laltra no 6
1.4 Passeggiata aleatoria sugli interi . . . . . . . . . . . . . . . . 8
1.5 Catene di Markov per ricorrenza . . . . . . . . . . . . . . . . 8
1.6 Legge al tempo 0 e legge al tempo 1 . . . . . . . . . . . . . . 10
1.7 Matrice di transizione in pi` u passi . . . . . . . . . . . . . . . 11
1.8 Leggi ad un tempo e leggi congiunte . . . . . . . . . . . . . . 13
1.9 Matrice di transizione in due passi
per la catena della rovina del giocatore . . . . . . . . . . . . . 14
1.10 La catena di nascita e morte e lurna di Ehrenfest . . . . . . . 15
1.11 Un modello per una la dattesa . . . . . . . . . . . . . . . . 16
1.12 Costruzione di una catena
data la matrice di transizione e la legge iniziale . . . . . . . . 18
1.13 Rappresentazione graca di una catena di Markov . . . . . . 20
1.14 Stati comunicanti . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.15 Classi chiuse e classi irriducibili . . . . . . . . . . . . . . . . . 23
1.16 Denizione di transienza e persistenza
in termini del tempo di primo ritorno . . . . . . . . . . . . . 24
1.17 Transienza e persistenza in termini del numero dei ritorni . . 25
1.18 Legge e valor medio del numero dei ritorni in uno stato . . . 27
1.19 Transienza e persistenza di uno stato
in termini del numero dei passaggi per esso
partendo da uno stato qualsiasi . . . . . . . . . . . . . . . . . 29
1.20 Una condizione suciente per la transienza . . . . . . . . . . 32
1.21 Una condizione suciente per la persistenza . . . . . . . . . . 33
1.22 Persistenza e transienza in classi nite . . . . . . . . . . . . . 34
1.23 Teorema di decomposizione dello spazio degli stati . . . . . . 35
1.24 Sistema di equazioni per le probabilità di assorbimento . . . . 36
1.25 Unicità della soluzione del sistema di equazioni
per le probabilità di assorbimento nel caso stati niti . . . . . 38
1.26 Probabilità di estinzione
per la catena di nascita e morte con estremi assorbenti . . . . 40
1.27 Persistenza o transienza per la catena di nascita e morte
irriducibile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
1.28 Tempi medi di assorbimento nella classe degli stati persistenti 43
1.29 La catena a due stati:
comportamento asintotico delle leggi al tempo n . . . . . . . 50
1.30 Denizione di misura invariante . . . . . . . . . . . . . . . . . 52
2
1.31 Esempi nel caso nito . . . . . . . . . . . . . . . . . . . . . . 52
1.32 Esistenza e unicità della misura invariante . . . . . . . . . . . 54
1.33 Catene ergodiche . . . . . . . . . . . . . . . . . . . . . . . . . 55
1.34 Catene regolari . . . . . . . . . . . . . . . . . . . . . . . . . . 56
1.35 La misura invariante per lurna di Ehrenfest . . . . . . . . . . 62
1.36 Non esistenza della misura invariante
per la passeggiata aleatoria simmetrica in Z . . . . . . . . . . 64
1.37 Misura invariante per le catene di nascita e morte . . . . . . . 64
1.38 Esempi di catene periodiche . . . . . . . . . . . . . . . . . . . 69
1.39 Periodo di una catena irriducibile . . . . . . . . . . . . . . . . 71
1.40 Reversibilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
1.41 Algoritmo di Metropolis . . . . . . . . . . . . . . . . . . . . . 74
1.42 Schema di dimostrazione
del teorema di esistenza della misura invariante
per catene irriducibili persistenti positive . . . . . . . . . . . . 77
1.43 Approssimazione della misura invariante
con la distribuzione empirica . . . . . . . . . . . . . . . . . . 78
1.44 Esercizi di riepilogo . . . . . . . . . . . . . . . . . . . . . . . . 80
2 Processo di Poisson 90
2.1 Denizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
2.2 Perdita di memoria . . . . . . . . . . . . . . . . . . . . . . . . 92
2.3 Merging e splitting . . . . . . . . . . . . . . . . . . . . . . . . 97
2.4 Processo di Poisson non stazionario . . . . . . . . . . . . . . . 101
2.5 Distribuzione dei tempi di salto in [0, T] condizionata a N(T)=n103
3 Processi di rinnovo 106
4 Catene di Markov a tempo continuo 110
4.1 Denizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
4.2 Funzione di transizione e tassi di salto . . . . . . . . . . . . . 113
4.3 Catene di nascita e morte . . . . . . . . . . . . . . . . . . . . 117
4.4 Code markoviane . . . . . . . . . . . . . . . . . . . . . . . . . 121
4.5 Misura invariante . . . . . . . . . . . . . . . . . . . . . . . . . 123
3
1 Catene di Markov a tempo discreto
1.1 Richiami sullindipendenza stocastica
per eventi e variabili aleatorie
Dato uno spazio di probabilità (, F, P), due eventi A e B in F sono
indipendenti se e solo se
P(A B) = P(A)P(B).
Allora una condizione suciente per lindipendenza è che almeno uno dei
due eventi abbia probabilità nulla; la condizione diventa anche necessaria se
gli eventi sono incompatibili, ovvero A B = .
Se P(B) = 0, si denisce la probabilità condizionata di A dato B
P(A|B) =
P(A B)
P(B)
e A e B sono indipendenti se solo se P(A|B) = P(A).
Sia {A
i
, i = 1, . . . , n} una famiglia di eventi: essi si dicono indipendenti
se per ogni k n e per ogni scelta di indici {i
1
, . . . , i
k
}
P
_
k
j=1
A
i
j
_
=
k
j=1
P(A
i
j
).
Lindipendenza implica per ogni k n e per ogni scelta di indici i
1
, . . . , i
k
P(A
i
k
| A
i
k1
. . . A
i
1
) = P(A
i
k
),
quando la probabilità condizionata ha senso. Una famiglia numerabile di
eventi si dice costituita da eventi indipendenti se ogni sua sottofamiglia
nita lo è.
Vale la seguente formula (formula del prodotto): se è n 2
P(A
1
A
2
. . . A
n
) =
P(A
n
| A
n1
A
n2
. . . A
1
)P(A
n1
| A
n2
. . . A
1
) . . . P(A
2
| A
1
)P(A
1
)
(se le probabilità condizionate hanno senso). Si userà la seguente notazione:
P(A B) = P(A, B)
cos` p.es.
P(A
1
, A
2
, A
3
) = P(A
3
| A
2
, A
1
)P(A
2
| A
1
)P(A
1
).
4
Si dimostra la formula del prodotto per induzione: per n = 2 è immediata
dalla denizione di probabilità condizionata; assunta vera per n, vale per
n+1, infatti applicando la formula del prodotto ai due eventi A
1
A
2
. . .A
n
e A
n+1
P(A
1
, A
2
, . . . , A
n
, A
n+1
) = P(A
n+1
| A
n
, . . . , A
1
)P(A
n
, . . . , A
1
)
e si conclude applicando lipotesi induttiva.
X
1
, . . . , X
m
variabili aleatorie reali denite sullo stesso spazio di proba-
bilità (, F, P) sono indipendenti:
nel caso discreto (cioè quando le v.a. assumono una quantità al pi` u numer-
abile di valori) se e solo se comunque scelti i valori reali x
1
, . . . , x
m
,
P(X
1
= x
1
, . . . , X
m
= x
m
) =
m
j=1
P(X
j
= x
j
);
nel caso continuo (cioè quando la funzione di distribuzione è una funzione
continua che si ottiene integrando una funzione densità) se e solo se co-
munque scelti i valori reali x
1
, . . . , x
m
P(X
1
x
1
, . . . , X
m
x
m
) =
m
j=1
P(X
j
x
j
).
Si può facilmente dimostrare che questo equivale a dire che sono indipendenti
nel caso discreto gli eventi della forma {X
i
= x
i
} e nel caso continuo gli
eventi della forma {X
i
x
i
}, al variare comunque di i e x
i
. Cos`, p.es., nel
caso discreto lindipendenza implica, per ogni k m e per ogni scelta di
indici {i
1
, . . . , i
k
} e di valori {x
i
1
, . . . , x
i
k
},
P(X
i
k
= x
i
k
| X
i
k1
= x
i
k1
, . . . , X
i
1
= x
i
1
) = P(X
i
k
= x
i
k
).
Indipendenza di famiglie innite di variabili: è quando qualsiasi sottofamiglia
nita verica lindipendenza.
Variabili aleatorie indipendenti e tutte con la stessa legge di probabilità
si dicono indipendenti e identicamente distribuite e questo si abbrevia con
i.i.d.
Si può dimostrare ([1]) che:
Teorema Se le variabili aleatorie reali X
1
, . . . , X
m
, Y
1
, . . . , Y
k
sono in-
dipendenti, allora sono indipendenti le variabili aleatorie (X
1
, . . . , X
m
) e
(Y
1
, . . . , Y
k
) denite tramite le funzioni : R
m
R
l
e : R
k
R
h
.
5
1.2 Denizione di catena di Markov
Sia S un insieme nito o numerabile. Una famiglia (X
n
)
n
di variabili aleato-
rie a valori in S denite tutte sullo stesso spazio di probabilità è una catena
di Markov se qualsiasi sia n (quando le probabilità condizionate hanno senso)
P(X
n+1
= j | X
n
= i, X
n1
= i
n1
, . . . , X
0
=i
0
)
= P(X
n+1
= j | X
n
= i).
Interpretazione: la conoscenza del valore di X
n
può dare informazioni sul val-
ore di X
n+1
, ma la conoscenza dei valori di (X
n1
, . . . , X
0
) non dà ulteriori
informazioni.
Gli elementi di S sono gli stati possibili della catena e si può sempre
assumere S Z. Si pone
p
ij
(n) = P(X
n+1
= j | X
n
= i).
Il parametro n è interpretato come tempo e il numero p
ij
(n) è detto proba-
bilità di transizione dallo stato i al tempo n allo stato j al tempo successivo,
n + 1.
Si deniscono catene di Markov omogenee quelle in cui qualsiasi sia n e
per ogni i, j
p
ij
(n) = p
ij
.
La matrice (eventualmente innita) P = (p
ij
)
(i,j)
è detta matrice delle prob-
abilità di transizione della catena (o pi` u brevemente matrice di transizione)
e i suoi elementi soddisfano
p
ij
0
e qualsiasi sia i
j
p
ij
= 1.
Una matrice i cui elementi soddisfano le precedenti proprietà si dice matrice
stocastica.
1.3 Esempio di due successioni di variabili aleatorie
relative ad un unico esperimento di cui una Markov e
laltra no
Si estrae una pallina da un bussolotto contenente N palline, di cui N
B
sono
bianche e N
R
sono rosse; lestrazione è casuale con reimmissione della pallina
estratta e di c palline del colore estratto e d del colore non estratto.
a) (X
n
)
n1
, con X
n
=risultato della n-ma estrazione non è in generale
una catena di Markov. Qui S = {B, R}. Si dimostra p.es. che se c = d
6
P(X
3
= B | X
2
= R) = P(X
3
= B | X
2
= R, X
1
= R).
Si ha
P(X
3
= B | X
2
= R, X
1
= R) =
N
B
+ 2d
N + 2(c +d)
,
e
P(X
3
= B | X
2
= R)
=
P(X
3
= B, X
2
= R, X
1
= R) + P(X
3
= B, X
2
= R, X
1
= B)
P(X
2
= R)
=
1
P(X
2
= R)
_
N
B
+ 2d
N + 2(c +d)
N
R
+c
N +c +d
N
R
N
+
N
B
+ (c +d)
N + 2(c +d)
N
R
+d
N +c +d
N
B
N
_
,
dove per calcolare ciascuno dei due addendi del numeratore si è utilizzata la
formula del prodotto, p.es.
P(X
3
= B, X
2
= R, X
1
= R) =
P(X
3
= B | X
2
= R, X
1
= R) P(X
2
= R | X
1
= R) P(X
1
= R).
Poiche P(X
2
= R) coincide con
P(X
2
= R | X
1
= R)P(X
1
= R) + P(X
2
= R | X
1
= B)P(X
1
= B)
=
N
R
+c
N +c +d
N
R
N
+
N
R
+d
N +c +d
N
B
N
,
semplicando si ottiene
P(X
3
= B | X
2
= R)
=
(N
B
+ 2d)(N
R
+c)N
R
+
_
N
B
+ (c +d)
_
(N
R
+d)N
B
_
N + 2(c +d)
__
(N
R
+c)N
R
+ (N
R
+d)N
B
_ .
Dalluguaglianza P(X
3
= B | X
2
= R, X
1
= R) = P(X
3
= B | X
2
= R) con
semplici passaggi si ottiene
(N
B
+2d)
_
1
(N
R
+c)N
R
(N
R
+c)N
R
+ (N
R
+d)N
B
_
=
_
N
B
+ (c +d)
_
(N
R
+d)N
B
(N
R
+c)N
R
+ (N
R
+d)N
B
.
Risolvendo si trova che luguaglianza sussiste solo se c = d. Se fosse per
esempio c > d, allora si troverebbe, coerentemente con lintuizione, P(X
3
=
B | X
2
= R, X
1
= R) < P(X
3
= B | X
2
= R).
b) (X
n
)
n1
, con X
n
=numero di palline bianche nel bussolotto dopo la
n-ma estrazione è una catena di Markov non omogenea.
Qui S = N ed è immediato dalla denizione che
P(X
n+1
= j | X
n
= i, X
n1
= i
n1
, . . . , X
1
= i
1
) = P(X
n+1
= j | X
n
= i)
e in particolare, qualsiasi sia n, la probabilità di transizione p
ij
(n) è nulla se
j = i +c, i +d, vale
i
N+n(c+d)
quando j = i +c e vale 1
i
N+n(c+d)
quando
j = i +d.
7
1.4 Passeggiata aleatoria sugli interi
Siano
1
,
2
, . . . ,
n
, . . . variabili aleatorie a valori interi sullo stesso spazio di
probabilità e i.i.d. di densità f() (e quindi f() una densità discreta su Z).
Sia X
0
una variabile aleatoria sullo stesso spazio di probabilità e a valori in
Z indipendente dalle altre (p.es. X
0
una costante in Z). Se si denisce
X
n+1
= X
0
+
1
+
2
+. . . +
n+1
, n 0
allora (X
n
)
n0
è una catena di Markov omogenea detta passeggiata aleatoria
in Z.
Questo è il modello per la posizione di una particella che si muove su Z
secondo la regola: inizialmente è in Z distribuita secondo la legge di X
0
e
poi se è in i salta in j con probabilità f(j i).
Infatti poiche X
n+1
= X
n
+
n+1
P(X
n+1
= j | X
n
= i) =
P(X
n
+
n+1
= j, X
n
= i)
P(X
n
= i)
= P(
n+1
= j i | X
n
= i)
= P(
n+1
= j i | X
0
+
1
+
2
+. . . +
n
= i)
= P(
n+1
= j i)
= f(j i),
dove nella penultima uguaglianza si utilizza il teorema del paragrafo 1 ap-
plicato alle variabili
n+1
e (X
0
,
1
,
2
, . . . ,
n
) dunque con m = 1, l = 1, k =
n + 1, h = 1, (x) = x, (y
1
, . . . , y
k
) = y
1
+. . . +y
k
.
Analogamente si può calcolare
P(X
n+1
= j | X
n
= i, X
n1
= i
n1
, . . . , X
0
= i
0
) = f(j i),
dimostrando cos` che (X
n
)
n0
è una catena di Markov con probabilità di
transizione p
ij
= f(j i). Un caso semplice è il seguente: f(1) = p, f(1) =
q, f(0) = r con r, p, q 0 e r +p +q = 1 e quindi p
ij
= p, r, q o 0 a seconda
che sia j = i + 1, i, i 1 o altro.
1.5 Catene di Markov per ricorrenza
Teorema Siano
1
,
2
, . . . ,
n
, . . . variabili aleatorie i.i.d. a valori in un sot-
toinsieme U dei reali e X
0
variabile aleatoria a valori in S sottoinsieme
discreto dei reali, denita sullo stesso spazio di probabilità e indipendente
dalle altre. Sia h : S U S. Posto per n 0
X
n+1
= h(X
n
,
n+1
),
(X
n
)
n0
è una catena di Markov omogenea a valori in S.
8
Dimostrazione Per ricorrenza esiste g
n+1
: S U . . . U S tale che
X
n+1
= g
n+1
(X
0
,
1
, . . .
n+1
),
dove
_
g
1
(x, y
1
) = h(x, y
1
)
g
n+1
(x, y
1
, . . . , y
n+1
) = h
_
g
n
(x, y
1
, . . . , y
n
), y
n+1
_
.
Segue che
P(X
n+1
= j | X
n
= i) =
P(h(X
n
,
n+1
) = j, X
n
= i)
P(X
n
= i)
= P
_
h(i,
n+1
) = j | g
n
(X
0
,
1
, . . . ,
n
) = i
_
= P
_
h(i,
n+1
) = j
_
= P
_
h(i,
1
) = j
_
,
dove la penultima uguaglianza segue dal teorema del paragrafo 1 applicato
alle variabili
n+1
e (X
0
,
1
, . . . ,
n
) dunque con m = 1, l = 1, k = n+1, h =
1, (x) = h(i, x) e (y
1
, . . . , y
k
) = g
n
(y
1
, . . . , y
k
) e lultima dal fatto che le
variabili
1
e
n+1
hanno la stessa legge.
Allo stesso modo vale
P(X
n+1
= j | X
n
= i, X
n1
= i
n1
, . . . , X
0
= i
0
)
= P
_
h(i,
n+1
) = j | g
n
(X
0
,
1
, . . . ,
n
) = i, . . . , g
1
(X
0
,
1
) = i, X
0
= i
0
_
= P
_
h(i,
1
) = j
_
per il teorema del paragrafo 1 applicato in modo opportuno alle variabili
n+1
e (X
0
,
1
, . . . ,
n
). Si è cos` dimostrato che
P(X
n+1
= j | X
n
= i) = P(X
n+1
= j | X
n
= i, X
n1
= i
n1
, . . . , X
0
= i
0
)
= P
_
h(i,
1
) = j
_
,
ovvero che il processo è una catena di Markov omogenea con probabilità di
transizione p
ij
= P
_
h(i,
1
) = j
_
. La passeggiata aleatoria sugli interi è un
esempio di catena per ricorrenza con S = U = Z e h(x, y) = x +y e quindi,
come già mostrato, p
ij
= P(i +
1
= j) = P(
1
= j i) = f(j i).
Esercizio 1
Dimostrare che il numero dei successi su n prove bernoulliane è una catena.
Soluzione
Indicata con S
n
la v.a. numero dei successi su n prove bernoulliane, n 1,
9
vale S
n
=
1
+
2
+ . . . +
n
con
1
,
2
, . . . ,
n
, . . . variabili aleatorie i.i.d.
denite sullo spazio di Bernoulli cos`
i
() =
i
= 1 o 0 con probabilità
1 o 1 p.
Dunque, posto S
0
0, la successione di variabili aleatorie (S
n
)
n0
è una
catena di Markov per ricorrenza con S = N, U = {0, 1} e h(x, y) = x + y.
Le probabilità di transizione sono dunque p
ij
= p, 1 p o 0 rispettivamente
per j = i + 1, i o altro e quindi la matrice di transizione con innite righe e
innite colonne è
P =
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
1 p p 0 0 0 . . . 0 0 0 0 . . .
0 1 p p 0 0 . . . 0 0 0 0 . . .
0 0 1 p p 0 . . . 0 0 0 0 . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
0 . . . 0 1 p p 0 . . .
. . . . . .
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
(S
n
)
n0
è un caso particolare di passeggiata aleatoria su Z: il valore
iniziale S
0
è costante pari a 0, la densità di salto f() è la densità di Bernoulli
di parametro p ovvero f(1) = p e f(0) = 1 p.
1.6 Legge al tempo 0 e legge al tempo 1
Introdotta la notazione
0
(i) = P(X
0
= i), i S,
0
è la densità di probabilità di X
0
che induce una misura di probabilità sui
sottoinsiemi di S, ovvero la legge di X
0
, detta legge iniziale della catena o
legge al tempo 0. Può esistere i
0
S tale che
0
(i
0
) = 1 e quindi
0
(i) = 0
per qualsiasi i = i
0
; in tal caso la legge iniziale assegna valore 1 ai sottoin-
siemi che contengono i
0
e valore 0 agli altri e si chiama delta di Dirac in
i
0
.
Per la densità al tempo 1 denita da
1
(j) = P(X
1
= j), j S,
si può ricavare la formula
1
(j) =
iS
p
ij
0
(i).
10
Infatti per la formula delle probabilità totali
1
(j) = P(X
1
= j) =
iS
P(X
1
= j | X
0
= i)P(X
0
= i).
Si può scrivere con notazione matriciale
1
=
0
P
dove qui e in seguito si intende esteso il concetto di moltiplicazione di due
matrici anche a matrici con un numero innito di righe e/o colonne e i vettori
sono pensati come vettori riga, p.es.
0
=
_
0
(1)
0
(2) . . .
0
(card(S)
_
.
La densità al tempo 1 induce una misura di probabilità sui sottoinsiemi
di S detta legge al tempo 1, che è la legge della variabile X
1
.
1.7 Matrice di transizione in pi` u passi
`
E facile dimostrare che se (X
n
)
n0
è una catena di Markov omogenea vale
anche per ogni n 0, r > 1
P(X
n+r
= j | X
n
= i, X
n1
= i
n1
, . . . , X
0
= i
0
) = P(X
n+r
= j | X
n
= i).
Nel caso r = 2:
P(X
n+2
= j | X
n
= i, . . . , X
0
= i
0
) coincide con
kS
P(X
n+2
= j, X
n+1
= k, X
n
= i, . . . , X
0
= i
0
)
P(X
n
= i, . . . , X
0
= i
0
)
e, moltiplicando e dividendo il termine generale della serie per
P(X
n+1
= k, X
n
= i, . . . , X
0
= i
0
),
si ottiene
kS
P(X
n+2
= j | X
n+1
= k,X
n
= i, . . . , X
0
= i
0
)
P(X
n+1
= k | X
n
= i, . . . , X
0
= i
0
)
che per la proprietà di Markov coincide con
kS
p
ik
p
kj
.
Lespressione precedente è lelemento di posto i, j del prodotto righe per
colonne di P per se stessa, cioè di P
2
= P P.
11
In modo analogo si calcola
P(X
n+2
= j | X
n
= i),
ottenendo lo stesso risultato. Si indica con p
(2)
ij
lelemento generico di P
2
,
cioè (P
2
)
ij
: dunque esso rappresenta la probabilità di passare dallo stato i
allo stato j in 2 passi.
Si consideri ora il caso generale: si dimostra per induzione che
P(X
n+r
= j | X
n
= i) = P(X
n+r
= j | X
n
= i, . . . , X
0
= i
0
) = (P
r
)
ij
,
assumendolo vero per r 1 e utilizzando lipotesi di Markov (corrispondente
al caso r = 1). Qui con ovvia notazione P
r
è il prodotto di P per se stessa
r volte.
Si ha che P(X
n+r
= j | X
n
= i, . . . , X
0
= i
0
) coincide con
kS
P(X
n+r
= j, X
n+r1
= k, X
n
= i, . . . , X
0
= i
0
)
P(X
n
= i, . . . , X
0
= i
0
)
e quindi moltiplicando e dividendo il termine generale della serie per
P(X
n+r1
= k, X
n
= i, . . . , X
0
= i
0
),
coincide con
kS
P(X
n+r
= j | X
n+r1
= k,X
n
= i, . . . , X
0
= i
0
)
P(X
n+r1
= k | X
n
= i, . . . , X
0
= i
0
)
cioè con
kS
p
kj
P(X
n+r1
= k | X
n
= i, . . . , X
0
= i
0
).
Per lipotesi induttiva lespressione precedente coincide con
kS
p
kj
(P
r1
)
ik
= (P
r
)
ij
.
Dunque P
r
, la potenza rma di P, è la matrice di transizione in r passi e
il suo generico elemento (P
r
)
ij
si denota con p
(r)
ij
.
`
E facile vericare che si
tratta di una matrice stocastica, cioè
0 p
(r)
ij
1
jS
p
(r)
ij
= 1.
12
La seconda proprietà segue osservando che
jS
p
(r)
ij
=
jS
P(X
r
= j | X
0
= i) =
P
_
jS
{X
r
= j} | X
0
= i
_
= P(X
r
S | X
0
= i) = 1.
1.8 Leggi ad un tempo e leggi congiunte
Se (X
n
)
n0
è una catena allora per ogni n 0 la densità di X
n
si denota
con
n
, cioè
n
(i) = P(X
n
= i), i S
e la legge di X
n
si dice legge al tempo n.
La densità al tempo n 1 si calcola in termini della densità iniziale e
della matrice di transizione in n passi:
n
(i) =
i
0
S
P(X
n
= i | X
0
= i
0
)P(X
0
= i
0
)
=
i
0
S
p
(n)
i
0
i
0
(i
0
),
dove al primo passaggio si è usata la formula delle probabilità totali.
Fissati m > 1 e n
1
< n
2
< . . . < n
m
, la legge del vettore aleatorio
(X
n
1
, . . . , X
n
m
) è la legge congiunta ai tempi n
1
, . . . , n
m
e la sua densità
denita da
P(X
n
1
= i
1
, . . . , X
n
m
= i
m
), i
1
, i
2
, . . . , i
m
S S . . . S
è detta densità congiunta ai tempi n
1
, . . . , n
m
.
Si calcola la densità congiunta ai tempi n
1
, . . . , n
m
utilizzando la formula
del prodotto del paragrafo 1 applicata agli eventi
{X
n
1
= i
1
}, . . . , {X
n
m
= i
m
}
e la proprietà di Markov:
P(X
n
1
= i
1
, . . . , X
n
m
= i
m
)
= P(X
n
m
= i
m
| X
n
m1
= i
m1
) . . . P(X
n
2
= i
2
| X
n
1
= i
1
)P(X
n
1
= i
1
)
= p
(n
m
n
m1
)
i
m1
i
m
. . . p
(n
2
n
1
)
i
1
i
2

n
1
(i
1
)
Dunque concludendo si può aermare che, conoscendo la legge iniziale e
la matrice di transizione, si calcolano le leggi ad un tempo e tutte le leggi
congiunte.
13
1.9 Matrice di transizione in due passi
per la catena della rovina del giocatore
Due giocatori A e B di capitali a e b rispettivamente, scommettono ogni
volta 1 euro e ogni volta A vince con probabilità p e quindi B vince con
probabilità q = 1 p. Il gioco termina se uno dei due esaurisce il capitale.
Se X
n
è il capitale di A dopo la n-ma scommessa, posto d = a + b, si può
scrivere
X
n+1
=
_
X
n
+
n+1
_
I
{1,...,d1}
(X
n
) +X
n
I
{0,d}
(X
n
), n 0
dove I
A
(x) = 1 se x A e 0 altrimenti e le
n
, n 1 sono variabili
aleatorie tra loro indipendenti che valgono 1 con probabilità p e 1 con
probabilità q = 1 p .
Posto X
0
a, (X
n
)
n0
è una catena di Markov per ricorrenza con:
0
la delta di Dirac in a, S = {0, 1, . . . , d}, U = {1, 1} e
h(x, y) = (x +y)I
{1,...,d1}
(x) +xI
{0,d}
(y).
La matrice di transizione è una matrice di ordine d+1 e ha la forma
P =
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
1 0 0 0 0 . . . 0 0 0 0
q 0 p 0 0 . . . 0 0 0 0
0 q 0 p 0 . . . 0 0 0 0
. . .
. . .
. . .
. . .
. . .
. . .
. . . q 0 p
0 . . . 0 0 0 1
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
Se assumiamo d = 4, la matrice P è di ordine 5 e coincide con
P =
_
_
_
_
_
_
1 0 0 0 0
q 0 p 0 0
0 q 0 p 0
0 0 q 0 p
0 0 0 0 1
_
_
_
_
_
_
e il suo quadrato è
P
2
=
_
_
_
_
_
_
1 0 0 0 0
q qp 0 p
2
0
q
2
0 2qp 0 p
2
0 q
2
0 qp p
0 0 0 0 1
_
_
_
_
_
_
.
14
Si osservi che per ogni i
4
j=0
p
(2)
ij
= 1
come deve essere.
Cos` se, per esempio X
0
= a = 2, essendo
0
(2) = 1 e
0
(i) = 0 per ogni
i = 2, vale
P(X
2
= 0) =
iS
p
(2)
i0

0
(i) = p
(2)
20
= q
2
,
come ci si aspetta dovendo P(X
2
= 0) coincidere con la probabilità di due
perdite consecutive.
1.10 La catena di nascita e morte e lurna di Ehrenfest
Una catena su S = {0, 1, . . . , d} con matrice di transizione
P =
_
_
_
_
_
_
_
_
r
0
p
0
0 . . . 0 . . . 0
q
1
r
1
p
1
0 0 . . . 0
0 q
2
r
2
p
2
0 . . . 0

0 0 . . . 0 q
d1
r
d1
p
d1
0 0 . . . 0 0 q
d
r
d
_
_
_
_
_
_
_
_
dove 0 q
i
, r
i
, p
i
1 e q
i
+r
i
+p
i
= 1, è chiamata catena di nascita e morte.
Il nome deriva dal fatto che questa catena può essere pensata come modello
per la consistenza numerica di una popolazione su una scala temporale in
cui ad ogni unità di tempo può accadere che un solo individuo generi un
nuovo individuo o muoia, dunque le possibili transizioni dallo stato i sono
solo in i + 1, i, i 1 e
p
i (i+1)
= p
i
p
i i
= r
i
p
i (i1)
= q
i
e p
i j
= 0 j = i+, i, i 1. Allora p
i
e q
i
prendono rispettivamente il nome
di probabilità di nascita e probabilità di morte (quando la consistenza della
popolazione è i).
La rovina del giocatore è una particolare catena di nascita e morte con
parametri
r
0
= 1 = r
d
p
i
= p r
i
= 0 q
i
= q, i = 1, . . . , d 1.
15
Unaltra catena di nascita e morte è quella di Ehrenfest, la cui matrice
di transizione è
P =
_
_
_
_
_
_
_
_
0 1 0 . . . 0 . . . 0
1
d
0
d1
d
0 0 . . . 0
0
2
d
0
d2
d
0 . . . 0

0 0 . . . 0
d1
d
0
1
d
0 0 . . . 0 0 1 0.
_
_
_
_
_
_
_
_
`
E modello per lo scambio di molecole tra due corpi isolati ovvero è modello
per la seguente situazione: d palline numerate sono contenute in due urne,
un intero tra 1 e d è estratto ripetutamente a caso e la pallina corrispondente
è spostata di urna. Fissata unurna, X
0
è il numero di palline inizialmente
nellurna e X
n
, n 1 è il numero di palline nella stessa urna dopo la n-ma
estrazione.
1.11 Un modello per una la dattesa
Si considera la catena per ricorrenza seguente
_
X
0
= 0
X
n+1
= max
_
0, X
n
1
_
+
n+1
, n 0
dove
1
,
2
, . . . ,
n
, . . . sono i.i.d. a valori in N di densità assegnata f().
Si può anche scrivere per n 0
X
n+1
= I
[1,+)
(X
n
)
_
X
n
1 +
n+1
_
+I
{0}
(X
n
)
n+1
Chiaramente S = N e
p
0j
= f(j)
mentre per ogni i 1, usando la denizione di probabilità condizionata e
lindipendenza di
n+1
da X
n
, si ottiene
p
ij
= P(X
n
1 +
n+1
= j | X
n
= i) = P(
n+1
= j i + 1) = f(j i + 1).
Questo è un modello per una la dattesa ad uno sportello che in ogni unità
di tempo serve un cliente e riceve un numero aleatorio di clienti ogni volta di
stessa legge indipendentemente dal passato. Per n 1 la variabile aleato-
ria X
n
rappresenta il numero dei clienti in la alla ne della n-ma unità
temporale.
16
Esercizio 2
a) Scrivere la matrice di transizione per la catena su S = {0, 1, 2} denita
da
X
n+1
= X
n
+
n+1
(modulo 3)
dove
1
,
2
, . . . ,
n
. . . sono variabili i.i.d. a valori in S con densità f() e
indipendenti da X
0
, variabile sullo stesso spazio di probabilità e a valori in
S.
Per esempio se X
0
() = 1,
1
() = 1,
2
() = 2,
3
() = 1, . . . sarà
X
0
() = 1, X
1
() = 2, X
2
() = 1, X
3
() = 2, . . ..
b) Calcolare
1
(2) = P(X
1
= 2), nel caso f(0) = 0.5, f(1) = 0.1, f(2) =
0.4 e
0
(0) = 0.5,
0
(1) = 0.5,
0
(2) = 0.
Soluzione
a) La matrice di transizione è di ordine 3 e ha la forma seguente
P =
_
_
f(0) f(1) f(2)
f(2) f(0) f(1)
f(1) f(2) f(0)
_
_
.
Notare che non solo per ogni i {0, 1, 2}
jS
p
ij
=
2
l=0
f(l) = 1,
ma anche per ogni j {0, 1, 2}
iS
p
ij
=
2
l=0
f(l) = 1.
Una matrice stocastica tale che gli elementi di ciascuna colonna hanno
somma pari a 1 si dice doppiamente stocastica.
b) Con i dati assegnati la matrice di transizione è
P =
_
_
0.5 0.1 0.4
0.4 0.5 0.1
0.1 0.4 0.5
_
_
e
1
(2) = P(X
1
= 2) =
2
i=0
p
i2
0
(i) = 0.5 p
02
+ 0.5 p
12
= 0.25
17
1.12 Costruzione di una catena
data la matrice di transizione e la legge iniziale
`
E immediato vericare che una v.a. X a valori in N \ {0} con densità
assegnata (p
1
, p
2
, . . . , p
N
) si costruisce cos`: se è una v.a. uniforme in
[0, 1], posto
a(1) = 0, a(j) =
j1
k=1
p
k
, j > 1
b(1) = p
1
, b(j) =
j
k=1
p
k
, j > 1
si denisce
X :=
j1
j I
[a(j),b(j))
().
Siano assegnate una densità di probabilità
0
e una matrice di tran-
sizione P su N\ {0}. Siano (
n
)
n1
variabili aleatorie i.i.d. uniformi in [0, 1]
indipendenti da unaltra variabile aleatoria X
0
denita sullo stesso spazio di
probabilità e con densità
0
. Posto
a(i, 1) = 0, a(i, j) =
j1
k=1
p
i k
, j > 1
b(i, 1) = p
i 1
, b(i, j) =
j
k=1
p
i k
, j > 1
h(i, y) =
j1
j I
[a(i,j),b(i,j))
(y),
si denisca
X
n+1
:= h(X
n
,
n+1
), n 0.
Allora (X
n
)
n0
è una catena di Markov per ricorrenza a valori in N\{0} con
legge iniziale
0
e matrice di transizione quella assegnata. Infatti ricordando
che per le catene per ricorrenza
P(X
n+1
= j | X
n
= i) = P(h(i,
1
) = j),
in questo caso dallespressione di h segue che
P(X
n+1
= j | X
n
= i) = P
_
1
[a(i, j), b(i, j))
_
= p
i j
,
18
dove lultima uguaglianza segue dal fatto che
1
ha legge uniforme nellin-
tervallo [0, 1] e lampiezza dellintervallo [a(i, j), b(i, j)) è p
i j
.
Questa costruzione suggerisce come simulare una catena di Markov con
spazio degli stati nito {1, 2, . . . , N} e con legge iniziale e matrice di tran-
sizione assegnata. Per simulazione di una catena di Markov (X
n
)
n0
-
no al tempo n si intende la determinazione di una sequenza di n valori
(i
1
, i
2
, . . . , i
n
) {1, 2, . . . , N} che costituiscano una realizzazione del vettore
aleatorio (X
1
, X
2
, . . . , X
n
), ovvero tali che si abbia per un qualche
(X
1
(), X
2
(), . . . , X
n
()) = (i
1
, i
2
, . . . , i
n
).
Si assuma inizialmente per semplicità che la legge iniziale sia una delta
di Dirac e quindi che sia X
0
= i
0
, dove i
0
è un numero in {1, 2, . . . , N}. I pi` u
noti linguaggi di programmazione hanno in libreria una procedura che genera
una variabile aleatoria uniforme in [0, 1] e richiamando n volte la stessa
procedura si realizza un vettore n-dimensionale le cui componenti sono i.i.d.
uniformi in [0, 1], ovvero un vettore come (
1
,
2
, . . . ,
n
): in altre parole si
genera una sequenza di n numeri che coincidono con (
1
(),
2
(), . . . ,
n
())
per un qualche . Al primo passo della simulazione si genera X
1
come
variabile aleatoria di densità assegnata pari a (p
i
0
1
, p
i
0
2
, . . . , p
i
0
N
), cioè il
numero i
1
:
i
1
= X
1
() =
N
j=1
j I
[a(i
0
,j),b(i
0
,j))
(
1
());
al secondo passo si genera X
2
come variabile aleatoria di densità assegnata
pari a (p
i
1
1
, p
i
1
2
, . . . , p
i
1
N
), cioè il numero i
2
i
2
= X
2
() =
N
j=1
j I
[a(i
1
,j),b(i
1
,j))
(
2
());
e si ripete il procedimento no a generare X
n
come variabile aleatoria di
densità (p
i
n1
1
, p
i
n1
2
, . . . , p
i
n1
N
), cioè il numero i
n
i
n
= X
n
() =
N
j=1
j I
[a(i
n1
,j),b(i
n1
,j))
(
n
()).
Nel caso in cui X
0
non sia deterministico, cè in pi` u il passo iniziale della
generazione di X
0
. In tal caso occorre richiamare una volta di pi` u la pro-
cedura di simulazione di ununiforme in [0, 1] per generare
0
indipendente
da (
1
,
2
, . . . ,
n
) e con
0
generare X
0
come variabile aleatoria di densità
(
0
(1),
0
(2), . . . ,
0
(N)), cioè il numero i
0
.
19
Esercizio 3
Per la catena dellEsercizio 2 calcolare la densità congiunta ai tempi 1 e 2
nel punto 2. Calcolare poi la probabilità che la catena si trovi nello stato 2
dopo 2 passi.
Soluzione
a) Ricordando che
P =
_
_
0.5 0.1 0.4
0.4 0.5 0.1
0.1 0.4 0.5
_
_
e
0
(0) =
0
(1) = 0.5 e che nellEsercizio 2 si è ottenuto
1
(2) = 0.25, si ha
per la formula del prodotto
P(X
2
= 0, X
1
= 2) = P(X
2
= 0 | X
1
= 2)P(X
1
= 2) = p
20
1
(2) = 0.025.
Invece
2
(2) = P(X
2
= 2) =
2
i=0
p
(2)
i2

0
(i) = p
(2)
02
(0.5) +p
(2)
12
(0.5).
Si devono calcolare dunque gli elementi di posto prima riga, terza colonna
e seconda riga, terza colonna del quadrato di P.
Si trova
P
2
=
_
_
0.41
0.26

_
_
e quindi
2
(2) = (0.5)(0.41 + 0.26) = 0.335.
1.13 Rappresentazione graca di una catena di Markov
Il graco di una catena di Markov si ottiene segnando un punto per ogni stato
della catena, una freccia orientata da un punto ad un altro se la probabilità
di transizione in un passo è positiva e il valore della probabilità di transizione
accanto alla freccia. Cos` per esempio
La rappresentazione graca consente di calcolare rapidamente le probabilità
di transizione in pi` u passi. Per esempio se la matrice di transizione è
P =
_
_
0 0.5 0.5
0.4 0.1 0.5
0.2 0.8 0
_
_
20
Figura 1: rovina del giocatore
Figura 2: random walk modulo 3 con f(i) > 0, i = 0, 1, f(0) +f(1) = 1
e quindi il graco è
per calcolare p
(2)
12
= P(X
3
= 2|X
1
= 1) =
3
k=1
p
1k
p
k2
basta calcolare i cam-
mini lunghi 2 passi che dal punto 1 portano al punto 2; ciascun cammino ha
probabilità pari al prodotto dei valori scritti sulle frecce e occorre sommare
tutte queste probabilità. Dunque
p
(2)
12
= (0.5)(0.1) + (0.5)(0.8) = 0.45,
mentre
p
(2)
23
= (0.1)(0.5) + (0.4)(0.5) = 0.25.
In modo analogo si procede per esempio nel calcolo di
p
(3)
11
=
3
l=1
p
1l
p
(2)
l1
=
3
l=1
p
1l
3
k=1
p
lk
p
k1
=
3
l,k=1
p
1l
p
lk
p
k1
,
ovvero si sommano le probabilità di tutti i cammini lunghi 3 passi che da 1
riportano in 1 e che hanno ciascuno probabilità pari al prodotto dei valori
scritti sulle frecce
p
(3)
11
= (0.5)(0.1)(0.4) + (0.5)(0.8)(0.4) + (0.5)(0.5)(0.2) = 0.23.
21
Figura 3: coda con f(i) > 0, i = 0, 1, 2, f(0) +f(1) +f(2) = 1
1.14 Stati comunicanti
Si dice che uno stato i comunica con lo stato j se cè un cammino nito sul
graco che porta da i a j e si scrive i j.
`
E immediato che questo equivale
a chiedere che esista n 1 tale che
p
(n)
ij
> 0.
(ricorda che p
(1)
ij
= p
ij
).
Due stati i e j si dicono comunicanti se esiste n 1 tale che p
(n)
ij
> 0
e esiste m 1 tale che p
(m)
ij
> 0, ovvero se i j e j i, ovvero se esiste
un cammino nito che porta dalluno allaltro e viceversa (i due cammini
potrebbero avere lunghezze diverse). Si scrive i j.
Per esempio nella catena di nascita e morte con q
i
> 0 e p
i
> 0 tutti
gli stati sono comunicanti. Mentre nella catena della rovina del giocatore
tutti gli stati in {1, . . . , d 1} sono comunicanti, inoltre qualsiasi sia i
{1, . . . , d 1} si ha che i 0 e i d, mentre 0 e d comunicano solo con se
stessi.
22
1.15 Classi chiuse e classi irriducibili
Un sottoinsieme C di S si dice una classe chiusa di stati se qualsiasi sia i C
si ha
jC
p
ij
= 1.
Questa condizione implica che indicato con C
c
il complementare di C
nessuno stato di C comunica con uno stato di C
c
:
si ha subito dalla denizione che se i C e j C
c
allora p
ij
= 0; inoltre
p
(2)
ij
=
hS
p
ih
p
hj
=
hC
p
ih
p
hj
= 0
poiche per la seconda uguaglianza si usa il fatto che per denizione di classe
chiusa se i C si ha p
ih
= 0 qualsiasi sia h C
c
e per la terza il fatto che,
se j C
c
, ancora per denizione di classe chiusa p
hj
= 0 qualsiasi sia h C;
allo stesso modo per induzione si prova che p
(n)
ij
= 0 per ogni n > 2. Infatti
p
(n)
ij
=
hS
p
ih
p
(n1)
hj
=
hC
p
ih
p
(n1)
hj
= 0,
dove nellultima uguaglianza si usa lipotesi induttiva Il viceversa è imme-
diato ovvero: se nessuno stato di C comunica con uno stato in C
c
, essendo
p
ij
= 0 qualsiasi siano i C e j C
c
, allora ssato i C si ha
jC
p
ij
= 1,
cioè C è chiusa.
Se C = {i} è chiusa allora lo stato i si dice assorbente. Per esempio nella
catena della rovina del giocatore 0 e d sono stati assorbenti.
Una classe chiusa si dice irriducibile se tutti i suoi stati sono comunicanti.
Se S è lunica classe chiusa irriducibile, allora la catena si dice irriducibile.
Nella catena rappresentata dal graco seguente
23
1, 2, 3 sono stati comunicanti, {4, 5, 6, 7} è una classe chiusa non irriducibile,
{4, 5} è una classe irriducibile, 7 è uno stato assorbente.
1.16 Denizione di transienza e persistenza
in termini del tempo di primo ritorno
Si ricordi che p
(n)
ij
indica la probabilità di passare da i a j in n passi. Si
introduce il simbolo
(n)
ij
per indicare la probabilità di arrivare in j partendo da i per la prima volta
dopo n passi, ovvero
(n)
ij
= P(X
n
1
+n
= j, X
n
1
+n1
= j, . . . , X
n
1
+1
= j | X
n
1
= i)
qualsiasi sia n
1
(è facile vericare che per la proprietà di Markov la proba-
bilità precedente è indipendente da n
1
).
Naturalmente
(1)
ij
= p
(1)
ij
= p
ij
, mentre qualsiasi sia n 2 vale
(n)
ij

p
(n)
ij
. Per esempio nel caso della catena con matrice di transizione
P =
_
_
0 0.5 0.5
0.4 0.1 0.5
0.2 0.8 0
_
_
facilmente si calcola
(2)
12
= (0.5)(0.8) = 0.4 p
(2)
12
= (0.5)(0.8) + (0.5)(0.1) = 0.45.
La disuguaglianza discende dal considerare che vale la relazione seguente
p
(n)
ij
=
n1
s=1
(s)
ij
p
(ns)
jj
+
(n)
ij
.
Si introduce il simbolo
ij
=
n1
(n)
ij
per indicare quindi la probabilità di arrivare in j in un numero nito di
passi essendo partiti da i. Immediatamente seguono
ij

(n)
ij
, qualsiasi sia
n 1 e quindi in particolare
ij

(1)
ij
= p
ij
. Se si indica con
j
la variabile
aleatoria tempo di primo passaggio per j, ovvero
j
() :=
_
min{n 1 t.c. X
n
() = j}, se il minimo esiste
+, altrimenti
24
allora
(n)
ij
= P(
j
= n | X
0
= i) e
ij
= P(
j
< | X
0
= i).
Naturalmente
ij
> 0 i j.
Si dimostra la condizione necessaria: infatti
ij
> 0 implica che esiste n 1
tale che
(n)
ij
> 0 e questo a sua volta implica p
(n)
ij
> 0, essendo
(n)
ij
p
(n)
ij
.
Si dimostra la condizione suciente: infatti i j implica che esiste
n 1 tale che p
(n)
ij
> 0 e poiche p
(n)
ij
=
n1
s=1

(s)
ij
p
(ns)
jj
+
(n)
ij
, segue che
esiste 1 s n tale che
(s)
ij
> 0 e quindi
ij
> 0.
Si denisce uno stato i persistente (o anche ricorrente) se
ii
= 1
e transiente se
ii
< 1,
ovvero a parole uno stato è persistente se il tempo di primo ritorno in i
partendo da i è nito con probabilità 1; è transiente se la stessa variabile è
nita con probabilità minore di 1 e quindi con probabilità positiva partendo
da i la catena non vi fa pi` u ritorno.
Banalmente ogni stato assorbente è persistente essendo
ii
p
ii
= P(X
1
= i | X
0
= i) = P(
i
= 1 | X
0
= i) = 1.
1.17 Transienza e persistenza in termini del numero dei ri-
torni
A giusticazione della terminologia introdotta nel precedente paragrafo si
dimostra il prossimo teorema.
Dora in avanti si userà la notazione
P( | X
0
= i) = P
i
().
Teorema
ii
< 1 P
i
(X
n
= i inf.nte spesso) = 0
ii
= 1 P
i
(X
n
= i inf.nte spesso) = 1
25
La dimostrazione utilizza il seguente lemma di probabilità elementare.
Lemma Se (B
k
)
k1
, B
k
F, è una successione crescente di eventi
(, F, P), ovvero se qualsiasi sia k 1 vale B
k
B
k+1
, allora P(
k1
B
k
) =
lim
k
P(B
k
). Se (A
k
)
k1
è una successione decrescente di eventi (, F, P),
ovvero se A
k
A
k+1
, allora P(
k1
A
k
) = lim
k
P(A
k
).
Dimostrazione del lemma Infatti
P
_
k1
B
k
_
= P
_
k1
{B
k
\ B
k1
}
_
=
k=1
(P(B
k
) P(B
k1
))
= lim
n
n
k=1
_
P(B
k
) P(B
k1
)
_
= lim
n
P(B
n
).
avendo posto B
0
= . Inne
P(
k1
A
k
) = 1 P(
k1
A
c
k
) = 1 lim
n
P(A
c
n
) = lim
n
P(A
n
)
essendo la successione degli eventi complementari (A
c
k
)
k1
successione cres-
cente di eventi.
Dimostrazione del teorema Levento {X
n
inf.nte spesso} si può riscri-
vere come intersezione di una successione decrescente di eventi. Pi` u precisa-
mente
{X
n
= i inf.nte spesso } =
k1
A
k
con
A
k
=
{X
n
1
= i, X
n
2
= i, . . . , X
n
k
= i, X
s
= i, s = n
1
, n
2
, . . . , n
k
, s < n
k
}
dove lunione disgiunta è estesa a n
1
< n
2
< . . . < n
k
, cioè A
k
è levento
denito a parole dal fatto che la catena visita almeno k volte lo stato i.
Dal lemma segue che
P
i
(X
n
= i inf.nte spesso) = lim
k
P
i
(A
k
).
Inoltre P
i
(A
k
) si può calcolare cos`:
n
1
<n
2
<...<n
k1
P
i
(X
n
1
= i, X
n
2
= i, . . . , X
n
k
= i, X
s
= i, s = n
1
, n
2
, . . . , n
k
, s < n
k
)
26
e lultima somma coincide con
n
1
<n
2
<...<n
k
(n
1
)
ii

(n
2
n
1
)
ii
. . .
(n
k1
n
k2
)
ii

(n
k
n
k1
)
ii
=
n
1
<n
2
<...<n
k1
(n
1
)
ii

(n
2
n
1
)
ii
. . .
(n
k1
n
k2
)
ii
n
k1
<n
k
(n
k
n
k1
)
ii
e, poiche, ssati n
1
< n
2
< . . . < n
k1
, al variare di n
k
la dierenza n
k
n
k1
varia in N \ {0}, allora lespressione precedente è uguale a
n
1
<n
2
<...<n
k1
(n
1
)
ii

(n
2
n
1
)
ii
. . .
(n
k1
n
k2
)
ii
h=1
(h)
ii
=
=
ii
n
1
<n
2
<...<n
k1
(n
1
)
ii

(n
2
n
1
)
ii
. . .
(n
k2
n
k3
)
ii

(n
k1
n
k2
)
ii
.
Fissando n
1
< n
2
< . . . < n
k2
e sommando su n
k1
si ottiene
2
ii
n
1
<n
2
<...<n
k2
(n
1
)
ii

(n
2
n
1
)
ii
. . .
(n
k3
n
k4
)
ii

(n
k2
n
k3
)
ii
e iterando k volte lo stesso procedimento si verica
P
i
(A
k
) =
k
ii
.
La dimostrazione si conclude utilizzando il lemma precedente e ricordan-
do che quando 0 a < 1 allora lim
k
a
k
= 0 e quando a = 1 allora
lim
k
a
k
= 1.
1.18 Legge e valor medio del numero dei ritorni in uno stato
In quel che segue si utilizzerà la variabile aleatoria N
n
(i) che conta il numero
delle visite fatte dalla catena allo stato i in n passi. Si ha
N
n
(i) =
n
k=1
I
{i}
(X
k
),
ricordando che I
{i}
(x) è la funzione indicatrice dellinsieme {i} che vale 1 se
x {i}, cioè x = i, e 0 altrimenti.
La variabile aleatoria denita da
N
(i) = lim
n
N
n
(i) =
k=1
I
{i}
(X
k
)
27
conta il numero totale delle visite della catena allo stato i (attenzione: il
limite si intende cos`: N
(i)() = lim
n
N
n
(i)() per ogni ). Os-
serviamo che, come la variabile aleatoria tempo di primo passaggio
i
, anche
N
(i) è una variabile estesa, cioè a valori in N {+}.

Si osserva che vale luguaglianza tra eventi
{X
n
= i inf.nte spesso} = {N
(i) = +}
e che quindi si può enunciare il teorema precedente cos`
ii
< 1 P
i
(N
(i) = +) = 0
ii
= 1 P
i
(N
(i) = +) = 1.
La densità della variabile numero dei ritorni nello stato, ovvero del nu-
mero dei passaggi della catena per i quando la sua legge iniziale è la delta
di Dirac in i, è dunque determinata nel caso di stati persistenti. Nel caso di
stati transienti vale il seguente lemma.
Lemma
i transiente = P
i
(N
(i) = k) =
_
_
1
ii
, k = 0
0, k = +
k
ii
(1
ii
), altrimenti
Dimostrazione Il caso k = +è contenuto, come già osservato, nel teorema
precedente. Il caso k = 0 deriva dalla denizione di
ii
. Per il resto si osserva
che
P
i
(N
(i) k) =
k
ii
;
infatti {N
(i) k} coincide con levento A

k
della dimostrazione del teorema
precedente. Quindi
P
i
(N
(i) = k) = P
i
(N
(i) k) P
i
(N
(i) k + 1) =
k
ii
(1
ii
),
che conclude la dimostrazione.
Si vuole calcolare ora il valore medio della variabile di cui si è appena
trovata la densità condizionata allevento {X
0
= i}; per ricordare che la
catena parte da i si scrive i sotto il simbolo di media. Chiaramente nel
caso persistente, per denizione di valor medio di variabile aleatoria estesa,
E
i
_
N
(i)
= +. Nel caso transiente invece E

i
_
N
(i)
< +, infatti
utilizzando la densità di N
(i) del lemma precedente si trova

E
i
_
N
(i)
k=1
k
k
ii
(1
ii
) =

ii
1
ii
< +
28
poiche
k=1
k
k
ii
(1
ii
) è media della geometrica trasformata di parametro
1
ii
(legge del numero dei fallimenti prima del successo in uno schema di
Bernoulli di parametro 1
ii
).
Si osserva ora che
E
i
_
N
(i)] = E
i
_
lim
n
N
n
(i)
= lim
n
E
i
_
N
n
(i)
,
poiche qui è lecito scambiare il limite con il valore medio (di ciò si tralascia
la dimostrazione). Inoltre utilizzando la linearità della media, si ha
E
i
_
N
n
(i)
=
n
k=1
E
i
_
I
{i}
(X
k
)
.
e, essendo I
{i}
(X
k
) B(p) con p = P
i
(X
k
= i) = p
(k)
ii
,
E
i
_
N
n
(i)
=
n
k=1
p
(k)
ii
poiche il valor medio di una binomiale coincide con il suo parametro. Si è
cos` mostrato che E
i
_
N
(i)
k=1
p
(k)
ii
. Si può allora enunciare il teorema
seguente.
Teorema
i transiente E
i
_
N
(i)
k=1
p
(k)
ii
< +
La parte necessaria del teorema è immediata e la parte suciente segue
dal fatto che se i è persistente allora il numero medio dei ritorni è innito.
Naturalmente il teorema si può anche enunciare cos`:
i persistente
k=1
p
(k)
ii
= +.
1.19 Transienza e persistenza di uno stato
in termini del numero dei passaggi per esso
partendo da uno stato qualsiasi
La densità del numero dei passaggi per i condizionata allevento {X
0
= j}
con j = i si calcola utilizzando luguaglianza
P
j
(N
(i) k) =
ji
k1
ii
,
29
che si ricava similmente a P
i
(N
(i) k) = P
i
(A
k
) =
k
ii
. Se è i persistente
e j = i si trova
P
j
(N
(i) = k) =
_
_
1
ji
, k = 0
ji
k1
ii

ji
k
ii
=
ji
k1
ii
(1
ii
) = 0, k 1
ji
, k = +
mentre se i è transiente
P
j
(N
(i) = k) =
_
_
1
ji
, k = 0
ji
k1
ii
(1
ii
), k 1
0, k = +.
In entrambi i casi la densità in k = + si deriva considerando che deve
essere
k=0
P
j
(N
(i) = k) + P
j
(N
(i) = +) = 1.
Si noti che nel caso j = i si ritrova la densità del numero dei ritorni nello
stato i già precedentemente calcolata.
Dalla densità appena calcolata si ricava il valore medio del numero dei
passaggi per i condizionata allevento {X
0
= j}, ottenendo:
i persistente o transiente e j i = E
j
_
N
(i)
= 0
i persistente e j i = E
j
_
N
(i)
= +
i transiente e j i = E
j
_
N
(i)
=

ji
1
ii
< +
dove in particolare lultima implicazione segue dalluguaglianza
k1
k
k1
ii
(1
ii
) =
1
1
ii
.
Tenendo presente anche i risultati del precedente paragrafo, si può rias-
sumere cos`:
se i è persistente quando la catena parte da i vi ritorna innite volte con
probabilità 1, mentre se parte da uno stato diverso da i è possibile che essa
non passi mai per i, ma se raggiunge i una volta allora vi passa in media
innite volte; se i è transiente, qualsiasi sia il punto di partenza della catena,
il numero di visite a i con probabilità 1 è nito (eventualmente nullo) e anche
il numero medio di visite a i è nito (eventualmente nullo).
Inne in modo simile al paragrafo precedente si dimostra
E
j
_
N
(i)
k=1
p
(k)
ji
30
e quindi da quanto esposto si deriva il teorema seguente.
Teorema Qualsiasi sia j S
i transiente =
k=1
p
(k)
ji
< +.
Utilizzando poi il fatto che il termine generico di serie convergente è in-
nitesimo, si ottiene immediatamente il seguente corollario.
Corollario Qualsiasi sia j S
i transiente = lim
k
p
(k)
ji
= 0 .
Esercizio 4
Dimostrare che vale lequazione detta di Chapman-Kolmogorov
p
(n+m)
ij
=
hS
p
(n)
ih
p
(m)
hj
e dedurne che, se i comunica con l e l comunica con j, allora i comunica con
j.
Soluzione
p
(n+m)
ij
=
hS
P(X
n+m
= j, X
n
= h | X
0
= i)
=
hS
P(X
n+m
= j, X
n
= h, X
0
= i)
P(X
0
= i)
.
Allora applicando la formula del prodotto, semplicando e usando la pro-
prietà di Markov, si ottiene
p
(n+m)
ij
=
hS
P(X
n+m
= j | X
n
= h)P(X
n
= h | X
0
= i).
Inne ricordando
P(X
n+m
= j | X
n
= h) = p
(m)
hj
, P(X
n
= h | X
0
= i) = p
(n)
ih
,
si ottiene lequazione di Chapman-Kolmogorov.
Inoltre se i l esiste n > 0 tale che p
(n)
il
> 0 e se l j esiste m > 0
tale che p
(m)
lj
> 0 e poiche per Chapman-Kolmogorov
p
(n+m)
ij
=
hS
p
(n)
ih
p
(m)
hj
p
(n)
il
p
(m)
lj
> 0,
si trova p
(n+m)
ij
> 0 e quindi anche i j.
31
1.20 Una condizione suciente per la transienza
Un criterio utile per vericare il carattere transiente di uno stato è
j i, i j =j transiente.
Per la dimostrazione si procede cos`. Posto m = min{n 1 : p
(n)
ji
> 0},
esistono i
1
, i
2
, . . . , i
m1
S e diversi da i e da j tali che P
j
(A) > 0 se A è
levento denito da
A = {X
1
= i
1
, . . . , X
m1
= i
m1
, X
m
= i};
dunque P
j
(A
c
) = 1 P
j
(A) < 1. Allora se si dimostra che
P
j
({
j
< } A) = 0,
si ha come conseguenza che
jj
è minore di 1; infatti
jj
= P
j
(
j
< ) = P
j
({
j
< }A)+P
j
({
j
< }A
c
) = P
j
({
j
< }A
c
)
e essendo {
j
< } A
c
A
c
vale P
j
({
j
< } A
c
) P
j
(A
c
).
Per dimostrare che P
j
({
j
< } A) = 0, si scrive
P
j
({
j
< } A) =
k=m+1
P
j
({
j
= k} A)
=
k=m+1
P
j
(
j
= k | A)P
j
(A).
Poiche per la proprietà di Markov P
j
(
j
= k | A) =
(km)
ij
e poiche
(km)
ij

p
(km)
ij
, con il cambio di variabile n = k m, si ottiene
P
j
({
j
< } A)
n=1
p
(n)
ij
P
j
(A)
Si conclude osservando che per ipotesi, qualsiasi sia n 1, si ha p
(n)
ij
= 0.
Si fa notare che quando S ha cardinalità nita limplicazione appena
dimostrata vale anche nel verso contrario (si veda il paragrafo 22), ma questo
non è vero se S è innito (per un controesempio si veda il paragrafo 27).
32
1.21 Una condizione suciente per la persistenza
Un criterio utile per vericare il carattere persistente di uno stato è
i persistente e i j =
ji
= 1 e j persistente.
Per la dimostrazione si procede cos`. Si comincia con il mostrare che
ji
= 1.
Sia n
0
= min{n 1 t.c. p
(n)
ij
> 0}, allora esistono i
1
, i
2
, . . . , i
n
0
1
= j, i tali
che posto
B = {X
1
= i
1
, . . . , X
n
0
1
= i
n
0
1
, X
n
0
= j}
vale P
i
(B) > 0. Poiche i è persistente vale
P
i
_
B {X
n
= i , qualsiasi sia n n
0
+ 1}
_
= 0;
inoltre per la proprietà di Markov è anche vero che
P
i
(B {X
n
= i , n n
0
+ 1}) = P
i
(B) P
j
(
i
= +) = P
i
(B)(1
ji
);
dalle due aermazioni segue
ji
= 1.
Si fa poi vedere che vale la condizione
k=1
p
(k)
jj
= + suciente per la
persistenza di j. Sia n
1
1 tale che p
(n
1
)
ji
> 0 (n esiste poiche, essendo
ji
= 1 è vero che j i).
k=1
p
(k)
jj

k=n
0
+1+n
1
p
(k)
jj
=
h=1
p
(h+n
0
+n
1
)
jj
.
Utilizzando lequazione di Chapman-Kolmogorov, con semplici minorazioni
si ottiene
k=1
p
(k)
jj

h=1
lS
p
(n
1
)
jl
p
(h)
ll
p
(n
0
)
lj
h=1
p
(n
1
)
ji
p
(h)
ii
p
(n
0
)
ij
= p
(n
1
)
ji
p
(n
0
)
ij
k=1
p
(h)
ii
.
Poiche, essendo per ipotesi i persistente, si ha che
k=1
p
(h)
ii
= +, per
confronto si deduce che anche
k=1
p
(h)
jj
= +.
Come corollario di questo criterio si ottiene:
Corollario Sia C S un classe irriducibile, allora tutti gli stati sono
persistenti o tutti transienti.
33
Si fa notare che, sia per S nito che innito, limplicazione appena di-
mostrata vale anche nel verso contrario. Infatti:
ji
= 1 implica banalmente
j i e quindi per limplicazione diretta se j è persistente
ij
= 1 (dunque
i j) e i è persistente.
1.22 Persistenza e transienza in classi nite
Si dimostra che se C S è una classe chiusa e nita allora in C esiste
almeno uno stato persistente. Si procede per assurdo. Infatti se tutti gli
stati in C fossero transienti, ssato uno di essi, j, si avrebbe (da un risultato
precedentemente dimostrato), per ogni i in C, lim
k
p
(k)
ji
= 0 e quindi
iC
lim
k
p
(k)
ji
= 0.
Daltro canto
iC
lim
k
p
(k)
ji
= lim
k
iC
p
(k)
ji
= lim
k
P
j
(X
k
C) = 1,
infatti limite e somma si scambiano poiche la somma è su un numero nito
di termini e lultima uguaglianza segue dal fatto che C è una classe chiusa.
Due sono le conseguenze importanti.
La prima è che tutti gli stati di una classe irriducibile nita sono persistenti
(segue mettendo insieme quanto appena detto e il corollario del paragrafo
precedente) e quindi se una catena ha spazio degli stati nito ed è irriducibile
allora tutti gli stati sono persistenti (segue dal precedente poiche tutto lo
spazio degli stati è una particolare classe chiusa).
La seconda conseguenza è che nel caso S nito la condizione suciente
per la transienza è anche necessaria: infatti, se per ogni j con i j vale
anche j i, allora i è elemento di una classe irriducibile nita e quindi è
persistente. Si ricorda che, come già accennato, nel caso S innito invece
la condizione non è necessaria: esistono classi irriducibili innite di stati
transienti (si veda il paragrafo 27).
Da quanto detto segue che quando S è nito per analizzare il carattere
degli stati si può procedere cos`: si individuano subito tutti gli stati transi-
enti, che sono tutti e soli quelli che comunicano con almeno uno stato che
non li ricambia, e poi intorno a ciascuno dei rimanenti si costruisce la classe
irriducibile (nita) di stati persistenti che lo contiene.
Per esempio, si consideri la catena con matrice di transizione
P =
_
_
_
_
_
_
_
_
1 0 0 0 0 0
1
4
1
2
1
4
0 0 0
0
1
5
2
5
1
5
0
1
5
0 0 0
1
6
1
3
1
2
0 0 0
1
2
0
1
2
0 0 0
1
2
0
1
2
_
_
_
_
_
_
_
_
.
34
Gli stati 3 e 2 comunicano con 1, ma 1 non comunica ne con 2 ne con 3 e
quindi gli stati 2 e 3 sono transienti; C
1
= {4, 5, 6} è classe irriducibile di
stati persistenti; C
2
= {1} è classe irriducibile formata da un unico stato
assorbente.
1.23 Teorema di decomposizione dello spazio degli stati
Lo spazio degli stati ammette una decomposizione di questo tipo
S = T C
1
C
2
. . .
dove T è linsieme degli stati transienti e C
n
, n = 1, 2, . . . sono classi disgiunte
irriducibili persistenti. Per dimostrarlo si considera i
1
S \T e si costruisce
C
1
come la classe che contiene tutti gli stati con cui comunica i
1
che, grazie
al criterio suciente per la persistenza, sono tutti persistenti. C
1
è non
vuota poiche contiene i
1
. C
1
è chiusa poiche se j C
1
allora, per il criterio
suciente per la persistenza, j è persistente e i
1
j e inoltre se j h per
lo stesso criterio j h e per la proprietà transitiva i
1
h. C
1
è irriducibile
poiche se j e l sono in C
1
allora i
1
j e i
1
l e usando la proprietà
transitiva j l.
Scelto uno stato i
2
che non appartiene a C
1
ne a T , si costruisce C
2
nello
stesso modo e cos` via.
`
E facile vericare poi che le classi C
n
, n = 1, 2 . . . sono
disgiunte: infatti se per esempio fosse h C
1
C
2
, allora ogni elemento di
C
1
, i, sarebbe tale che h i, ma allora, poiche C
2
è chiuso e h C
2
, sarebbe
anche i C
2
e quindi C
1
C
2
.In modo analogo si prova il viceversa.Segue
che C
1
= C
2
.
Dunque: quando la catena parte da uno stato di un qualsiasi C
n
rimane
per sempre in C
n
visitando innitamente spesso ogni stato di C
n
(con prob-
abilità 1); quando la catena parte da uno stato di T e T è numerabile, può
rimanere per sempre in T o entrare in qualche C
n
e rimanere poi l` per sem-
pre visitando ogni suo stato innitamente spesso; se T ha cardinalità nita,
invece, qualsiasi sia la legge iniziale, la catena esce prima o poi da T e non
vi rientra pi` u. Pi` u precisamente, posto
N
(T ) =
iT
N
(i),
N
(T ) è la variabile aleatoria che conta il numero dei passaggi per T e si

dimostra che
P(N
(T ) = +) = 0.
Infatti, qualsiasi sia la legge iniziale, per la proprietà di Markov
P(N
(T ) = +) =
jS
P
j
(N
(T ) = +)
0
(j)
35
e quindi è suciente far vedere che, per ogni j S , P
j
(N
(T ) = +) = 0.
Poiche T ha cardinalità nita,
N
(T ) = + = esiste i T t.c. N
(i) = +
cioè
{N
(T ) = +} =
iT
{N
(i) = +}
e quindi
P
j
(N
(T ) = +)
iT
P
j
(N
(i) = +) = 0,
dove la disuguaglianza segue dal fatto che in generale la probabilità di unu-
nione di eventi è minore o uguale alla somma delle probabilità dei singoli
eventi e lultima uguaglianza segue dal fatto che P
j
(N
(i) = +) = 0, per
ogni j S e per ogni i T .
Esercizio 5
Studiare il carattere degli stati della matrice di transizione seguente
P =
_
_
_
_
_
_
_
_
0
1
2
1
2
0 0 0
0
2
3
0 0 0
1
3
0 0
1
2
0
1
2
0
0 0
1
2
1
4
0
1
4
0
4
5
0 0 0
1
5
0 0 0 0
1
2
1
2
_
_
_
_
_
_
_
_
Soluzione
Gli stati 1, 3, 4 sono transienti: infatti 1 3 ma 3 1, 3 5 ma 5 3,
4 3 ma 3 4. Facilmente si verica poi che {2, 5, 6} è classe irriducibile,
nita e quindi persistente.
1.24 Sistema di equazioni per le probabilità di assorbimento
Sia C una classe chiusa di S (si ricordi che C può contenere anche stati
transienti). Indicata con
C
la variabile aleatoria che indica il tempo di
ingresso della catena in C, ovvero
C
() =
_
min{n 1 t.c. X
n
() C}, se il minimo esiste
+, altrimenti
si denisca
C
i
= P
i
(
C
< +), i S,
36
allora
C
i
è la probabilità che partendo da i la catena arrivi in un tempo
aleatorio nito in C. Dopo questo istante la catena non potrà pi` u lasciare C
essendo la classe chiusa e per questo
C
i
si chiama probabilità di assorbimento
in C partendo da i.
Allora è ovvio che
i C =
C
i
= 1
e
i C
chiusa, C
C = =
C
i
= 0.
Si fa vedere che le quantità
C
i
, i T \ C soddisfano un sistema di equazioni
lineari in tante incognite e tante equazioni quanto è la cardinalità di T \ C.
Fissato i T \ C
C
i
=
n=1
P
i
(
C
= n),
inoltre
P
i
(
C
= n) =
hC, h
j
T \C, j=1,...,n1
p
ih
1
p
h
1
h
2
. . . p
h
n1
h
e
P
i
(
C
= n + 1) =
hC, h
j
T \C, j=1,...,n
p
ih
1
p
h
1
h
2
. . . p
h
n
h
=
h
1
T \C
p
ih
1
P
h
1
(
C
= n).
Ora, poiche
C
i
= P
i
(
C
= 1) +
n=2
P
i
(
C
= n),
con il cambio di variabile n = m+ 1
C
i
= P
i
(
C
= 1) +
m=1
P
i
(
C
= m+ 1)
e sostituendo a P
i
(
C
= m + 1) lespressione
h
1
T \C
p
ih
1
P
h
1
(
C
= m) e a
P
i
(
C
= 1) il suo valore
jC
p
ij
, si ottiene qualsiasi sia i T \ C
C
i
=
jC
p
ij
+
m=1
h
1
T \C
p
ih
1
P
h
1
(
C
= m)
e scambiando lordine delle sommatorie (cosa possibile poiche i termini sono
non negativi)
C
i
=
jC
p
ij
+
h
1
T \C
p
ih
1
C
h
1
.
37
Si vedrà nel prossimo paragrafo che se T ha cardinalità nita il sistema
x
i
=
jC
p
ij
+
h
1
T \C
p
ih
1
x
h
1
.
ha soluzione unica, che quindi coincide con le probabilità di assorbimento.
Si osservi che, grazie al criterio suciente per la persistenza, la classe
S \ T di tutti gli stati persistenti di una catena (nita e non) è una classe
chiusa. In tal caso il sistema soddisfatto dalle probabilità di assorbimento
diventa
x
i
=
jS\T
p
ij
+
jT
p
ij
x
j
, i T .
`
E immediato vericare che x
i
= 1 qualsiasi sia i T è una soluzione del
sistema, che quindi nel caso nito coincide con la probabilità di assorbimento
nella classe degli stati persistenti. Cos` nel caso T nito, qualsiasi sia la legge
iniziale
P(
S\T
< +) =
jS
S\T
j

0
(j) =
jS
0
(j) = 1.
Lo stesso risultato si può anche mostrare mettendo insieme il fatto che
P(
S\T
< +) = P(N
(T ) < +),
e che nel caso T nito come si è già visto P(N
(T ) < +) = 1.
1.25 Unicità della soluzione del sistema di equazioni
per le probabilità di assorbimento nel caso stati niti
Sia x
i
, i T \ C una soluzione del sistema
x
i
=
hC
p
ih
+
hT \C
p
ih
x
h
;
si dimostra che x
i
coincide con
i
= P
i
(
C
< +). Per questo si sostituisce
nellequazione precedente il valore di x
h
dato dallequazione stessa
x
i
=
hC
p
ih
+
hT \C
p
ih
jC
p
hj
+
hT \C
p
ih
jT \C
p
hj
x
j
=
hC
p
ih
+
hT \C
jC
p
ih
p
hj
+
jT \C
hS
p
ih
p
hj
x
j
,
dove nella riscrittura del terzo termine si è usato il fatto che se j T \ C e
h C allora p
hj
= 0.
38
Si osserva che, poiche i primi due addendi insieme danno la probabilità
di passare da i in C in al pi` u due passi,
x
i
= P
i
(
C
2) +
jT \C
p
(2)
ij
x
j
.
Con analogo procedimento dallequazione precedente si ottiene
x
i
= P
i
(
C
3) +
jT \C
p
(3)
ij
x
j
,
e iterando n 1 volte
x
i
= P
i
(
C
n) +
jT \C
p
(n)
ij
x
j
.
Passando al limite per n nel secondo membro e utilizzando il fatto che
T , e quindi T \ C, è nito e pertanto si possono scambiare somma e limite,
si ottiene
x
i
= lim
n
P
i
(
C
n) +
jT \C
lim
n
p
(n)
ij
x
j
.
Ora {
C
n} è una successione crescente di eventi, ovvero
{
C
n} {
C
n + 1},
e inoltre
n=1
{
C
n} = {
C
< +},
cos`, applicando il lemma di continuità della probabilità per successioni
crescenti di eventi del paragrafo 17,
lim
n
P
i
(
C
n) = P
i
(
C
< +).
Inoltre si è dimostrato nel paragrafo 19 che qualsiasi sia i S per j transiente
lim
n
p
(n)
ij
= 0 e quindi in denitiva si ottiene come si voleva
x
i
= P
i
(
C
< +).
39
1.26 Probabilità di estinzione
per la catena di nascita e morte con estremi assorbenti
In questa sezione si calcola la probabilità di assorbimento in {0} per una
catena di nascita e morte con 0 e m assorbenti, ovvero r
0
= 1 (quindi
p
0
= 0) e r
m
= 1 (e quindi q
m
= 0), e con p
i
> 0 e q
i
> 0, e quindi
tutti gli stati intermedi comunicanti e transienti. Ponendo per semplicità di
notazione
C
i
=
{0}
i
=
i
, il sistema si scrive
i
= q
i
i1
+p
i
i+1
+r
i
i
,
i {1, . . . , m1}, dove
0
= 1 e
m
= 0. Sostituendo a r
i
il valore 1p
i
q
i
,
dopo facili passaggi algebrici, si trova per i {1, . . . , m1}
i+1
=
q
i
p
i
(
i1
i
)
(attenzione: si usa p
i
> 0). Si calcola in modo ricorsivo per i {1, . . . , m1}
i+1
=
q
i
q
i1
. . . q
1
p
i
p
i1
. . . p
1
(1
1
) =
i
(1
1
)
avendo posto
i
=
q
i
q
i1
. . . q
1
p
i
p
i1
. . . p
1
.
Si noti che posto
0
= 1 luguaglianza
i+1
=
i
(1
1
)
vale anche per i = 0, dunque vale per i {0, . . . , m1}. Allora sommando
da 0 a m1 ambo i membri delluguaglianza precedente, si ricava
m
=
m1
i=0
i
(1
1
)
da cui, ricordando che
0
= 1 e
m
= 0, si ottiene
1
1
=
1
m1
i=0

i
(attenzione: si usa q
i
> 0). Sommando ora da j a m 1 ambo i membri
delluguaglianza già utilizzata e ricordando che
m
= 0, si ricava
j

m
=
j
=
m1
i=j

i
m1
i=0

i
.
Si assuma p
i
= p e q
i
= q, allora r
i
= r e si ottiene
i
=
_
q
p
_
i
e quindi
j
=
_
q
p
_
j
+
_
q
p
_
j+1
+. . . +
_
q
p
_
m1
1 +
_
q
p
_
+. . . +
_
q
p
_
m1
40
e se q = p = 1/2 o anche solo q = p, r = 0
j
=
mj
m
.
Cos` nella rovina del giocatore la probabilità che A perda è
a
=
b
a +b
.
1.27 Persistenza o transienza per la catena di nascita e morte
irriducibile
Per analizzare il carattere degli stati della catena di nascita e morte a valori
in S = N e con p
i
> 0 e q
i
> 0 per ogni i S, si osserva che: poiche essa è
irriducibile gli stati hanno tutti lo stesso carattere, in particolare il carattere
dello stato 0 e inoltre
00
= p
00
+p
01
10
= r
0
+p
0
P
1
(
0
< +).
Pertanto la catena è persistente se e solo se
1 = r
0
+p
0
P
1
(
0
< +)
e quindi, ricordando che r
0
+p
0
= 1, se e solo se
P
1
(
0
< +) = 1.
Per calcolare P
1
(
0
< +) si osserva che
{
0
< +, X
0
= 1} =
m=1
{
0
<
m
, X
0
= 1}.
Infatti
0
() < +implica che esiste M, dipendente da , tale che
0
() <
M; inoltre, poiche, per tale che X
0
() = 1, si ha
m
() + 1
m+1
(),
allora, per tale che X
0
() = 1,
m
() diverge a + crescendo, e quindi
esiste m, dipendente da , tale che
0
() < M <
m
(). Pertanto
{
0
< +, X
0
= 1}
m=1
{
0
<
m
, X
0
= 1}.
Linclusione inversa è immediata.
Dunque, applicando il lemma di continuità della probabilità per succes-
sioni crescenti di eventi del paragrafo 17
P
1
(
0
< +) = lim
m
P
1
(
0
<
m
).
41
Ma P
1
(
0
<
m
) è pari alla probabilità di assorbimento in 0 partendo da
1 per la catena di nascita e morte su {0, . . . , m} con le stesse p
i
, r
i
, q
i
per
i = 1, . . . , m1 ma con 0 e m assorbenti.
Pertanto, ricordando lespressione di
j
per j = 1 calcolata nel paragrafo
precedente, si ha
P
1
(
0
< +) = lim
m
m1
i=1

i
m1
i=0

i
= lim
m
_
1
1
m1
i=0

i
_
.
Concludendo, la catena è persistente se e solo se
i=0
i
= +.
Se q
i
= q, p
i
= p
i=0
i
=
i=0
_
q
p
_
i
= +
se e solo se
q
p
1 ovvero se e solo se q p.
Esempio: p
i
=
i+2
2i+2
e q
i
=
i
2i+2
; allora
q
i
p
i
=
i
i+2
e
i
=
1 2 3 . . . (i 2)(i 1)i
3 4 5 . . . i (i + 1)(i + 2)
=
2
(i + 1)(i + 2)
e poiche
i
ha lo stesso comportamento di
1
i
2
< +, la catena è
transiente.
Esercizio 6
Tre libri sono messi uno sopra laltro a formare una pila. In ogni istante
se ne sceglie uno a caso e si mette in cima alla pila lasciando invariata la
posizione degli altri due. Assumendo che i libri siano contraddistinti con le
lettere A,B,C: descrivere con una catena di Markov il sistema il cui stato è
costituito in ogni istante dalla disposizione dei libri nella pila.
Soluzione
Ci sono tanti stati quante sono le permutazioni della terna(A,B,C), ovvero
3! = 6. Inoltre da ogni stato le transizioni possibili equiprobabili sono 3.
Cos` se per esempio ordiniamo i possibili stati in questo modo:
{(ABC) , (BAC) , (C AB) , (AC B) , (BC A) , (C B A)}
la matrice di transizione è la seguente
P =
_
_
_
_
_
_
_
_
1
3
1
3
1
3
0 0 0
1
3
1
3
0 0 0
1
3
0 0
1
3
1
3
1
3
0
0
1
3
1
3
1
3
0 0
1
3
0 0 0
1
3
1
3
0 0 0
1
3
1
3
1
3
_
_
_
_
_
_
_
_
42
La catena è irriducibile poiche tutti gli stati sono comunicanti e, essendo lo
spazio di stato nito, tutti gli stati sono persistenti.
1.28 Tempi medi di assorbimento nella classe degli stati per-
sistenti
In questa sezione si determina il sistema di equazioni al quale devono soddis-
fare i valori medi dei tempi di assorbimento nella classe chiusa C di tutti gli
stati persistenti, quando linsieme degli stati transienti è nito. In tal caso
qualsiasi sia i T vale
C
i
= P
i
(
C
< +) = 1 e qui si vogliono determinare
le equazioni per E
i
[
C
], valor medio di
C
condizionato a (X
0
= i).
Sia i T allora
E
i
[
C
] = 1 P
i
(
C
= 1) +
n=2
nP
i
(
C
= n)
= P
i
(
C
= 1) +
l=1
(1 +l) P
i
(
C
= 1 +l)
e essendo P
i
(
C
= 1 +l) =
hT
p
ih
P
h
(
C
= l),
E
i
[
C
] = P
i
(
C
= 1) +
l=1
P
i
(
C
= 1 +l) +
l=1
l
hT
p
ih
P
h
(
C
= l)
=
n=1
P
i
(
C
= n) +
l=1
l
hT
p
ih
P
h
(
C
= l).
Dunque, potendo scambiare lordine delle somme nel secondo addendo, se è
i T si ha
E
i
[
C
] = P
i
(
C
< +) +
hT
p
ih
l=1
l P
h
(
C
= l)
= 1 +
hT
p
ih
E
h
[
C
],
dove nellultimo passaggio si è usato P
i
(
C
< +) =
C
i
= 1.
Si può dimostrare che il sistema
x
i
= 1 +
hT
p
ih
x
h
, i T ,
quando T ha cardinalità nita, in particolare se lo spazio degli stati del-
la catena è nito, ammette ununica soluzione e dunque risolvendolo si
ottengono proprio i valori medi desiderati.
43
Nel caso della rovina del giocatore con p = q per C = {0, m} e T = {1, . . . m1}
si calcola
E
i
[
C
] = i(a +b i)
e quindi, se il capitale iniziale di A è a, in media anche il gioco nisca si
aspetta un tempo pari ad ab.
Continuazione dellEsercizio 6
Quanto tempo in media occorre se la catena è inizialmente nello stato
(A,B,C) (dallalto verso il basso) anche il primo libro dallalto sia quello
contraddistinto dalla lettera C?
Soluzione
Per rispondere si calcola il tempo medio di assorbimento partendo dallo stato
1 nella classe chiusa C = {3, 6} per la catena modicata rendendo assorbenti
gli stati 3 e 6. Il graco della nuova catena è
Il sistema da risolvere per calcolare E
1
[
C
] è:
_
_
x
1
= 1 +
1
3
x
1
+
1
3
x
2
x
2
= 1 +
1
3
x
2
+
1
3
x
1
x
4
= 1 +
1
3
x
4
+
1
3
x
2
x
5
= 1 +
1
3
x
5
+
1
3
x
1
le cui soluzioni sono x
1
= x
2
= x
4
= x
5
= 3. Pertanto E
1
[
C
] = 3.
44
Esercizio 7
a) Calcolare le probabilità di assorbimento nello stato 0 per la catena con
matrice di transizione
P =
_
_
_
_
1 0 0 0
1
3
0
1
3
1
3
0
1
4
1
4
1
2
0 0 0 1
_
_
_
_
.
b) Calcolare la probabilità che la catena sia assorbita nello stato 0 se la
densità iniziale è quella uniforme.
c) Calcolare i tempi medi di assorbimento in {0, 3}.
Soluzione
a) Le probabilità di assorbimento nello stato 0 risolvono
_
x
1
=
1
3
+
1
3
x
2
x
2
=
1
4
x
1
+
1
4
x
2
da cui si calcola facilmente
{0}
1
= x
1
=
3
8
e
{0}
2
= x
2
=
1
8
.
b) Se poi la legge iniziale è uniforme, allora
P(
0
< +) =
3
i=0
{0}
i
1
4
= 1
1
4
+
3
8

1
4
+
1
8

1
4
=
3
8
.
c) I tempi medi di assorbimento in C = {0, 3} risolvono
_
x
1
= 1 +
1
3
x
2
x
2
= 1 +
1
4
x
1
+
1
4
x
2
e quindi si calcola E
1
[
C
] =
13
8
, E
2
[
C
] =
15
8
.
45
Esercizio 8
Sia (X
n
)
n0
la catena che descrive la seguente passeggiata aleatoria sui
vertici di un triangolo, numerati con 1,2,3 procedendo in senso antiorario: ci
si muove in senso antiorario con probabilità p e orario con probabilità 1 p
e la densità iniziale è
0
= (
1
5
0
4
5
). Calcolare il valore medio del tempo di
primo arrivo nello stato 2.
Soluzione
Vale la formula
E[
2
] =
3
i=1
0
(i)E
i
[
2
].
Infatti poiche
P(
2
= n) =
3
i=1
0
(i)P
i
(
2
= n)
si ha
E[
2
] =
n=1
nP(
2
= n) =
n=1
n
3
i=1
0
(i)P
i
(
2
= n)
e scambiando lordine delle sommatorie
E[
2
] =
n=1
nP(
2
= n) =
3
i=1
0
(i)
n=1
nP
i
(
2
= n).
Si osserva che la stessa formula si sarebbe potuta ottenere anche nel modo
che segue. La variabile aleatoria,
2
, tempo di primo arrivo nello stato 2, si
può scrivere cos`
2
=
2
I
{1}
(X
0
) +
2
I
{2}
(X
0
) +
2
I
{3}
(X
0
)
e quindi per la linearità della media
E[
2
] =
3
i=1
E
_
2
I
{i}
(X
0
)
.
La densità della variabile
2
I
{i}
(X
0
) in k 1 si calcola cos`:
P(
2
I
{i}
(X
0
) = k) = P(
2
= k, X
0
= i) = P(
2
= k|X
0
= i)P(X
0
= i).
Pertanto P(
2
I
{i}
(X
0
) = k) = P
i
(
2
= k)
0
(i) se k 1 e
E[
2
I
{i}
(X
0
)] =
k=1
k P
i
(
2
= k)
0
(i) =
0
(i)
k=1
k P
i
(
2
= k) =
0
(i)E
i
[
2
].
46
Sostituendo dunque nella formula E[
2
] =
3
i=1
0
(i)E
i
[
2
] i valori della
densità iniziale si ottiene
E[
2
] =
1
5
E
1
[
2
] +
4
5
E
3
[
2
].
Un modo per calcolare le medie E
1
[
2
], E
3
[
2
] è quello di pensare che esse
sono le stesse per la catena in cui rendiamo assorbente lo stato 2, ovvero per
la catena
Questa catena ha il vantaggio di avere gli stati 1 e 3 transienti e 2 unica
classe persistente. Cos` si può impostare il sistema
_
x
1
= 1 +p
13
x
3
= 1 + (1 p)x
3
x
3
= 1 +p
31
x
1
= 1 +p x
1
la cui soluzione (x
1
, x
3
) fornisce E
1
[
2
] e E
3
[
2
]. Si trova
E
1
[
2
] =
2 p
1 p +p
2
, E
3
[
2
] =
1 +p
1 p +p
2
Si noti che se p = 1 p, ovvero nel caso simmetrico, come ci si può as-
pettare, E
1
[
2
] = E
3
[
2
] e in particolare entrambi i valori sono uguali a 2. In
conclusione
E[
2
] =
1
5
2 p
1 p +p
2
+
4
5
1 +p
1 p +p
2
=
6 + 3p
5(1 p +p
2
)
.
47
Esercizio 9
Quattro fratelli di età dierente giocano a tirarsi la palla: ciascuno la lancia
con uguale probabilità a quelli pi` u piccoli di lui, ma il pi` u piccolo di tutti
non la lancia aatto e ferma il gioco.
a) Descrivere con una catena di Markov il gioco. Quanto tempo in media
dura il gioco se ad iniziarlo è il maggiore?
b) Arriva un amico e il gioco cambia cos`: ciascuno lancia la palla a caso al
gruppo composto dai fratelli pi` u piccoli e dallamico, tranne il fratello
minore e lamico che non lanciano la palla a nessuno e fermano il gioco.
Se ad iniziare è il maggiore, con che probabilità il gioco nisce con la
palla nelle mani del minore? In media quanto tempo dura questo
secondo gioco?
Soluzione
a) Numerati con {1, 2, 3, 4} i fratelli dal pi` u grande al pi` u piccolo, la
catena ha la matrice di transizione seguente
P =
_
_
_
_
0
1
3
1
3
1
3
0 0
1
2
1
2
0 0 0 1
0 0 0 1
_
_
_
_
il suo graco è
e lo spazio degli stati è costituito dagli stati transienti T = {1, 2, 3} e
dallo stato assorbente 4, poiche i 4 e 4 i qualsiasi sia i = 1, 2, 3
e 4 comunica solo con se stesso. Allora la classe C di tutti gli stati
48
persistenti coincide con {4} e il sistema di equazioni risolto dai tempi
medi di assorbimento in C è
_
_
x
1
= 1 +
1
3
x
2
+
1
3
x
3
x
2
= 1 +
1
2
x
3
x
3
= 1
La soluzione è x
1
=
11
6
, x
2
=
3
2
, x
3
= 1 e dunque la risposta è
11
6
. Si
sarebbe anche potuto calcolare facilmente in questo caso la densità del
tempo di assorbimento
C
trovando
P
1
(
C
= 1) =
1
3
, P
1
(
C
= 2) =
1
3
+
1
6
=
1
2
, P
1
(
C
= 3) =
1
6
.
Il tempo medio si calcolava allora cos`
E
1
[
C
] = 1
1
3
+ 2
1
2
+ 3
1
6
=
11
6
b) Lo spazio degli stati diventa {1, 2, 3, 4, 5} dove come prima i fratelli
sono numerati dal pi` u grande al pi` u piccolo e lultimo stato indica
lamico; la matrice di transizione si modica cos`
P =
_
_
_
_
_
_
0
1
4
1
4
1
4
1
4
0 0
1
3
1
3
1
3
0 0 0
1
2
1
2
0 0 0 1 0
0 0 0 0 1
_
_
_
_
_
_
il suo graco è
e lo spazio degli stati è costituito dagli stati transienti T = {1, 2, 3} e
dagli stati assorbenti 4 e 5, poiche i 4 e 4 i qualsiasi sia i = 1, 2, 3
e 4 e 5 comunicano solo con se stessi. C
1
= {4} e C
2
= {5} sono dunque
ora le uniche due classi irriducibili persistenti. In questo caso la classe
C di tutti gli stati persistenti coincide con C
1
C
2
= {4, 5}.
49
Le probabilità di assorbimento nella classe C
1
= {4} sono la soluzione
del sistema
_
_
x
1
=
1
4
+
1
4
x
2
+
1
4
x
3
x
2
=
1
3
+
1
3
x
3
x
3
=
1
2
e quindi x
1
= x
2
= x
3
=
1
2
, come era da aspettarsi per ragioni di
simmetria. Dunque se ad iniziare è il maggiore, con probabilità
1
2
il
gioco nisce con la palla nelle mani del minore.
Il sistema di equazioni risolto dai tempi medi di assorbimento in C è
_
_
x
1
= 1 +
1
4
x
2
+
1
4
x
3
x
2
= 1 +
1
3
x
3
x
3
= 1
la cui soluzione è x
1
=
19
12
, x
2
=
4
3
, x
3
= 1 e dunque la risposta è
19
12
.
Del resto
P
1
(
C
= 1) =
1
2
, P
1
(
C
= 2) =
1
4
+
1
4

2
3
=
5
12
, P
1
(
C
= 3) =
1
12
,
e quindi
E
1
[
C
] = 1
1
2
+ 2
5
12
+ 3
1
12
=
19
12
.
1.29 La catena a due stati:
comportamento asintotico delle leggi al tempo n
Si consideri la catena con S = {0, 1} e
P =
_
1 p p
q 1 q
_
con q, p [0, 1] e si calcoli la densità al tempo n,
n
. Chiaramente basterà
calcolare per esempio
n
(0) = P(X
n
= 0). Si ha
n
(0) = P(X
n
= 0 | X
n1
= 0)
n1
(0) + P(X
n
= 0 | X
n1
= 1)
n1
(1)
= (1 p)
n1
(0) +q
n1
(1)
= (1 p)
n1
(0) +q(1
n1
(0))
= (1 p q)
n1
(0) +q,
50
e ricorsivamente
n
(0) = (1 p q)
n
0
(0) +q
n1
j=0
(1 p q)
j
.
Pertanto, essendo
n1
j=0
(1 p q)
j
=
1 (1 p q)
n
p +q
,
si ottiene
n
(0) =
q
p +q
+ (1 p q)
n
_
0
(0)
q
p +q
_
n
(1) =
p
p +q
+ (1 p q)
n
_
0
(1)
p
p +q
_
.
Si osserva che, qualsiasi sia la densità iniziale
0
, se p +q = 1 si ottiene,
per ogni n 1,
n
(0) = q e
n
(1) = p. Se invece si assume |1 p q| < 1,
si ha lim
n
(1 p q)
n
= 0, qualsiasi sia la densità iniziale
0
, e quindi
lim
n
n
(0) =
q
p +q
e
lim
n
n
(1) =
p
p +q
.
Dunque in entrambi i casi si può dire che, qualsiasi sia la densità iniziale
0
, la legge di questa catena al crescere del tempo si stabilizza. Ci si può
chiedere se questo comportamento sia eccezionale. Per ora si noti che posto
0
(0) =
q
p+q
e quindi
0
(1) =
p
p+q
si ha per ogni n 1,
n
(0) =
q
p+q
e quindi
n
(1) =
p
p+q
, ovvero, se la legge iniziale coincide con la legge limite, la stessa
legge è la legge della catena in ogni tempo.
Si osserva che il conto precedente vale anche nel caso in cui uno dei due
parametri è in (0, 1) e laltro assume uno dei valori estremi dellintervallo.
Inoltre la stessa convergenza delle densità ha luogo anche nel caso in cui uno
dei due parametri è nullo e laltro è 1; anzi in tal caso si calcola facilmente
che, qualsiasi sia la densità iniziale
0
, vale
n
(0) =
q
p+q
e
n
(1) =
p
p+q
per
ogni n 1.
Invece se entrambi i parametri sono nulli oppure se entrambi sono pari ad 1
allora non cè convergenza della successione delle densità; infatti, se entrambi
i parametri sono nulli, la matrice di transizione è la matrice identità e,
qualsiasi sia la densità iniziale
0
, la successione (
n
, n 0) è costante
uguale a
0
; se i due parametri sono entrambi uguali ad 1 allora, qualsiasi
sia la densità iniziale
0
, per n pari
n
coincide con
0
, mentre per n dispari
n
coincide con (
0
(0)
0
(1)).
51
1.30 Denizione di misura invariante
Si denisce misura di probabilità invariante o stazionaria per una matrice
di transizione P unapplicazione v : S [0, 1] tale che
i)
iS
v
i
= 1
ii) se (X
n
)
n0
è la catena associata a P con densità iniziale
0
= v, allora
qualsiasi sia n 1
n
= v P
n
= v.
Condizione necessaria e suciente anche v : S [0, 1] sia una misura
di probabilità invariante è che
a)
iS
v
i
= 1
b) v P = v.
La condizione necessaria è immediata. La condizione suciente segue
osservando che a) e i) coincidono e b) implica ii): infatti se b) è vera, allora,
poiche
n
=
n1
P,
assumendo lipotesi induttiva
n1
= v si ha
n
= v P = v.
1.31 Esempi nel caso nito
Data P nita e bistocastica, cioè tale che per ogni i S
n
j=1
p
ji
= 1
(n= cardinalità di S) si dimostra che esiste una costante k tale che v
i
= k per
ogni i S è una misura di probabilità invariante. Anche v sia invariante
la costante k deve vericare
a)
n
i=1
k = 1
b)
n
j=1
k p
ji
= k per ogni i S.
La condizione b) è chiaramente vera essendo
n
j=1
k p
ji
= k
n
j=1
p
ji
e P
bistocastica. La condizione a) fornisce k =
1
n
.
Dunque una misura invariante per P bistocastica è la misura uniforme.
`
E lunica?
52
Come secondo esempio si considera la catena che descrive una passeg-
giata aleatoria sui vertici di un grafo: la catena ha tanti stati quanti sono i
vertici e la probabilità di transizione da uno stato (vertice) è uniforme sugli
stati adiacenti (vertici connessi al primo da un arco).
Dato per esempio il grafo
il graco della catena associata è il seguente
Se k
i
è il numero dei vertici adiacenti a i S e
k =
iS
k
i
,
allora v tale che
v
i
=
k
i
k
è una misura invariante per la catena. Infatti
jS
k
j
k
p
ji
=
j adiacenti a i
k
j
k
1
k
j
=
k
i
k
,
lultima uguaglianza usa il fatto che solo k
i
sono gli stati per i quali p
ji
= 0.
`
E lunica misura invariante?
Per la catena di nascita e morte su {0, 1, . . . , m} con gli stati 0 e m
assorbenti e q
i
> 0, p
i
> 0 se i = 1, . . . , m1, è chiaro che v
(1)
= (1 0 . . . 0)
è invariante, poiche v
(1)
P = v
(1)
e
m
i=0
v
(1)
i
= 1. Analogamente v
(2)
=
(0 0 . . . 1) è invariante.
53
Sia ora il vettore w denito cos`
w
i
= v
(1)
i
+ (1 )v
(2)
i
per una qualche costante (0, 1). Allora w è invariante poiche w
i
0 per
ogni i = 0, . . . , m e inoltre
a)
m
i=0
w
i
=
m
i=0
v
(1)
i
+ (1 )
m
i=0
v
(2)
i
= + (1 ) = 1.
b)
wP = v
(1)
P + (1 ) v
(2)
P = v
(1)
+ (1 )v
(2)
= w.
La famiglia precedente denisce uninnità di misure invarianti e dal prossi-
mo risultato segue che ogni misura invariante appartiene alla famiglia.
Proposizione Se i e transiente e v e invariante vale v
i
= 0.
Dimostrazione Se v è invariante, per ogni i S
v
i
=
n
(i) =
jS
v
j
p
(n)
ji
e passando al limite in n in entrambi i membri si ottiene per ogni i S
v
i
= lim
n
jS
v
j
p
(n)
ji
=
jS
v
j
lim
n
p
(n)
ji
= 0
Lo scambio tra somma e limite è immediato se S è nito ed è lecito in
generale poiche si può utilizzare il seguente risultato sulle serie ([1]): le con-
dizioni lim
n
a
nj
= 0, |a
nj
| A per ogni n, j,
j=1
|b
j
| < + implicano
lim
n
j=1
|a
nj
b
j
| = 0. Nel caso in esame: a
nj
= p
(n)
ji
1, b
j
= v
j
e
j=1
b
j
= 1.
1.32 Esistenza e unicità della misura invariante
Si sono trovate una o pi` u misure invarianti per tre diversi esempi di catene.
Ma in generale esiste sempre almeno una misura invariante? Se esiste quando
è unica?
Teorema(Markov Kakutani ) ([1]) Una matrice di transizione su uno
spazio nito ammette sempre almeno una misura invariante.
Si è già dimostrato nel caso della catena di nascita e morte che ogni
combinazione convessa di due misure invarianti è invariante e si vede subito
che la dimostrazione non dipende ne dalla catena ne dalla forma di v
(1)
e v
(2)
54
e quindi il risultato vale in generale. Pertanto se esiste pi` u di una misura
invariante allora ne esistono innite.
Su S eventualmente innito sia P irriducibile. Già si è detto che la
caratterizzazione degli stati è globale, cioè o sono tutti persistenti o sono
tutti transienti, di conseguenza la catena si dice persistente o transiente. Si
ricorda che i è persistente se e solo se P
i
(
i
< +) = 1, ma se una variabile
aleatoria è nita con probabilità 1 questo non implica necessariamente che
il suo valore medio sia nito. Nel caso persistente si distinguono cos` due
sottocasi:
catena persistente positiva: per ogni i S, E
i
[
i
] < +,
catena persistente nulla: per ogni i S, E
i
[
i
] = +.
Anche il carattere della persistenza nel caso irriducibile è globale (vedi [3]).
Teorema Ogni catena irriducibile persistente positiva ammette ununica
misura invariante data da
v
i
=
1
E
i
[
i
]
, i S.
Le catene irriducibili transienti o persistenti nulle non ammettono misura
invariante.
Si rimanda per unidea della dimostrazione alla ne di queste note e per
maggior dettaglio a [3].
Nel caso irriducibile dunque per determinare lesistenza della misura in-
variante occorre poter stabilire se la media dei tempi di ritorno negli stati è
nita e, per il carattere globale della nozioni di persistenza nulla e positiva
e transienza, è suciente vericarlo per un solo stato.
`
E intuitivo (ma richiederebbe una dimostrazione che qui si omette) il
fatto che tutte le catene irriducibili nite sono persistenti positive e quindi
hanno ununica misura invariante. Se si calcola la misura invariante allora
automaticamente si calcolano anche i tempi medi di ritorno negli stati.
1.33 Catene ergodiche
Una matrice di transizione P si dice ergodica se ssato j qualsiasi sia i S
lim
n
p
(n)
ij
= v
j
per qualche v : S [0, 1] tale che
j
v
j
= 1. Si può dimostrare che
dallergodicità discende
i) ssato j, qualsiasi sia la misura iniziale della catena, lim
n
n
(j) =
v
j
ii) v è una misura invariante
55
iii) v è lunica misura invariante.
La dimostrazione si fa vedere ora nel caso nito, quando limiti e somme
si scambiano senza problema:
i)
lim
n
n
(j) = lim
n
0
(i) p
(n)
ij
=
0
(i) lim
n
p
(n)
ij
=
0
(i)v
j
= v
j
0
(i) = v
j
_
La dimostrazione di questo punto nel caso innito richiede il risultato di
scambio di limite e serie enunciato precedentemente:
lim
n
|
0
(i)(p
(n)
ij
v
j
)| lim
n
0
(i)|p
(n)
ij
v
j
| =
0
(i) lim
n
|p
(n)
ij
v
j
| = 0
e |p
(n)
ij
v
j
| 2 per ogni n, i.
_
ii) per ogni i S si ha (v P)
i
= v
i
poiche
j
v
j
p
ji
=
j
lim
n
p
(n)
kj
p
ji
= lim
n
j
p
(n)
kj
p
ji
= lim
n
p
(n+1)
ki
= v
i
(k è arbitrario ssato)
iii) Se w fosse unaltra misura invariante, scelta
0
= w si avrebbe
n
(i) = w
i
per ogni i, n e quindi, dovendo anche essere per il punto prece-
dente lim
n
n
(i) = v
i
, seguirebbe, per lunicità del limite, w
i
= v
i
per
ogni i.
1.34 Catene regolari
Nel caso delle catene irriducibili con spazio degli stati nito esiste una con-
dizione necessaria e suciente per lergodicità: la regolarità.
Una matrice di transizione su uno spazio di stati nito si dice regolare se
esiste n 1 tale che p
(n)
ij
> 0 per ogni i, j.
Una condizione suciente per la regolarità è che P sia irriducibile e esista
h S tale che p
hh
> 0. Infatti se m = max{n(i, j), i, j S t.c. p
(n(i,j))
ij
> 0}
(n(i, j) esiste per lirriducibilità), allora p
(2m)
ij
> 0 per ogni i, j poiche
p
(2m)
ij
p
(n(i,h))
ih
p
hh
. . . p
hh
p
(n(h,j))
hj
> 0,
dove il prodotto di p
hh
per se stesso è ripetuto 2mn(i, h) n(h, j) volte.
56
Si noti bene che la regolarità è condizione necessaria per lergodicità
solo nel caso in cui la catena sia irriducibile. Come controesempio si tenga
presente la catena a due stati con uno dei due parametri nullo e laltro pari
ad 1 (vedi sezione 29).
Esercizio 10
Sia X
n
la catena su S = {1, 2, 3} tale che: se lanciando una moneta si ottiene
testa allora X
0
= 1, altrimenti X
0
= 2 o X
0
= 3 con uguale probabilità; nei
tempi successivi se la catena è in 1 vi rimane, se è in 3 passa in 2, se è in 2
passa in 3 con probabilità
2
3
o rimane in 2.
a) Calcolare le eventuali misure invarianti.
b) Calcolare lim
n
p
(n)
ij
per ogni i, j.
c) Calcolare lim
n
n
(i) per ogni i.
Soluzione
La catena ha matrice di transizione
P =
_
_
1 0 0
0
1
3
2
3
0 1 0
_
_
e misura iniziale
0
= (
1
2
1
4
1
4
) e il suo graco è
a) Pertanto S = C
1
C
2
= {1} {2, 3}, ovvero 1 è stato assorbente e
{2, 3} è classe persistente positiva. Esistono pertanto innite misure
invarianti che sono tutte le combinazioni convesse di v
(1)
= (1 0 0) e
v
(2)
= (0
3
5
2
5
). I vettori 1 e (
3
5
2
5
) sono infatti le misure invarianti della
catena ristretta rispettivamente alle classi {1} e {2, 3}.
57
b)
`
E evidente che qualsiasi sia n la matrice di transizione in n passi avrà
la forma
P
(n)
=
_
_
_
1 0 0
0 p
(n)
22
p
(n)
23
0 p
(n)
32
p
(n)
33
,
_
_
_
da cui subito si ricava che
lim
n
p
(n)
11
= 1, lim
n
p
(n)
12
= 0, lim
n
p
(n)
13
= 0,
lim
n
p
(n)
21
= 0, lim
n
p
(n)
31
= 0 .
Per quanto riguarda gli altri elementi, poiche la matrice di transizione
ristretta agli stati 2 e 3 è regolare (in quanto irriducibile con p
22
> 0)
allora è ergodica e si ha per i = 2, 3
lim
n
p
(n)
i2
= v
(2)
2
=
3
5
, lim
n
p
(n)
i3
= v
(2)
3
=
2
5
c) Inne poiche
n
(1) =
3
i=1
0
(i) p
(n)
i1
=
1
2
p
(n)
11
+
1
4
p
(n)
21
+
1
4
p
(n)
31
=
1
2
n
(2) =
3
i=1
0
(i) p
(n)
i2
=
1
4
p
(n)
22
+
1
4
p
(n)
32
n
(3) =
3
i=1
0
(i) p
(n)
i3
=
1
4
p
(n)
23
+
1
4
p
(n)
33
,
allora
lim
n
n
(1) =
1
2
lim
n
n
(2) =
1
4
(
3
5
+
3
5
) =
3
10
lim
n
n
(3) =
1
4
(
2
5
+
2
5
) =
1
5
.
Esercizio 11
Sia data la matrice di transizione
P =
_
_
0.4 0.4 0.2
0.3 0.4 0.3
0.2 0.4 0.4
_
_
.
58
Calcolare lunica misura invariante.
Soluzione
La matrice è irriducibile nita e quindi persistente positiva e con ununica
misura invariante soluzione del sistema
_
_
x
1
+x
2
+x
3
= 1
0.4 x
1
+ 0.3 x
2
+ 0.2 x
3
= x
1
0.4 x
1
+ 0.4 x
2
+ 0.4 x
3
= x
2
0.2 x
1
+ 0.3 x
2
+ 0.4 x
3
= x
3
x
i
0
equivalente a
_
_
x
1
+x
2
+x
3
= 1
6 x
1
+ 3 x
2
+ 2 x
3
= 0
4 x
1
6 x
2
+ 4 x
3
= 0
2 x
1
+ 3 x
2
6 x
3
= 0
x
i
0.
Moltiplicando la seconda equazione per 2 e sottraendole la terza e al tempo
stesso moltiplicando la quarta per 2 e sottraendole la terza si ottiene il
sistema equivalente
_
_
x
1
+x
2
+x
3
= 1
8 x
1
+ 12 x
2
= 0
12 x
2
16 x
3
= 0
x
i
0
dal quale facilmente si ricava x
1
=
3
4
x
2
, x
3
=
3
4
x
2
e inne x
2
=
2
5
.
Esercizio 12
Assegnata la matrice di transizione
P =
_
_
0
1
4
3
4
0
1
2
1
2
0 0 1
_
_
a) calcolare la misura invariante se esiste
b) la media del tempo di primo ritorno in 1
c) la media dei tempi di assorbimento in 3.
Soluzione
a) La decomposizione dello spazio degli stati è
S = {1, 2, 3} = T C = {1, 2} {3}
ovvero: 1 e 2 sono stati transienti poiche comunicano con 3 che non comu-
nica ne con 1 ne con 2; 3 è uno stato assorbente. Pertanto lunica misura
invariante è v = (0 0 1), unica soluzione non negativa del sistema
_
x
i
= 1
xP = x
x
1
= 0
x
2
= 0
59
(si ricordi: le misure invarianti valgono 0 sugli stati transienti)
b) Poiche 1 è transiente, si ha
11
= P
1
(
1
< +) < 1
ovvero
P
1
(
1
= +) > 0
e quindi E
1
[
1
] = +.
c) Per calcolare i tempi di assorbimento in 3 si può risolvere il sistema
E
i
[
3
] = 1 +
jT
p
ij
E
j
[
3
], i = 1, 2
che coincide con
_
E
1
[
3
] = 1 +
1
4
E
2
[
3
]
E
2
[
3
] = 1 +
1
2
E
2
[
3
]
che dà E
2
[
3
] = 2 e E
1
[
3
] = 3/2.
Altrimenti si può determinare la densità di
3
, ovvero P
i
(
3
= k) per
k 1 corrispondente alla legge iniziale delta di Dirac in i, e calcolare poi
E
i
[
3
] =
k=1
kP
i
(
3
= k), i = 1, 2.
Per esempio, dal graco della catena subito si calcola
P
1
(
3
= 1) =
3
4
, P
1
(
3
= k) =
1
2
k+1
, k 2
e quindi
E
1
[
3
] =
3
4
+
k=2
k
1
2
k+1
=
3
4
+
1
2
_
E[Z]
1
2
_
=
3
2
.
con Z variabile aleatoria geometrica di parametro
1
2
e quindi E[Z] = 2.
Analogamente
P
2
(
3
= 1) =
1
2
, P
2
(
3
= k) =
1
2
k
, k > 1
e quindi
E
2
[
3
] = E[Z] = 2.
Naturalmente E
3
[
3
] = 1.
60
Esercizio 13
Assegnata la matrice
P =
_
_
_
_
_
_
3
4
0 0
1
4
0
1
4
1
4
1
4
1
4
0
0 0 0 0 1
1
2
0 0
1
2
0
0 0
1
4
0
3
4
_
_
_
_
_
_
a) trovare tutte le misure invarianti
b) calcolare la probabilità di raggiungere linsieme {1, 4} partendo dallo
stato 2. Quanto vale allora la probabilità di raggiungere linsieme
{3, 5}?
Soluzione
a) In questo caso
S = {1, 2, 3, 4, 5} = T C
1
C
2
= {2} {1, 4} {3, 5},
ovvero vi sono due classi irriducibili persistenti positive. Risolvendo il
sistema
_
_
x
1
+x
2
+x
3
+x
4
+x
5
= 1
x
1
=
3
4
x
1
+
1
2
x
4
x
2
= 0
x
3
=
1
4
x
5
x
4
=
1
4
x
1
+
1
2
x
4
x
5
= x
3
+
3
4
x
5
.
si trova x = (2x
4
0 x
3
x
4
4x
3
) con 3x
4
+ 5x
3
= 1 dove x
3
e x
4
sono
lasciate come parametri. Dunque le misure invarianti sono tutti i vettori
della forma (2 0 4) al variare di e in R
+
tali che 3 +5 = 1. Si
osserva che la prima e la quarta componente della generica misura invariante
(2 0 4) risolvono un sistema separato dal sistema risolto dalla terza
e dalla quinta e precisamente il sistema risolto dalla misura invariante della
dinamica su C
1
e la la terza e la quinta componente risolvono il sistema
risolto dalla misura invariante della dinamica su C
2
. Segue che per = 0
si ottiene v
(1)
= (
2
3
0 0
1
3
0) e che (v
(1)
1
v
(1)
4
) è la misura invariante della
dinamica su C
1
e per = 0 si ottiene v
(2)
= (0 0
1
5
0
4
5
) e che (v
(2)
3
v
(2)
5
)
è la misura invariante della dinamica su C
2
. Inoltre, poiche dividendo la
soluzione di un sistema omogeneo per la somma delle sue componenti si
ottiene una soluzione le cui componenti hanno come somma 1, esiste una
costante > 0 tale che (2 ) = (v
(1)
1
v
(1)
4
) e quindi (2 0 0 0) = v
(1)
.
Per lo stesso motivo esiste una costante > 0 tale che (0 0 0 4) =
61
v
(2)
. Cos` poiche (2 0 4) = (2 0 0 0) + (0 0 0 4) allora
e sono tali che (v
(1)
1
+ v
(1)
4
) + (v
(2)
3
+ v
(2)
5
)=1, ovvero, ricordando che
v
(1)
1
+v
(1)
4
= 1 = v
(2)
3
+v
(2)
5
, sono tali che = 1 . Si è mostrato che ogni
misura invariante si esprime come combinazione convessa di v
(1)
e v
(2)
, cioè
v = v
(1)
+ (1 )v
(2)
con [0, 1].
Con dimostrazione analoga si prova laermazione generale per cui: le misure
invarianti di una catena a valori in uno spazio nito sono tutte e sole quelle
che si ottengono per combinazione convessa a partire dalle misure invarianti
della dinamica ristretta alle classi persistenti.
b) Si devono calcolare le probabilità di assorbimento
C
1
2
e
C
2
2
. Per
calcolare
C
1
2
si risolve
x =
1
4
+
1
4
+
1
4
x
e si ottiene
C
1
2
=
2
3
. Dal fatto che
C
2
2
= P
2
(
C
2
< +) = P
2
(
C
2
<
C
1
) = 1 P
2
(
C
1
<
C
2
) = 1
C
1
2
,
segue
C
2
2
=
1
3
.
1.35 La misura invariante per lurna di Ehrenfest
Si ricordano le probabilità di transizione dellurna di Ehrenfest con d biglie:
p
0j
= I
{1}
(j), p
dj
= I
{d1}
(j),
p
ij
= I
{i+1}
(j)
d i
d
+I
{i1}
(j)
i
d
, 1 i d 1.
La catena è una catena di nascita e morte irriducibile nita e quindi persis-
tente positiva. Esiste dunque ununica misura invariante che è la soluzione
di
_
_
x
0
+x
1
+. . . +x
d
= 1
x
0
=
x
1
d
x
i
= x
i1
d(i1)
d
+x
i+1
i+1
d
, 1 i d 1
x
d
=
x
d1
d
x
i
0.
Scelto x
0
come parametro, si verica subito che il sistema è equivalente al
sistema
_
_
x
0
+x
1
+. . . +x
d
= 1
x
1
= d x
0
x
i
=
d (d1) ... (di+1)
i!
x
0
=
_
d
i
_
x
0
, 1 i d
x
i
0.
62
Per dimostrarlo si osservi che dalla seconda equazione segue che
x
1
= d x
0
e sostituendo nella terza per i = 1 il valore di x
1
in termini di x
0
si ottiene
x
2
=
d(d 1)
2
x
0
=
_
d
2
_
x
0
.
Iterando il procedimento dalla terza equazione si ricavano tutti i valori in
funzione di x
0
. Infatti lequazione si riscrive anche cos`
x
i+1
=
d
i + 1
x
i
d i + 1
i + 1
x
i1
,
e se si assume che valga
x
i1
=
_
d
i 1
_
x
0
=
d (d 1) . . . (d i + 2)
(i 1)!
x
0
e
x
i
=
_
d
i
_
x
0
=
d (d 1) . . . (d i + 1)
i!
x
0
,
si ottiene
x
i+1
=
d
i + 1
d (d 1) . . . (d i + 1)
i!
x
0
d i + 1
i + 1
d (d 1) . . . (d i + 2)
(i 1)!
x
0
=
d(d i) (d 1) . . . (d i + 1)
(i + 1)!
x
0
=
_
d
i + 1
_
x
0
Per ricavare il valore di x
0
si sostituiscono le espressioni ottenute nella prima
equazione ottenendo
d
i=0
_
d
i
_
x
0
= 1
e dalla formula del binomio di Newton si ricava x
0
=
1
2
d
. Concludendo la
misura invariante è v con
v
i
=
1
2
d
_
d
i
_
i = 0, . . . , d
ovvero la densità della binomiale di parametri n = d, p =
1
2
.
63
1.36 Non esistenza della misura invariante
per la passeggiata aleatoria simmetrica in Z
Si può dimostrare che la passeggiata aleatoria su Z in cui sono possibili solo
le transizioni sugli stati adiacenti (p
ij
= I
{i1}
(j) q+I
{i+1}
(j) p) è persistente
se e solo se è simmetrica, cioè con stessa probabilità di un passo avanti e uno
indietro. Qui si dimostra che la passeggiata aleatoria simmetrica su Z non
ammette misura invariante e dunque si conclude che è catena persistente
nulla.
Nel caso simmetrico p
ij
= I
{i1}
(j)
1
2
+I
{i+1}
(j)
1
2
e il sistema di equazioni
per la misura invariante si riscrive
_
iZ
x
i
= 1, x
i
0
x
i
=
x
i1
2
+
x
i+1
2
, i Z.
Dallequazione generale si ricava x
i+1
= 2x
i
x
i1
e quindi x
i+1
x
i
=
x
i
x
i1
, i Z, e quindi x
i+1
x
i
= x
1
x
0
.
Pertanto per ogni i 1
x
i
x
0
=
i1
j=0
(x
j+1
x
j
) = i(x
1
x
0
)
e quindi
x
i
= i(x
1
x
0
) +x
0
.
Segue che, poiche
iZ
x
i
= 1 < +, non può essere x
1
x
0
> 0 altrimenti
lim
i+
x
i
= + (mentre il termine generico di una serie convergente
è innitesimo); ne può essere x
1
x
0
< 0 altrimenti lim
i
x
i
= ,
mentre x
i
0. Dunque x
1
x
0
= 0, cioè x
i
= x
0
per ogni i 1. Inoltre
dovendo essere
iZ
x
i
< + e quindi
i1
x
i
< +, potrà solo essere
x
i
= x
0
= 0 per ogni i 1. Inoltre per ragioni di simmetria vale anche per
ogni i 1
x
i
=
_
|i| + 1
_
(x
0
x
1
) +x
1
e quindi x
i
= 0 per ogni i 1. Dunque il sistema non ammette soluzione
poiche quella identicamente nulla non verica
iZ
x
i
= 1.
1.37 Misura invariante per le catene di nascita e morte
Lenunciato che si vuole dimostrare è il seguente: una catena di nascita e
morte innita persistente ammette una misura invariante se e solo se, posto

0
= 1
i
=
p
0
p
1
. . . p
i1
q
1
q
2
. . . q
i
, i 1,
64
si ha
i=0

i
< +
e la misura invariante si calcola cos` per ogni i 0
v
i
=

i
i=0

i
.
Il sistema per il calcolo della misura invariante è
_
_
x
0
= x
0
r
0
+x
1
q
1
x
i
= x
i1
p
i1
+x
i
r
i
+x
i+1
q
i+1
, i 1
+
i=0
x
i
= 1
x
i
0
e sostituendo a r
i
il valore 1 p
i
q
i
si ottiene
_
_
x
1
q
1
x
0
p
0
= 0
x
i+1
q
i+1
x
i
p
i
= x
i
q
i
x
i1
p
i1
, i 1
+
i=0
x
i
= 1
x
i
0
e quindi
_
_
x
i
q
i
x
i1
p
i1
= 0, i 1
+
i=0
x
i
= 1
x
i
0
da cui
_
_
x
i
=
p
i1
q
i
x
i1
=
p
i1
q
i
p
i2
q
i1
x
i2
= . . . =
i
x
0
, i 1
+
i=0
x
i
= 1
x
i
0.
Dalla seconda equazione si ottiene il valore di x
0
:
x
0
=
1
i=0

i
.
e dunque contemporaneamente la condizione necessaria e suciente e le-
spressione della misura invariante.
Se la catena è irriducibile ma lo spazio è nito S = {0, 1, . . . , m} allora
essendo persistente positiva ammette ununica misura invariante che risolve
_
_
x
0
= x
0
r
0
+x
1
q
1
x
i
= x
i1
p
i1
+x
i
r
i
+x
i+1
q
i+1
, 1 i m1
x
m
= x
m1
p
m1
+x
m
q
m
+
i=0
x
i
= 1
x
i
0
65
e quindi
v
i
=

i
m
i=0

i
.
Esercizio 14
Si indichi con (X
n
)
n
la catena di Markov che descrive una coda in cui le
variabili aleatorie numero dei clienti in arrivo e in partenza in ogni unità
temporale sono indipendenti di legge Bernoulli rispettivamente di parametri
=
1
4
e =
1
2
.
a) Calcolare le probabilità di transizione della catena.
b) La catena è irriducibile ?
`
E persistente? Ammette una misura invari-
ante unica?
c) Dare le condizioni su e generici che consentono di rispondere
aermativamente alle precedenti domande.
Soluzione
a) Indicati con A e B rispettivamente gli eventi {arriva un cliente} e {parte
un cliente}, per ipotesi A e B sono eventi indipendenti e da ogni sta-
to i diverso da 0 si transita in i + 1 con la probabilità di A B
c
che è
P
i
(A) P
i
(B
c
) = (1 ) =
1
8
e in i 1 con la probabilità di A
c
B che è
P
i
(A
c
) P
i
(B) = (1 ) =
3
8
e inne si rimane in i con la probabilità di
AB
A
c
B
c
che è +(1)(1) =
1
2
. Inne da 0 si transita in 1 con
probabilità =
1
4
e si resta in 0 con probabilità 1 =
3
4
. Riassumendo
r
0
=
3
4
, p
0
=
1
4
, e, per ogni i 1, q
i
= q =
3
8
, p
i
= p =
1
8
, r
i
= r =
1
2
.
b) La catena è irriducibile poiche per ogni i 1 si ha p
i
> 0 e q
i
> 0. La
catena è persistente poiche sappiamo che, se le probabilità di nascita e morte
non dipendono dallo stato, condizione suciente è che q
i
p
i
, i 1. La
catena ammette ununica misura invariante poiche la condizione necessaria
e suciente in generale è
i=0

i
< + e, se si ha come in questo caso
p
i
= p, q
i
= q, i 1, allora per i 1 vale
i
=
p
0
p
_
p
q
_
i
e quindi la serie è
convergente se e solo se
p
q
< 1 cioè p < q, come in questo caso. La misura
invariante in generale è
v
i
=

i
i=0

i
e qui per i 1,

i
=
1
4
3
8
_
1
3
_
i1
=
2
3
_
1
3
_
i1
e quindi
i=0

i
= 1 +
2
3
i=1
_
1
3
_
i1
= 1 +
2
3
3
2
= 2
66
e in conclusione
v
0
=
1
2
, v
i
=
_
1
3
_
i
, i 1.
[c)] Se e sono in (0, 1) allora p
i
> 0 e q
i
> 0, per ogni i 1, e la catena è
irriducibile. La condizione per la persistenza è p = (1) (1) = q
ovvero ovvero probabilità di arrivo minore o uguale alla probabilità
di partenza. La condizione per lesistenza della misura invariante è p =
(1) < (1) = q, ovvero < , ovvero probabilità di arrivo minore
della probabilità di partenza. Se è = 0, allora si vede subito che la catena
non è irriducibile (infatti nessuno stato comunica con i successivi), tutti gli
stati positivi sono transienti (per ogni i 1, i comunica con 0 ma 0 non
comunica con i) e lo stato 0 è assorbente. Esiste ununica misura invariante
che è la delta di Dirac in i = 0. Se è = 0 la catena non è irriducibile
(nessuno stato comunica con i precedenti), gli stati sono tutti transienti e
naturalmente non esiste misura invariante.
Esercizio 15
Trovare la misura di probabilità invariante per la catena con graco
Soluzione
In questo caso
S = {1, 2, 3, 4} = T C = {3} {1, 2, 4}
e pertanto la misura invariante sarà della forma
v = (v
1
v
2
0 v
4
)
dove (v
1
v
2
v
4
) è la misura invariante per la matrice di transizione irriducibile
P =
_
_
3
4
1
4
0
1
4
1
2
1
4
0
3
4
1
4
_
_
67
ottenuta da quella originaria cancellando la terza riga e la terza colonna.
Occorre risolvere dunque
_
_
x
1
+x
2
+x
3
= 1
x
1
=
3
4
x
1
+
1
4
x
2
x
2
=
1
4
x
1
+
1
2
x
2
+
3
4
x
3
x
3
=
1
4
x
2
+
1
4
x
3
x
i
0.
Si trova x = (
3
7
3
7
1
7
) e dunque v = (
3
7
3
7
0
1
7
) è lunica misura invariante per
la catena originaria.
Esercizio 16
Assegnata la matrice
P =
_
_
0
1
4
3
4
0
1
2
1
2
1 0 0
_
_
a) calcolare la misura invariante se esiste
b) la media del tempo di primo ritorno in 1
Soluzione
a) La catena è irriducibile e quindi, poiche nita, anche persistente positiva.
Esiste dunque ununica misura invariante che si ottiene risolvendo
_
_
x
1
+x
2
+x
3
= 1
x
1
= x
3
x
2
=
1
4
x
1
+
1
2
x
2
x
3
=
3
4
x
1
+
1
2
x
2
x
i
0
equivalente a
_
_
x
1
+x
2
+x
3
= 1
x
1
= 2x
2
= x
3
x
i
0
da cui x = (
2
5
1
5
2
5
) è la misura invariante.
b) Dal teorema sulle catene irriducibili si sa che la media del tempo di
primo ritorno in uno stato è il reciproco del valore della misura invariante
nello stato e quindi
E
1
[
1
] =
5
2
=
1
v
1
.
68
Esercizio 17
Calcolare la misura invariante per lurna di Ehrenfest con d = 3 modicata
nel modo seguente: la biglia corrispondente al numero estratto viene inserita
in una delle due urne scelta a caso e la catena conta le biglie in unurna
ssata.
Soluzione
La matrice di transizione della catena di Ehrenfest modicata con d = 3 è
P =
_
_
_
_
1
2
1
2
0 0
1
6
1
2
1
3
0
0
1
3
1
2
1
6
0 0
1
2
1
2
.
_
_
_
_
Infatti, indicati con A e B rispettivamente gli eventi {il numero estratto cor-
risponde ad una biglia dellurna ssata} e {lurna estratta è quella ssata},
per ipotesi A e B sono eventi indipendenti condizionatamente al numero di
biglie nellurna ssata e per esempio da ogni stato i diverso da 0 e d si tran-
sita in i 1 con la probabilità di AB
c
che è P
i
(A) P
i
(B
c
) =
i
d
1
2
e in i +1
con la probabilità di A
c
B che è P
i
(A
c
) P
i
(B) =
di
d
1
2
e inne si rimane in
i con la probabilità di AB
A
c
B
c
che è
1
2
. In modo analogo si calcolano
le probabilità di transizione da 0 e da d. Si tratta di una catena di nascita
e morte irriducibile e persistente positiva ed è facile calcolare risolvendo il
sistema di equazioni corrispondente che lunica misura invariante è
v =
_
1
8
3
8
3
8
1
8
_
.
Per lo stesso calcolo si possono anche utilizzare le formule generali per la
misura invariante di una catena di nascita e morte nita.
1.38 Esempi di catene periodiche
Si assuma che la catena di Ehrenfest si trovi nello stato i {0, 1, . . . , d},
allora certamente al tempo successivo si troverà in uno stato diverso, ma
potrà tornare in i in un tempo che dista dallattuale un numero pari; sarà
impossibile per la catena, invece, essere in i in tempi che sono a distan-
za dispari dal tempo attuale. Ovvero usando le probabilità di transizione
qualsiasi sia i
p
(2n)
ii
> 0, n 1 p
(2n+1)
ii
= 0, n 0.
La stessa cosa accade per una qualsiasi catena di nascita e morte nita
irriducibile a barriere riettenti (r
0
= 0, p
0
= 1, r
d
= 0, q
d
= 1) e con r
i
= 0
qualsiasi sia i = 1, . . . , d 1.
69
La stessa proprietà è vericata dalla matrice di transizione della catena
associata al grafo
ovvero la potenza P
n
per n pari ha tutti gli elementi sulla diagonale positivi
e per n dispari ha tutti gli elementi sulla diagonale nulli. Si individua subito
anche unaltra particolarità:
P
2n+1
=
_
_
_
_
0 + 0 +
+ 0 + 0
0 + 0 +
+ 0 + 0
_
_
_
_
P
2n
=
_
_
_
_
+ 0 + 0
0 + 0 +
+ 0 + 0
0 + 0 +
_
_
_
_
dove il segno + indica che lelemento corrispondente è positivo. Dunque
se parto da uno stato dispari allora mi trovo in ogni tempo dispari in uno
stato pari e in ogni tempo pari in uno stato dispari.
`
E dunque chiaro che
pur essendo questa catena irriducibile e quindi, essendo nita, persistente
positiva e esistendo ununica misura invariante v, non potrà certo essere
qualsiasi sia j
lim
n
p
(n)
ij
= v
j
.
Infatti ssati i e j se il limite esistesse non potrebbe che essere
lim
n
p
(n)
ij
= 0.
Si consideri ora la catena con graco
`
E facile accorgersi che anche in questo caso cè una regolarità in P. In questo
caso qualsiasi sia i
p
(3n)
ii
> 0, n 1 p
(h)
ii
= 0, h = 3n, n 1.
70
Cos` come prima lo spazio degli stati veniva diviso in due classi, i pari e i
dispari, che erano, da qualunque stato si partisse ciclicamente rivisitati (pe-
riodo 2), anche ora lo spazio viene suddiviso in classi rivisitate ciclicamente
e precisamente {1}, {2}, {0, 3}: comunque si parta dopo 3 passi ci si ritrova
nella classe di appartenenza dello stato iniziale.
1.39 Periodo di una catena irriducibile
Nel caso delle catene irriducibili persistenti positive, sia S nito o innito,
lergodicità è equivalente allaperiodicità.
Si denisce periodo di uno stato persistente i in una catena generica (non a
priori irriducibile) il numero t
i
denito come
MCD{n : p
(n)
ii
> 0}
(MCD=massimo comun divisore). Vale il seguente teorema.
Teorema In una catena irriducibile il periodo è lo stesso per ogni stato
(e si chiama periodo della catena).
Dimostrazione Si dimostra che ssato i S per qualsiasi k = i, t
i
e t
k
sono divisori luno dellaltro e da questo seguirà la tesi. Poiche la catena è
irriducibile esistono m 1 e n 1 tali che p
(m)
ik
> 0 e p
(n)
ki
> 0. Dunque
p
(m+n)
ii
> 0
e dunque t
i
è divisore di m+n e inoltre, qualsiasi sia r 1 tale che p
(r)
kk
> 0,
essendo p
(m+n+r)
ii
p
(m)
ik
p
(r)
kk
p
(n)
ki
vale
p
(m+n+r)
ii
> 0
e dunque t
i
è divisore di m + n + r e in conclusione t
i
è divisore di r
e poiche r è qualsiasi (tra le lunghezze dei cammini che portano da k in
k), per denizione di MCD, t
i
t
k
. La dimostrazione è conclusa poiche
largomento è simmetrico in t
i
e t
k
.
71
Si denisce aperiodica una catena di periodo 1.
Naturalmente una condizione suciente per laperiodicità è che esista uno
stato h tale che p
hh
> 0.
Si osservi che laperiodicità quando la catena è irriducibile ma non è persis-
tente positiva non è suciente per avere lergodicità : basta ricordare il caso
di una catena di nascita e morte con probabilità non nulla di tornare con un
passo in uno stato ma senza misura invariante ovvero con
i=0

i
= +.
Come esempio si consideri il caso r
0
> 0 e p
i
= p q = q
i
qualsiasi sia
i 1.
Esercizio 18
Sia (X
n
)
n
una catena di nascita e morte su N con
p
i
=
1
3
, i 0 q
i
=
2
3
, i 1.
i) La catena è transiente o persistente?
ii) Esiste una misura invariante? In caso aermativo calcolarla.
iii) La catena è ergodica?
Soluzione
i) La catena è irriducibile essendo p
i
> 0 e q
i
> 0, per ogni i 1. Si
ricorda che la condizione di persistenza per una catena di nascita e
morte su N irriducibile è
i=0
i
= +,
dove
0
= 1,
i
=
q
i
q
i1
. . . q
1
p
i
p
i1
. . . p
1
, i 1.
Qui
0
= 1,
i
=
_
2
3
_
i
_
1
3
_
i
= 2
i
i 1
e quindi la serie è divergente e la catena persistente.
ii) La misura invariante esiste se e solo se
i=0

i
< +,
72
dove

0
= 1,
i
=
p
0
p
1
. . . p
i1
q
1
q
2
. . . q
i
, i 1.
Qui

0
= 1,
i
=
_
1
3
_
i
_
2
3
_
i
=
1
2
i
, i 1.
e quindi la serie è convergente come serie geometrica di ragione minore
di 1. Dunque esiste la misura invariante ed è
v
0
=
1
2
, v
i
=
_
1
2
_
i
2
=
1
2
i+1
, i 1.
iii) La catena è ergodica perche è aperiodica: questo si deduce per esempio
osservando che p
00
> 0.
1.40 Reversibilità
La proprietà di Markov si conserva rovesciando il tempo, infatti utilizzando
la denizione di probabilità condizionata e la formula del prodotto si ottiene
P(X
n
= i | X
n+1
= j, X
n+2
= j
2
, . . . , X
n+k
= j
k
)
=
P(X
n+2
= j
2
, . . . , X
n+k
= j
k
| X
n+1
= j, X
n
= i)P(X
n+1
= j | X
n
= i)P(X
n
= i)
P(X
n+2
= j
2
, . . . , X
n+k
= j
k
| X
n+1
= j)P(X
n+1
= j)
=
P(X
n+1
= j | X
n
= i)P(X
n
= i)
P(X
n+1
= j)
=

n
(i) p
ij
n+1
(j)
e allo stesso risultato si perviene calcolando
P(X
n
= i | X
n+1
= j).
Una catena di Markov si dice reversibile quando si verica che
P(X
n
= i | X
n+1
= j) = P(X
n+1
= i | X
n
= j)
cioè quando le probabilità di transizione (in un passo) allindietro coincidono
con le probabilità di transizione in avanti, ovvero quando il comportamento
statistico della catena rimane lo stesso rovesciando il tempo (si ricordi che
le leggi congiunte sono determinate dalle probabilità di transizione e dalla
legge iniziale).
Si dice che una misura di probabilità v soddisfa lequazione del bilancio
dettagliato per una matrice di transizione P se qualsiasi siano i e j
v
i
p
ij
= v
j
p
ji
.
73
Se v soddisfa lequazione precedente allora è invariante per P. Infatti
qualsiasi sia i
lS
v
l
p
li
=
lS
v
i
p
il
= v
i
lS
p
il
= v
i
.
Inoltre la catena con matrice di transizione P e legge iniziale v risulta
reversibile; infatti per linvarianza
n
(i) = v
i
e
n+1
(j) = v
j
da cui
P(X
n
= i | X
n+1
= j) =

n
(i) p
ij
n+1
(j)
=
v
i
p
ij
v
j
=
v
j
p
ji
v
j
= p
ji
.
Esempi di catene reversibili sono lurna di Ehrenfest, la catena di un grafo e
qualsiasi catena di nascita e morte persistente positiva in regime di stazionar-
ietà, ovvero inizializzata con la relativa misura invariante. Infatti si può facil-
mente vericare lequazione del bilancio dettagliato in ciascun caso: per lur-
na di Ehrenfest dobbiamo vericare v
i
p
i(i+1)
= v
i+1
p
(i+1)i
con v
i
=
_
d
i
_
1
2
d
e p
i(i+1)
=
di
d
e p
(i+1)i
=
i+1
d
; per la catena di un grafo dobbiamo vericare
v
i
p
ij
= v
j
p
ji
con v
i
=
k
i
k
e p
ij
= 0 se e solo se p
ji
= 0 ; per la catena di nasci-
ta e morte persistente positiva dobbiamo vericare v
i
p
i(i+1)
= v
i+1
p
(i+1)i
con v
i
=

i
i=0

i
,
i
=
p
0
p
1
...,p
i1
q
1
q
2
...,q
i
i 1,
0
= 1 e p
i(i+1)
= p
i
, p
(i+1)i
= q
i
.
1.41 Algoritmo di Metropolis
Si dimostra ([1]) che, dato uno spazio S nito e assegnata una misura di
probabilità v su S diversa dalla uniforme tale che per qualsiasi i valga v
i
> 0,
si può costruire una matrice stocastica P regolare per la quale v soddisfa
lequazione del bilancio dettagliato. Il metodo per costruire P si chiama
algoritmo di Metropolis e la sua importanza applicativa è evidente: volendo
simulare una variabile aleatoria con legge v basterà simulare una catena di
matrice di transizione P e legge iniziale qualsiasi e poi considerarne il valore
per n grande. Si sa infatti che la catena è ergodica e quindi, per n grande,
n
, la densità al tempo n di X
n
, approssima v.
La matrice P non è unica ma se ne può costruire una per ogni ma-
trice stocastica Q irriducibile e simmetrica di dimensione pari allo spazio S.
Fissata Q il generico elemento p
ij
di P è per i = j
p
ij
=
_
q
ij
se v
i
v
j
q
ij
v
j
v
i
se v
i
> v
j
;
e naturalmente
p
ii
= 1
j=i
p
ij
.
Per simulare una catena di Markov con la matrice di transizione P deni-
ta nellalgoritmo di Metropolis è utile la seguente osservazione, che suggerisce
74
come costruire la catena al passo n +1 sapendo che al passo n si trova in i.
Si assuma che siano k i possibili stati della catena. Sia Y una variabile di
densità (q
i1
q
i2
. . . , q
ik
) e sia U una variabile denita sullo stesso spazio di
probabilità, uniforme in [0, 1] e indipendente da Y . Allora la variabile
X = Y I
[0,
v
Y
v
i
)
(U) + i I
[
v
Y
v
i
,1]
(U)
è tale che qualsiasi sia j
P(X = j) = p
ij
ovvero ha densità (p
i1
p
i2
. . . , p
ik
). Infatti qualsiasi sia j = i
P(X = j) = P
_
Y = j, U <
v
Y
v
i
_
= P
_
Y = j, U <
v
j
v
i
_
= P(Y = j)P
_
U <
v
j
v
i
_
= q
ij
P
_
U <
v
j
v
i
_
.
Ricordando che per denizione di legge uniforme
P
_
U <
v
j
v
i
_
=
_
1 se v
i
v
j
v
j
v
i
se v
i
> v
j
,
si ottiene il risultato. Cos`, se j = i, P(X = i) = 1
j=i
p
ij
= p
ii
. Dunque
la procedura per simulare il valore al passo (n+1)-mo della catena se al
passo n-mo si trova in i, è la seguente: si genera una variabile di densità
(q
i1
q
i2
. . . , q
ik
); se si ottiene i si lascia la catena in i; se si ottiene un valore
j diverso da i con v
j
v
i
si sposta la catena in j; se invece il valore j è tale
che v
j
< v
i
, si simula una uniforme in [0, 1] e se questa è pi` u piccola di
v
j
v
i
si
sposta la catena in j, altrimenti la si lascia in i.
Esercizio 19
Sia (X
n
)
n
una catena di Markov su S = {1, 2, 3, 4} con matrice di transizione
_
_
_
_
1
2
0
1
2
0
1
3
0 0
2
3
1 0 0 0
0 0 0 1
_
_
_
_
.
i) Determinare il carattere degli stati della catena.
ii) Calcolare le eventuali misure invarianti.
iii) Calcolare lim
n
n
(i) , i S nel caso
0
(1) +
0
(3) = 1.
75
Soluzione
i) Lo spazio degli stati S = {1, 2, 3, 4} si decompone nellunione disgiunta
della classe transiente T = {2} e delle due classi irriducibili persistenti
positive C
1
= {1, 3} e C
1
= {4}; dunque 2 è lunico stato transiente e 4
è stato assorbente.
ii) Le misure invarianti sono tutte e sole le combinazioni convesse delle
misure invarianti v
(1)
e v
(2)
per la dinamica ristretta rispettivamente a C
1
e
C
2
, ovvero sono tutte e solo quelle della forma v
(1)
+(1)v
(2)
con [0, 1].
Inoltre v
(1)
= (x
1
, 0, x
3
, 0) dove
_
x
1
=
1
2
x
1
+x
3
x
3
=
1
2
x
1
,
da cui v
(1)
= (
2
3
, 0,
1
3
, 0). Inne facilmente si ricava v
(2)
= (0, 0, 0, 1).
iii) Se
0
(1) +
0
(3) = 1, poiche {1, 3} è classe chiusa, qualsiasi sia n vale
n
(2) = 0,
n
(4) = 0 e pertanto lim
n
n
(2) = lim
n
n
(4) = 0. Per
calcolare lim
n
n
(1) e lim
n
n
(3), osserviamo che la catena ristretta
a C
1
= {1, 3} ha matrice di transizione regolare e quindi è ergodica; dunque,
qualsiasi sia la densità iniziale
0
che soddisfa
0
(1) +
0
(3) = 1, le densità
al crescere di n convergono a v
(1)
1
, v
(1)
3
, quindi
lim
n
n
(1) =
2
3
lim
n
n
(3) =
1
3
.
Esercizio 20
Si consideri una catena di Markov su N avente matrice di transizione data
p
i i+1
= p e p
i 0
= 1 p dove 0 < p < 1. Determinare lunica misura invari-
ante della catena. Si tratta di una misura di probabilità nota? Determinare
il periodo della catena. La catena è ergodica?
Soluzione
La matrice di transizione della catena è
P =
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
1 p p 0 0 0 . . . 0 0 0 0 . . .
1 p 0 p 0 0 . . . 0 0 0 0 . . .
1 p 0 0 p 0 . . . 0 0 0 0 . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
1 p . . . 0 0 p 0 . . .
. . . . . .
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
76
e quindi la misura invariante risolve il sistema
_
_
x
0
=
iN
(1 p)x
i
x
i
= px
i1
, i 1
iN
x
i
= 1
x
i
0.
Si ricava x
0
= (1 p)
iN
x
i
= 1 p e x
i
= px
i1
= p
2
x
i2
= . . . = p
i
x
0
=
p
i
(1p), i 1. Dunque lunica misura invariante è v
i
= p
i
(1p), i 0 e si
tratta della densità di una geometrica trasformata di parametro 1 p, cioè
la densità del numero di fallimenti prima del primo successo in uno schema
di Bernoulli innito di parametro 1 p.
La catena che è irriducibile è aperiodica come si deduce dal fatto che p
00
> 0.
Dallunicità della misura invariante segue che esiste ununica classe persis-
tente positiva che per lirriducibilità è tutto lo spazio di stato; si sa che una
catena irriducibile persistente positiva e aperiodica è ergodica.
Un altro procedimento consiste nel dimostrare direttamente che qualsiasi sia
i
lim
n
p
(n)
ij
= p
j
(1 p).
e questo segue subito dopo aver calcolato che per qualsiasi siano i, j, per
ogni n j + 1 vale
p
(n)
ij
= p
j
(1 p)
nj1
h=0
_
n j 1
h
_
p
h
(1 p)
nj1h
= p
j
(1 p).
Infatti per arrivare a j in n j +1 passi occorre naturalmente passare per 0
se i j e lo stesso vale se i < j, poiche dallipotesi n j +1 segue n > j i.
Dunque: inizialmente n j 1 passi qualsiasi (per n = j + 1 nessuno), un
passo per andare a 0 e i successivi ed ultimi j passi per arrivare in j.
1.42 Schema di dimostrazione
del teorema di esistenza della misura invariante
per catene irriducibili persistenti positive
Si ricorda che v è invariante se e solo se si ha qualsiasi sia j e qualsiasi sia k
v
j
=
iS
v
i
p
(k)
ij
.
77
Dunque v invariante implica che per ogni n
v
j
=
1
n
n
k=1
iS
v
i
p
(k)
ij
=
iS
_
1
n
n
k=1
p
(k)
ij
_
v
i
e usando luguaglianza E
i
[N
n
(j)] =
n
k=1
p
(k)
ij
(vedi paragra 18 e 19) si
ottiene
v
j
=
iS
E
i
[N
n
(j)]
n
v
i
=
iS
E
i
_
N
n
(j)
n
_
v
i
.
Si osserva che la variabile aleatoria
N
n
(j)
n
=
1
n
n
k=1
I
{j}
(X
k
) rappresenta la
frequenza relativa di visita allo stato j su n tempi. Passando al limite in n
nelluguaglianza precedente si ottiene
v
j
=
iS
lim
n
E
i
_
N
n
(j)
n
_
v
i
,
dove il passaggio al limite sotto il segno di serie, ovvio nel caso S nito,
è lecito in generale. Si ottiene lesistenza e la forma dellunica misura in-
variante per catene persistenti posistive usando il fatto che per le catene
irriducibili persistenti, qualsiasi sia i vale
lim
n
E
i
_
N
n
(j)
n
_
=
_
1
E
j
[
j
]
, se E
j
[
j
] < +
0, altrimenti
(vedi per unidea della dimostrazione il paragrafo successivo e per una di-
mostrazione completa [3]).
1.43 Approssimazione della misura invariante
con la distribuzione empirica
Nel paragrafo precedente si identica la misura invariante utilizzando il
valore del lim
n
E
i
_
N
n
(j)
n
_
. Questo valore si può derivare dal risultato
seguente: se (X
n
)
n
è catena irriducibile persistente allora qualsiasi sia j con
probabilità 1, ovvero a meno di un insieme trascurabile di traiettorie,
lim
n
N
n
(j)
n
=
_
1
E
j
[
j
]
, se E
j
[
j
] < +
0, altrimenti.
78
`
E intuitivo: il rapporto tra n e il numero dei passaggi per j no al tempo n
è vicino, quando n è grande, alla durata media degli intertempi tra un pas-
saggio e laltro per j. Questo fatto ha la conseguenza applicativa seguente:
non potendo calcolare facilmente la misura invariante (p.es. perche è grande
il numero degli stati), nel caso persistente positivo, se ne può approssimare
il valore in uno stato j con il valore aleatorio, per n grande, della frequenza
relativa delle visite a j su n tempi, ovvero con la distribuzione empirica nello
stato j. Inoltre controllando se il valore di frequenza relativa dei passaggi
per un qualsiasi stato ssato si avvicina a 0 per n grande, si può dedurre la
persistenza nulla della catena.
Viceversa la frequenza di visita ad uno stato ssato si può approssimare a
regime con il valore della misura invariante nello stato.
Si dà unidea qui della dimostrazione dellenunciato nel caso in cui la
catena parta da j: secondo le notazioni già introdotte, si dimostra che le-
nunciato vale con probabilità 1 quando la densità iniziale è la delta di Dirac
in j.
A tale scopo si utilizza la legge forte dei grandi numeri nella formulazione
seguente:
Legge forte dei grandi numeri
Siano X
1
, X
2
, . . . , X
k
, . . . variabili aleatorie denite sullo stesso spazio di
probabilità i.i.d. e di valore medio nito m. Allora con probabilità 1
lim
k
X
1
+X
2
+. . . +X
k
k
= m
Se X
k
0 qualsiasi sia k e E[X
k
] = +, allora con probabilità 1
lim
k
X
1
+X
2
+. . . +X
k
k
= +
Si utilizza il risultato precedente applicato alle variabili seguenti:
1
j
,
2
j
,
k
j
, . . .
denite da
k
j
= T
k
j
T
k1
j
, k 1
dove
T
0
j
= 0, T
k
j
= min{n 1 t.c. N
n
(j) = k}, k 1
e quindi
k
j
è il tempo che intercorre tra la k 1-ma e la kma visita a j e
in particolare
1
j
= T
1
j
=
j
. Si osservi che per lipotesi di persistenza T
k
j
è
nito con probabilità 1.
Le variabili aleatorie
k
j
sono indipendenti e tutte con la stessa legge di
j
e
dunque per la legge dei grandi numeri con probabilità 1
lim
k
1
j
+
2
j
+. . . +
k
j
k
=
_
E
j
[
j
], se E
j
[
j
] < +
+, altrimenti.
79
Allora, poiche
1
j
+
2
j
+. . . +
k
j
k
=
T
1
j
+ (T
2
j
T
1
j
) +. . . + (T
k
j
T
k1
j
)
k
=
T
k
j
k
,
con probabilità 1 vale
lim
k
T
k
j
k
=
_
E
j
[
j
], se E
j
[
j
] < +
+, altrimenti
Inoltre è chiaro che
T
N
n
(j)
j
n < T
N
n
(j)+1
j
,
poiche la scrittura T
N
n
(j)
j
indica la variabile tempo dellultima visita a j
prima del tempo n (n incluso), e quindi qualsiasi sia n
j
(altrimenti
N
n
(j) = 0)
T
N
n
(j)
j
N
n
(j)

n
N
n
(j)
<
T
N
n
(j)+1
j
N
n
(j)
.
Essendo j persistente con probabilità 1
lim
n
N
n
(j) = +
e quindi si può dedurre da quanto sopra che con probabilità 1
lim
n
T
N
n
(j)
j
N
n
(j)
= lim
n
T
N
n
(j)+1
j
N
n
(j)
=
_
E
j
[
j
], se E
j
[
j
] < +
+, altrimenti.
Il teorema del confronto per le successioni di variabili reali conclude la
dimostrazione.
1.44 Esercizi di riepilogo
1. Sono date due urne e 2d biglie di cui d nere e d bianche. Inizialmente
d biglie scelte a caso sono collocate nellurna 1 e le restanti d biglie
sono collocate nellurna 2. Ad ogni istante una biglia è scelta a caso
da ciascuna delle due urne ed è spostata nellaltra urna. Sia X
0
il
numero iniziale delle biglie nere nellurna 1 e X
n
il numero delle biglie
nere nellurna 1 al tempo n. Trovare le probabilità di transizione della
catena di Markov (X
n
)
n0
.
2. Sia
P =
_
_
_
_
_
_
_
_
1 0 0 0 0 0
1
4
1
2
1
4
0 0 0
0
1
5
2
5
1
5
0
1
5
0 0 0
1
6
1
3
1
2
0 0 0
1
2
0
1
2
0 0 0
1
4
0
3
4
_
_
_
_
_
_
_
_
.
80
matrice di transizione su S = {1, 2, 3, 4, 5, 6}.
i) Determinare il carattere degli stati.
ii) Dimostrare che muovendosi dallo stato 4 con la dinamica descritta
da P la probabilità di raggiungere lo stato 6 in un tempo nito è
almeno
3
4
.
iii) Calcolare la probabilità di raggiungere lo stato 1 partendo dallo
stato 2 in un tempo nito,
21
, e dare uninterpretazione proba-
bilistica del numero 1
21
.
iv) Calcolare le eventuali misure invarianti della catena.
v) Determinare la media del tempo di ritorno nello stato 4.
vi) Per la catena con matrice di transizione P e densità iniziale uni-
forme su {4, 5, 6}, calcolare la probabilità degli eventi A = {X
2
=
4}, B = {X
2
= 4, X
3
= 5} e C = {X
100
= 4, X
101
= 2}. In che
modo si potrebbe procedere per calcolare in modo approssima-
to la probabilità dellevento D = {X
50
= 5}? E quanto vale la
probabilità dellevento E = {X
50
= 2}?
3. Calcola la probabilità di raggiungere in un tempo nito lo stato 3 par-
tendo dallo stato 1, per la catena con spazio degli stati S = {1, 2, 3, 4}
e con matrice di transizione
P =
_
_
_
_
0
1
2
1
2
0
1
2
0
1
4
1
4
0 0 1 0
0 0 0 1
_
_
_
_
.
E se la densità iniziale fosse quella uniforme?
4. Un uomo possiede 2 ombrelli e ne prende uno al mattino per andare
in ucio e a sera quando torna, naturalmente se piove e se ce nè
uno disponibile. Assumi che ogni volta la probabilità che piova sia
p. Indica con (X
n
)
n1
la catena di Markov che conta gli ombrelli
disponibili prima delln-mo tragitto (senza distinguere tra tragitti di
andata e ritorno).
i) Scrivi la matrice di transizione della catena e determina il carat-
tere degli stati.
ii) Con che probabilità luomo non ha ombrelli disponibili prima del
secondo, del terzo e del quarto tragitto se si assume che prima
del primo tragitto li abbia entrambi disponibili (la legge iniziale,
ovvero la legge di X
1
, è la delta di Dirac in 2)?
81
iii) Dopo quanto tempo in media, se si assume che prima del primo
tragitto abbia entrambi gli ombrelli disponibili, luomo non ha
ombrelli disponibili?
iv) Calcola le eventuali misure invarianti. Cosa puoi dire sul com-
portamento di p
(n)
ij
per n grande?
v) Come approssimeresti la probabilità con cui luomo si bagna al
96-mo tragitto?
5. Unapparecchiatura di età j 0 allinizio della giornata si guasta
durante la giornata con probabilità p
j
e in tal caso è sostituita da
unapparecchiatura identica ma nuova, che entra in funzione allinizio
della giornata successiva. Lapparecchiatura è sostituita anche quando
è troppo vecchia e si conviene che questo corrisponda alletà N (per età
di unapparecchiatura si intende qui il numero delle giornate intere (24
ore) in cui lapparecchiatura ha funzionato). Per n 0, si indica con
X
n
la v.a. che conta letà dellapparecchiatura funzionante allinizio
della n + 1-ma giornata.
i) Scrivi la matrice di transizione della catena di Markov (X
n
)
n0
e determina il carattere degli stati.
ii) Se al tempo n = 0 lapparecchiatura è nuova, con che probabilità
è nuova al tempo n = 2?
iii) Calcola, nell ipotesi del punto precedente, con che probabilità
lapparecchiatura installata inizialmente viene utilizzata al mas-
simo, ovvero sostituita per vecchiaia e non per guasto.
iv) Calcola le eventuali misure invarianti. Cosa puoi dire sul com-
portamento di p
(n)
ij
per n grande?
v) Ogni quanto tempo in media avviene una sostituzione?
6.
`
E assegnata la catena (X
n
)
n0
con matrice di transizione
P =
_
_
_
_
0
1
2
0
1
2
1
2
0
1
2
0
0 1 0 0
0 0 1 0
_
_
_
_
e misura iniziale
0
(1) = 1.
i) Studiare il comportamento della legge di X
n
per n grande.
ii) Calcolare in modo approssimato
P(X
82
= 3, X
81
= 4) e P(X
60
= 1, X
58
= 3).
82
Soluzioni
1. Si vuole calcolare P(X
n+1
= j | X
n
= i) per n 0, i, j S =
{0, 1, . . . , d}. Indicati con E e F rispettivamente gli eventi {la biglia
scelta a caso dallurna 1 è nera} e {la biglia scelta a caso dallurna 2 è
nera}, gli eventi E e F sono indipendenti condizionatamente al sapere
il numero delle biglie nere nellurna 1. Inoltre se nellurna 1 ci sono i
biglie la probabilità di E è
i
d
e quella di F è
di
d
. Si calcola
P(X
n+1
= i + 1 | X
n
= i) =
P(E
c
F | X
n
= i) = P(E
c
| X
n
= i)P(F | X
n
= i) =
_
d i
d
_
2
P(X
n+1
= i 1 | X
n
= i) =
P(E F
c
| X
n
= i) = P(E | X
n
= i)P(F
c
| X
n
= i) =
_
i
d
_
2
.
Poiche se j = i 1, i, i + 1 si ha P(X
n+1
= j | X
n
= i) = 0, segue
P(X
n+1
= i | X
n
= i) = 1
(d i)
2
d
2

(i)
2
d
2
=
2i(d i)
d
2
.
Dunque si tratta di catena omogenea, catena di nascita e morte con
p
i
=
(di)
2
d
2
, r
i
=
2i(di)
d
2
e q
i
=
i
2
d
2
. Si osservi che in particolare p
0
= 1
e q
d
= 1, ovvero le barriere sono riettenti.
2. i) 1 è stato assorbente, poiche comunica solo con se stesso; 2 e 3 sono
transienti, infatti p.es. 2 1 ma 2 1 e 3 6 ma 6 3; {4,5,6}
costituiscono una classe irriducibile nita e dunque costituita da stati
persistenti positivi.
ii) Si tratta di dimostrare la disuguaglianza
46

3
4
. Per denizione
46
P
4
(X
1
= 6) + P
4
(X
1
= 6, X
2
= 6)
e, poiche P
4
(X
1
= 6, X
2
= 6) = P
4
(X
1
= 4, X
2
= 6) + P
4
(X
1
=
5, X
2
= 6), segue
46
p
46
+p
44
p
46
+p
45
p
56
=
1
2
+
1
6
1
2
+
1
3
1
2
=
3
4
.
iii) Poiche 1 è stato assorbente,
21
coincide con la probabilità di
assorbimento
{1}
2
nella classe {1} partendo dallo stato 2. Occorre
dunque risolvere il sistema
x
1
=
1
4
+
1
2
x
1
+
1
4
x
2
x
1
=
1
5
x
1
+
2
5
x
2
.
83
Facilmente si calcola x
1
=
{1}
2
=
3
5
e x
2
=
{1}
3
=
1
5
.
Indicata con C la classe di tutti gli stati persistenti, poiche gli stati
transienti sono in numero nito, si ha
1 = P(
C
< +) =
{1}
2
+
{4,5,6}
2
e quindi
1
21
= 1
{1}
2
=
{4,5,6}
2
,
ovvero a parole 1
21
è la probabilità di assorbimento nella classe
{4, 5, 6} partendo da 2.
iv) La catena è nita e quindi le misure invarianti sono tutte e sole le
combinazioni convesse delle misure invarianti sulle classi irriducibili.
Dunque una qualsiasi misura invariante è della forma v = v
(1)
+
(1 )v
(2)
con [0, 1], dove v
(1)
= (1 0 0 0 0 0) e v
(2)
si calcola
risolvendo il sistema
_
_
x
1
+x
2
+x
3
+x
4
+x
5
+x
6
= 1
x
i
= 0, i = 2, 3
x
4
=
1
6
x
4
+
1
2
x
5
+
1
4
x
6
x
5
=
1
3
x
4
x
6
=
1
2
x
4
+
1
2
x
5
+
3
4
x
6
x
i
0.
Si ottiene v
(2)
=
_
0 0 0
1
4
1
12
2
3
_
.
v) Poiche 4 è nella classe irriducibile {4, 5, 6} possiamo considerare la
dinamica ristretta a questa classe (la classe è chiusa!).
`
E noto che per
una catena persistente positiva la media del tempo di primo ritorno
in uno stato è il reciproco del valore della misura invariante nello sta-
to. La catena ristretta a {4, 5, 6} è persistente positiva (in quanto
irriducibile e nita) e la sua misura invariante è (v
(2)
4
v
(2)
5
v
(2)
6
) =
_
1
4
1
12
2
3
_
e quindi E
4
[
4
] = 4.
vi)
P(A) =
2
(4) =
iS
0
(i)p
(2)
i4
=
1
3
(p
(2)
44
+p
(2)
54
+p
(2)
64
).
Per calcolare le probabilità di transizione in pi` u passi occorre calco-
lare le potenze della matrice P. Per rendere pi` u agevole il conto si
osservi che le probabilità di transizione in n passi allinterno della
classe irriducibile {4, 5, 6}, coincidono con gli elementi della potenza
n-ma della sottomatrice ottenuta cancellando prima, seconda e terza
84
riga e colonna della matrice P, ovvero della matrice
_
_
1
6
1
3
1
2
1
2
0
1
2
1
4
0
3
4
_
_
.
Si ottiene p
(2)
44
=
23
72
, p
(2)
54
=
5
24
, p
(2)
64
=
11
48
, da cui P(A) =
109
432
.
Inoltre si ha P(B) = p
45
P(A) =
1
3
P(A) =
109
1296
e inne P(C) =
100
(4)p
42
= 0 poiche, essendo la classe {4, 5, 6} chiusa, si ha p
42
= 0.
La probabilità dellevento {X
50
= 5} si può approssimare con il val-
ore in 5 della misura invariante della dinamica ristretta alla classe
{4, 5, 6}, cioè
1
12
; infatti la dinamica ristretta alla classe {4, 5, 6} è
ergodica poichè la sua matrice di transizione
_
_
1
6
1
3
1
2
1
2
0
1
2
1
4
0
3
4
_
_
.
è regolare essendo vericato il criterio suciente (almeno un elemento
sulla diagonale positivo). Si noti invece che la probabilità dellevento
{X
50
= 2} è esattamente 0 in quanto coincide con
iS

0
(i) p
(50)
i2
=
1
3
(p
(50)
42
p
(50)
52
p
(50)
62
) e per denizione di classe chiusa p
(50)
i2
= 0, i = 4, 5, 6.
3. Gli stati 3 e 4 sono assorbenti, mentre gli stati 1 e 2 sono transienti
poiche p.es. entrambi comunicano con 3 ma 3 non comunica con essi.
Si tratta dunque di calcolare la probabilità di assorbimento in {3}
partendo da 1, cioè il valore
{3}
1
che risolve insieme a
{3}
2
(probabilità
di assorbimento in {3} partendo da 2) il sistema
_
{3}
1
=
1
2
+
1
2
{3}
2
{3}
2
=
1
4
+
1
2
{3}
1
.
Si trova
{3}
1
=
5
6
,
{3}
2
=
2
3
.
Se la densità iniziale fosse uniforme, poiche vale luguaglianza
P(
3
< +) =
0
(i)
i3
,
tenendo conto del risultato precedente e del fatto che essendo 3, 4 as-
sorbenti le probabilità di raggiungere 3 in tempo nito partendo da 3
e da 4 sono rispettivamente 1 e 0, si ha che la probabilità richiesta è
1
4
_
5
6
+
2
3
+ 1
_
=
5
8
.
85
4. i) La matrice di transizione è
P =
_
_
0 0 1
0 q p
q p 0
_
_
,
con q = 1 p. Tutti gli stati sono comunicanti e quindi, poiche lo
spazio degli stati è nito, persistenti positivi.
ii) Si assume che
1
(2) = 1 e quindi
1
(1) =
1
(0) = 0. Allora è
evidente che la probabilità dellevento
{0 ombrelli disponibili prima del secondo tragitto}
è q e infatti in formule
2
(0) =
1
(i)p
i0
= p
20
= q.
Analogamente per calcolare P(0 ombrelli disponibili prima del terzo tragitto)
si procede cos`
3
(0) =
1
(i)p
(2)
i0
= p
(2)
20
=
i
p
2i
p
i0
= 0.
E inne per calcolare P(0 ombrelli disponibili prima del quarto tragitto)
4
(0) =
1
(i)p
(3)
i0
= p
(3)
20
=
i
p
2i
p
(2)
i0
=
i
p
2i
j
p
ij
p
j0
= q
j
p
0j
p
j0
+p
j
p
1j
p
j0
= q
2
+p
2
q.
iii) Rispondere a questo punto equivale a rispondere alla domanda:
qual è il tempo medio di assorbimento in 0 partendo da 2 per la catena
corrispondente alla matrice di transizione
_
_
1 0 0
0 q p
q p 0
_
_
,
ovvero per la dinamica modicata rendendo assorbente lo stato 0 e
quindi la classe {0} coincidente con la classe di tutti gli stati persistenti
(in tal caso infatti 1 e 2 comunicano con 0 ma 0 non comunica con essi
e quindi sono transienti). La risposta è quindi x
2
dove x
1
, x
2
risolvono
il sistema dei tempi medi di assorbimento
_
x
1
= 1 +px
2
+qx
1
x
2
= 1 +px
1
,
86
che risolto dà x
1
=
1+p
pp
2
e x
2
=
2p
pp
2
.
iv) Poiche la catena è persistente positiva esiste ununica misura in-
variante che si ottiene risolvendo il sistema
_
_
v
0
= qv
1
v
1
= qv
1
+pv
2
v
2
= v
0
+pv
1
v
0
+v
1
+v
2
= 1
che risolto dà v
0
=
1p
3p
e v
1
= v
2
=
1
3p
. La catena soddisfa il criterio
suciente per la regolarità (essere irriducibile e avere un elemento non
nullo sulla diagonale di P) e quindi è ergodica e dunque lim
n
p
(n)
ij
=
v
j
indipendentemente da i.
v) P(si bagna al 96 mo tragitto) = P
_
{piove al 96 mo tragitto}
{X
96
= 0}
_
= pP(X
96
= 0) e questo per lindipendenza tra gli eventi.
Inoltre per lergodicità si approssima P(X
96
= 0) con v
0
=
1p
3p
.
5. i) Lo spazio degli stati è S = {0, 1, . . . , N} e la matrice di transizione
è
P =
_
_
_
_
_
_
_
_
p
0
q
0
0 0 0 . . . 0 0
p
1
0 q
1
0 0 . . . 0 0
p
2
0 0 q
2
0 . . . 0 0
. . .
p
N1
0 0 0 0 . . . 0 q
N1
1 0 0 0 0 . . . 0 0
_
_
_
_
_
_
_
_
,
con q
j
= 1 p
j
. Tutti gli stati sono comunicanti e quindi, poiche lo
spazio degli stati è nito, persistenti positivi.
ii) Si assume che
0
(0) = 1 e quindi
0
(1) = . . . =
0
(N) = 0 e dunque
si calcola
2
(0) =
0
(i)p
(2)
i0
= p
(2)
00
=
i
p
0i
p
i0
= p
2
0
+p
1
q
0
.
iii) Indicati con
0
e
N
i tempi di primo raggiungimento degli stati
0 e N, rispondere a questo punto equivale a calcolare P
0
(
N
<
0
) e
poiche
P
0
(
N
<
0
) = P
0
(
N
<
0
, X
1
= 1)
e lultimo membro coincide con
P
0
(
N
<
0
| X
1
= 1)P
0
(X
1
= 1) = P
1
(
N
<
0
)q
0
,
87
occorre calcolare P
1
(
N
<
0
). Lultima probabilità coincide con la
probabilità di assorbimento in N partendo da 1 per la catena cor-
rispondente alla matrice di transizione
P =
_
_
_
_
_
_
_
_
1 0 0 0 0 . . . 0 0
p
1
0 q
1
0 0 . . . 0 0
p
2
0 0 q
2
0 . . . 0 0
. . .
p
N1
0 0 0 0 . . . 0 q
N1
0 0 0 0 0 . . . 0 1
_
_
_
_
_
_
_
_
,
ovvero per la dinamica modicata rendendo assorbenti gli stati 0 e
N. La risposta è quindi x
1
dove x
1
, x
2
. . . , x
N1
risolvono il seguente
sistema delle probabilità di assorbimento in N
_
_
x
1
= q
1
x
2
x
2
= q
2
x
3
. . .
x
N1
= q
N1
.
Risolvendo si ottiene x
j
= q
j
q
j+1
. . . q
N1
e in particolare x
1
= q
1
q
2
. . . q
N1
.
iv) Poiche la catena è persistente positiva esiste ununica misura in-
variante che si ottiene risolvendo il sistema
_
_
v
0
= p
0
v
0
+p
1
v
1
+. . . p
N1
v
N1
+v
N
v
1
= q
0
v
0
v
2
= q
1
v
1
. . .
v
N
= q
N1
v
N1
v
0
+v
1
+v
2
+. . . +v
N
= 1
.
A ritroso dalla penultima equazione si ricava v
j
=
v
N
q
0
q
1
q
2
...q
j1
, per
j = 0, . . . , N 1 e sostituendo questi valori nellultima equazione si
calcola v
N
=
q
0
q
1
q
2
...q
N1
1+q
0
+q
0
q
1
+...+q
0
q
1
q
2
...q
N1
. Inne sostituendo il valore
ottenuto per v
N
nellespressione del generico v
j
si trova
v
j
=
q
0
q
1
q
2
. . . q
j1
1 +q
0
+q
0
q
1
+. . . +q
0
q
1
q
2
. . . q
N1
, j = 1, . . . , N,
v
0
=
1
1 +q
0
+q
0
q
1
+. . . +q
0
q
1
q
2
. . . q
N1
.
La catena soddisfa il criterio suciente per la regolarità (essere ir-
riducibile e avere un elemento non nullo sulla diagonale di P) e quindi
è ergodica e dunque lim
n
p
(n)
ij
= v
j
indipendentemente da i.
88
v) Occorre calcolare il tempo medio di ritorno nello stato 0 che in
formule è E
0
[
0
]. Si sa che nelle catene persistenti positive questo
valore coincide con v
1
0
e dunque in questo caso con 1 + q
0
+ q
0
q
1
+
. . . +q
0
q
1
q
2
. . . q
N1
.
6. La catena è irriducibile e quindi il periodo è lo stesso per ogni stato
ed è facile vericare che è 2. Inoltre per
0
tale che
0
(1) = 1 si ha
qualsiasi sia n 0
2n+1
(1) =
2n+1
(3) = 0
2n+2
(2) =
2n+2
(4) = 0.
i) Si ha
2n+1
(2) =
1
2
2n
(1) +
2n
(3) =
1
2
2n
(1) +
_
1
2n
(1)
_
= 1
1
2
2n
(1)
e, essendo
2n
(1) =
1
2
2n1
(2) qualsiasi sia n 1, si ottiene qualsiasi
sia n 1
2n+1
(2) = 1
1
4
2n1
(2).
Dunque i valori della densità in i = 2 sui tempi dispari costituiscono
una successione per ricorrenza della forma
_
a
m+1
= 1
1
4
a
m
a
1
=
1
2
Pertanto il limite, se esiste, risolve L = 1
1
4
L e non può che essere
quindi L =
4
5
. Si può inoltre vericare che a
m
per m dispari è mono-
tona crescente e per m pari è monotona decrescente e che entrambe
le sottosuccessioni convergono a L =
4
5
. Cos` resta dimostrato che
lim
n
2n+1
(2) =
4
5
e di conseguenza lim
n
2n+1
(4) =
1
5
.
Inoltre poichè
2n
(1) =
1
2
2n1
(2) si ricava lim
n
2n
(1) =
2
5
e di
conseguenza lim
n
2n
(3) =
3
5
.
In denitiva la densità di X
n
quando n è grande è approssimata se n
è dispari da (0
4
5
0
1
5
) e se n è pari da (
2
5
0
3
5
0). Si può vericare che
(
4
5
1
5
) e (
2
5
3
5
) sono le misure invarianti per la dinamica in due passi
ristretta rispettivamente a {2, 4} e {1, 3}. Infatti la dinamica in due
passi e multipli di due passi su {2, 4} è data dalla matrice
_
3
4
1
4
1 0
_
e il sistema soddisfatto dalla misura invariante è
_
_
x
1
=
3
4
x
1
+x
2
x
2
=
1
4
x
1
x
1
+x
2
= 1 ;
89
mentre la dinamica in due passi e multipli di due passi su {1, 3} è data
dalla matrice
_
1
4
3
4
1
2
1
2
_
e il sistema soddisfatto dalla misura invariante è
_
_
x
1
=
1
4
x
1
+
1
2
x
2
x
2
=
3
4
x
1
+
1
2
x
2
x
1
+x
2
= 1 .
ii)
P(X
82
= 3, X
81
= 4) =
81
(4)p
43

1
5
1 =
1
5
P(X
60
= 1, X
58
= 3) =
58
(3)p
(
31
2)
3
5

1
2
=
3
10
.
2 Processo di Poisson
2.1 Denizione
Tra i processi stocastici a tempo continuo a valori in N, ovvero nellinsieme
delle famiglie di v.a. denite su di uno stesso spazio di probabilità, a valori in
N ed indicizzate da un parametro reale continuo non negativo, interpretato
come il tempo, si chiamano processi di conteggio quelli che hanno traiettorie
uscenti dallo 0, non decrescenti, costanti a tratti e con salti di ampiezza
unitaria.
Sia (X
k
, k 1) una famiglia di v.a. indipendenti (dunque in particolare
denite sullo stesso spazio di probabilità) di legge esponenziale di parametro
. Posto
S
0
:= 0 S
n
:=
n
k=1
X
k
, n 1
si costruisce il processo di Poisson (N(t))
t0
mediante luguaglianza
N(t) := max(n 0, S
n
t).
Si deve osservare che dalla denizione segue che N(0) = 0 e che ogni traiet-
toria del processo è costante a tratti, non decrescente, continua da destra ed
ha salti unitari. Dunque il processo di Poisson è processo di conteggio. Se
si immagina che la v.a.X
k
sia il tempo aleatorio che intercorre tra il k-mo
ed il k + 1-mo evento di un determinato usso di eventi, allora S
n
rappre-
senta il tempo aleatorio in cui si verica lnmo evento e la v.a.N(t) conta
il numero degli eventi occorsi no al tempo t incluso. Dunque la v.a. N(t)
può assumere ogni valore naturale e se ne determina facilmente la densità
90
di probabilità a partire dallassunzione sulla legge degli intertempi di salto.
Fissato k N, per calcolare P(N(t) = k) il punto di partenza sono le due
semplici uguaglianze tra eventi
(N(t) = k) = (N(t) k)\(N(t) k + 1)
e
(N(t) k) = (S
k
t).
Infatti insieme forniscono la terza uguaglianza
(N(t) = k) = (S
k
t)\(S
k+1
t)
ovvero, passando alle probabilità, luguaglianza
P(N(t) = k) = P(S
k
t) P(S
k+1
t).
Lultima uguaglianza riduce il calcolo della densità di N(t) alla conoscenza
della funzione di ripartizione dei tempi S
n
, n 1. A questo proposito
occorre ricordare i due fatti seguenti noti dai corsi di probabilità elementare.
In primo luogo, se X
1
, X
2
, . . . , X
m
sono v.a. indipendenti rispettivamente
di legge (
1
, ), (
2
, ), . . . , (
m
, ), allora
X
1
+X
2
+. . . +X
m
(
1
+
2
+. . . +
m
, ).
Da cui ricordando che la legge esponenziale di parametro è la legge gamma
di parametri (1, ) e che le leggi gamma con il primo parametro intero pren-
dono il nome di Erlang (cos` (m, ) si chiama anche Erlang di parametri
(m, ) e si scrive Erl(m, )), segue che se X
1
, X
2
, . . . , X
m
sono v.a. i.i.d. di
legge esp(), allora
X
1
+X
2
+. . . +X
m
Erl(m, ).
Inoltre, la funzione di ripartizione di una v.a.Z Erl(m, ) si calcola con
procedura ricorsiva integrando per parti la funzione densità corrispondente,
x

m
(m1)!
x
m1
e
x
no ad ottenere
P(Z t) = 1
m1
i=0
(t)
i
i!
e
t
.
Da quanto detto segue che la legge di S
n
, tempo di occorrenza dellnmo
evento di un processo di Poisson di parametro , è una Erlang di parametri
(n, ) e in particolare
P(S
n
t) = 1
n1
i=0
(t)
i
i!
e
t
.
91
Pertanto, andando a sostituire le corrispondenti espressioni nella formula
per il calcolo della densità di N(t), si trova
P(N(t) = k) = 1
k1
i=0
(t)
i
i!
e
t
1 +
k
i=0
(t)
i
i!
e
t
=
(t)
k
k!
e
t
.
In conclusione si è ottenuto che il processo di Poisson al tempo t ha legge di
Poisson di parametro t, ovvero, ssato t, vale N(t) Poiss(t). Cos`, ricor-
dando il signicato del parametro della legge esponenziale e del parametro
della legge Poisson, si vede che il parametro del processo di Poisson è al
tempo stesso il reciproco del tempo medio di attesa tra un evento e laltro
e il numero medio degli eventi che si vericano nellintervallo di tempo uni-
tario. Dunque per esempio se cresce allora diminuisce il tempo medio tra
un evento e laltro e cresce la frequenza degli eventi.
2.2 Perdita di memoria
Per perdita di memoria del processo di Poisson di parametro si intende
la proprietà per la quale, ssato un qualsiasi tempo t, il tempo che occorre
attendere a partire da t anche si verichi un evento è v.a. che ha legge
esponenziale di parametro e che è indipendente dai successivi intertempi
del usso.
Fissato t > 0, si introduce la v.a.
t
0 denita da
t
:= S
N(t)+1
t
e si dimostra che qualsiasi sia x numero reale positivo vale
P(
t
x) = 1 e
x
.
Il punto di partenza per la dimostrazione è luguaglianza tra eventi
(
t
> x) =
+
n=0
_
S
n
t, S
n+1
t > x),
dalla quale, tenendo conto che gli eventi dellunione sono disgiunti, si ricava
passando alle probabilità
P(
t
> x) =
+
n=0
P
_
S
n
t, S
n+1
t > x).
Il primo termine della somma, ovvero quello corrispondente allindice n = 0,
coincide con
P
_
S
0
t, S
1
t > x) = P(S
1
t > x) =
P(S
1
> t +x) = P(X
1
> t +x) = e
(t+x)
.
92
Il termine generico per n 1 si può invece riscrivere cos`
P
_
S
n
t, S
n
+X
n+1
> t +x)
e, condizionando al valore di S
n
Erl(n, ), cos`
+
0
P
_
S
n
t, S
n
+X
n+1
> t +x | S
n
= y)

n
(n 1)!
y
n1
e
y
dy.
Lespressione precedente coincide con
t
0
P
_
X
n+1
> t +x y | S
n
= y)

n
(n 1)!
y
n1
e
y
dy
e ancora, per lipotesi di indipendenza di X
n+1
da X
1
, X
2
, . . . , X
n
e quindi
da S
n
, con
t
0
P
_
X
n+1
> t +x y)

n
(n 1)!
y
n1
e
y
dy.
Inne, poiche X
n+1
ha densità esponenziale di parametro e t + x y è
positivo, lintegrale precedente si riscrive
t
0
e
(t+xy)

n
(n 1)!
y
n1
e
y
dy.
In denitiva
P(
t
> x) =e
(t+x)
+
n1
t
0
e
(t+xy)

n
(n 1)!
y
n1
e
y
dy =
e
(t+x)
+
t
0
e
(t+xy)
n1
n
(n 1)!
y
n1
e
y
dy =
e
(t+x)
+
t
0
e
(t+xy)
n1
n1
(n 1)!
y
n1
e
y
dy.
Con il cambio di indice n 1 in m si trasforma la sommatoria in
m0
m
m!
y
m
= e
y
e quindi si conclude
P(
t
> x) = e
(t+x)
+
t
0
e
(t+xy)
dy = e
x
.
Come applicazione di quanto esposto si considera il seguente problema.
93
Problema del taxi
Una vettura è pronta a svolgere il servizio ad una fermata dei taxi. Si as-
sume che i passeggeri in arrivo alla fermata del taxi seguano un usso di
Poisson e che in media a quella fermata arrivino 20 passeggeri allora. Le
vetture partono solo a pieno carico, ovvero con 4 persone, o 10 minuti dopo
larrivo del primo passeggero.
a) Con quale probabilità il primo passeggero aspetta 10 minuti?
b) Se altri 2 passeggeri arrivano dopo 8 minuti, con quale probabilità il taxi
non parte a pieno carico?
Soluzione
a) Sia (N(t))
t0
il processo che conta i passeggeri arrivati dopo il primo,
allora, quando il tempo è calcolato in minuti, N(t) Poiss(t/3) e gli in-
tertempi tra un arrivo e laltro sono esponenziali indipendenti di parametro
1/3. Per rispondere alla domanda bisogna calcolare con quale probabilità
arrivano non pi` u di 2 clienti nei successivi 10 minuti, ovvero
P(N(10) 2) =
2
h=0
_
10
3
_
h
e
10/3
h!
.
b) Per rispondere alla seconda domanda si utilizza la proprietà di perdita
di memoria del Poisson, perche la probabilità richiesta coincide con la prob-
abilità che tra lottavo ed il decimo minuto non vi siano arrivi. Dunque,
indicato con
8
il tempo occorrente dopo lottavo minuto (a partire dallar-
rivo del primo passeggero) per vedere arrivare un altro passeggero, bisogna
calcolare P(
8
> 2) e, poiche per la perdita di memoria
8
esp(1/3), il
risultato è e
2/3
.
Si può dimostrare che gli incrementi del processo di Poisson di parametro
su intervalli disgiunti sono v.a. indipendenti e che, ciascun incremento ha
legge di Poisson di parametro pari al prodotto del parametro per lampiez-
za dellintervallo.
Qui si fa vedere che
P(N(s) = n, N(s +t) N(s) = k) =
(s)
n
n!
e
s
(t)
k
k!
e
t
.
Questo dimostra al tempo stesso lindipendenza degli incrementi su due
intervalli disgiunti adiacenti e laermazione sulla legge di probabilità di un
generico incremento. Luguaglianza tra eventi
(N(s) = n, N(s +t) N(s) = k) =
(N(s) = n, N(s +t) N(s) k) \ (N(s) = n, N(s +t) N(s) k 1)
riduce la dimostrazione a quella della relazione
P(N(s) = n, N(s +t) N(s) k) =
(s)
n
n!
e
s
k
i=0
(t)
i
i!
e
t
.
94
Ora
P(N(s) = n, N(s +t) N(s) k) =
P(S
n
s < S
n+1
, S
n+1
+X
n+2
+. . . +X
n+k
s +t) =
P(S
n
s, S
n
+X
n+1
> s, S
n
+X
n+1
+Z s +t)
ricordando che S
n+1
= S
n
+X
n+1
e indicando con Z la v.a.X
n+2
+. . . , X
n+k
.
Utilizzando due volte la probabilità condizionata, in particolare condizionan-
do la prima volta al valore di S
n
Erl(n, ) e la seconda volta al valore di
X
n+1
esp() e ricordando che le v.a. S
n
, X
n+1
e Z sono indipendenti, si
ottiene
P(N(s) = n, N(s +t) N(s) k) =
s
0
P(y +X
n+1
> s, y +X
n+1
+Z > s +t)

n
(n 1)!
y
n1
e
y
dy =
s
0
_
+
sy
P(y +x +Z > s +t)e
x
dx
_

n
(n 1)!
y
n1
e
y
dy
Si noti che nel primo passaggio è y < s e questo insieme alla condizione
y +X
n+1
> s implica che sia x > s y > 0. Poiche Z ha legge Erl(k, ), se
s +t y x 0 ovvero x s y +t allora
P(y +x +Z > s +t) = 1,
mentre se x < s y +t allora
P(y +x +Z > s +t) =
k1
i=0
((s +t y x))
i
i!
e
(s+tyx)
.
Sostituendo questi valori nellultimo integrale si ottiene
s
0
_
sy+t
sy
k1
i=0
((s +t y x))
i
i!
e
(s+tyx)
e
x
dx
_
n
y
n1
(n 1)!
e
y
dy+
s
0
_
+
sy+t
e
x
dx
_
n
y
n1
(n 1)!
e
y
dy
espressione che, eettuate nel primo addendo le dovute semplicazioni e
calcolato nel secondo addendo lintegrale in x, diventa
s
0
_
sy+t
sy
k1
i=0
((s +t y x))
i
i!
e
(s+t)
dx
_
n
y
n1
(n 1)!
dy+
s
0
e
(sy+t)

n
y
n1
(n 1)!
e
y
dy.
95
Per completare il calcolo del primo addendo è suciente scambiare somma-
toria ed integrale e quindi integrare prima in x e poi in y. Si ottengono cos`
facilmente le uguaglianze seguenti
e
(s+t)
s
0
_
k1
i=0
i+1
i!
sy+t
sy
(s + t y x)
i
dx
_
n
y
n1
(n 1)!
dy+
e
(s+t)

n
(n 1)!
s
0
y
n1
dy =
e
(s+t)
k1
i=0
(t)
i+1
(i + 1)!
n
(n 1)!
s
0
y
n1
dy + e
(s+t)
(s)
n
n!
=
e
(s+t)
k
i=1
(t)
i
i!
(s)
n
n!
+ e
(s+t)
(s)
n
n!
=
(s)
n
n!
e
(s)
k
i=0
(t)
i
i!
e
t
.
La dimostrazione è conclusa.
Dalla densità della variabile N(t +t) N(t) e dallo sviluppo di Taylor
della funzione esponenziale si ricavano immediatamente anche le proprietà
seguenti:
i) P(N(t + t) N(t) = 1) = t +o(t)
ii) P(N(t + t) N(t) = 0) = 1 t +o(t),
da cui segue naturalmente
P(N(t + t) N(t) 2) = o(t).
Riassumendo: se lintervallo temporale è piccolo, la probabilità che si ver-
ichi un solo evento, a meno di termini trascurabili, è proporzionale al-
lampiezza dellintervallo temporale secondo il coeciente e il vericarsi
di due o pi` u eventi è trascurabile.
Di fatto si può anche dimostrare che queste regole del susseguirsi degli even-
ti, unite al fatto che il numero degli eventi che si vericano su intervalli
disgiunti sono variabili indipendenti e al fatto che si iniziano a contare gli
eventi al tempo iniziale, ovvero il processo al tempo iniziale vale 0, sono
assiomi, ovvero costituiscono una denizione alternativa per il processo di
Poisson (vedi il paragrafo seguente sul processo di Poisson non stazionario).
Problema della multa
Parcheggio in sosta vietata 2 volte al giorno lasciando ferma la vettura ogni
volta per 1 ora; so che i vigili passano mediamente volte in unora. Come
96
stimo la probabilità di prendere una multa?
Soluzione
Con una certa approssimazione, per il processo che conta il numero dei pas-
saggi dei vigili si possono ritenere soddisfatte le proprietà che caratterizzano
il processo di Poisson: si assume dunque che il processo che conta il numero
dei passaggi dei vigili con il tempo misurato in ore sia un processo di Poisson
di parametro . Indicati con t
1
e t
2
, t
1
= t
2
, gli istanti in cui parcheggio, la
probabilità di prendere una multa è la probabilità dellevento
(N(t
1
+ 1) N(t
1
) 1) (N(t
2
+ 1) N(t
2
) 1)
probabilità che coincide con
1 P
_
(N(t
1
+ 1) N(t
1
) = 0) (N(t
2
+ 1) N(t
2
) = 0)
_
=
1 P(N(t
1
+ 1) N(t
1
) = 0)P(N(t
2
+ 1) N(t
2
) = 0) = 1 e
2
dove per la prima uguaglianza si usa il fatto che le v.a. N(t
1
+1) N(t
1
) e
N(t
2
+ 1) N(t
2
) sono indipendenti e per la seconda che hanno entrambe
legge Poiss().
2.3 Merging e splitting
Siano (N
1
(t))
t0
e (N
2
(t))
t0
due processi di Poisson tra loro indipendenti
rispettivamente di parametri
1
e
2
. Ci si domanda se il processo che
conta il numero complessivo degli eventi sia ancora un processo di Poisson.
La risposta è aermativa e la proprietà va sotto il nome di merging.
Denito qualsiasi sia t 0
N(t) := N
1
(t) +N
2
(t),
la dimostrazione consiste nellosservare che il processo (N(t))
t0
è un pro-
cesso che inizialmente vale 0, ha gli incrementi indipendenti come somma di
v.a. indipendenti e nel dimostrare che (N(t))
t0
verica le proprietà i) e ii)
del paragrafo precedente.
Per la verica della i) si osserva che vale luguaglianza tra eventi
(N(t + t) N(t) = 1) =
(N
1
(t + t) N
1
(t) = 1, N
2
(t + t) N
2
(t) = 0)
(N
2
(t + t) N
2
(t) = 1, N
1
(t + t) N
1
(t) = 0)
dove lunione è disgiunta. Quindi passando alle probabilità, tenendo conto
dellindipendenza di (N
1
(t))
t0
e (N
2
(t))
t0
, si ottiene
P(N(t + t) N(t) = 1) =
P(N
1
(t + t) N
1
(t) = 1)P(N
2
(t + t) N
2
(t) = 0)+
P(N
2
(t + t) N
2
(t) = 1)P(N
1
(t + t) N
1
(t) = 0).
97
Utilizzando allora il fatto che le i) e ii) del paragrafo precedente valgono
per (N
1
(t))
t0
e (N
2
(t))
t0
, con sostituito da
1
e
2
rispettivamente, e
tenendo conto delle semplici regole sugli innitesimi, si ottiene la relazione
voluta con
1
+
2
al posto di .
In modo analogo si verica che il processo (N(t))
t0
verica anche la ii) con
1
+
2
al posto di : naturalmente in tal caso si parte dalluguaglianza tra
eventi
(N(t + t) N(t) = 0) =
(N
1
(t + t) N
1
(t) = 0, N
2
(t + t) N
2
(t) = 0).
Dunque il processo (N(t))
t0
risulta un processo di Poisson di parametro
1
+
2
. Si osservi che quanto dimostrato implica in particolare che per
t > 0 N(t) Poiss
_
(
1
+
2
)t
_
e che questo segue anche direttamente dal
fatto noto che somma di v.a. di Poisson indipendenti è v.a. di Poisson con
parametro la somma dei parametri.
Un esempio di applicazione del merging è la soluzione del seguente problema.
Problema della scorta
Determinare la distribuzione di probabilità del tempo di esaurimento della
scorta complessiva di due prodotti di cui si conosce la richiesta media gior-
naliera, assumendo che i due ussi di richiesta dei prodotti siano indipendenti
e modellizzabili ciascuno con un processo di Poisson e assumendo anche che
in assenza di un prodotto ci si accontenta dellaltro.
Unaltra domanda interessante nella medesima situazione è la seguente: s-
sato un prodotto, con quale probabilità si esaurisce prima la scorta di quel
prodotto?
Soluzione
Si indichi con
i
la richiesta media giornaliera del prodotto i = 1, 2.Per
quanto appena detto allora, se la consistenza della scorta è n, il tempo di
esaurimento è il tempo delln-mo evento di un Poisson di parametro
1
+
2
e quindi ha distribuzione Erlang di parametri n e
1
+
2
.
Inoltre per calcolare la probabilità che si esaurisca prima la scorta del prodot-
to 1, si osserva che, assumendo che le singole scorte ammontino a n
1
e n
2
con
n
1
+n
2
= n, questo accade se si vericano al pi` u n
2
1 richieste del prodotto 2
(ovvero, almeno n
1
richieste del prodotto 1) entro le prime n1 = n
1
+n
2
1
richieste. Infatti indicata con R
i
, i = 1, 2 la v.a. che conta le richieste del
prodotto i entro le prime n 1 richieste, si ha banalmente
R
2
n
2
1 =R
1
n
1
e R
1
n
1
implica che si esaurisce prima la scorta del prodotto 1. Mentre
se R
2
> n
2
1 allora R
2
n
2
e quindi si esaurisce prima la scorta del
prodotto 2. Ora, indicata con p
2
la probabilità che una generica richiesta
98
sia del usso 2, si tratta di calcolare la probabilità di al pi` u n
2
1 successi
per uno schema di Bernoulli di parametri n 1 = n
1
+n
2
1 e p
2
. Dunque
la probabilità richiesta coincide con
n
2
1
k=0
_
n 1
k
_
p
k
2
(1 p
2
)
n1k
.
Inne per calcolare il valore p
2
si osservi che dalla proprietà di perdita di
memoria applicata ai singoli ussi segue che a partire dal tempo di una qual-
siasi richiesta occorre attendere un tempo esponenziale di parametro
1
per
una nuova richiesta del prodotto 1 e un tempo esponenziale di parametro
2
per una nuova richiesta del prodotto 2. Inoltre questi due tempi esponen-
ziali sono indipendenti poiche si è assunto che i ussi lo siano e quindi hanno
densità congiunta (pari al prodotto delle densità) e dunque non possono as-
sumere lo stesso valore. Cos` il valore p
2
deve coincidere con la probabilità
che il tempo esponenziale (strettamente) pi` u piccolo sia quello di parametro
2
ovvero

2
1
+
2
. In conclusione
p
2
=

2
1
+
2
.
Per dimostrare lultima uguaglianza si procede cos`: indicate con X e Y due
v.a. esponenziali rispettivamente di parametri
2
e
1
P(X < Y ) =
+
0
P(X < Y | Y = y)
2
e
2
y
dy =
+
0
P(X < y | Y = y)
2
e
2
y
dy =
+
0
P(X < y)
2
e
2
y
dy =
+
0
P(X y)
2
e
2
y
dy =
+
0
(1 e
1
y
)
2
e
2
y
dy =

2
1
+
2
.
La proprietà del processo di Poisson che va sotto il nome di splitting
lavora al contrario della proprietà del merging: da un processo di Poisson si
generano due processi di Poisson indipendenti.
Si assume che (N(t))
t0
sia un processo di Poisson di parametro e che
ogni evento del processo sia etichettato, in modo indipendente dagli altri,
come evento di tipo i = 1, 2 con probabilità p
i
, i = 1, 2, p
1
+p
2
= 1. Allora,
indicati con N
i
(t), i = 1, 2, il numero degli eventi di tipo i vericatisi no al
tempo t, i processi (N
1
(t))
t0
e (N
2
(t))
t0
sono processi di Poisson tra loro
indipendenti rispettivamente di parametri p
1
e p
2
.
Per dimostrare la proprietà precedente si verica che, qualsiasi siano t > 0
e k e m naturali, vale
P(N
1
(t) = k, N
2
(t) = m) =
(p
1
t)
k
k!
e
p
1
t
(p
2
t)
m
m!
e
p
2
t
.
99
Infatti si calcola
P(N
1
(t) = k, N
2
(t) = m) =
+
n=0
P(N
1
(t) = k, N
2
(t) = m | N(t) = n)P(N(t) = n)
e, ricordando che N
1
(t) + N
2
(t) = N(t), risulta evidente che lunico val-
ore possibile per n, indice della somma, è k + m e lespressione precedente
coincide con
P(N
1
(t) = k, N
2
(t) = m | N(t) = k +m)P(N(t) = k +m).
Il primo fattore dellespressione precedente per ipotesi si calcola come la
probabilità di k successi ciascuno di probabilità p
1
su k +m prove indipen-
denti, mentre il secondo è il valore k +m della densità di una v.a. con legge
Poisson di parametro t = (p
1
+ p
2
)t (si ricordi p
1
+ p
2
= 1). Quindi si
scrive
_
k +m
k
_
p
k
1
p
m
2
_
t
_
k+m
(k +m)!
e
(p
1
+p
2
)t
.
Usando il valore del coeciente binomiale e riscrivendo lesponenziale come
e
p
1
t
e
p
2
t
si ottiene proprio lespressione voluta e la proprietà di splitting
è dimostrata.
Si osservi che N
1
(0) = 0 e per t > 0 N
1
(t) può anche scriversi
N(t)
i=1
D
i
,
dove le v.a. D
1
, D
2
, . . . sono i.i.d. di legge Bernoulli di parametro p
1
, in-
dipendenti da (N(t))
t0
.
Un processo (X(t))
t0
uscente dallo 0 e denito al tempo t > 0 dalla formula
X(t) :=
N(t)
i=1
D
i
,
dove D
1
, D
2
, . . . sono i.i.d. a valori interi positivi indipendenti dal processo
(N(t))
t0
, prende il nome di processo di Poisson composto. Si tratta di un
processo a valori in N con traiettorie costanti a tratti e continue a destra,
ma non necessariamente con salti unitari e quindi non necessariamente un
processo di conteggio.
Per esempio si può rappresentare con un processo di questo tipo lammontare
delle richieste di un certo prodotto in un generico istante se si assume che i
clienti che cercano il prodotto giungano secondo un usso di Poisson e ogni
cliente chieda un numero aleatorio di pezzi del prodotto indipendente dal
numero di pezzi richiesti dagli altri clienti ma di stessa legge (la v.a.D
i
è il
numero di pezzi richiesti dal cliente i-mo).
Per il calcolo del valor medio del processo al tempo t si procede cos`
E[X(t)] =
+
n=1
E[X(t) | N(t) = n]P(N(t) = n).
100
Allora sostituendo lespressione di X(t) nella formula, per la linearità della
media condizionata, lindipendenza delle v.a. D
1
, D
2
, . . . da (N(t))
t0
, e
luguaglianza in legge delle D
1
, D
2
, . . ., lespressione precedente coincide con
+
n=1
n
i=1
E[D
i
]P(N(t) = n) = E[D
1
]
+
n=1
nP(N(t) = n) = E[D
1
]t.
Si consideri la seguente applicazione della proprietà di splitting.
Problema della coda con usso di ingresso Poisson, inniti sportelli e
tempo di servizio a due valori
In un ideale ucio di servizio il numero degli sportelli è innito, il usso di
ingresso dei clienti è Poisson di parametro e il tempo di servizio di cias-
cuno sportello è T
1
con probabilità p
1
e T
2
con probabilità p
2
= 1p
1
. Ci si
domanda quanti saranno gli sportelli occupati ad un tempo grande ssato.
Soluzione
Il tempo medio di servizio per ipotesi è pari a T
1
p
1
+ T
2
p
2
. Indicato con
(N
i
(t))
t0
, i = 1, 2, il usso dei clienti ad uno sportello di tipo i (ovvero
con tempo di servizio T
i
), si sa, per la proprietà di splitting, che si tratta di
un usso di Poisson di parametro p
i
e che i due ussi sono indipendenti.
Allora, per ogni tempo t maggiore del massimo tra T
1
e T
2
, il numero degli
sportelli occupati al tempo t sarà uguale al numero dei clienti arrivati ad
uno sportello di tipo 1 nellintervallo di tempo (t T
1
, t] pi` u il numero dei
clienti arrivati ad uno sportello di tipo 2 nellintervallo di tempo (t T
2
, t],
ovvero sarà pari a (N
1
(t) N
1
(t T
1
)) + (N
2
(t) N
2
(t T
2
)) e le v.a.
N
1
(t) N
1
(t T
1
) e N
2
(t) N
2
(t T
2
) sono indipendenti con legge di Pois-
son rispettivamente di parametri p
1
T
1
e p
2
T
2
.
`
E noto che la somma di
v.a. di Poisson indipendenti è ancora Poisson con parametro la somma dei
parametri e dunque (N
1
(t) N
1
(t T
1
)) + (N
2
(t) N
2
(t T
2
)) è v.a. di
Poisson di parametro p
1
T
1
+p
2
T
2
= (p
1
T
1
+p
2
T
2
). Si conclude che per
tempi grandi, ovvero maggiori del massimo tra T
1
e T
2
, se la legge del tempo
di servizio è discreta a due valori, il numero degli sportelli occupati è v.a.
di legge Poisson di parametro pari al prodotto del numero medio dei clienti
in ingresso nel tempo unitario per il tempo medio di servizio.
Di fatto si può dimostrare che laermazione precedente è vera qualsiasi sia
la legge del tempo di servizio degli sportelli purche comune e di media nita.
2.4 Processo di Poisson non stazionario
Un processo di Poisson non stazionario (N(t))
t0
è un processo di conteggio
che ha incrementi indipendenti e che verica le proprietà i) e ii) del paragrafo
2 con al posto della costante una funzione t (t), ovvero le proprietà
i
) P(N(t + t) N(t) = 1) = (t) t +o(t)

101
e
ii
) P(N(t + t) N(t) = 0) = 1 (t)t +o(t),

da cui segue naturalmente
P(N(t + t) N(t) 2) = o(t).
Si determina qui la legge dellincremento N(s +t) N(s), per s e t generici,
ovvero si calcola la probabilità che lincremento assuma un generico valore
k 0, cioè P(N(s+t) N(s) = k). Indicata questa probabilità con p
k
(s, t),
considerando s come costante e t come variabile, poiche in un intervallo
t può vericarsi, con probabilità non trascurabile rispetto allampiezza
t, un evento o nessuno e poiche il numero di eventi su intervalli disgiunti
costituisce una famiglia di v.a. indipendenti, vale, qualsiasi sia k 1,
p
k
(s, t + t) =p
k1
(s, t)
_
(s +t)t +o(t)
_
+
+p
k
(s, t)
_
1 (s +t)t +o(t)
_
+o(t).
Nel membro di destra delluguaglianza lultimo termine o(t) tiene conto
della trascurabile probabilità che nellintervallo [s +t, s +t +t) si verichi
pi` u di un evento. Lespressione precedente si può riscrivere
p
k
(s, t + t) p
k
(s, t)
t
= p
k1
(s, t)(s +t) p
k
(s, t)(s +t) +
o(t)
t
e dividendo ambo i membri per t e mandando t a zero, si ottiene, qualsiasi
sia k 1,
d
dt
p
k
(s, t) = p
k1
(s, t)(s +t) p
k
(s, t)(s +t).
In modo analogo si ricava che
d
dt
p
0
(s, t) = p
0
(s, t)(s +t).
Risolvendo lultima equazione con dato iniziale p
0
(s, 0) = 1 si ottiene
p
0
(s, t) = e
(M(s+t)M(s))
dove
M(x) :=
x
0
(y) dy
e poi procedendo per ricorrenza si calcola, qualsiasi sia k 1, tenendo conto
che p
k
(s, 0) = 0,
p
k
(s, t) = e
(M(s+t)M(s))
(M(s + t) M(s))
k
k!
.
102
Dunque lincremento sullintervallo (s, s + t] del processo di Poisson non
stazionario ha legge di Poisson di parametro M(s+t)M(s). In particolare,
scegliendo s = 0, si ricava che la legge al tempo t del processo di Poisson
non stazionario è Poisson di parametro M(t) e dunque M(t) =
t
0
(y) dy
rappresenta il numero medio degli eventi che si vericano no al tempo t
(incluso).
Si osserva che se si assume che (t) = per ogni t > 0 si ritrova la densità
degli incrementi del processo di Poisson stazionario.
2.5 Distribuzione dei tempi di salto in [0, T] condizionata a
N(T)=n
Una importante proprietà dei tempi di salto di un processo di Poisson si
enuncia a parole cos`: condizionatamente al sapere che si vericano n eventi
nellintervallo [0, T], i tempi S
1
, . . . , S
n
sono il riordinamento in senso cres-
cente di n v.a. i.i.d. di legge uniforme in [0, T].
Qui non si dimostra la proprietà ma si calcola soltanto la k-ma marginale
di questa distribuzione condizionata, ovvero per 1 k n si calcola la
funzione di distribuzione di S
k
, tempo in cui si verica il kmo evento, con-
dizionata al sapere che nellintervallo [0, T] si sono vericati n eventi.
Per t T, utilizzando tra le altre cose luguaglianza tra eventi
(S
k
t) = (N(t) k)
e lindipendenza delle v.a. N(t) e N(T) N(t), si calcola
P(S
k
t | N(T) = n) =
P(N(t) k | N(T) = n) =
P(N(t) k, N(T) = n)
P(N(T) = n)
=
n
j=k
P(N(t) = j, N(T) N(t) = n j)
P(N(T) = n)
=
n
j=k
P(N(t) = j)P(N(T) N(t) = n j)
P(N(T) = n)
=
n
j=k
_
t
_
j
e
t
/j!
_
(T t)
_
nj
e
(Tt)
/(n j)!
_
T
_
n
e
T
/n!
e dopo le dovute semplicazioni si ottiene
P(S
k
t | N(T) = n) =
n
j=k
_
n
j
_
_
t
T
_
j
_
1
t
T
_
nj
Quanto ottenuto è coerente con la proprietà enunciata inizialmente, che
implica che, condizionatamente allevento (N(T) = n), la v.a. S
k
ha la
103
legge della k ma v.a. del riordinamento crescente di n v.a. i.i.d. uniformi
in [0, T]. Infatti la probabilità che esattamente j tra n v.a. i.i.d. di legge
uniforme in [0, T] assumano valore nellintervallo [0, t] è
_
n
j
_
_
t
T
_
j
_
1
t
T
_
nj
e quindi la probabilità che almeno k tra n v.a. i.i.d. di legge uniforme in
[0, T] assumano valore nellintervallo [0, t] è proprio
n
j=k
_
n
j
_
_
t
T
_
j
_
1
t
T
_
nj
.
Unapplicazione della distribuzione dei tempi di salto condizionata al
numero dei salti è la seguente.
Problema del costo di attesa
Una sequenza di messaggi arriva secondo un usso di Poisson di parametro
alla porta di un canale di comunicazione; il canale viene aperto in tempi
deterministici multipli di un tempo ssato T. Ciascun messaggio che arriva
tra un tempo e laltro rimane conservato in un buer ad un certo costo
sso per ogni unità temporale. Allapertura del canale i messaggi in attesa
vengono trasmessi istantaneamente.
Qual è il costo medio per la conservazione di tutti i messaggi arrivati tra
una trasmissione e la successiva?
Soluzione
Indicato con (N(t))
t0
il processo di Poisson che conta i messaggi, il tempo
totale di conservazione dei messaggi è la v.a.
(T S
1
) + (T S
2
) +. . . + (T S
N(T)
)
e dunque, indicato con C il costo sso per ogni unità temporale per ogni
singolo messaggio, il costo totale per la conservazione è
C
_
T S
1
+T S
2
+. . . +T S
N(T)
_
.
Dunque essendo C deterministico, condizionando al valore di N(T) Poiss(T)
si ottiene
E
_
C
_
T S
1
+T S
2
+. . . +T S
N(T)
_
_
=
CE
_
T S
1
+T S
2
+. . . +T S
N(T)
_
=
C
+
n=0
E
_
T S
1
+T S
2
+. . . +T S
n
| N(T) = n
_
(T)
n
n!
e
T
=
C
+
n=0
nT E
_
S
1
+S
2
+. . . +S
n
| N(T) = n
_
(T)
n
n!
e
T
.
104
Per quanto enunciato precedentemente, condizionatamente al fatto che vi
siano n arrivi, la somma delle v.a. tempo di arrivo entro il tempo T coincide
con la somma di n v.a. uniformi in [0, T]. Dunque, poiche il valor medio
condizionato è lineare e il valor medio di una v.a. uniforme in [0, T] è T/2,
si ottiene
E
_
S
1
+S
2
+. . . +S
n
| N(T) = n
_
= n
T
2
. Pertanto il valor medio del costo totale risulta
C
+
n=1
n
T
2
(T)
n
n!
e
T
= C
T
2
2
+
n=1
(T)
n1
(n 1)!
e
T
= C
T
2
2
.
Si conclude questa sezione dimostrando che per ogni k n vale la
formula
E[S
k
S
k1
| N(T) = n] =
T
n + 1
.
Si premettono due enunciati relativi ad una v.a. X non negativa. Se X è
discreta vale E[X] =
+
k=1
P(X k), essendo
+
n=1
nP(X = n) =
+
n=1
n
k=1
P(X = n) =
+
k=1
+
n=k
P(X = n).
Analogamente, se X è continua vale
E[X] =
+
0
P(X t) dt =
+
0
P(X > t) dt.
Analoghe rappresentazioni valgono per il valor medio condizionato di v.a.
non negative. Dunque per la linearità della media condizionata, dopo aver
notato che per k n e t > T vale P(S
k
> t | N(T) = n) = 0, si scrive
E
_
S
k
S
k1
| N(T) = n
_
=
E
_
S
k
| N(T) = n
_
E
_
S
k1
| N(T) = n
_
=
+
0
P
_
S
k
> t | N(T) = n
_
dt
+
0
P
_
S
k1
> t | N(T) = n
_
dt =
T
0
P
_
S
k
> t | N(T) = n
_
dt
T
0
P
_
S
k1
> t | N(T) = n
_
dt =
T
0
_
P(S
k1
t | N(T) = n) P(S
k
t | N(T) = n)
_
dt.
Andando a sostituire le espressioni della distribuzione condizionata prece-
dentemente dimostrata ci si riduce al calcolo di
T
0
_
n
k 1
_
_
t
T
_
k1
_
1
t
T
_
n+1k
dt =
T
1
0
_
n
k 1
_
s
k1
(1 s)
n+1k
ds
105
che integrato per parti dà il risultato.
3 Processi di rinnovo
Si chiamano processi di rinnovo quei processi di conteggio per i quali gli
intertempi tra eventi successivi sono v.a. i.i.d. di media nita. Dunque i
processi di Poisson sono particolari processi di rinnovo. In un processo di rin-
novo gli eventi sono pensati come rinnovi nel senso di nuove inizializzazioni
di situazioni che hanno una durata aleatoria indipendente dalle precedenti
ma sempre statisticamente la stessa. Ad esempio sono processi di rinnovo
quelli che contano le sostituzioni immediate di apparecchiature identiche a
tasso di guasto non necessariamente costante e quindi per esempio soggette
ad usura. Si ricorda la nozione di tasso di guasto di una distribuzione di
v.a. X non negativa continua. Si calcola
P(t < X < t + t | X > t) =
t+t
t
f
X
(x) dx
1 F
X
(t)
=
f
X
(t)t +o(t)
1 F
X
(t)
=
f
X
(t)
1 F
X
(t)
t +o(t),
dove la seconda uguaglianza discende dal teorema fondamentale del calco-
lo integrale. Si denisce tasso di guasto o rischio al tempo t (della dis-
tribuzione) di X la quantità
f
X
(t)
1 F
X
(t)
.
Dalle precedenti uguaglianze segue che
f
X
(t)
1 F
X
(t)
t
costituisce, a meno di termine trascurabili rispetto a t, unapprossimazione
per la probabilità che unapparecchiatura con tempo di vita X e ancora in
vita al tempo t, si guasti tra t e t +t. A secondo che il tasso di rischio ri-
manga costante o no nel tempo lapparecchiatura non è soggetta o è soggetta
allusura ed in particolare se il tasso di rischio rimane costante, cresce o de-
cresce nel tempo allora laspettativa sul tempo di vita dellapparecchiatura
in seguito allutilizzo rispettivamente rimane la stessa, peggiora o migliora.
Indicato con r(t) il tasso di rischio al tempo t, integrando luguaglianza
r(t) =
f
X
(t)
1 F
X
(t)
si ottiene
ln(1 F
X
(t)) =
t
0
r(s) ds
106
ovvero
1 F
X
(t) = e
t
0
r(s) ds
e da ciò segue che la distribuzione esponenziale è lunica con tasso di rischio
costante.
Imponendo che valga r(t) = Ct
con C > 0 e > 1, dalla relazione

1 F
X
(t) = e
t
0
r(s) ds
, si ricava
F
X
(t) = t I
[0,+)
_
1 e
Ct
+1
/(+1)
_
.
Si tratta della funzione di distribuzione nota con il nome di Weibull di
parametri C e : qualsiasi sia C > 0, per > 0 la funzione t r(t) è
crescente, per 1 < < 0 è decrescente, e inne per = 0 la distribuzione
coincide con lesponenziale e quindi t r(t) è costante.
Si dimostra facilmente che la distribuzione (, ) ha tasso di rischio vari-
abile crescente per > 1 e decrescente per < 1, qualsiasi sia .
Per dare una denizione formale di un processo di rinnovo si può ripetere
quella del processo di Poisson sostituendo però alla assunzione che la legge
degli intertempi sia esponenziale quella che la media degli intertempi sia
nita.
Innanzitutto si deve osservare che lipotesi di media nita garantisce che
in un tempo nito il numero dei rinnovi può soltanto essere nito. Infatti,
indicata con la media degli intertempi, la legge forte dei grandi numeri
implica che
lim
n+
X
1
+. . . +X
n
n
= lim
n+
S
n
n
=
con probabilità 1 e questo implica che
lim
n+
S
n
= +.
Da questo segue che se si indica con (N(t))
t0
il processo di rinnovo e si ssa
un tempo t, a meno di un insieme probabilisticamente irrilevante di traiet-
torie, esiste un indice n abbastanza grande (che dipende dalla traiettoria)
tale che è S
n
> t e quindi, N(t) n 1.
In secondo luogo si nota che esattamente come nel caso del processo di
Poisson vale luguaglianza
P(N(t) k) = P(S
k
t)
che riduce il calcolo della densità di N(t) alla conoscenza della funzione di
ripartizione dei tempi S
n
, n 1. Il valore medio del processo di rinnovo ad
un tempo t ssato, cioè
M(t) := E[N(t)]
107
si calcola a partire dalla funzione di ripartizione dei tempi S
n
, n 1
per mezzo della formula
M(t) =
+
k=1
P(S
k
t)
che segue immediatamente dalla formula M(t) =
+
k=1
P(N(t) k), vera
essendo N(t) v.a. non negativa (vedi paragrafo 5 del I capitolo).
Nel seguito ci si limita a considerazioni asintotiche sul valore medio del
processo di rinnovo ad un tempo t ssato, M(t), e sul valore medio del
tempo che occorre attendere a partire da t anche si verichi un rinnovo,
cioè E[
t
] dove, come per il processo di Poisson, si denisce
t
:= S
N(t)+1
t.
La funzione t M(t) si chiama funzione di rinnovo e
t
si chiama tempo di
vita residua al tempo t, con riferimento allinterpretazione degli intertempi
dei rinnovi come tempi di guasto di apparecchiature identiche a sostituzione
immediata.
Si ricordi subito che nel particolare caso del processo di Poisson di parametro
, poiche vale =
1
, valgono le uguaglianze
M(t) =
t
E[
t
] = ,
dove in particolare lultima uguaglianza segue dalla proprietà di perdita di
memoria del processo di Poisson. Dunque per il processo di Poisson la fun-
zione di rinnovo è lineare e il tempo medio di vita residuo è costante nel
tempo.
Per i processi di rinnovo con intertempi di rinnovo non esponenziali la fun-
zione di rinnovo non è lineare ma lo è asintoticamente e il tempo medio di
vita residua non è costante ma lo è asintoticamente. Pi` u precisamente si
può dimostrare che quando gli intertempi di rinnovo sono v.a. continue con
momento secondo nito, ovvero E[X
2
1
] < +, valgono per tempi grandi le
due approssimazioni seguenti
M(t)
t
+
E[X
2
1
]
2
2
1 E[
t
]
E[X
2
1
]
2
.
Qui non si dimostra la prima approssimazione, ma si spiega come dalla prima
si ricava la seconda e a questo scopo si introduce e si dimostra un lemma
interessante di per se: si tratta dellequazione di Wald che generalizza il
risultato relativo al valore medio della somma di un numero aleatorio di
termini aleatori indipendenti di stessa legge visto per il processo di Poisson
composto.
108
Si assuma che D
1
, D
2
, . . . siano v.a. i.i.d. non negative di media nita,
N sia un v.a. a valori naturali con media nita e inne levento (N = i) sia
indipendente dalle v.a. D
i+1
, D
i+2
, . . . (ciò vale in particolare se la v.a. N è
indipendente dalle v.a. D
1
, D
2
, . . .), allora
E
_
N
i=1
D
i
_
= E[N]E[D
1
].
Per la dimostrazione basta osservare che il primo membro delluguaglianza
coincide con
E
_
+
i=1
D
i
I
iN
_
e, potendo scambiare media e serie poiche i termini sono non negativi,
coincide con
+
i=1
E[D
i
I
iN
].
Ora la v.a. D
i
è indipendente dalla v.a. I
iN
, essendo levento (N i)
complementare di (N < i) =
i1
k=1
(N = k), indipendente dalla v.a.D
i
in
quanto unione di eventi per ipotesi indipendenti dalla v.a.D
i
. Inoltre si sa
che il valor medio del prodotto di v.a. indipendenti è il prodotto dei valori
medi e quindi lespressione precedente coincide con
+
i=1
E[D
i
] E[I
iN
].
Si conclude osservando che le v.a. D
i
hanno tutte media E[D
1
] e che
+
i=1
P(N i) = E[N].
Dallequazione di Wald si deriva la relazione tra la funzione di rinnovo e
il tempo medio di vita residua. Infatti si scrive
E[
t
] = E
_
N(t)+1
i=1
X
i
t
_
e applicando lequazione di Wald si ottiene
E[
t
] =
_
1 +M(t)
_
t.
Si noti levento
_
N(t) + 1 = i
_
coincide con levento
_
S
i1
t < S
i
_
che
chiaramente è indipendente dalle v.a. X
i+1
, X
i+2
, . . ..
Sostituendo a M(t) nel membro di destra dellultima uguaglianza la sua
approssimazione
t
+
E[X
2
1
]
2
2
1 si ottiene subito
E[
t
]
E[X
2
1
]
2
109
Ricordando che V ar(X
1
) = E[X
2
1
]
2
, lapprossimazione si riscrive
E[
t
]
_
V ar(X
1
)
2
+ 1
_
2
.
Si osservi che
_
V ar(X
1
)
2
+ 1
_
2
>
V ar(X
1
)
2
> 1
V ar(X
1
)
> 1.
Per una generica v.a. Z, di media e con varianza nita si può leggere
il coeciente
V ar(Z)
, ricordando il signicato di media e varianza, come

una misura della regolarità della distribuzione e in particolare
V ar(Z)
>
1 indica una distribuzione irregolare. Sono irregolari in questo senso per
esempio le v.a. con distribuzione (, ) per > 1, qualsiasi sia > 0.
Il fatto che per distribuzioni degli intertempi irregolari il tempo medio di
vita residua si approssima con un valore che supera la media degli intertempi
si ricorda con il nome di paradosso del tempo di attesa: se le partenze ai
capolinea sono irregolari arrivando a caso ad una fermata si aspetta in media
pi` u del tempo medio tra una partenza e laltra.
4 Catene di Markov a tempo continuo
4.1 Denizione
La generalizzazione al tempo continuo del concetto di catena di Markov a
tempo discreto e a valori discreti è naturale.
Una famiglia di v.a. (X(t))
t0
a valori in S discreto denite tutte sullo
stesso spazio di probabilità è una catena di Markov a tempo continuo se,
qualsiasi sia n, qualsiasi siano t
0
, t
1
, . . . t
n+1
, qualsiasi siano i, j, i
0
, . . . , i
n1
in S (quando le probabilità condizionate hanno senso)
P(X(t
n+1
) = j | X(t
n
) = i, X(t
n1
) = i
n1
, . . . , X(t
0
) = i
0
) =
P(X(t
n+1
) = j | X(t
n
) = i).
Qui si considera il caso omogeneo ovvero quello in cui, ssato t 0, per ogni
s 0
p
ij
(t) := P(X(t) = j | X(0) = i) = P(X(s +t) = j | X(s) = i)
e p
ij
(t) è detto probabilità di transizione da i a j nel tempo t. Vale natural-
mente p
ij
(0) = I
i
(j).
Si consideri una dinamica stocastica su uno spazio discreto S che segua
due regole: in ogni stato i o si rimane per sempre (stato assorbente) o si
110
rimane un tempo esponenziale di parametro
i
, indipendentemente dal pas-
sato; se lo stato i è non assorbente, quando si lascia lo stato i si salta in un
altro stato j = i con probabilità p
ij
, indipendentemente dal passato.
Sia (X(t))
t0
il processo che al tempo t assume per valore lo stato in cui ci si
trova al tempo t seguendo questa dinamica, precisando che per stato quan-
do t è un tempo di transizione si intende quello assunto dopo la transizione,
cosicche le traiettorie risultano continue a destra. Si può dimostrare, usando
lindipendenza tra salti e tempi di permanenza e la perdita di memoria della
distribuzione esponenziale, che (X(t))
t0
è una catena di Markov a tempo
continuo omogenea.
Viceversa è anche vero il contrario: se un sistema aleatorio si muove in
uno spazio di stati discreto, allora anche valga la proprietà di Markov è
necessario che il tempo di permanenza negli stati non assorbenti sia espo-
nenziale. Qui si dà unidea della dimostrazione: la probabilità che il tempo
di permanenza nello stato i (non assorbente) superi t coincide con
P(X(s) = i, s t | X(0) = i)
e questa probabilità, per la continuità da destra delle traiettorie e per la
densità dei razionali nei reali, coincide con la probabilità che X(q) = i su
tutti i razionali q in [0, t] e per il lemma di continuità della probabilità con
lim
n+
P
_
X(s) = i, s = kt/n, k = 0, 1, . . . , n 1 | X(0) = i
_
.
Richiedere la proprietà di Markov equivale allora a richiedere che indicata
con f(t) la probabilità cercata valga
f(t) = lim
n+
_
p
ii
(t/n)
_
n
.
Segue che per ogni > 0
f(t) = f(t)
.
Infatti
f(t) = lim
n+
_
p
ii
(t/n)
_
n
e per ogni razionale esiste una successione divergente di interi della forma
m = n/ da cui
lim
n+
_
p
ii
(t/n)
_
n
= lim
m+
_
p
ii
(t/ m)
_
m
= f(t)
.
Per reale qualsiasi si usa la monotonia della funzione f.
Fissato t tale che f(t) < 1 (tale t esiste poiche lo stato i non è assorbente),
qualsiasi sia s > 0 si scrive come s = t per qualche e si riscrive f(t) =
f(t)
come
f(s) = e
s
t
ln f(t)
111
da cui segue
f(s) = e
c s
posto c :=
ln f(t)
t
. Questo ricordando la denizione di f(s) è quello che si
voleva dimostrare.
Dunque numerati gli elementi di un insieme discreto S, una dinamica di
Markov a tempo continuo su S è data se sono dati: una matrice stocastica
P, di elemento generico p
ij
, che assegna le probabilità con cui avvengono
i salti con la convenzione p
ij
= I
i
(j) quando i è assorbente; i parametri
i
> 0, i = 1, 2, . . . delle leggi esponenziali dei tempi di permanenza negli
stati, con la convenzione
i
= 0 quando i è assorbente. Si noti che la matrice
P, matrice delle probabilità di salto, ha gli elementi sulla diagonale pari a 1
se lo stato è assorbente e pari a 0 altrimenti.
Si può dimostrare che muovendosi con questa dinamica, se i parametri
i
, i = 1, 2, . . . sono limitati, ovvero se esiste tale che
i
qualsiasi
sia i, si compiono solo un numero nito di salti su ogni intervallo di tempo
nito (proprietà di non esplosione). In particolare naturalmente i parametri
i
, i = 1, 2, . . . sono limitati quando S è nito.
Lesempio pi` u semplice di catena di Markov a tempo continuo è il pro-
cesso di Poisson di parametro : in questo caso S = N, nessuno stato è
assorbente,
i
= , i = 1, 2, . . . e la matrice P ha per ogni riga un unico
elemento non nullo, p
i,i+1
= 1. Inne il processo di Poisson, come ogni pro-
cesso di rinnovo, ammette su un intervallo di tempo nito solo un numero
nito di salti.
Viene naturale chiedersi se, dati su di uno stesso spazio di probabilità
un processo di Poisson (N(t))
t0
di parametro e una catena di Markov a
tempo discreto (Z
n
)
n0
, il processo denito con
X(t) := Z
n
, S
n
t < S
n+1
, n 0
sia una catena di Markov a tempo continuo (qui S
n
è come al solito ln-mo
tempo di salto del processo di Poisson). Si noti che il processo introdotto
si può anche scrivere cos`: (Z
N(t)
)
t0
. La risposta è aermativa. Il punto
è che se la matrice di transizione di (Z
n
)
n0
ha almeno un elemento della
diagonale diverso da 1 e da 0, ovvero la catena (Z
n
)
n0
ha almeno uno stato
non assorbente i con probabilità di transizione in se stesso non nulla, i tempi
di salto di (X(t))
t0
sono un sottoinsieme eventualmente proprio dei tempi
di salto di (N(t))
t0
e il tempo di soggiorno in i risulta esponenziale di
parametro (1p
ii
) (in generale si può dimostrare che somma di un numero
aleatorio, con distribuzione geometrica di parametro p di v.a. esponenziali
di parametro è esponenziale di parametro p).
Va anche notato che ogni catena di Markov a tempo continuo, (X(t))
t0
,
contiene una catena di Markov a tempo discreto, (Z
n
)
n0
: posto S
0
:= 0 e
112
detti S
n
, n 1 i tempi di salto di (X(t))
t0
, si pone Z
n
:= X(S
n
), n 0.
Naturalmente la matrice dei salti P della catena a tempo continuo coincide
con la matrice di transizione P della catena a tempo discreto e dunque per la
dinamica discreta gli stati non assorbenti hanno probabilità nulla di tornare
dopo un passo in se stessi.
4.2 Funzione di transizione e tassi di salto
Data una catena di Markov a tempo continuo in 1, 2, . . ., in analogia al caso
tempo discreto si indica con
t
la densità di probabilità al tempo t 0,
ovvero per ogni j
t
(j) := P(X(t) = j).
Come calcolare
t
, t > 0 a partire dalla densità iniziale
0
e dalla dinamica,
ovvero dai parametri dei tempi di permanenza
i
, i = 1, 2, . . . e dalla matrice
delle probabilità di salto P?
Dalla formula delle probabilità totali si ricava
t
(j) =
i1
p
ij
(t)
0
(i)
e quindi, introdotta la funzione a valori matriciali
t P(t) :=
_
p
ij
(t)
_
ij
,
funzione di transizione al tempo t, in analogia al caso discreto, qualsiasi sia
t 0, si può scrivere
t
=
0
P(t)
(P(0) è la matrice identità). Dunque il problema si sposta su come calcolare
la funzione di transizione P(t), t 0 a partire dalla dinamica, ovvero dai
parametri dei tempi di permanenza
i
, i = 1, 2, . . . e dalla matrice delle
probabilità di salto P.
Si può dimostrare che la funzione di transizione soddisfa le seguenti equazioni
dierenziali
P
(t) = QP(t)
P
(t) = P(t)Q,
dove Q è cos` denita
q
ij
=
i
p
ij
, i = j
q
ii
=
i
.
Si può osservare che, con le convenzioni adottate sul valore di
i
per i assor-
bente, nella matrice Q una riga corrispondente ad uno stato assorbente è tut-
ta nulla. Del resto, ricordando che P(0) è la matrice identità, dalle equazioni
si ricava che P
(0) = Q e se i è assorbente, qualsiasi sia t, p

ij
(t) = I
i
(j) per
113
ogni j e quindi p
ij
(t) = 0 per ogni j.
Le precedenti equazioni (matriciali) sono note rispettivamente con il nome
di equazioni allindietro e allavanti di Kolmogorov. Riscrivendole in forma
estesa si trova
p
ij
(t) =
k
q
ik
p
kj
(t)
p
ij
(t) =
k
p
ik
(t)q
kj
e si nota che lequazione allindietro lega in un sistema di equazioni dieren-
ziali lineare del I ordine gli elementi di colonna della funzione di transizione,
mentre viceversa quella allavanti gli elementi di riga. Inoltre per entrambe
le equazioni il dato iniziale è noto: nel primo caso p
jj
(0) = 1 e p
ij
(0) = 0
per i = j, nel secondo caso p
ii
(0) = 1 e p
ij
(0) = 0 per j = i.
Naturalmente anche le equazioni enunciate siano utili ai ni del calcolo di
P(t), occorre che esse abbiano ununica soluzione: ciò accade per esempio
nel caso di parametri
i
limitati e quindi in particolare nel caso a stati niti.
Si dimostra lequazione allindietro, p
ij
(t) =
k
q
ik
p
kj
(t), nel modo
seguente.
Se lo stato i è assorbente p
ij
(t) = 0 qualsiasi sia j e q
ik
= 0 qualsiasi sia k e
quindi lequazione è vera. Se lo stato i non è assorbente, indicato con T
1
il
tempo di primo salto della catena di Markov, si scrive
p
ij
(t) = P(T
1
> t, X(t) = j | X(0) = i) + P(T
1
t, X(t) = j | X(0) = i).
Per il primo termine si osserva che, condizionatamente a partire da i, T
1

esp(
i
) e T
1
> t implica X(t) = i e quindi
P(T
1
> t, X(t) = j | X(0) = i) = I
i
(j)P(T
1
> t | X(0) = i) = I
i
(j)e
i
t
.
Il secondo termine si riscrive condizionando al valore di T
1
, avendo indicato
con f
T
1
la densità di T
1
P(T
1
t, X(t) = j | X(0) = i, T
1
= s)f
T
1
(s) ds =
t
0
P(X(t) = j | X(0) = i, T
1
= s)
i
e
i
s
ds
114
Ma per la formula delle probabilità totali, la formula del prodotto e la
proprietà di Markov
P(X(t) = j | X(0) = i, T
1
= s) =
k=i
P(X(t) = j, X(T
1
) = k | X(0) = i, T
1
= s) =
k=i
P(X(t) = j | X(T
1
) = k, X(0) = i, T
1
= s)P(X(T
1
) = k | X(0) = i, T
1
= s) =
k=i
P(X(t) = j | X(s) = k)P(X(T
1
) = k | X(0) = i)
k=i
p
kj
(t s)p
ik
e quindi lintegrale si riscrive
t
0
k=i
p
kj
(t s)p
ik
i
e
i
s
ds
e con il cambio di variabile s in t u
i
e
i
t
t
0
k=i
p
kj
(u)p
ik
e
i
u
du.
In conclusione
p
ij
(t) = I
i
(j)e
i
t
+
i
e
i
t
t
0
k=i
p
kj
(u)p
ik
e
i
u
du
e la funzione t p
ij
(t) è derivabile in quanto composizione di funzioni
derivabili, con derivata pari a
i
_
I
i
(j)e
i
u
i
e
i
t
t
0
k=i
p
kj
(u)p
ik
e
i
u
du
_
+
i
k=i
p
kj
(t)p
ik
cioè a
i
p
ij
(t) +
i
k=i
p
kj
(t)p
ik
e ricordando la denizione di q
ij
lequazione è dimostrata.
A questo punto dimostrare lequazione allavanti, p
ij
(t) =
k
p
kj
(t)q
kj
,
è pi` u semplice.
Si deriva in s la relazione
p
ij
(t +s) =
k
p
ik
(t)p
kj
(s)
115
(equazione di Chapman Kolmogorov); la derivata esiste poiche è stata già
dimostrata lequazione allindietro e derivando si ottiene
p
ij
(t +s) =
k
p
ik
(t)p
kj
(s).
Inoltre dallequazione allindietro già dimostrata segue che P
(0) = Q e
quindi lultima uguaglianza in s = 0 è lequazione cercata.
Proprio luguaglianza P
(0) = Q consente di interpretare gli elementi

della matrice Q, che non sono sulla diagonale, come tassi di salto: infatti
per la formula di Taylor con il resto di Peano, qualsiasi siano i, j con i = j
p
ii
(t) = 1 +q
ii
t +o(t)
p
ij
(t) = q
ij
t +o(t)
e dunque, a meno di termini trascurabili rispetto a t, p
ij
(t) = q
ij
t, ovvero
q
ij
t è lapprossimazione al I ordine della probabilità che in un intervallo di
ampiezza t di tempo si passi da i a j.
Si sottolinea che la matrice Q, detta anche matrice dei parametri in-
nitesimali, non è una matrice stocastica ed in particolare gli elementi non
sono necessariamente in [0, 1] e la somma degli elementi di riga è nulla. In-
fatti se i è assorbente si è già detto che la riga corrispondente in Q è tutta
nulla, mentre se i è non assorbente q
ii
=
i
e inoltre
j=i
q
ij
=
j=i
i
p
ij
=
i
j=i
p
ij
=
i
dove nellultima riga si usa
j=i
p
ij
= 1.
Si deve anche notare che dati i parametri innitesimali, ovvero data Q, la
dinamica è assegnata. Infatti si calcolano i parametri dei tempi di soggiorno
i
, i = 1, 2, . . . e la matrice delle probabilità di salto P nel modo seguente: se
la riga i-ma di Q è nulla allora
i
= 0 e la riga i-ma di P ha solo lelemento
sulla diagonale non nullo, ovvero i è stato assorbente; altrimenti
i
=
j=i
q
ij
, p
ij
=
q
ij
i
.
In conclusione cos`, come nel caso tempo discreto una dinamica markoviana
è individuata dalla matrice di transizione P, nel caso tempo continuo una
dinamica markoviana è individuata dalla matrice dei parametri innitesimali
Q.
116
4.3 Catene di nascita e morte
Le catene di Markov a tempo continuo per le quali
q
ij
= 0 |i j| 1
sono dette catene di nascita e morte. Esse possono assumere valori su
(0, 1, 2 . . . , d) o (0, 1, 2 . . .), ma il salto possibile da ogni stato è solo ver-
so gli stati adiacenti, ovvero da i solo in i + 1 o in i 1.
Si pone qualsiasi sia i
i
:= q
i,i+1
, i 0
i
:= q
i,i1
, i 1
i
si chiama tasso di nascita e
i
tasso di morte e si pone anche
0
:= 0 e
se S è nito
d
:= 0. Segue che valgono le uguaglianze
i
=
i
+
i
,
0
=
0
e, nel caso S sia nito,
d
=
d
e per le probabilità di salto
p
i,i+1
=

i
i
+
i
, p
i,i1
=

i
i
+
i
, p
0,1
= 1
e se S è nito p
d,d1
= 1.
Si considera la catena a due stati, cioè il caso S = (0, 1), e si calcola la
funzione di transizione risolvendo le equazioni allindietro: per calcolare gli
elementi della prima colonna di P(t) si impostano le equazioni
p
00
(t) = q
00
p
00
(t) +q
01
p
10
(t)
p
10
(t) = q
11
p
10
(t) +q
10
p
00
(t)
ovvero
p
00
(t) = p
00
(t) +p
10
(t)
p
10
(t) = p
10
(t) +p
00
(t),
avendo posto per semplicità =
0
e =
1
. Sottraendo la seconda
equazione dalla prima si ottiene
_
p
00
(t) p
10
(t)
_
=
_
+
__
p
00
(t) p
10
(t)
_
e quindi, tenendo conto che p
00
(0) p
10
(0) = 1,
p
00
(t) p
10
(t) = e
(+)t
.
Sostituendo nella prima equazione lespressione calcolata si ottiene
p
00
(t) = e
(+)t
117
e poi integrando con condizione iniziale p
00
(0) = 1
p
00
(t) =

+
+

+
e
(+)t
.
Inne
p
10
(t) =

+

+
e
(+)t
.
Per evidenti ragioni di simmetria valgono anche
p
01
(t) =

+

+
e
(+)t
, p
11
(t) =

+
+

+
e
(+)t
.
Lanalogia con la catena a due stati a tempo discreto è completa se si osserva
che vale
lim
t+
P(t) =
_

+
+
_
.
Per una generale catena di nascita e morte le equazioni allindietro e
allavanti si scrivono rispettivamente cos`
p
ij
(t) = q
i,i1
p
i1,j
(t) +q
ii
p
ij
(t) +q
i,i+1
p
i+1,j
(t)
p
ij
(t) = p
i,j1
(t)q
j1,j
+p
ij
(t)q
jj
+p
i,j+1
(t)q
j+1,j
ovvero
p
ij
(t) =
i
p
i1,j
(t) (
i
+
i
)p
ij
(t) +
i
p
i+1,j
(t)
p
ij
(t) =
j1
p
i,j1
(t) (
j
+
j
)p
ij
(t) +
j+1
p
i,j+1
(t)
qualsiasi siano i, j ricordandosi di porre
1
= 0 e nel caso S sia nito anche
d+1
:= 0.
Si chiamano catene di pura nascita le catene di Markov a tempo continuo
con
i
= 0 qualsiasi sia i e quindi
i
=
i
e p
i,i+1
= 1. Le equazioni di
Kolmogorov si scrivono
p
ij
(t) =
i
p
ij
(t) +
i
p
i+1,j
(t)
p
ij
(t) =
j1
p
i,j1
(t)
j
p
ij
(t)
con le solite convenzioni. Fissati i e t 0, non essendo ammessi salti
allindietro, se è j < i vale p
ij
(t) = 0; dalle equazioni di Kolmogorov si
ricava
p
ii
(t) =
i
p
ii
(t)
e dunque, essendo p
ii
(0) = 1, segue che
p
ii
(t) = e
i
t
;
118
per j > i, p
ij
(t) si calcola ricorsivamente da una delle due equazioni di
Kolmogorov. Infatti utilizzando, per esempio, lequazione allavanti
p
ij
(t) =
j1
t
0
e
j
(ts)
p
i,j1
(s) ds.
Nel caso in cui il tasso di nascita sia costante, ovvero
i
= si ha
p
ii
(t) = e
t
;
p
i,i+1
(t) =
t
0
e
(ts)
e
s
ds = e
t
t
0
ds = te
t
p
i,i+2
(t) =
t
0
e
(ts)
se
s
ds =
2
e
t
t
0
s ds =
_
t
_
2
2
e
t
e per induzione
p
i,i+k
(t) =
_
t
_
k
k!
e
t
.
Una catena di pura nascita con tasso di nascita , uscente dallo zero, ovvero
con
0
(0) = 1, assume valore k al tempo t > 0 con probabilità
t
(k) = p
0k
(t) =
_
t
_
k
k!
e
t
e infatti è un processo di Poisson.
Un esempio di catena di nascita e morte a tempo continuo a valori in N
con tassi lineari è costituito dai processi di ramicazione: sono i processi che
contano il numero di individui di una popolazione in cui: ogni individuo,
dopo un tempo di quiescenza di legge esponenziale di parametro > 0, si
duplica con probabilità p o muore con probabilità 1 p, indipendentemente
dagli altri; nuovi individui si aggiungono alla popolazione seguendo un usso
di Poisson di parametro 0 indipendente dalle altre variabili aleatorie del
processo. Si determinano i parametri dei tempi di permanenza della catena
nei singoli stati. Se la popolazione non ha individui, ovvero il processo è
nello stato 0, arriverà un nuovo individuo dopo un tempo esp() e
quindi
0
= .
Altrimenti se nella popolazione ci sono i 1 individui (numerati), indicati
con
1
,
2
, . . . ,
i
i tempi di quiescenza degli individui e indicato con T
1
il
tempo di primo salto del processo, varrà
T
1
= min(,
1
,
2
, . . . ,
i
)
119
e T
1
esp( + i ) (si ricordi: minimo di esponenziali indipendenti è
esponenziale con parametro la somma dei parametri ) e quindi
i
= +i , i 1.
Non sono ammessi salti di ampiezza maggiore di 1 dal momento che le
v.a. ,
1
,
2
, . . . ,
i
sono v.a. indipendenti con densità e quindi con densità
congiunta (si ricordi: v.a. indipendenti hanno come densità congiunta il
prodotto delle densità e la dierenza di due di esse ha densità).
Si calcolano le probabilità di salto. Vale
p
i,i1
=
P(X(T
1
) = i 1 | X(0) = i) =
P(X(T
1
) = i 1, T
1
= | X(0) = i) =
P(X(T
1
) = i 1 | T
1
= , X(0) = i)P(T
1
= | X(0) = i).
Ora P(X(T
1
) = i 1 | T
1
= , X(0) = i) è la probabilità che, coincidendo
il tempo di primo salto con la ne del tempo di quiescenza di un individuo,
lindividuo muoia e quindi
P(X(T
1
) = i 1 | T
1
= , X(0) = i) = 1 p.
Inoltre
(T
1
= ) =
_
min(
1
,
2
, . . . ,
i
) <
_
e, poiche le v.a. e min(
1
,
2
, . . . ,
i
) sono, condizionatamente a X(0) = i,
indipendenti ed esponenziali rispettivamente di parametro e i, allora
P
_
T
1
= | X(0) = i
_
=
i
+i
(si ricordi: date due esponenziali indipendenti allora, se X esp() e Y
esp(), si ha Y < X con probabilità /( +)). In denitiva
p
i,i1
=
i(1 p)
+i
.
Di conseguenza
p
i,i+1
= 1 p
i,i1
=
+ip
+i
.
I tassi di nascita e morte sono dunque
i
= +ip,
i
= i(1 p).
120
4.4 Code markoviane
Un altro esempio di catene di nascita e morte sono le code markoviane,
ovvero i processi che contano il numero dei clienti allinterno di un servizio,
sia quelli serviti che quelli in attesa di servizio. Qui si considera soltanto il
caso semplicato in cui non vi sia uscita dei clienti se non per ne servizio,
corrispondente allidea che la sala di attesa sia innita, ovvero il buer sia
innito. Si assume che il usso di arrivo dei clienti sia un processo di Poisson
di parametro indipendente dal tempo di servizio ad ogni sportello che si
assume sempre esponenziale di parametro . Nel caso in cui il numero degli
sportelli sia nito, N, la coda si indica con M|M|N, altrimenti la coda si
indica con M|M|. I salti della catena possono essere solo di ampiezza
unitaria, positivi o negativi, dal momento che i tempi esponenziali in gioco
sono v.a. indipendenti con densità.
I tassi di nascita e morte sono lineari nel caso M|M|, in particolare
i
= , i 0
i
= i, i 1
0
= 0.
Per calcolarli si usino le uguaglianze
i
=
i
p
i,i+1
e
i
=
i
p
i,i1
tenendo
presente che
0
= , p
01
= 1 e qualsiasi sia i 1,
i
= i + (per la regola:
il minimo di esponenziali indipendenti ha legge . . . ) e p
i,i+1
= /( + i)
e p
i,i1
= i/( + i) (per la regola: la probabilità che di due v.a. la pi` u
piccola sia una ssata delle due è . . . ).
Nel caso M|M|N, i tassi di nascita e morte si calcolano analogamente e sono
i
= , i 0
i
=
_
i, 1 i N
N, i > N
,
0
= 0.
E ovvio che, avendo stabilito una regola di precedenza per i clienti in attesa
di servizio (per esempio, rst in rst out ovvero lordine di arrivo diven-
ta ordine di servizio), il primo cliente in attesa nel caso inniti sportelli
viene servito subito mentre in questo caso aspetta un tempo esponenziale di
parametro N (si ricordi la perdita di memoria dellesponenziale). Quanto
tempo in media aspetterà il secondo cliente in la?
Si calcola ora la funzione di transizione della coda M|M|. Indicato
con X(t) il processo al tempo t, si osserva che X(t) = Y (t)+Z(t), dove Y (t)
conta il numero dei clienti presenti al tempo 0 e ancora in servizio al tempo
t, mentre Z(t) conta i clienti arrivati in (0, t] e ancora in servizio al tempo
t. Segue luguaglianza tra eventi
_
X(t) = j, X(0) = i
_
=
ij
k=0
_
Y (t) = k, Z(t) = j k, X(0) = i
_
e quindi passando alla probabilità, dopo aver applicato ladditività della
probabilità al secondo membro, dividendo ambo i membri per P(X(0) = i)
121
si ottiene
p
ij
(t) =
ij
k=0
P
_
Y (t) = k, Z(t) = j k | X(0) = i
_
.
Applicando poi lindipendenza dei tempi di servizio e di ingresso segue
p
ij
(t) =
ij
k=0
P
_
Y (t) = k | X(0) = i
_
P(Z(t) = j k | X(0) = i
_
Per quanto riguarda il primo fattore, poichè un cliente presente al tempo 0
è ancora in servizio al tempo t con probabilità e
t
, si ha
P
_
Y (t) = k | X(0) = i
_
=
_
i
k
_
e
kt
(1 e
t
)
ik
.
Per quanto riguarda il secondo fattore, indicata con q
t
la probabilità che un
cliente entrato in coda dopo il tempo 0 sia ancora in servizio al tempo t,
per la formula delle probabilità totali, se N(t) conta tutti i clienti entrati in
coda dopo il tempo iniziale, si ha
P
_
Z(t) = j k | X(0) = i
_
=
njk
_
n
j k
_
q
jk
t
(1 q
t
)
nj+k
P(N(t) = n | X(0) = i) =
njk
_
n
j k
_
q
jk
t
(1 q
t
)
nj+k
(t)
n
n!
e
t
=
q
jk
t
(t)
jk
(j k)!
e
t
njk
_
t(1 q
t
)
_
nj+k
(n j + k)!
=
q
jk
t
(t)
jk
(j k)!
e
q
t
t
Cos` in denitiva
p
ij
(t) =
ij
k=0
_
i
k
_
e
kt
(1 e
t
)
ik
(q
t
t)
jk
(j k)!
e
q
t
t
.
Inoltre, detto tempo di arrivo del generico cliente entrato in coda dopo il
tempo iniziale, si può calcolare q
t
condizionando al valore di cos`
q
t
=
e
(ts)
f
(s) ds.
122
Infatti se = s anchè il cliente resti in coda no al tempo t il suo servizio
deve durare almeno t s e questo avviene con probabilità e
(ts)
. Inne,
poiche si sa che, condizionatamente al numero di arrivi in [0, t] di un Poisson,
i tempi di arrivo sono v.a. uniformi in [0, t], si riscrive
q
t
=
t
0
e
(ts)
1
t
ds =
1 e
t
t
.
Si osservi che
lim
t+
p
ij
(t) =
_
_
j
e
/
j!
poiche i termini corrispondenti a k = 0 si annullano con e
kt
. Dunque
riassumendo si è calcolato lelemento generico della funzione di transizione
p
ij
(t) e si è visto che, indipendentemente da i, per tempi grandi approssima
la densità di Poisson di parametro / calcolata in j. Ricordando che per
una v.a. esponenziale il valore medio coincide con linverso del parametro,
si può riformulare la frase precedente dicendo che la generica riga della fun-
zione di transizione converge alla densità di Poisson di parametro pari al
tasso di ingresso per il valore medio del tempo di servizio. Questo risultato
è generale per le code con inniti sportelli, usso di ingresso Poisson e tempo
di servizio di legge qualsiasi con media nita. In particolare per esempio lo si
è dimostrato come applicazione dello splitting nel caso di tempo di servizio
a due valori.
Si tratta del secondo esempio, dopo quello della catena a due stati, di conver-
genza della funzione di transizione al divergere del tempo ovvero di ciò che,
in analogia con il caso tempo discreto, si denisce comportamento ergodico
delle catene di Markov a tempo continuo.
4.5 Misura invariante
Data su S una dinamica markoviana a tempo continuo Q, in analogia al caso
tempo discreto, una densità di probabilità w su S si dice misura invariante
per Q quando se
0
= w allora vale
t
= w qualsiasi sia t > 0. Quindi,
ricordando che
t
=
0
P(t), w è una misura invariante se e solo se
w = wP(t),
ovvero w è autovettore con autovalore 1 della funzione di transizione in ogni
tempo.
Si dimostra ora che
w = wP(t), t wQ = 0.
Per dimostrare la condizione necessaria basta osservare che derivando a de-
stra e a sinistra la relazione w = wP(t) si ottiene 0 = wP
(t) che calcolata

123
in 0 dà luguaglianza wQ = 0, essendo P
(0) = Q.
Viceversa wQ = 0 implica che
_
wP(t)
_
= 0 qualsiasi sia t e quindi wP(t) =

wP(0) = w. Infatti qualsiasi sia i dallequazione di Kolmogorov allindietro
segue
k
w
k
p
ki
(t) =
k
w
k
j
q
kj
p
ji
(t) =
j
p
ji
(t)
k
w
k
q
kj
,
ma lipotesi dice che
k
w
k
q
kj
= 0 e quindi
k
w
k
p
ki
(t) = 0.
Esiste un legame tra la misura invariante di una dinamica markoviana a
tempo continuo Q e quella della dinamica a tempo discreto in essa contenuta
denita dalla matrice delle probabilità di salto P? Per esempio: lesistenza
nel caso continuo è legata in qualche modo allesistenza nel caso discreto?
E in caso aermativo, le due misure invarianti, w del caso continuo e v del
discreto si scrivono una in termini dellaltra?
Una prima risposta sono le due implicazioni seguenti:
wQ = 0,
j
w
j
j
< +=vP = v, v
i
:=
w
i
j
w
j
j
, i.
v = vP,
j
v
j
j
< +=wQ = 0, w
i
:=
v
i
/
i
j
v
j
/
j
, i.
Si ricava qui soltanto la prima delle due implicazioni. Lipotesi implica che
qualsiasi sia j
k
w
k
q
kj
=
k=j
w
k
q
kj
+w
j
q
jj
= 0
da cui
k=j
w
k
q
kj
= w
j
q
jj
= w
j
j
.
Ricordando la relazione q
kj
=
k
p
kj
vera per k = j, si ricava
k=j
w
k
k
p
kj
= w
j
j
,
ovvero in forma compatta detto v il vettore di componente generica w
k
k
si
ricava
v = vP
ovvero v è autovettore di autovalore 1 per la matrice delle probabilità di
salto P, che è anche matrice di transizione della catena (Z
n
)
n0
. Dividendo
il vettore di componente generica w
k
k
per la somma delle sue componenti
si ottiene una densità invariante per la dinamica a tempo discreto associata
a P.
124
Dal risultato visto immediatamente segue che nel caso S nito per quanto
riguarda esistenza e unicità della misura invariante la dinamica continua Q
e la dinamica discreta associata a P si equivalgono. Inoltre per il caso S
innito con parametri
i
, i = 1, 2 . . . limitati se la dinamica discreta associ-
ata a P è persistente positiva e quindi ha ununica misura invariante allora
anche la dinamica continua Q ammette ununica misura invariante (segue
subito ragionando per assurdo dalla prima delle precedenti implicazioni).
Riferimenti bibliograci
[1] P.Baldi, Calcolo delle probabilità e statistica, Milano : McGraw-Hill,
1992
[2] P.Bremaud, Markov Chains, Gibbs elds, Monte Carlo simulation and
queues, New York : Springer, 1999
[3] P.G.Hoel, S.C.Port, C.J.Stone, Introduction to Stochastic Processes,
Boston: Houghton Miin, c1972
[4] S.M.Ross, Introduction to Probability Models, San Diego [etc.] :
Harcourt Academic Press, 2000
[5] H.C.Tijms, A First Course in Stochastic Models, Wiley, 2003
125

Note CPinf1112 - Antonella Calzolari

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Note CPinf1112 - Antonella Calzolari

Uploaded by

Copyright:

Available Formats

Modelli stocastici a valori discreti

Note del corso di CP per la L.M. in Informatica

(i) `e una variabile estesa, cio`e a valori in N {+}.

(i) k} coincide con levento A

= +. Nel caso transiente invece E

(i) del lemma precedente si trova

(T ) `e la variabile aleatoria che conta il numero dei passaggi per T e si

) P(N(t + t) N(t) = 1) = (t) t +o(t)

) P(N(t + t) N(t) = 0) = 1 (t)t +o(t),

con C > 0 e > 1, dalla relazione

, ricordando il signicato di media e varianza, come

(0) = Q e se i `e assorbente, qualsiasi sia t, p

(0) = Q consente di interpretare gli elementi

(t) che calcolata

= 0 qualsiasi sia t e quindi wP(t) =

You might also like