Professional Documents
Culture Documents
Equazione caratteristica
Molti problemi interessanti in un gran numero di discipline scientifiche si possono ricondurre alla
seguente relazione matriciale
Ax = x
dove A una matrice quadrata, x un vettore non nullo e uno scalare. in cui una trasformata lineare
del vettore x risuta uguale ad un semplice riscaldamento dello stesso vettore x. Di solito, la
moltiplicazione di una matrice per un vettore comporta modifiche importanti nello stesso vettore. Nel
caso per che i cambiamenti si limitino
ad un cambio di scala e/o di orientamento mantenendo inalterate
le componenti del vettore x si parla di x come di autovettore della matrice A e di come autovalore
della matrice A.
Ax x = (A I ) x = 0
Se il determinante della matrice dei coefficienti
A I
nullo allora lunica soluzione possibile x=0, detta banale poich non richiede nessun particolare
sforzo per essere determinata. Se invece il determinante nullo si apre la via a diversi ragionamenti
interessanti.
Ad ogni matrice quadrata A di ordine m associata una funzione polinomiale ottenuta dal
determinante della matrice A a cui sottratta la matrice identit moltiplicata per uno scalare.
a11
a
[A I ]= 21
a m1
a12
a 22
am2
a1m
a 2m
a mm 2
A I = C 0 m + C1m 1 + + C m 1 + C m = 0
Se indichiamo con ti la traccia della potenza i-esima della matrice A e cio
i volte
t i = Tr( A i ) = Tr AAAA
Tr
(
A
)
=
Tr
i volte
A A A
I coefficienti dellequazione caratteristica sono calcolabili dalla relazione con a traccia delle potenze
della matrice.
1
C0 = 1
C3 = (C2 t1 + C1t 2 + t 3 )
3
C1 = t1
1
1
C2 = (C1t1 + t 2 )
Cm = (Cm1t1 + Cm2 t 2 + + C1t m1 + t m )
2
m
Esempio
1 2 0
5 6 4
A = 2 2 2;
A 2 = A A = 6 12 10;
0 2 3
4 10 13
17 30 24
t1 = 1+ 2 + 3 = 6
3
2
A = A A = 30 56 54;
t 2 = 5 + 12 + 13 = 30
24 54 59
t 3 = 17 + 56 + 59 = 132
1
1
C0 = 1; C1 = 6;
C2 = ((6) 6 + 30) = 3; C3 = [( 3) 6 + (6) 30 + 132] = 10
2
3
Ne consegue che lequazione caratteristica
3 6 2 + 3 + 10 = 0
Lequazione caratteristica, come ogni polinomio, pu essere scritta come un prodotto
A
I = ( 1)m ( 1 )( 2 ) ( m )
Le radici dellequazione caratteristica sono gli autovalori di A. Quindi esistono m soluzioni, non
necessariamente reali e/o distinte, rispetto al sistema di equazioni Ax=x.
Esempio
3 1
A =
2 2
3
1
A I =
2
2
A I = 0
(3 )(2 ) 2 = 0 2 5 + 4 = 0
La traccia di una matrice quadrata pari alla somma dei suoi autovalori.
Consideriamo la fattorizzazione dellequazione caratteristica
m m
f ( ) = (1) ( i )
i=1
m-1
c1 = (1)
m1
m1
a = (1) (a
ii
11
m1
tr( A)
i=1
quindi
c1 = (1)
m +1
m
i
e pertanto Tr( A) = i
i=1
i=1
Il determinante di una matrice quadrata coincide con il prodotto dei suoi autovalori
m
A = i
i=1
Esempio
13 4
A =
4 7
13 4
A
I =
7
4
A I = 0
(13 )( 7 ) 16 = 0 2 20 + 75 = 0
Gli autovettori
Molte applicazioni statistiche coinvolgono un insieme di vettori non nulli associati ad una data matrice
ed in particolare ai suoi autovalori. La relazione che interessa la seguente
(A iI) x i = 0
ovvero Ax i = i x i
i = 1,2,,m
(A iI) x i = 0
ha almeno una soluzione non banale se i un autovalore di A. Si verifica subito che c un problema di
univocit. Se xi un autovettore associato a i lo sar anche kxi dove k uno scalare non nullo. Infatti
Ax i = i x i
A kx i = kx i
Ay i = i y i
con y i = kx i
Quindi, ad ogni autovalore sono associati infiniti autovettori che per differiscono tra di loro solo per un
fattore moltiplicativo.
Esempio
3 1
A =
1 = 4
e 2 = 1
2 2
x 0 1 1 x1 0
( A 4I) 1 =
= x1 x 2 = 0 x1 = x 2
x 2 0 2 2 x 2 0
2x1 2x 2 = 0
x1=1 e x2=1 produce (1,1) che un autovettore associato a 1 =4. Allo stesso modo, per 2 =1 si ha
3 1 1 00 2 1 x1 0 2 1 x1 0
1
=
= 2x1 = x1
2
2 2 0 10 2 1x 2 0 2 1 x 2 0
Ne consegue che
1 1
1 2
una matrice formata con degli autovettori associati agli autovalori della matrice A. Naturalmente,
anche la matrice
k
k
1
2
k1 e k 2 0
k 2k
2
2
una matrice di autovettori associati agli autovalori di A. Da notare che gli autovettori cos ottenuti
sono linearmente indipendenti. Infatti, la relazione:
1
1 0
k1 + k 2 =
1
2 0
verificata se e solo se k1=k2=0 il che escluso dalla condizione posta sugli scalari k1 e k2.
Il calcolo degli autovalori e dei corrispondenti autovettori non pu essere basato sulla
determinazione delle radici dellequazione caratteristica che abbiamo utilizzato per matrici (2x2). Infatti,
supponiamo che lequazione caratteristica sia
3 + p2 + q + r = 0
che diventa
3 + a + b = 0
p2
3
2 p 3 9 pq + 27r
b=
27
a=q
(1/3)
Una radice reale 1=(-b/2+d)
+ (-b/2-d) (1/3) e due immaginarie
Tre radici reali di cui almeno due uguali: 1=(-b/2) (1/3) , 2=(b/2) (1/3) , 3=(b/2) (1/3)
Tre radici reali e distinte: 1=2(a/3) 0.5 cos(/3) , 2=2(-a/3) 0.5 cos(/3+2/3) ,
3=2(-a/3)0.5 cos(/3+2/3) dove cos()=-2.59808b/(-a)1.5
Esempio
3 0 2
A = 0 2 0 1 = 5, 2 = 2, 3 = 1
4 4 1
E chiaro che non si pu procedere in questo modo artigianale. Per fortuna sono disponibili diversi
algoritmi di calcolo rapidi ed efficienti che risolvono brillantemente il problema della determinazione
ed autovettori.
industriale degli autovalori
Matrici ortogonali
Una matrice ortogonale se
a) A quadrata; b) A At = I ; c) At A = I
( A B) B t A t = ABB t A t = AA t = I
B t A t AB = B t B = I
allora
Q t = Q 1 Q t Q = I
A At = I = 1
Tuttavia
2
A A t = A A t = A A = 1 A = 1
A = 1 2 ,, m
Matrice di Householder
H = I 2 xx t
con
x0
e xt x = 1
H ortogonale
a1 0
0 a1
A = diag( a1,a2 ,,am ) =
0 0
( a1 )
0
A I =
(a2 )
0
(am )
( am )
0
Lequazione caratteristica
A I = ( ai ) = ( a1 )( a2 ) ( am )
i=1
Quindi gli autovalori della matrice diagonale coincidono con i valori sulla diagonale.
0
ei = 1 dove l imposizione i - esima.
Esempio
7 0 0
A = 0 6 0
0 0 3
1 = 6, 2 = 3, 3 = 7
Au = u
A 1 Au = A1u
u = A1u
1
1
u = A 1u A 1 I u = 0
Si noti anche se un autovettore della matrice A associato a allora anche un autovettore della
matrice A-1 associato a () -1.
Au = u
I + Au = + Iu
(A + I)u = ( + )u
Quindi (+) un autovalore della matrice (A+I) e u che un autovettore di A anche autovettore di
(A+I).
Au = u
Moltiplicando per A entrambi i termini otteniamo
A 2u = k Au A 2u = u = 2 u
Se un autovalore di A allora () p un autovalore di Ap ed A condivide gli autovettori con Ap .
( A I )( B I ) =
A I B I
c) Il determinante di una matrice triangolare (inferiore o superiore) pari al prodotto degli elementi
sulla diagonale.
0 a22
a2m
A=
A = a11a22 amm
0 amm
0
d) Se P una matrice quadrata ed abbiano Q e W lo stesso ordine. Allora
e)
P 0
=PQ
W Q
Quindi
P I
0
= P I Q I
W
Q I
f) Se P e Q sono dello stesso ordine si ha
g)
0 P
=P
I Q
h) scambiando due righe o due colonne non cambia gli autovalori. Infatti il determinante cambia di
segno, ma lequazione caratteristica uguagliata a zero e ci non ha quindi effetto.
Teorema di Hamilton-Cayley
Ogni matrice quadrata soddisfa la sua equazione caratteristica
f ( ) = C0 m + C1m1 + + Cm1 + Cm = 0
Se al posto dello scalare si sostituisce la matrice A e si considerano le corrispondenti potenze di
matrici, si ottiene
C0
C1
m 1
+ +
C m 1
Cm
m +1
m +1
m +1
m +1
i=1
i=1
i=1
m +1
i = 0
i1
i=1
e, pertanto, f(A)x=0.
Sebbene luso comune veda autovettori colonna cio soluzioni che verificano
C 0 m
C1m 1
A =
+ +
C m 1
Cm
t A = t
che in genere sono diversi (a meno che A non sia una matrice simmetrica).
Spettro della matrice A
Linsieme degli autovalori della matrice A anche noto come spettro di A e di solito gli autovalori sono
posti in ordine decrescente di grandezza
1 2 m
In particolare, lautovalore di modulo massimo noto come raggio spettrale di A.
Determinante ed autovalori
Se unautovalore zero allora il determinante della matrice nullo. Infatti
m
A = i = 1 2 m
i=1
e basta che uno solo degli autovalori sia nullo perch si abbia |A|=0. Inoltre, a causa del prodotto, il
determinante risulta molto sensibile ai valori piccoli (cio quelli che in valore assoluto sono inferiori
allunit).
r(A ) min{n,m}
cio A non pu contenere vettori LIN pi di quanto non sia il pi piccolo tra numero di righe n e
numero di colonne m.
r (A) m z (A)
Dove z(A) il numero di autovalori non nulli nella equazione caratteristica della matrice
b) Se A una matrice diagonale allora il suo rango uguale al numero di colonne o righe non nulle.
A = diag( a11,a22 ,,amm ) ; r( A) = m
se
aii 0
i = 1,2,,m
r (C ) min{r (A), r (B )}
perch se una matrice moltiplicata per una matrice non singolare allora il suo rango rimane invariato.
C = Q A
Tuttavia
A = Q1 C
d) Il rango di una matrice pari al numero di autovalori diversi da zero associati alla matrice.
2 1
A =
1 2
2
1
A I =
2
1
A I = 0 2 4 + 3 = 0 1 = 3, 2 = 1
( a11 )
0
A I = 0
a12
(a22 )
0
a1m
a2m
che ancora triangolare
0
(amm )
Poich il determinante della matrice triangolare dato dal prodotto degli elementi sulla diagonale,
avremo
m
i = aii
i = 1,2,,m.
Au = k u ( A k I ) = 0
con u 0
per k=1,2,3. Tale sistema ha un numero di soluzioni linearmente indipendenti (LIN) pari a
m r (A k I )
Le soluzioni si ottengono da
uk = [G ( A k I ) I ] z
Dove G- la cosiddetta inversa generalizzata di (A-kI) e z un vettore arbitrario. In breve, G- soddisfa la
condizione GG-G=G (1 condizione di Moore-Penrose). Possiamo scriverne linversa generalizzata
come
B
C
(A kI) = k k
E
D
Dove Bk non singolare (cio esiste la sua inversa ordinaria) ed ha lo stesso rango di (A-kI).
Effettuiamo adesso la partizione del vettore arbitrario z
z t = [z1 z 2 ]
Bk1 0
(A kI) =
con matrice nulle di dimensioni opportune
0 0
B1 0B
k
uk = k
0 0 D
Ck It
E 0
0 z1
con t = ran(A k I)
Imt z 2
che implica
I
uk = t
0
0 z1
Imt z 2
I
B1
k Ck k
0 0
0 B1C z1 +B k Ck z 2
k k
=
=
z2
0
I z 2
Esempio
2 2 0
A = 2 1 1
7 2 3
1 = 3, 2 = 1,
3 = 4
Per 1 =3 si ha
1 2 0
1 2
0
A 1I = 2 2 1 con B1 =
; C1 =
2 2
1
7 2 6
1 1
B11 =
;
1 1 2
1 1 0
G = 1 1 2 0;
0 0 0
1 1 0
u1 = 1 1 21 = 2
u1 = 1
2
con tutti valori interi.
multipli
Calcolo degli autovettori per autovalori
Se lautovalore k ha molteplicit mk il rango di (A-kI) deve essere stabilito di volta in volta
Esempio
1 2 2
Allautovalore 1 corrisponde
2 2 2
2
u1 =
(2
2) 1 (1 + 2 )
2
=
1
2
2
0 2 2
A 2I = 1 3 1 che ha rango 2.
1 1 1
Posto
si ottiene
0 2
2 t
B2 =
; C2 = ; Z = [Z1 ]
1 3
1
1 3 2 2 2
u2 = 2 1 0 1 =
Dando i valori
(1 = 1, 2 = 0); (1 = 0, 2 = 1), = 1
avremo
1 1 2
U = 1
0 1 che ha U 0 e quindi i tre autovettori sono LIN
0 1 1
Altro esempio
0 1 2
A = 2 3 0
0 4 5
1 1 2
( A 2 I) = 2 2 0
0 4 4
Il rango di questa matrice 2: infatti la 3a riga si ottiene sommando alla 2a la 1a moltiplicata per due.
Se il rango 2, allora esistono 3-ran(A-2 I)=3-2=1 vettori LIN associati a 2 =1. Se definiamo
1 1
2
t
B2 =
; C2 = ; Z = [ Z1 ]
2 2
0
Otteniamo
1 2 12
+
u2 = 4 2 10 =
Per 1 =6 si ha
2
6 1
A 1 I = 2 3 0
0
4 1
che ha pure rango 2 dato che la 3a ottenuta sommando la 2a per (-2) e sommando due.
Definiamo ora:
6 1
2
B1 =
; C1 = ;
2 3
0
3 8
Z = [ Z1 ] otteniamo u1 = 2 8
t
quindi le radici della equazione caratteristica sono tre, ma i vettori LIN ottenibili sono due. Ne consegue
che, se gli autovalori non sono distinti non necessariamente possibile ottenere m autovettori
linearmente
indipendenti.
1, 2 ,, m
Non tutti nulli tali che
i=1
Ottenendo
1u1 [(A 2I)(A 3I) (A mI)] + 2u2 [(A 2I)(A 3I) (A mI)] + +
mum [(A 2I)(A 3I) (A mI)] = 0
Per k 1 gli addendi sono tutti nulli dato che uno dei fattori
k uk (A k I)
= 1 [( A 2 I )( A 3 I ) ( A m1I )]( A m I ) u1 = 0
= 1 [( A 2 I )( A 3 I ) ( A m1I )]( Au1 m u1 ) = 0
= 1 [( A 2 I )( A 3 I ) ( A m1I )]( 1u1 m u1 ) = 0
= 1 [( A 2 I )( A 3 I ) ( A m1I )]1 ( 1 m ) = 0
e che si riduce a
1 ( 1 2 )( 1 3 ) ( 1 m )u1 = 0
Poich gli autovalori sono distinti ci implica che 1=0. Lo stesso si pu dire per gli altri coefficienti i
1, 2 ,, p
tali che
p
mi = m
i=1
r(A
k I) = n m k (A k I)u k ha m ( m m k ) = m k soluzioni LIN.
Per dimostrare che autovettori in gruppi diversi siano LIN supponiamo che non lo siano. In particolare
supponiamo che uk associato a k sia una combinazione lineare degli autovettori z1,z2,,zp associati a
h h=1,2,,p
con hk. In breve si ipotizza che
p
Allora
mk
mk
mk
Auk = i Azi h uk = i k zi = k i zi
i=1
i=1
i=1
Necessit. Ci equivale
a dimostrare che se U-1 AU=D esiste, allora si ha ran(A-k I)=m-r . Sia D la
matrice diagonale formata con gli m autovalori della matrice A. Ne consegue che (D-k I) ha
esattamente mk zeri sulla diagonale e cio tanti quanto la molteplicit di k . Quindi ran(D-k I)=m- mk
Poich esiste U-1 AU=D ne consegue che A=UD-1U e quindi
(A k I) = (UDU1 k I) = U [D k I]U1
e poich ran(D-k I)=m- mk, lo stesso sar per A-kI perch il rango rimane invariato se la matrice
moltiplicata per matrici non singolari.
In generale quindi, se ci sono autovalori ripetuti diversi da zero, siamo sicuri che il rango della matrice
originaria non compromesso, ma il rango della matrice formata con gli autovettori sar pieno solo se
gli autovalori sono distinti oppure, se ripetuti, si verifica la condizione posta allinizio del paragrafo.
per k = 1,2,,m
1 0 0
0 2 0
A [u1u2 um ]
ovvero AU = UD
0 0 m
D = diag( 1, 2 ,, m )
Esempio
1 2 2
A = 1 2 1 E.C.
1 1 0
( 1)( 2 1) = 0
Con
1 1 2
1 = 1, 2 = 1, 3 = 1, e, ad esempio, U = 1 0 1
0 1 1
1 2 2 1 1 2 1 1 2
AU = 1 2 1 1 0 1 = 1 0 1
1 1 0 0 1 1 0 1 1
1 1 2 1 0 0 1 1 2
UD = 1 0 1 0 1 0 = 1 0 1
0 1 1 0 0 1 0 1 1
U1 AU = D
Se la relazione sul rango non verificata per qualche k allora A deficitaria e U -1 non esiste. Ci
pu succedere per solo in caso di autovalori ripetuti.
U 1 AU = D U 1 A U dato che A B = A B
poich U 1 = 1 U U 1 AU = U 1 A U = A e quindi A = D
b) A e D hanno la stessa equazione caratteristica e quindi gli stessi autovalori. Il converso per non
vero: P e Q possono avere gli stessi autovalori (e quindi lo stesso determinante) ma non necessariamente
risulteranno simili nel senso prima descritto. Le due matrici
1 0
1 2
P =
; Q =
0 1
0 1
hanno gli stessi autovalori 1=1 e 2=1, ma per ogni qualunque matrice non singolare C si ha C-1 PC=I.
dato che P=I e quindi non esiste una matrice U tale che U-1 PU=Q
Matrici simmetriche
Le matrici simmetriche hanno alcune propriet interessanti rispetto ad autovalori e autovettori che
conviene studiarle separatamente. Una matrice quadrata A simmetrica quando identica alla sua
trasposta
A = At
aij = a ji
i = 1,2,,m;
j = 1,2,,m
a) Se gli elementi di A sono reali ed A simmetrica allora le radici dellequazione caratteristica sono
pure reali.
b) Tutte le matrici simmetriche sono diagonalizzabili e cio esiste U-1 tale che
A = UDU 1
D = diag( 1, 2 ,, m )
2 uT2 u1 = 1uT2 u1
e dato che 1 2 lidentit possibile solo se
1 2 m
allora
x t Ax
1 t m
xx
linearpende indipendenti ortogonali associati agli autovalori di A, singoli o mltipli che siano. Daltra
parte, se u1 e u2 sono autovettori associati a 1 e 2 e cio
u1t u2 = ut2u1 = 0
Possiamo trasformare i due vettori in modo che la loro norma euclidea sia unitaria
1
u+1 = t u1;
u1 u1
1
1
1
t
u+2 = t u2 ; (u+i ) u+i = t uti ui t = 1
u2u2
ui ui
ui ui
A = QDQ t con
Esempio
Q t Q = QQ t = I
1 2 2
A = 2 1 2; 1 = 5, 2 = 1, 3 = 1
2 2 1
(1 + 2 )
2 2 2
u
2 2 e quindi u2 = 1
1 = ; A 2I = 2
= u3
2
2 2 2
2 2
1 2 0
0
U = 1 1 1 Q =
2 1 3
6
1 1 1
3
2 1
a j a tj
j=1
cio la somma dei prodotti esterni delle colonne di A. Come noto il prodotto esterno o prodotto
vettoriale di due vettori conformabili determina una matrice.
2
2
2
4 0 6
t
u = 4 ; v = 0 uv = 4 [2 0 3] = 8 0 12
1
3
1
2 0 3
Il prodotto di due matrici pu essere realizzato utilizzando il prodotto esterno dei loro vettori
r1
r2
AB = [c1 c1 c m ] = c1 r1t + c 2r2t + c m rmt
rm
Sia ora U la matrice ortogonale usata nella diagonalizzazione di A con UtU=I. Quindi
m
I = u j utj
j=1
Au j uTj
j=1
=A
j u j utj = A
j=1
Che nota come la scomposizione spettrale di A. Tale formula si applica anche alle potenze di A.
A P = Pj u j uTj
f) Gli autovalori di una matrice simmetrica sono tutti non-negativi se e solo se la matrice non negativa
definita cio x t Ax 0 per ogni x e questo si dimostra con la similitudine a D.
x = 0 x T Ax = 0.
Alcune di esse sono per nulle solo se x=0.
Esempio
2 2 1
A = 2 5 1 ; x T Ax = [ x1
1 1 2
x2
2 2 1 x1
x 3 ] 2 5 1 x 2
1 1 2 x 3
2
x t Ax = 2x12 + 5x 22 + 2x 32 + 4 x1 x 2 + 2x1 x 3 + 2x 2 x 3 = ( x1 2x 2 ) + ( x1 + x 3 ) + ( x 2 + x 3 )
che maggiore di zero a meno che x1=x2=x3=0. Altre forme quadratiche sono nulle anche per x0.
Esempio
37 2 24
A = 2 13 3 ; x t Ax = [ x1
24 3 17
x2
37 2 24 x1
x 3 ] 2 13 3 x 2
24 3 17 x 3
2
Che risulta
nulla per x=[2 1 3].
Le forme quadratiche si dicono:
positive defnite se
x T Ax > 0
x 0
positive semidefinite
x T Ax 0
x 0 e x T Ax = 0
per qualche x 0
Le ultime due categorie sono indicate congiuntamente con il termine di forme quadratiche non negative
definite.
y = (Qt )1 x
allora
y T Ay 0 yQ T y 0
c) Le matrici non negative definite ammettono la scomposizione: A=QQt con Q reale e rango pieno di
colonna inoltre, se A positiva definita Q non singolare. Unimportante conseguenza che
m
x T Ax = x i x j uij
i=1 j=1
m
= y i2
per y = Qt x
i=1
d) Se X una matrice con elementi reali allora (XtX) simmetrica e non negativa definita. Inoltre se X
ha rango pieno allora (XtX) positiva definita.
37 2 24
( i )
Ne consegue che gli autovettori danno la direzione dei semiassi della ellissoide attraverso il coseno e gli
autovalori ne danno la lunghezza. La massima eccentricit data dal coefficiente di condizionamento: