You are on page 1of 284

Note

Metodi geometrici per la fisica matematica


Anno Accademico 2007-2008

S. Cacciatori

B. van Geemen

versione 07.0

INDICE

Indice
1 Algebra multilineare
5
1.1 Tensori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Tensori in fisica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3 Lalgebra esterna. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2 Rappresentazioni di gruppi finiti
2.1 Teoria generale . . . . . . . . . .
2.2 Caratteri . . . . . . . . . . . . . .
2.3 Le classi di coniugio di Sm . . . .
2.4 Le rappresentazioni irriducibili del

.
.
.
.

28
28
30
36
39

3 Tensori e gruppo simmetrico


3.1 Introduzione e risultati generali . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 I funtori di Schur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 Esempi: T 3 V e T 4 V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

45
45
48
53

4 Geometria differenziale
4.1 Richiami di analisi. . . . . . . . . .
4.2 Variet`a differenziabili . . . . . . . .
4.3 Spazi e fibrati tangenti . . . . . . .
4.4 Forme differenziali. . . . . . . . . .
4.5 Geometria differenziale e meccanica

.
.
.
.
.

58
58
58
63
69
74

.
.
.
.
.

.
.
.
.
.

83
83
88
90
93
97

.
.
.
.

101
. 101
. 109
. 110
. 115

.
.
.
.

117
. 117
. 119
. 124
. 129

. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
gruppo simmetrico

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

5 Gruppi e algebre di Lie


5.1 Gruppi di Lie . . . . . . . . . . . . . . . . . . . . . . .
5.2 Algebre di Lie semplici . . . . . . . . . . . . . . . . . .
5.3 Rappresentazioni di algebre di Lie semplici . . . . . . .
5.4 Le rappresentazioni irriducibili dellalgebra di Lie sl(2)
5.5 Rappresentazioni di sl(2). . . . . . . . . . . . . . . . .
6 La classificazione delle algebre di Lie semisemplici
6.1 Lalgebra di Cartan e i pesi. . . . . . . . . . . . . .
6.2 Sistemi di radici e diagrammi di Dynkin . . . . . .
6.3 Diagrammi di Dynkin . . . . . . . . . . . . . . . . .
6.4 Algebre di Lie semplici reali . . . . . . . . . . . . .

.
.
.
.

7 Rappresentazioni di algebre di Lie semplici


7.1 Pesi: integralit`a e simmetria . . . . . . . . . . . . . .
7.2 Il peso massimale di una rappresentazione irriducibile
7.3 Le rappresentazioni irriducibili di sl(n) . . . . . . . .
7.4 Le rappresentazioni irriducibili di sl(3) . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.

INDICE

8 Gruppi ortogonali
8.1 Forme bilineari simmetriche e forme
8.2 Esempi di gruppi ortogonali . . . .
8.3 Quaternioni. . . . . . . . . . . . . .
8.4 Il gruppo ortogonale SO(2m) . . .
8.5 Il gruppo ortogonale SO(2m + 1)

quadratiche
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

137
. 137
. 139
. 143
. 145
. 149

9 Rappresentazioni di Spin
152
9.1 Lalgebra di Clifford . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
9.2 Lalgebra di Clifford e il gruppo spinoriale. . . . . . . . . . . . . . . . . . . . . . 155
9.3 Le rappresentazioni spinoriali di so(n). . . . . . . . . . . . . . . . . . . . . . . . 160
10 Strutture geometriche
10.1 Fibrati . . . . . . . . . . . . . . .
10.2 Geometria e gruppi di Lie . . . .
10.3 Connessioni . . . . . . . . . . . .
10.4 Derivate covarianti (connessioni di
10.5 Curvature . . . . . . . . . . . . .
10.6 Strutture Riemanniane . . . . . .
11 Teoria dinamica delle simmetrie.
11.1 Campi di materia. . . . . . . . .
11.2 Campi di gauge. . . . . . . . . .
11.3 Teorie di Yang-Mills. . . . . . .
11.4 Simmetrie esterne e relativit`a. .

.
.
.
.

. . . . .
. . . . .
. . . . .
Koszul)
. . . . .
. . . . .

.
.
.
.

.
.
.
.

12 Campi scalari e spinoriali.


12.1 Le particelle e il gruppo di Poincare.
12.2 Equazione di Klein-Gordon. . . . . .
12.3 Equazione di Dirac. . . . . . . . . . .
12.4 Il gruppo SO(1, 3) . . . . . . . . . .
12.5 Campi di spin 1. . . . . . . . . . . .
12.6 Campi e gravit`a (cenni). . . . . . . .

.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

13 Geometria del Modello Standard e GUT.


13.1 I campi del modello standard. . . . . . . . . . . . . . . .
13.2 Costruzione del Modello Standard. . . . . . . . . . . . .
13.3 La massa dei neutrini. . . . . . . . . . . . . . . . . . . .
13.3.1 Il meccanismo dellaltalena (Seesaw mechanism). .
13.4 Teorie GUT (cenni). . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

166
. 166
. 174
. 178
. 185
. 191
. 193

.
.
.
.

207
. 207
. 210
. 214
. 217

.
.
.
.
.
.

224
. 224
. 229
. 231
. 236
. 242
. 242

.
.
.
.
.

245
. 245
. 250
. 256
. 257
. 258

INDICE
14 Le rappresentazioni dellalgebre di Lie sl(3)
14.1 Lalgebra di Lie sl(3). . . . . . . . . . . . . . . . . . .
14.2 Pesi: integralit`a e simmetria . . . . . . . . . . . . . .
14.3 Il peso massimale di una rappresentazione irriducibile
14.4 Le rappresentazioni irriducibili di sl(3) . . . . . . . .
14.5 La forma di Killing per sl(3). . . . . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

263
. 263
. 269
. 272
. 275
. 277

1 ALGEBRA MULTILINEARE

Algebra multilineare

Testi consigliati: [A], [MB].

1.1

Tensori

1.1.1 Lo spazio duale. Sia V uno spazio vettoriale reale di dimensione n. Scelta una
base e1 , . . . , en di V ogni x V si scrive in modo unico come combinazione lineare x =
x1 e1 + . . . + xn en con xi R. In questo modo si ottiene un isomorfismo

x1

=
V Rn ,
x = (x1 , x2 , . . . , xn ) = ... .
xn
Lo spazio duale V di V `e lo spazio vettoriale reale delle applicazioni R-lineari da V a R:
V := HomR (V, R) = {l : V R, l R-lineare}.
Si ricordi che per l, m V e , R lelemento l + m dello spazio vettoriale V `e definito
da:
(l + m)(x) := l(x) + m(x)
(x V ).
Poiche `e lineare, l `e determinata dalle l(ei ) R:

x1

l(x) = l(x1 e1 + . . . + xn en ) = x1 l(e1 ) + . . . + xn l(en ) = (l(e1 ) ; l(e2 ) ; . . . ; l(en )) ... .


xn
Data la base ei , l si identifica con unapplicazione lineare Rn R che `e data da una matrice,
ancora indicata con l, con una sola riga e n colonne i cui coefficienti sono le immagini dei vettori
di base: l = (a1 ; a2 ; . . . ; an ) con ai := l(ei ).
1.1.2 La base duale. Data la base ei di V , si ottiene in modo canonico una base 1 , . . . , n
di V , detta la base duale, che `e definita da:
X
j : V R,
j (
xi ei ) = xj
cio`e j (ei ) = ij dove `e la di Kronecker: ij = 0 se i 6= j e ij = 1 se i = j. Si noti che
1 = (1 0 . . . 0),. . .,n = (0 0 . . . 1).
1.1.3 Lapplicazione duale. Dati gli spazi vettoriali V, W , di dimensione n e r rispettivamente, abbiamo definito i loro spazi duali V , W . Adesso consideriamo unapplicazione lineare
f : V W . Essa induce unapplicazione lineare
f : W V ,

m 7 m f,

1 ALGEBRA MULTILINEARE

cio`e, se m : W R `e lineare, definiamo f m V con (f m)(v) := m(f (v)). L applicazione


f `e detta applicazione duale di f oppure applicazione aggiunta.
Sia A la matrice di f : V W e M = (m1 . . . mr ) la matrice di m : W
= Rr R rispetto
alle basi ei , fj di V e W rispettivamente. Siccome m(f (x)) = M Ax, troviamo che la matrice
di f (m) `e M A.
P

La base duale j di W d`a un isomorfismo W


= Rr , e lelemento m =
j m j j W
corrisponde al vettore (m1 , . . . , mr ) che `e t M , una matrice con r righe e una sola colonna. Se
usiamo la base duale delle ei come base di V , la matrice di f `e allora t A perche t (M A) = t At M .
Quindi se f : V W `e dato da una matrice A, allora, rispetto alle base duale f : W V
`e dato dalla matrice t A.
1.1.4 Motivazione. Per motivare il prodotto tensoriale tra due spazi vettoriali, consideriamo
lo spazio delle applicazioni lineari V W dove anche W `e uno spazio vettoriale su R di
dimensione finita, dim W = m. Data una base f1 , . . . , fm di W e una f HomR (V, W ) sia
f (ej ) =

m
X

aij fi

(f HomR (V, W ))

i=1

cio`e la matrice (aij ) `e la matrice determinata da f . Sfruttando il fatto che j (x) = xj si ha:
X
X
X
X
f (x) = f (
xj ej ) =
xj f (ej ) =
j (x)f (ej ) =
aij j (x)fi .
j

i,j

Perci`o f `e una combinazione lineare delle applicazioni lineari x 7 j (x)fi . Questo si vede anche
facilmente utilizzando il prodotto matriciale, per esempio:


 
 
 
 
a11 a12
1
1
0
0
= a11
(1 0) + a12
(0 1) + a21
(1 0) + a22
(0 1).
a21 a22
0
0
1
1
(Si noti che il vettore ei V `e identificato con lapplicazione lineare R V che manda in
ei .) Quindi, in un certo senso, Hom(V, W ) `e un prodotto degli spazi vettoriali V e W ; ogni
elemento f Hom(V, W ) `e una combinazione lineare di prodotti di elementi di V e di W . Si
veda 1.1.9 per definizioni precise.
1.1.5 Il prodotto tensoriale. Dati gli spazi vettoriali reali V, W di dimensione rispettivamente n e m, definiamo uno spazio vettoriale reale V W di dimensione nm, il prodotto
tensoriale di V e W . Gli elementi di V W sono combinazioni R-lineari di tensori puri v w
con v V, w W . Vogliamo che siano valide le solite regole per un prodotto:
(v1 + v2 ) w = v1 w + v2 w,
v (w1 + w2 ) = v w1 + v w2 ,
a(v w) = (av) w = v (aw).
Per ottenere lo spazio vettoriale pi`
u grande possibile nel quale valgono queste regole,
consideriamo lo spazio vettoriale F (V, W ) che ha come base tutte le coppie (v, w) con v

1 ALGEBRA MULTILINEARE

V, w W . In particolare, se V o W non `e lo spazio {0}, F (V,P


W ) ha dimensione infinita!
<
Un elemento f F (V, W ) si scrive, in modo unico, come f =
ri (vi , wi ) dove ri R
i
e (vi , wi ) V W sono coppie distinte. In F (V, W ) consideriamo il sottospazio vettoriale
R(V, W ) generato dai seguenti elementi di F (V, W ):
(v1 + v2 , w) (v1 , w) (v2 , w),
(v, w1 + w2 ) (v, w1 ) (v, w2 ),
a(v, w) (av, w),
a(v, w) (v, aw),
dove v1 , v2 V , w1 , w2 W ed a R.
Definiamo il prodotto tensoriale di V e W , denotato con V W , come lo spazio quoziente:
V W := F (V, W )/R(V, W ),

con v w := (v, w) = (v, w) + R(V, W ),

cio`e, ogni elemento t V W `e una classe laterale: t = f + R(V, W ) per un certo f F (V, W ),
che di solito indicheremo con t = f , e v w `e la classe laterale definita da (v, w) F (V, W ).
Si ricordi che f = g se e solo se f g R(V, W ). Le operazioni in un spazio quoziente sono
f + g = f + g e f = f . Siccome f = 0 per ogni f R(V, W ), otteniamo per esempio:
0 = (v1 + v2 , w) (v1 , w) (v2 , w)
= (v1 + v2 , w) (v1 , w) (v2 , w)
= (v1 + v2 ) w (v1 w) (v2 w),
quindi, se scriviamo 0 = 0 V W , vediamo che vale la prima regola. Nello stesso modo si
verificano le altre regole. Poiche abbiamo imposto su F (V, W ) soltanto le relazioni di R(V, W ),
V W `e lo spazio pi`
u grande nel quale queste valgono.
1.1.6 Una
tensoriale. Siano ei e fj basi di V e W rispettivamente.
P base del prodotto
P
Dato v = i vi ei V e w = j wj fj W abbiamo, usando le regole qui sopra:
P
v w = ( i vi ei ) w
P
=
i (vi ei ) w
P
P
=
i vi (ei (
j wj fj ))
= ...
P
=
i,j vi wj (ei fj ).
Ogni elemento di F (v, w) `e una combinazione lineare delle coppie (v, w), quindi ogni elemento
di V W = F (V, W )/R(V, W ) `e una combinazione delle v w. Come appena mostrato, ogni
v w `e combinazione lineare dei ea fb con a = 1, . . . , n e b = 1, . . . , m. Quindi ogni elemento

1 ALGEBRA MULTILINEARE

di V W `e combinazione lineare degli nm elementi ea fb , in particolare dim V W nm =


(dim V )(dim W ). Per mostrare che si ha l uguaglianza, sfruttiamo lapplicazione lineare
a,b : F (V, W ) R,

(v, w) 7 va wb

(si ricordi che i (v, w) sono una base di F (V, W )). Si verifica che a,b (R(V, W )) = 0, quindi
a,b d`a unapplicazione ben definita a,b : V W R. Limmagine di ei fj `e zero tranne se
i = a, j = b e perci`o gli ei fj sono indipendenti e sono quindi una base di V W . Concludiamo
che
dim V W = (dim V )(dim W ),
V W = i,j Rei fj .
1.1.7 Applicazioni bilineari e prodotto tensoriale. Il prodotto tensoriale di due spazi
vettoriali `e definito come un quoziente. Perci`o per definire unapplicazione lineare f : V W
U , dove U `e uno spazio vettoriale, bisogna sempre verificare che sia ben definita, cio`e, bisogna
prima definire unapplicazione f : F (V, W ) U che soddisfi le condizioni f(R(V, W )) = 0 e
f((v, w)) = f (v w), come abbiamo fatto per la applicazione f = a,b con f = a,b in 1.1.6.
Adesso daremo un criterio pi`
u facile che garantisce che f sia ben definita e, in pi`
u, otterremo
una descrizione di tutte le applicazioni lineari V W U .
Unapplicazione

(v1 + v2 , w) = (v1 , w) + (v2 , w),
: V W U,
tale che
(v, w1 + w2 ) = (v, w1 ) + (v, w2 )
per ogni , R, v, v1 , v2 V e w, w1 , w2 W `e detta bilineare.
Sia dunque : V W U unapplicazione bilineare, allora definiamo unapplicazione
lineare
: F (V, W ) U,

((v,
w)) := (v, w).

Siccome `e bilineare, abbiamo che (R(V,


W )) = 0, per esempio vale:
1 + v2 , w) (v1 , w) (v2 , w)) =
((v
=
=

1 + v2 , w)) ((v
1 , w)) ((v
2 , w))
((v
(v1 + v2 , w)) (v1 , w) (v2 , w)
0

definisce unapplicazione lineare (ben


perche (v1 + v2 , w) = (v1 , w) + (v2 , w). Perci`o
definita)
: V W U,
v w 7 (v, w).
ricordando soltanto che:
A questo punto si potrebbe dimenticare lapplicazione
ogni applicazione bilineare : V W U definisce unapplicazione lineare : V W U
tale che (v w) = (v, w).
Viceversa, `e facile verificare, usando le regole per date in 1.1.5, che lapplicazione (detta
applicazione bilineare universale)
B : V W V W,

(v, w) 7 v w

1 ALGEBRA MULTILINEARE

`e bilineare. In pi`
u, si verifica che la composizione dellapplicazione bilineare B con ogni applicazione lineare f : V W U `e unapplicazione bilineare := f B : V W U . Poiche
(v, w) = f (B(v, w)) = f (v w) concludiamo che f `e lapplicazione lineare definita da come
sopra, cio`e f = .
Risulta che abbiamo verificato:
1.1.8 Propriet`
a universale del prodotto tensoriale. Sia B lapplicazione bilineare universale V W V W , B(v, w) := v w. Allora per ogni spazio vettoriale reale U di
dimensione finita e per ogni applicazione bilineare : V W U esiste ununica applicazione
lineare : V W U tale che il diagramma
B

V W V W

.
U
sia commutativo, ovvero risulti: = B.
1.1.9 Esempio: applicazioni lineari. Riprendiamo lesempio motivante 1.1.4. Si verifica
che la applicazione
: V W HomR (V, W ),

(l , w) 7 [x 7 l(x)w]

`e bilineare. Perci`o otteniamo unapplicazione lineare

: V W HomR (V, W ),

l w 7 [x 7 l(x)w]

(l V , w W, x V ).

Usando le basi i e fj di V e W `e facile vedere che `e iniettiva. Poiche dim V W =


dim HomR (V, W ), concludiamo che `e un isomorfismo:

: V W HomR (V, W )
1.1.10 Esempio: applicazioni bilineari. Linsieme Bil(V, W ) delle applicazioni bilineari
V W R `e uno spazio vettoriale con le operazioni:
( + )(v, w) := (v, w) + (v, w),

()(v, w) := (v, w),

per , Bil(V, W ), v V, w W e R.
Se ei , fj sono basi di V e W e se `e bilineare, abbiamo:
X
X
X
(
xi ei ,
yj fj ) =
xi yj (ei , fj ),
i

quindi unapplicazione bilineare `e determinata dalle immagini delle coppie (ei , fj ) V W .


In particolare, otteniamo un isomorfismo di spazi vettoriali reali Bil(V, W )
= Mn,m (R) dove

1 ALGEBRA MULTILINEARE

10

Mn,m (R) `e lo spazio vettoriale delle matrici reali con n righe e m colonne. Segue che
dim Bil(V, W ) = (dim V )(dim W ). Si noti che se M = ((ei , fj )) `e la matrice determinata
da , allora
(x, y) = t xM y,
(M = ((ei , fj )) Mn,m (R)).
Il fatto che xi = i (x) e yj = j (y), dove j W `e la base duale delle fj , suggerisce il
seguente risultato.
La propriet`a universale del prodotto tensoriale mostra che l applicazione bilineare
V W Bil(V, W ),

(l, m) 7 [(x, y) 7 l(x)m(y)]

induce unapplicazione lineare


: V W Bil(V, W ),

l m 7 [(x, y) 7 l(x)m(y)].

E facile vedere (per esempio usando le basi) che questa applicazione `e iniettiva e siccome
dim(V W ) = dim Bil(V, W ) otteniamo che

: V W Bil(V, W ).
Un altro modo di ottenere queso risultato `e di osservare che in 1.1.7 abbiamo mostrato che

Bil(V, W ) Hom(V W, R),

7 .

Siccome Hom(V W, R) = (V W ) , lo spazio duale, basta verificare che (V W )


= V W .
Per questo si pu`o usare l applicazione bilineare
V W (V W ) ,

(l, m) 7 [(x y) 7 l(x)m(y)],

lasciamo i dettagli come esercizio.


1.1.11 Funtorialit`
a del prodotto tensoriale. Consideriamo le applicazioni lineari f : V1
V2 e g : W1 W2 tra spazi vettoriali reali di dimensione finita. E facile vedere che
V1 W1 V2 W2 ,

(v1 , w1 ) 7 f (v1 ) g(w1 )

`e unapplicazione bilineare che induce perci`o unapplicazione lineare, indicata con f g:


f g : V1 W1 V2 W2 ,

v1 w1 7 f (v1 ) g(w1 ).

Osserviamo lisomorfismo evidente:


(V W ) U
= V (W U ),

(v w) u 7 v (w u),

che ci permette di scrivere semplicemente V W U per entrambi questi spazi.


1.1.12 La rappresentazione controgradiente. Sia V uno spazio vettoriale di dimensione
finita. Il gruppo GL(V ) delle applicazioni lineari invertibili agisce su V : A(Bx) = (AB)x

1 ALGEBRA MULTILINEARE

11

per x V . Per A GL(V ) e l V , lo spazio duale, abbiamo definito lapplicazione duale


(A l)(x) = l(Ax) (vedi 1.1.3). Si noti che questa non d`a unazione di GL(V ) su V :
(A (B l))(x) = (B l)(Ax) = l(BAx),

invece ((AB) l)(x) = l(ABx);

Poiche in generale AB 6= BA, non vale in generale A (B l) = (AB) l. Per questo motivo
definiamo per A GL(V ):
A : V V ,

l 7 [x 7 (Al)(x) := l(A1 x)],

(A GL(V ), l V , x V ).

Ora si ha una azione di GL(V ) su V perche:


(A(Bl))(x) = (Bl)(A1 x) = l(B 1 A1 x) = l((AB)1 x) = ((AB)l)(x)
per ogni A, B GL(V ), l V e x V . Si noti che lazione `e tramite applicazioni lineari: A(l + m) = Al + Am. Abbiamo quindi ottenuto un omomorfismo di gruppi, detto
rappresentazione controgradiente
GL(V ) GL(V ),

A 7 [l 7 Al]

(A GL(V ), l V ).

Osserviamo che con questa defizione di Al si ha:


(Al)(Ax) = l(A1 Ax) = l(x),
cio`e, il valore della trasformata della forma lineare nel trasformato del punto `e il valore della
forma lineare nel punto.
Come visto in 1.1.3, se A : V V `e dato dalla matrice, indicata ancora con A, rispetto
a una base di V , allora rispetto alla base duale di V la mappa indotta V V `e data dalla
matrice t A. Quindi la rappresentazione controgradiente
GL(V ) GL(V ),

A 7 A := t A1 .

1.1.13 Azione di GL(V ) su Tmn (V ). Per un intero k Z0 definiamo uno spazio vettoriale:
T 0 (V ) = R,

T 1 (V ) = V,

T k (V ) = V n := |V V
{z. . . V},
k

e poi, per interi n, m Z0 definiamo:


Tmn (V ) := T n (V ) T m (V ),
si noti che T n (V ) T 0 (V ) = T n (V ) R
= T n (V ) usando la applicazione (v1 . . . vn ) 7
(v1 . . . vn ). Similmente Tm0 (V )
= T m (V ).
Per A GL(V ) definiamo unapplicazione:
A = nm (A) : Tmn (V ) Tmn (V )

1 ALGEBRA MULTILINEARE

12

x1 x2 . . . . . . xn l1 . . . lm 7 (Ax1 ) (Ax2 ) . . . (Axn ) (Al1 ) . . . (Alm ).


Non `e difficile vedere che nm (AB) = nm (A)nm (B), cio`e che GL(V ) agisce su Tmn , e che nm (A)
`e unapplicazione lineare su Tmn . Quindi otteniamo un omomorfismo di gruppi
nm : GL(V ) GL(Tmn (V )).
Sia ei , 1 i n, una base di V . Si pu`o mostrare che se M Hom(V, V ) = V V = T11 `e
data dalla matrice M = (mij ) Mn (R), allora lazione di A GL(V ) su M `e data da:
A M = AM A1

(A GL(V ), M T11 (V )).

Invece, se consideriamo unapplicazione bilineare Bil(V, V )


= V V = T20 (V ), data da
una matrice M = (mij ) Mn (R), allora lazione di A GL(V ) su M `e dato da:
A M = t A1 M A1 ,

(A GL(V ), M T20 (V )).

(Si noti che lazione di A GL(V ) su Bil(V, V ) `e dato da (A)(x, y) = (A1 x, A1 y) e


che (x, y) = t xM y).
1.1.14 La complessificazione di uno spazio vettoriale reale. Sia V uno spazio vettoriale
reale. Definiamo uno spazio vettoriale complesso VC con unapplicazione iniettiva R-lineare
V , VC tale che VC = V iV , cio`e, ogni elemente di VC si scrive, in modo unico, come somma
v1 + iv2 con v1 , v2 V . Nel caso che V = Rn , troviamo VC = Cn e linclusione Rn , Cn `e
quella standard.
La definizione di VC `e data da:
VC := V R C
dove C `e visto come spazio vettoriale di dimensione due su R. In particolare, VC `e uno spazio
vettoriale reale di dimensione 2 dim V . Per definire lazione di C su VC (cio`e il prodotto di un
scalare t C con un vettore w VC ) osserviamo che, per ogni t C, lapplicazione
t : V C VC ,

(v, t) 7 v (tz)

`e R-bilineare e quindi definisce unapplicazione R-lineare t : VC VC , v z 7 v (tz).


Lazione di C su VC `e allora definito da t (v z) := v (tz). E facile verificare che in questo
modo VC `e uno spazio vettoriale complesso. In pi`
u, lapplicazione
V VC ,

v 7 v 1

`e R-lineare e, poich`e
v (x + iy) = (v x) + (v (iy)) = (xv) 1 + (yv) i

(x, y R),

si ha VC = V iV dove, per definizione della struttura di spazio vettoriale complesso su VC ,


iV = {v i : v V }.

1 ALGEBRA MULTILINEARE

13

Una propriet`a importante di VC `e che ogni applicazione R-lineare A : V V definisce


unapplicazione C-lineare
AC : VC VC ,

AC (v z) := (Av) z

(A HomR (V, V )),

come si verifica facilmente usando lapplicazione R-bilineare V C VC , (v, z) 7 (Av) z.


Nel caso V W , dove W `e uno spazio vettoriale complesso, si ottiene unapplicazione Clineare VC W dato da v z zv (dove il prodotto zv `e preso nel spazio vettoriale complesso
W ). Un esempio interessante `e il caso dove
V := {X W = Mn (C) : t X + X = 0 }.
Si noti che V `e un sottospazio vettoriale reale di W , ma non un sottospazio vettoriale complesso
(se X 6= 0 e t X = X allora t iX = it X = +iX 6= iX, quindi iX 6 V ). Questo argomento
mostra in realt`a che V iV = {0} e quindi, calcolando dimensioni (oppure vedi 6.4.3), si ha
W = V + iV e perci`o VC
= W.

1.2

Tensori in fisica

Gli elementi dello spazio vettoriale Tmn (V ) si chiamano tensori di rango r = n + m, con n indici
controvarianti ed m indici covarianti o anche tensori di tipo (n, m). In particolare i tensori di
tipo (1, 0) sono i vettori di V detti anche vettori controvarianti, mentre i tensori di tipo (0, 1)
vengono chiamati covettori o vettori covarianti. Le nozioni di covarianza e controvarianza sono
direttamente riconducibili al modo in cui GL(V ) agisce su Tmn (V ). Vogliamo per`o soffermarci a
illustrarle da un punto di vista meno astratto, in maniera tale da rendere evidente limportanza
dei tensori in fisica e contemporaneamente giustificare le notazioni usualmente adottate.
1.2.1 Vettori, indici in alto e controvarianza. In prima approssimazione per un fisico
una grandezza vettoriale `e una quantit`a specificata da una intensit`a (o modulo), una direzione
e un verso. Per esempio il vettore posizione, o la velocit`a di una particella in un determinato
istante, o la forza che un corpo esercita su di un altro e cos` via. Per specificare un tale vettore
o eseguirne una misura `e necessario introdurre un sistema di riferimento, che corrisponde alla
scelta di una base ordinata {~e1 , ~e2 , ~e3 } dello spazio vettoriale V in cui il vettore, diciamo ~v ,
vive. Dunque
~v = v 1~e1 + v 2~e2 + v 3~e3 ,
e la misura consister`a nella determinazione delle componenti del vettore, cio`e i coefficienti v i .
Si noti che abbiamo scritto gli indici come apici. Questo `e un fatto puramente convenzionale
che `e per`o universalmente adottato e come vedremo permette di semplificare le notazioni. A
questo punto si pu`o essere tentati di identificare il vettore ~v con la terna delle sue componenti
1
v

v2 .
v=
v3

1 ALGEBRA MULTILINEARE

14

Tale identificazione risulta essere inappropriata dato che mentre il vettore ~v prescinde dalla
scelta di una base, v non ha alcun significato senza tale base. E se infatti si decide di cambiare
base, il vettore ~v rester`a invariato, mentre le sue componenti ~v cambieranno ansse. Infatti
supponiamo di introdurre la nuova base {~e1 , ~e2 , ~e3 } legata alla precedente dalla matrice M =
{Mi j } da
3
X
~ei =
Mi j ~ej .
j=1

Rispetto a questa base le nuove componenti v saranno tali per cui


~v = v1~e1 + v2~e2 + v3~e3 ,
e quindi
X

v i~ei =

vj~ej =

vj Mj k~ek ,

j,k

da cui
vi =

vj Mj i .

In forma matriciale questa relazione pu`o essere scritta come


T

dove

v =T v M ,

indica la trasposizione, mentre 0 0 `e lusuale prodotto matriciale. In conclusione


v =T M 1 v ,

ovvero: se la base {~ei } viene cambiata con la matrice M , allora le componenti di un vettore
si trasformano con linversa della matrice trasposta. In pratica si trasformano al contrario
per compensare il cambiamento di base in modo da lasciare invariato ~v . Questo giustifica
il termine controvariante. Se vogliamo identificare un vettore con le sue componenti, allora
dobbiamo tenere presente che queste si trasformano controvariantemente rispetto ad un cam` chiaro che tali ragionamenti non dipendono dalla dimensione dello
biamento di riferimento. E
spazio vettoriale.
Si cominci anche ad osservare una prima comodit`a della scelta sulle posizioni degli indici in
alto o in basso: nel cambiamento di base, si somma lindice in alto della matrice con quello in
basso della base, per dare una seconda base che ancora `e indicizzata da un pedice. Ecco perche
il corrispondente indice di riga della matrice `e un pedice.
P
Viceversa, nel cambiamento delle componenti, espresso dalla relazione v i = j vj Mj i , si somma
lindice in basso della matrice con quello in alto delle componenti, per dare altre componenti
che secondo le convenzioni scelte devono ancora avere lindice in alto. Questo mostra la coerenza delle convenzioni. Scegliamo infine di adottare una ulteriore semplificazione, suggerita da
Einstein e nota appunto come convenzione di Einstein: ogni volta che un indice in alto ed
uno in basso compaiono ripetuti, `e sottintesa una sommatoria sugli stessi. Per esempio potremo
scrivere le relazioni precedenti come
~v = v i~ei , ~ei = Mi j ~ej , v i = vj Mj i ,

1 ALGEBRA MULTILINEARE

15

e cos via. In questa sezione dora in poi adotteremo questa convenzione.


Mettiamo infine in evidenza il seguente fatto: quando si identifica un vettore con le sue componenti, talvolta si dice erroneamente che il vettore `e descritto da 3 (nel caso tridimensionle)
scalari. Tuttavia uno scalare `e una grandezza che non dipende dalla scelta del sistema di
riferimento, come pu`o essere la temperatura in un punto dato. Questa osservazione dovrebbe
ulteriormente chiarire la possibile ambiguit`a che pu`o portare lidentificazione di un vettore con
le sue componenti. Se da una parte il formalismo in componenti ha un significato pratico, dato
che esse rappresentano le quantita da misurare in un dato riferimento, daltra parte si intuisce la necessit`a di un formalismo indipendente dai riferimenti per catturare quelle propriet`a
intrinseche che prescindano dalla scelta di un riferimento.
1.2.2 Covettori, indici in basso e covarianza. I covettori sono gli elementi dello spazio
duale V . Indichiamo con w il generico covettore. Esso sar`a completamente specificato dalla
sua valutazione su una base {~ei } di V : wi = w(~ei ). Infatti possiamo scrivere w = wi i dove i
e la base di V canonicamente associata alla base di V , come mostrato nelle sezioni precedenti.
Ne segue immediatamente che le componenti wi di w si trasformano con la stessa matrice con
cui si effettua il cambiamento di base:
wi = w(Mi j ~ej ) = Mi j wj .
Ecco perche i covettori vengono detti vettori controvarianti, e secondo le convenzioni introdotte
le loro componenti si indicano con un pedice. Lasciamo come esercizio quello di verificare che
in effetti la base canonica si trasforma con la matrice inversa trasposta, mostrando quindi la
completa coerenza delle notazioni.
Si noti anche che w(~v ) = wi v i .
n
1.2.3 Tensori in Tm
(V ) e componenti. A questo punto `e chiaro quale debba essere la
notazione in componenti di un tensore x Tmn (V ). Scriveremo cio`e le sue componenti come
n
xji11...i
...jm tenendo conto che se si effettua un cambiamento di base

~ei = Mi j ~ej ,
le componenti diventano
...hn
k1
n
.
xij11...i
. . . Mjn km (T M 1 )i1 h1 . . . (T M 1 )in hn xhk11...k
...jm = Mj1
m

Lasciamo come esercizio la dimostrazione di questo fatto, nonche la riformulazione in termini


di azione del gruppo GL(V ).
1.2.4 Una convenzione alternativa. In casi pi`
u generali `e conveniente utilizzare una
notazione leggermente differente da quella indicata nel paragrafo precedente, valida ad esempio
in casi di spazi vettoriali su corpi non abeliani anziche su campi. In tal caso occorrer`a distinguere
ad esempio tra campi vettoriali destri e campi vettoriali sinistri. Se K `e il corpo degli scalari,
posto s : (K, V ) V , diremo che lo spazio vettoriale V `e destro se
s(a, s(b, v)) = s(ba, v) ,

a, b K , v V ,

1 ALGEBRA MULTILINEARE

16

mentre diremo che `e sinistro se


s(a, s(b, v)) = s(ab, v) ,

a, b K , v V ,

cio`e come se gli scalari moltiplicassero da destra, s(a, v) = va, nel primo caso e da sinistra,
s(a, v) = av, nel secondo caso. Si noti che se uno spazio vettoriale `e destro allora il suo duale V
`e uno spazio vettoriale1 sinistro e viceversa. Per fissare le idee, secondo le convenzioni comuni,
supponiamo che V sia destro. Sia ~e1 , . . . , ~en una base di V , che disporremo in un vettoreriga ~e := (~e1 , . . . , ~en ). Il generico vettore ~v V avr`a perci`o componenti in K che scriveremo
convenientemente in un vettore-colonna v Kn in modo da utilizzare il prodotto riga per
colonna2 nella scrittura
v
X
~v =
~ei v i = ~e v .
i=1

Si verifica facilmente che, fissata la base ~e un endomorfismo lineare di V `e rappresentato da


una matrice n n con coefficienti in K, che moltiplica con lusuale prodotto riga per colonna i
vettori-colonna v che rappresentano i punti di V in Kn .
Consideriamo ora il duale V e sia h , i : V V K la valutazione dei funzionali sui vettori,
che trasforma in modo naturale lazione destra degli scalari su V nellazione a sinistra su V . Sia
~1 , . . . ,~n la base duale canonica definita da h~i , ~ej i = ji , dove la delta di Kronecker `e costruita
con lo zero e lunit`a in K. Conviene allora disporre i vettori della base in un vettore-colonna
1
~
.

 =
.
.
~n
in modo che la definizione della base diventa h, ~ei = I mentre ~e  = idV , essendo I la matrice
di componenti ji .
Ne segue che nella base fissata un covettore ~v V sar`a individuato da un vettore riga v =
(v1 , . . . , vn ) Kn in modo tale che ~v = v . In particolare se ~v = v  V e w
~ = ~e w V
allora si ottiene h~v , wi
~ = v w,
lusuale prodotto riga per colonna! Sia inoltre A End(V ) ed
A lapplicazione duale definita da hA~v , wi
~ := h~v , Awi.
~ Ne segue che se A `e rappresentato da
una matrice M M at(n, K) tale che w 7 w,
allora A `e rappresentato dalla stessa matrice
M che per`o agisce a destra: v 7 v M . Si noti che solo dopo trasposizione, che trasforma
i vettori riga in vettori colonna, loperatore aggiunto viene allora rappresentato dalla matrice
trasposta che per`o agisce a sinistra. Questo perche essenzialmente la trasposizione corrisponde
allesplicitazione dellisomorfismo (non naturale) tra V e V che quindi trasforma unazione
destra in sinistra e viceversa. Tuttavia tale isomorfismo `e conveniente solo nel caso degli spazi
vettoriali su un campo cosicch`e non vi `e nessuna differenza tra azione destra ed azione sinistra.
qui continuiamo a limitarci al caso di spazi finito dimensionali e V `e lo spazio dei funzionali lineari su V
a valori in K
2
che dora in poi indicheremo con un punto
1

1 ALGEBRA MULTILINEARE

17

In generale invece `e conveniente mantenere evidente la caratteristica di spazio sinistro per V


(se V `e destro) e ci`o giustifica le notazioni qui introdotte.
In queste notazioni un cambiamento di base sar`a definito da una matrice M GL(n, K) tale
= ~e M . La condizione di indipendenza di un vettore dalla base `e espressa dunque dalla
che ~e
v ovvero
relazione ~v = ~e v = ~e
~e
v = ~e v = ~e (M M 1 ) v = (~e M ) (M 1 v) = ~e
(M 1 v) ,
cosicche v = M 1 v: se la base trasforma con la matrice M (a destra) allora le componenti
del vettore trasformano con la matrice M 1 (a sinistra).
Lasciamo come esercizio la determinazione di simili proposizioni nel caso dei covettori e dei
tensori in generale, nonch`e il confronto dettagliato con le formule ottenute nei paragrafi precedenti.
Mentre nel presente capitolo continueremo ad usare le notazioni precedenti, queste convenzioni
verranno adottate nel capitolo 10 riguardante i fibrati differenziali.
1.2.5 Il tensore metrico e labbassamento ed innalzamento degli indici. Su uno spazio
vettoriale V finitodimensionale e reale, `e sempre possibile introdurre un tensore metrico, cio`e
una forma bilineare non degenere g Bil(V, V ). Nondegenere significa che se fissiamo ~v V e
~ V allora ~v = ~0. Se g(~v , ~v ) 0 , ~v V , si dice che la metrica
si ha che g(~v , w)
~ = 0 , W
`e definita positiva o Euclidea. Lasciamo come esercizio la verifica del fatto che in tal caso
g(~v , ~v ) = 0 implica ~v = ~0. Similmente una metrica g si dir`a definita negativa se g `e definita
positiva. Nei restanti casi si parler`a di metrica Lorentziana con data segnatura. In ogni caso
vediamo che il tensore metrico `e dunque un tensore simmetrico in V V .
Esso definisce una corrispondenza biunivoca : V V , ~v 7 (~v ), dove (~v )(w)
~ := g(~v , w).
~
Si verifica immediatamente che si tratta infatti di un isomorfismo lineare, basti usare il fatto
che g `e nondegenere3 . In componenti si ha
vi = gij v j ,
dove vi sono le componenti del covettore (~v ), notazione piuttosto naturale dato lisomorfismo.
Viceversa, dato un covettore w, si indicano con wi le componenti del vettore 1 (w). Se con g ij
indichiamo le componenti della matrice inversa alla gij (si dimostri che g ij sono le componenti
di un tensore simmetrico controvariante di grado 2), allora si ha
wi = g ij wj .
Le operazioni appena viste vengono anche chiamate abbassamento ed innalzamento dellindice.
Esse possono essere estese in maniera ovvia a tensori di rango qualunque. Cos` ad esempio
Tij = gik T k j = gjk Ti k = gik gjl T kl .
Si noti in generale limportanza della posizione degli indici alzati ed abbassati: in generale T i j
e Tj i , ad esempio, non saranno affatto uguali.
3

In particolare dunque in generale tale isomorfismo non richiede nemmeno che g sia simmetrico.

1 ALGEBRA MULTILINEARE

18

Si noti infine che nel caso di una metrica euclidea `e sempre possibile scegliere una base in cui
gij = ij , essendo ij lusuale simbolo di Kronecker.
1.2.6 Esempi di tensori in fisica. Abbiamo gi`a parlato di esempi di vettori in fisica, come
la velocit`a, la forza, eccetera, che individuano tensori di tipo (1, 0). Cos` potremo anche dire
che una quantit`a scalare, come ad esempio la temperatura, `e un tensore di tipo (0, 0). Per
vedere come i tensori prolificano in fisica, vediamo ulteriori esempi di grandezze fisiche di natura tensoriale.
La costante dielettrica.
Consideriamo una sostanza materiale immersa in un campo elettrico. Dal punto di vista microscopico accade che le molecole componenti il materiale subiranno leffetto del campo elettrico
eventualmente deformandosi ed orientandosi secondo le coercizioni imposte dal campo e dalla
struttura stessa del materiale (cristallina o meno). Per contro, le molecole deformate generano allora un campo (microscopico) che si somma al campo esterno modificando cos` il campo
complessivo nella regione occupata dalla sostanza materiale.
Dal punto di vista macroscopico ci`o verr`a descritto in termini di un campo di induzione elettrica
~ che dipender`a sia dal campo elettrico esterno E,
~ sia dalla natura precisa della sostanza S
D
stessa
~ = E(E,
~ S) .
D
~ 0 := E(~0, S) sia sia differente da zero.
In particolare per alcune sostanze pu`o accadere che D
Si dice allora che S `e un materiale piezoelettrico. La maggior parte delle sostanze non sono
~ 0 = ~0. Per tali sostanze, se il campo elettrico nella regione in cui sono
piezoelettriche sicche D
~ Qualora
situate `e abbastanza debole, linduzione elettrica dipender`a linearmente dal campo E.
le correzioni nonlineari non entrino in gioco praticamente mai la sostanza in considerazione viene
detta mezzo lineare o anche mezzo normale. I materiali per cui invece le correzioni nonlineari
non sono essenzialmente mai trascurabili si dicono mezzi nonlineari.
Supponiamo dunque di disporre di un mezzo normale e concentriamoci su un punto fissato.
In tal caso allora E definisce una mappa lineare E : R3 R3 che, per quanto osservato nel
paragrafo 1.1.9, sar`a rappresentata da un tensore  V V , detto tensore di permettivit`a
dielettrica. Qui abbiamo posto R3 =: V . Poiche in generale tale tensore dipender`a dal punto
considerato, in generale la permettivit`a dielettrica definisce in realt`a un campo tensoriale sul
mezzo normale4 . Se non si ha alcuna dipendenza dal punto, si dice che il mezzo normale `e un
dielettrico omogeneo. In componenti potremo scrivere
Di =  i j E j ,
dove ovunque `e stata omessa la dipendenza esplicita dal punto p.
Osserviamo che se gij sono le componenti della metrica spaziale (euclidea) nel dato punto p, allora si pu`o ivi descrivere la permeabilit`a dielettrica tramite il tensore completamente covariante
ij ottenuto abbassando lindice controvariante. Si pu`o allora dimostrare, tramite un semplice
argomento di termodinamica, che quest ultimo tensore deve necessariamente essere simmetrico.
4

Il concetto di campo tensoriale richiede lintroduzione di strumenti matematici pi`


u raffinati e verr`a descritto
in maniera precisa nel capitolo successivo.

1 ALGEBRA MULTILINEARE

19

Nel caso in cui il mezzo sia omogeneo allora il tensore  non dipende dal punto. Se invece il
mezzo `e isotropo le sue componenti non devono restare invariate qualunque sia la rotazione che
si compia nel cambiare riferimento. Poiche, a meno di costanti moltiplicative, lunico tensore
a due indici invariante per rotazione `e i j , si ha che in tal caso deve essere i j = i j . Se il
mezzo `e anche omogeneo, il dielettrico `e allora unicamente caratterizzato da uno scalare , detto
costante dielettrica.
Una trattazione del tutto analoga pu`o essere fatta per il campo magnetico.
Il tensore degli sforzi e la pressione.
Un altro esempio riguarda lo studio delle propriet`a meccaniche dei mezzi continui. Se ad esempio ci si accinge a deformare un corpo solido che si trovava allequilibrio, esso si opporr`a a
tale azione tramite delle forze interne che tenderanno a mantenerlo (o riportarlo) nello stato di
equilibrio. Tali forze interne vengono dette sforzi.
Se il corpo solido preso in considerazione non `e ad esempio fatto di materiale piezzoelettrico,
cio`e se le deformazioni non generano campi elettrici (o magnetici) macroscopici allinterno del
mezzo, allora gli sforzi saranno dovuti univocamente alle inerazioni tra le molecole adiacenti.
Dal punto di vista macroscopico, essendo tali interazioni di breve range, le varie parti del corpo
solido appariranno interagire solamente per mezzo delle superfici che li delimitano. Pertanto su
una porzione di volume V delimitato dalla superficie S = V la forza esercitata dalle restanti
parti del corpo sar`a esprimibile nella forma5
I
i
ij nj dS
F =
S

essendo ~n(p) la normale uscente alla superficie S nel punto p. E chiaro che allora ij (p) `e un
tensore di secondo grado definito in ogni punto p del corpo: esso `e detto tensore degli sforzi.
ij
come
In particolare tramite il teorema di Stockes si pu`o interpretare la divergenza f i =
xj
la forza per unit`a di volume subita dal corpo nel dato punto ad effetto della deformazione.
Pi`
u precisamente per definizione gli sforzi interni sono descritti dalla reazione del corpo alla
deformazione, ovvero da f i .
Se xi rappresenta il vettore posizione del punto p rispetto ad un origine O, possiamo interpretare
la quantit`a mij = f i xj f j xi come il momento di torsione per unit`a di volume subito nel punto
p a causa della deformazione6 . Se si integra sul volume V esplicitando lespressione di f~ e
utilizzando nuovamente il teorema di Stockes, si ottiene unespressione per il momento angolare
totale agente sul volume V dato
I
Z
ij
ik j
jk i
M = ( x x )nk dS + ( ij ji )dV .
S

In generale accade che, benche abbiamo introdotto il concetto di forze volumetriche f i , tale
momento debba essere ragionevolmente attribuito esclusivamente alle forze di contatto sulla
superficie, sicche lintegrale di volume deve essere nullo qualunque sia il volumetto considerato.
5

si noti lindice covariante per il versore ~n normale alla superficie: quando si calcola il flusso di un campo ~v
vettoriale attraverso una superficie occorre determinare punto per punto il prodotto scalare ~v ~n = v i nj gij = v i nj
6
per la precisione questo `e il duale di Hodge del momento angolare, si veda pi`
u avanti

1 ALGEBRA MULTILINEARE

20

Pertanto genericamente si ha che il tensore degli sforzi `e un tensore simmetrico.


Pu`o tuttavia accadere che in casi eccezionali il momento angolare subisca anche un contributo
dovuto ad esempio alla contorsione della struttura microscopica del mezzo. In questo caso la
seconda equazione cardinale della meccanica non `e pi`
u conseguenza della prima e il termine di
volume non `e pi`
u nullo. In questo caso il vettore
1
Si := ijk jk ,
2
pu`o essere interpretato come uno spin classico del mezzo continuo. Benche si sia finora ragionato in termini di corpi solidi, gli stessi ragionamenti possono essere ripetuti, con le stesse
conclusioni, nel caso di corpi fluidi (liquidi e gassosi). In effetti liquidi dotati di spin classico
sono noti ai chimici industriali e vengono utilizzati ad esempio per la realizzazione di propellenti
per razzi.
Nel caso di mezzi isotropi, analogamente al tensore di permettivit`a dielettrica, il tensore degli
sforzi dovr`a allora essere della forma ij = p ij . Il coefficiente di proporzionalit`a p `e la pressione.
Vettori assiali e vettori polari.
Vi sono grandezze per la cui descrizione il concetto di vettore inteso intuitivamente come oggetto descritto da una intensit`a, una direzione ed un verso `e solo convenzionale e viene a dipendere
nei dettagli dallosservatore. Per chiarire questo punto consideriamo ad esempio il caso immaginario di una sferetta che ruota su s`e stessa con velocita angolare . Supponiamo di voler
attribuire un vettore alla velocit`a angolare, che ne specifichi sia lasse di rotazione che il senso
di rotazione. Per stabilire tale vettore specifichiamo un sistema di riferimento cartesiano inerziale sinistrorso con origine nel centro della sfera ed asse z sovrapposto allasse di rotazione.
Decidiamo dunque di attribuire alla velocit`a angolare il vettore di coordinate (0, 0, ) se la
rotazione va dallasse x allasse y e con segno opposto nel caso contrario. Questo stabilir`a un
ben preciso vettore che secondo il nostro riferimento (~e1 , ~e2 , ~e3 ) si scriver`a
~ = ~e3 . Si noti che
il risultato per
~ non dipende da quale dei due poli della sfera sia scelto come punto di uscita
dellasse z.
Supponiamo ora di voler risolvere lo stesso problema con le stesse convenzioni ma scegliendo
stavolta un sistema (~e0x , ~e0y , ~e0z ) destrorso anziche uno sinistrorso. Il risultato ovvio e che deter` chiaro che nessuna delle due determinazioni `e privilegiata
mineremo un vettore
~ 0 = ~ . E
ed entrambi i vettori vanno ugualmente bene per specificare la velocit`a angolare della sferetta.
Ciascuno di essi `e ben definito una volta che si specifichi un sistema di riferimento orientato e
non dipende dal sistema di riferimento purche si considerino solo riferimenti con lo stesso orientamento. Per dare un significato assoluto (cio`e completamente indipendente dal riferimento) al
vettore velocit`a angolare, `e necessario unificare le due convenzioni, richiedendo che si trasformi in 0 quando si passi da un sistema sinistrorso ad uno destrorso. Ci`o significa che
~ non
pu`o essere trattato come un usuale vettore ma piuttosto occorre considerare la coppia {~ , },
essendo lorientamento scelto. I vettori con questa proprit`a si chiamano vettori assiali per
distinguerli dagli usuali vettori che vengono invece chiamati vettori polari.
Si lascia come esercizio la verifica del fatto che il prodotto vettoriale tra due vettori polari `e un
vettore polare, mentre quello tra un vettore assiale ed uno polare `e invece un vettore polare. In

1 ALGEBRA MULTILINEARE

21

particolare si ha dunque che il campo elettrico pu`o essere rappresentato da un vettore polare
mentre quello magnetico sar`a un vettore assiale.
Tensori rispetto ad un gruppo di trasformazioni.
Largomento del precedente esempio suggerisce una generalizzazione molto utile in fisica. Possiamo infatti dire che i vettori assiali si comportano come usuali tensori controvarianti di grado
1 se consideriamo solo trasformazioni di riferimento che conservano lorientamento. Pi`
u in
generale possiamo pensare a tensori che si comportano come tali solamente se si prende in considerazione un determinato gruppo G di trasformazioni. Sia cio`e V uno spazio vettoriale che
sia lo spazio supporto di una rappresentazione del gruppo G.7 Diremo allora che Ti1 ,...,im j1 ,...,jn
sono le componenti di un tensore di tipo (m, n) rispetto al gruppo G (nella rappresentazione )
se trasformano nel modo corretto sotto una trasformazione di base indotta dalle applicazioni
lineari del tipo (g) : V V , al variare di g G.
Per capire limportanza di questo concetto in fisica vediamo alcuni esempi.
Un primo semplice esempio `e il vettore velocit`a che si comporta esattamente come un vettore rispetto al gruppo delle rotazioni ma non certamente rispetto al gruppo di trasformazioni
di Galilei. I vettori forza ed accelerazione restano tali anche rispetto al gruppo di Galilei,
mentre non lo sono rispetto al gruppo di Lorentz: rispetto ad esso si comportano solamente
come componenti spaziali di un tetravettore. In generale i tetravettori si comportano come tali
rispetto a trasformazioni tra sistemi di riferimento inerziali. Ad esempio la tetra-accelerazione
non trasforma correttamente se si passa da un sistema inerziale ad uno non inerziale. I campi
elettrico e magnetico si comportano come vettori (polare ed assiale) rispetto al gruppo delle
rotazioni mentre rispetto al gruppo di Lorentz si comportano come le componenti di un tensore
antisimmetrico controvariante di secondo grado (il tensore di Faraday).
Questi esempi e molti altri mostrano che in fisica `e sovente indispensabile specificare il gruppo
di trasformazioni rispetto al quale le grandezze in gioco si comportano effettivamente come tensori. Il carattere tensoriale di una grandezza fisica dipende in tal senso dal contesto specifico.
Leggi tensoriali in fisica.
Osserviamo per concludere quale sia limportanza di formulare le leggi fisiche sotto forma tensoriale. Il punto chiave `e che se le componenti di un tensore sono nulle in un determinato
riferimento, allora lo sono in qualunque riferimento. Quindi se `e possibile scrivere una legge
fisica nella forma
Ti1 ,...,im j1 ,...,jn = 0 ,
in un dato riferimento, allora essa `e universale nel senso che mantiene la stessa forma in
qualunque altro sistema di riferimento. Ci`o `e conseguenza del fatto che se Ti1 ,...,im j1 ,...,jn sono le
componenti del tensore T , il quale non dipende dalle coordinate, allora la legge fisica assume
la forma T = 0, chiaramente indipendente dalla scelta di ogni sistema di riferimento. Cos`
ad esempio la legge di Newton F i = mai ha la forma invariante F~ = m~a che ne evidenzia
la natura tensoriale rispetto al gruppo di Galilei. Tale legge non `e per`o invariante rispetto al
gruppo di Lorentz, mentre lo sono le equazioni di Maxwell. In una descrizione coerente della
fisica `e opportuno che le leggi fisiche siano tutte della stessa natura, cosicche diventa necessario
modificare le equazioni di Newton affinch`e possano essere anchesse scritte in termini di tensori
7

si veda il capitolo dedicato ai gruppi di Lie

1 ALGEBRA MULTILINEARE

22

Lorentziani. Naturalmente si potrebbe pensare invece che sia necessario cambiare le equazioni
di Maxwell per renderle Galilei-covarianti. Tuttavia la prima soluzione risulta essere quella
corretta, anzitutto dal punto di vista sperimentale. Vi sono inoltre degli evidenti motivi di
principio che portano alla stessa conclusione: essendo i sistemi galileiani una situazione limite
di quelli lorentziani `e pi`
u naturale pensare che i tensori rispetto al gruppo di Galilei compaiano
solo in tali situazioni limite.

1.3

Lalgebra esterna.

1.3.1 Il prodotto esterno. Sia V uno spazio vettoriale reale di dimensione n. Definiamo un
sottospazio I2 di V V con:
I2 := hv v : v V i.
Si noti che per u, v V :
(u + v) (u + v) = u u + v v + u v + v u,
quindi u v + v u = (u + v) (u + v) u u v v I2 per ogni u, v I2 .
Il prodotto esterno di V `e lo spazio quoziente
2 V := V V /I2

con u v := u v = u v + I2 .

Visto che v v I2 , si ha v v + I2 = I2 , quindi


v v = 0,

u v = v u

perche u v + v u I2 .
P
P
Se ei `e una base di V e u = ui ei , v = vj ej , allora:
X
X
X
uv =(
ui ei ) (
vj ej ) =
ui vj (ei ej ) =

(ui vj uj vi )(ei ej ).

1i<jn

quindi gli ei ej con i < j generano 2 V . Per vedere se sono indipendenti, definiamo per gli
interi a, b con 1 a < b n unapplicazione bilineare
a,b : V V R,

(u, v) 7 ua vb ub va .

Quindi a,b definisce unapplicazione lineare a,b : V V R. Si noti che a,b (v v) =


va vb vb va = 0, quindi a,b (I2 ) = 0. Perci`o a,b definisce unapplicazione lineare
a,b : 2 V R,

a,b (u v) = ua vb ub va .

Siccome a,b (ei ej ) = 0 tranne se {i, j} = {a, b} segue che gli ei ej , i < j sono una base di
2 V , quindi
dim 2 V = (n2 ) = n(n 1)/2,
2 V = i<j Rei ej .

1 ALGEBRA MULTILINEARE

23

In modo simile a quanto visto in 1.1.7, si pu`o considere applicazioni bilineari alternanti, cio`e
applicazioni bilineari
: V V R,

t.c. (u, v) = (v, u)

(u, v V ).

Si mostra che Hom(V V, R) = Bilalt (V V, R) (c.f. 1.1.8) dove Bilalt (V V, R) `e lo spazio


vettoriale reale delle applicazioni bilineari alternanti. Per esempio, a,b Bilalt (V V, R) qui
sopra corrisponde a a,b Hom(V V, R).
Finalmente osserviamo che per u = (u1 , u2 ), v = (v1 , v2 ) R2 si ha:

 



u1
v1
u1 v1
uv =

= det(u, v)e1 e2 ,
dove (u, v) :=
.
u2
v2
u2 v2
1.3.2 Il k-esimo prodotto esterno. Per ogni intero k 3 definiamo il sottospazio Ik di
T k (V ) nel modo seguente:
Ik = Ik1 V V Ik1

( T k (V )).

In particolare, per k = 3 si ha:


I3 = hu u v, u v v : u, v V i.
In generale, se un tensore puro t = v1 v2 . . . vk T k (V ) soddisfa vi = vi+1 per un certo
i, allora t Ik .
Il k-esimo prodotto esterno di V `e lo spazio vettoriale
k V := T k (V )/Ik ,

v1 v2 . . . vk := v1 v2 . . . vk + Ik .

Poiche v1 v2 . . . vi vi+1 . . . vk = 0 se vi = vi+1 troviamo, come in 1.3.1, che


v1 v2 . . . vi vi+1 . . . vk = v1 v2 . . . vi+1 vi . . . vk
per ogni vi V . Ogni permutazione di {1, . . . , n} `e un prodotto di trasposizioni del tipo
(i i + 1), quindi otteniamo che:
v1 v2 . . . vi vi+1 . . . vk = ()v(1) v(2) . . . v(i) v(i+1) . . . v(k)
per ogni Sk , dove Sk `e il gruppo simmetrico, e ogni vi V , dove () `e il segno della
permutazione .
Sfruttando il fatto che applicazioni multilineari in k variabili, cio`e lineari in ogni variabile,
ed alternanti, cio`e :
: V k R,

(v1 , . . . , vi , . . . , vk ) = ()(v(1) , . . . , v(i) , . . . , v(k) )

definiscono applicazioni k V R si mostra che una base di k V `e data dagli:


eI := ei1 ei2 . . . eik ,

dove I = {i1 , . . . , ik } {1, . . . , n}

1 ALGEBRA MULTILINEARE

24

e i1 < i2 < . . . < ik . In particolare


dim k V = (nk )

se 0 k n,

k V = 0 se k > n.

Se dim V = n si ha, usando il fatto che il determinante di una matrice `e R-lineare in ogni
colonna ed `e alternante, che
v1 v2 . . . vn = det(v1 , . . . , vn )(e1 e2 . . . en ),
dove ei `e una base di V e

(v1 , . . . , vn ) =

(v1 )1 (v2 )1 . . . (vn )1


(v1 )2 (v2 )2 . . . (vn )2

..
..
..
..
.
.
.
.
(v1 )n (v2 )n . . . (vn )n

dove vj =

n
X

(vj )i ei .

i=1

1.3.3 Lalgebra esterna. Per uno spazio vettoriale reale V di dimensione finita definiamo
k
T (V ) =
k=0 T (V )

dove T k (V ) `e definito in 1.1.13. Lo spazio vettoriale T (V ), di dimensione infinita se V 6= {0},


ha un prodotto naturale (anche se banale). Per tensori puri si definisce:
( T k+l (V )).
P
Si
i s i , t =
P estende poi questo prodotto in modo R-bilineare a tutto T (V ). Quindi se s =
j tj T (V ) con si , tj tensori puri, definiamo
X
X
X
st=(
i s i ) (
j tj ) =
ui vj (si tj ).

(u1 u2 . . . uk ) (v1 v2 . . . vl ) := u1 u2 . . . uk v1 v2 . . . vl

Con questo prodotto T (V ) diventa una R-algebra, cio`e uno spazio vettoriale reale con un
prodotto R-bilineare. Sia
I = I2 I3 . . . Ik . . . =
i=k Ik ,
con Ik come in 1.3.2. Allora lo sottospazio reale I `e un ideale bilaterale dellalgebra T (V ), cio`e
per t T (V ) e s I si ha s t I e t s I, come segue facilmente dalla definizione di Ik .
Questo implica che lalgebra quoziente, chiamata lalgebra esterna,
V := T (V )/I = R V 2 V . . . n V,
`e una R-algebra con prodotto indotto da . Tale prodotto si indica con :
(u1 u2 . . . uk ) (v1 v2 . . . vl ) := u1 u2 . . . uk v1 v2 . . . vl

( k+l V ).

1 ALGEBRA MULTILINEARE

25

Si verifica che:
(u1 u2 . . . uk ) (v1 v2 . . . vl ) = (1)kl (v1 v2 . . . vl ) (u1 u2 . . . uk ).
1.3.4 Lazione di GL(V ) su k V . Sia A GL(V ), allora abbiamo definito in 1.1.13
k (A) : V k V k ,

x1 . . . xk 7 (Ax1 ) . . . (Axk ).

Si noti che n (A)(Ik ) = Ik , perche se xi = xi+1 anche Axi = Axi+1 . Quindi n (A) induce una
mappa lineare ben definita
[k] (A) : k V k V,

x1 . . . xk 7 (Ax1 ) . . . (Axk ).

Poiche k `e un omomorfismo, otteniamo, per ogni k, un omomorfismo


[k] : GL(V ) GL(k V ),

[k] (AB) = [k] (A)[k] (B).

Si verifica che se n = dim V allora [n] (A) = det(A).


1.3.5 Il duale di k V . Ci sono due modi comodi per descrivere lo spazio vettoriale (k V ) ,
lo spazio duale di k V .
Dato l1 , . . . , lk V e v1 , . . . , vk V , definiamo unapplicazione multilineare
a : V . . . V V . . . V R,

(l1 , . . . , lk , v1 , . . . , vk ) 7 det(A),

A = (li (vj )),

cio`e A `e la matrice k k con coefficienti i numeri reali Aij := li (vj ). La multilinearit`a di a


permette di definire unapplicazione bilineare
a0 : (V )k V k R,

a0 (l1 . . . lk , v1 . . . vk ) = a(l1 , . . . , lk , v1 , . . . , vk ).

Si noti che a0 (l1 . . .lk , v1 . . .vk ) = 0 se vi = vi+1 (in tal caso due colonne di A sono uguali)
e anche se li = li+1 (in tal caso due righe di A sono uguali). Quindi a0 `e zero su Ik V k e su
Ik (V )k (definito in modo analogo). Quindi a0 definisce unapplicazione bilineare:
a
: k (V ) k V R,

a
(l1 . . . lk , v1 . . . vk ) = a(l1 , . . . , lk , v1 , . . . , vk ).

Si scrive di solito (l1 . . . lk )(v1 . . . vk ) := a(l1 , . . . , lk , v1 , . . . , vk ), in modo esplicito:


X
(l1 . . . lk )(v1 . . . vk ) =
()l1 (v(1) )l2 (v(2) ) . . . lk (v(k) )
Sk

dove Sk `e il gruppo simmetrico e () `e il segno della permutazione Sk .


Sia e1 , . . . , en una base di V e sia 1 , . . . n la base duale di V . Allora gli eI = ei1 . . . eik
sono una base di k V e gli J = j1 . . . jk sono una base di k (V ). Si ha:

1 se I = J,
J (eI ) =
0 se I 6= J,

1 ALGEBRA MULTILINEARE

26

perche la matrice jk (eil ) `e lidentit`a I se I = J; se I 6= J esiste un ia I, ia 6 J e quindi


jk (eia ) = 0 per ogni jk J e perci`o det(jk (eil )) = 0. Questo mostra che le applicazioni lineari
J : k V R sono la base duale della base data dalle eI , e quindi

k (V ) (k V ) ,

l1 . . . lk 7 [v1 . . . vk 7 (l1 . . . lk )(v1 . . . vk )].

Unaltro modo per ottenere lo spazio (k V ) `e il seguente. Lo spazio vettoriale n V `e uno


dimensionale. Si scelga un isomorfismo f : n V R. Allora si ha un isomorfismo

nk V (k V ) ,

u1 . . . unk 7 [v1 . . . vk 7 f (u1 . . . unk v1 . . . vk )].

Si noti che se J {1, . . . , n} `e il complemento di I = {i1 , . . . , ik }, allora eJ nk V soddisfa


eJ eI = e1 . . . en 6= 0 n V ; mentre se I e J hanno un elemento in comune si ha
eJ eI = 0. Quindi, a meno di moltiplicazione per scalari, gli eJ , con |J| = n k, sono la base
duale della base di k V data dalle eI con |I| = k.
1.3.6 Orientazione. Sia V uno spazio vettoriale reale di dimensione n. Lo spazio vettoriale
n V `e unidimensionale, quindi isomorfo a R, e perci`o (n V ){0} ha due componenti connesse.
Unorientazione su V `e la scelta di una componente connessa di (n V ) {0}. Una base ei di V
`e detta orientata se e1 . . .en `e un elemento nella componente connessa data dallorientazione.
Per esempio, se ei `e la base standard di V = Rn , unorientazione di V `e data dalla componente connessa a cui appartiene e1 . . . en . La base e2 , e1 , e3 , . . . , en di V `e allora non
orientata in quanto e2 e1 e3 . . . en = e1 . . . en non giace nella componente connessa
determinata dallorientazione.
1.3.7 Loperatore di Hodge. Sia V uno spazio vettoriale reale orientato di dimensione n
dotato di un prodotto scalare (, ). Definiamo un applicazione lineare, chiamata operatore di
Hodge:
: k V nk V,
eI = I,J eJ ,
dove e1 , . . . en `e una base ortonormale orientata di V , I = {i1 , . . . , ik }, J = {j1 , . . . , jnk } e
I J = {1, . . . , n}, ed I,J {1} `e tale che
I,J (eI eJ ) = I,J (ei1 . . . eik ) (ej1 . . . ejnk ) = e1 . . . en .
Si pu`o mostrare che non dipende dalle scelta della base ortonormale orientata. La mappa
`e un isomorfismo per ogni k, 0 k n.
Per esempio, se definiamo unorientazione su R3 con la scelta della componente connessa
sulla quale giace e1 e2 e3 , dove ei `e la base standard, e prendiamo il prodotto scalare standard,
allora otteniamo per : 2 R3 1 R3 = R3 :
(e1 e2 ) = e3 ,

(e1 e3 ) = e2 ,

(e2 e3 ) = e1 ,

(si noti: (e1 e3 ) e2 = e1 e2 e3 , cio`e {1,3},{2} = 1, quindi (e1 e3 ) = e2 ).


Per x = (x1 , x2 , x3 ), y = (y1 , y2 , y3 ) R3 si ha:
x y = (x1 y2 x2 y1 )(e1 e2 ) + (x1 y3 x3 y1 )(e1 e3 ) + (x2 y3 x3 y2 )(e2 e3 ),

1 ALGEBRA MULTILINEARE

27

quindi
(x y) = (x2 y3 x3 y2 )e1 (x1 y3 x3 y1 )e2 + (x1 y2 x2 y1 )e3 = x y,
dove x y `e il prodotto vettoriale.
Il caso Minkowskiano.
In alcune applicazioni fisiche lo spazio vettoriale non `e dotato di un prodotto scalare ma solamente di una forma simmetrica non degenere di segnatura non definita. Un tipico esempio `e
` possibile ugualmente definire il duale di Hodge in base alla
lo spazio-tempo minkowskiano. E
seguente osservazione. La forma , essendo non degenere, induce un isomorfismo naturale8 tra
V e il suo duale V :
: V V

v 7 (v);

(v)[w] = (v, w) , w V .

Tale isomorfismo si estende in modo ovvio ad un isomorfismo


tra V e V , con
k
( )(w1 , . . . , wk ) = (w1 ) . . . (wk ).
Essendo simmetrica e non degenere, essa avr`a un numero p si autovalori positivi ed un numero
q di autovalori negativi, tali che p + q = n := dim(V ). Si dice che la forma ha segnatura (p, q)
o anche che la segnatura `e s = p q. Una base {ei }ni=1 V si dice ortonormale se

se i 6= j
0
1
se i = j p
(ei , ej ) =

1
se i = j > p .
Fissata una base ortonormale orientata {ei }ni=1 , sia n V lunico elemento individuato
da (e1 , . . . , en ) = 1. Si dimostra che non dipende dalla scelta della base. Esso genera degli
isomorfismi lineari
(k) : k V nk V , v1 . . . vk 7 (k) (v1 . . . vk ) ,

v1 , . . . , vk V ,

dove
(k) (v1 . . . vk )[w1 , . . . , wnk ] := (v1 . . . vk , w1 , . . . , wnk ) .
Otteniamo allora un operatore : k V nk V definito da = (nk )1 (k) . Tale mappa
coincide con loperatore di Hodge se `e definita positiva e ne costituisce la definizione nel caso
in cui sia semplicemente nondegenere. Si noti che = (1)q id.
Si noti infine che induce una forma bilineare nondegenere su V che si pu`o usare per definire
il duale di Hodge per V . Si ottiene facilmente che sul duale = (k) k (esercizio).

cio`e indipendente dalla scelta di una base

2 RAPPRESENTAZIONI DI GRUPPI FINITI

28

Rappresentazioni di gruppi finiti

Testi consigliati: [A], [FH], [S].

2.1

Teoria generale

2.1.1 Rappresentazioni e applicazioni equivarianti. Sia G un gruppo finito, sia V uno


spazio vettoriale reale (o complesso) di dimensione finita e sia
: G GL(V )
un omomorfismo. Un tale omomorfismo `e detto rappresentazione di G in V .
Siano : G GL(V ) e : G GL(W ) due rappresentazioni di un gruppo G sugli spazi
vettoriali complessi V, W . Unapplicazione lineare f : V W `e detta G-equivariante (oppure
G-invariante, vedi 2.2.3) se f ((g)v) = (g)f (v) per ogni g G e v V . Si scrive:
HomG (V, W ) = {f Hom(V, W ) : f ((g)v) = (g)f (v) g G, v V }.
Le rappresentazioni e sono dette isomorfe (oppure equivalenti) se esiste una f
HomG (V, W ) che `e un ismorfismo f : V W di spazi vettoriali. In tale caso si ha:
f (g) = (g)f , cio`e f (g)f 1 = (g) per ogni g G.
In particolare, se S : V V `e unapplicazione lineare invertibile, e se : G GL(V ) `e una
rappresentazione, allora : G GL(V ), definita da (g) := S(g)S 1 `e una rappresentazione
isomorfa a .
2.1.2 Sottospazi invarianti. Un sottospazio W V `e detto G-invariante se (g)(W ) W
per ogni g G.
Una rappresentazione di G in V , V 6= {0}, `e detta irriducibile se non ci sono sottospazi
G-invarianti diversi da W = {0} e W = V .
Un risultato fondamentale `e:
2.1.3 Teorema. Sia una rappresentazione di un gruppo finito G in V , allora V `e una somma
diretta di sottorappresentazioni irriducibili.
2.1.4 Prodotti scalari invarianti. Per la dimostrazione del teorema, vedi per esempio [A],
Corollario (4.9) del Capitolo 9. Si mostra prima che esiste su V un prodotto scalare invariante
per G, cio`e (x, y) = ((g)x, (g)y) per ogni x, y V e g G. Dato questo, segue facilmente
che se W V `e G-invariante, allora anche W `e G-invariante e il teorema segue.
Il fatto che ogni (g) preserva un prodotto scalare, cio`e che (g) `e unitario, implica che (g)
`e diagonalizzabile.
` interessante notare che un prodotto scalare G-invariante esiste pi`
E
u in generale se G `e un
gruppo di Lie compatto. Il trucco di unitariet`a Weyl (Weyls unitarity trick), che si usa per
mostrare la completa riducibilit`a di rappresentazioni di gruppi e algebre di Lie semisemplici,
sfrutta tale costruzione.

2 RAPPRESENTAZIONI DI GRUPPI FINITI

29

2.1.5 Esempio. Sia G = S2 il gruppo delle permutazioni di due elementi.


rappresentazione di G su uno spazio vettoriale V si decompone in G-rappresentazioni
V = V1 V ,

V1 = {v V : (g)v = v g G},

Una

V = {v V : ((12))v = v },

infatti ogni v V si scrive come v = (v + (12)v)/2 + (v (12)v)/2.


Ogni sottospazio di V1 (e di V ) `e G-invariante. Invece, se x V1 , y V sono entrambi
non nulli, allora hx + yi non `e una sottorappresentazione, perche ((12))(x + y) = x y e
x y 6 hx + yi. Ogni sottospazio 1-dimensionale di V1 (e di V ) `e una rappresentazione
irriducibile di G. Si noti che, a meno di isomorfismi, G ha soltanto due rappresentazioni
irriducibili, entrambe hanno dimensione 1 e una `e banale ((g) = 1 per ogni g G), mentre
per laltra si ha (e) = 1, ((12)) = 1, quindi coincide con il segno  : S2 {1} GL(C).
2.1.6 Esempio. Sia G = Sm e sia V = Rm . Si definisce una rappresentazione di G in V
ponendo
: G GL(V ),
ei 7 e(i) ,
dove e1 , . . . , em `e la base standard di Rm . Il sottospazio
W = he1 + e2 + . . . + em i
`e G-invariante perche gli ei sono permutati tra di loro da ogni g G. La rappresentazione di
G su W `e banale e, poich`e dim W = 1, W `e una rappresentazione irriducibile di G.
Sia (, ) il prodotto scalare standard su Rm , allora `e facile vedere che ((g)x, (g)y) = (x, y)
per ogni g G e x, y V . Quindi questo prodotto scalare `e G-invariante e perci`o W `e un
sottospazio G-invariante.
2.1.7 Il Lemma di Schur. Il seguente lemma `e uno strumento fondamentale per lo studio
delle rappresentazioni.
2.1.8 Lemma (Lemma di Schur.) Siano : G GL(V ) e : G GL(W ) due rappresentazioni irriducibili di un gruppo G su spazi vettoriali complessi V, W . Sia f HomG (V, W ),
cio`e f `e unapplicazione G-equivariante. Allora
1. f = 0 oppure f `e un isomorfismo,
2. se V = W e = , allora f = I, la moltiplicazione per uno scalare .
Dimostrazione. Si noti che ker(f ) e im(f ) sono sottospazi G-invarianti di V e di W rispettivamente. Infatti, se v ker(f ), cio`e f (v) = 0, allora (g)f (v) = 0 e quindi f ((g)v) = 0, perci`o
anche (g)v ker(f ). Similmente, se w im(f ), allora w = f (v) per un certo v V e quindi
(g)w = (g)f (v) = f ((g)v), cio`e (g)w `e limmagine di (g)v V e perci`o (g)w im(f ).
Poiche V `e irriducibile, si ha ker(f ) = V oppure ker(f ) = {0}. Nel primo caso f `e zero.
Nel secondo caso, f `e iniettiva e V
= im(f ) `e un sottospazio G-invariante, non-zero, di W , che
`e irriducibile, quindi im(f ) = W e perci`o f `e anche suriettiva. Segue che f `e un isomorfismo.

2 RAPPRESENTAZIONI DI GRUPPI FINITI

30

Sia V = W e = . Lapplicazione f : V V `e lineare, sia C un autovalore di f .


Allora f I `e un endomorfismo di V che `e G-equivariante perche f lo `e e (I)A = A(I) per
ogni applicazione lineare A : V V , in particolare per A = (g). Quindi ker(f I) `e un
sottospazio G-invariante non nullo e perci`o ker(f I) = V . Segue che f = I.
2

2.2

Caratteri

2.2.1 Il carattere di una rappresentazione. Sia : G GL(V ) una rappresentazione di


G. Definiamo unapplicazione, il carattere di ,
= : G C,

(g) := Tr((g))

dove Tr(A) `e la traccia


Pdellapplicazione lineare A : V V (cio`e, se A `e data da una matrice
(aij ), allora T r(A) = i aii ).
Si noti che se : G GL(V ) `e una rappresentazione e A GL(V ) `e un isomorfismo tra
e , cio`e A((g)v) = (g)Av per ogni v V , allora (g) = A(g)A1 e quindi = . Il
carattere dipende quindi soltanto della classe di isomorfismo di una rappresentazione.
Alcune propriet`a di base di un carattere sono:
2.2.2 Lemma. Sia : G GL(V ) una rappresentazione di un gruppo finito G con carattere
= . Allora:
1. (e) = dim V , dove e G `e lelemento neutro.
2. (g) = (hgh1 ) per ogni g, h G, cio`e, `e costante sulle classi di coniugio di G.
3. (g 1 ) = (g), il coniugato complesso.
4. Se : G GL(W ) `e una rappresentazione, allora il carattere della rappresentazione
: G V W `e + . Il carattere della rappresentazione : G V W `e
.
Dimostrazione. Poiche (e) = I, la matrice identit`a n n dove n = dim V , segue
(e) = Tr(I) = n. La seconda propriet`a segue da (hgh1 ) = (h)(g)(h)1 e il fatto che
Tr(SAS 1 ) = T r(A). Per mostrare la terza propriet`a, consideriamo una base di V rispetto alle
quale (g) `e diagonale. Poiche G `e finito si ha g N = e per un certo N . Perci`o (g)N = I e
con un semplice ragionamento si vede che gli autovalori 1 , . . . , n di (g) sono radici dellunit`a
1
N -esime: N
= i . Gli autovalori di (g 1 ) = (g)1 sono
i = 1 per i = 1, . . . , n e quindi i
1
allora i = i . Perci`o
1
(g 1 ) = Tr((g)1 ) = 1
1 + . . . + n = 1 + . . . + n = (g).

Lultima propriet`a segue considerando delle basi ei , fj di V , W su cui (g) e (g) sono dati da
matrici diagonali (vedi 2.1.4). Se (g)ei = i ei , (g)fj = j fj allora ei fj 7 i j (ei fj ). La

2 RAPPRESENTAZIONI DI GRUPPI FINITI

31

traccia di (g) (g) `e allora


(g) = Tr((g) (g)) =

i j = (

i,j

X
i )(
j ) = (g) (g).
j

Il caso `e pi`
u semplice.

2.2.3 Applicazioni equivarianti e invarianti. Si ricordi che Hom(V, W )


= V W dove
V = HomC (V, C) `e lo spazio duale dello spazio vettoriale complesso V . La rappresentazione
su V definisce una rappresentazione duale su V data da (g)l = l (g)1 = l (g 1 ).
Rispetto ad una base si ha (g) = t (g)1 = t (g 1 ). Poiche Tr(A) = Tr(t A) otteniamo dal
Lemma 2.2.2
: G V = HomC (V, C).
= ,
Otteniamo una rappresentazione di G su Hom(V, W ) data da:
: G Hom(V, W ),

g 7 [f 7 [v 7 (g)f ((g)1 v)]]

Si noti che un elemento f Hom(V, W ) `e invariante per G se (g)f ((g)1 v) = f (v) per ogni
v V e g G. Questa identit`a, per g 1 invece di g, `e equivalente a f ((g)v) = (g)f (v), cio`e,
f HomG (V, W ).
Per questo motivo unapplicazione G-equivariante `e anche detta G-invariante.
2.2.4 Proiettori e idempotenti. Un elemento p in un algebra A `e detto idempotente
se p2 = p. Nel caso in cui A = End(V ) un idempotente `e anche detto un proiettore, cio`e
unapplicazione lineare P : V V `e un proiettore se P 2 = P .
2.2.5 Lemma. Sia P End(V ) `e un proiettore, allora
V = im(P ) im(I P ),

e im(I P ) = ker(P ).

In pi`
u, anche I P `e un proiettore e si ha ker(P ) = im(I P ).
Dimostrazione. Si noti che (I P )(I P ) = I P P + P 2 = I P , quindi I P
`e un proiettore. Per mostrare la decomposizione di V , si noti che v = (P v) + (I P )v per
ogni v V , quindi V = im(P ) + im(I P ). Poi se x imP , quindi x = P y per un certo
y V , allora P 2 = P implica che P x = P 2 y = P y = x, quindi P x = x, cio`e P `e lidentit`a
sul sottospazio imP . Se x im(I P ), quindi x = (I P )z per un certo z V , allora
P x = P (I P )z = (P P 2 )z = 0. Se v im(P ) im(I P ), allora si ha P v = v e P v = 0,
quindi v = 0. Si noti che rispetto a questa decomposizione lapplicazione P `e data da:
P : v = vP + vIP 7 vP ,

vP = P v imP,

vIP = (I P )v im(I P ).
2

Da ci`o segue che im(I P ) = ker(P ).

2.2.6 Lo spazio degli invarianti. Sia : G GL(V ) una rappresentazione di un gruppo


su uno spazio vettoriale V . Lo spazio degli invarianti `e
V G := {v V : (g)v = v

g G}.

2 RAPPRESENTAZIONI DI GRUPPI FINITI

32

Come appena visto, Hom(V, W )G = HomG (V, W ).


P
Sia G un gruppo finito. Se v V G allora (g)v = v e quindi gG (g)v = v +. . .+v = |G|v
dove |G| `e lordine di G. Definiamo:
= 0 : V V,

1 X
(g).
|G| gG

Allora per v V G si ha v = v. In pi`


u, per ogni v V is ha v V G perche per ogni h G:
!
!
1 X
1 X
(h)(g) v =
(hg) v = v
(h)(v) =
|G| gG
|G| gG
(si noti che se g varia in G anche hg, per h G fissato, varia in G). Lapplicazione lineare `e
quindi un proiettore su V G : 2 = , perche V V G e `e lidentit`a su V G . Quindi
V = im() ker() = V G ker(),

v = (v, (I )v).

Se prendiamo una base e1 , . . . , ek di V G e una base ek+1 , . . . , en di ker() otteniamo una base
e1 , . . . , en di V rispetto alla quale la matrice P di ha tutti i coefficienti ugali a zero tranne
P11 = P22 = . . . = Pkk = 1. In particolare Tr() = dim V G . Daltra parte,
dim V G = Tr() = Tr(

1 X
1 X
1 X
(g)) =
Tr((g)) =
(g).
|G| gG
|G| gG
|G| gG

Questa formula, in combinazione con il Lemma di Schur ha delle consequenze notevoli.


Si noti che se G = S2 , allora v = (v + ((12))v)/2 e (I )v = (v ((12))/2. Abbiamo
gi`a usato queste applicazioni nellEsempio 2.1.5.
2.2.7 Caratteri irriducibili. Per studiare i caratteri delle rappresentazioni irriducibili,
detti caratteri irriducibili, sfruttiamo il Lemma di Schur 2.1.7 che d`a, per le rappresentazioni
irriducibili : G V , : G W :

1 se V
= W,
dim HomG (V, W ) =

0 se V 6= W.
Il risultato della sezione 2.2.6 precendente, applicato alla rappresentazione di G su
Hom(V, W ) ci d`a:
dim HomG (V, W ) =

1 X
1 X
(g) =
(g) (g).
|G| gG
|G| gG

Questo suggerisce di definire, per un gruppo finito G, un prodotto scalare (Hermitiano) (, )


sullo spazio vettoriale complesso delle funzioni : G C dato da
(, ) :=

1 X
(g)(g).
|G| gG

2 RAPPRESENTAZIONI DI GRUPPI FINITI

33

Allora i caratteri irriducibili : G C di G sono ortonormali per questo prodotto scalare: se


: G GL(V ) e : G GL(W ) sono rappresentazioni irriducibili allora

1 X
1 se
= ,
(g)(g) = dim HomG (V, W ) =
( , ) =

0 se 6= .
|G|
gG

In particolare, i caratteri delle rappresentazioni irriducibili sono indipendenti, perci`o il numero delle rappresentazioni irriducibili di un gruppo finito `e al pi`
u |G|, la dimensione dello
spazio delle funzioni G C. In realt`a, un carattere `e costante sulle classi di coniugio (2.2.2.2),
e quindi il numero delle rappresentazioni irriducibili `e al pi`
u il numero delle classi di coniugio
di G. Mostreremo lugualianza in 2.2.12.
Per esempio, se G = S3 , le classi di coniugio sono (vedi anche 2.3.3)
{e},

{(12), (13), (23)},

{(123), (132)},

quindi S3 , che ha 6 elementi, ha al pi`


u tre rappresentazioni irriducibili.
Il seguente lemma, di frequente uso, `e una semplice conseguenza del Teorema 2.1.3 e
dellortonormalit`a dei caretteri irriducibili.
2.2.8 Lemma. Siano 1 , . . . , r i caratteri irriducibili di un gruppo finito G e sia i : G
GL(Vi ) la rappresentazione irriducibile corrispondente: i (g) = Tr(i (g)).
Sia : G V una rappresentazione di G. Allora la decomposizione di in rappresentazioni
irriducibili `e
V
con ni = ( , i ).
= V1n1 V2n2 . . . Vrnr ,
Inoltre, si ha:
( , ) = n21 + n22 + . . . n2r .
Dimostrazione. Il Teorema 2.1.3 garantisce che V
= V1n1 V2n2 . . .Vrnr per certe ni Z0 .
Il carattere di `e allora, vedi 2.2.2,4, il carattere n1 1 + . . . + nr r . Per calcolare gli ni
sfruttiamo lortonormalit`a dei caratteri irriducibili:
X
( , i ) = (n1 1 + . . . + nr r , i ) =
nj (j , i ) = ni .
j

Dunque si ha:
( , ) = (n1 1 + . . . + nr r , n1 1 + . . . + nr r ) =

X
i,j

ni nj (i , j ) =

n2i .

2
2.2.9 Esempio: il gruppo S3 . Sia G = S3 il gruppo delle permutazioni di tre elementi e
sia : S3 W
= R2 la rappresentazione sul spazio perpendicolare a (1, 1, 1) R3 costruito
nellEsempio 2.1.6. Poiche R3 = W W e W `e la rappresentazione banale, quindi (g) = 1
per ogni g S3 e perci`o W (g) = 1, abbiamo = 1 + W . Ovviamente (vedi Lemma 2.2.2)

2 RAPPRESENTAZIONI DI GRUPPI FINITI

34

W (e) = dim W = 2. Se g = (12) allora (g) fissa e3 e permuta e1 ed e2 , quindi ((12)) = 1


e W ((12)) = 0. Poiche un carattere `e costante sulle classi di coniugio, si ha W (g) = 0 per
ognuno dei tre 2-cicli. Se g = (123), la traccia di (g) `e zero, e quindi W ((123)) = 1, e
questo vale anche per laltro 3-ciclo (132). Da qui segue:
6
1
(W , W ) = (22 + 3 02 + 2 (1)2 ) = = 1.
6
6
La conclusione `e chePW `e una rappresentazione irriducibile,
P 2 perche nella decomposizione in
irriducibili W =
ni i come nel Lemma 2.2.8 si ha
ni = 1 e quindi esattamente una
delle ni `e 1 e le altre sono zero.
Adesso conosciamo tre rappresentazioni irriducibili di S3 : la rappresentazione banale, con
carattere 0 (g) = 1 per ogni g S3 , la rappresentazione data dal segno di una permutazione,
 : S3 {1} GL(C), e la rappresentazione due dimensionale appena costruita. Di solito, i
caratteri irriducibile sono messi in una tabella dei caratteri come qui sotto.
S3
0

W

{e}
1
1
2

{(12), (23), (13)}


1
-1
0

{(123), (132)}
1
1
-1

Il prodotto scalare `e dato da (1/6)(a1 b1 + 3a2 b2 + 2a3 b3 ) dove (a1 , a2 , a3 ) e (b1 , b2 , b3 ) sono due
righe di questa matrice. Si verifica facilmente lortonormalit`a dei caratteri irriducibili.
2.2.10 La rappresentazione regolare. Per trovare il numero delle rappresentazioni irriducibili si studia la rappresentazione regolare di un gruppo finito G. Si consideri lo spazio
` facile verificare
vettoriale C[G], di dimensione |G|, con vettori di base gli eg dove g varia in G. E
che si ha una rappresentazione
= R : G GL(C[G]),

(g)eh = egh .

Poiche egh = eh se e solo se g = e, il carattere di questa rappresentazione `e particolarmente


semplice:

|G| se g = e,
R (g) := R (g) =
0
se g 6= e.
Nella decomposizione in irriducibili C[G] = V1n1 V2n2 . . . Vrnr (cf. Lemma 2.2.8) si ha
allora:
1 X
R (g)i (g) = i (e) = dim Vi ,
ni = (R , i ) =
|G| gG
cio`e ogni rappresentazione irriducibile compare in R con moltiplicit`a uguale alla sua
dimensione! Un altro risultato `e:
|G| = dim C[G] = dim(V1n1 V2n2 . . . Vrnr ) = (dim V1 )2 + . . . + (dim Vr )2 ,
che d`a, per esempio, una stima della dimensione di una rappresentazione irriducible di G.

2 RAPPRESENTAZIONI DI GRUPPI FINITI

35

2.2.11 Lo spazio generato dai caratteri. Sia : G GL(V ) una rappresentazione di un


gruppo finito e sia : G C una funzione che `e costante sulle classi di coniugio. Definiamo
un endomorfismo di V con:
X
, : V V,
, =
(g)(g).
gG

Allora , `e G-equivariante:
, (h) =

X
gG

(g)(g)(h) =

(g)(gh),

gG

ed inoltre si noti che gh = h(h1 gh) e che, per ipotesi, (g) = (h1 gh) quindi:
X
X
X
, ((h)v) =
(g)(gh) =
(h1 gh)(h)(h1 gh) = (h)
(g)(g) = (h),
gG

gG

gG

dove abbiamo usato che h1 gh varia in tutto G se g varia in tutto G.


Supponiamo adesso che una funzione : G C sia costante sulle classi di coniugio e
che (, i ) = 0 per ogni rappresentazione irriducibile di G. Per il Lemma di Schur, per ogni
rappresentazione irriducibile i di G si ha ,i = i I per un certo numero complesso i . Quindi
Tr(,i ) = ni i dove ni = dim Vi :
i =

1 X
|G|
1
Tr(,i ) =
(, i ).
(g)Tr(i (g)) =
ni
ni gG
ni

Poiche (, i ) = 0 per ipotesi, abbiamo allora i = 0 e quindi ,i = 0 per ogni rappresentazione irriducibile di G. Perci`o , `e zero per ogni rappresentazione di G. Per`o nella rappresentazione regolare R le matrici R (g) sono indipendenti in End(C[G]), per esempio R (g) `e
lunica matrice per cui il coefficiente g,e 6= 0 (questo perche (h)ee = eh , quindiPla prima colonna
di (h) ha un unico coefficiente 1 e gli altri zero). In particolare, se ,R = g (g)R (g) = 0
allora (g) = 0 per ogni g G e quindi = 0. Pertanto, ogni funzione : G C che `e
costante sulle classi di coniugio `e contenuta nello spazio vettoriale generato dai caratteri delle
rappresentazioni irriducibili. Poiche questi caratteri sono ortonormali si ha:
2.2.12 Teorema. I caratteri irriducibili formano una base ortonormale dello spazio vettoriale
delle funzioni G C che sono costanti sulle classi di coniugio.
In particolare, il numero delle rappresentazioni irriducibili di G `e uguale al numero delle
classi di coniugio di G.
2.2.13 Esempio: gruppi abeliani. Sia G un gruppo abeliano, cio`e gh = hg per ogni
g, h G. Allora hgh1 = g per ogni g, h G e quindi ogni elemento di G `e una classe
di coniugio. Perci`o il numero delle classi di coniugio `e r = |G|, che `e anche il numero delle
rappresentazioni irriducibili di G.

2 RAPPRESENTAZIONI DI GRUPPI FINITI

36

P
Poiche ri=1 n2i = |G|, dove gli ni sono le dimenionsioni delle rappresentazioni irriducibile
di G, ogni rappresentazione irriducibile di G ha dimensione uno(!).
2.2.14 Il groupring. Lo spazio vettoriale C[G] (vedi 2.2.10) `e una C-algebra con
moltiplicazione:
X
X
X
X X
(
xg eg )(
yg eg ) =
xg yh egh =
(
xh yk )eg .
g,h

hk=g

Si noti che il prodotto non `e commutativo se G non `e commutativo. Questa algebra si chiama
il groupring di G. Una rappresentazione : G GL(V ) induce un omomorfismo di algebre:
X
X
: C[G] End(V ),
xg eg 7
xg (g).
Siano i : G Vi (i = 1, . . . , r), le rappresentazioni irriducibili di G e sia
:= ri=1 i : G

r
Y

GL(Vi ).

i=1

Come abbiamo gi`a notato, dim C[G] = |G| =

2
i (dim Vi ) =

dim End(Vi ) e lomomorfismo

: C[G] ri=1 End(Vi )


`e un isomorfismo. Per mostrare questo, si ricordi che la rappresentazione regolare R su C[G]
`e isomorfa a i Vini , dove i Vi sono le rappresentazioni irriducibili di G e ni = dim Vi . Quindi
esiste una matrice M GL(N ), con N = |G| = dim C[G], tale che
SR (g)S 1 = diag(1 (g), . . . , 1 (g), . . . , r (g), . . . , r (g))
{z
}
|
{z
}
|
n1

nr

`e una matrice con blocchi diagonali. Il sottospazio di End(CN ) generato dalle SR (g)S 1 ,
dove g varia in G, ha dimensione |G| perche S `e invertibile e i R (g), dove g varia in G, sono
indipendenti (vedi 2.2.11). Quindi anche il sottospazio di End(CM ), con M = n1 +n2 +. . .+nr ,
generato dalle matrici
(g) = diag(1 (g), 2 (g), . . . , r (g)).
ha dimensione |G| e perci`o `e un isomorfismo di spazi vettoriali. Poiche `e lestensione Clineare di una rappresentazione di G si ha (xy) = (x)
(y), e quindi `e un isomorfismo di
algebre. Vedi 2.4.2 per un esempio.

2.3

Le classi di coniugio di Sm

2.3.1 Classi di coniugio. Si ricordi che due elementi g, g 0 di un gruppo G sono detti coniugati
se esiste un h G tale che g 0 = hgh1 . Lessere coniugati (o il coniugio) `e una relazione di

2 RAPPRESENTAZIONI DI GRUPPI FINITI

37

equivalenza. Quindi le classi di equivalenza sono una partizione di G. Se C G `e un classe di


coniugio e g C `e un qualunque elemento di C allora
C = Cg = {hgh1 : h G}.
Per esempio, se G `e un gruppo abeliano allora ogni classe di coniugio consiste di un solo
elemento perche hgh1 = hh1 g = g per ogni g, h G. Per ogni gruppo G la classe di coniugio
dellelemento neutro e G ha un solo elemento: Ce = {e}.
2.3.2 Decomposizione di permutazioni in cicli. Si ricordi che il gruppo Sm `e linsieme delle
applicazioni biiettive g : {1, . . . , m} {1, . . . , m} con prodotto la composizione (g1 g2 )(i) :=
g1 (g2 (i)) per ogni i {1, . . . , m}.
Un ciclo `e un elemento g Sm tale che ci siano interi distinti i1 , . . . , ir {1, . . . , m} per i
quali
g(i1 ) = i2 ,

g(i2 ) = i3 , . . . , g( ir1 ) = g(ir ),

g(ir ) = i1 ,

g(i) = i se i 6 {i1 , . . . , ir }.

Si scrive g = (i1 i2 . . . ir ), g `e detto un r-ciclo e lordine del ciclo `e |g| = r (questo `e proprio
lordine dellelemento g Sm ).
Ogni permutazione `e un prodotto di cicli disgiunti ([A], Proposizione 6.6). Si noti che se
c, c0 sono due cicli disgiunti, allora commutano tra loro: cc0 = c0 c.
Per esempio, lidentit`a e `e il prodotto di m uno cicli: e = (1)(2) . . . (m), e la decomposizione
in cicli della permutazione g S4 con
g(1) = 3 g(2) = 2,

g(3) = 4,

g(4) = 1 `e

g = (134)(2).

Sia g Sm e sia g = c1 c2 . . . ck la decomposizione di g in cicli disgiunti. Sia mi = |ci | Z>0


lordine del ciclo ci , allora m = m1 + m2 + . . . + mk . Poiche ci cj = cj ci possiamo scrivere ogni
permutazione g Sm come prodotto di cicli disgiuni nel modo seguente:
g = c1 c2 . . . ck ,

|c1 | |c2 | . . . |cr |

la somma m = |c1 | + |c2 | + . . . + |cr | `e detta partizione di un intero m associato ad g.


Per esempio g = (134)(2) d`a la partizione 4 = 3 + 1 e lidentit`a di Sm d`a la partizone
m = 1 + 1 + . . . + 1.
2.3.3 Le classi di coniugio di Sm . Sia c = (i1 i2 . . . ir ) Sm un r-ciclo e sia h Sm , allora
`e facile determinare il coniugato hch1 che risulta essere anchesso un r-ciclo. Infatti si ha:
h(i1 i2 . . . ir )h1 = (h(i1 ) h(i2 ) . . . h(ir )),
perche se i 6 {h(i1 ), . . . , h(ir )} allora h1 (i) 6 {i1 , . . . , ir } e quindi (ch1 )(i) = c(h1 (i)) =
h1 (i), perci`o (hch1 )(i) = h(h1 (i)) = i; se invece i = h(ij ) per un certo j, allora (ch1 )(i) =
c(ij ) = ij+1 (con j + 1 = 1 se j = r) e perci`o (hch1 (h(ij )) = h(ij+1 ).

2 RAPPRESENTAZIONI DI GRUPPI FINITI

38

Se g = c1 c2 . . . cr allora
hgh1 = h(c1 c2 . . . cr )h1 = (hc1 h1 )(hc2 h1 ) . . . (hcr h1 ).
Quindi ogni elemento in una classe di coniugio di una permutazione che `e prodotto di r cicli
con ordine m1 , . . . , mr `e un prodotto di r cicli con ordine m1 , . . . , mr . In particolare gli elementi
in una classe di coniugio di Sm determinano la stessa partizione di m. Non `e difficile verificare
che se due elementi in Sm determinano la stessa partizione, allora sono tra loro coniugati ([A],
Proposizione 6.10(c)).
Per esempio, siano g = (134)(2), g 0 = (1)(243) S4 . Entrambi due determinano la partizione 4 = 3 + 1. Allora g = hg 0 h1 con h = (12)(34) perche hg 0 h1 = (h(1))(h(2)h(4)h(3)) =
(2)(134) = g.
Quindi le classi di coniugio di Sm sono in biiezione con le partizioni di m. La classe di
coniugio determinata dalla partizione m = m1 + m2 + . . . + mr `e indicato con Cm1 ,m2 ,...,mr .
Per esempio S3 ha tre classi di coniugio perche 3 ha esattamente tre partizioni:
3 = 3,

3 = 2 + 1,

3 = 1 + 1 + 1.

Le classe di coniugio di S3 sono (dove non scriviamo gli 1-cicli):


C3 = {(123), (132)},

C2,1 = {(12), (13), (23)},

C1,1,1 = {e}.

Il gruppo S4 ha 5 classi di coniugio perche 4 ha esattamente cinque partizioni:


4 = 4,

4 = 3 + 1,

4 = 2 + 2,

4 = 2 + 1 + 1,

4 = 1 + 1 + 1 + 1.

le classe di coniugio di S4 sono (dove non scriviamo gli 1-cicli):


C4 = {(1234), (1243), . . .},

C3,1 = {(123), (132), . . .},

C2,1,1 = {(12), (13), . . .},

C2,2 = {(12)(34), (13)(24), . . .}

C1,1,1,1 = {e}.

Lasciamo al lettore la verifica del fatto che il numero di elementi in ogni classe di coniugio `e
dato da:
|C4 | = 6,
|C3,1 | = 8,
P
si noti che |C | = |S4 | = 24.

|C2,2 | = 3,

|C2,1,1 | = 6,

|C1,1,1,1 | = 1,

2.3.4 Esempio. Date le classe di coniugio in S4 non `e difficile trovare i caratteri irriducibili,
come abbiamo gi`a fatto per S3 in 2.2.9. Ci sono la rappresentazione banale, con carattere
0 e il segno, con carattere  . Poi c`e la rappresentazione 3 dimensionale 3 su W (vedi
2.1.6), `e facile trovare il suo carattere W e verificare che (W , W ) = 1, quindi W `e un
carattere irriducibile. Poiche W ((12)) = 1, segue che la rappresentazione 3 tensorizzata con
 ha un carattere, dato da 3  (g) = W (g) (g) che `e diverso da W e che risulta essere
irriducibile. Poi si trova il carattere di una quinta rappresentazione irriducile determinando

2 RAPPRESENTAZIONI DI GRUPPI FINITI

39

un vettore a = (a1 , . . . , a5 ) perpendicolare ai quattro caratteri gi`a trovati e poi il carattere


mancante `e dato da a0 = a dove a1 > 0 (sarebbe la dimensione della quinta rappresentazione)
e (a0 , a0 ) = 1. La tabella dei caratteri di S4 `e quindi quella qui sotto, dove la prima riga d`a la
cardinalit`a dei classi di coniugio.
S4
0

3
3 
2

1
C1,1,1,1
1
1
3
3
2

6
C2,1,1
1
-1
1
-1
0

3
C2,2
1
1
-1
-1
2

8
C3,1
1
1
0
0
-1

6
C4
1
-1
-1
1
0

Il carattere 2 di S4 `e molto simile al carattere W di S3 (vedi 2.2.9). Infatti, esiste un


omomorfismo suriettivo : S4 S3 tale che 2 `e la composizione di con la rappresentazione
W : S3 GL(W ). Per definire , si noti che S4 ha una classe di coniugio
C2,2 = {x1 = (12)(34), x2 = (13)(24), x3 = (14)(23)}
con soltanto 3 elementi. La coniugazione con g S4 induce una permutazione di questi elementi,
quindi esiste una permutazione degli indici 1, 2, 3 tale che gxi g 1 = x(i) . Cio definisce
unapplicazione
: S4 S3 ,
g 7 se gxi g 1 = x(i)
e si verifca facilmente che `e un omomorfismo. Un rapido conto mostra che:
((12)) = (23),

((123)) = (132),

((12)(34)) = e,

((1234)) = (13).

A questo punto `e facile verificare che il carattere della rappresentazione W : S4 GL(W )


`e 2 . Per n > 4 non ci sono omomorfismi suriettivi Sn Sm con m > 2 (per m = 2 c`e il
segno perche S2
= {1}).

2.4

Le rappresentazioni irriducibili del gruppo simmetrico

2.4.1 Sottospazi invarianti nel groupring. Ogni rappresentazione irriducibile di un


gruppo finito G `e presente, con molteplicit`a dim(), nella rappresentazione regolare R del
gruppo (vedi 2.2.10) sul groupring C[G]. Per g G e x C[G] si ha R (g)x = gx, quindi, per
ogni y C[G] il sottospazio C[G]y C[G] `e G invariante, semplicemente perche se x C[G]y
allora x = zy per un certo z C[G] e
R (g)x = R (g)zy = R (g)zy = (gz)y

C[G]y.

Usando lisomorfismo del groupring con il prodotto di algebre di matrici di 2.2.14, non `e difficile
mostrare che, dato , esiste c C[G] tale che il sottospazio G-invariante C[G]c sia la rappresentazione irriducibile di G. Nel caso del gruppo simmetrico, esistono espressioni esplicite per
tali elementi, che si chiamano simmetrizzatori di Young(Young symmetrizers), vedi 2.4.3.

2 RAPPRESENTAZIONI DI GRUPPI FINITI

40

2.4.2 Esempio. Per dare un isomorfismo esplicito tra C[S3 ] e M1 (C) M1 (C) M2 (C),
determiniamo prima la rappresentazione 2 := W : S3 GL(2, C) in modo esplicito.
Una base di W = h(1, 1, 1)i C3 `e data da f1 , f2 (e f1 + f2 + f3 = 0):
f1 = (2, 1, 1),

f2 = (1, 2, 1),

f3 = (1, 1, 2),

g fi = fg(i)

in particolare, S3 permuta gli fi . Le matrici dei 2 (g) rispetto a questa base sono:






0 1
1 0
1 1
2 ((12)) =
, 2 ((13)) =
, 2 ((23)) =
0 1
1 0
1 1
e


2 ((123)) =

0 1
1 1


,

2 ((213)) =

1 1
1 0


,

e, ovviamente, 2 (e) = I. Otteniamo un isomorfismo


: C[S3 ] M1 (C) M1 (C) M2 (C),

xg eg 7

xg (1, (g), (g)).

Si noti che
((12)) + ((13)) + ((23)) = (3, 3, 0),

((123)) + ((132)) = (2, 2, I).

Quindi troviamo:
(1, 0, 0) = (1/6)(

X
gS3

(g)) = 0 ,

(0, 1, 0) = (1/6)(

(g)
(g)) =:  ,

gS3

dove riconosciamo il proiettore sullo spazio degli invarianti = 0 (vedi 2.2.6). Si noti in
particolare che
C[G]0
(a, b, c) 7 (a, 0, 0)
= M1 (C),
d`a la sottorappresentazione banale di C[g]. Similmente, il sottospazio G-invariante C[G] =
{(0, b, 0) : b C} di C[G] `e la rappresentazione data dal segno. Il proiettore corrispondente
alla rapresentazione due dimensionale `e:
(0, 0, I) = (2/3, 2/3, (2/3)I) (2/3, 2/3, (1/3)I)
= (2/3)
(e) (1/3)(
((123)) + ((132))
=: 2 .
Quindi il sottospazio G-invariante C[G]2 `e isomorfo a M2 (C), che `e 4-dimensionale. La rappresentazione di G = S3 su C[G]2 `e isomorfa a due copie della rappresentazione irriducibile
2 .
Se vogliamo un elemento c2 C[G] tale che C[G]c2 sia due dimensionale e tale che la
rappresentazione di S3 su questo sottospazio sia 2 , dobbiamo avere che (c2 ) = (0, 0, P ) con
P una matrice di rango uno. Allora C[G]c2
= M2 (C)P , e si pu`o mostrare che `e costituita
dalle matrici 2 2 che hanno lo stesso nucleo (di dimensione uno) di P ed `e un sottospazio

2 RAPPRESENTAZIONI DI GRUPPI FINITI

41

di dimensione due di M2 (C). Poiche questo sottospazio `e G-invariante ed `e contenuto nella


rappresentazione 2 2 , d`a la rappresentazione 2 di G. Un esempio `e:
c2 = e + e(13) e(12) e(123) C[S3 ],

(c) = (0, 0, P ),

dove

P = 2 (c2 ) =

1 0
0 1


+

1 0
1 1

0 1
1 0

0 1
1 1


=

0 0
3 3


.

2.4.3 Diagrammi di Young e simmetrizzatori di Young. Data una partizione di un


intero m Z>0 , m = m1 + . . . + mr , il suo diagramma di Young `e una figura con m quadri, mi
nella i-esima riga, come negli esempi in figura:

3=1+1+1

4=4

8=4+3+1

Data la partizione = (m1 , . . . , mr ) di m, vogliamo costruire un elemento c in C[Sm ]. Per


questo, scriviamo i numeri 1, 2 . . . , m nel diagramma di Young come nellesempio (in realt`a,
cambiando lordine dei numeri si ottiene un elemento con propriet`a simili e la rappresentazione
definita `e la stessa).
1 ,
2
3

1 2 3 4 ,

1 4 6 8 .
2 5 7
3

Poi definiamo due sottogruppi di Sm associati alla partizione = (m1 , . . . , mr ) di m:


P = P = {g Sm : g permuta gli elementi di ogni riga }
e
Q = Q = {g Sm : g permuta gli elementi di ogni colonna }.
Per esempio:
P1,1,1 = {e},

Q1,1,1 = S3 ;
P4 = S4 , Q4 = {e}.
Si ha P4,3,1
= S4 S3 S1 e Q4,3,1
= S3 S2 S2 S1 (dove S1 = {e}), per`o S3 sottogruppo
di P4,3,1 permuta i tre elementi di {2, 5, 7} e fissa gli altri elementi in {1, . . . , 8}, invece i gruppi
simmetrici in Q permutano rispettivamente gli elementi di {1, 2, 3}, {4, 5}, {6, 7}, e fissano gli
altri.

2 RAPPRESENTAZIONI DI GRUPPI FINITI

42

Usando i sottogruppi P e Q associati alla partizione = (m1 , . . . , mr ) di m, definiamo due


elementi di C[G]:
X
X
a :=
eg ,
b :=
(g)eg ,
gP

gQ

dove  : Sm {1} `e il segno. Poi definiamo il simmetrizzatore di Young


c := a b

( C[Sm ]).

Il risultato principale, che non dimostriamo, vedi [FH], Theorem 4.3, `e:
2.4.4 Teorema. Sia = (m1 , . . . , mr ) una partizione di m. Allora il sottospazio Sm -invariante
del groupring C[Sm ] definito da c :
V := C[Sm ]c
`e una rappresentazione irriducibile, indicata con , di Sm .
In questo modo si ottiene una biiezione tra le partizioni di m e le rappresentazioni irriducibili
di Sm .
2.4.5 Esempio. Un esempio semplice `e dato dalla partizione m = m. In questo caso P = Sm ,
Q = {e}, quindi
X
eg , bm = ee ,
quindi cm = am .
am =
gSm

P
Poiche eh cm = g eh eg = g ehg = g eg = c , e gli eh sono una base di C[Sm ] troviamo che
C[Sm ]cm = Ccm , uno spazio unidimensionale. Poiche R (h)eg = ehg si ha R (h)cm = cm , perci`o
Wm = C[Sm ]cm `e la rappresentazione banale di Sm .
Se = (1, 1, . . . , 1), si ha P = {e}, quindi a = ee , e Q = Sm . Perci`o
X
c = c(1,...,1) = b(1,...,1) =
(g)eg .
g

Si noti che
eh c =

X
g

(g)eh eg =

X
g

(g)ehg =

(h1 k)ek = (h)c ,

dove k = hg varia in Sm se g varia in Sm e abbiamo usato che  `e un omomorfismo:


(xy) = (x)(y), (x1 ) = (x)1 . Segue che W = C[Sm ]c = Cc `e unidimensionale e
che la rappesentazione di Sm su W `e data da  : Sm GL(C) perche R (h)c = (h)c .
Nel caso = (2, 1), abbiamo:
P2,1 = {e, (13)},

Q2,1 = {e, (12)}

quindi a2,1 = ee + e(13) ,

b = ee e(12) ,

perci`o il simmetrizzatore di Young di `e:


c = (ee + e(13) )(ee e(12) ) = ee2 + e(13)e ee(12) e(13)(12) = ee + e(13) e12) e(123) ,

2 RAPPRESENTAZIONI DI GRUPPI FINITI

43

e questo `e proprio lelemento c2 di 2.4.2. In 2.4.2 abbiamo visto che C[S3 ]c2 `e la rappresentazione
irriducibile, due dimensionale, di S3 . Diamo una verifica esplicita di questo fatto.
Poiche V = C[S3 ]c `e due dimensionale (vedi anche la formula in 2.4.6), una base di V `e
data da c , gc per un qualunque g S3 tale che questi due elementi siano indipendenti (ci`o
esclude ovviamente g = e e, meno ovvio, g = (13)). Prendiamo g = (12) allora:
(12)c = (12)(ee + e(13) e12) e(123) ) = e(12) + e(132) ee e(23) ,
quindi c , (12)c sono indipendenti nello spazio vettoriale C[S3 ]. Poiche (12)2 = e, (12) scambia
questi due vettori. In particolare, la matrice di moltiplicazione per (12) su questa base ha traccia
zero. Allora si verifica che
(123)c = e(123) +e(23) e(13) e(132) = c (12)c ,

(123)(12)c = e(13) +ee(123) e(12) = c .

Quindi il sottospazio generato da c , (12)c `e invariante per (12), (123) e, poiche queste due
permutazioni generano S3 , tale sottospazio `e invariante per S3 . Le matrici di moltiplicazione
sono:




0 1
1 1
: (12) 7
,
: (123) 7
.
1 0
1 0
` facile
In particolare, T r( ((12))) = 0 , T r( ((123))) = 1 e ovviamente T r( (e)) = 0. E
verificare (e labbiamo gi`a fatto!) che questo carattere `e irriducibile. Segue che la rappresentazione `e equivalente alla rappresentazione 2 di 2.4.2. Infatti, basta scambiare i due vettori
di base c , (12)c per ottenere le matrici di 2 .
2.4.6 La dimensione di V . Esiste un modo semplice per determinare la dimensione della
rappresentazione irriducibile V . Sia = {m1 , . . . , mr }, con m = m1 + . . . + mr , e consideriamo
il diagramma di Young della partizione . Nel quadrato nella i-esima riga e j-esima colonna
mettiamo il numero hij := 1 + dij + sij , dove dij `e il numero dei quadrati a destra e sij `e
il numero dei quadrati sotto questo quadrato (questo numero si chiama la hooklength del
quadrato). Allora si ha
m!
dim V = Q
.
i,j hij
Qualche esempio:

= 3 2 ,
2 1

= 6 4 3 1 ,
4 2 1
1

m2

...
...

2 1 .

Quindi la partizione = {2, 2} di m = 4 definisce la rappresentazione irriducibile V di S4 che


ha dimensione
4321
dim V =
=2
3221

2 RAPPRESENTAZIONI DI GRUPPI FINITI

44

e, poiche S4 ha ununica rappresentazione irriducibile di dimensione due, V `e la


rappresentazione 2 trovata in 2.3.4.
Si noti che V `e una rappresentazioe irriducibile di S8 di dimensione (8!)/(6 4 4 2 3) = 70.
La partizione = {m 1, 1} di m definisce una rappresentazione irriducibile V di Sm che
ha dimensione
m(m 1)(m 2)!
= m 1.
dim V =
m ((m 2)!) 1
Si pu`o mostrare che V `e la rappresentazione W di 2.1.6.

3 TENSORI E GRUPPO SIMMETRICO

45

Tensori e gruppo simmetrico

Testi consigliati: [FH].

3.1

Introduzione e risultati generali

3.1.1 Lazione di Sm su T m V Sia V uno spazio vettoriale reale di dimensione n. Per un


intero m Z0 sono stati definiti nella sezione 3.1 gli spazi vettoriali:
T 0 (V ) = R,

T 1 V = V,

T m V := |V V
{z. . . V} .
m

Per g Sm , lapplicazione (g) : T m V T m V `e per definizione la permutazione dei fattori


del prodotto tensoriale che corrisponde a g. Quindi si sposta li-esima componente del prodotto
tensoriale nella g(i)-esima componente. Per esempio, se v1 , v2 , v3 V :
((123)) : v1 v2 v3 7 v3 v1 v2 ,
perche (123) manda 1 7 2 quindi v1 compare nel secondo fattore dellimmagine, poi 2 7 3
quindi v2 compare nellultimo fattore, ecc. Si noti che v3 v1 v2 6= vg(1) vg(2) vg(3) .
Per ottenere una formula per (g) si noti che
(g) : v1 v2 . . . vm 7 y1 y2 . . . ym = vg1 (1) vg1 (2) . . . vg1 (m)
perche, per definizione di , yj = vi dove j = g(i), cio`e i = g 1 (j) e perci`o yj = vg1 (i) .
E facile verificare che : Sm GL(T m V ) `e un omomorfismo: se (h)(y1 . . . ym ) =
z1 . . . zm allora
zk = yh1 (k) = vg1 (h1 (k)) = v(hg)1 (k)
quindi
(h)( (g)(v1 . . . vm )) = v(hg)1 (1) . . . v(hg)1 (m) = (hg)(v1 . . . vm ).
Si pu`o anche considerare unazione di Sm da destra, su T m V , data da (v1 . . . vm ) =
v(1) . . . v(m) (vedi [FH], p.76, questo rende un po faticoso il confronto tra varie formule
esplicite ma non cambia la sostanza).
3.1.2 Lazioni dei gruppi GL(V ) e Sm su T m V . Il gruppo GL(V ) agisce su T m V tramite
lomomorfismo
: GL(V ) GL(T m V ),

(A)(v1 v2 . . . . . . vm ) = (Av1 ) (Av2 ) . . . (Avm ).

Il gruppo simmetrico Sm agisce su T m V tramite lomomorfismo (vedi 3.1.1:


: Sm GL(T m V ),

( 1 )(v1 v2 . . . . . . vm ) = v(1) v(2) . . . v(m) .

3 TENSORI E GRUPPO SIMMETRICO

46

Queste azioni commutano, cio`e:


(A) ( 1 ) = ( 1 )(A),
per ogni A GL(V ) e ogni Sm , infatti, entrambe mandano
v1 v2 . . . . . . vm 7 (Av(1) ) (Av(2) . . . (Av(m) ).
Spesso non scriveremo gli omomorfismi , , ma semplicemente A(v1 . . . . . .vm ) = (Av1 )
. . . (Avm ) e 1 (v1 . . . . . . vm ) = v(1) . . . v(m) .
3.1.3 Esempio. Consideriamo il caso n = 2. Il gruppo S2 ha soltanto due elementi, S2 =
{e, g = (12)}. Poiche g 2 = e e (e) = I, lidentit`a su T 2 V , (g) : T 2 V T 2 V `e unapplicazione
lineare con (g)2 = I. Quindi ogni elemento t di T 2 V si scrive nel modo seguente:
t = (t + (g)t)/2 + (t (g)t)/2
e, poiche (g)((t + (g)t)/2) = (t + (g)t)/2, (g)((t (g)t)/2) = (t (g)t)/2, la
decomposizione di T 2 V in autospazi di (g) `e:
T 2 V = S 2 V A2 V,

S 2 V = {x T 2 V : (g)x = x },

S 2 V = {x T 2 V : (g)x = x },

3.1.4 Gli spazi A2 V e 2 V . Se e1 , . . . , en `e una base di V , allora ei ej , 1 i, j n `e


una base di T 2 V e (g)(ei ej ) = ej ei . Quindi otteniamo una base di S 2 V e A2 V nel modo
seguente:
S 2 V = he1 e1 , . . . , en en , e1 e2 + e2 e1 , . . . , en1 en + en1 en i,
A2 V = he1 e2 e2 e1 , . . . , en1 en en1 en i.
Nella sezione 1.3.1 abbiamo definito il prodotto esterno 2 V di V e unapplicazione canonica
: T 2 V 2 V,

u v 7 u v = v u.

Lo spazio vettoriale 2 V ha una base data dalle ei ej con 1 i < j n. Poiche (ei ei ) =
ei ei = ei ei = 0 e (ei ej ) = ei ej , si ha (S 2 V ) = 0 e la restrizione A di ad A2 V
`e un isomorfismo, con inversa 1
A data da:

2
2
1
A : V A V,

1
1
A (u v) = 2 (u v v u).

Spesso si scrive (identificando A2 V e 2 V ):


u v := 12 (u v v u).
In modo simile, scriviamo
u v := 21 (u v + v u)

( S 2 V ),

3 TENSORI E GRUPPO SIMMETRICO

47

si dice che u v `e il prodotto simmetrico di u e v.


3.1.5 Decomposizioni. Gli autospazi S 2 V e A2 V di (g) nell esempio 3.1.3 sono invarianti
per GL(V ):
(A)(S 2 V ) S 2 V,
(A)(A2 V ) A2 V
(A GL(V )),
come si verifica per esempio considerando lazione di GL(V ) sui vettori di base di S 2 V e di
A2 V .
Per generalizzare questo decomposizione consideriamo uno spazio vettoriale W , due gruppi,
G e H, e due omomorfismi
: G GL(W ),

: H GL(W ),

t.c. (g) (h) = (h)(g)

per ogni g G, h H, cio`e le azioni di G e H commutano. Sia data una decomposizione


W = W1 W2

t.c. (h)Wi Wi

per ogni h H, cio`e gli spazi W1 , W2 sono H-invarianti (si dice anche che W1 , W2 sono
sottorappresentazioni di H). Sia (come in 2.1.1)
HomH (W1 , W2 ) := {f Hom(W1 , W2 ) : f ((h)w1 ) = (h)f (w1 ) w1 W1 }.
cio`e HomH (W1 , W2 ) `e linsieme (in effetti uno spazio lineare) delle applicazioni lineari W1 W2
che commutano con lazione di H, dette applicazioni H-equivarianti.
3.1.6 Lemma. Siano : G GL(W ) e : H GL(W ) rappresentazioni che commutano.
Sia W = W1 W2 e supponiamo che HomH (W1 , W2 ) = 0. Allora W1 `e G-invariante.
Dimostrazione. Per g G e w1 W1 , il vettore (g)w1 W = W1 W2 si scrive come
(g)w1 = (1 (g)w1 , 2 (g)w1 )

W1 W2 ,

ed `e facile verificare che le i (g) : W1 Wi , i = 1, 2, sono mappe lineari. Ora mostriamo che
2 (g) `e H-equivariante, e quindi, per ipotesi, `e zero. Segue allora che (g)w1 = (1 (g)w1 , 0)
W1 come desiderato.
Per mostrare che 2 (g) `e H-equivariante, si noti che per ogni h H, g G e w1 W1 :
(h)((g)w1 ) = (h)(1 (g)w1 , 2 (g)w1 ) = ( (h)(1 (g)w1 ), (h)(2 (g)w1 )),
dove per la seconda ugualizanza si usa che (h)Wi Wi , quindi (h)(1 (g)w1 ) W1 ,
(h)(2 (g)w1 ) W2 . Daltra parte, poiche (h) e (g) commutano, troviamo:
(h)((g)w1 ) = (g)( (h)w1 ) = (1 (g)( (h)w1 ), 2 (g)( (h)w1 )),
dove per la seconda ugualianza si usa che (h)w1 W1 . Quindi abbiamo verificato
che (h)(2 (g)w1 ) = 2 (g)( (h)w1 ), per ogni w1 W1 e ogni h H, perci`o 2 (g)
HomH (W1 , W2 ).
2
3.1.7 Esempio. Sia W = T 2 V , H = S2 = {e, g} e W1 = S 2 V , W2 = A2 V come in
3.1.3. Allora per f HomH (W1 , W2 ) si ha f ((g)w1 ) = f (w1 ) per ogni w1 S 2 V , mentre
(g)f (w1 ) = f (w1 ) perche f (w1 ) A2 V . Quindi f (w1 ) = 0 per ogni w1 W1 e perci`o
HomH (W1 , W2 ) = 0.

3 TENSORI E GRUPPO SIMMETRICO

3.2

48

I funtori di Schur

3.2.1 La decomposizione intrinseca di T m V . Sullo spazio vettoriale W = T m V , ci sono


le rappresentazioni : GL(V ) GL(W ) e : Sm GL(W ) che commutano (vedi 3.1.2). La
teoria delle rappresentazioni di Sm (vedi 2.4.4) da una decomposizione intrinsica:
T m V = W ,

n
con W
= V

dove varia nellinsieme delle partizioni di m e V `e la rappresentazione irriducibile di Sm che


corrisponde alla partizione .
Poiche le rappresentazioni irriducibili V e V sono isomorfe se e solo se = , il Lemma di
Schur implica (vedi 3.2.3):
HomSm (Vn , Vn ) = 0

( 6= ).

Ogni W := Vn `e allora GL(V )-invariante per il Lemma 3.1.6.


3.2.2 Esempio. Poiche conosciamo i caratteri irriducibili di S3 e non `e difficile trovare il
carattere = della rappresentazione : S3 T 3 V , si calcola facilmente le moltiplicit`a
n = (, ) delle rappresentazioni irriducibili V in T 3 V .
Anzitutto, (e) = dim T 3 V = n3 dove n = dim V . Sia e1 , . . . , en una base di V . Se g S3 ,
allora g(e1 e2 e3 ) = eg1 (1) eg1 (2) eg1 (3) , quindi g permuta questi vettori di base di
T 3 V . Perci`o la matrice (g) ha tutti i coefficienti uguali a zero, tranne (g)ij = 1 se g manda il
j-esimo vettore di base di T 3 V neli-esimo vettore di base. Perci`o (g) = T r( (g)) `e uguale al
numero dei vettori di base di T 3 V fissati da g. Se g = (12) allora g fissa esattamente i vettori
di base di tipo ei ei ej , con 1 i, j n, quindi ((12)) = n2 . In modo simile, g = (123),
fissa esattamente gli ei ei ei , quindi ((123)) = n.
Sia per esempio = (2, 1), allora a questa partizione di 3 corrisponde la rappresentazione
irriducibile due dimensionale di S3 che ha carattere 2,1 (g) = 2, 0, 1 per g = e, (12), (123)
rispettivamente (vedi 2.2.9). Quindi otteniamo:
n3 n
1
.
n2,1 = (, 2,1 ) = (n3 2 + 3 n2 0 + 2 n (1)) =
6
3
Si veda 3.2.10 per un altro modo di ottenere queste moltiplicit`a. E un esercizio per il lettore
verificare le formule per le moltiplicit`a n (= dim S V ) date in 3.2.10 nel caso n = 3, 4.
n

3.2.3 Le applicazioni Sm -equivarianti. Studiamo lo spazio HomSm (Vn , V ) in maggior


detaglio, in particolare nel caso = .
Sia
f : Vn Vn
Sm -equivariante. Allora f = (f1 , . . . , fn ) con fi : Vn V . Poiche ogni coppia di V `e
Sm -invariante, ogni fi `e Sm equivariante. In pi`
u, poiche f `e lineare, per v1 , . . . , vn V si ha
fi (v1 , . . . , vn ) = fi (v1 , 0 . . . , 0) + . . . + fi (0, . . . , 0, vn ).

3 TENSORI E GRUPPO SIMMETRICO

49

Per ogni i, j lapplicazione


fij : V V ,

v 7 fi (0, . . . , 0, v, 0, . . . , 0)

(con v nella j-esima posizione) `e Sm equivariante. Se 6= allora, per il Lemma di Schur, ogni
fij = 0. Se invece = , ogni fij `e uno scalare, quindi f = (fij ) `e data da una matrice n n ,
cio`e:
HomSm (Vn , Vn )
= M (n , C).
In particolare, poiche ogni W = Vn `e GL(V )-invariante e lazione di ogni A GL(V ) `e
Sm -equivariante, otteniamo una rappresentazione
: GL(V ) GL(n , C),
che risulta essere irriducibile, vedi il Teorema 3.2.6. Questa rappresentazione, indicata con S V ,
`e determinata da V e dalla partizione di m. La rappresentazione S V di GL(V ) `e contenuta
in T m V , ma poiche la sua moltiplicit`a non `e uno, tranne per = (m) e = (1, 1, . . . , 1),
non c`e in generale un modo intrinseco di ottenere S V come sottospazio di T m V . Usando il
simmetrizzatore di Young c di (che dipende da una scelta di inserire i numeri 1, . . . , m nel
diagramma di Young e dalla scelta dellazione di Sm su T m V a sinistra o a destra, che non `e
la stessa per tutti gli autori) si pu`o mostrare che S V
= c T m V . Questa sar`a la definizione
di S V qui sotto, ma vale la pena di ricordare (vedi 3.3.1 per esempio) che in generale ci sono
altre applicazione GL(V )-equivarianti S V , T m V .
3.2.4 Il funtore di Schur. La rappresentazione di Sm su T m V d`a, per estensione C-lineare,
un omomorfismo di C-algebre
C[Sm ] End(T m V ),
X
X
x=
ag eg 7 [v1 v2 . . . vm 7
ag vg1 (1) vg1 (2) . . . vg1 (m) ].
g

Sia = (m1 , . . . , mr ) una partizione di m e sia c C[Sm ] il simmetrizzatore di Young


associato a (vedi 2.4.3). Definiamo il sottospazio S V di T m V nel modo seguente:
S V := c T m V

(= im(c : T m T m V )).

In questo modo assegniamo ad ogni spazio vettoriale V uno spazio vettoriale S V : questa
assegnazione si chiama il funtore di Schur (definito da ). Si noti che data unapplicazione
lineare f : V W si ottiene unapplicazione indotta S V S W , che `e indicata con S (f ).
Il sottospazio vettoriale S V di T m V `e GL(V )-invariante perche lazione di GL(V ) commuta
con quella di Sm .
3.2.5 Il sottospazio (S V ) V di T m V . Il Teorema 2.4.4 mostra che V := C[Sm ]c `e
una rappresentazione irriducibile di Sm . Poiche il simmetrizzatore di Young soddisfa c2 = k c
([FH], Theorem 4.3), per un intero k (6= 0), si ha c (S V ) = S V . Scrivendo f = c g, si vede
che c f = k f per ogni f S V .

3 TENSORI E GRUPPO SIMMETRICO

50

Siano g1 = e, . . . , gn Sm tali che gli gi c sono una base di V e sia f1 , . . . , fm una base
di S V :

S V = ni=1
Cfi ,
V = m
j=1 Cgj c .
Si pu`o mostrare che lapplicazione
(S V ) V T m V,

fi (gj c ) 7 gj c fi = k gj (fi )

`e iniettiva. Quindi la sua immagine `e una rappresentazione di Sm che `e isomorfa a Vm ed `e


una rappresentazione di GL(V ) isomorfa a (S V )n . In questo modo si ottiene ([FH], Theorem
6.3(2), Lemma 6.22 e Exercise 6.30):
3.2.6 Teorema. La decomposizione di T m V in sottorappresentazioni irriducibili per il gruppo
GL(V ) Sm `e data da:
M
T mV
(S V ) V
=

dove percorre le partizioni di m, S V `e una rappresentazione irriducibile di GL(V ) e V `e la


rappresentazione irriducibile di Sm definita da .
Si hanno in particolare le decomposizioni, in rappresentazioni irriducibili per Sm e GL(V )
rispettivamente:
M n
M
T mV
V
(S V )m ,
n := dim S V, m = dim V .
=
=

3.2.7 Esempio: m = 2. Nel caso m = 2, le partizioni sono 2 = 2 e 2 = 1 + 1. Le due


rappresentazioni irriducibili di S2 hanno dimensione 1: V
= C, perci`o (S V ) V
= S V .
Otteniamo allora la decomposizione
V V
= S2 V S1,1 V,

S2 V
= S 2 V,

S1,1 V
= 2 V,

che `e quella dellEsempio 3.1.3. Infatti, si ha (vedi 2.4.5):


c2 (v1 v2 ) = (1 + (12))(v1 v2 ) = v1 v2 + v2 v1 = 2v1 v2 ,
e similmente,
c1,1 (v1 v2 ) = (1 (12))(v1 v2 ) = v1 v2 v2 v1 = 2v1 v2 .
3.2.8 Il prodotto alternante in T m V . Lapplicazione canonica
: T m V m V,

v1 v2 . . . vm 7 v1 v2 . . . vm ,

ristretta a S(1,1,...,1) V induce un isomorfismo

S(1,1,...,1) V = c T m V m V,

3 TENSORI E GRUPPO SIMMETRICO

51

per v1 v2 . . . vm T m V e = (1, 1, . . . , 1) si ha:


c (v1 v2 . . . vm ) =

(g)vg(1) vg(2) . . . vg(m) 7 (m!)(v1 v2 . . . vm ).

gSm

Si noti che se dim V < m, si ha S1,1,...,1 V = m V = 0. In generale si ha (vedi 3.2.11):


S V = 0

se = (m1 , m2 , . . . , mr ) e dim V < r.

3.2.9 Il prodotto simmetrico in T m V . Il sottospazio Sm V di T m V `e detto lm-esimo


prodotto simmetrico di V ed `e scritto S m V . Per v1 , . . . , vm V si definisce il loro prodotto
simmetrico, che sta in S m V , come
X
vg(1) vg(2) . . . vg(m) .
v1 v2 . . . vm := (m!)1 cm (v1 v2 . . . vm ) = (m!)1
gSm

Si noti che v1 . . . vm `e limmagine di v1 . . . vm mediante il proiettore sullo spazio degli


invarianti (vedi 2.2.6). In particolare, per ogni g Sm si ha:
v1 v2 . . . vm = vg(1) vg(2) . . . vg(m) .
Sia e1 , . . . , en una base di V , allora una base di S m V `e data dalle
ei1 ei2 . . . eim

con i1 i2 . . . im .

In modo simile a 1.3.3, ma considerando applicazioni simmetriche invece di applicazioni


alternanti, si possono definire i sottospazi Ik di T k V nel modo seguente:
I2 = h. . . , v1 v2 v2 v1 , . . .iv1 ,v2 V ,

Ik = Ik1 V V Ik1

( T k V ).

Allora si ha v1 v2 = v2 v1 in T 2 V /I2 e poi v1 . . . vm = vg(1) . . . vg(m) in T m V /Im


per ogni g Sm . In particolare,
v1 v2 . . . vm = v1 v2 . . . vm

( T m V /Im ).

Si pu`o mostrare che T m V /Im


= S m V e spesso si scrive (come anche per il prodotto )
semplicemente v1 v2 . . . vm per lelemento v1 v2 . . . vm di T m V /Im .
La struttura di algebra su T (V ) = m T m V (vedi 1.3.3) induce una struttura di algebra
su S V := T V /I, dove I = I2 I3 . . ., detta lalgebra simmetrica generata da V . Si ha un
isomorfismo tra lalgebra simmetrica su V e lanello dei polinomi in n = dim V variabili:
S V =

M
m=0

S m V C[x1 , . . . , xn ],

ei1 ei2 . . . eim 7 xi1 xi2 . . . xim .

3 TENSORI E GRUPPO SIMMETRICO

52

3.2.10 La dimensione di S V . Sia = (m1 , m2 , . . . , mr ) una partizione di m. Allora si


ha la seguente formula per la dimensione dello spazio vettoriale S V ([FH], Theorem 6.3(1) e
Excercise 6.4):
Yni+j
dim S V =
,
n = dim V,
h
ij
i,j
il prodotto `e sugli m = m1 +. . .+mr quadrati nel diagramma di Young di e hij `e il hooklength
del quadrato nel i-esima riga e j-esima colonna hij (vedi 2.4.6).
Qualche esempio:

= 3 1 ,
1

= 3 2 ,
2 1

m1

...
...

2 1 .

Se = (2, 1) ci sono tre quadrati con (i, j) = (1, 1), (1, 2), (2, 1) e hij `e come indicato nel
diagramma, quindi:
dim S2,1 V =

(n 1 + 1)(n 1 + 2)(n 2 + 1)
(n + 1)n(n 1)
n(n2 1)
=
=
.
311
3
3

Se = (2, 2) ci sono quattro quadrati con (i, j) = (1, 1), (1, 2), (2, 1), (2, 2) e quindi:
(n 1 + 1)(n 1 + 2)(n 2 + 1)(n 2 + 2)
n2 (n2 1)
dim S2,2 V =
=
.
3221
12
Se = (m), allora ci sono m quadrati con (i, j) = (1, 1), (1, 2), . . . , (1, m) e:
dim Sm V = dim S m V =

(n 1 + 1)(n 1 + 2) (n 1 + m)
=
m(m 1) 1

m+n1
m

che `e un coefficiente binomiale. Similmente, si calcola:


dim S3,1 =

(n + 2)(n + 1)n(n 1)
,
8

dim S2,1,1 =

(n + 1)n(n 1)(n 2)
,
8

e si verifica che dim S1,1,...,1 V = dim m V = (nm ).


3.2.11 Loperatore b . In generale, non `e facile identificare il sottospazio S V = c T m V di
T m V . Si ricordi (vedi 2.4.3) che c = a b e che b `e dato da:
X
b :=
(g)eg ,
Q = S 1 S 2 . . . S s ,
gQ

dove i `e il numero dei quadrati nella i-esima colonna del diagramma di Young di . Si noti
che 1 = r, il numero delle righe. Cio`e ogni g Q `e un prodotto g1 g2 gs = gs gs1 g1 ,

3 TENSORI E GRUPPO SIMMETRICO

53

in modo unico, di permutazioni gj Sj , e gj permuta soltanto i numeri nei quadrati nella


j-esima colonna. Questo ci permette di scrivere:


 X
 X
 X
(g1 )eg1 .
b :=
(gs )egs
(gs1 )egs1
gs Ss

g1 S1

gs1 Ss1

Poiche i numeri nella prima colonna sono 1, 2 . . . , 1 , si ha:



 X
(g1 )eg1 (V . . . V ) = (1 V ) (V . . . V ) .
|
{z
}
{z
}
|
g1 S1

m1

In questo modo, si ottiene:


b (T m V ) = (1 V ) (2 V ) . . . (s V )

( T m V ).

Si noti che b (T m V ) = 0 se uno dei j V = 0, cio`e se j > dim V . Poiche 1 2 . . . s


e 1 = r, b (T m V ) = 0 se r > dim V . In tal caso anche S V = a b (T m V ) = 0.
3.2.12 Una base di S V e diagrammi di Young. Sia e1 , . . . , en una base di V , allora
esiste un modo efficiente per trovare una base di S V . Sia una partizione di m e sia n =
dim V . Esiste una base di S V tale che i vettori di base sono in corrispondenza biunivoca con
i tableau semistandard di Young ([FH], Problem 6.15 ). Un tableau semistandard di Young
`e il diagramma di Young di dove in ogni quadrato compare un intero dellinsieme {1, . . . , n}
in modo tale che i numeri in ogni colonna siano in ordine strettamente crescente (ai+k,j > ai,j
se ai,j `e lintero nel quadrato nelli-esima riga e j-esima colonna) mentre gli interi in ogni riga
siano in ordine non-decrescente (ai,j+k ai,j ). La prima condizione corrisponde al fatto che
S V (1 V ) . . . (s V ).
Per esempio, gli otto vettori di base di S2,1 V , con dim V = 3 corrispondono ai seguenti
tableau semistandard:
11 ,
2

3.3

11 ,
3

22 ,
3

12 ,
2

13 ,
3

23 ,
3

13 ,
2

12 .
3

Esempi: T 3 V e T 4 V .

3.3.1 La decomposizione di T 3 V . Sia m = 3. Ci sono tre partizioni di 3: 3, 2 + 1, 1 + 1 + 1


e le rappresentazioni corrispondenti di S3 hanno dimensione 1, 2, 1 rispettivamente. Perci`o il
Teorema 3.2.6, insieme a 3.2.9 e 3.2.8, ci d`a:
V V V
= S(3) V (S2,1 V )2 S1,1,1 V
= S 3 V (S2,1 V )2 3 V.
La rappresentazione S2,1 V di GL(V ) `e limmagine del simmetrizzatore di Young c2,1 : T 3 V
T 3 V . Si ha (vedi 2.4.5):
c2,1 = a2,1 b2,1 = (ee + e(13) )(ee e(12) ) = ee + e(13) e(12) e(123) .

3 TENSORI E GRUPPO SIMMETRICO

54

Si noti che
b2,1 (v1 v2 v3 ) = v1 v2 v3 v2 v1 v3 = 2(v1 v2 ) v3 .
Quindi, come abbiamo gi`a visto in generale in 3.2.11,
imb2,1 = (2 V ) V.
Ora si ha: S2,1 V = a2,1 (b2,1 T 3 V ) = a2,1 ((2 V ) V ). Con a2,1 = e + e(13) si calcola:
(e + e(13) )(v1 v2 v3 v2 v1 v3 )) = v1 v2 v3 v2 v1 v3 + v3 v2 v1 v3 v1 v2 ,
quindi
c2,1 (v1 v2 v3 ) = 2(v1 v2 ) v3 + 2v3 (v2 v1 ).
In particolare, S2,1 V non `e contenuto in (2 V ) V . Posto
(S 2 V )13 V := hw1 w2 w3 + w3 w2 w1 : wi V i

( T 3 V ),

si ha che S2,1 V (S 2 V )13 V . Per capire meglio come `e fatto lo spazio S2,1 V , si noti che
lapplicazione data dal simmetrizzatore c3 : T 3 V S 3 V , v1 v2 v3 7 v1 v2 v3 (vedi
3.2.9) ristretto a (S 2 V )13 V manda ogni elemento del sottospazio S2,1 V di T 3 V in zero:
c3 (c2,1 (v1 v2 v3 )) = c3 (v1 v2 v3 v2 v1 v3 + v3 v2 v1 v3 v1 v2 )
= v1 v2 v3 v2 v1 v3 + v3 v2 v1 v3 v1 v2
= 0.
Usando la formula per la dimensione degli S V mostriamo che
S2,1 V = ker( : (S 2 V )13 V S 3 V ).
` facile vedere che `e suriettiva, quindi
E
dim ker() = dim((S 2 V )13 V ) dim S 3 V =

n+1
2

n+2
3

n(n2 1)
= dim S2,1 V,
3

e perci`o ker(c3 ) = S2,1 V .


Si noti che t 7 (23)t d`a un isomorfismo (che commuta con lazione di GL(V )):
(S 2 V )13 V
= (S 2 V ) V := h(w1 w3 ) w2 = w1 w3 w2 + w3 w1 w2 : wi V i.
In generale si ha (vedi [FH], p.79) che Sd,1
= ker((S d V ) V S d+1 V ).
3.3.2 Una base di S2,1 V . Non `e difficile verificare la formula per la dimensione di S2,1 V .
Sia e1 , . . . , en una base di V . Una base di T 3 V `e data dagli eijk := ei ej ek . Quindi
S V = c2,1 T 3 V , con c2,1 = ee e12) + e(13) e(123) `e generato dagli
fijk := c2,1 eijk = eijk ejik + ekji ekij

(eijk := ei ej ek ).

3 TENSORI E GRUPPO SIMMETRICO

55

Si verifica facilmente che:


fijk = fjik ,

fikj = fkij ,

fjki = fkji ,

fijk + fkij + fjki = 0.

In particolare, fijk = 0 se i = j = k (infatti, eiii S 3 V ). Limmagine del sottospazio tridimensionale di T 3 V generato da eiij , eiji , ejii , con i 6= j, ha dimensione uno ed `e generato da
fiji = fjii perche c2,1 eiij = 0. Se i, j, k sono distinti, limmagine del sottospazio sei dimensionale generato dai e(i)(j)(k) , dove varia tra le permutazioni di {i, j, k}, ha dimensione due.
Una base dellimmagine `e data da fijk e fikj . Il numero di vettori di base `e allora facile da
contare:
n(n2 1)
.
dim S2,1 V = n(n 1) + 2 (n3 ) =
3
Nel caso n = 3, la corrispondenza tra i tableau semistandard di 3.2.12 e i vettori di base
fijk `e data da
i k

c2,1 (ei ej ek ) = fijk .


j

3.3.3 Lo spazio S2,1 V e tensori alternanti. Come osservato prima, il sottospazio W


=
Vn
= (S V ) V `e definito in modo intrinseco da T m V , mentre il sottospazio S V dipende
da varie scelte non intrinseche. Per ogni x C[Sm ], la moltiplicazione per x d`a unapplicazione
GL(V )-equivariante S V xS V . Poiche S V `e una rappresentazione irriducibile per GL(V ),
se xS V 6= 0, questapplicazione `e un isomorfismo.
Consideriamo per esempio = (2, 1) e x = ee e(12) C[S3 ]. Usando:
e(12) (c21 (v1 v2 v3 )) = v2 v1 v3 v1 v2 v3 + v2 v3 v1 v1 v3 v2 ,
otteniamo che
(ee e(12) )(c21 (v1 v2 v3 )) = 2(v1 v2 ) v3 (v2 v3 ) v1 (v1 v3 ) v2 ,
e quindi

S2,1
= (ee e(12) )S2,1 (2 V ) V.

Una certa combinazione lineare di questi elementi `e pi`


u semplice:
xc2,1 (v1 v2 v3 v1 v3 v2 ) = 3((v1 v2 ) v3 + (v1 v3 ) v2 ).
Si verifica che lapplicazione naturale : T 3 V 3 V , data da (v1 v2 v3 ) = v1 v2 v3 ,
manda ogni elemento del sottospazio (ee e(12) )S2,1 di T 3 V in zero ed `e suriettiva. Quindi
dim ker() = dim((2 V ) V ) dim 3 V = (n2 ) n (n3 ) =
e perci`o ([FH], p.76)

n(n2 1)
= dim S2,1 V,
3

S2,1 V
= ker( : (2 V ) V 3 V ).

3 TENSORI E GRUPPO SIMMETRICO

56

In generale, S2,1,...,1 V
= ker(m1 V V m V ) ([FH], p.79).
Nel libro [FH] p.76, lo spazio S2,1 V `e definito usando un certo simmetrizzatore di Young e
lazione a destra, e il loro spazio `e generato dalle
v1 v2 v3 + v2 v1 v3 v3 v2 v1 v3 v1 v2 (2 V )13 V,
cio`e, questi generatori sono antisimmetrici rispetto allazione di (13). E facile vedere che lo
spazio generato da questi elementi `e (23)xc2,1 T 3 V (S V ) V , e quindi `e isomorfo, come
rappresentazione di GL(V ), al nostro spazio S V .
3.3.4 La decomposizione di T 4 V . Sia m = 4, ci sono cinque partizioni di 4:
(4), (3, 1), (2, 2), (2, 1, 1), (1, 1, 1, 1) e le rappresentazioni corrispondenti di S4 hanno dimensione
1, 3, 2, 3, 1 rispettivamente. Perci`o il Teorema 3.2.6, in combinazione con 3.2.9 e 3.2.8, si da:
V V V V
= S 4 V (S3,1 V )3 (S2,2 V )2 (S2,1,1 V )3 4 V.
Consideriamo il sottospazio S2,2 = c2,2 T 4 V di T 4 V . Come nellesempio 3.3.1 si ha:
b2,2 T 4 V = (2 V ) (2 V )

(V V ) (V V ).

In questo caso non `e facile descrivere a2,2 (b2,2 T 4 V ). Visto che a2,2 = (ee + e(13) )(ee + e(24) ) si
ha:
a2,2 T 4 V = (S 2 V )13 (S 2 V )24 V V V V,
quindi S2,2 V = a2,2 (b2,2 T 4 V ) (S 2 V )13 (S 2 V )24 . Poiche lazione di S4 commuta con quella
di GL(V ), lo spazio (23)S2,2 V `e isomorfo, come rappresentazione di GL(V ) a S2,2 e si ha:
S2,2 V
= (23)S2,2 V (S 2 V ) (S 2 V )

(V V ) (V V ).

Si ha una decomposizione di GL(V )-rappresentazioni:


(S 2 V ) (S 2 V )
= S 2 (S 2 V ) 2 (S 2 V ).
Un elemento di (S 2 V ) (S 2 V ) `e una combinazione lineare di tensori del tipo:
(ei ej ) (ek el ) = fijkl + fjikl + fijlk + fjilk

(S 2 V ) (S 2 V )

dove gli ei sono una base di V e fijkl = ei ej ek el . Poi un elemento in S 2 (S 2 V ) `e


combinazione lineare di tensori del tipo:
gijkl := (ei ej ) (ek el ) + (ek el ) (ei ej )

S 2 (S 2 V ).

Lasciamo al lettore il piacere di verificare che


(23)c2,2 (fijkl ) = gikjl gjkil

( S 2 (S 2 V )).

Quindi limmagine dellapplicazione (23)c2,2 : T 4 V T 4 V `e contenuta in S 2 (S 2 V ) e perci`o


(23)S2,2 V S 2 (S 2 V ).

3 TENSORI E GRUPPO SIMMETRICO

57

La restrizione dellapplicazione
c4 : T 4 V S 4 V,

fijkl 7 ei ej ek el

a S 2 (S 2 V ) manda gikjl gjkil nello 0 ed `e suriettiva. Calcolando le dimensioni si vede che


S2,2 V
= (23)S2,2 V = ker(c4 : S 2 (S 2 V ) S 4 V ),
infatti
dim S 2 (S 2 V ) dim S 4 V

=
=
=

(n(n+1)/2)n(n+1)/2+1
(n+3)(n+2)(n+1)n
2
24
n(n+1)(3(n(n+1)+2)(n+3)(n+2))
24
n2 (n2 1)
12

= dim S2,2 V.
3.3.5 La rappresentazione S2,2 V e S 2 (2 V ). Per la geometria riemanniana c`e unaltra
copia della GL(V )-rappresentazione S2,2 in T 4 V che `e di grande interesse (vedi [FH], Exc. 23.38,
2
p.427). Si ricordi che S2,2 V V2,2
T 4 V , e che in 3.3.4 abbiamo visto che ci sono le
= S2,2
due copie S2,2 V := c2,2 T 4 V e (23)S2,2 V = e23 S2,2 , quindi ogni altra copia di S2,2 V in T 4 V `e
ottenuta come (aee + be(23) )S2,2 V per certi a, b C.
Ora consideriamo il sottospazio
S 2 (2 V ) , (2 V ) (2 V ).
Se le ei sono una base di V , questo spazio `e generato dalle
hijkl := (ei ej ) (ek el ) = fijkl fjikl fijlk + fijlk + fklij flkij fklji + flkji .
dove fijkl = ei ej ek el . Lasciamo verificare al lettore che
2c22 fijkl + (13)c2,2 fijkl = 2hijkl + hikjl hiljk S 2 (2 V ).
Perci`o S 2 (2 V ) contiene (2ee + e(23) )S2,2 , che `e una copia di S2,2 . Si verifica anche, usando
3.2.10, che
S2,2 V
= (2ee + e(23) )S2,2 V = ker(c4 : S 2 (2 V ) 4 V ).

4 GEOMETRIA DIFFERENZIALE

58

Geometria differenziale

Testi consigliati: [dC], [D], [DNF1], [DNF2], [T], [Wa].

4.1

Richiami di analisi.

4.1.1 Diffeomorfismi. Sia U Rm un sottoinsieme aperto. Lalgebra delle funzioni lisce su


U si indica con C (U ). Sia
F = (F1 , F2 , . . . , Fn ) : U Rn
unapplicazione liscia, cio`e ogni Fi : U R `e in C (U ). Unapplicazione liscia F : U V :=
F (U ) ( Rn ) `e detta diffeomorfismo su U se esiste una mappa liscia G : V U tale che
F G = idF (U ) e G F = idU . In tal caso si ha m = n.
La matrice jacobiana di F in p U `e la matrice n m definita da:

(F1 /t1 )(p) . . . (F1 /tm )(p)

..
..
Jp (F ) =
( Mn,m (R)),

.
.
(Fn /t1 )(p) . . . (Fn /tm )(p)
dove le ti sono le coordinate su Rm . Per x Rm , il vettore Jp (F )x Rn `e dato da:
Jp (F )x = (dF (p + tx)/dt)|t=0 ,
quindi Jp (F ) determina il comportamento di F vicino a p. Per esempio si ha:
4.1.2 Teorema della funzione inversa. Sia U un aperto in Rm e sia F : U Rm
unapplicazione liscia. Supponiamo che la matrice jacobiana Jp (F ) sia invertibile in un punto
p U . Allora esiste un intorno aperto U 0 di p tale che F (U 0 ) `e aperto e che l applicazione
F|U 0 : U 0 F (U 0 ) `e un diffeomorfismo.

4.2

Variet`
a differenziabili

4.2.1 Definizione di variet`


a. Sia M uno spazio topologico non-vuoto di Hausdorff. Una
carta locale di M `e una coppia (U, ) dove U M `e un aperto e : U (U ) ( Rm ) `e un
omeomorfismo. Due carte locali (U, ), (V, ) sono dette compatibili se
1 : (U V ) (U V )
`e un diffeomorfismo. Si noti che in tal caso anche ( 1 )1 = 1 `e un diffeomorfismo.
Un atlante di M `e una collezione {(Ui , i )iI di carte locali compatibili tale che M = iI Ui .
Se M `e connesso segue che il numero intero m non dipende della carta dell atlante ed `e detto
dimensione di M .

4 GEOMETRIA DIFFERENZIALE

59

Sia A = {(Ui , i )}iI un atlante di M e sia (V, ) una carta locale compatibile con tutte le
(Ui , i ). Allora anche {(Ui , i )}iI {(V, )} `e un atlante di M .
Prendendo quindi lunione di tutte le carte compatibili con un atlante dato, otteniamo un
atlante massimale, cio`e un atlante che non `e propriamente contenuto in nessun altro atlante.
In particolare, ogni atlante di M `e contenuto in un unico atlante massimale.
Una variet`a differenziabile `e una coppia (M, A) dove M `e uno spazio topologico non-vuoto
di Hausdorff ed A `e un atlante massimale di M . Si richiede inoltre che la topologia di X sia a
base numberabile, condizione tecnica verificata per gli esempi considerati in queste note.
Un esempio di variet`a `e lo spazio vettoriale Rn , con la topologia euclidea, con latlante
massimale definito dallatlante, con una sola carta locale, {(Rn , idRn )}. Un sottoinsieme aperto
U di una variet`a M , con le restrizioni delle carte locali di M ad U , `e una variet`a.
Sia (U, ) una carta di M . Si noti che per ogni diffeomorfismo : (U ) ((U )) Rm ,
anche (U, ) `e una carta di M . In particolare, se p U e (x) = x (p), la carta locale
(U, := ) soddisfa (p) = 0.
4.2.2 Applicazioni lisce.
rispettivamente. Sia

Siano M, N variet`a differenziabili di dimensione m ed n


f : M N

unapplicazione continua. Lapplicazione f `e detta liscia in p M se per ogni carta (U, ) di


M , con p U , e ogni carta (V, ) di Y , con f (p) V , lapplicazione
f 1 : (U f 1 (V )) (V )

( Rn )

`e liscia in (p) (U f 1 (V )) ( Rm ). Se scriviamo F = f 1 , allora F = (F1 , . . . , Fn )


`e definita sullaperto (U f 1 (V )) di Rm che contiene (p) e f liscia in p vuole dire che ogni
Fi `e liscia nel punto (p).
Per verificare se f `e liscia in p M basta verificarlo per una sola carta (U, ) e una sola
carta (V, ) perche se (U 0 , 0 ), (V 0 , 0 ) sono altre carte, si ha:
0 f (0 )1 = ( 0 1 ) f 1 ( (0 )1 ).
Poiche le mappe 0 1 , (0 )1 sono diffeomorfismi, e per ipotesi f 1 `e liscia, segue
che lapplicazione 0 f (0 )1 `e liscia.
Lapplicazione f `e detta liscia se `e liscia in ogni p M . E facile verifcare che la composizione
di due applicazioni liscie `e liscia.
4.2.3 Funzioni lisce. Un caso particolare di applicazioni lisce sono quelle della forma
f : V R
dove V `e un aperto in una variet`a M . Lalgebra delle funzioni lisce su V `e denotato con C (V ).
Un esempio importante di funzioni lisce `e quello delle funzioni coordinate di una carta. Sia
(U, = (x1 , . . . , xm )) una carta di M , allora xi C (U ), per ogni i = 1, . . . , m, perche se
(t1 , . . . , tm ) = (p) (U ) Rm allora:
(xi 1 )(t1 , . . . , tm ) = xi (p) = ti

4 GEOMETRIA DIFFERENZIALE

60

e la funzione (t1 , . . . , tm ) 7 ti `e ovviamente liscia.


4.2.4 Il rango di una mappa liscia. Sia f : M N una mappa liscia tra variet`a di
dimensione m e n rispettivamente. Sia p M e siano (U, ), (V, ) carte di M e N con p U e
f (p) V . Allora F = (F1 , . . . , Fn ) := f 1 `e una mappa liscia su un intorno di (p) Rm
e la sua matrice jacobiana in (p) `e:


J(p) (F ) := (Fi /tj )((p))
dove t1 , . . . , tm sono le coordinate su Rm .
Il rango di f in p `e definito come il rango della matrice J(p) (F ).
Questa definizione non dipende dalle scelta delle carte. Se invece di F consideriamo G =
F dove e sono diffeomorfismi locali, allora, poiche J(G) = J()J(F )J() e J(),
J() sono applicazioni lineari invertibili, segue che il rango di J(G) `e uguale a quello di J(F ).
4.2.5 Sommersioni. Sia f : M N unapplicazione liscia tra variet`a di dimensione m e n
rispettivamente. Lapplicazione `e detta sommersione in p M se il rango di f in p `e uguale a
n = dim N . In tal caso, dim M dim N e f ha rango massimale in p M .
4.2.6 Sottovariet`
a. Un sottoinsieme K M `e una sottovariet`a di M se per ogni p K
esiste una carta (U, = (x1 , . . . , xn )) di M con p U e tale che
K U = {q M : xr+1 (q) = . . . = xm (q) = 0 }
per qualche r, cio`e, tramite lomeomorfismo : U (U ) Rm , limmagine di K (pi`
u
precisamente: di K U ) `e un aperto di un sottospazio lineare di Rm .
Una sottovariet`a `e una variet`a che ha per carte gli (U K, = (x1 , . . . , xr )) con (U, ) come
sopra. Si verifica facilmente che linclusione i : K , M `e unapplicazione liscia. In particolare,
la restrizione a K di una funzione liscia su M `e liscia.
Un risultato importante `e il seguente teorema.
4.2.7 Teorema. Sia f : M N `e unapplicazione liscia tra variet`a di dimensione m e n
rispettivamente. Sia q N tale che f `e una sommersione in ogni p f 1 (q). Allora f 1 (q) `e
una sottovariet`a di dimensione r = m n di M .
4.2.8 Esempio: la sfera. Sia F : Rn+1 R la mappa definita da F (x) = x21 + . . . + x2n+1 .
Usando le carte locali sulle variet`a Rn+1 e R che sono individuate dalle identit`a, si ha:
F (x) =

n+1
X

x2i ,

Jx (F ) = (2x1 2x2 . . . 2xn+1 ).

i=1

Quindi se x 6= 0 la matrice Jx (F ) ha rango 1 = dim R e concludiamo che F `e una sommersione


sullaperto Rn+1 {0} di Rn+1 .

4 GEOMETRIA DIFFERENZIALE

61

Dal Teorema 4.2.7 segue allora che F 1 (1) `e una sottovariet`a di Rn+1 , quindi la sfera di
dimensione n `e una variet`a:
X
S n = {x Rn+1 :
x2i = 1 } = F 1 (1).
4.2.9 Esempio: il gruppo SL(n, R).
determinante 1 `e una variet`a. Sia

Mostriamo che il gruppo delle matrici con

2
F = det : Mn (R)
= Rn R,

A = (aij ) 7 det(A).

Per calcolare det /xij si sviluppi il determinante della matrice X = (xij ) rispetto li-esimo
riga:
n
X
det(X) = det(xij ) =
(1)i+j xij det(Xij )
j=1

dove Xij Mn1 (R) `e la matrice ottenuta cancellando li-esima riga e la j-esima colonna della
matrice X. Poiche in questa formula xij compare soltanto davanti a det(Xij ), si ha
det /xij = (1)i+j det(Xij ).
Quindi la matrice JX (F ), con una sola riga e n2 colonne, ha rango massimale se det(Xij ) 6= 0
per almeno una coppia i, j. La formula qui sopra mostra inoltre che det(X) 6= 0 implica che
almeno uno delle det(Xij ) `e non-zero.
Quindi, per X nell aperto GL(n, R) di Mn (R), dato dalle matrici con det(A) 6= 0, JX (F )
ha rango massimale. Perci`o det `e un sommersione su
SL(n, R) = {A Mn (R) : det(A) = 1 } = F 1 (1).
Dal teorema segue che SL(n, R) `e una variet`a. La dimensione di SL(n, R) `e n2 1.
Un altro modo di mostrare che det ha rango massimale su GL(n, R) `e di usare il fatto che
per una mappa liscia : R Mn (R) si ha:
J0 (det ) = J(0) (det)J0 (),
dove si noti che J0 (det ) = (d/dt)(det())(0) `e una matrice 1 1. Sia X GL(n, R) e
definiamo (t) = (1 + t)X Mn (R). allora (0) = X e
J0 (det ) = ((d/dt)(det((1 + t)X))|t=0
= ((d/dt)((1 + t)n det(X))|t=0
= (n(1 + t)n1 det(X))|t=0
= n det(X) 6= 0
quindi anche J(0) (det) = JX (det) 6= 0 e siccome JX (det) ha soltanto una riga, concludiamo
che det ha rango massimale in X GL(n, R).

4 GEOMETRIA DIFFERENZIALE

62

4.2.10 Esempio: il gruppo O(n,R). Il gruppo ortogonale reale `e il sottogruppo di GL(n, R)


definito da
O(n, R) := {A Mn (R) : t AA = I },
in particolare, per A O(n, R) si ha A1 = t A. Per mostrare che O(n, R) `e una sottovariet`a
di GL(n, R), definiamo prima
Symn (R) := {X Mn (R) : t X = X },
cio`e, Symn (R) `e lo spazio vettoriale reale delle matrici n n simmetriche. Si noti che
dim Symn (R) = n(n + 1)/2. Definiamo poi unapplicazione liscia tra spazi vettoriali:
F : Mn (R) Symn (R),

A 7 t AA,

e notiamo che O(n, R) = F 1 (I). Mostriamo che F `e una sommersione su F 1 (I).


Sia A F 1 (I), dobbiamo mostrare che JA (F ) ha rango massimale, oppure, equivalentemente, che JA (F ) `e unapplicazione suriettiva. Se consideriamo JA (F ) come matrice con
2
n2 colonne e n(n + 1)/2 righe, allora per X Mn (R) che corrisponde a x Rn si ha che
JA (F )x = y Rn(n+1)/2 , dove y corrisponde alla matrice simmetrica Y data da:
Y =

d
F (A
d

+ X)|=0

se y = JA (F )x.

Per A F 1 (I) e X Mn (R), si ha:


d
F (A
d

+ X)|=0 =

d t
( (A
d

+ X)(A + X))|=0

d t
( AA
d

+ (t AX + t XA) + 2 (t XX))|=0

AX + t XA.

Si noti che t AX + t XA = 0 equivale a t AX = t XA e, poiche t XA = t (t AX), questo equivale inoltre a t AX = t (t AX), cio`e t AX `e una matrice antisimmetrica. Poiche A `e invertibile
otteniamo un isomorfismo

=
ker(JA (F ))
= {X Mn (R) : t AX = t (t AX) } {Z Mn (R) : t Z = Z},

X 7 t AX,

con inversa Z 7 t A1 Z. Quindi dim ker(JA (F )) = n(n 1)/2 per ogni A F 1 (I) e perci`o
dim im(JA (F )) = n2 n(n 1)/2 = n(n + 1)/2 = dim Symn (R). Concludiamo che JA (F ) ha
rango massimale per ogni A F 1 (I) e quindi che F `e una sommersione su O(n, R).
Si ricordi che O(n, R) ha due componenti connesse: una `e il gruppo
SO(n, R) = {A O(n, R) : det(A) = 1 },
laltra `e data dalle matrici A O(n, R) con det(A) = 1. Abbiamo mostrato che entrambe
sono variet`a di dimensione n(n 1)/2.

4 GEOMETRIA DIFFERENZIALE

4.3

63

Spazi e fibrati tangenti

4.3.1 Lo spazio tangente. Sia M una variet`a differenziabile di dimensione m e sia p M .


Lalgebra dei germi delle funzioni lisce in p `e
C (M, p) := {(U, f )}/
dove U `e un intorno aperto di p e f : U R `e una funzione liscia. Per tali (U, f ), (V, g) si
definisce (U, f ) (V, g) se f = g su un intorno di p. Quindi la classe, il germe, di f dipende
soltanto dal comportamento di f molto vicino a p. Di solito scriveremo semplicemente f
invece di [(U, f )] per il germe definito da (U, f ).
Una derivazione su C (M, p) `e unapplicazione

v(f + g) = v(f ) + v(g),

v : C (M, p) R,
t.c.
v(f g) = f (p)v(g) + g(p)v(f ),
per f, g C (M, p) e , R, cio`e v `e R-lineare e soddisfa la regola di Leibnitz. Linsieme
delle derivazioni su C (M, p) `e uno spazio vettoriale reale tramite
(v + w)(f ) := v(f ) + w(f )

(, R, f C (M, p)),

dove v, w sono derivazioni su C (M, p). Questo spazio vettoriale `e detto spazio tangente di M
in p e si scrive Tp M . Una derivazione in Tp M si chiama vettore tangente.
Esempi di tali derivazioni si ottengono nel modo seguente. Sia (U, = (x1 , . . . , xm ) una
carta di M dove p U . Si definisce
(/xi )|p : C (M, p) R,

(/xi )|p (f ) :=

(f 1 )
((p)),
ti

dove i ti sono coordinate su Rm . Si noti che f 1 `e liscia su un intorno di (p) in Rm . E


facile verificare che (/xi )|p Tp M .
4.3.2 Una base dello spazio tangente. Si pu`o mostrare che i (/xi )|p , 1 i m, definiti
come sopra,
Psono una base di Tp M , in particolare, dim Tp M = dim M = m. Sia v Tp M ,
allora v = ai (/xi )|p per certe ai R. Poiche xi C (M, p) e si ha:
(/xi )|p (xj ) = ij
con ij la delta di Kronecker, i coefficienti ai di v sono determinati da:
v(xj ) =

m
X

ai (/xi )|p (xj ) = aj .

i=1

In particolare, se (V, = (y1 , . . . , ym )) `e unaltra carta di M con p V , allora abbiamo anche


i vettori tangenti (/yi )|p Tp M . Per esprimere questi vettori tangenti come combinazione
lineare delle (/xi )|p si noti:
(/yj )|p =

m
X
i=1

cij (/xi )|p

con cij = (/yj )|p (xi ),

4 GEOMETRIA DIFFERENZIALE

64

che generalizza la ben nota formula /yj =

i (xi /yj )/xi .

4.3.3 Vettori tangenti e cammini. Un altro modo di definire un vettore tangente in Tp M


`e il seguente. Sia  > 0 e
: ] , [ M,
(0) = p
unapplicazione liscia, detto cammino. Definiamo


: C (M, p) R,

(f ) :=

df
d


.
| =0

E facile mostrare che Tp M .


Viceversa,
data una carta (U, = (x1 , . . . , xm )) di M con p U e un vettore tangente
P
v = ai (/xi )|p Tp M , sia a = (a1 , . . . , am ) Rm . Definiamo un cammino
: ] , [ M,

( ) = 1 ((p) + a)

con  tale che (p) + a (U ) per ] , [. Si verifica che = v, quindi ogni vettore
tangente si ottiene tramite un cammino.
4.3.4 Lo spazio tangente ad uno spazio vettoriale. Un caso importante, anche se banale,
`e M = V , uno spazio vettoriale reale di dimensione finita. Per p V si ha un isomorfismo
naturale tra V e Tp V nel modo seguente:

V Tp V,

a 7 ,

con ( ) = p + a.
P
Se V = Rm , lisomorfismo `e dato da a = (a1 , . . . , am ) 7
ai (/ti )|p . Questo isomorfismo
verr`a usato in varie occasioni in futuro.
4.3.5 Il differenziale di unapplicazione liscia. Sia f : M N unapplicazione liscia tra
variet`a di dimensione m e n rispettivamente. Per p M definiamo unapplicazione lineare, il
differenziale di f in p:
(df )p : Tp M Tf (p) N,

v 7 [g 7 v(g f )]

dove v Tp M e g C (N, f (p)) (e quindi g f C (M, p)).


Se Tp M `e definito da un cammino , allora (df )p Tf (p) N `e definito dal cammino
f perche per g C (N, f (p)):
((df )p )(g) = (g f ) = (d(g (f ))/d )| =0 = (f ) (g).
Siano (U, = (x1 , . . . , xm )) e (V, = (y1 , . . . , yn )) carte di M e N rispettivamente con p U
e f (p) V . Allora delle basi di Tp M e Tf (p) N sono i (/xi )|p e (/yj )|f (p) rispettivamente.
La matrice (vij ) dellapplicazione lineare (df )p `e data da:
(df )p ((/xj )|p ) =

n
X
i=1

vij (/yi )|f (p) .

4 GEOMETRIA DIFFERENZIALE

65

Usando (/yi )|f (p) (yj ) = ij si trova:



vij = (df )p ((/xj )|p (yi ) = (/xj )|p (yi f ).
Se scriviamo F = (F1 , . . . , Fn ) = f 1 allora Fi = yi f 1 e
vij = (/xj )|p (yi f ) = ((yi f 1 )tj )((p)) = (Fi /tj )((p)).
Ne concludiamo che il differenziale (df )p `e determinato dalla matrice jacobiana J(p) (F ).
4.3.6 Il differenziale di una funzione liscia. Sia f : M R una funzione liscia. Per
p M , il suo differenziale `e una mappa lineare
quindi (df )p Tp M := Hom(Tp M, R).

(df )p : Tp M Tf (p) R = R,

Qui sfruttiamo lisomorfismo Tf (p) R = R di 4.3.4. Il duale Tp M := (Tp M ) dello spazio tangente
Tp M `e detto spazio cotangente. Ogni f C (M, p) definisce allora un elemento (df )p Tp M .
Il differenziale `e dato dalla seguente identit`a:
(df )p : Tp M R,

(f C (M, p), v Tp M ).

(df )p (v) = v(f ),

Per verificare lidentit`a, si ricordi che lisomorfismo Tf (p) R


= R identifica (/t)|f (p) con

P
R. Sia g C (R, f (p)) e applichiamo la derivazione (df )p (v) Tf (p) R a g, scrivendo
v = ai (/xi )|p Tp M :
1 )

((df )p (v))(g) =

ai g(ft
i

ai g
(f (p)) (ft
t
i

((p))
1 )

((p))

= v(f )( t
)|f (p) (g),

che verifica che (df )p (v)) Tf (p) R corrisponde a v(f ) R.


Sia (U, = (x1 , . . . , xm )) una carta di M con p U , allora i (/xi )|p sono una base di
Tp M . Poiche
(dx)i )p ((/xj )|p ) = (/xj )|p (xi ) = ij ,
i (dxi )p Tp M sono la base duale di Tp M . Lelemento (df )p Tp M `e la seguente combinazione
lineare dei (dxi )p :
X
(df )p =
(/xi )|p (f )(dxi )p
i

come si verifica facilmente valutando entrambi i membri sui vettori tangenti (/xj )|p per
j = 1, . . . , n.
4.3.7 Il fibrato tangente. Sia M una variet`a differenziabile di dimensione m. Lunione
disgiunta degli spazi tangenti ad M `e denotata con
a
TM =
Tp M,
sia : T M M, v 7 p
pM

4 GEOMETRIA DIFFERENZIALE

66

se v Tp M . Sia (U, = (x1 , . . . , xm )) una carta locale di M . Allora per ogni p U , i vettori
tangenti (/xi )|p sono una base di Tp M . Quindi otteniamo una biezione

: T U := 1 (U ) U Rm (U ) Rm

( Rm Rm = R2m )

data da
v=

ai (/xi )|p 7 (p, (a1 , . . . , am )) 7 ((p), (a1 , . . . , am )).

Si noti che p = (v).


Si pu`o mostrare che esiste una topologia di Hausdorff su T M t.c. `e continua. In pi`
u, T M
`e una variet`a differenziabile, di dimensione 2m, con carte (T U, ) ottenute da carte (U, ) di
M come sopra. In particolare, : T U (U ) Rm `e un omeomorfismo.
Per esempio, se V `e uno spazio vettoriale, allora

V V T V,

(p, a) 7

con ( ) = p + a.
4.3.8 Esempio: il fibrato tangente a una sottovariet`
a. Sia f : M N una sommersione
1
su K = f (y) per un certo y N . Quindi K `e una sottovariet`a di M di dimensione r = m n
dove m = dim M , n = dim N (vedi 4.2.7). Per ogni p K lo spazio tangente Tp K `e una
sottospazio di Tp M . Se (U, = (x1 , . . . , xn )) `e una carta di M con p K U e tale che
K U = {x M : xr+1 (x) = . . . = xm (x) = 0 } allora Tp K `e lo sottospazio di Tp M con base
(/xi )|p per 1 i r.
Sia v Tp K definito da un cammino : ] , [ K. Allora f (( )) = y, un cammino
costante, per ogni perche f (K) = y. Quindi (df )p (v) = 0 Ty N cio`e Tp K ker((df )p ).
Poiche lapplicazione lineare (df )p `e suriettiva, perche (df )p `e dato dalla matrice jacobiana in
carte locali, segue che dim Tp K = dim K = n m `e uguale a dim ker((df )p ), perci`o:
Tp K = ker((df )p : Tp M Tf (p) N )

(p K).

Quindi, con significato ovvio, T K = ker(df : T M T N ).


4.3.9 Esempio: il fibrato tangente di S n . Si ricordi (vedi Esempio 4.2.8) che S n = f 1 (1)
dove
f : Rn+1 R,
x = (x1 , . . . , xn+1 ) 7 x21 + . . . + x2n+1
`e una sommersione sulla n-sfera S n . Quindi per x S n e y Tx Rn+1 = Rn+1 abbiamo che
y Tx S n se e solo se (df )x (y) = 2x1 y1 + . . . + 2xn+1 yn+1 = 0. Sia (, ) il prodotto scalare
euclideo standard su Rn+1 , (x, y) = x1 y1 + . . . + xn+1 yn+1 . Se non confondiamo le coppie (x, y)
con il prodotto scalare (x, y) abbiamo allora:
T S n+1 = {(x, y) Rn+1 Rn+1 = T Rn+1 : (x, x) = 1, (x, y) = 0 }.
Non `e difficile verificare che lapplicazione
F : Rn+1 Rn+1 R2 ,

(x, y) 7 ((x, x), (x, y))

4 GEOMETRIA DIFFERENZIALE

67

`e una sommersione su F 1 ((1, 0)). Quindi T S n `e una sottovariet`a di R2n+2 e questa struttura
di variet`a su T S n coincide con quella data dalle carte (T U, ) come in 4.3.7.
Nel caso n = 1, il fibrato tangente T S 1 `e diffeomorfo al prodotto S 1 R. Un tale
diffeomorfismo `e:
f : S 1 R T S 1 ,

((x1 , x2 ), t) 7 (x, y) = ((x1 , x2 ), t(x2 , x1 )).

Per dare qualche idea su come `e fatto il fibrato T S 2 , definiamo il fibrato tangente unitario:
T1 S 2 = {(x, y) T S 2 : (x, x) = (y, y) = 1, (x, y) = 0 }.
Si noti che ogni fibra 1 (x) di : T1 S 2 S 2 `e diffeomorfa a S 1 . E facile verificare che T1 S 2
`e una sottovariet`a di R3 R3 e quindi anche di T S 2 .
La variet`a T1 S 2 `e diffeomorfa a SO(3) = {A O(3) : det(A) = 1}. Si ricordi che una
matrice A = (a1 |a2 |a3 ), con colonne ai , sta in SO(3) esattamente se le colonne sono una
base ortonormale di R3 , quindi ||ai ||2 = (ai , ai ) = 1 e (ai , aj ) = 0 se i 6= j. Poi si ricordi
che dati due vettori x, y R3 il loro prodotto vettoriale x y `e perpendicolare a entrambi
e ||x y|| = ||x||||y||sen dove ]0, [ `e langolo tra i vettori x, y (nel piano hx, yi). In pi`
u,
det(x, y, x y) 0 in quanto i vettori x, y, x y sono ortientati. Da ci`o segue che lapplicazione
f : T S 2 SO(3),

(x, y) 7 A = (x|y|x y)

`e ben definita ed `e facile vedere che f e f 1 sono lisce.


4.3.10 Campi vettoriali. Sia M una variet`a differenziabile e sia : T M M il fibrato
tangente. Un campo vettoriale X su un aperto V di M `e unapplicazione liscia
X : V T V := 1 (V )

t.c. X = idV .

Si noti che (X(p)) = p implica che X(p) 1 (p) = Tp M . Quindi un campo vettoriale su V
d`a per ogni p V un vettore tangente X(p) in Tp M . Se (U, = (x1 , . . . , xm )) `e una carta di
M con U V allora per ogni p U si ha
X(p) = a1 (p)(/x1 )|p + . . . + am (p)(/xm )|p ,

(ai (p) R)

e X `e liscia su U equivale a dire che gli ai : U R sono funzioni lisce. Linsieme dei campi
vettoriali su V si indica con X (V ).
Dati i campi vettoriali X, Y X (V ) e le funzioni lisce f, g C (V ), definiamo un campo
vettoriale f X + gY su V come:
(f X + gY )(p) := f (p)X(p) + g(p)Y (p)

( Tp M ),

dove p V . Con questo operazione linsieme X (V ) `e un modulo sullalgebra C (V ), in


particolare, X (V ) `e un gruppo abeliano.
Dati X X (V ) e f C (V ) otteniamo una funzione liscia X(f ) su V nel modo seguente:
X(f )(p) := Xp (f ),

dove

Xp := X(p)

( Tp M )

4 GEOMETRIA DIFFERENZIALE

68

e dove p V . Per verificare che X(f ) `e liscia, si usaPlespressione locale per X data qui sopra:
se F = f 1 e t = (p) Rm allora X(f )(p) =
ai (1 (t))(F/ti )(t) che `e liscia perche
1
ai e F sono lisce su (U ).
4.3.11 Parentesi di Lie. Dati i campi vettoriali X, Y X (V ) su un aperto V M e una
funzione liscia f C (V ) la funzione Y (f ) `e liscia su V . Per p V consideriamo la mappa
f 7 Xp (Y (f ))

f C (V )).

( R,

Questa mappa non `e una derivazione in generale. Per esempio, se V = M = R, X = Y = /t


e p = a R allora Xp (Y (f )) = f 00 (a), ma lapplicazione f 7 f 00 (a) non soddisfa la regola di
Leibnitz. Pi`
u in generale, ogni campo vettoriale su R si scrive come g/t per g C (R). Se
X = g/t, Y = h/t, si ha:
Xp (Y (f )) = Xp (hf 0 ) = (ghf 00 + gh0 f 0 )|t=a = g(a)h(a)f 00 (a) + g(a)h0 (a)f 0 (a)
e si noti che la parte sbagliata `e g(a)h(a)f 00 (a): questa espressione `e per`o simmetrica in g, h
cio`e in X, Y .
Definiamo le parentesi di Lie [X, Y ] di due campi vettoriali X, Y X (V ) come:
[X, Y ]p (f ) := Xp (Y (f )) Yp (X(f ))

( R,

X, Y X (V ), p V, f C (V )).

Nellesempio si ottiene:
[X, Y ]p (f ) = (g(a)h(a)f 00 (a) + . . .) (. . . + h(a)g 0 (a)f 0 (a)) = (g(a)h0 (a) g 0 (a)h(a))f 0 (a)
e quindi [X, Y ]p `e una derivazione. Il campo vettoriale [X, Y ] `e allora dato da
[X, Y ] = (gh0 h0 g)/t,

(X = g/t, Y = h/t X (R)).

In generale, in coordinate locali si ha:


X
[X, Y ] =
(Xj Yi /xj Yj Xi /xj )/xi

(X =

Xi /xi , Y =

Yi /xi )

i,j

Le parentesi di Lie godono delle propriet`a seguenti:


[X, Y ] = [Y, X],

[X, [Y, Z]] + [Y, [Z, X]] + [Z, [X, Y ]] = 0

la seconda identit`a `e detta identit`a di Jacobi (si noti la permutazione ciclica degli argomenti).
Un altro modo di scrivere lidentit`a di Jacobi `e:
adZ ([X, Y ]) = [X, adZ (Y )] + [adZ (X), Y ]
dove adZ (V ) := [Z, V ]. In questa scrittura si vede che adZ soddisfa la regola di Leibnitz per il
prodotto dato dalle parentesi di Lie.

4 GEOMETRIA DIFFERENZIALE

4.4

69

Forme differenziali.

4.4.1 Il fibrato delle k-forme. Sia M una variet`a differenziabile di dimensione m. Per
p M abbiamo definito lo spazio cotangente Tp M = Hom(Tp M, R) e il suo k-esimo prodotto
esterno k Tp M , uno spazio vettoriale di dimensione (m
k ). Similmente alla definizione del fibrato
tangente si pu`o definire una variet`a differenziabile, il fibrato delle k-forme,
a
k (M ) :=
k Tp M,
: k (M ) M
pM

dove `e unapplicazione liscia tale che (k Tp M ) = p. Definiamo inoltre 0 (M ) = M R.


Una k-forma differenziale su un aperto V di M `e unapplicazione liscia
: V k (V ) := 1 (V )

( k (M ))

tale che = idV , cio`e, per ogni p V si ha che (p) 1 (p) = k T p M . Se (U, =
(x1 , . . . , xm ) `e una carta di M con U V , i differenziali (dxi )p sono una base di Tp M , quindi
X
aI (p)dxI
( k Tp M ),
(p) =
I,]I=k

e `e liscia se e solo se le funzioni aI sono lisce. Una 0-forma `e semplicemnete una funzione
liscia f : V R.
Linsieme delle k-forme differenziali su V si denota con k (V ) e si ha 0 (V ) = C (V ). Per
f, g C (V ) e , k (V ) si definisce una k-forma con:
(f + g)(p) = f (p)(p) + g(p)(p)

( k Tp M ).

Data una 1-forma 1 (M ) e un campo vettoriale X X (M ) si definisce una funzione


liscia (X) C (M ) tramite (X)(p) := (p)(X(p)). Pi`
u in generale, una k-forma
k
(M ) e k campi vettoriali X1 , . . . , XP
k X (M ), definiscono una funzione liscia (X1 , . . . , Xk ),
localmente tramite (X1 , . . . , Xk ) = aI (dxI (X1 , . . . Xk )):
(X1 , . . . , Xk ) C (M )

con (dxi1 . . . dxik )(X1 , . . . , Xk ) = det(A),

A = (dxia (Xb ))

dove 1 a, b k (vedi 1.3.5).


4.4.2 La derivata esterna. Sia V un aperto in una variet`a M . Per f C (V ) = 0 (V ) e p
V abbiamo definito il suo differenziale (df )p Tp M . In questo modo otteniamo unapplicazione
d = d0 : 0 (V ) 1 (V ),

(d0 f )(p) = (df )p

Si pu`o mostrare che per ogni k 0 esiste un unica applicazione


dk : k (V ) k+1 (V )
tale che:

( Tp M ).

4 GEOMETRIA DIFFERENZIALE

70

1. d0 = d,
2. dk `e R-lineare,
3. dk ( ) = (da ) + (1)a (db )

per a (V ), b (V ) e k = a + b,

4. dk+1 dk = 0.
Lunicit`a di dk implica che per k (V ) e U V un aperto si ha: dk ()|U = dk ()|U ),
dove |U k (U ) e le derivate dk sono su k (V ) e k (U ) rispettivamente. Questo permette di
calcolare la derivata esterna su carte locali.
Sia (U, = (x1 , . . . , xm )) una carta di M con U V , e sia
X
=
aI dxI
( k (U )),
I,]I=k

con aI C (U ) = 0 (U ). Per calcolare dk sfruttiamo prima il fatto che dk `e R-lineare


X
X
dk (aI dxI ).
aI dxI ) =
dk = dk (
I,]I=k

I,]I=k

Poi applichiamo (3) con a = 0, b = k:


dk (aI dxI ) = (d0 aI ) dxI + aI dk (dxI ).
Poi mostriamo che dk (dxI ) = 0, usando ancora (3), con a = 1, b = k 1:
dk (dxI ) = dk (d0 xi1 d0 xi2 . . . d0 xik )
= (d1 d0 xi1 ) d0 xi2 . . . d0 xik d0 xi1 dk1 (d0 xi2 . . . d0 xik )
Per (4), d1 d0 = 0. Usando (3) k 1-volte si trova che dk1 (d0 xi2 . . . d0 xik ) = 0. Quindi si
ottiene:
X
X
dk = dk (
aI dxI ) =
(daI ) dxI .
I,]I=k

I,]I=k

4.4.3 Il pull-back di forme differenziali. Sia f : M N unapplicazione liscia tra variet`a


differenziabili. Allora f definisce unapplicazione lineare, il pull-back,
f : k (N ) k (M ),

(f )(X1 , . . . , Xk ) := ((df )X1 , . . . , (df )Xk ),

dove k (N ) e X1 , . . . , Xk X (M ).
Si pu`o mostrare che la derivata esterna `e compatibile con il pull-back:
f (d) = d(f ).

4 GEOMETRIA DIFFERENZIALE

71

4.4.4 Forme differenziali su R3 . Sia M = R3 e sia f 0 (R3 ), cio`e f : R3 R sia una


funzione liscia. Allora


3
X
f f f
f
df =
dxi .
Si ricordi grad(f ) =
,
,
.
x
x
x
x
i
1
2
3
i=1
Sia 1 (R3 ), diciamo = gdx1 + hdx2 + kdx3 con g, h, k C (R3 ). Dunque si ha, con
gi = g/xi ecc.:
d1 = d1 (gdx1 + hdx2 + kdx3 )
= (g1 dx1 + g2 dx2 + g3 dx3 ) dx1 + . . . + (k1 dx1 + k2 dx2 + k3 dx3 ) dx3
= (h1 g2 )dx1 dx2 + (k1 g3 )dx1 dx3 + (k2 h3 )dx2 x3
dove abbiamo usato dxi dxj = dxj dxi . Usando loperatore di Hodge (vedi 1.3.7), si pu`o
identificare questa 2-forma con una 1-forma:

g
k2 h3
d1 = (k2 h3 )dx1 (k1 g3 )dx2 +(h1 g2 )dx3 .
Si ricordi rot h = (k1 g3 ) .
k
h1 g2
In particolare, d1 d0 = 0 corrisponde al fatto che rot(grad(f )) = 0 per ogni f C (R3 ).
Sia 2 (R3 ), diciamo = pdx1 dx2 + qdx1 dx3 + rdx2 dx3 con p, q, r C (R3 ). Si
ha:
d2 = d2 (pdx1 dx2 + qdx1 dx3 + rdx2 x3 )
= (p1 dx1 + p2 dx2 + p3 dx3 ) dx1 dx2 + . . . + (r1 dx1 + r2 dx2 + r3 dx3 ) dx2 dx3
= (p3 q2 + r1 )dx1 dx2 dx3 .
Si noti che usando loperatore di Hodge si ha:
= rdx1 qdx2 + pdx3

div(r, q, p) = r1 q2 + p3 ,

quindi d2 d1 = 0 corrisponde al fatto che div(rot(f, g, h)) = 0 per ogni f, g, h C (R3 ).


Usando le correspondenze qui sopra, otteniamo allora il diagramma
d0

0 (R3 )

grad

1 (R3 )

d1

rot

2 (R3 )

d2

3 (R3 )

div

C (R3 ) C (R3 )3 C (R3 )3 C (R3 )


dove le applicazioni verticali sono come sopra.
4.4.5 Equazioni di Maxwell e forme differenziali. Nella teoria della relativit`a ristretta, il
campo elettrico e magnetico vengono unificati, nel senso che risultano comportarsi come diverse
componenti di un unico campo tensoriale antisimmetrico, il tensore di Faraday

0
Ex
Ey
Ez
Ex
0
Bz By
,
F = {F } =
Ey Bz
0
Bx
Ez By Bx
0

4 GEOMETRIA DIFFERENZIALE

72

sullo spazio-tempo R4 . La metrica di Minkowski = dx dx , dove x0 = ct,


(x1 , x2 , x3 ) = (x, y, z) e { } = diag{1, 1, 1, 1} permette tramite abbassamento degli
indici di interpretare F come una 2forma su R4 ,
1
= F dx dx .
2
Allora, se i = 1, 2, 3 mentre 0 si riferisce alla coordinata temporate, si ha 0i = Ei e, vista come
una due forma su R3 , 12 ij dxi dxj = B 9 .
Daltra parte il tensore di Faraday deve risolvere le equazioni di Maxwell che in forma covariante
sono
F F F
+
+
=0,
x
x
x
4
F
j
=

x
c
dove j `e la tetra-corrente. Si noti che la prima equazione coincide con d = 0. Vogliamo
scrivere anche la seconda nel linguaggio delle forme differenziali. A tale scopo consideriamo il
duale di Hodge in R4 , dotato del tensore metrico . Seguendo 1.3.7 abbiamo10
!
X
1 X
(2)
2 1
0
i
i
j
=  ( )
F0i dx dx
Fij dx dx +
2 i6=06=j
i6=0
!
X
X

1
F0i 0 i
= (2)
Fij i j
2 i6=06=j
x
x
x
x
i6=0
X

1
ijk Fij dx0 dxk F0i dxj dxk ,
=
2 i6=0,j6=0,k6=0
dove ijk sono le componenti della 3forma dx1 dx2 dx3 = 16 ijk dxi dxj dxk . Di conseguenza


X
Fij
1
0
l
k
kij dx dx dx
d =
2 i6=06=j; k6=06=l xl


X
1
F0i
j
k
l
+
ikl dx dx dx
2 i6=06=j; k6=06=l xj


F0i
1 X
0
k
l

ikl dx dx dx ,
2 i6=06=k6=06=l x0
P
ed infine, usando i ijl ihk = jh lk jk lh ,

X  Fij
X F0s
F0j
0
d =
dx +

dxj .
s
i
0
x
x
x
i6=06=j
s6=0
9

Qui stiamo trattando B come una uno forma su R3 dipendente da un parametro t e il duale di Hodge `e
inteso in R3 . Si noti che sono tensori rispetto alle trasformazioni di R3 ma non a quelle di R4 .
10
qui non adottiamo la convenzione di Einstein per evitare confusione

4 GEOMETRIA DIFFERENZIALE

73

Se introduciamo la 1forma J := j dx e ricordiamo che = id, le equazioni di Maxwell


assumono perci`o la semplice forma
d = 0 ,
4
J .
d =
c
In particolare dalla seconda segue che deve aversi per consistenza d J = 0 e dunque d J = 0
che `e lequazione di continuit`a per J espressa nel linguaggio delle forme differenziali (verificare):
j
= 0.
x
4.4.6 La 1-forma canonica sul fibrato cotangente. Sia M una variet`a di dimensione m e
sia T M il suo fibrato cotangente, che `e una variet`a di dimensione 2m. Mostriamo che si pu`o
definire, in modo intrinseco, un elemento di 1 (T M ).
Sia Tp M = 1 (p) dove : T M M . Il differenziale di in `e unapplicazione
lineare dal spazio tangente al fibrato cotangente di M in al spazio tangente di M in () = p:
(d) : T (T M ) Tp M.
Poiche Tp M , abbiamo una mappa lineare : Tp M R e quindi la composizione di (d)
e d`a una mappa lineare
=: (d) : T (T M ) R,
cio`e T (T M ) e in questo modo otteniamo una 1-forma 1 (T M ).
Per calcolare in coordinati locali, prendiamo una carta (U, ( = (x1 , . . . , xm )) di M con
p U . Allora otteniamo una carta locale

: T U = (U ) R

2m

m
X

yi (dxi )p 7 ((x1 (p), . . . , xm (p), y1 , . . . , ym )).

i=1

Tramite questa carta otteniamo la base (/xi ) , (/yi ) , con 1 i m, di T (T M ). In


coordinate locali, la mappa `e (x, y) 7 x. Si ha allora:
(d) ((/xi ) ) = (/xi )p ,
Perci`o, con =

(d) ((/yi ) ) = 0.

yi (dxi )p Tp M si ha:

m
m
m
X
X
X
(
qi (/xi ) + ri (/yi ) ) = (
qi (/xi )p ) =
y i qi .
i=1

i=1

i=1

Usando le coordinate locali (x1 , . . . , xm , y1 , . . . , ym ) su T M abbiamo infine:


=

yi dxi ,

e quindi

d =

m
X

dyi dxi .

i=1

La 2-forma d `e alla base della teoria Hamiltoniana della meccanica classica.

4 GEOMETRIA DIFFERENZIALE

4.5

74

Geometria differenziale e meccanica

Come esempio di applicazione della geometria differenziale alla fisica rivediamo qui alcuni
aspetti della meccanica classica Hamiltoniana dal punto di vista geometico.
4.5.1 Equazione di Newton e geometria. Consideriamo il moto di una particella di
massa m soggetta ad un determinato campo di forze che per ora chiameremo semplicemente
F~ (x) ed al quale daremo un significato pi`
u preciso tra poco. Supponiamo che la particella si
muova su una variet`a M che ammetteremo essere di classe C . Per esempio potrebbe muoversi
su una superficie sferica perfettamente liscia o su un iperboloide di rotazione e cos` via. Sia n la
dimensione di M . La traiettoria della particella sar`a una curva nella variet`a e la sua velocit`a
allistante t sar`a perci`o un vettore nello spazio tangente T(t) M . Vediamo dunque che il fibrato
tangente si presenta in modo naturale come loggetto geometrico pi`
u adeguato per descrivere
il moto della particella, rappresentando lo spazio delle posizioni e delle velocit`a assumibili da
essa. Infatti la descrizione matematica del fibrato tangente risulta particolarmente adatta alla
descrizione fisica non solo da un punto di vista teorico, ma in un certo senso anche dal punto
di vista pratico. Come `e stato mostrato, scelto un atlante per M , il fibrato tangente T M pu`o
essere descritto localmente come il prodotto (U ) Rn , in cui U `e un aperto di una carta
locale (U, ). Ci`o `e essenzialmente quello che fa un fisico quando, per descrivere il fenomeno
in considerazione, introduce in una certa regione (corrispondente allintorno U ) un riferimento
(che individua i punti di U in termini di una certa regione di Rn ) rispetto al quale misura
in ogni istante la posizione e la velocit`a della particella. La velocit`a risulter`a allora essere un
vettore v Rn , cosicche lisomorfismo locale 1 (U ) ' U Rn `e realizzato in modo concreto
dal fisico che effettua lesperimento, essendo essenzialmente v = dtd ((t)).
In sostanza `e quindi conveniente dal punto di vista geometrico vedere in ogni istante la velocit`a
della particella come un punto in T M . Nella notazione del paragrafo 4.3.3 scriveremo allora
(t)

= ((t), |(t) ). Pi`


u precisamente, vediamo la curva
: R M ,

t 7 (t) ,

come una mappa differenziabile tra variet`a differenziabili11 . Allora il differenziale di definisce
una mappa
d : T R T M ,
come mostrato in 4.3.5. Consideriamo il campo vettoriale su R
2

Xt : R T R ' R , R Xt = idR ,


t 7 Xt (t) =

t,
t


.

Allora = d Xt , cio`e `e definita dai diagrammi commutativi


d

T R T M
Xt %
R
11

TM
% M

R M

dove la struttura differenziale di R `e come al solito definita dallunica carta locale (R, idR ); eventualmente
in luogo di R la curva pu`
o essere definita su un intervallo (a, b) ma il concetto non cambierebbe.

4 GEOMETRIA DIFFERENZIALE

75

Una volta chiarito il concetto di velocit`a dal punto di vista geometrico, `e evidente come debba
essere trattata laccelerazione = ()
. Poiche `e una curva in T M , similmente sar`a una
curva in T (T M ) costruita rispetto a esattamente nello stesso modo in cui abbiamo costruito
rispetto a . Mentre lasciamo come esercizio i dettagli della costruzione di , ci basti ora
osservare che se (t)

= ((t), |(t) ) allora


= (((t), |(t) ); ((t), |(t) ) ) = (((t), |(t) ); ( |(t) ; | |(t) )) ,
cosicche il secondo ed il terzo elemento coincidono.
Tale osservazione diventa fondamentale nel momento in cui dobbiamo scrivere la seconda legge
di Newton per la meccanica: m
= F . Perche tale equazione sia ben definita occorre anzitutto
che F abbia valori in T (T M ) e possiamo dunque pensare al campo di forze F come un campo
vettoriale su T M
F : T M T (T M ) , T M F = idT M ;

(x, ~v ) 7 F (x, ~v ) .

Una tale definizione non `e completa poiche in generale non sarebbe compatibile con lequazione
di Newton. Infatti il generico punto di T (T M ) lo possiamo scrivere in coordinate locali nella
forma ((x, v); (w, z)) R2n R2n , mentre laccelerazione, come abbiamo notato pocanzi, richiede
che la seconda e la terza componente debbano coincidere. Questa condizione pu`o essere scritta
in maniera pi`
u elegante nel linguaggio geometrico.
Osserviamo anzitutto che c`e una mappa naturale
T M : T (T M ) T M ,

((x, v); (w, z)) 7 (x, v) .

Daltra parte si consideri la mappa analoga M : T M M . Il suo differenziale `e la mappa


dM : T (T M ) T M ,

((x, v); (w, z)) 7 (x, w) .

La condizione soddisfatta dallaccelerazione pu`o dunque essere scritta nella forma T M =


dM . La stessa condizione deve perci`o essere soddisfatta dal campo di forze: chiameremo
campo di forze una mappa
F : T M T (T M ) ,

T M F = idT M ;

T M F = dM F .

Con tale definizione si pu`o infine scrivere lequazione di Newton sulla variet`a M
m
= F .
Si noti che scritta in questa forma essa `e indipendente dalla scelta delle coordinate o di una
carta locale.
4.5.2 Richiami di meccanica Hamiltoniana. Una descrizione ancora pi`
u geometrica si
ottiene nel formalismo Hamiltoniano.
Si consideri una particella soggetta a forze conservative, descritte da un potenziale V (q i ), dove

4 GEOMETRIA DIFFERENZIALE

76

q i sono le coordinate generalizzate che individuano la posizione della particella. In termini della
funzione lagrangiana12
L : T M R ,

L(q j , qj ) = T (q j , qj ) V (q j ) ,

dove T (q j , qj ) `e lenergia cinetica, lequazione di Newton per la dinamica assume la forma


d L
L
= j ,
j
dt q
q

qj =

dq j
.
dt

Si noti che in questa forma le equazioni del moto sono covarianti, nel senso che trasformano
esattamente come la base locale dello spazio tangente TqM come in 4.3.2. Si lascia come esercizio
la verifica di questo fatto. Poiche nel caso in cui la lagrangiana non dipenda esplicitamente
dalla coordinata q J0 per qualche fissato j0 le equazioni del moto implicano che pj0 := L
sia
qj0
i j
i
una costante del moto, appare opportuno considerare in luogo di (q , q ) le variabili (q , pj )
, detti momenti coniugati alle variabili q i , purche il sistema di equazioni ottenuto
dove pj := L
qj
sia equivalente. Qui abbiamo utilizzato appositamente il termine variabili anziche coordinate,
poiche come osservato pocanzi pi si comportano (almeno fintanto che si impongono le equazioni
del moto) come le componenti di un covettore e dunque descrivono localmente il fibrato cotangente piuttosto che il fibrato tangente. Comunque ci viene in aiuto il fatto che localmente il
fibrato tangente e quello cotangente sono tra di loro diffeomorfi (ed in particolare sono diffeomorfi a U Rn , dove U `e un aperto di qualche carta locale) cosicche risulta evidente che il
nuovo sistema sar`a equivalente al precedente se la mappa
q j 7 pj =

L
qj

`e invertibile, cio`e ci permette di ricavare qi come funzioni di pi e q k . Il teorema della funzione


2
implicita ci dice che questo `e garantito localmente dalla condizione det qi Lqj 6= 0.
Ammesso che tale condizione sia soddisfatta si introduce allora la funzione
H : T M R ,

H(q i , pj ) = (pk qk L)|qj =qj (qi ,pk ) ,

rispetto alla quale le equazioni del moto diventano (esercizio)


H
dq j
=
dt
pj
H
dpj
= j .
dt
q
Indichiamo con xI , i = 1, . . . , 2n le coordinate del generico punto di T M , dove xi = q i ,
xn+i = pi , i = 1, . . . , n. Se introduciamo la matrice 2n 2n antisimmetrica


O I
E=
,
I O
12

qui (q i , qj ) sono coordinate locali in T M

4 GEOMETRIA DIFFERENZIALE

77

dove O e I sono le matrici nulla ed identit`a n n, possiamo scrivere le equazioni del moto nella
forma
dxI
H
= EIJ J .
dt
x
I

`e un vettore tangente a T M nel punto di coDal punto di vista geometrico abbiamo che dx
dt
H
ordinate {xI }, mentre x
e un covettore dello spazio cotangente nello stesso punto. Possiamo
J `
dunque vedere la matrice E come una mappa E : Tx (T M ) Tx (T M ) ed `e cio`e un tensore
controvariante di secondo grado. Essa `e chiaramente una mappa non degenere e la sua inversa
E1 , usualmente indicata con , `e dunque un tensore covariante antisimmetrico, che individua
pertanto una due-forma = 21 IJ dxI dxJ = dqi dpi . Confrontando con la sezione 4.4.6,
vediamo allora che = d, dove `e la uno-forma canonica su T M .
Possiamo quindi concludere che la meccanica Hamiltoniana dal punto di vista geometrico `e
descritta in modo naturale sul fibrato cotangente ed `e essenzialmente specificata da due ingredienti fondamentali: una funzione Hamiltoniana H : T M R e la forma canonica su T M .
Il differenziale della forma canonica definisce una due forma, talvolta chiamata la seconda forma
canonica, che ha la propriet`a di essere non degenere. Il differenziale di H definisce invece un
campo covettoriale su T M che viene trasformato in un campo vettoriale dallinversa della seconda forma canonica, 1 = E. Diciamo XH := E(dH) (campo hamiltoniano). Le equazioni
di Hamilton sono infine le equazioni che determinano le curve x(t) su T M con la propriet`a di
essere in ogni punto tangenti al campo vettoriale XH . Una tale equazione si chiama equazione
di flusso per il campo XH .13
Associate al moto delle particelle possono esserci delle osservabili fisiche, che saranno delle
funzioni reali delle coordinate q e p delle particelle, come ad esempio potrebbe essere la loro
energia. Tali osservabili fisiche F (q, p) varieranno nel tempo seguendo levoluzione (q(t), p(t))
determinata dalle equazioni di Hamilton. Derivando rispetto al tempo si ottiene
dF
= {F , H} ,
dt
dove


X  F H
F H
{F , H} =

i p
q
pi q i
i
i

sono le parentesi di Poisson. Come si vede immediatamente esse possono essere scritte nella
forma {F , H} = (XF , XH ), che mette in evidenza il ruolo della seconda forma canonica
nellevoluzione temporale.
E possibile a questo punto riformulare quanto esposto in questo paragrafo nel linguaggio
rigoroso della geometria differenziale.
4.5.3 Formulazione geometrica della meccanica Hamiltoniana. Sia M una variet`a
differenziabile reale ndimensionale di classe C sia T M il corrispondente fibrato cotangente.
Quest ultimo `e naturalmente dotato di una 1forma canonica , il cui differenziale d`a origine
13

Si noti che le equazioni di Newton nella precedente sezione sono anchesse delle equazioni di flusso per il
campo vettoriale F su T M , essendo appunto una curva su T M .

4 GEOMETRIA DIFFERENZIALE

78

ad una 2forma nondegenere = d. Si dice allora che tale 2forma provvede T M di una
struttura simplettica naturale. In particolare essa definisce una mappa
E : T (T M ) T (T M ) ,

7 E()

1 (T M )

secondo la regola
(E(), X) := (X) ,

1 (T M ) , X X (T M ) .

In pratica, in un fissato punto e sistema di coordinate, E `e rappresentata dallinversa trasposta


della matrice IJ delle componenti della 2 forma .
Sia ora H C (T M, R). Una tale funzione viene detta funzione hamiltoniana. Si chiama
invece campo hamiltoniano associato ad H il campo vettoriale XH := E(dH). E molto ineteressante il problema inverso di stabilire se un campo vettoriale X su T M sia un campo
hamiltoniano, cio`e se esiste una funzione hamiltoniana al quale il campo `e associato. Si chiama
contrazione del campo X con la 2forma la 1forma iX definita da14
iX ()(Y ) := (X, Y ) ,

X X (T M ) .

Il problema posto equivale allora a chiedersi se esiste una funzione F di tipo hamiltoniano tale
che iX = dF . Se F esiste si dice che iX `e esatta. Evidentemente una condizione necessaria
`e che valga d(iX ) = 0. Se `e soddisfatta si dice che iX `e chiusa: una forma esatta `e sempre
anche chiusa. Tuttavia tale condizione non `e in generale sufficiente poiche non `e detto che una
forma chiusa sia anche esatta. Per fare un esempio di forma chiusa ma non esatta si consideri la
uno forma = d sul cerchio S 1 , essendo la funzione coordinata angolare. E facile verificare
che `e ben definita su tutto il cerchio, mentre la funzione non lo `e ovviamente. Dunque
`e chiusa ma non esatta. Tuttavia notiamo che se restringiamo il problema, anzich`e su tutto
il cerchio, ad un sottoinsieme aperto proprio di S 1 , allora in tale aperto |U `e esatta: mentre
non esiste una funzione C (S 1 , R) tale che = d, si ha che `e ben definita su U e si ha
|U = d|U . Si dice allora che `e localmente esatta. Si pu`o dimostrare che questo fatto `e vero
in generale, cio`e ogni forma chiusa `e localmente esatta. In altre parole se iX `e chiusa allora
per ogni punto x T M esiste un intorno aperto U T M che lo contiene ed una funzione
F C (U, R) tale che iX |U = dF . In tal caso si dice che il campo `e localmente hamiltoniano.
Si chiama sistema hamiltoniano la tripla {M, , H}. Ad esso si associa il problema della
determinazione del flusso hamiltoniano. Dato un campo vettoriale Y X (N ) su una variet`a
differenziabile N ed un punto p N , si vuole determinare una curva : (a, a) N , con
(0) = p e che in ogni punto sia tangente al campo vettoriale dato. Seguendo la notazione del
paragrafo 4.5.1 si deve risolvere dunque il problema di Cauchy

(t)

= Y (t) ,
(0) = p .
Lequazione differenziale si chiama equazione di flusso del campo Y . Si chiamano equazioni
di Hamilton associate al dato sistema Hamiltoniano le equazioni di flusso per il campo XH =
14

dovrebbe da qui essere chiaro come si possa definire la contrazione iX n1 (M ) per ogni n (M ) e
X X (M ).

4 GEOMETRIA DIFFERENZIALE

79

E(dH). Il problema di Cauchy `e localmente ben definito, ma si pu`o in effetti porre il problema
in una forma pi`
u debole ma pi`
u interessante che presentiamo nel seguente paragrafo.
4.5.4 Flussi ed evoluzione temporale. Si consideri un campo vettoriale V X (N ) e la
relativa equazione di flusso. In particolare si prenda in considerazione il problema di Cauchy
= V ,
(0) = p0 N .
Introducendo una carta locale intorno a p0 non `e difficile dimostrare che localmente la soluzione
esiste sempre ed `e unica. Essa `e detta curva integrale di V passante per p0 . Ancora pi`
u
15
interessante `e il fatto che `e possibile dimostrare che vi `e dipendenza continua e differenziabile
dal dato iniziale p0 . Pi`
u precisamente esiste un intorno U N contenente p0 ed  > 0 tale che,
detta (t; p) la soluzione del problema di Cauchy associato allequazione di flusso per V con
punto iniziale (0) = p U , allora lapplicazione
Vt : U N ,

q 7 Vt (q) ,

`e un diffeomorfismo tra U e Vt (U ) per ogni fissato t (, ). Lapplicazione Vt , che per
t fissato determina un diffeomorfismo locale mentre per p U fissato determina una curva
integrale per V , viene detta flusso locale o semplicemente flusso di V .
Se il campo vettoriale `e hamiltoniano V = XH , allora si pu`o immaginare che ogni punto p U
sia una particella la cui evoluzione temporale `e descritta da un sistema hamiltoniano. Allistante
t = 0 tutte le particelle riempiranno la regione U dello spazio delle fasi (in tal caso N = T M
H
per qualche M ). Al variare del tempo esse occuperanno invece la posizione X
t (p). Vediamo
dunque che in tal caso il flusso di XH individua quindi levoluzione temporale del sistema. Esso
`e detto in tal caso flusso hamiltoniano.
Un altro esempio di origine fisica `e quello di immaginare U come una regione attraversata da
un fluido in moto stazionario, di cui V rappresenti il campo di velocit`a. In tal caso i punti di U
possono essere visti come i punti del fluido allistante t = 0 che invece occuperanno la posizione
Vt (p) allistante t.
Ritornando al caso di un flusso Hamiltoniano, si noti che esso permette di definire levoluzione
H
rappresenter`a la
temporale di una osservabile fisica. Se O C (M, R) allora Ot = O X
t
stessa osservabile allistante t. Si osservi che in particolare il flusso ha le propriet`a V0 = id e
Vt1 Vt2 = Vt1 +t2 .
Daltra parte pi`
u in generale una osservabile fisica potrebbe essere un campo vettoriale o
tensoriale.
4.5.5 Pull back. Siano date due variet`a differenziabili M ed N ed unapplicazione f :
M N liscia. Si consideri un campo tensoriale covariante di grado q, V (N, T N q ), di
cui in particolare fanno parte le forme differenziali. Poiche la fibra di T N q altro non `e che il
duale della fibra di T N q , `e naturale in tal caso introdurre il concetto di pull back di V tramite
15

si assume che sia la variet`


a che il campo vettoriale sono di classe C

4 GEOMETRIA DIFFERENZIALE

80

lapplicazione liscia f : M N . Esso trasporta il campo V allindietro, da N a M , nel campo


tensoriale f (V) (N, T M q ) definito dalla commutativit`a del seguente diagramma
T f

T M q
f (V)
M

T N q
V

essendo T f la mappa cotangente di f , cio`e la trasposta della mappa tangente:


hT f (V)(x), T (x)i = hV(f (x)), T f (T )(f (x))i,

x M, T (M, T M q ) ,

mentre h , i `e la valutazione dei funzionali sui vettori. Dunque f (V) = T f V f . Si noti che in
tale formula non compare linversa di f cosicche il pull back `e ben definito anche qualora f non
sia un diffeomorfismo, ma semplicemente una applicazione liscia. In particolare, in coordinate
locali il pull back `e descritto dalla trasposta della matrice jacobiana composta con f (esercizio).
4.5.6 Push forward. Siano date due variet`a differenziabili M ed N ed unapplicazione
f : M N liscia. Sia poi V X (M ) un campo vettoriale su M . Si vuole indurre un
campo vettoriale su N tramite f , che verr`a denotato con f (V ). A tale scopo consideriamo il
diagramma commutativo
df
T M
TN
M
N
M

dal quale si vede che un campo su N pu`o essere ottenuto ponendo f (V ) = df V f 1 , cio`e per
y N si ha f (V )y = (df )x V (x) dove x = f 1 (y). In particolare dunque f (V ) `e ben definito
se f `e un diffeomorfismo. La mappa f viene detta push forward e vale la commutativit`a del
diagramma
df
T M
TN
V
f (V )
M

f 1

E semplice determinare lespressione per il push forward di V in coordinate locali e lo si lascia


come esercizio (si veda la sezione 4.3.5). In generale, si considera il diagramma precedente con
Tf

T M p
T
M

T N p
f (T )

f 1

dove: T M p `e il prodotto tensore di T M per s`e stesso p volte, cio`e un fibrato vettoriale
su M che ha per fibra in x M lo spazio vettoriale Tx M p ; T `e una sezione del fibrato
tensoriale16 , cio`e una applicazione liscia T : M T p M tale che T = idM , essendo la
16

si scrive T (M, T M p ), in particolare (M, T M ) = X (M )

4 GEOMETRIA DIFFERENZIALE

81

proiezione su M ; T f `e lestensione della mappa df , detta anche mappa tangente, definita da


T f (T M p ) = (df (T M ))p .
Poiche f `e un diffeomorfismo, si pu`o definire anche il push forward di un campo tensoriale
covariante su M tramite f , come il pullback tramite f 1 . Questo permette di estendere il
concetto di push forward al caso di campi tensoriali misti. Le espressioni locali in tal caso
generalizzano i concetti di covarianza e controvarianza introdotti nella sezione 1.217 .
Si noti infine che per un campo scalare S, cio`e un campo tensoriale di tipo (0, 0), si ha f S =
S f 1 .
4.5.7 Derivata di Lie ed evoluzione temporale. Per quanto visto nel paragrafo 4.5.6 e

in 4.5.4, si pu`o scrivere levoluzione temporale di una osservabile


 scalare S C (T M, R) come
XH
XH 1
XH
il suo push forward tramite t = (t ) , cio`e St = t (S). Questa forma pu`o essere
immediatamente generalizzata al caso di osservabili tensoriali O Oqp (M, T M p T M q )

H
per le quali scriveremo Ot = X
t (O).
Di questa espressione `e possibile determinare lequivalente infinitesimale, che si ottiene derivando rispetto al parametro t e ponendo t = 0. Il risultato ottenuto si chiama derivata di Lie del
campo tensoriale O rispetto al campo vettoriale XH :

H
X
t (O) O0
.
LXH O = lim
t0
t
E chiaro che in generale si pu`o sostituire a XH un campo vettoriale V qualunque. In tal caso
la derivata di Lie di O rispetto a V si indica con LV O.
Nel caso di un campo scalare S la derivata di Lie coincide con la derivata direzionale e si ha
LV S = hdS, V i. Se invece W `e un campo vettoriale allora si trova LV W = [V, W ], coincide
cio`e con le parentesi di Lie introdotte in 4.3.11:
LV S := hdS, V i := (dS)(V ) = V (S),

LV W := [V, W ].

Infine per una qualunque kforma differenziale si ha


LV = (iV d(k) + d(k1) iV ),

( k (M )).

Si lascia come esercizio la dimostrazione di queste ultime due asserzioni.


Consideriamo pi`
u in dettaglio il caso di una osservabile scalare S. Allora
dS
= LXH S = hdS, XH i = (XS , XH ) ,
dt
in accordo con quanto osservato nella sezione introduttiva 4.5.2.
4.5.8 Derivata di Lie e derivata esterna. La derivata di Lie `e permette di determinare
una formula comoda per il calcolo della derivata esterna di una forma differenziale. Sia una
1forma su M e V, W X (M ) due campi vettoriali. Allora vale la seguente formula di Cartan
(d)(V, W ) = LV ((W )) LW ((V )) ([V, W ]) .
17

in tal caso la matrice M di cambiamento di base va identificata con lnversa trasposta della matrice jacobiana
calcolata nel punto considerato

4 GEOMETRIA DIFFERENZIALE

82

La dimostrazione si ottiene direttamente in carte locale, valutando entrambi i membri e osservando che coincidono. Si noti che se la formula vale per = 1 , 2 allora vale anche per
= 1 + 2 , quindi basta verificarla nel caso = adxk con a C (M ). Lasciamo come
esercizio la determinazione della generalizzazione alle kforme.

Rimandiamo ad altri testi per ulteriori applicazioni della geometria alla meccanica Hamiltoniana. Volendo invece considerare applicazioni ad altri campi della fisica `e conveniente dapprima
sviluppare un po di concetti riguardanti la teoria dei gruppi di Lie e delle loro rappresentazioni.

5 GRUPPI E ALGEBRE DI LIE

83

Gruppi e algebre di Lie

Testi consigliati: [FH], [DNF1], [DNF2], [Ha], [Wa].

5.1

Gruppi di Lie

5.1.1 Gruppi di Lie. Una variet`a G `e detta gruppo di Lie se esistono due applicazioni lisce
: G G G,

: G G,

e un punto e G tali che G sia un gruppo con elemento neutro e, prodotto g1 g2 := (g1 , g2 ), e
inversa g 1 := (g).
Unapplicazione f : H G tra gruppi di Lie `e un omomorfismo di gruppi di Lie se f `e
liscia e se f `e un omomorfismo di gruppi. Un sottogruppo H G di un gruppo di Lie `e detto
sottogruppo di Lie se `e una sottovariet`a di G, in quel caso H `e anche un gruppo di Lie.
5.1.2 Sottogruppi di Lie immersi. Un punto delicato `e che limmagine f (H) di un omomorfismo di gruppo di Lie f : H G non `e sempre un sottogruppo di Lie; ovviamente f (H)
`e un sottogruppo di G per`o f (H) non `e necessariamente una sottovariet`a di G. Un esempio `e
(vedi anche 5.1.3) il caso H = R, G = (R/Z)2 (il toro), e lomomorfismo
f : R (R/Z)2 ,

t 7 (t, at),

(a R, a 6 Q).

Si noti che f `e iniettiva (si ha (t, at) = (0, 0) se e solo se (t, at) Z2 ; se t 6= 0 e t, at Z
allora si ha a = (at)/t Q in contraddizione con la scelta a 6 Q). Per ogni n Z troviamo
un punto pn := (n, an) = (0, an) G e i pi sono distinti nello spazio topologico compatto G
e quindi hanno un punto di accumulazione p. Allora `e impossibile trovare una carta locale
(U, = (x1 , x2 )), con p U , di G tale che f (H) U = {q U : x2 (q) = 0}, che `e chiuso in U .
Un sottogruppo di Lie immerso `e limmagine di un omomorfismo di gruppi di Lie iniettivo.
In particolare, f (H) qui sopra `e un sottogruppo di Lie immerso di G.
5.1.3 Esempi. Il gruppo additivo (R, +) `e un gruppo di Lie perche le applicazioni (x, y) = x+
y e (x) = x sono evidentemente lisce. Similmente il gruppo moltiplicativo R := (R {0}, )
`e un gruppo di Lie. Lapplicazione exp : R R , exp(x) := ex `e un omomorfismo di gruppi di
Lie.
Il gruppo di Lie R/Z pu`o essere definito come la variet`a differenziabile S 1 ( R2 ), la
circonferenza, con legge del gruppo indotta dalladdizione degli angoli
: S 1 S 1 S 1 ,

((cos , sen ), (cos , sen )) = (cos( + ), sen ( + ))

e le formule ben note che esprimono cos(+), sen (+) in termini di cos , . . . , sen mostrano
che `e liscia. Ovviamente anche linversa (cos , sen ) = (cos , sen ) `e liscia. Per essere
precisi, bisogna identificare t R/Z con il punto (cos(2t), sen (2t)) di S 1 .

5 GRUPPI E ALGEBRE DI LIE

84

Il gruppo GL(n, R) `e un gruppo di Lie. Ovviamente GL(n, R) `e un gruppo ed `e un aperto


dello spazio vettoriale Mn (R) di dimensione n2 , quindi GL(n, R) `e una variet`a. I coefficienti
di
di A e B ((AB)ij =
P un prodotto AB di due matrice A e B sono polinomi nei coefficienti
1
e liscia. Linversa `e anchessa liscia perche A = (det A)1 A] dove A]
k aik bkj ), quindi `
`e la matrice dei cofattori di A, cio`e (A] )ij `e il determinante, moltiplicato per (1)i+j , della
matrice (n 1) (n 1) ottenuta da A eliminando la j-esima riga e la i-esima colonna. La
funzione det `e data da un polinomio nei coefficienti di una matrice, e quindi `e liscia. Poiche
det(A) `e liscia e non zero su GL(n, R), anche A 7 (A) = (det A)1 A] `e liscia su GL(n, R).
Ogni sottovariet`a di GL(n, R) che `e un sottogruppo di GL(n, R) `e allora un gruppo di Lie.
Esempi sono SL(n, R) (vedi 4.2.9) e SO(n, R) (vedi 4.2.10).
5.1.4 Rappresentazioni dei gruppi di Lie. Una rappresentazione (reale) di un gruppo di
Lie su uno spazio vettoriale V (reale) di dimensione n `e un omomorfismo di gruppi di Lie
: G GL(V )
= GL(n, R).
Esempi sono l inclusione SL(n, R) , GL(n, R), SO(n, R) , GL(n, R), la rappresentazione
controgradiente GL(V ) GL(V ) (vedi 1.1.12) e gli omomorfismi kl : GL(V ) GL(Tlk (V ))
(vedi 3.1).
5.1.5 La rappresentazione Aggiunta. Sia G un gruppo di Lie e sia g := Te G, lo spazio
tangente di G nellidentit`a e G. Per g G definiamo un automorfismo ig di G per
coniugazione:
ig : G G,
h 7 ghg 1
(g, h G).
Poiche ig `e unapplicazione liscia tale che ig (e) = e, si ha unapplicazione lineare, il suo
differenziale, che si chiama Ad(g)
Ad(g) := (dig )e : g = Te G g.
Poiche ig ig1 = idG si ha Ad(g)Ad(g 1 ) = idg , quindi Ad(g) GL(g).
Lapplicazione, detta applicazione Aggiunta,
Ad : G GL(g),

g 7 Ad(g)

`e una rappresentazione di G perche (g1 g2 )h(g1 g2 )1 = g1 (g2 hg21 )g11 implica:


igg0 = ig ig0

perci`o

Ad(gg 0 ) := (digg0 )e = (dig )e (dig0 )e = Ad(g) Ad(g 0 ).

5.1.6 La rappresentazione Aggiunta per GL(n). Il gruppo di Lie GL(n, R) `e un aperto


2
della variet`a Mn (R)
= Rn e quindi TI GL(n, R)
= TI Mn (R) = Mn (R) (vedi 4.3.4 per lultima
identificazione). Per calcolare Ad(g)(X), per g GL(n, R) e X TI GL(n, R) = Mn (R),
consideriamo un cammino che rappresenta X:
: ] , [ G Mn (R),

tale che

(0) = I,

0 (0) = X.

5 GRUPPI E ALGEBRE DI LIE

85

Allora, usando una delle definizione di 4.3.5, Ad(g)(X) `e definito dal cammino 7 ig (( )) e
questo cammino corrisponde a




d(g( )g 1 )
d
ig (( ))
=
= gXg 1
Ad(g)(X) =
d
d
| =0
| =0
come si verifica differenziando ogni coefficiente della matrice g( )g 1 rispetto e ponendo
= 0.
5.1.7 La rappresentazione Aggiunta per SL(n). Il gruppo di Lie SL(n, R) = det1 (1)
`e una sottavariet`a di GL(n, R) e il suo spazio tangente in g SL(n, R) `e lo spazio vettoriale
(vedi 4.3.8)
Tg SL(n, R) := ker((d det)g : Tg GL(n, R)
= Mn (R) T1 R = R).
Per g = I, da 4.2.9, la matrice (d det)I = JI (det) ha coefficienti (1)i+j det(Iij ), che sono zero
se i 6= j e 1 se i = j, cio`e
(d det)I (X) = x11 + x22 + . . . + xnn =: tr(X)
dove tr(X) `e la traccia della matrice X. Perci`o:
TI SL(n, R) = {X Mn (R) : tr(X) := x11 + x22 + . . . + xnn = 0 },
cio`e lalgebra di Lie di SL(n, R) sono le matrice di Mn (R) con traccia nulla. Poiche SL(n, R) `e
una sottovariet`a di GL(n, R), il calcolo fatto qui sopra mostra che Ad(g)(X) = gXg 1 per g
SL(n, R) e X TI SL(n, R). Si noti che per g SL(n, R) si ha proprio Ad(g)(TI SL(n, R))
TI (SL(n, R)) perche il polinomio caratteristico di X `e uguale a quello di gXg 1 e tale polinomio
`e pX () = (n tr(X)n1 + . . .).
5.1.8 La rappresentazione Aggiunta per SO(n). Lo spazio tangente TI SO(n, R) del
gruppo di Lie SO(n, R) si determina usando 4.2.10 e, di nuovo, 4.3.8, con A = I:
X 7 t X + X,

TI SO(n, R) = ker(JI (F ) : Mn (R) Symn (R)),


cio`e

TI SO(n, R) = { X Mn (R) : t X = X } = Altn (R),


lo spazio vettoriale delle matrici n n alternanti. Per g SO(n, R) la mappa Aggiunta
Ad(g) End(TI SO(n, R)) `e ancora data da Ad(g)(X) 7 gXg 1 . Si noti che g 1 = t g per
g SO(n, R) e quindi se X Altn (R) anche gXg 1 Altn (R):
t

(gXg 1 ) = t (gX(t g)) = g(t X)(t g) = gX(t g)

( Altn (R), g SO(n, R), X Altn (R)).

Si noti che per il cammino



: R SO(2, R),

cos sen
sen cos


,

X := (0) =

0 1
1 0


TI SO(2, R)

5 GRUPPI E ALGEBRE DI LIE

86

e che infatti t X = X.
5.1.9 Lalgebra di Lie di un gruppo di Lie. Nella sezione 5.1.5 abbiamo definito un
omomorfismo di gruppi di Lie
Ad : G GL(g)
e quindi otteniamo unapplicazione lineare, chiamata applicazione aggiunta,
ad := (dAd)e : Te G = g TI GL(g)
= End(g).
Qui indentifichiamo, come al solito, lo spazio tangente in I allaperto GL(g) dello spazio
vettoriale End(g) con questo spazio vettoriale stesso.
Per calcolare laggiunta per sottogruppi di Lie di GL(n, R) si noti che per un cammino
:] , [ GL(n, R) e ogni ] , [ si ha ( )( )1 = I. Quindi, con 0 (0) := (d/d )(0),
abbiamo 0 (0) 1 (0) + (0)( 1 )0 (0) = 0. In particolare,
(0) = I,

0 (0) = X

( 1 )0 (0) = X.

Per X TI GL(n, R) definito da un cammino (quindi con (0) = I, 0 (0) = X) e Y g,


limmagine di Y sotto lendomorfismo ad(X) di g `e:
ad(X)(Y ) :=

dAd(( ))(Y )
d
d( )Y ( )
d


| =0


1
| =0

= 0 (0)Y 1 (0) + (0)Y ( 1 )0 (0)


= XY Y X =: [X, Y ]
dove [X, Y ] `e detto il commutatore di X e Y .
su G per
In generale, per un gruppo di Lie, per X Te G si definisce un campo vettoriale X
g := (dLg )e (X) dove
X
Lg : G G,
Lg (h) := gh.
h = X
gh , si dice che il campo
Poiche Lg Lh = Lgh segue che per ogni g, h G si ha (dLg )h X
`e invariante a sinistra. Poi si mostra che le parentesi di Lie per campi vettoriali
vettoriale X
(vedi 4.3.11) sono compatibili con la mappa ad nel senso che:
^ ) = [X,
Y ],
ad(X)(Y
questo giustifica la nostra definizione [X, Y ] := ad(X)(Y ) per X, Y g. Da questa identit`a
e dallidentit`a di Jacobi, oppure nel caso di sottogruppi di Lie di GL(n, R), dal semplice fatto
che [X, Y ] = XY Y X, segue che
[X, Y ] = [Y, X],

[X, [Y, Z]] = [[X, Y ], Z] + [Y, [X, Z]].

5 GRUPPI E ALGEBRE DI LIE

87

5.1.10 Algebre di Lie. Unalgebra di Lie g `e uno spazio vettoriale con unapplicazione
bilineare alternante
g g g,
(X, Y ) 7 [X, Y ]
che soddisfa lidentit`a di Jacobi (vedi qui sopra).
Esempi di algebre di Lie sono gli spazi tangenti Te G, dove e `e lelemento neutro di un gruppo
di Lie G (vedi 5.1.9) e gli spazi vettoriali X (M ) (di dimensione infinita!) dei campi vettoriali
su una variet`a differenziabile (vedi 4.3.11).
5.1.11 Lapplicazione esponenziale. Dato un X g, X 6= 0, si pu`o mostrare che esiste un
unico cammino
= X : R G,

t.c. = X,

(s + t) = (s)(t)

(s, t R),

cio`e `e omomorfismo di gruppi di Lie.


Lapplicazione esponenziale `e definita da:
exp : g G,

exp(tX) := X (t),

quindi la restrizione di exp alla retta < X > g `e un omomorfismo per ogni X g. In pi`
u si
ha che
(d exp)0 : T0 g = g Te G = g
`e lidentit`a. Lapplicazione exp `e lunica applicazione con queste due propriet`a. Se G `e connesso,
si pu`o mostrare che G `e generato da exp(U ), dove U g `e un intorno aperto di 0 g.
Se G `e un sottogruppo di Lie di GL(n, R), allora g M (n, R) e si ha la formula esplicita:
exp tX =

k k
X
t X
k=0

k!

(X M (n, R) = Te GL(n, R)).

Si noti che si ha proprio := (d/dt) exp tX)t=0 = X.


In generale non vale exp(X + Y ) = (exp X)(exp Y ) perche XY 6= Y X. La formula di
Campbell-Baker-Haussdorf d`a una formula per (exp X)(exp Y ) come exp di una somma di
commutatori tra X e Y :
(exp X)(exp Y ) = exp(X + Y + (1/2)[X, Y ] + (1/12)[X, [X, Y ]] (1/12)[Y, [X, Y ]] + . . .).
Per calcolare lexp `e spesso utile usare che exp(SXS 1 ) = S(exp(X))S 1 (che segue dalla
serie per exp), quindi la forma di Jordan di X determina essenzialmente exp(X).
Si pu`o mostrare che poiche (d exp)0 `e un isomorfismo, limmagine della mappa esponenziale
contiene un aperto U di G tale che e U . La formula qui sopra mostra che il prodotto in
un tale aperto di G `e determinato dal prodotto nellalgebra di Lie g. Questo ci permette di
mostrare che unalgebra di Lie g di dimensione finita determina in modo unico un gruppo di
Lie G che `e connesso e semplicemente connesso. Queste condizioni su G sono importanti, per
esempio lalgebra di Lie g = R (con prodotto banale) `e lalgebra di Lie di R = R {0} (non

5 GRUPPI E ALGEBRE DI LIE

88

connesso), di R/Z (connesso ma non semplicemente connesso) e di R (connesso e semplicemente


connesso e lunico tale G con algebra di Lie g, a meno di isomorfismo di gruppi di Lie).
5.1.12 Esempi dellapplicazione esponenziale. Si ha:
exp(tX) = diag(et1 , . . . , etn ),

se X = diag(1 , . . . , n ) M (n, R)

perche X k = diag(k1 , . . . , kn ).
Se X M (n, R) `e nilpotente, allora X N = 0 per un
2
X /2! + . . . + X N /N !, una somma finito. Per esempio,

0 1 0
0 0
X = 0 0 2 ,
X2 = 0 0
0 0 0
0 0

certo N e quindi exp(X) = I + X +

2
0 ,
0

X 3 = 0,

quindi si ha:

1 t 2t2
exp(tX) = I + tX + t2 X 2 /2 = 0 1 2t .
0 0 1
Sia (vedi 5.1.8)


0 1
X=
TI SO(2, R),
1 0

si noti: X 2 = I,

X 2k = (1)k I,

X 2k+1 = (1)k X.

Lesponenziale di X `e allora
exp(tX) =
=

P Xn
n n!
P

(1)k t2k
k=0 (2k)!

I+

P

(1)k t2k+1
k=0 (2k+1)!

= (cos t)I + (sen t)X

cos t sen t
.
=
sen t cos t

5.2

Algebre di Lie semplici

5.2.1 Sottogruppi e sottoalgebre di Lie. Sia G G0 un sottogruppo di Lie, allora


g = Te G Te G0 = g0 `e un sottospazio vettoriale. Il prodotto di Lie in g `e allora la restrizione
del prodotto di Lie in g0 : visto che ghg 1 G per ogni g, h G si ha Ad(g)(Y ) g per ogni
Y g e g G. Questa poi implica che ad(X)(Y ) = [X, Y ] g per ogni X, Y g. Si dice che
g `e una sottoalgebra di Lie di h.

5 GRUPPI E ALGEBRE DI LIE

89

In particolare, se : G GL(V ) `e una rappresentazione di G, allora (G) `e un sottogruppo


di Lie di GL(V ) e Te (G) = (d)e g. Quindi (d)e g `e un sottoalgebra di Lie di End(V).
In generale, una sottoalgebra di Lie h g non determina un sottogruppo di Lie H di G.
Si pu`o invece mostrare che h determina sempre un sottogruppo di Lie immerso f (H) G
(dove f : H G `e un omomorfismo di gruppi di Lie) tale che limmagine del differenziale
(df )e : Te H Te G = g `e h g. In pi`
u, liniettivit`a di f implica che (df )e `e iniettiva, quindi

Te H = h.
5.2.2 Sottogruppi normali ed ideali. Supponiamo che H sia un sottogruppo di Lie normale
di G, cio`e ghg 1 H per ogni g G, h H. Allora Ad(g)(Y ) h per ogni g G, Y h e
perci`o ad(X)(Y ) = [X, Y ] h per ogni X g e Y h (in questo senso h assorbe g). Si dice
che h `e un ideale di g.
Se G `e un gruppo di Lie e H `e un sottogruppo di Lie normale chiuso, allora anche G/H
`e un gruppo di Lie e lo studio di G equivale a studiare H, G/H e i possibili gruppi di Lie G0
che hanno H come sottogruppo normale e G/H come gruppo quoziente (si dice che G0 `e una
estensione di G/H con H).
5.2.3 Algebre di Lie semplici e semi-semplici. Unalgebra di Lie g `e detta semplice se
dim g > 1 e se g non ha ideali tranne {0} e g. Cio`e, se V g `e un sottospazio vettoriale tale
che [x, v] V per ogni x g e v V allora V = {0} oppure V = g.
Unalgebra di Lie `e detta semi-semplice se `e somma diretta di algebre di Lie semplici.
5.2.4 Esempio. Lalgebra di Lie del gruppo SL(n, R)
sl(n) := {W Mn (R) : tr(W ) = 0 }
`e semplice per ogni n 2, qui lo dimostriamo per n = 2.
Una base di sl(2) = {W M2 (R) : tr(W ) = 0 } `e data da:






0 1
0 0
1 0
X :=
,
Y :=
,
H :=
,
0 0
1 0
0 1
e un facile calcolo mostra che i commutatori sono dati da:
[X, Y ] = [Y, X] = H,

[H, X] = [X, H] = 2X,

[H, Y ] = [Y, H] = 2Y,

(cio`e XY Y X = H ecc.) e gli altri commutatori sono zero: [X, X] = [Y, Y ] = [H, H] = 0
perche [X, X] = [X, X] ecc.
Sia W sl(2) la matrice


a b
W = aH + bX + cY =
( sl(2)).
c a
Allora si verifica:

[X, W ] =

0 1
0 0



a b
c a

a b
c a



0 1
0 0


=

c 2a
0 c


,

5 GRUPPI E ALGEBRE DI LIE

90

e quindi, come sopra, ma con [X, W ] invece di W :




0 2c
[X, [X, W ]] =
.
0 0
Sia adesso V sl(2), V 6= 0, uno sottospazio vettoriale tale che [Z, W ] V per ogni
Z sl(2) e W V , mostriamo che V = sl2 e quindi sl2 `e semplice.
Sia W V , W = aH + bX + cY 6= 0 come sopra, quindi uno dei coefficienti a, b, c `e non
zero.
Se c 6= 0, abbiamo [X, W ] V , e poi [X, [X, W ]] V . Perci`o 2cX V e quindi X V .
Inoltre [Y, X] = H V , e poi [Y, H] = 2Y V . Ma allora V contiene una base di sl2 e perci`o
V = sl2 .
Nel caso c = 0, a 6= 0 si ha [X, Z] = 2aX V e quindi X V , come sopra si deduce che
V = sl(2). Infine, se c = a = 0, b 6= 0 si ha Z = bX V e, ancora una volta, V = sl(2).
Ne concludiamo che V = sl2 se V 6= 0 e quindi sl2 `e unalgebra di Lie semplice.

5.3

Rappresentazioni di algebre di Lie semplici

5.3.1 Rappresentazioni di algebre di Lie. Una rappresentazione di unalgebra di Lie g in


V , dove V `e un spazio vettoriale di dimensione finita, `e unapplicazione lineare
: g End(V )

t.c.

([X, Y ]) = (X) (Y ) (Y ) (X)

dove indica la composizione di endomorfismi di V , cio`e una rappresentazione di unalgebra


di Lie conserva il commutatore.
Una rappresentazione `e detta irriducibile se V non ha sottospazi invarianti per g tranne {0}
e V , cio`e se W `e un sottospazio di V tale che (X)w W per ogni X g e ogni w W allora
W = {0} oppure W = V .
5.3.2 La rappresentazione aggiunta. Un esempio `e lapplicazione aggiunta di g in End(g):
ad : g End(g),

X 7 [Y ad(X)(Y )]

(X, Y g).

Questapplicazione `e una rappresentazione di g perche dallidentit`a di Jacobi [X, [Y, Z]] =


[[X, Y ], Z] + [Y, [X, Z] segue
ad([X, Y ])(Z) = [[X, Y ], Z] = [X, [Y, Z]] [Y, [X, Z]] = ad(X)(ad(Y )(Z)) ad(Y )(ad(X)(Z))
per ogni Z g, quindi ad([X, Y ]) = ad(X) ad(Y ) ad(Y ) ad(X) in End(g).
Se g `e semplice (vedi 5.2.3) allora ad `e una rappresentazione irriducibile. Infatti, se W g
`e un sottospazio invariante, allora ad(X)(Y ) W per ogni X g e Y W implica che W `e
un ideale di g. Poiche g `e semplice si ha allora W = {0} oppure W = g.

5 GRUPPI E ALGEBRE DI LIE

91

5.3.3 Il nucleo di una rappresentazione. Sia : g End(V ) una rappresentazione di


unalgebra di Lie. Il nucleo ker() `e unideale di g perche se X g e Y ker() si ha
([X, Y ]) = (X)(Y ) (Y )(X) = (X) 0 0 (X) = 0,
quindi [X, Y ] ker(). In particolare, se g `e semplice, allora ogni rappresentazione di g `e 0
(cio`e (X) = 0 per ogni X g) oppure `e iniettiva.
5.3.4 Rappresentazioni del gruppo e dellalgebra di Lie. Data una rappresentazione
r : G GL(V ) otteniamo unapplicazione lineare


d
:= (dr)e : g End(V ),
(X)v :=
r((t))v
dt
|t=0
dove `e un cammino in G che rappresenta X Te G, cio`e con (0) = e e 0 (0) = X. Lapplicazione `e una rappresentazione dellalgebra di Lie g in V . Per mostrarlo, osserviamo prima
che, per g, h G si ha, in GL(V ):
ir(g) (r(h)) = r(g)r(h)r(g)1 = r(ghg 1 ) = r(ig (h)),

cio`e ir(g) r = r ig : G GL(V ).

Il differenziale g End(V ) di questa mappa G GL(V ) in e G `e allora


d(ir(g) r)e = d(ir(g) )I (dr)e = (dr)e (dig )e ,

quindi Ad(r(g)) = Ad(g).

Adesso prendiamo il differenziale in e G dellapplicazione


G End(V ),

g 7 Ad(r(g)) = Ad(g).

Usando un cammino in G con (0) = e, 0 (0) = X, troviamo per ogni Y g:






d
d
Ad(r((t)))((Y ))
=
(Ad((t))(Y ))
.
dt
dt
t=0
t=0
Con la definizione di Ad, nel caso G GL(n), si ottiene:




d
d
1
1
r((t))(Y )r((t) )
=
((t)Y (t) )
.
dt
dt
t=0
t=0
Il lato sinistro `e [(X), (Y )] e poiche lapplicazione `e continua il lato destro `e ([X, Y ]).
Quindi `e una rappresentazione dellalgebra di Lie g:
[(X), (Y )] = ([X, Y ]).
5.3.5 Rappresentazioni in prodotti tensoriali. Siano r : G GL(V ) e s : G GL(W )
rappresentazioni di un gruppo di Lie in spazi vettoriali. Allora si ha una rappresentazione di
G nel prodotto tensoriale:
r s : G GL(V W ),

v w 7 (r(g)v) (s(g)w),

5 GRUPPI E ALGEBRE DI LIE

92

come si verifica facilmente.


La rappresentazione r s di G definisce una rappresentazione dellalgebra di Lie g
d(r s)e : g End(V W ).
Si ha (si veda 5.3.4) usando la regola di Leibnitz:


d
r((t))v s((t))w
= ((X)v) w + v (X)w,
d(r s)e (X)(v w) =
dt
|t=0
dove `e un cammino in G con (0) = e, 0 (0) = X e
= (dr)e : g End(V ),

= (ds)e : g End(W )

sono le rappresentazioni dellalgebra di Lie di G definiti da r, s.


5.3.6 La decomposizione di Jordan. Per studiare le rappresentazioni di unalgebra di
Lie g si usano gli autospazi di endomorfismi (X) per X g. In generale, se V `e uno spazio
vettoriale complesso di dimensione finita e X End(V ), lo spazio V non `e la somma diretta
degli autospazi di X. Per esempio, la matrice X di 5.2.4 ha autovalore 0 (con moltiplicit`a 2),
ma lautospazio corrispondente, generato da (1, 0), ha soltanto dimensione 1.
Un endomorfismo ha una decomposizione di Jordan, cio`e esiste una base di V tale che la
matrice A dellendomorfismo `e una matrice triangolare superiore. Si pu`o fare tale decomposizione in modo che la matrice A sia la somma di una matrice diagonale As e una matrice
strettemente triangolare superiore An (cio`e (An )kl = 0 se k l, in particolare XnN = 0 per
N dim V ) e:
A = As + A n ,
A s An = An A s .
Un risultato fondamentale `e che se g `e un algebra di Lie semi-semplice e X g allora ci
sono (unici) Xs , Xn g tali che
X = Xs + Xn

e tali che (X)s = (Xs ),

(X)n = (Xn )

per ogni rappresentazione : g End(V ) su uno spazio vettoriale V di dimensione finita.


In particolare, sia g `e semplice e una rappresentazione non-banale. Se H g `e tale che
(H) `e diagonalisabile, allora (H)s = (H) e (H)n = 0. Poiche `e iniettivit`a, si ha allora
che H = Hs e Hn = 0. Perci`o in ogni rappresentazione di g si ha che (H) `e diagonalizzabile.
Per esempio, linclusione sl(2) M2 (R) `e una rappresentazione di sl(2) nella quale H
`e diagonale, quindi H = Hs . Dal risultato citato si ha allora che in ogni rappresentazione
di sl(2) in uno spazio vettoriale complesso V di dimensione finita, lendomorfismo (H) `e
diagonalizzabile, cio`e:
V = C V ,

V = {v V : (H)v = v }.

Similmente, X = Xn e quindi esiste un N (che dipende dalla rappresentazione!) tale che


(X)N = 0.

5 GRUPPI E ALGEBRE DI LIE

93

5.3.7 Omomorfismo di rappresentazioni. Un omomorfismo tra due rappresentazioni


: g End(V ) e : g End(W ) di un algebra di Lie g `e unapplicazione lineare
S : W V

tale che (X)S = S(X)

(X g).

Si verifica facilmente che ker(S) `e un sottospazio invariante di W e che im(S) `e un sottospazio


invariante di V . Infatti, se w ker(S) e X g allora
S((X)w) = (X)(Sw) = (X)0 = 0

quindi anche (X)w ker(S),

e similmente, se v im(S) allora v = Sw per un w W e:


(X)v = (X)Sw = S((X)w)

quindi anche (X)v im(S).

Le due rappresentazioni sono dette isomorfe se esiste un isomorfismo S : W V tale che


(X) = S(X)S 1 : V V
per ogni X g. Per esempio, se V = W = Rn , due rappresentazioni sono isomorfe se e solo se
una `e ottenuta dallaltra tramite un cambio di base di Rn .
Due rappresentazioni r : G GL(V ) e s : G GL(W ) di un gruppo di Lie G sono dette
isomorfe se esiste un isomorfismo S : W V tale che
r(g) = Ss(g)S 1 : V V
per ogni g G. Si noti che se r, s sono isomorfe, allora anche le rappresentazioni delle algebre
di Lie che definiscono, (dr)0 e (ds)0 , sono isomorfe.
5.3.8 Completa riducibilit`
a di rappresentazioni. Sia : g End(V ) una rappresentazione di unalgebra di Lie in uno spazio vettoriale V . La rappresentazione `e detta
completamente riducibile se
V = iI Wi
dove ogni Wi `e una sottorappresentazione irriducibile.
Un risultato fondamentale di H. Weyl dice che se g `e semi-semplice, allora ogni rappresentazione di g in uno spazio vettoriale di dimensione finita `e completamente riducibile.
u, le
PIn pi`
0

sottorappresentazioni irriducibili sono determinati in modo unico, cio`e se Wi =


Wj dove
0
gli Wi , Wj0 sono irriducibili, allora esiste una permutazione degli indici tale che Wi
.
= W(j)
Questo risultato implica anche che se W V `e una sottorappresentazione irriducibile, allora
W
= Wi per un certo i.

5.4

Le rappresentazioni irriducibili dellalgebra di Lie sl(2)

5.4.1 Le rappresentazioni di sl(2). Si studi una rappresentazione qualunque di sl(2) in


uno spazio vettoriale V . Da questo studio `e facile ottenere tutte le rappresentazioni irriducibili

5 GRUPPI E ALGEBRE DI LIE

94

di sl(2). Esse sono parametrizzate da un intero n Z0 , detto il peso pi`


u alto della rappresentazione. La rappresentazione n con peso pi`
u alto n `e in uno spazio vettoriale V (n) di
dimensione n + 1.
5.4.2 Rappresentazioni di sl(2). Sia : sl(2) End(V ) una rappresentazione dellalgebra
di Lie sl(2) in uno spazio vettoriale di dimensione finita. Sia X, Y, H la base di sl(2) data in
5.2.4. Poiche `e una rappresentazione abbiamo (in End(V ))
[(X), (Y )] = (H),

[(H), (X)] = 2(X),

[(H), (Y )] = 2(Y ).

In particolare, vale (H)(X) = (X)(H) + ([H, X]) = (X)(H) 2(X) ecc.


5.4.3 Pesi e spazi di peso di una rappresentazione di sl(2). Consideriamo gli autovalori (detti pesi di ) e autospazi (detti spazi di pesi, (ingl: weight spaces)) dellapplicazione
lineare (H) : V V . Mostreremo che questi autovalori sono interi, ma per adesso consideriamo un autovalore qualunque C di (H). Nella complessificazione VC di V consideriamo
lautospazio corrispondente
V := {v VC : (H)v = v },
Per adesso non sfruttiamo il risultato generale sulla forme di Jordan di (H) di 5.3.6.
5.4.4 Lazione di X e Y su V . Un primo risultato `e che gli endomorfismi (X), (Y ) di V
trasformano un autospazio di (H) in un altro:
(X)V V+2 ,

(Y )V V2 ,

cio`e (X) alza il peso di 2 mentre (Y ) labbassa di 2. Questo segue dal calcolo seguente: per
v V si ha
(H)((X)v) = ((X)(H))v + ([H, X])v = (X)(v) + 2(X)v = ( + 2)(X)v,
e similmente (H)((Y )v) = ( 2)(Y )v.
5.4.5 Vettori massimali. Sia v V , v 6= 0. Allora (X)k v `e un autovettore di (H) con
autovalore + 2k. Poiche V ha dimensione finita e i numeri complessi , + 2, + 4, . . . sono
distinti, esiste un k tale che (X)k v 6= 0, (X)k+1 v = 0.
Un vettore v V `e detto vettore massimale (per la rappresentazione ) se v `e un autovettore
di (H) e se (X)v = 0.
Come visto, ogni autovettore v, v 6= 0, di (H) d`a un vettore massimale, non zero, di V . In
particolare, ogni rappresentazione V di sl(2) ha vettori massimali.
5.4.6 Vettori massimali e sottorappresentazioni di V . Dato un vettore massimale
v V , v 6= 0, mostriamo che il sottospazio
W := hv, (Y )v, (Y )2 v, . . . i

( V )

5 GRUPPI E ALGEBRE DI LIE

95

`e invariante per sl(2), quindi W `e una sottorappresentazione di V .


Per costruzione si ha (Y )w W , per ogni w W . Poi (H)w W per ogni w W perche
(H)((Y )l v) = ( 2l)((Y )l v) W . Poiche v `e massimale, (X)v = 0. Usando [X, Y ] = H
si ha
(X)((Y )v) = (Y )((X)v) + (H)v = 0 + v W.
Per induzione su k, supponendo che (X)((Y )k1 v) W , troviamo allora:
(X)((Y )k v) = (Y )((X)(Y )k1 v) + (H)((Y )k1 v) W,
perche sia (X)(Y )k1 v che (H)((Y )k1 v) stanno in W .
(Y ), (H) e (X) e perci`o `e invariante per sl(2).

Quindi W `e invariante per

5.4.7 La sottorappresentazione W . Sia W la sottorappresentazione di V generata da un


vettore massimale v V (vedi 5.4.6). Se dim W = n + 1, una base di W `e data dalle (Y )k v,
con k = 0, 1, . . . , n (questi vettori sono indipendenti perche (H)(Y )k v = ( 2k)(Y )k v). In
particolare, (Y )n v 6= 0 e (Y )n+1 v = 0.
Lazione di (Y ) e (H) su questa base sono semplice da descrivere:

(Y )k+1 v
k < n,
k
k
k
(H)(Y ) v = ( 2k)(Y ) v,
(Y )(Y ) v =
0 se k = n.
Adesso mostriamo che
k

(X)(Y ) v =

0
se k = 0,
ck (Y )k1 v 1 k n,

dove ck = k k(k 1).

Abbiamo gi`a visto i casi k = 0, 1:


(X)v = 0,

(X)((Y )v) = (Y )((X)v) + (H)v = v.

Usando questo, troviamo:


(X)((Y )2 v) = (Y )((X)(Y )v) + (H)((Y )v)
= (Y )(v) + ( 2)((Y )v)
= ( + ( 2))((Y )v),
quindi c2 = 2 2. Poiche (X)((Y )k v) = (Y )((X)(Y )k1 v) + (H)((Y )k1 v) troviamo
in generale:
(X)((Y )k v) = ( + ( 2) + . . . + ( 2(k 1)))(Y )k1 v
= (k 2(1 + 2 + . . . + (k 1)))(Y )k1 v
= (k k(k 1))(Y )k1 v.
In particolare, le matrici di (H), (Y ) e (X) rispetto alla base v, (Y )v, . . . , (Y )n v di W
sono determinate in modo unico dal peso di v e dalla dimensione n + 1 di W .

5 GRUPPI E ALGEBRE DI LIE

96

5.4.8 I pesi sono interi. Mostriamo che il peso del vettore massimale v `e un intero:
Z0 ,

in pi`
u

dim W = + 1,

in particolare, ogni autovalore 2k di (H) su W `e un intero.


Poiche (Y )n+1 v = 0 otteniamo:
0 = (X)(Y )n+1 v = cn+1 (Y )n v.
Dato che (Y )n v 6= 0 si ha cn+1 = 0:
0 = cn+1 = (n + 1) (n + 1)n

= n.

Gli n + 1 autovalori, i pesi, di (H) sullo spazio n + 1-dimensionale W sono allora gli interi
n, n 2, n 4, . . . , n 2n = n, ognuno con molteplicit`a 1:
W = nk=0 Wn2k ,

W := {w W : (H)w = w }

dim W = 1.

Una base di Wn2k `e data da (Y )k v, quindi (Y ) : Wn2k Wn2(k+1) `e un isomorfismo,


tranne se k = n (in quel caso Wn2(k+1) = 0). In pi`
u, abbiamo visto che per k = 1, . . . , n
(X)((Y )k v) = ck (Y )k1 v

con ck 6= 0

(k = 1, . . . , n)

quindi in questi casi (X) : Wn2k Wn2(k1) `e un isomorfismo e (X)Wn = 0 perche v Wn


`e un vettore massimale. Segue che ker (X) = Wn . In particolare, ogni vettore massimale in
W `e un moltiplo di v.
Adesso non `e difficile verificare che le matrici che abbiamo trovato per (X), (Y ) e (H)
rispetto alla base (Y )k v, k = 0, . . . , n, di W , definiscono una rappresentazione di sl(2). In
5.5.3 si dar`a unaltra dimostrazione.
5.4.9 La sottorappresentazione W `
e irriducibile. Sia W 0 W un sottospazio sl(2)invariante con W 0 6= 0. Prendiamo un w W 0 , w 6= 0. Allora esiste un l 0 tale che
(X)l w 6= 0 ma (X)l+1 w = 0. Per quanto visto prima, si ha allora (X)l w = cv, dove v `e
il vettore massimale e c C, c 6= 0. Poich`e W 0 `e sl(2)-invariante, si ha allora v W 0 e poi
(Y )k v W 0 per ogni k 0, quindi W 0 = W . In questo modo abbiamo mostrato che gli unici
sottospazi sl(2)-invarianti in W sono {0} e W , e quindi la rappresentazione di sl(2) in End(W )
`e irriducibile.
5.4.10 La rappresentazione irriducibile V (n) di sl(2). Sia adesso V una rappresentazione irriducibile di sl(2). La scelta di un vettore massimale non-zero v V definisce una
sottorapresentazione non-banale W di V . Poiche V `e irrididucibile, V = W (ed il vettore
massimale `e quindi unico a meno di moltiplicazione per un scalare non nullo).
Poiche W ha una base data dalle vk := (Y )k v, 0 k n dove (H)v = nv, e poiche le
applicazioni (Y ), (H) e (X) rispetto a questa base sono state determinate in modo unico,
tale rappresentazione `e unica. Si pu`o verificare che queste applicazioni definiscono davvero una

5 GRUPPI E ALGEBRE DI LIE

97

rappresentazione (oppure vedi 5.5.3). Quindi esiste ununica rappresentazione irriducibile di


dimensione n + 1 di sl(2), scritto V (n), e anche:
n : sl(2) End(V (n)).
La rappresentazione V (n) ha allora pesi = n, n 2, . . . , n, il peso pi`
u alto `e n e ogni
spazio di peso V (n) ha dimensione 1.

5.5

Rappresentazioni di sl(2).

5.5.1 Esempi. La rappresentazione 0 `e quella banale: (Z) = 0 per ogni Z sl(2).


La rappresentazione identit`a `e 1 : sl(2) , M2 (R) e si noti che gli autovalori di 1 (H) = H
sono proprio 1 e 1 2 = 1.
Poi c`e la rappresentazione aggiunta ad : sl(2) End(sl(2))
= M3 (R). Poiche X, H, Y sono
una base di sl(2) e poiche
ad(H)(X) = [H, X] = 2X,

ad(H)(H) = [H, H] = 0,

ad(H)(Y ) = [H, Y ] = 2Y

si ha ad(H) = diag(2, 0, 2), in particolare, ad(H) ha autovalori 2, 2 2 = 0, 2 4 = 2.


Inoltre, sl(2) ha base di autovettori
X,

ad(Y )(X) = [Y, X] = H,

ad(Y )2 (X) = [Y, [Y, X]] = [Y, H] = 2Y

e la dimensione della rappresentazione irriducibile ad `e 2 + 1 = 3.


5.5.2 Una rappresentazione di SL(2, R). Consideriamo la rappresentazione r, di
dimensione infinita, di SL(2, R) sullo spazio C (R2 ) delle funzioni lisce su R2 data da
r : SL(2, R) Aut(C (R2 )),

(r (A) F )(v) := F (t Av)

(v R2 ).

Si noti che:
(r(A)(r(B)F )))(v) = (r(B)F )(t Av) = F (t B(t Av)) = F (t (AB)v) = (r(AB)F )(v),
quindi r `e una rappresentazione.
La rappresentazione dellalgebra di Lie associata `e:
: sl(2) End(C (R2 )),

((Z)F )(v) :=

d
(r(t (t))F )(v)|t=0
dt

(Z sl(2)),

dove `e un cammino in SL(2, R) con (0) = I, 0 (0) = Z. In particolare, con la base X, Y, H


di sl(2) come sopra, si possono prendere i cammini (t) = exp(tX) ecc:




 t

1 t
1 0
e
0
exp(tX) =
,
exp(tY ) =
,
exp(tH) =
.
0 1
t 1
0 et

5 GRUPPI E ALGEBRE DI LIE

98

Allora troviamo, con v = (x, y):


((X)F )(v) =

d
(F (x, tx + y))|t=0 = (xy )F (v),
dt

((Y )F )(v) =

d
(F (x + ty, y))|t=0 = (yx F )(v),
dt

d
(F (et x, et y))|t=0 = ((xx yy )F )(v).
dt
Lalgebra di Lie di sl(2) ha dunque una rappresentazione nei campi vettoriali su R2 . Lasciamo
al lettore la verifica che vale proprio [X, Y ] = [yx , xy ] = xx yy = H ecc.
((H)F )(v) =

5.5.3 La rappresentazione V (n) di sl(2). Sia F un polinomio omogeneo di grado n, cio`e


F (x, y) = n F (x, y) per ogni R. Allora si verifica che anche r(A)F `e un polinomio
omogeneo di grado n. Perci`o
R[x, y]n := {F R[x, y] : F (x, y) = n F (x, y) R }
`e un sottospazio vettoriale di C (R2 ) che `e invariante sotto r(SL(2, R)) e perci`o `e anche
invariante sotto (sl(2)).
La restrizione di a questo sottospazio d`a una rappresentazione
n : sl(2) End(R[x, y]n ),

Z 7 n (Z) = (Z)|R[x,y]n .

Una base di R[x, y]n `e data dai monomi


xn , xn1 y, . . . xna y a , . . . y n ,

quindi

dim R[x, y]n = n + 1.

Si noti che:
n (H)(xna y a ) = (xx yy )(xna y a ) = (n a)xna y a axna y a = (n 2a)xna y a ,
quindi xna y a V (n)n2a , e in modo simile:
n (X)(xna y a ) = xy (xna y a ) =
axna+1 y a1 ,
na a
na a
n (Y )(x y ) = yx (x y ) = (n a)xna1 y a+1 .
In particolare, ogni vettore della base `e un autovettore per n (H), con autovalori n, n 2, n
4 . . . , n, in pi`
u n (X)(xn ) = 0 e R[x, y]n `e generato dalle n (Y )a (xn ) = ca xna y a con ca =
n(n 1) . . . (n a + 1) 6= 0 per a = 1, . . . , n.
5.5.4 La formula di Clebsch-Gordan. Studiamo ora la decomposizione del prodotto
tensoriale di due rappresentazioni irriducibile di sl(2). Per la classificazione ottenuta in 5.4.10,
dobbiamo considerare la rappresentazione
: sl(2) V (n) V (m),

(Z)(v w) = (n (Z)v) w + w (m (Z)w)

5 GRUPPI E ALGEBRE DI LIE

99

dove Z sl(2) e con n, m Z0 di dimensione (n + 1)(m + 1). La rappresentazione si decompone, in modo unico, (vedi 5.3.8) in rappresentazioni irriducibili. Poiche le rappresentazioni
irriducibili sono determinate dai loro pesi, basta considerare questi.
Se v V (n) e w V (m) sono autovettori di n (H) e m (H), con autovalori ,
rispettivamente, allora (vedi 5.3.5):
((H)(v w) = (n (H)v) w + v m (H)w = (v w) + (v w) = ( + )(v w).
Quindi il prodotto tensoriale di due autovettori `e un autovettore. Poiche V (n) e V (m) sono
somma diretta di spazi peso troviamo allora che gli spazi pesi di V (n) V (m) sono:
(V (n) V (m)) = += V (n) V (m) .
Poiche i pesi di V (n) e V (m) sono n, n 2, . . . , n 2k, . . . , n e m, m 2, . . . , m 2l, . . . , m
i pesi di V (n) V (m) sono allora gli (n + 1)(m + 1) interi nella tabella n + 1 m + 1 qui sotto:
n+m
(n 2) + m
..
.

n + (m 2)
(n 2) + (m 2)
..
.

...
...

n + (m 2l)
(n 2) + (m 2l)
..
.

...
...

nm
(n 2) m
..
.

(n 2k) + m (n 2k) + (m 2) . . . (n 2k) + (m 2l) . . . (n 2k) m


..
..
..
..
.
.
.
.
n m

n + (m 2)

...

n + (m 2l)

...

n m

In particolare, n + m `e il peso pi`


u alto di V (n) V (m) e perci`o la rappresentazione irriducibile
V (n + m) `e una sottorappresentazione di V (n) V (m), con moltiplicit`a uno. Poiche i pesi di
V (n + m) sono gli n + m 2r, r = 0, . . . , n + m, gli altri pesi di V (n) V (m) sono quelli che
rimangono togliendo la prima riga e lultima colonna della tabella. Il peso pi`
u alto rimasto `e
allora (n2)+m = n+m2 e quindi V (n+m2) `e una sottorappresentazione di V (n)V (m),
con moltiplicit`a uno. Poi togliamo la prima riga e lultima colonna della tabella che era rimasta
e troviamo che V (n + m 4) `e una sottorappresentazione di V (n) V (m), con moltiplicit`a
uno, ecc. Conclusione:
V (n) V (m)
= V (n + m) V (n + m 2) . . . V (|n m|),
questa formula si chiama formula di Clebsch-Gordan.
5.5.5 Esempio. La formula di Clebsch-Gordan d`a:
V (1) V (1)
= V (2) V (0)
= Sym2 (R2 ) R
dove la rappresentazione di sl(2) su R `e quella banale. Questa si verifica facilmente, la
rappresentazione V (1) V (1) `e ottenuta dalla rappresentazione di SL(2) su M2 (R) per
r(g)(M ) = gM t g, ovviamente Sym2 (R2 ) e Alt2 (R2 ) sono sottospazi invarianti, e abbiamo
visto in 5.5.3 che Sym2 (R2 )
= V (2) e Alt2 (R2 ) ha dimensione uno, quindi `e la rappresentazione
banale dellalgebra di Lie semplice sl(2) (vedi 5.3.3).

5 GRUPPI E ALGEBRE DI LIE

100

5.5.6 La decomposizione di prodotti tensoriali. Un modo comodo per trovare esplicitamente la decomposizione di un prodotto tensoriale di rappresentazioni irriducibili di sl(2) dato
dalla formula di Clebsch-Gordan `e il seguente.
Consideriamo V (n) = R[x, y]n e V (m) = R[u, v]m (vedi 5.5.3), prendiamo altri variabile per
ottenere la decomposizione di
V (n) V (m) = R[x, y]n R[u, v]m
in modo pi`
u semplice. Da 5.3.5 e 5.5.3 otteniamo:
n (X) m (X) = xy + uv ,

n (H) m (H) = xx yy + uu vv .

Con questi operatori si ottiene:


(n (X) m (X))(xv yu) =

(xy + uv )(xv yu)

= 0,

(n (H) m (H))(xv yu) = (xx yy + uu vv )(xv yu) = 0.


Quindi anche (xv yu)k 7 0 applicando questi operatori.
Per ottenere la decomposizione di una rappresentazione di sl(2) dobbiamo trovare i vettori
massimali, cio`e i polinomi f R[x, y]n R[u, v]m tali che (n (X) m (X))(f ) = 0 e tali che
(n (H) m (H))(f ) = kf , allora k 0 e f genera una coppia di V (k).
Poiche gli operatori lineari considerati sono derivazioni, troviamo:
(n (X) m (X))(xa ub (xv yu)c ) = ub (xv yu)c (n (X) m (X))(xa ) + . . .
= axa1 ub (xv yu)c (xy + uv )(x) + . . .
= 0 + 0 + 0 = 0,
e, similmente,
(n (H) m (H))(xa ub (xv yu)c ) = (a + b + 0)xa ub (xv yu)c = (a + b)xa ub (xv yu)c .
Quindi xa ub (xv yu)c `e un vettore massimale, di peso a + b, per ogni a, b, c Z0 tale che
xa ub (xv yu)c R[x, y]n R[u, v]m , cio`e tale che a + c = n, b + c = m. Supponiamo ora che
n m, allora c = 0, 1, . . . , m poi b = m c, a = n c e il peso massimale corrispondente `e
a + b = n + m 2c. Quindi troviamo che R[x, y]n R[u, v]m ha sottorappresentazioni isomorfe
a V (n + m), V (n + m 2), . . . , V (n m). Secondo Clebsch e Gordan queste sono tutte le
sottorappresentazioni irriducibili di R[x, y]n R[u, v]m .
Nel caso n = m, lo scambio di variabili x u, y v d`a una decomposizione in autospazi:
V (n) V (n) = Sym2 (V (n)) Alt2 (V (n)).
Si noti che il vettore massimale della sottorappresentazione V (n 2k) di V (n) V (n) `e
xnk unk (xv yu)k , che `e simmetrico se k `e pari ed alternante se k `e dispari. Quindi si
ha:
Sym2 (V (n)) = V (2n) V (2n 4) . . . V (2n 4k) . . . ,
Alt2 (V (n)) = V (2n 2) V (2n 6) . . . V (2n 4k 2) . . . .

6 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI

101

La classificazione delle algebre di Lie semisemplici

Testi consigliati: [FH], [Ha], [Hu].

6.1

Lalgebra di Cartan e i pesi.

6.1.1 Introduzione. In questo capitolo daremo la classificazione delle algebre di Lie complesse
semplici.
Il risultato `e che ci sono quattro famiglie, parametrizzate da interi positivi, di algebre di Lie
complesse semplici g e poi ci sono 5 casi eccezionali, si veda 6.3.3. La classificazione sfrutta
lazione di una sottoalgebra di Cartan h di g nella rappresentazione aggiunta su g. Risulta
che nello spazio vettoriale duale h `e definito un sottospazio reale hR generato da certi vettori,
chiamati radici di g. Linsieme delle radici di g `e un sistema di radici, questo concetto `e definito
in 6.2.2. Si mostra che esiste una biiezione tra sistemi di radici irriducibili e algebre di Lie
complesse semplici. Poi si d`a la classificazione dei sistemi di radici.
6.1.2 Lalgebra di Cartan. Sia g unalgebra di Lie complessa semplice. Una sottoalgebra di
Lie h g `e detta unalgebra di Cartan se h `e abeliana, se ogni elemento di h `e diagonalizzabile
(in una e quindi in ogni rappresentazione di g, vedi 5.3.6) e se h `e massimale rispetto a tale
propriet`a (vedi [FH], Definition D.2).
Si pu`o mostrare che se h, h0 sono due algebre di Cartan di g, allora esiste un automorfismo
g g0 che manda h in h0 , quindi h `e essenzialmente unica (vedi [FH] D.3).
Il rango l di g `e la dimensione di unalgebra di Cartan di g:
l = rango(g) := dimC h.
6.1.3 Pesi delle rappresentazioni. Sia h unalgebra di Cartan di g e sia
: g End(V )
una rappresentazione di g.
Poiche (H) per ogni H h `e diagonalizzabile, si pu`o decomporre V in autospazi per (H).
Se H, H 0 h e V V `e lautospazio di (H) con autovalore , allora (H 0 )V V perche:
(H)((H 0 )X) = (H 0 )((H)X) = (H 0 )(X) = ((H 0 )X),

(X V ).

Quindi V ha una decomposizione in autospazi per H 0 . Procedendo in questo modo, usando


una base H1 , . . . , Hl di h, si trova una decomposizione
P V = V1 ,...,l tale
Pche Hi v = i v per
v V1 ,...,l . Poiche ogni H h si scrive come H =
xi Hi , si ha Hv = ( i xi )v. Quindi un
autospazio V1 ,...,l definisce una mappa lineare (un peso)
L : h C,

H=

l
X
i=1

xi Hi 7

l
X
i=1

i x i ,

tale che (H)v = L(H)v

6 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI

102

per ogni v V1 ,...,l . Si scrive VL := V1 ,...,l e VL `e detto uno spazio peso (invece di autospazio per tutti gli elementi di h) con peso L h , lo spazio duale di h. In particolare, ogni
rappresentazione V di g ha una decomposizione in spazi peso:
V = Lh VL ,

(H)v = L(H)v

(v VL ).

Poiche dim V `e finita, VL = 0 tranne che per un numero finito di L h , questi L sono detti i
pesi della rappresentazione e la moltiplicit`a di un peso L `e la dimensione di VL .
6.1.4 La rappresentazione aggiunta. La rappresentazione aggiunta di unalgebra di Lie g
`e (vedi 5.3.2):
ad : g End(g),
X
7 (ad(X) : Y 7 [X, Y ]).
Poiche h `e abeliana, si ha [H, H 0 ] = 0 H 0 = 0 per ogni H, H 0 h e quindi h `e contenuta nellautospazio g0 con peso 0. Si pu`o mostrare che ogni elemento in questo autospazio `e
diagonalizzabile e quindi sta in h, perci`o g0 = h.
Otteniamo allora la decomposizione in autospazi (spazi peso) per lalgebra di Cartan:
g = h (h {0} g ),
dove il sottospazio g `e definito da:
g := {X g : [H, X] = (H)X }.
6.1.5 Le radici di unalgebra di Lie semisemplice. Un elemento h `e detto una
radice (inglese: root) di g se 6= 0 e g 6= 0. Poiche dim g `e finita, ci sono soltanto un numero
finito di radici. Linsieme delle radici `e indicato con R.
Lo spazio radice (inglese root space) `e lautospazio g di g, dove R.
6.1.6 Le radici di sl(n). Lalgebra di Lie sl(n) del gruppo di Lie SL(n) `e data da:
sl(n) = { X Mn (C) : T r(X) := X11 + . . . + Xnn = 0 }
(vedi 5.1.7), in particolare, dim sl(n) = n2 1. Sia h il sottospazio di sl(n) delle matrici
diagonali:
h = {H sl(n) : Hij = 0 se i 6= j } = {diag(t1 , . . . , tn ) Mn (C) : t1 + . . . + tn = 0 }.
Poiche H1 H2 = H2 H1 se H1 , H2 sono matrici diagonali, si ha [H1 , H2 ] = 0 per ogni H1 , H2 h
e quindi h `e abeliana e diagonalizzabile (perche gi`a diagonalizzata!).
Si noti che se H = diag(t1 , . . . , tn ) e X = (Xij ) Mn (C) allora (HX)ij = ti Xij , cio`e la
i-esima riga di HX `e quella di X, moltiplicata per ti . Similmente, (XH)ij = tj Xij , cio`e la
j-esima colonna di (HX) `e quella di X, moltiplicata per tj . Perci`o, [H, X] `e la matrice con
coefficienti dati da
[H, X]ij = (ti tj )Xij ,

H = diag(t1 , . . . , tn ).

6 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI

103

A questo punto `e facile trovare gli spazi radice. Sia Ei,j la matrice elementare:
Ei,j Mn (C),

(Ei,j )kl = ik jl

dove ab `e il delta di Kronecker: ab = 1 se a = b e zero altrimenti. In particolare, tutti i


coefficienti di Ei,j sono zero tranne (Ei,j )ij = 1. Allora
[H, Ei,j ] = (ti tj )Ei,j .
Poiche gli Ei,j sono una base di Mn (C), linsieme delle radici di sl(n) `e:
R = {ij := Li Lj h : 1 i, j n, i 6= j },
dove
Li : h C,
Poiche

Li (diag(t1 , . . . , tn )) = ti .

ti = 0 gli Li h non sono indipendenti in h ma si ha:


L1 + . . . + L n = 0 h .

Una base di gij `e data dalla matrice elementare Ei,j :


gij = CEi,j .
Si noti che ogni spazio radice `e proprio unidimensionale.
Per essere concreti, nel caso n = 3 si ha:

t1 0 0
x11 x12 x13
t1 x11 t1 x12 t1 x13
HX = 0 t2 0 x21 x22 x23 = t2 x21 t2 x22 t2 x23 ,
0 0 t3
x31 x32 x33
t3 x31 t3 x32 t3 x33
e poi:

t1 x11 t1 x12 t1 x13


t1 x11 t2 x12 t3 x13
[H, X] = HX XH = t2 x21 t2 x22 t2 x23 t1 x21 t2 x22 t3 x23
t3 x31 t3 x32 t3 x33
t1 x31 t2 x32 t3 x33

0
(t1 t2 )x12 (t1 t3 )x13
0
(t2 t3 )x23 .
= (t2 t1 )x21
(t3 t1 )x31 (t3 t2 )x32
0
Quindi gli autovalori non nulli di ad(H) sono: (t1 t2 ), (t1 t3 ), (t2 t3 ). Perci`o sl(3) ha
sei radici: R = {(L1 L2 ), (L1 L3 ), (L2 L3 )}.
6.1.7 Commutatori e radici. Linsieme delle radici R h determina lalgebra di Lie
semplice g. Un primo passo per capire come mai ci`o capita `e la propriet`a:
[g , g ] g+

(, R),

6 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI

104

in particolare [g , g ] = 0 se + 6 R. La dimostrazione `e facile, sia X g , X g , allora


[H, [X , X ]] = [[H, X ], X ] + [X , [H, X ]]
= (H)[X , X ] + (H)[X , X ]
= ( + )(H)[X , X ]
e perci`o [X , X ] g+ , dove abbiamo usato lidentit`a di Jacobi come in 5.3.2. Si pu`o mostrare
che [g , g ] = g+ se + R.
6.1.8 La forma di Killing. Sia V uno spazio vettoriale complesso. Lo spazio vettoriale
complesso End(V ) ha una forma bilineare naturale data da BV (X, Y ) := Tr(XY ) dove Tr(Z)
`e la traccia dellendomorfismo Z di V . Scegliendo una base di V , cio`e un isomorfismo V
= Cn ,
si pu`o esplicitare tale forma bilineare e si ottiene:
Bn : Mn (C) Mn (C) C,

n X
n
X
Bn (X, Y ) = Tr(XY ) =
(
Xlk Ykl ),
l=1 k=1

P
dove Tr(Z) = l Zll `e la traccia della matrice Z. La formula per Bn mostra che Tr(XY ) =
Tr(Y X), quindi B `e simmetrico: B(X, Y ) = B(Y, X) per ogni X, Y End(V ). Poiche la
traccia `e lineare, Tr(X + Y ) = Tr(X) + Tr(Y ), si ha T r([X, Y ]) = T r(XY Y X) = 0.
Unaltra propriet`a importante della forma di Killing `e:
B([X, Y ], Z) = B(X, [Y, Z])

(X, Y, Z Mn (C)),

cio`e, che vale Tr((XY Y X)Z) = Tr(X(Y Z ZY )). Per mostrarlo si considera la differenza
tra i due lati e si usa:
Tr((XY Y X)Z X(Y Z ZY )) = Tr(XZY Y XZ) = Tr([XZ, Y ]) = 0,
come appena visto.
La rappresentazione aggiunta di unalgebra di Lie semplice g d`a una inclusione ad : g ,
End(g)
= Mn (C) dove n = dim g. Quindi otteniamo una forma bilineare su g, detta forma di
Killing, definita da
B : g g C,

B(X, Y ) := Bg (ad(X), ad(Y ))

e, come appena visto, questa forma bilineare soddisfa B([X, Y ], Z) = B(X, [Y, Z]).
La forma di Killing `e nondegenere, cio`e, per ogni X g, X 6= 0, esiste uno Z g tale che
B(X, Z) 6= 0. Per mostrare ci`o, si definisce il nucleo di B:
ker(B) := {X g : B(X, Z) = 0 Z g}
e si mostra che ker(B) = 0. Si noti che ker(B) `e un sottospazio lineare di g. In pi`
u, se X, Y g
sono tali che B(X, Z) = B(Y, Z) = 0 per ogni Z g allora anche B([X, Y ], Z) = B(X, [Y, Z]) =

6 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI

105

B(X, Z 0 ) = 0. Quindi ker(B) `e un ideale di g e, poiche g `e semplice, ker(B) = {0} oppure


ker(B) = g. Poi si dimostra che ker(B) 6= g, per esempio usando un risultato di Cartan.
6.1.9 La simmetria R = R. Siano , h e X g , X g . Se + 6= 0 h ,
allora esiste un H h tale che ( + )(H) 6= 0. Si ha:
(H)B(X , X ) = B([H, X ], X ) = B([X , H], X ) = B(X , [H, X ]) = (H)B(X , X ),
perci`o ( + )(H)B(X , X ) = 0 e quindi B(X , X ) = 0. In particolare, gli autospazi g e g
sono perpendicolari se + 6= 0:
g B g

se + 6= 0.

Sia adesso R e X g , X 6= 0. Supponiamo che g = 0. Allora B(X , X ) = 0 per ogni


X g e per ogni h . Ma allora B(X , X) = 0 per ogni X g = g , in contraddizione
con il fatto che B `e nondegenere su g. Quindi g 6= 0 se g 6= 0.
6.1.10 La forma di Killing e lalgebra di Cartan. La restrizione della forma di Killing
ad h `e nondegenere
perche se H h allora esiste un X g tale che B(H, X) 6= 0. Allora
P
X = X0 + X con X0 h e X g . Se R, 6= 0 e quindi + 0 6= 0 e in 6.1.9
abbiamo visto che ci`o implica B(H, X ) = 0. Quindi B(H, X0 ) 6= 0 e poiche X0 g0 = h segue
che B non `e degenere su h.
Poiche B `e nondegenere su h, B definisce una dualit`a, sempre indicata con B, cio`e un
isomorfismo:

=
B : h h, 7 T
se (H) = B(T , H)
per ogni H h. Si noti che (T ) = B(T , T ).
6.1.11 Copie di sl(2) in g. Sia R, quindi anche R e [g , g ] g0 = h. Mostriamo
che
[X , X ] = B(X , X )T
se X g , X g ,
dove T h `e definito in 6.1.10. Da questo segue che [g , g ] = CT perche ci sono X , X
tale che B(X , X ) 6= 0 (vedi 6.1.9).
Sia H h, allora si ha:
B(H, [X , X ]) =
=
=
=

B([H, X ], X )
(H)B(X , X )
B(H, T )B(X , X )
B(H, B(X , X )T ),

quindi ogni H h `e perpendicolare a [X , X ] B(X , X )T . Poiche B `e nondegenere su


h segue [X , X ] = B(X , X )T , come volevasi dimostrare.
Si ricordi che lalgebra di Lie sl(2) ha una base H, X, Y con H = [X, Y ] e [H, X] = 2X (si
veda 5.2.4). Si pu`o mostrare che B(T , T ) 6= 0 e quindi si pu`o definire lelemento
H :=

2
T
B(T , T )

( h),

allora (H ) = B(T , H ) = 2.

6 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI

106

Visto che CH = CT = [g , g ], ci sono X g , X g tale che [X , X ] = H e


poiche (H ) = 2 si ha anche [H , X ] = (H )X = 2X . Il sottospazio tre dimensionale
generato da X , X e H `e allora una sottoalgebra di Lie di g isomorfa a sl(2):
[X , X ] = H ,

[H , X ] = 2X ,

[H , X ] = 2X .

In particolare, ogni radice definisce una copia di sl(2).


Linclusione di algebre di Lie sl(2) , g composta con la rappresentazione aggiunta di g
definisce una rappresentazione dellalgebra sl(2) su g. In particolare, gli autovalori di ad(H )
sono interi(!) (vedi 5.4.8). Poiche
ad(H )(X ) = [H , X ] =
si ha allora che

2(T )
2
[T , X ] =
X
B(T , T )
B(T , T )

2(T )
Z
B(T , T )

(, R).

Lo studio dellazione di sl(2) su g permette inoltre di mostrare che:


dim g = 1

se R

e anche che se R allora R se e solo se = 1.


6.1.12 Lo spazio hR . Per ogni R `e stato definito un elemento H h (vedi 6.1.11).
Si pu`o mostrare che il sottospazio vettoriale complesso di h generato dalle H `e h. Usando
lisomorfismo h
= h definito da B, si pu`o definire una forma bilineare (, ) su h nel modo
seguente:
(, ) := B(T , T )
(, h ).
Lo sottospazio vettoriale reale di h generato dalle H , scritto hR , `e uno spazio reale di
dimensione l = dimC h, il rango di g:
l = dimC h = dimR hR .
La forma bilineare (, ) definisce un prodotto scalare sullo spazio vettoriale reale hR .
Si noti che in 6.1.11 abbiamo mostrato che
2

(, )
2(T )
=
(, )
B(T , T )

`e un intero.
6.1.13 Il gruppo di Weyl. Linsieme delle radici R di unalgebra di Lie complessa semplice
`e un sottoinsieme finito che genera uno spazio vettoriale reale hR con un prodotto scalare (, ),
vedi 6.1.12.

6 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI

107

Per una radice , scriviamo per liperpiano perpendicolare a :


:= {x hR : (x, ) = 0 }

( hR ).

Sia s la riflessione in :
s : hR hR ,

x 7 x 2

(x, )
,
(, )

per verificare la formula basta notare la linearit`a, che s (x) = x se x , cio`e se (x, ) = 0,
e che s () = per R. Il sottogruppo del gruppo ortogonale di hR generato dalle s ,
R `e il gruppo di Weyl di g, scritto
W = W (g) := h s : R i

( O(hR )).

6.1.14 Linvarianza di R sotto W . Linsieme delle radici R `e invariante per lazione di


W , cio`e per w W e R anche w() R. Per mostrare questo, dobbiamo verificare che se
, R anche
s () = 2

B(T , T )
(T )
(, )
=2
=2
= (H )
(, )
B(T , T )
B(T , T )

R.

La copia di sl(2) g generata da H , X , X agisce su g via la rappresentazione aggiunta. Il


sottospazio V[] g definito da
V[] := nZ gn+ ,
`e una sottorappresentazione di sl(2) in g perche:
ad(H )Xn+ = (n + )(H )Xn+ ,

ad(X )Xn+ = [X , Xn+ ] g(n1)+ .

Ogni gn+ `e uno spazio peso delle rappresentazioni di sl(2) su V[] con peso lintero (n +
)(H ) = 2n + (H ). Poiche ogni gn+ ha dimensione al pi`
u uno, segue che V[] `e una
rappresentazione irriducibile di sl(2) (vedi 5.4.10). Da ci`o segue che i pesi di V[] sono m, m
2, . . . , (m 2), m per un certo m Z0 .
Dato che (H ) `e un peso, anche (H ) deve essere un peso di V[] . Quindi esiste un
intero n tale che (H ) = (n + )(H ). Dato che (H ) = 2 si ha n = (H ). Perci`o
(H ) + `e una radice di g, come desiderato.
6.1.15 Esempio: lalgebra di Cartan di sl(n). Consideriamo il caso g = sl(n). Sia
ij = Li Lj R (vedi 6.1.6), si ricordi che gij = CEi,j . Definiamo, per i, j {1, . . . , n},
i 6= j, lelemento
Hij = [Ei,j , Ej,i ] = Ei,i Ej,j

( [gij , gij ] h),

la matrice diagonale con tutti i coefficienti uguale a zero tranne un 1 in posizione ii e un 1


in posizione jj. In particolare, Hji = Hij . Per esempio, se n = 3, H12 = diag(1, 1, 0) e
H23 = diag(0, 1, 1). Si verifica che
[Hij , Ei,j ] = 2Ei,j

quindi Hij = Hij ,

6 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI

108

lunico elemento in [gij , gij ] con questo autovalore su gij .


Le radici di sl(n) sono gli kl = Lk Ll con kl (diag(t1 , . . . , tn )) = tk tl , quindi si ha

2 se k = i, l = j,
1 se k = i, l 6= j,
kl (Hij ) =

0 se {k, l} {i, j} = ,
e ovviamente kl (Hlk ) = 2, kl (Hik ) = kl (Hki ) = 1 se i 6= l.
Lazione del gruppo di Weyl `e dato da s () = (H ) (vedi 6.1.13) quindi

ij 2ij = ij se k = i, l = j,
il ij =
jl se k = i, l 6= j,
sij (kl ) =

kl se {k, l} {i, j} = ,
(si noti: il ij = (Li Ll ) (Li Lj ) = Lj Ll = jl ). Usando s () = s () e
s = s , troviamo che
dove = (ij) Sn ,

sij (kl ) = (k)(l) ,

W (sl(n))
= Sn ,

cio`e il gruppo di Weyl del sistema di radici di sl(n) `e il gruppo simmetrico Sn .


Si noti che non abbiamo usato il prodotto scalare su hR in modo esplicito. Poiche le riflessioni
s sono applicazioni ortogonali, possiamo comunque determinare questo prodotto scalare, a
meno di moltiplicazione per una constante non-zero, da questo risultato (per calcoli diretti
vedi [FH], 15.1). Anzitutto, date due radici ij , kl , esiste un W (sl(n)) = Sn tale che
(ij ) = kl . Quindi (, ) non dipende dalla scelta di R. Scegliamo lo scalare col quale
moltiplichiamo il prodotto scalare su hR in modo tale che (, ) = 2 e scriviamo ancora (, )
per questo prodotto scalare. Poiche
(H ) = 2

(, )
= (, )
(, )

troviamo, usando la formula per sij qui sopra, che


(ij , ij ) = 2,

(ij , il ) = 1,

(ij , kl ) = 0

se i, j, k, l sono distinti tra di loro. Questa mostra che si ha una isometria


hR = (ni=1 RLi ) /hL1 + . . . + Ln i E := {(x1 , . . . , xn ) Rn : x1 + . . . + xn = 0},
data da:
Li 7 ei (e1 + . . . + en )/n,

quindi ij = Li Lj 7 ei ej ,

(ij , kl ) = (ei ej , ek el ).

dove il prodotto
scalare su E `e P
quello indotto dal prodotto scalare euclideo standard su Rn :
P
(x, y) = xi yi . In particolare, ( ni=1 ai Li , Lk Ll ) = ak al .

6 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI

6.2

109

Sistemi di radici e diagrammi di Dynkin

6.2.1 Sistemi di radici. Sia g unalgebra di Lie semplice (complessa) con algebra di Cartan
h. La rappresentazione aggiunta di g individua un insieme finito R h , cio`e un insieme di
mappe lineari h C. Un h sta in R se e solo 6= 0 e se esiste un X g tale che
ad(H)(X) = (H)X per ogni H h (vedi 6.1.5). Il sottospazio reale di h generato dalle radici
si scrive hR , la sua dimensione `e uguale al rango di g, cio`e l = dimC h = dimR hR .
La forma di Killing B su g induce un prodotto scalare sullo spazio reale hR , scritto semplicemente (, ). Il gruppo di Weyl W di g `e il sottogruppo del gruppo ortogonale di (hR , (, ))
generato dalle riflessioni rispetto agli iperpiani perpendicolari alle radici. Linsieme delle radici
R `e invariante per lazione di W , cio`e ogni w W permuta le radici.
Adesso definiamo, in astratto, un sistema di radici. Mostriamo che gli insiemi di radici
R hR sono sistemi di radici. Poi daremo brevemente i risultati principali che servono per
classificare i sistemi di radici e per mostrare che c`e una biiezione tra algebre di Lie complesse
semplice e sistemi di radici.
6.2.2 Definizione. Sia E uno spazio vettoriale euclideo, cio`e E `e uno spazio vettoriale reale
con prodotto scalare, scritto (, ). Un sistemo di radici in E `e un sottoinsieme R E tale che
valgano le seguenti quattro condizioni:
R1 R `e un insieme finito, R genera E e 0 6 R.
R2 Sia R, allora R se e solo se = 1.
R3 Per R, la riflessione s rispetto alliperpiano manda R in se stesso.
R4 Per , R il numero reale
n := 2

(, )
(, )

`e un intero.
Un elemento di R `e detto
` radice, il rango di R `e la dimensione di E. Un sistema di radici `e detto
irriducibile se R 6= R1 R2 in modo tale che ogni R1 `e perpendicolare con ogni R2 .
6.2.3 Unalgebra di Lie d`
a un sistema di radici. Sia g unalgebra di Lie complessa
semplice e sia h unalgebra di Cartan di g. Allora R = Rg hR `e un sistema di radici
irriducibile (vedi [FH], 21.1), vedi anche 6.1.11, 6.1.12.
6.2.4 Un sistema di radici d`
a unalgebra di Lie. Sia R E un sistema di radici
irriducibile. Si pu`o definire unalgebra di Lie complessa g = gR , che risulta essere semplice e
tale che il sistema di radici Rg di g `e proprio R stessa. In pi`
u, se R = Rg , il sistema di radici
di unalgebra di Lie complessa semplice, allora gR = g.
In combinazione con il fatto, vedi 6.2.3, che ogni algebra di Lie semplice complessa determina un sistema di radici irriducibile, si conclude che si ha una biiezione tra le algebre di Lie

6 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI

110

semisemplici complesse e i sistemi di radici irriducibili. Per la classificazione dei sistemi di


radici irriducibili, tramite diagrammi di Dynkin, si veda 6.3.
Per costruire lalgebra di Lie gR si pu`o usare una variante della costruzione di Serre (vedi
[FH], p.337). Siano 1 , . . . , n le radici semplici di g che corrisponderanno ai vertici del diagramma di Dynkin, definito qui sotto. e sia nij = 2(i , j )/(j , j ). Si consideri lalgebra di
Lie complessa generata da elementi Hi , Xi , Yi , 1 i n, cio`e un elemento di questa algebra di
Lie `e una combinazione lineare di [Z1 [Z2 , [Z3 , . . . Zk ]] . . .] con Zj {H1 , . . . , Yn }. Poi si prenda
il quoziente per le seguenti relazioni
[Hi , Hj ] = 0,

[Xi , Xi ] = Hi ,

[Xk , Yl ] = 0,

[Hi , Xj ] = nji Xj ,

[Hi , Yj ] = nji Yj

per ogni i, j e k 6= l, poi per i 6= j si impone anche:


[Xi , Xj ] = 0,
[Xi , [Xi , Xj ]] = 0,
[Xi , [Xi , [Xi , Xj ]]] = 0,
[Xi , [Xi , [Xi , [Xi , Xj ]]]] = 0,

[Yi , Yj ] = 0
[Yi , [Yi , Yj ]] = 0,
[Yi [Yi , [Yi , Yj ]]] = 0
[Yi , [Yi [Yi , [Yi , Yj ]]]] = 0

se nij
se nij
se nij
se nij

= 0,
= 1,
= 2,
= 3.

Lalgebra di Lie quoziente si indica con gR . Si mostra che gR `e semplice, di rango n, con algebra
di Cartan h =< H1 , . . . , Hn > e il sistema di radici di gR `e R.

6.3

Diagrammi di Dynkin

6.3.1 Radici positive e radici semplici. Le condizioni R1, . . . , R4 sono molto restrittive.
Per esempio, se `e langolo tra due radici , , allora una formula ben nota per il prodotto
scalare d`a:
(, )2
=
n n = 4 cos2 .
cos2 =
(, )(, )
Poiche gli n sono interi per R4 e 0 cos2 1 ci sono poche possibilit`a per gli n (vedi
[FH], Table 21.4 e 6.3.3). In particolare, non `e difficile classificare tutti i sistemi di radici di
rango 1 (`e facile vedere che `e unico) e 2 (ce ne sono 4, i tre sistemi irriducibili sono disegnati
in 6.3.3).
Per classificare i sistemi di radici in generale, si usa una qualsiasi applicazione lineare l :
E R tale che l() 6= 0 per ogni R. Poiche R `e finito, tale l esiste ed `e detta mappa
regolare. Allora, poiche l() 6= 0, l() = l() e R = R (per R2), si ottiene una partizione
dellinsieme R
a
R = R+
R
R+ := { R : l() > 0}, R = R+ .
Linsieme R+ `e detto linsieme delle radici positive mentre R `e linsieme delle radici negative. Una radice positiva ( R+ ) `e detta semplice se non `e la somma di due altre radici
positive.

6 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI

111

Si mostra poi che linsieme delle radici semplice `e una base di E, che ogni radice positiva
`e una combinazione lineare delle radici positive con coefficienti che sono interi positivi e che
(, ) 0 per radici semplici , . Questo implica che 90 < 180 .
6.3.2 Esempio. Sia R il sistema di radici di sl(n), vedi 6.1.6:
X
X
ai = 0,
R = {Li Lj : i 6= j} E = hR = {
ai Li hC :

ai R i }.

Si scelga l : E R tale che


X
X
l(
ai L i ) =
li ai ,

con li > li+1 > 0,

allora l(Li Lj ) = li lj 6= 0 se i 6= j, quindi l `e una mappa regolare. Una scelta conveniente,


anche per il sistema di radici Bn qui sotto in 6.3.5, `e di definire:
l : ni=1 RLi R,

l(Li ) = n + 1 i,

quindi l(Li Lj ) = j i ( Z).

Poiche li lj > 0 se e solo se i < j si ha:


R+ = { Li Lj : i < j }.

Sia i := Li Li+1

( R+ )

per i = 1, . . . , n1. Si noti che l() Z>0 per ogni R+ e l() = 1 se e solo se = i per un
certo i. Allora segue che ogni i `e semplice perche se i = + con , R+ allora 1 = l(i ) =
l() + l() 2, una contraddizione. Invece, per k 2, Li Li+k = (Li Li+1 ) + (Li+1 Li+k )
quindi le altre radici positive non sono semplici.
P
P
Gli i sono una base di E (si ricordi che
ai = 0 se
ai Li E). In pi`
u, se a R+ si ha
= Li Lj con i < j e:
Li Lj = (Li Li+1 ) + (Li+1 Li+2 ) + . . . + (Lj1 Lj ) = i + i+1 + . . . + j1
quindi ogni radice positiva `e combinazione lineare delle radici positive con coefficienti che sono
interi positivi (infatti, i coefficienti sono in {0, 1}). Infine,
(i , i+1 ) = (Li Li+1 , Li+1 Li+2 ) = 1,

(i , j ) = 0 se |i j| > 1.

6.3.3 Diagrammi di Dynkin. Se 1 , . . . , n e 10 , . . . , n0 sono radici semplici (per scelte di


mappe regolari l, l0 : E R), allora si mostra che esistono un w W (R) e una permutazione
0
0
0
di 1, . . . , n tale che w(i ) = (i)
. Quindi gli n2 prodotti scalari (i , j ) = ((i)
, (j)
) sono
determinati in modo unico (a meno di permutazioni) da R.
Il diagramma di Dynkin di un sistema di radici `e definito nel modo seguente. Per ogni
radice semplice si ha un vertice, e due vertici sono connessi da k segmenti, k {0, 1, 2, 3}, se
4(i , j )2
= 4 cos2 = k
(i , i )(j , j )

6 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI

112

dove `e langolo tra le due radici corrispondenti. Se , hanno lunghezza diversa, mettiamo
il segno < (o >) sui segmenti tra i vertici corrispondenti, indicando in tal modo quale `e pi`
u
lungo dellaltro.
Se due radici semplici e non sono perpendicolari, (, ) < 0. Allora k = 4 cos2 `e 1, 2, 3,
e langolo tra di loro `e 120 , 135 , 150 rispettivamente. Si ricordi che n = 2(, )/(, ) e
n sono interi per R4, ora negativi, con prodotto n n = k, quindi n , n {1, 2, 3}.
Supponiamo ora n n , poiche (, )/(, ) = n /n si ha:
Se k = 1, si ha n = n = 1, quindi (, ) = (, ).
Se k = 2, si ha n = 2, n = 1, quindi (, ) = 2(, ).
Se k = 3, si ha n = 3, n = 1, quindi (, ) = 3(, ).
Nel diagramma di Dynkin si trovano allora soltanto le seguenti connessioni tra due vertici:

(, ) = (, )
cos = 1/2
= 120

>

(, ) = 2(,
)
cos = 2/2
= 135

>

(, ) = 3(,
)
cos = 3/2
= 150


-

I tre casi considerati qui sopra sono tutti i tre sistemi di radici di rango 2, si chiamano A2 , B2
e G2 rispettivamente. Questi sistemi di radici sono quindi i seguenti:

6
-


-




Dato il diagramma di Dynkin di R, si pu`o ricostruire R (a meno di moltiplicazione per uno


scalare e una isometria) nel modo seguente. Si enumeri i vertice del diagramma di Dynkin.
Si prenda 1 = e1 E = Rn , con prodotto scalare standard. Supponiamo che 1 , . . . , i1
Ri1 Rn sono stati determinati. Dal diagramma si trova la lunghezza di i . Si trova anche
i prodotti scalari (j , i ) ( 0) per j = 1, . . . , i 1, questi determinano una retta (affine) in
Ri su cui giace i . Ci sono adesso due scelte per i (scambiate tramite la riflessione rispetto
alliperpiano Ri1 Ri ). In questo modo si determina 1 , . . . , n Rn , unico a meno di una
isometria. Sia si la riflessione rispetto alliperpiano perpendicolare a i e sia W il gruppo
generato dalle si . Si mostra che lunione delle orbite delle i `e un sistema di radici, che `e R, a
meno di moltiplicazione per uno scalare (per aggiustare la lunghezza di 1 ) e una isometria:
R
= { w(i ) : w W, i = 1, . . . , n }.
6.3.4 Esempio: sl(n) e An1 . Per esempio, sia R = {Li Lj : i 6= j, 1 i, j n} e
i = Li Li+1 per i = 1, . . . , n 1 il sistema di radici di sl(n) (con la scelta di radici positive

6 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI

113

come in 6.3.2). Le radici hanno la stessa lunghezza e il diagramma di Dynkin `e:


1
c

2
c

n2
c

n1

questa sistema di radici `e chiamato An1 .


6.3.5 Esempio: il sistema di radici Bn . Il sistema di radici Bn `e il sottoinsieme di Rn ,
con prodotto scalare standard, dato dai vettori Rn con (, ) {1, 2}, cio`e:
Bn = { Li , (Li Lj ),

i, j {1, . . . , n}, i 6= j }

dove gli Li sono la base standard di Rn . Poiche le riflessioni s sono applicazioni ortogonali, `e
ovvio che s (Bn ) = Bn . Si noti che s permuta Li e Lj se = Li Lj , manda Li 7 Lj e
Lj 7 Li se = Li + Lj e manda Li 7 Li se = Li . Infine s fissa gli altri Lk .
La mappa l : Rn R di 6.3.2 `e regolare anche per Bn . Le radici positive sono gli Li e gli
Li Lj con i < j, le radici semplici sono i R con l() = 1:
1 = L1 L2 , . . . n1 = Ln1 Ln ,

n = Ln .

Il diagramma di Dynkin Bn contiene quello di An1 , poi lultima radice semplice n `e


perpendicolare a tutte le altre tranne n1 e
4 cos2 = 4

(n1 , n )2
= 4(1)2 /(2 1) = 2
(n1 , n1 )(n , n )

quindi ci sono due segmenti tra n1 e n . Poiche (n1 , n1 ) > (n , n ) mettiamo il segno
> nel diagramma tra i vertice corrispondenti:
1

n2 n1
e

e >

6.3.6 Classificazione dei diagrammi di Dynkin. Si arriva cos` a classificare tutti i


diagrammi di Dynkin:

6 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI

n2 n1

n2 n1

e
c

n1

n
e >

n3

n2
c

e <

n1

114

An , n 1,

sl(n + 1),

Bn , n 2,

so(2n + 1),

Cn , n 3,

sp(2n),

Dn , n 4,

so(2n),

n
2
c

3
c

4
c

5
c

n1
c

En , n = 6, 7, 8,

1
1

e >

F4 ,

< e

G2 .

Si noti che E5 corrisponderebbe `a D5 , D3 a A3 , D2 a due copie di A1 , e C2 a B2 , mentre


D1 = C1 = B1 = A1 , quindi le restrizioni su n sono fatte in modo tale da avere ogni diagramma
di Dynkin una sola volta. Per i diagrammi di Dynkin delle algebre di Lie complesse semplici
sl(n + 1), so(2n) e so(2n + 1) vedi 6.3.4, 8.4.2 e 8.5.2.
I sistemi di radici En , F4 , G2 corrispondono ai gruppi di Lie eccezionali, si veda [FH] Lecture
22, per maggiori dettagli su di essi. In particolare, E8 e G2 godono di un interesse particolare
per i fisici.
6.3.7 Il sistema di radici duali. Sia R E un sistema di radici. Per R definiamo

:=

2
( E),
(, )

:= {
R
: R } ( E).

E `e un sistema di radici, detto sistema di radici duali di R. In


Si pu`o verificare che anche R
pi`
u se 1 , . . . , n sono le radici semplici di R (per una scelta di una mappa regolare l), allora

1, . . . ,
n sono radici semplici di R.

Nel caso in cui (, ) `e lo stesso intero per tutti gli R, allora ovviamente R e R
coincidono (a meno di moltiplicazione per uno scalare). Queste `e il caso per An , Dn e En . Se
sono isomorfe (succede nel caso
invece ci sono due lunghezze di radici, potrebbe essere che R e R
B2 = C2 , F4 e G2 ) oppure che non sono isomorfe, questo succede soltanto nel caso R = Bn , Cn
n = Cn , e Cn = Bn per n > 2.
con n > 2, in quel caso B
Nel caso di Bn , vedi 6.3.5, le radici sono
= Li


= 2Li ,

= (Li Lj )


= (Li Lj ) (i 6= j).

6 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI

115

In particolare, (, ) {1, 2} mentre (


,
) {2, 4}. Usando la solita mappa regolare l di
6.3.1, si verifica che

1 = L1 L 2 , . . . ,
n1 = Ln1 Ln ,

n = 2Ln

n `e quello di Cn . Viceversa, Cn = Bn .
sono le radici semplici e che il diagramma di Dynkin di B

6.4

Algebre di Lie semplici reali

6.4.1 Coniugazioni su uno spazio vettoriale complesso. Sia V uno spazio vettoriale
complesso di dimensione finita. Una coniugazione su V `e uninvoluzione C-antilineare
: V V,

(z1 v1 + z2 v2 ) = z1 v1 + z2 v2 ,

((v)) = v,

per v, v1 , v2 V e z1 , z2 C. Il sottospazio (reale) dei vettori -invarianti `e:


V := {v V : V = V },

si ha V = V iV ,

perche la R-linearit`a di e 2 = I d`a la decomposizione in autospazi (reali) V = V V dove


v V se (v) = v. Se v V si ha (iv) = i(v) = iv, quindi iV V . Viceversa, se
(v) = v allora (iv) = i(v) = iv, quindi iv = w V e v = iw iV , perci`o anche
V iV .
Un esempio di coniugazione `e
: Cn Cn ,

(z1 , . . . , zn ) 7 (
z1 , . . . , zn ),

in questo caso ovviamente (Cn ) = Rn , i vettori con z1 , . . . , zn R. Ogni base di uno spazio vettoriale complesso definisce in questo modo una coniugazione, data dalla coniugazione complessa
delle coordinate di un vettore.
Se `e unaltra coniugazione su Cn , allora : Cn Cn `e C-lineare ed invertibile (si noti
che ( )1 = ), quindi (w) = Aw per un A GL(n, C) e ogni w V . Sia v = (w)
allora otteniamo (v) = A(v), quindi data una coniugazione , tutti le altre si ottengono
componendo con unapplicazione C-lineare invertibile opportuna.
Per esempio, lapplicazione : C C, z 7 a
z `e una coniugazione su V = C se e solo se
z ) = z per ogni z C, quindi se e solo se a
a = 1. Per esempio, se a = i allora
2 = I, cio`e a(a

C = iR.
6.4.2 Forme reali di algebre di Lie complesse. Sia g unalgebra di Lie complessa. Una
forma reale di g `e un sottospazio reale g0 di g, che `e unalgebra di Lie (reale) e tale che
g = g0 ig0 (equivalente: g0 R C
= g tramite il prodotto X z 7 zX) (vedi [FH], Lecture
26).
Una forma reale di g determina quindi una coniugazione su g con g = g0 . In generale
per`o, per una coniugazione su g qualsiasi, lo spazio vettoriale g non `e unalgebra di Lie.

6 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI

116

6.4.3 Le forme reali di sl(n). Lalgebra di Lie


sl(n)R := {X Mn (R) : tr(X) = 0 }

, sl(n) = {Y Mn (C) : tr(Y ) = 0 }

`e una forma reale di sl(n) perche Y sl(n) si scrive in modo unico come Y = Y1 + iY2 con
Y1 , Y2 sl(n)R (usare tr(Y1 + iY2 ) = tr(Y1 ) + itr(Y2 )).
Sia Q = diag(1 , . . . , n ) Mn (C) con i {1}. Allora Q2 = I, cio`e Q = Q1 e Q = Q.
Lapplicazione X 7 Q1 (t X)Q `e C-lineare, e quindi
: sl(n) sl(n),

X 7 Q1 (t X)Q

`e C-antilineare, e in pi`
u `e uninvoluzione:


( (X)) = Q1t Q1 (t X Q = Q1 t QXQ1 Q = X.
I punti fissi di sono
su(Q) := sl(n) = {X sl(n) : QX + t XQ = 0 }
che `e lalgebra di Lie del gruppo unitario SU (Q) definito da
SU (Q) = {A GL(n, C) : t AQA = Q, }.
Se Q = Ip,q , la matrice con 1 = . . . = p = 1, p+1 = . . . = n = 1, quindi In = I, il gruppo
unitario si scrive SU (p, q) (oppure SU (n) se q = 0) e lalgebra di Lie si scrive su(p, q) oppure
su(n). Si pu`o anche mostrare in modo diretto che su(n) `e una forma reale di sl(n), poiche
X su(n) se e solo se X = X e tr(X) = 0, in particolare X `e una matrice antihermitiana, e
ogni Y sl(n) si scrive come


Y + tY ,
con Y t Y , i(Y + t Y ) su(n).
Y = 21 Y t Y + i i
2
Il risultato fondamentale `e che ogni forma reale di sl(n) `e isomorfa a sl(n)R , su(n) oppure
su(p, q) con 1 p q n, p + q = n.
6.4.4 La forma compatta. Il gruppo di Lie SU (n) `e compatto. La sua algebra di Lie su(n)
`e una forma reale di sl(n). Lalgebra di Cartan h di sl(n) da una sottoalgebra h su(n) di
su(n):
P
h su(n) = {diag(t1 , . . . , tn ) : P
ti = 0} {X : t X = X }
= {diag(is1 , . . . , isn ) :
si = 0, sj R }.
Gli autovalori di ad(H) per H h su(n) nella rappresentazione aggiunta sono isa isb =
i(sa sb ), in particolare, sono puramente immaginari. Poiche exp(H) = diag(et1 , . . . , etn ), e
ex+iy = ex (cos x + isen y), si ha che exp(h su(n)) `e un sottogruppo compatto.
In generale, sia g0 una forma reale di unalgebra di Lie complessa semplice g. Allora g0
`e lalgebra di Lie di un gruppo di Lie reale compatto se e solo se ogni radice di g ha valori
puramente immaginari su h g0 , dove h `e unalgebra di Cartan di g (vedi [FH], Proposition
26.4)

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

117

Rappresentazioni di algebre di Lie semplici

Testi consigliati: [FH], [Ha], [Hu].

7.1

Pesi: integralit`
a e simmetria

7.1.1 I pesi di una rappresentazione. Sia g unalgebra di Lie semplice e sia


: g End(V )
una rappresentazione di g su uno spazio vettoriale complesso V di dimensione finita. Sia h g
unalgebra di Cartan. In 6.1.3 abbiamo visto che V si decompone in spazi pesi (autospazi per
h):
V = V ,
(H)v = (H)v
(H h, v V )
dove : h C `e unapplicazione lineare. Linsieme delle h per i quali V 6= 0 `e detto
linsieme dei pesi di .
In particolare, i pesi della rappresentazione aggiunta di g sono le radici e = 0 (vedi 6.1.5).
7.1.2 Esempio. Sia V = Cn , la rappresentazione standard di g = sl(n). Poiche H =
diag(t1 , . . . , tn ) h `e gi`a diagonale sulla base standard ei di V , si ha:
V = Cn = Li VLi ,

VLi = Cei ,

perche Hei = ti ei = Li (H)ei .

7.1.3 Integralit`
a dei pesi. Lalgebra di Cartan h `e generata su C dagli H dove `e una
radice di g. Dato un H , ci sono X g tali che < H , X , X > `e una sottoalgebra di
Lie di g che `e isomorfa a sl(2) e tale che [H , X ] = 2X (vedi 6.1.11). In particolare, la
restrizione della rappresentazione a questa sl(2) `e una rappresentazione di sl(2) e quindi gli
autovalori di H su V sono interi. Perci`o, per ogni peso di una rappresentazione di g e per
ogni R si ha:
(H ) Z
Questo `e equivalente a, come gi`a visto, < , > Z:
< , >:= 2

2
(, )
=
B(T , T ) = B(T , H ) = (H ) Z,
(, )
(, )

vedi 6.1.10 per la definizione di T , 6.1.11 per la definizione di H e 6.1.12 per la definizione di
(, ).
7.1.4 Il reticolo dei pesi W . Quindi un peso di una rappresentazione di g `e contenuto
nellinsieme:
W := { hR : < , > Z R }.

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

118

`
Scelta una decomposizione R = R+ R , sia = {1 , . . . , n } R+ linsieme delle radici
semplici. I pesi fondamentali di g (rispetto a ) sono gli elementi i hR definiti da
< i , i >= 1,

< i , j >= 0

(i 6= j).

Allora si ha:
W = Z1 Z2 . . . Zn .
Infatti, per W sia mi =< , i >. Allora mi Z e
X
X
<
mi i , j >=< , j >
< mi i , j >= mj mj = 0
i

( j ).

Dal
P fatto che (, ) `e un prodotto scalare su hR e gli i sono una base di hR , segue che
e:
i mi i = 0, cio`
X
=
m i i ,
dove mi =< , i > Z
i

che mostra . Per , si noti che < , > `e lineare in , quindi basta verificare che
`e una radice del
< i , > Z per i = 1, . . . , n. Si ricordi da 6.3.7 che
= (2/(, )) R
sistema di radici duali. Visto che < i , >= (,
) dobbiamo quindi mostrare che (i ,
) Z
Gli i sono un base di radici semplici di R
e quindi ogni
per ogni
R.
`e una combinazione
con coefficienti interi di questi
i . Poiche (i ,
) `e lineare in
basta allora verificare che
(i ,
j ) Z per ogni i, j. Ma (i ,
j ) =< i , j >= ij , per definizione di i , e abbiamo
mostrato .
Linsieme W `e un sottogruppo abeliano di rango n di hR e genera questo spazio. Si chiama
il reticolo dei pesi (weight lattice) di g.
7.1.5 Il reticolo delle radici. Il reticolo delle radici `e il gruppo:
R := Z1 + . . . + Zn .
Poiche ogni radice `e una combinazione lineare con coefficienti interi delle radici semplici
1 , . . . , n , R R . Inoltre, dato che n = 2(, )/(, ) =< , > Z ogni radice `e
un peso e quindi R W . Il gruppo quoziente W /R risulta essere un gruppo finito e ha
(pi`
u precisamente, il suo duale) uninterpretazione in termine di gruppi di Lie complessi con
algebra di Lie g, vedi [FH] p.372-374.
7.1.6 Radici e pesi. Nel capitolo 6 abbiamo introdotto e studiato la decomposizione
dellalgebra di Lie in spazi peso per la rappresentazione aggiunta:
g = h (R g ).
Lazione di un (X ), con X g , manda V in V+ ,
(X ) : V V+

(X g )

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

119

perche, per v V :
(H)((X )v) =
=
=
=

(([H, X ]) + (X )(H))v
(((H)X ) + (X )(H))v
((H) + (H))((X )v)
( + )(H)((X )v).

7.1.7 Il gruppo di Weyl e i pesi. Mostriamo che per R e un peso di V , anche s ()


`e un peso di V , cio`e linsieme dei pesi di una rappresentazione `e invariante per lazione del
u dim V = dim Vs () , cio`e, i pesi nella stessa orbita del gruppo di
gruppo di Weyl su hR . In pi`
Weyl hanno la stessa molteplicit`a.
La dimostrazione `e analoga a quella di 6.1.14. Anzitutto si ha:
s () = < , > = (H ).
Se V 6= 0, allora V `e uno spazio peso per sl(2) con peso k := (H ) e molteplicit`a dim V .
Sia < H , X , X > la copia di sl(2) g associata a . Il sottospazio
V[] := nZ V+n

( V = V )

`e allora invariante per (sl(2)), quindi `e una rappresentazione di sl(2). Si noti che V+n `e uno
spazio peso per H sl(2) con peso ( + n)(H ) = (H ) + 2n perche (H ) = 2.
Dalla teoria delle rappresentazioni di sl(2) segue che se k `e un peso di una rappresentazione
di sl(2), allora anche k `e un peso con la stessa molteplicit`a e che (X )k : V[],k V[],k `e
un isomorfismo (con segno se k > 0). Poiche
k = (H ) = (H ) 2(H ) = ( (H ))(H )
il sottospazio di V[] con peso (H ) per sl(2) `e V(H ) = Vs () .

7.2

Il peso massimale di una rappresentazione irriducibile

7.2.1 La camera di Weyl. Poiche il gruppo di Weyl W permuta i pesi di ogni rappresentazione di g, `e interessante avere un modo di determinare un unico elemento (almeno, quasi
sempre) in ogni orbita di W .
Sia = {1 , . . . , n } R linsieme delle radici semplici (per una scelta di mappa regolare
l). La camera di Weyl fondamentale (chiusa) `e il sottoinsieme di hR dato da:
C = C() = {x hR : (x, ) 0 }.
Allora si pu`o mostrare che per ogni x hR esiste un w W tale che w(x) C. Questo w `e
unico tranne se (w(x), ) = 0 per un , nel qual caso anche (s w)(x) = w(x) C quindi
w non `e unico (vedi [FH], Lemma D.31). Linsieme delle x C con (x, ) = 0 per un
`e detto una parete della camera di Weyl.

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

120

7.2.2 I pesi dominanti. Un peso W `e detto dominante se W C. Linsieme dei


pesi dominanti `e indicato con
nX
o
+
W := W C =
mi i : mi Z0 ,
lultima ugualianza segue dal fatto che <

mi i , j >= mj .

7.2.3 Vettori massimali e pesi massimali. Sia : g End(V ) una rappresentazione


di g. Un peso di `e detto massimale se esiste v V , v 6= 0, tale che (X )v = 0 per ogni
R+ . Il vettore v V `e detto vettore massimale di .
Ci`o generalizza il concetto di vettore massimale per una rappresentazione di sl(2), vedi 5.4.5.
Nel caso g = sl(2) i pesi massimali (in quel caso, interi n Z0 ) classificano le rappresentazioni
irriducibili di g (vedi 5.4.10).
Ogni R+ `e una combinazione, con coefficienti interi non-negativi, di radici semplici.
Poiche g+ = [g , g ] se + `e una radice, si pu`o mostrare che X `e un prodotto (per il
prodotto di Lie in g) delle Xi . Quindi (X ) `e un prodotto delle (Xi ). Perci`o un vettore
v V `e massimale se e solo se (Xi )v = 0 per ogni radice semplice i .
Se `e un peso tale che V+i = 0 per ogni radice semplice, allora, poiche (X )(V ) V+ ,
ogni v V , v 6= 0, `e un vettore massimale di .
7.2.4 Pesi massimali sono dominanti. Mostriamo che un peso massimale `e un peso
dominante. Sia un peso massimale, e sia v V un vettore massimale. Se hH , X i g `e
la copia di sl(2) definita da R+ , allora il vettore massimale v `e un vettore massimale per
questa sl(2). Perci`o (H )v = (H )v con (H ) 0. Per ogni radice semplice i R+ si ha
allora 0 (Hi ) =< , i >, quindi `e dominante.
7.2.5 Esistenza di un vettore massimale. Linsieme dei pesi di una rappresentazione di
g `e un insieme finito, quindi esiste un peso con l() l() per ogni peso di . Poiche l `e
lineare e l() > 0 per ogni R+ si ha l( + ) > l() e quindi V+ = 0 per ogni R.
Quindi `e un peso massimale di e ogni v V , v 6= 0 `e un vettore massimale di .
7.2.6 La rappresentazione irriducibile generata da un vettore massimale. Sia v V
un vettore massimale. Sia W il sottospazio generato dalle immagini di v mediante successive
applicazioni di elementi di g con R .
Mostriamo che W `e una sottorappresentazione di g. Sia R = {1 , . . . , N },
Wn := h (Xi1 ) . . . (Xik )v : ij R , 0 k n i,

W =
n=0 Wn .

Poiche : g End(V ) `e lineare, basta mostrare che (X)x W per ogni x W e X =


H, X , X con H h, R e R+ .
Sia x = (Xi1 ) . . . (Xik )v Wn con k n. Allora (H)x = (H)x con = + i1 +
. . . + ik (vedi 7.1.6), quindi (H)x W e, in pi`
u, x V . In particolare,
(h)Wn Wn

(n Z0 ),

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

121

e segue che (H)W W per ogni H h. Lunico vettore (a meno di moltiplicazione per uno
scalare) in W con peso `e v:
W = Cv,
e ogni altro peso di W si scrive come = + i1 + . . . + ik con k 1 e ij R .
La definizione di Wn mostra che per x Wn e R si ha (X )x Wn+1 . Segue che
(X )W W per ogni R .
In fine, mostriamo per induzione su n che
(X )Wn Wn

X g , R+ ;

da ci`o segue che (X )W W per ogni R+ . Se n = 0, si ha W0 = Cv e (X )v = 0 perche


v `e un vettore massimale. Se x Wn e n > 0, allora x = (X )y con y Wn1 e R ,
quindi
(X )x = (X )(X )y
= (X )(X )y + ([X , X ])y.
Si noti che Y := [X , X ] g+ . Se + 6 R {0}, g+ = 0 e quindi Y = 0. Se
+ = 0, Y h e quindi (Y )y Wn . Se + R allora (Y )y Wn perche y Wn1 .
Se + R+ si ha (Y )y Wn1 per lipotesi di induzione. Quindi in ogni caso si ha
([X , X ])y Wn . Sempre per lipotesi di induzione, per y Wn1 si ha (X )y Wn1 , e
perci`o (X )(X )y Wn . Allora anche (X )(X )y + ([X , X ])y Wn e concludiamo che
(X )x Wn .
7.2.7 La rappresentazione W `
e irriducibile. Mostriamo che la rappresentazione W di
g generata dal vettore massimale v `e irriducibile. Sia W = W 0 W 00 , dove W 0 , W 00 sono
sottorappresentazioni. Decomponendo ciascuna in spazi peso, lo spazio peso W = Cv, che ha
dimensione uno, `e contenuto in W 0 oppure W 00 . Poiche la rappresentazione di g generata da v
`e W si ha W 0 = W oppure W 00 = W , quindi W `e irriducibile.
7.2.8 Il vettore massimale `
e unico. Mostriamo che v `e lunico vettore massimale (a meno
di moltiplicazione per uno scalare) nella rappresentazione W . Sia v 0 W , v 0 (6= 0) un vettore
massimale. Allora v 0 genera una sottorappresentazione W 0 W . Dato che W `e irriducibile e
W 0 6= 0, si ha allora W 0 = W . Sia W il peso di v 0 , allora = + i1 + . . . + ik per certi
ir R . Sia l : hR R una mappa regolare lineare tale che l() < 0 per ogni R , allora
l() l() e si ha l() = l() se e solo se = .
Ogni altro peso di W 0 si scrive come = + j1 + . . . + jl per certi js R , in particolare
l( ) l(). Dato che v W 0 e il peso di v `e segue allora che l() l().
Quindi l() = l() e perci`o = . Dato che W = Cv, segue v 0 Cv. In particolare, una
rappresentazione irriducibile ha un unico vettore massimale, a meno di moltiplicazione per uno
scalare.
7.2.9 Conclusione. Data una rappresentazione : g End(V ), il teorema di Weyl (vedi
5.3.8) afferma che V = V1 V2 . . . Vk , dove ogni Vi `e una rappresentazione irriducibile.
I risultati appena ottenuti mostrano che ogni Vi ha un vettore massimale vi e che il vettore

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

122

massimale vi genera una sottorappresentazione irriducibile di Vi , che `e quindi Vi . In particolare,


la dimensione dello spazio generato dai vettori massimali `e k.
Se la rappresentazione `e irriducibile, allora ha un unico vettore massimale (a meno di
moltiplicazione per uno scalare). Il peso = del vettore massimale `e allora determinato
in modo unico dalla rappresentazione. Questo peso `e massimale (per definizione) e abbiamo
mostrato che `e quindi dominante (si veda 7.2.4).
Mostriamo che il peso determina in modo unico (a meno di isomorfismi) la rappresentazione irriducibile W generata dal vettore massimale. Questa rappresentazione irriducibile
verr`a indicata con V ().
Poi c`e da stabilire se un peso dominante determini una rappresentazione irriducibile il
cui vettore massimale abbia peso (si vedano 7.2.12 e 7.2.13).
7.2.10 Unicit`
a della rappresentazione irriducibile. Due rappresentazioni irriducibili
V , W di g su spazi vettoriali V, W rispettivamente, con vettori massimali v V e w W e
lo stesso peso +
W sono isomorfe. Per vedere questo, si consideri la somma diretta V W ,
che `e una rappresentazione di g con
: g End(V W ),

(X)(x, y) := (V (X)x, W (X)y).

Sia U V W la sottorappresentazione generata da (v, w). Allora U `e irriducibile perche


(v, w) `e un vettore massimale in V W . La proiezione
V : U V,

(x, y) 7 x,

soddisfa V (X) = V (X)V

per ogni X g come si verifica facilmente. Quindi V `e un omomorfismo di rappresentazioni e


perci`o ker(V ) e im(V ) sono sottospazi invarianti (vedi 5.3.7). Poiche (v, w) U e V (v, w) =
v V , si ha ker(V ) 6= U e im(V ) 6= 0. Dato che U e V sono irriducibili, si ha allora
ker(V ) = 0 e im(V ) = V , quindi V `e un isomorfismo. Similmente, usando W , si trova che
U
= W , quindi V
= W.
7.2.11 Prodotti tensoriali e pesi. Il prodotto tensoriale di rappresentazioni V , W di
unalgebra di Lie g `e definito da
V W (X)(v w) = ((X)v) w + v (W (X)w).
In particolare, se X = H g e
V (H)v = 1 (H)v,

W (H)w = 2 (H)w

V W (H)(v w) = (1 + 2 )(H)(v w).

Quindi se V1 e W2 sono spazi peso di V e W , il loro prodotto tensoriale `e contenuto in uno


spazio peso di V W :
V1 W2 (V W )1 +2 .
In generale si ha V1 . . . Vk V1 +...+k .
7.2.12 Le rappresentazioni irriducibili fondamentali. I pesi fondamentali 1 , . . . , n ,
definiti da < i , j >= ij (vedi 7.1.4), sono in particolare pesi dominanti (vedi 7.2.2). Un

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

123

teorema fondamentale mostra che esistono rappresentazioni irriducibili V (i ) di g con peso


massimale i , cio`e
i : g End(V (i )),

i (H)vi = i (H)vi ,

i (X )vi = 0,

per ogni R+ , dove vi V (i ) `e un vettore massimale (che `e unico a meno di moltiplicazione


per una costante). Queste rappresentazioni si chiamano rappresentazioni fondamentali di g.
7.2.13 La classificazione di rappresentazioni irriducibili. Ogni peso dominanteP `e una
combinazione lineare con coefficienti interi non-negativi dei pesi fondamentali. Sia = i mi i ,
mi Z0 . Consideriamo il prodotto tensoriale
V := V (1 ) . . . V (1 ) V (2 ) . . . V (2 ) . . . V (n ) . . . V (n ) .
|
{z
} |
{z
}
|
{z
}
m1

m2

mn

Sia vi V (i ) un vettore massimale e sia


v := v1 . . . v1 v2 . . . v2 . . . vn . . . vn
{z
} |
{z
}
|
{z
}
|
m1

m2

( V ).

mn

Dato che vi V (i ) `e un vettore massimale, cio`e i (X )vi = 0 per ogni i R+ , si ha


(X )v = 1 (X )v1 v1 . . . vn + . . . + v1 v1 . . . n (X )vn = 0 + . . . + 0 = 0.
Quindi v `e un vettore massimale in V con peso (massimale e quindi dominante):
(H)v = (m1 1 + m2 2 + . . . + mn n )(H)v = (H)v.
Perci`o v genera una rappresentazione irriducibile W V con (unico) peso massimale (vedi
7.2.6). Questa rappresentazione W `e lunica rappresentazione irriducibile con peso massimale
(vedi 7.2.10) ed `e indicata con V () := W .
In questo modo si conclude la classificazione delle rappresentazioni irriducibili di unalgebra di Lie complessa semplice: esse corrispondono ai pesi dominanti. In particolare sono
parametrizate da n-tuple di interi (m1 , . . . , mn ) dove n `e il rango
P dellalgebra di Lie, e ogni
mi Z0 . La rappresentazione corrispondente `e V () con = mi i .
7.2.14 Formula per la dimensione di V (). La dimensione della rappresentazione V ()
corrispondente al peso dominante `e ([FH], Cor. 24.6):
Q
X
R+ ( + , )
,
dove = 12
.
dim V () = Q
R+ (, )
+
R

Un esempio: se g = sl(3), si ha R+ = {L1 L2 , L2 L3 , L1 L3 } e quindi


Y
= L1 L 3 ,
(, ) = 1 1 2 = 2.
R+

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

124

Se = m1 1 + m2 2 = a1 L1 + a2 L2 , con a1 = m1 + m2 , m2 = a2 , allora
Y
( + , ) = (m1 + 1)(m2 + 1)(m1 + m2 + 2) = (a1 a2 + 1)(a2 + 1)(a1 + 2),
R+

quindi la dimensione di V () `e:


dim V (m1 1 + m2 2 ) = (m1 + 1)(m2 + 1)(m1 + m2 + 2)/2 = (a1 a2 + 1)(a2 + 1)(a1 + 2)/2.

7.3

Le rappresentazioni irriducibili di sl(n)

7.3.1 I pesi fondamentali di sl(n). Un insieme di radici semplici del sistema di radici R di
sl(n), indicato con An1 , `e dato dalle i = Li Li+1 Rn /hL1 + . . . + Ln i, con 1 i n 1.
Si noti che, con
1 = L 1 ,

2 = L1 + L2 , . . . , n1 = L1 + L2 + . . . + Ln1 = Ln

si ha

< i , j >= ij ,

dove il prodotto scalare (, ) viene calcolato tramite lisometria di hR con E in 6.1.15. In


particolare, (, ) = 2 per ogni radice e perci`o < , >= (, ). Quindi questi i sono i pesi
fondamentali.
I pesi dominanti di sl(n) sono allora
Pn1
+
W = {
i=1 mi i : mi Z0 }
= {(m1 + . . . + mn1 )L1 + (m2 + . . . + mn1 )L2 + . . . + mn1 Ln1 : mi Z0 }
P
e dominante se a1 a2 . . . an1 (e poi an1 = mn1 , an2 an1 =
cio`e un peso n1
i=0 ai Li `
mn2 ecc.).
Nella rappresentazione
standard Cn di sl(n), lalgebra di Cartan `e data dalle H =
P
diag(t1 , . . . , tn ) con
ti = 0 e Li (H) = ti . In particolare si ha la decomposizione in spazi
peso:
Cn = ni=1 Cei ,
Hei = Li (H)ei
(1 i n)
e ei `e li-esimo vettore della base standard di Cn . Lunico peso dominante in {L1 , . . . , Ln } `e
L1 = 1 quindi si ha:
V (1 ) = Cn .
Si noti anche che X , per R+ , `e una matrice triangolare superiore con zeri sulla diagonale,
quindi X e1 = 0, che verifica che e1 (Cn )1 `e un vettore massimale.
La rappresentazione di sl(n) su k Cn ( (Cn )k ), per k < n, ha la seguente decomposizione
in spazi peso:
k Cn = (k Cn ) ,

= Li1 + Li2 + . . . + Lik ,

V = C ei1 ei2 . . . eik ,

dove i1 < . . . < ik . Lunico peso dominante tra le Li1 + Li2 + . . . + Lik , con indici distinti, `e
L1 +L2 +. . .+Lk = k (bisogna ricordare Ln = (L1 +. . .+Ln1 )). Quindi la rappresentazione

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

125

`e irriducibile perche ogni sottorappresentazione non banale avrebbe un peso dominante. Perci`o
abbiamo trovato le rappresentazioni irriducibili fondamentali, esse sono i
V (k ) = k Cn .
Il prodotto wedge
k Cn nk Cn n Cn
= C,

(, ) 7 = c, e1 . . . en

d`a una dualit`a k Cn


= (nk Cn ) . Quindi le rappresentazioni V (k ) e V (nk ) di sl(n) sono
rappresentazioni duali:
V (k )
= (V (nk )) .

c
c

c
c

sc
2

c
c
c

c
sc

sc

c
2

c
c

c
c

c
c

c1

sc

c
sc

c
c

c
c

c
c

sc

sc

c
c

c
c

Pesi fondamentali e radici di sl(3)


7.3.2
Rappresentazioni di sl(n) e funtori di Schur. La rappresentazione V , con =
P
mi i , `e una sottorappresentazione di un prodotto tensoriale:
V () , k (k V )mk V

Pn1
k=1

kmk

V = Cn .

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

126

La decomposizione del prodotto tensoriale V m in rappresentazioni irriducibili di GL(V )


`e data nel Teorema 3.2.6. Mostriamo che la restrizione a SL(V ) di una rappresentazione
irriducibile di GL(V ) su uno spaziop
vettoriale W rimane irriducibile. Ogni A GL(V )
n
si scrive come A = (tI)B con t = ( det(A))1 , n = dim V , e B SL(V ). Poiche tI
commuta con tutti gli elementi di GL(V ), anche (tI) commuta con tutto (GL(V )), e quindi,
per il Lemma di Schur 2.1.7, (tI) = sIW per un s = s(t) C. Se W = W1 W2 `e una
decomposizione di W in sottospazi invarianti per (SL(V )), allora, poiche sIW (Wi ) Wi ,
questi sottospazi sono invarianti anche per (GL(V )), quindi uno dei due `e {0} e laltro W .
Segue che : SL(V ) GL(W ) `e irriducibile.
In particolare, nella decomposizione del Teorema 3.2.6:
X
T m V = p (Sp V )mp ,
con p = (p1 , . . . , pr ), pi pi1 > 0,
pi = m
i

in rappresentazioni irriducibili per GL(V ), parametrizzate dalle partizioni p di m, ogni Sp V `e


una rappresentazione irriducibile di SL(V ) = SL(n, C) e quindi di sl(n). Il peso dominante
che corrisponde alla rappresentazione irriducibile di Sp V `e:
Sp V
= V (p1 L1 + p2 L2 + . . . + pr Lr ).
Poiche L1 + . . . + Ln1 + Ln = 0, le rappresentazioni definite da p = (p1 , . . . , pr ) e pa =
(p1 + a, . . . , pr + a, a, . . . , a), partizioni di m e m + na rispettivamente, sono isomorfe.
Per mostrare che Sp V
= V (p1 L1 + p2 L2 + . . . + pr Lr ), basta trovare un peso massimale in
Sp V , che `e unico perche Sp V `e irriducibile, e verificare che `e uguale a p1 L1 + p2 L2 + . . . + pr Lr .
Si ricordi che Sp V = ap bp T m V e
bp V m (1 V ) . . . (s V ),
dove i `e il numero dei quadrati nella i-esima colonna del diagramma di Young di p (vedi
3.2.11). In particolare, s = p1 , il numero delle colonne `e uguale al numero dei quadrati nella
prima riga. Un vettore massimale del lato a destra `e
v = (e1 e2 . . . e1 ) . . . (e1 e2 . . . es ),

Hv = (p1 L1 + . . . + pr Lr )(H)v,

perche Hei = Li (H)ei e e1 compare s = p1 volte in v e ha peso L1 , poi ci sono p2 colonne


con almeno due quadrati e perci`o e2 compare p2 volte, ecc. Il vettore v `e massimale perche un
X , per R+ `e dato da un Ei,j , con i < j, che manda ej 7 ei e ek 7 0 se k 6= j, quindi
v 7 0. Applicando ap a v otteniamo un vettore di Sp V e poiche ap v `e una simmetrizzazione
parziale di v il peso di ap v Sp V `e uguale al peso di v. Da ci`o segue lisomorfismo Sp V
=
V (p1 L1 + p2 L2 + . . . + pr Lr ).
Nel caso n = 3 verifichiamo esplicitamente che la dimensione di S(a1 ,a2 ) V , calcolato usando
3.2.10 `e uguale alla dimensione di V (a1 L1 + a2 L2 ), calcolata con 7.2.14. Il diagramma di Young
della partizione m = a1 + a2 `e:
...
...
a1 +1

a1

a2

a2 1

...
...

a1 a2
a1 a2
+2
1

...

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

127

dove abbiamo indicato gli hooklength hij nei quadrati. Allora si ha, per n = 3,
! a
!
a1
2
Yni+j
Y
Y
a1 a2 + 1
(2 + j)
(1 + j)
dim S(a1 ,a2 ) V =
=
hij
(a1 + 1)! a2 !
i,j
j=1
j=1
quindi dim S(a1 ,a2 ) V = (a1 + 2)(a2 + 1)(a1 a2 + 1)/2 che `e proprio la formula di 7.2.14 per
dim V (a1 L1 + a2 L2 ).
7.3.3 Il prodotto simmetrico della rappresentazione standard. Mostriamo che la
rappresentazione V (k1 ) (per k 0) di sl(n) `e la rappresentazione S k V (1 ), il k-esimo prodotto
simmetrico della rappresentazione standard V = V (1 ). In pi`
u determiniamo gli spazi peso e
mostriamo che ogni spazio peso ha dimensione 1.
Consideriamo (si veda anche 5.5.2 per il caso n = 2) la rappresentazione del gruppo di Lie
SL(n, R) su C (Rn ) definita da:
r : SL(n, R) Aut(C (Rn )),

(r (A) F )(v) := F (t Av)

(v Rn ).

Sia := (dr)I : sl(n, R) End(C (Rn )) la rappresentazione dellalgebra di Lie associata. Si


mostra facilmente che, per i 6= j,
(Ei,j ) = xi

,
xj

(t1 E1,1 + . . . + tn En,n ) = t1 x1

+ . . . + tn xn
.
x1
xn

Sia C[x1 , . . . , xn ]m lo spazio vettoriale dei polinomi omogenei di grado m. Una base di
C[x1 , . . . , xn ]m `e data dai monomi
xa11 xa22 . . . xann ,

a1 + a2 + . . . + an = m.

E facile verificare che C[x1 , . . . , xn ]m `e un sottospazio sl(n, R)-invariante che `e anche sl(n) =
sl(n, R) R C invariante. La complessificazione di d`a allora le rappresentazioni
m : sl(n) End(C[x1 , . . . , xn ]m ).
Un vettore massimale di m `e un F C[x1 , . . . , xn ]m tale che m (X )F = 0 per ogni R+ .
Allora = Li Lj con i < j, m (X ) = xi /xj e F soddisfa:
xi

F
= 0
xj

1 i < j n.

In particolare, F/xj = 0 per j = 2, . . . , n quindi F = cxm


1 per uno scalare c C. Quindi
m ha un unico vettore massimale (a meno di moltiplicazione per uno scalare) e perci`o m `e
irriducibile. Il peso del vettore massimale `e:
m (H)(xm
1 ) = (t1 x1

m
+ . . . + tn xn
)(xm ) = mt1 xm
1 = mL1 (H) x1 ,
x1
xn 1

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

128

quindi il peso massimale `e mL1 . Dato che 1 = L1 , questo mostra che


V (m1 )
= C[x1 , . . . , xn ]m = S m V,
detto lm-esimo prodotto simmetrico della rappresentazione standard V . Si verifica che ogni
monomio `e un vettore peso:
m (H)(xa11 xa22 . . . xann ) = (a1 L1 + a2 L2 + . . . + an Ln )(H)xa11 xa22 . . . xann .
P
I pesi sono quindi della forma a1 L1 + a2 L2 + . . . + an Ln con ai 0 e ai = m. Questi pesi sono
distinti tra di loro, perci`o ogni spazio peso ha dimensione uno cio`e ogni peso ha moltiplicit`a
uno.
Nel diagramma qui sotto sono indicati i pesi e i monomi di S 3 V = C[x, y, z]3 , cio`e per sl(3).
Per sl(3) il diagramma dei vettori pesi di S m V `e un triangolo con vertici mL1 , mL2 e mL3 ,
ogni peso nel interno del triangolo (incluso quelli sul bordo) `e un peso di S m V e ha molteplicit`a
uno.
3L2

L1 + 2L2

xy

2L1 + L2

3L1

x3

2L2 + L3

xy

L 1 + L2 + L3
t
xyz

y2z

L2 + 2L3

L1 + 2L2
t

x2 z

L1 + 2L3

yz

xz 2

3L3
t

z3
7.3.4 Il duale del prodotto simmetrico. Si ricordi che lazione di A GL(n, C) sullo
spazio duale `e data dalla matrice t A1 (vedi 1.1.12). Per lalgebra di Lie questo implica (si usi
un cammino (t) con (0) = I e 0 (0) = X) che lazione di X g sullo spazio duale `e data
da t X. In particolare, se V `e una rappresentazione di g con pesi 1 , . . . , r , i pesi di V sono
1 , . . . , r .
Poiche iP
pesi della rappresentazione S m V sono della forma a1 L1 + a2 L2 + . . . + an Ln con
ai Z0 e
ai = n, i pesi della rappresentazione duale (S m V ) = S m (V ) sono della forma

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

129

(a1 L1 + a2 L2 + . . . + a3 L3 ). In particolare, mLn = m(L1 + L2 + . . . + Ln1 ) `e un peso


dominante di questa rappresentazione. Poiche per R+ , m(L1 + L2 + . . . + Ln ) + non `e un
peso, m(L1 + L2 + . . . + Ln1 ) `e un peso massimale di S m (V ). Visto che S n V `e irriducibile,
anche il suo duale `e irriducible (un sottospazio invariante W S m V definisce un sottospazio
W = {x S n V : w(x) = 0 w S m V } che `e anchesso invariante). Quindi
S m V = V (mn1 )

7.4

dove m1 = L1 + . . . + Lm1 = Lm .

Le rappresentazioni irriducibili di sl(3)

7.4.1 I pesi del prodotto tensoriale di S m V e S n V . Sia = m1 + n2 un


peso dominante di sl(3), cio`e m, n Z0 . La rappresentazione irriducibile V () `e una
sottorappresentazione di
V () = V (m1 + n2 ) , V (m1 ) V (n2 ) = (S m V ) (S n V ),

V = C3 .

Per trovare la decomposizione di (S m V )(S n V ) in rappresentazioni irriducibili, determiniamo


i pesi di questa rappresentazione e la loro molteplicit`a. Poi troviamo i pesi, con loro moltiplicit`a,
di ogni rappresentazione irriducibile V () di sl(3), vedi 7.4.4.
Consideriamo prima un esempio, con m = m1 = 3, n = m2 = 2. Nel prossimo diagramma
sono riportati i pesi della rappresentazione (S 3 V ) (S 2 V ). Si noti che i pesi sullesagono H0 ,
che `e il bordo del diagramma, sono somma di un peso di S 3 V e un peso di S 2 V in modo unico,
quindi la molteplicit`a di un peso in H0 `e uno.
Nel triangolo interiore T , con vertici 3L1 2L1 = L1 , L2 , L3 , ogni peso `e la somma di un
peso di S 3 VPe un peso di S 2 V in 6 modi diversi. Infatti, = Li + (b1 L1 + b2 L2 + b3 L3 ), con
bi Z0 e
bi = 2, `e sempre un peso di S 3 V , e = (b1 L1 + b2 L2 + b3 L3 ) `e un peso di S 2 V .
Quindi per ognuno dei sei pesi di S 2 V esiste un peso di S 3 V tale che Li = + .
Non `e difficile vedere che un peso sullesagono H1 , in mezzo tra H0 e T e indicato con le
linee tratteggiate, `e la somma di un peso di S 3 V e un peso di S 2 V in 3 modi diversi. Per
esempio,
2L1 L3 = 3L1 (L1 + L3 ) = (2L1 + L2 ) (L2 + L3 ) = (2L1 + L3 ) 2L3 ,

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

130

si noti che si usano soltanto i 3 pesi di S 2 V nel triangolino formato dalle prime due righe.

3L2 2L3
2L3
3L2

s
s

s
s

s
s

s
s

3L1

s
2L1

s
s

3L2 2L1

s
s

s
s

s
s

s
L1

s
s

s 3L1 2L3

s
s

s3L1 2L2
s

2L2

3L3
3L3 2L1

s
s

s
s

s
s

3L3 2L2

Si noti inoltre che ci sono 15 pesi su H0 , 9 su H1 e 3 in T con molteplicit`a 1, 3 e 6 rispettivamente,


e questo quadra con:
dim (S 3 V ) (S 2 V ) = 10 6 = 60 = 15 + 27 + 18 = 15 1 + 9 3 + 3 6.
Nel caso m n il diagramma dei pesi di (S m V ) (S n V ) `e una unione di esagoni
H0 , H1 , . . . Hmn e un triangolo pieno T con vertici (m n)L1 , (m n)L2 , (m n)L1 .
La molteplicit`a di un peso in Hi `e (i + 1)(i + 2)/2, per esempio se un peso Hi `e sul
lato superiore dellesagono, = + con nel triangolino superiore del diagramma dei pesi di
S n V formato dalle prime i + 1 righe e un peso opportuno di S m V . Poiche questo triangolino
ha (i + 1)(i + 2)/2 pesi, segue la molteplicit`a di .
Se T , allora per ogni peso di S n V c`e un peso di S n V tale che = + , quindi
la molteplicit`a di un tale peso `e dim S n V = (n + 1)(nP+ 2)/2. (Per vedere questo, si noti che
si pu`o scrivere = c1 L1 + c2 L2 + c3 L3 con ci Z0 e i ci = m n, come
P nel diagramma dei
pesi di S mn V . Allora = + (b1 L1 + b2 L2 + b3 L3 ), con bi Z0 e
bi = n, `e sempre un
m
n
peso di S V . Poiche = (b1 L1 + b2 L2 + b3 L3 ) `e un peso di S V , si ha = + per ogni
peso di S n V .)
In conclusione, per un peso di (S m V ) (S n V ) si ha:

(i + 1)(i + 2)/2
se
Hi ,
i = 0, 1, . . . n 1,
m
n
dim (S V S V ) =
(n + 1)(n + 2)/2
se
T.
7.4.2 La decomposizione di (S m V ) (S n V ). Un peso massimale di (S m V ) (S n V ) `e
= mL1 nL3 = (m + n)L1 + nL2 = m1 + n2
perche + non `e un peso per R+ (questi pesi sono o a destra (se = 1 ) o sopra
(se = 2 , 1 + 2 ) a nel diagramma dei pesi e non ci sono tali pesi.) Poiche H0 ha

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

131

molteplicit`a uno, lo spazio peso ((S m V ) (S n V )) ha dimensione uno. Perci`o la sottorappresentazione generato da un vettore non-zero v in questo spazio genera una sottorappresentazione irriducibile di (S m V ) (S n V ) isomorfo a V . Per la teoria generale, esiste allora una
sottorappresentazione W1 di (S m V ) (S n V ) tale che
(S m V ) (S n V ) = V (m1 + n2 ) W 0 .
Per trovare la decomposizione di W 0 , dobbiamo trovare gli altri pesi massimali di (S m V )
(S n V ). Mostriamo che i soli pesi massimali in W1 sono
i = (mi)L1 (ni)L3 = (m+n2i)L1 +(ni)L2 = (mi)1 +(ni)2

(i = 1, . . . , n),

e che ogni (W 0 )i contiene un unico, a meno di moltiplicazione per uno scalare, vettore
massimale. Da qui segue che, per m n,
(S m V ) (S n V ) = V (m1 + n2 ) V ((m 1)1 + (n 1)2 ) . . . V ((m n)1 ).
7.4.3 Dimostrazione di 7.4.2. Per mostrare laffermazione sui pesi massimali, consideriamo
prima un peso Hi , 6= i . Usando il gruppo di Weyl, possiamo assumere che = i k1
oppure = i k2 con k > 0.
i 21s

i s 1

i 21s

si

i s 1
s

i 2
s

i 22

si

i (1 + 2 )

i 2(1 + 2 )

Consideriamo la copia di sl(2) generata da H1 , X1 . Sia W1 la sottorappresentazione di


questo sl(2) generato dai vettori in Vi . Si ha
i (H1 ) = ((m i)L1 (n i)L3 )(diag(1, 1, 0)) = m i,
quindi Vi = (W1 )mi , uno spazio peso di questo sl(2). Dalla teoria delle rappresentazioni di
sl(2) segue che
(X1 )k : (W1 )mi (W1 )mi2k
`e iniettiva, per k = 0, 1, . . . , m i, con inversa (X1 )k . Si noti che (X1 )k Vi = Vi k1 ,
quindi (W1 )mi2k Vi k1 . Per k = 0, 1, . . . , m i, i pesi i k1 sono esattamente i pesi
(m i k)L1 + kL2 (n i)L3 sul lato superiore dellesagono Hi . Poiche la molteplicit`a di
un peso `e costante sul esagono, si ha dim Vi = dim Vi k1 , e quindi (X1 )k : Vi Vi k1
`e un isomorfismo con inversa (X1 )k . Perci`o (X1 ) : Vi k1 Vi (k1)1 `e un isomorfismo
per k = 0, 1, . . . , m i, k 6= 0, in particolare, non ci sono vettori massimali in Vi k1 per k 6= 0.

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

132

In modo simile, usando la copia di sl(2) generata da H2 , X2 si vedi che non ci sono vettori
massimali in Vi l2 con i l2 Hi e l 6= 0. Poi, ancora in modo simile, si mostra che non ci
sono vettori massimali in V per in un triangolo, tranne al pi`
u in Vmn con mn = (mn)L1 .
Adesso mostriamo che c`e un unico vettore massimale, a meno di moltiplicazione per uno
scalare, in ogni Vi . Considerando il triangolo formato dalle prime i righe del diagramma dei
pesi di S n V , si vede che se i = + con , pesi di S m V , S n V rispettivamente, allora
i = + ,
con cj Z0

= (m i)L1 + (c1 L1 + c2 L2 + c3 L3 )
= (n i)L3 (c1 L1 + c2 L2 + c3 L3 ),
P
e
cj = i. Il vettore peso corrispondente a questa decomposizione `e
1 ,c2 ,ni+c3 )
vc := e(mi+c1 ,c2 ,c3 ) e(c
,

dove
ed = e(d1 ,d2 ,d3 ) := (e1 ) d1 (e2 ) d2 (e3 ) d3 ,

ed = e(d1 ,d2 ,d3 ) := (e1 ) d1 (e2 ) d2 (e3 ) d3 ,

dove e1 , e2 , e3 sono i vettori della base duale. Definiamo ed = 0, ed = 0 se una delle di `e negativa.
Si noti che ed corrisponde al monomio xd1 y d2 z d3 .
Adesso calcoliamo lazione di X1 = E1,2 su vc , si ricordi che E1,2 e1 = 0, E1,2 e2 = e1 , E1,2 e3 =
0, e nella rappresentazione duale lazione `e data da t E1,2 = E2,1 quindi e1 7 e2 e e2 , e3 7 0.
Perci`o si ha:
(mi+c +1,c 1,c )

1
2
3
(X1 )vc = c2 e1
e(c1 ,c2 ,ni+c3 ) c1 e(mi+c1 1,c2 +1,c3 ) (e )(c1 1,c2 +1,ni+c3 )
P
Sia v = c xc vc Vi , con xc C, allora
X
v=
xc vc ker (X1 ) = c2 cv = (c1 + 1)c(c1 +1,c2 1,c3 ) .

In modo simile, si trova


X
v=
xc vc ker (X2 )

c3 xc = (c2 + 1)x(c1 ,c2 +1,c3 1) .

Lultima formula implica che se c(0,0,i) = 1, allora c(0,1,i1) = i, poi c(0,2,i2) = i(i 1)/2 ecc. Si
usa poi la prima formula per determinare
c(p,q,r) per ogni p, q, r Z0 , p + q + r = i. Il risultato
P
`e che v `e un multiplo del vettore c (c1 !c2 !c3 !)1 vc . Quindi c`e un unico vettore massimale in
(S m V S n V )i .
7.4.4 I pesi di V (m1 + n2 ). Adesso siamo in grado di determinare i pesi della rappresentazione irriducibile V (m1 + n2 ) e le loro molteplicit`a. Per il caso n = 0, V (m1 ) = S m V
si vedi 7.3.3. Nel caso n = 1, si noti che
(S m V ) V = V (m1 + 2 ) S m V.
Il diagramma dei pesi di (S m V ) V `e un esagono H0 con vertici mL1 L3 = (m + 1)L1 + L2
e le sue orbite attraverso il gruppo di Weyl e il triangolo T (bordo e interno) con vertici mLi ,

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

133

i = 1, 2, 3. I pesi su H0 e T hanno molteplicit`a 1 e 3 rispettivamente, vedi 7.4.1. I pesi di S m V


sono i punti del triangolo, ognuno ha molteplicit`a uno. Quindi i pesi di V (m1 + 2 ) sono i
pesi in H0 , con molteplicit`a 1 0 = 1 e i pesi di T , con molteplicit`a 3 1 = 2.
Per m n generale, si noti che
(S m V ) (S n V ) = V (m1 + n2 ) V ((m 1)1 + (n 1)2 ) . . . V ((m n)1 )
= V (m1 + n2 ) (S m1 V ) (S n1 V ).
Quindi un peso di V (m1 + n2 ) ha molteplicit`a
dim (V (m1 + n2 )) = dim((S m V ) (S n V )) dim((S m1 V ) (S n1 V )) .
Usando il risultato di 7.4.1 e (i + 1)(i + 2)/2 i(i + 1)/2 = i + 1, troviamo:

i+1
se
Hi ,
i = 0, . . . , n 1,
dim (V (m1 + n2 )) =
n+1
se
T.
7.4.5 Esempio: S m V V . Determiniamo la decomposizione della rappresentazione S m V V
di sl(3), dove V P
= C3 `e la rappresentazione standard. I pesi di S m V sono gli a1 L1 + a2 L2 + a3 L3
con ai Z0 e
ai = m, in particolare, i pesi di V sono L1 , L2 , L3 , vedi 7.3.3. Ogni peso ha
molteplicit`a uno.
P
I pesi di S m V V si scrivono allora tutti come c1 L1 +c2 L2 +c3 L3 con ci Z0 e ci = m+1.
Si noti che questi sono anche i pesi di S m+1 V e il diagramma dei pesi `e un triangolo con vertici
(m + 1)Li . La molteplicit`a dei pesi (m + 1)Li , i = 1, 2, 3, `e uno, perche lunico modo di ottenere
(m + 1)Li come somma di pesi di S m V e V `e (m + 1)Li = mLi + Li . Se esattamente uno delle
cj = 0, diciamo c2 = 0, allora ci sono due modi di ottenere c1 L1 + c2 L2 come somma:
c1 L1 + c2 L2 = (c1 1)L1 + c2 L2 = c1 L1 + (c2 1)L2
quindi la molteplicit`a di ogni peso sul bordo del triangolo, che non sia un vertice, `e due. Poi
ogni peso nellinterno del triangolo ha ci 1 per ogni i e quindi ha molteplicit`a tre:
c1 L1 + c2 L2 + c3 L3 = ((c1 1)L1 + c2 L2 + c3 L3 ) + L1 = . . . = (c1 L1 + c2 L2 + (c3 1)L3 ) + L3 .
Nel diagramma qui sotto i pesi sullesagono indicato hanno molteplicit`a due, il vertice (m+1)L1
del diagramma ha molteplicit`a uno e i pesi nellinterno dellesagono hanno molteplicit`a 3.
(m 1)L1 + 2L2

mL1 s+ L2

mLs1

(m + 1)L1

mL1 + L3

mL1 + 2L3

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

134

Il peso (m + 1)L1 `e massimale perche (m + 1)L1 + (Li Lj ) non `e un peso se i > j. La sua
molteplicit`a `e uno, quindi V ((m + 1)L1 ) = S m+1 V compare con molteplicit`a uno in S m V V .
Togliendo i pesi di S m+1 V , si vede che rimane un diagramma esagonale, con vertici
mL1 + L2 = (m 1)1 + 2
e la sua immagine per il gruppo di Weyl (che permuta gli Li ). I pesi sul bordo dellesagono hanno
molteplicit`a 2 1 = 1, i pesi nellinterno, che `e un triangolo con vertici mL1 , mL2 , mL3 hanno
molteplicit`a 3 1 = 2. Questi sono esattamente i pesi, con molteplicit`a, della rappresentazione
irriducibile V ((m 1)1 + 2 ). Quindi si ha:
S m V V = S m+1 V V ((m 1)1 + 2 ).
Si noti che il nucleo dellapplicazione suriettiva
S m V V S m+1 V,

F G 7 F G

`e allora V ((m 1)1 + 2 ).


7.4.6 Esempio: V V V . I pesi della rappresentazione standard V = C3 di sl(3)
sono L1 , L2 , L3 ; siano e1 , e2 , e3 i vettori peso: Hei = Li (H)ei . Allora la rappresentazione
W := V V V , di dimensione 33 = 27, ha una base di vettori peso data dalle ei ej ek (con
peso Li + Lj + Lk ). In particolare, i pesi di W sono aL1 + bL2 + cL3 = (a c)L1 + (b c)L2 ,
con a + b + c = 3 e a, b, c 0.
Per decomporre W in rappresentazioni irriducibili, determiniamo la molteplicit`a dei pesi
dominanti, cio`e dei pesi aL1 + bL2 + cL3 = (a c)L1 + (b c)L2 con a c b c 0, cio`e
a b c (vedi 7.3.1). Quindi questi pesi sono 3L1 , 2L1 + L2 , L1 + L2 + L3 . Segue gi`a che se V
`e un componente irriducibile di W , allora `e uno di questi tre pesi. La molteplicit`a dei pesi di
W `e:
peso dominante molteplicit`a
3L1 = 31
1
2L1 + L2 = 1 + 2
3 e1 e1 e2 , e1 e2 e1 ,
L 1 + L 2 + L3 = 0
6 e1 e2 e3 , e1 e3 e2 ,
e2 e3 e1 , e3 e1 e2 ,

vettori peso
e1 e1 e1
e2 e1 e1
e2 e1 e3
e3 e2 e1

Poiche 3L1 `e un peso massimale (3L1 + non `e un peso di W per nessuna radice > 0, cio`e
per = L1 L2 , L1 L3 , L2 L3 ), ed ha molteplicit`a uno. Quindi V (31 ) `e una componente
irriducibile di W e compare una volta solo in W . Il diagramma dei pesi di V (31 ) `e un triangolo
(infatti V (31 )
= Sym3 (V ), vedi 7.3.3) e quindi ogni peso di V (31 ) ha molteplicit`a uno (vedi
7.4.4). Perci`o W = V (31 ) W 0 e i pesi dominanti di W 0 sono
2L1 + L2 = 1 + 2
L 1 + L 2 + L3 =
0

con molteplicit`a 3 1 = 2,
,,
,,
6 1 = 5.

Si noti che 2L1 +L2 `e un peso massimale di W 0 e ha molteplicit`a due, quindi W 0 = V (1 + 2 )2


W 00 . Il peso L1 + L2 + L3 di V (1 + 2 ) ha molteplicit`a 2 (il diagramma dei pesi di V (1 + 2 )

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

135

`e un esagono H0 e un triangolo T ridotto ad un solo punto 0 = L1 + L2 + L3 , poi si usi 7.4.4).


Quindi W 00 ha un unico peso dominante, L1 + L2 + L3 = 0, con molteplicit`a 5 2 2 = 1, perci`o
W 00 = V (0)
= C, `e la rappresentazione banale di sl(3). In conclusione:
V V V = V (31 ) V (1 + 2 )2 V (0).
Si verifica anche facilmente che dim V (31 ) = 10, dim V (1 + 2 ) = 8 e che 27 = 10 + 2 8 + 1,
come dovrebbe essere. Questa decomposizione si ottiene anche con i funtori di Schur (si veda
7.3.2 e Teorema 3.2.6):
2
V(1,1,1) .
V V V = T 3 V = V(3) V(2,1)

L1 + 2L2

3L2

1j
c

3L1

1j

3j

c
L2

2L2 + L3

2L1 + L2

3j

3j

cL1
2L1 + L3

6j
c

c
L2 + 2L3

L1 + L2 + L3

3j
c

L3

3j

3j

L1 + 2L3

1j
3L3

7.4.7 Le algebre di Lie su(n) e sl(n)C . Una rappresentazione : sl(n)C End(V ) dellalgebra di Lie complessa sl(n)C su uno spazio vettoriale complesso V definisce, per restrizione,
una rappresentazione dellalgebra di Lie su(n) sl(n)C . Si pu`o mostrare che in questo modo
si ottiene una biiezione tra le rappresentazioni irriducibile di sl(n)C (di dimensione finita) e le
rappresentazioni di su(n). Data una rappresentazione : su(n) End(V ), in particolare `e
R-lineare, la rappresentazione di sl(n)C = su(n) R C corrispondente `e lestensione C-lineare
C di : C (X z) := z(X) per X su(n) e z C.
Lalgebra di Lie su(n) `e lo spazio vettoriale reale definito da
su(n) = {X Mn (C) : t X + X = 0,

tr(X) = 0 }

7 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI

136

(si noti che X su(n) e X 6= 0 allora iX 6 su(n)).


P In particolare, una matrice diagonale
H = diag(t1 , . . . , tn ) su(n) se e solo se ti = ti e
ti = 0. In pi`
u, se X su(n) allora anche
X su(n).
Data una rappresentazione di sl(n)C , il suo duale `e dato da : X 7 t (X) (perche
per il gruppo di Lie la rappresentazione duale `e data da A 7 t A1 (si veda 1.1.12), quindi si
prenda la derivata in A = I). Quindi se `e un peso con molteplicit`a k per , allora `e un
peso con molteplicit`a k per . Data una rappresentazione : su(n) End(V ) si definisce
una rappresentazione dellalgebra di Lie reale su(n), detta la sua coniugata complessa, con
: su(n) End(V ),

X 7 (X).

Poiche X = t X per X su(n), se `e un peso con molteplicit`a k per , allora `e un peso


con molteplicit`a k per . In particolare, se `e la restrizione della rappresentazione di sl(n)
a su(n), allora `e la restrizione della rappresentazione duale .
Di solito i fisici indicano le rappresentazioni di su(n) (e di tutti le altre algebre di Lie)
con la loro dimensione, eventualmente con qualche indice per distinguere rappresentazioni non
equivalenti con la stessa dimensione. Per esempio, qui sotto diamo un dizionario che d`a il
legame tra le rappresentazioni di sl(3)C e di su(3):
V0 1,

VL1 3,

VL1 +L2 = VL1 3,

V2L1 +L2 8,

V3L1 10.

I prodotti tensoriali sono tipicamente indicati con un invece di un , e analogamente


invece di scrivono +, per esempio:
VL1 VL1 +L2 = V2L1 +L2 V0
2
VL1 VL1 VL1 = V3L1 V2L
V0
1 +L2

3 3 = 8 + 1,
3 3 3 = 10 + 8 + 8 + 1.

8 GRUPPI ORTOGONALI

137

Gruppi ortogonali

Testi consigliati: [FH].

8.1

Forme bilineari simmetriche e forme quadratiche

8.1.1 Forme bilineari simmetriche. Sia V uno spazio vettoriale su un campo K (K = R


oppure C) di dimensione n. Sia
B : V V K
una forma bilineare simmetrica. Sia ei una base di V , allora B `e definita da una matrice
simmetrica
A := (B(ei , ej ))1i,jn = t A,
B(x, y) = t xAy.
Per S GL(n, K) si ha allora
B(Sx, Sy) = t x(t SAS)y.
Due matrici simmetriche A, A0 sono dette congruenti se A = t SAS per un S GL(n, K). Una
forma bilineare simmetrica definisce quindi una classe di congruenza di matrici simmetriche.
Data una matrice simmetrica A, esiste una matrice S GL(n, K) tale che
t

SAS = diag(1, . . . , 1, 1, . . . , 1, 0, . . . , 0),


| {z } | {z } | {z }
p

p + q + r = n = dim V.

(si veda [A], 7.2, Teorema 2.9). Nel caso K = C si pu`o sempre trovare una S tale che q = 0 (se
B(x, x) = 1 allora B(ix, ix) = i2 B(x, x) = +1).
8.1.2 Legge di Sylvester. ([A], Capitolo 7, Teorema 2.11) I numeri p, q, r che compaiono
nella matrice diagonale qui sopra sono determinati univocamente dalla classe di congruenza di
A, cio`e dalla forma bilineare B.
8.1.3 Forme bilineari simmetriche nondegeneri. Una forma bilineare B `e detta nondegenere se per ogni v V , v 6= 0, esiste un w V tale che B(v, w) 6= 0. Equivalentemente, se
A `e una matrice simmetrica che definisce B, allora det A 6= 0, oppure nella forma standard di
A qui sopra si ha r = 0.
Una forma bilineare simmetrica nondegenere `e quindi determinata, a meno di isomorfismi
di V , da due interi non-negativi p, q con p + q = n e la matrice simmetrica in forma standard
corrispondente `e indicata con:
Ip,q := diag(1, . . . , 1, 1, . . . , 1),
| {z } | {z }
p

p + q = n.

8.1.4 Forme quadratiche. Una forma quadratica Q su V `e unapplicazione


Q : V K,

tale che Q(x) = B(x, x)

8 GRUPPI ORTOGONALI

138

per una certa forma bilineare simmetrica B. Si noti che, rispetto ad una base dove B `e data
dalla matrice simmetrica A, si ha:
Q(x + y) = t (x + y)A(x + y) = t xAx + t xAy + t yAx + t yAy = Q(x) + Q(y) + 2B(x, y),
dove t xAy = B(x, y) = B(y, x) = t yAx, quindi Q determina B in modo unico: B(x, y) =
(Q(x + y) Q(x) Q(y))/2. (Equivalentemente, si definisce una forma quadratica richiedendo
che (x, y) 7 Q(x + y) Q(x) Q(y) sia unapplicazione bilineare). Si dice che Q `e nondegenere
se B lo `e.
Siano K = R e Q nondegenere. Allora esiste una base di V e ci sono p, q con p + q = n tali
che
Q(x) = t xIp,q x = x21 + . . . + x2p (x2p+1 + . . . + x2n ).
Nel caso K = C e Q nondegenere, esiste una base tale che
Q(x) = t xIn,0 x = x21 + . . . + x2n .
In questo caso conviene spesso scegliere unaltra base di V . Nel caso n = 2m quella per cui le
coordinate sono:
m
m
X
X
2
2
yj = xj + ixm+j , yj+m = xj ixm+j ,
quindi Q(x) =
(xj + xj+m ) =
yj yj+m ,
j=1

j=1

P
2
nel caso n = 2m + 1 dispari, si prende y2m+1 = x2m+1 quindi Q(x) = ( m
j=1 yj yj+m ) + y2m+1 .
Il gruppo ortogonale O(Q) di una forma quadratica `e il sottogruppo di GL(V ) definito da
O(Q) = {S GL(V ) : Q(Sx) = Q(x) } = {S GL(V ) : B(Sx, Sy) = B(x, y) x, y V },
lultima ugualianza segue da 2B(x, y) = Q(x + y) Q(x) Q(y).
Nel caso K = R i gruppi ortogonali sono indicati con
O(p, q) := O(Ip,q ),

O(n, R) := O(In,0 )

dove si scrive il campo R in modo esplicito per non confondersi con


O(n) = O(In ) = O(n, C)
per il gruppo ortogonale complesso. Visto che il gruppo ortogonale O(p, q) `e isomorfo a O(q, p)
(basta moltiplicare la matrice Ip,q con 1 e permutare i vettori di base), consideriamo soltanto
il caso p q nella sezione seguente.
8.1.5 Componenti connesse dei gruppi ortogonali. I gruppi ortogonali O(n, R) e O(n)
hanno due componenti connesse, la componente connessa contenente lidentit`a I `e SO(n, R)
rispettivamente SO(n). I gruppi O(p, q) con pq 6= 0 hanno quattro compomenti connesse.
Mostriamo che O(p, q) ha almeno 4 componenti connesse. Scriviamo una matrice M
O(p, q) nel modo seguente


A B
M=
,
A Mp (R), B Mp,q (R), C Mq,p (R), D Mq (R).
C D

8 GRUPPI ORTOGONALI

139

Allora A `e invertibile: se Ax = 0 per x Rp allora



 
 
A B
x
0
=
,
y = Cx Rq ,
C D
0
y
P 2
P
e quindi Qp,q ((x, 0)) =
xi 0 e Qp,q (M (x, 0)) = Q((0, y)) = yj2 0. Poiche M
O(p, q) si ha x = y = 0 e quindi A `e invertibile. In particolare, lapplicazione
: O(p, q) R {0},

M 7 det(A)

`e ben definita e continua. Adesso consideriamo lapplicazione continua:


(det, ) : O(p, q) (R {0})2 ,

M 7 (det(M ), (M )).

Sia M la matrice diagonale con M11 = b, Mnn = ab e Mii = 1 per i 6= 1, n. Allora per
a, b {1} si ha M O(p, q) e (det(M ), (M )) = (ab2 , b) = (a, b). Poiche (R {0})2 ha
quattro componenti connesse, concludiamo che anche O(p, q) ha almeno quattro componenti
connesse.

8.2

Esempi di gruppi ortogonali

8.2.1 Il gruppo ortogonale O(2, R). Il gruppo O(2, R) `e il


ortogonali di GL(2, R). Si ha A O(2, R) t AA = I che d`a
coefficienti di A:


  2
 
a c
a b
a + c2 ab + cd
=
=
b d
c d
ab + cd b2 + d2

sottogruppo delle matrici


le condizioni seguenti sui
1 0
0 1


.

Poiche ab + cd = 0 e (a, c), (b, d) 6= (0, 0) esiste un R, 6= 0, tale che (b, d) = (c, a).
Lequazione 1 = b2 + d2 = 2 (a2 + c2 ) = 2 mostra che = 1.
Nel caso = 1, si ha (b, d) = (c, a). Poiche a2 + c2 = 1, il punto (a, c) R2 sta sulla
circonferenza con raggio 1 e quindi esiste un R tale che a = d = cos , c = b = sen e
quindi


cos sen
A =
,
A A = A+
sen cos
che `e la matrice di una rotazione per con centro (0, 0). Si noti che det A = 1. Per verificare
che A A = A+ , cio`e che 7 A `e un omomorfismo di gruppi di Lie R SO(2, R), si usano
le ben note formule che seguono da ei ei = ei(+) , cio`e
(cos + isen )(cos + isen ) = cos( + ) + isen ( + ).
Si noti che A = exp(X) dove X `e un generatore di Lie(SO(2, R)), si veda 5.1.12.
Nel caso = 1 si ha (b, d) = (c, a) e det A = a(a) b2 = (a2 + b2 ) = 1. Segue
che O(2, R) ha due componenti connesse, ciascuna omeomorfa alla circonferenza S 1 . Come

8 GRUPPI ORTOGONALI

140

prima, si ha (a, c) = (cos , sen ). Sia = /2, allora (si usi per esempio (ei )2 = e2i cio`e
(cos + isen )2 = cos 2 + isen 2):
a = d = cos = cos 2 = cos2 sen 2 ,

b = c = sen = sen 2 = 2 cos sen .

Si verifica che A `e la matrice della riflessione rispetto alliperpiano v definito da v =


(sen , cos ), cio`e Ax = x 2(x, v)v.
Il prodotto di due riflessioni `e in SO(2, R) e quindi `e una rotazione. Ogni rotazione `e il
prodotto di due riflessioni, per esempio, A, B qui sotto sono riflessioni e






cos sen
1 0
cos sen
A=
,
B=
,
AB =
sen cos
0 1
sen cos
`e la rotazione per .
8.2.2 Il gruppo di Lorentz O(1, 1). Il gruppo O(1, 1) `e il sottogruppo delle matrici di
GL(2, R) che soddisfano t AI1,1 A = I1,1 , cio`e:



  2
 

a c
1 0
a b
a c2 ab cd
1 0
=
=
.
ab cd b2 d2
0 1
b d
0 1
c d
Poiche ab cd = 0 esiste un R tale che (b, d) = (c, a), Lequazione 1 = b2 d2 =
2 (a2 c2 ) = 2 mostra che = 1.
Per parametrizzare le soluzioni dellequazione a2 c2 = 1, poniamo u = a + c. Poiche
(a + c)(a c) = 1, si ha u1 = a c, in particolare u 6= 0, cio`e u R>0 oppure u R<0 .
Dunque
a = (u + u1 )/2,

c = (u u1 )/2,

con u = a + c,

u1 = a c.

Si noti che O(1, 1) ha quattro componenti connesse, in corrispondenza con il segno di e di


u = a + b, ciascuno di queste componenti `e omeomorfa con R>0 . Poiche det A = ad bc =
a(a) (c)c = (a2 c2 ) = , la componente connessa di O(1, 1) che contiene lidentit`a I `e:

 


a b
(u + u1 )/2 (u u1 )/2
o
SO(1, 1) =
=
: u R>0 .
c d
(u u1 )/2 (u + u1 )/2
Ci sono altre due parametrizzazioni di SO(1, 1)o che sono ben note. Una viene dalla teoria
della relativit`a speciale. Poiche u R>0 , lapplicazione u 7 u2 `e una biiezione. Si definisce

1+v
1+v
1+v
u2 1
2
,
con inversa: u =
, u=
=
.
v= 2
u +1
1v
1v
1 v2
Quindi i coefficienti delle matrici sono

1+v 1 1v
1
1
a = (u + u )/2 = (
+
)=
,
1v 2 1+v
1 v2

b = (u u1 )/2 =

v
.
1 v2

8 GRUPPI ORTOGONALI

141

Gli elementi di O(1, 1)o sono quindi le ben note trasformazioni di Lorentz (con velocit`a della
luce c = 1, quindi v = v/c = ):
!
Av :=
e

1
1v 2
v
1v 2

v
1v 2
1
1v 2

si verifica Av Aw = A v+w ,
1+vw

v+w
1+vw

`e la somma relativistica delle velocit`a.


Unaltra parametrizzazione `e data dalla mappa esponenziale (si veda 5.1.11 exp :
T0 SO(1, 1)o = R SO(1, 1)o . Poiche SO(1, 1)o `e uno dimensionale e u 7 (u), con (u)
la matrice con a = (u + u1 )/2 ecc., `e un cammino con (1) = I, e X := 0 (1) `e dato da




d
(u + u1 )/2 (u u1 )/2
0 1
=
,
Lie(SO(1, 1)o ) = RX
X=
1 0
du (u u1 )/2 (u + u1 )/2 |u=1
Per calcolare exp(tX) si noti che X 2 = I e quindi
!
!
 t


X
X
t2k
t2k+1
(e + et )/2 (et et )/2
exp(tX) =
I+
X=
.
(et et )/2 (et + et )/2
(2k)!
(2k
+
1)!
k=0
k=0

Poiche exp(tX)exp(sX) = exp((s + t)X), otteniamo un isomorfismo exp : R SO(1, 1)o ,


t 7 exp(tX) (suriettivo perche per ogni u R>0 esiste un t R tale u = et e iniettivo perche
(et + et )/2 = 1 se e solo se t = 0). Spesso si usa la notazione:
cosh t := (et + et )/2,

sinh t := (et et )/2.

8.2.3 Il gruppo O(2, 1). Consideriamo lo spazio vettoriale V delle matrici 2 2 con traccia
zero, che `e anche lalgebra di Lie sl(2):




y1 y2
3
V = sl(2) = M =
: (y1 , y2 , y3 ) R .
y3 y1
Per A SL(2, R) la rappresentazione aggiunta Ad : SL(2, R) GL(V ) `e data da
Ad(A) : V V,

Ad(A)(M ) = AM A1 .

Poiche det(A) = 1,
det(M ) = y12 y2 y3 ,

det(AM A1 ) = det(A) det(M ) det(A)1 = det(M ),

lapplicazione Q : M 7 det(M ) `e una forma quadratrica su V e Ad(A) O(Q) per ogni


A SL(2, R). Cambiando coordinate in V , y1 = x1 , y2 = x2 x3 , y3 = x2 + x3 otteniamo
Q(M ) = x21 x22 + x23 , quindi Q `e equivalente a Q1,2 e perci`o O(Q)
= O(1, 2)
= O(2, 1). Perci`o
Ad : SL(2, R) SO(2, 1)o ,

A 7 Ad(A)

8 GRUPPI ORTOGONALI

142

`e un omomorfismo di gruppi di Lie e si pu`o verificare che `e suriettivo con nucleo I.


8.2.4 Il gruppo O(2, 2). Consideriamo lo spazio vettoriale V delle matrici 2 2:




y1 y3
4
V = M =
: (y1 , y2 , y3 , y4 ) R .
y4 y2
Per A, B SL(2, R) definiamo unapplicazione lineare
r(A, B) : V V,

r(A)(M ) = AM t B.

Poiche det(A) = det(B) = 1,


det(M ) = y1 y2 y3 y4 ,

det(AM t B) = det(A) det(M ) det(B) = det(M ),

lapplicazione Q : M 7 det(M ) `e una forma quadratrica su V e r(A) O(Q) per ogni


A, B SL(2, R). Cambiando coordinate in V , y1 = x1 + x3 , y2 = x1 x3 , y3 = x2 + x4 ,
y4 = x2 x4 , otteniamo Q(M ) = x21 + x22 x23 x24 , quindi Q `e equivalente a Q2,2 e perci`o
O(Q)
= O(2, 2). Lapplicazione
r : SL(2, R) SL(2, R) SO(2, 2)o ,

(A, B) 7 r(A, B)

`e un omomorfismo di gruppi di Lie e si pu`o verificare che r `e suriettiva con nucleo I.


8.2.5 Il gruppo O(3, 1). Consideriamo lo spazio vettoriale V delle matrici 2 2 Hermitiane
(cio`e t M = M ): :




y1
y3 + iy4
4
: (y1 , y2 , y3 , y4 ) R .
V = M =
y3 iy4
y2
Per A SL(2, C) definiamo unapplicazione R-lineare
r(A) : V V,

r(A)(M ) = AM t A.

Poiche det(A) = 1,
det(M ) = y1 y2 y32 y42 ,

det(AM t A) = det(A) det(M )det(A) = det(M ),

lapplicazione Q : M 7 det(M ) `e una forma quadratrica su V e r(A) O(Q) per ogni


A SL(2, C). Cambiando coordinate in V , y1 = x1 + x2 , y2 = x1 x2 , y3 = x3 , y4 = x4 ,
otteniamo
Q(M ) = x21 x22 x23 x24 ,
quindi Q `e equivalente a Q1,3 e perci`o O(Q)
= O(1, 3)
= O(3, 1). Lapplicazione
r : SL(2, C) SO(3, 1)o ,

A 7 r(A)

`e un omomorfismo di gruppi di Lie e si pu`o verificare che r `e suriettivo con nucleo I.

8 GRUPPI ORTOGONALI

8.3

143

Quaternioni.

8.3.1 Quaternioni, Sp(1) e SU (2). I quaternioni sono una generalizzazione dei numeri
complessi, come i numeri complessi sono una generalizzazione dei numeri reali. Un quaternione
`e formalmente una coppia di numeri complessi, ma `e pi`
u comodo scriverlo nella forma
h = z + wj,

dove si ha

j 2 = 1,

jz = zj

(z, w C).

Si noti che il prodotto non `e commutativo. Laddizione `e data da:


(z + wj) + (z 0 + w0 j) = (z + z 0 ) + (w + w0 )j.
Il prodotto `e dato da:
(z + wj)(z 0 + w0 j) = zz 0 + zw0 j + wjz 0 + wjw0 j
= zz 0 + zw0 j + wz 0 j + ww0 j 2
= (zz 0 ww0 ) + (zw0 + wz 0 )j.
So pu`o verificare che valgono le propriet`a di associativit`a per laddizione e moltiplicazione e la
distributivit`a. Se z = a + bi, w = c + di con a, . . . , d R, un quaternione si scrive:
h = z + wj = (a + bi) + (c + di)j = a + bi + cj + dk,

k := ij = ji

(a, . . . , d R).

Si verifica facilmente che anche k 2 = 1. Lalgebra dei quaternioni si indica con H.


Una propriet`a importante dei quaternioni `e che ogni elemento non-zero ha un inverso
moltiplicativo, si dice che H `e un corpo. Definiamo prima il coniugato di un quarternione
h per:
h = z + wj = z wj = a bi cj dk,
si ha hh0 = h0 h.
Si verifica che
= z z + ww = a2 + b2 + c2 + d2
hh

( R0 ),

`e sempre reale ed `e zero soltanto se h = 0. Perci`o, se h 6= 0, h1 := (hh)


1 h
`e
quindi hh
linverso di h. La norma di un quaternione `e
p

|h| = hh
(R0 ).
La norma `e un omomorfismo di gruppi moltiplicativi H := H {0} R>0 perche
|hh0 |2 = (hh0 )hh0 = h(h0 h0 )h = (hh)(h0 h0 ) = |h|2 |h0 |2
dove abbiamo usato che il numero reale h0 h0 commuta con ogni quaternione, in particolare con
Il nucleo della norma:
h.
Sp(1) := {h H : |h| = 1 } = {a + bi + cj + dk H : a2 + b2 + c2 + d2 = 1 }

8 GRUPPI ORTOGONALI

144

`e allora un sottogruppo moltiplicativo. Poiche S 3 `e una variet`a (una sottovariet`a di R4 ) si


verifica facilmente che Sp(1) `e un gruppo di Lie. E noto che S n `e un gruppo di Lie soltanto se
n = 1, 3.
Lalgebra dei quaternioni `e isomorfa a una sottoalgebra dallalgebra delle matrici M2 (C):


z w
X : H M2 (C),
h = z + wj 7 Xh =
,
w z
quindi X `e iniettiva e per h, h0 H si ha:
Xh+h0 = Xh + Xh0 ,

Xhh0 = Xh Xh0 ;

in pi`
u |h|2 = det(Xh ),

come si verifica facilmente. I quaternioni i, j, k corrispondono alle matrici di Pauli:








i 0
0 1
0 i
Xi =
= 1 ,
Xj =
= 2 ,
Xk =
= 3 .
0 i
1 0
i 0
Tramite la mappa X si ottiene un isomorfismo di gruppi di Lie (si veda Esercizio 8.3.3):
X : Sp(1) SU (2) = {A GL(2, C) : t AA = I, det(A) = 1 },
dove SU (2) `e il gruppo unitario speciale in dimensione 2.
8.3.2 Esercizio. Sia x = x0 + x1 i + x2 j + x3 k un quaternione, definiamo ~x = (x1 , x2 , x3 ) R3 .
Verificare che

z0 = x0 y0 (~x, ~y ),
xy = z0 + z1 i + z2 j + z3 k,
con
~z = x0 ~y + y0~x + ~x ~y .
8.3.3 Esercizio. Sia


A=

Mostrare che A U (2) = {B

zz + uu
ww
+ vv

zw + uv

z w
u v


M2 (C).

GL(2, C) : t BB = I} se e solo se
= 1,
= 1,
= 0,

se e solo se

u = w,

v = z.

8.3.4 SO(3, R) e la rappresentazione Aggiunta per SU (2). Sia G = SU (2), usando


per esempio il diffeomorfismo SU (2)
= S 3 (si veda 8.3.1) si ottiene:
su(2) := TI SU (2)

+ X = 0, tr(X) = 0 }
= {X M2 (C) : t X

ix1
x2 + ix3
: (x1 , x2 , x3 ) R3
=
M=

x2 + ix3
ix1

= R3 .

8 GRUPPI ORTOGONALI

145

La rappresentazione Aggiunta di SU (2) `e allora un omomorfismo di gruppi di Lie:


Ad : SU (2) GL(3, R)
= GL(su(2)),

Ad(A)(M ) = AM A1 .

Poiche det(A) = 1,
det(M ) = x21 + x22 + x23 ,

det(AM A1 ) = det(A) det(M ) det(A)1 = det(M ),

lapplicazione Q : M 7 det(M ) `e una forma quadratrica su V e Ad(A) O(Q)


= O(3, R) per
3

ogni A SL(2, C). Poiche SU (2) = S `e connesso e Ad(1) = I allora Ad(SU (2)) SO(3, R).
Si pu`o verificare che
Ad(SU (2)) = SO(3, R),

ker(Ad) = {1}.

8.3.5 Il gruppo ortogonale SO(4, R). Consideriamo lo spazio vettoriale reale quattro
dimensionale H, equivalentemente, lo spazio delle matrici 2 2 seguenti (si veda 8.3.1): :




x
+
ix
x
+
ix
0
1
2
3
4
H
: (x0 , x1 , x2 , x3 ) R .
= M =
x2 + ix3 x0 ix1
Per A, B SU (2) H definiamo unapplicazione lineare
r(A, B) : H H,

r(A, B)(M ) = AM B 1 ,

(A, B, M sono quaternioni, quindi anche AM B 1 `e un quaternione!). Poiche det(A) =


det(B) = 1,
det(M ) = x20 + x21 + x22 + x23 ,

det(AM B 1 ) = det(A) det(M ) det(B)1 = det(M ),

lapplicazione Q : M 7 det(M ) `e una forma quadratrica su V e r(A, B) O(Q)


= O(4, R) per
ogni A, B SU (2). Poiche SU (2) `e connessa otteniamo unapplicazione
r : SU (2) SU (2) SO(4, R),

A 7 r(A, B)

che `e un omomorfismo di gruppi di Lie e si pu`o verificare che r `e suriettivo con nucleo
(I, I), (I, I).

8.4

Il gruppo ortogonale SO(2m)

8.4.1 Lalgebra di Lie so(2m). Per determinare unalgebra di Cartan dellalgebra di Lie
so(2m) scegliamo una base di C2m tale che la forma quadratica sia data da


0 I
t
x1 xm+1 + . . . + xm x2m = xQx/2,
Q=
,
I 0

8 GRUPPI ORTOGONALI

146

dove la matrice simmetrica Q `e divisa in blocchi m m. Lalgebra di Lie so(2m) M2m (C) `e
data dalle matrici X M2m (C) tali che


A B
t
XQ + QX = 0,
sia X =
.
C D
Allora lequazione per X diventa:

 

  t
 t
0 I
0 I
A B
C
A tC
+
= t
t
t
D
B D
I 0
I 0
C D

A
t
B


+

C D
A B


=

0 0
0 0


,

quindi otteniamo le equazioni seguenti per le matrici m m in X:


t

A = D,

B = B,

C = C.

Verifichiamo che la dimensione di so(2m) `e (2m)(2m 1)/2 = 2m2 m. Poiche A Mm (C),


che ha dimensione m2 , e B, C Mm (C) sono antisimmetriche, si trova infatti dim so(2m) =
m2 + 2m(m 1)/2 = 2m2 m.
8.4.2 Le radici di so(2m). Si noti che la seguente sottoalgebra di matrici diagonali sta in
so(2m):
h = { H = diag(t1 , . . . , tm , t1 , . . . , tm ) : ti C },

sia Hi = Ei,i Ei+m,i+m h.

Consideriamo gli autospazi in so(2m), per la rappresentazione aggiunta, di questa sottoalgebra.


Una base di so(2m) `e data dalle Hi e le
Ei,j Ej+m,i+m ,

Ek,l+m El,k+m ,

Ek+m,l El+m,k ,

dove 1 i, j, k, l m, i 6= j e k < l. Le prime matrici hanno A = t D e B = C = 0, poi


ci sono quelle con A = C = 0 e B = t B e infine ci sono quelle con A = B = 0 e t C = C.
Poiche [diag(t1 , . . . , t2m ), Ea,b ] = (ta tb )Ea,b e ora ti+m = ti si ha:
[H, Ei,j Ej+m,i+m ] =
(ti tj )(Ei,j Ej+m,i+m ),
[H, Ek,l+m El,k+m ] =
(tk + tl )(Ek,l+m El,k+m ),
[H, Ek+m,l El+m,k ] = (tk + tl )(Ek+m,l El+m,k ).
Questo implica che se X so(2m), X 6 h allora [H, X] 6= 0 per un certo H h. Quindi h `e
una sottoalgebra commutativa massimale, e perci`o h `e unalgebra di Cartan di so(2m). In pi`
u
abbiamo trovato la decomposizione di so(2m) in spazi peso per la rappresentazione aggiunta.
Le radici di so(2m) sono:
Li L j ,

(Lk + Ll ),

1 i, j, k, l m, i 6= j, k < l.
P
P
Ogni applicazione l : hR = Rn = RLi R, l( ai Li ) = li ai con li > li+1 > 0 `e regolare (si
veda 6.3.1). Le radici positive sono gli Li Lj con i < j e gli Lk + Ll con k < l.

8 GRUPPI ORTOGONALI

147

Si pu`o verificare, similmente al caso di sl(n), si veda 6.1.15, che il gruppo di Weyl agisce
nel modo seguente. Se = Li Lj la riflessione s permuta Li e Lj e fissa gli altri radici. Se
= Lk + L l ,
Lk 7 Ll ,

s :

Ll 7 Lk ,

Li 7 Li

i 6= k, l).

( = Lk + Ll ,

Il prodotto scalare su hR definito dalla forma di Killing su h `e invariante per il gruppo di Weyl
e perci`o `e uguale, a meno di moltipicazione per uno scalare, al prodotto scalare standard dato
da (Li , Lj ) = ij . Si ha (, ) = 2 per ogni radice e perci`o < , >= 2(, )/(, ) = (, )
per ogni hR .
Le radici semplici sono
1 = L1 L2 ,

2 = L2 L3 , . . . , m1 = Lm1 Lm ,

Il loro diagramma di Dynkin `e il seguente:


n2
1
2
3 n3
c

m = Lm1 + Lm .

n1

Dn

n
8.4.3 Le rappresentazioni fondamentali di so(2m). I pesi fondamentali i , i = 1, . . . , m,
di so(2m), definiti da < i , j >= (i , j ) = ij (si veda 7.1.4). Poiche (, ) = 2 per ogni
R si ha < i , j >:= 2(i , j )/(j , j ) = (i , j ), quindi:
1 = L 1 ,

2 = L1 + L2 , . . . ,

L1 + L2 + . . . + Lm1 Lm
,
2
I pesi dominanti di so(2m) sono allora:
m1 =

m2 = L1 + L2 + . . . + Lm2 ,
m =

Pm
+
mi i : mi Z0 }
W = {
n i=1
= (m1 + . . . + mm2 + (mm12+mm ) L1 + . . . +

L1 + L2 + . . . + Lm1 + Lm
.
2

(mm1 +mm )
Lm1
2

(mm1 +mm )
Lm
2

P
Quindi un peso = m
e dominante se a1 a2 . . . am1 |am | (e poi mm =
i=1 ai Li `
am1 + am , mm1 = am1 am , mm2 = am2 am1 , . . ., m1 = a1 a2 ).
Nella rappresentazione standard di so(2m) su V := C2m , lalgebra di Cartan `e data dalle
H = diag(t1 , . . . , tm , t1 , . . . , tm ) e Li (H) = ti per i = 1, . . . , m. Quindi i pesi di V sono gli
Li e lunico peso dominante tra di loro `e L1 . Perci`o si ha:
V (1 ) = V,

V = C2m .

Si pu`o mostrare (si veda [FH], Thm 19.2) che


V (k ) = k V,

k = 1, 2, . . . , m 2.

8 GRUPPI ORTOGONALI

148

Un vettore con peso massimale in V (k ) = k V `e ovviamente e1 e2 . . . ek . Anche la


rappresentazione m1 V `e irriducibile, ma il suo peso massimale `e L1 +. . .+Lm1 = m1 +m ,
che non `e un peso fondomentale. La rappresentazione m V `e riducibile.
Poiche le rappresentazioni V (m1 ), V (m ) hanno pesi con coefficienti che non sono interi rispetto alla base L1 , . . . , Lm di hR , non `e possibile trovarli nei prodotti tensoriali delle
V (1 ), . . . , V (m2 ) (che poi sono tutti contenuti nei prodotti tensoriali di V = V (1 )), perche
ogni peso in una tale rappresentazione `e una combinazione con coeficienti interi di L1 , . . . , Lm .
I pesi di V (m1 ), la rappresentazione
irriducibile generata da un vettore massimale con
Pm
peso m1 , sono del tipo m1 i=1 ni i con ni 0 (si veda 7.2.6). Nessuno di questi pesi
`e dominante, tranne m1 stesso. Poiche ogni peso `e nellorbita di un peso dominante per il
gruppo di Weyl, ogni peso di V (m1 ) `e nellorbita di m1 . Perci`o ogni spazio peso di V (m1 )
`e isomorfo allo spazio del peso massimale, in particolare, `e unidimensionale. Il gruppo di Weyl
agisce per permutazioni delle Li e cambiamenti di un numero pari di segni, quindi i pesi di
V (m1 ) sono:
(1 L1 + 2 L2 + . . . + m Lm )/2,

i {+1, 1},

1 2 m = 1.

i {+1, 1},

1 2 m = +1.

In modo simile, i pesi di V (m ) sono:


(1 L1 + 2 L2 + . . . + m Lm )/2,

Ogni peso di V (m1 ) e di V (m ) ha moltiplicit`a uno e ogni rappresentazione ne ha 2m1 ,


quindi:
dim V (m1 ) = 2m1 ,
dim V (m ) = 2m1 .
Le rappresentazioni fondamentali V (m1 ) e V (m ) si chiamano rappresentazioni spinoriali
(Inglese: (half) spin representations). Costruiremo queste rappresentazioni di so(2m) in 9.3.5.
8.4.4 Il caso so(4). Nel caso m = 2, lalgebra di Lie so(4) `e data da:
so(4) = h H1 H2 , E1,2 E4,3 , E2,1 E3,4 i h H1 +H2 , E1,4 E2,3 , E3,2 E4,1 i
= sl(2) sl(2),
lisomorfismo manda i tre generatori di ogni coppia nei generatori standard di sl(2). La rappresentazione standard C4 di so(4) ha pesi = L1 , L2 , L1 , L2 . Si ha (H1 H2 ) = 1, 1, 1, 1
e (H1 + H2 ) = 1, 1, 1, 1, quindi C4 `e isomorfa a due copie della rappresentazione standard
due dimensionale di ognuna delle due copie di sl(2). Da qui segue che C4
= W1 W2 dove
W1 , W2 sone le rappresentazioni standard delle due copie di SL(2).
Le rappresentazioni due dimensionali di so(4) ottenute come la composizione
i
i : so(4)
= sl(2) sl(2) sl(2) , End(C2 )

sono rappresentazioni due dimensionali, irriducibili, di so(4). Poiche 1 (H1 H2 ) = diag(1, 1),
1 (H1 + H2 ) = 0, i pesi di 1 sono aL1 + bL2 con a b = 1 e a + b = 0, quindi (L1 L2 )/2.
Perci`o 1 `e una delle due rappresentazioni spinoriali di so(4). In modo simile si trova che i pesi
di 2 sono (L1 + L2 )/2 e quindi anche 2 `e una rappresentazione spinoriale.

8 GRUPPI ORTOGONALI

8.5

149

Il gruppo ortogonale SO(2m + 1)

8.5.1 Lalgebra di Lie so(2m + 1). Per determinare unalgebra di Cartan dellalgebra di
Lie so(2m + 1) scegliamo una base di C2m+1 tale che la forma quadratica sia dato da

I 0 0
x1 xm+1 + . . . + xm x2m + x22m+1 = t xQx,
Q = 0 I 0 ,
0 0 1
dove la matrice simmetrica Q `e divisa in quattro blocchi m m, due blocchi 1 m, due blocchi
m 1 e un blocco 1 1. Lalgebra di Lie so(2m + 1) M2m+1 (C) `e data dalle le matrici
X M2m+1 (C) tali che

t
A B a
A tC c
t
XQ + QX = 0,
sia X = C D b , quindi t X = t B t D d
t
t
a tb e
c td e
con A, B, C, D Mm (C), a, b, c, d, Cm e e C. Allora le equazioni per X diventano:

t

C D b
0 0 0
C tA c
tD tB d + A B a = 0 0 0 ,
t
t
c td e
0 0 0
b ta e
quindi otteniamo le equazioni seguenti per i blocchi di X:
t

A = D,

B = B,

C = C,

d = a,

c = b,

e = 0.

Verifichiamo che la dimensione di so(2m+1) `e (2m+1)(2m)/2 = 2m2 +m. Poiche A Mm (C),


che ha dimensione m2 , e B, C Mm (C) sono antisimmetriche e a, b Cm , si trova infatti
dim so(2m) = m2 + 2m(m 1)/2 + 2m = 2m2 + m.
8.5.2 Le radici di so(2m + 1). Si noti che la seguente sottoalgebra di matrici diagonali sta
in so(2m + 1):
h = { H = diag(t1 , . . . , tm , t1 , . . . , tm , 0) : ti C },

sia Hi = Ei,i Ei+m,i+m h.

Consideriamo gli autospazi in so(2m + 1), per la rappresentazione aggiunta, di questa sottoalgebra. Una base di so(2m + 1) `e dato dalle Hi e le matrici indicate qui sotto. Poiche
[diag(t1 , . . . , t2m , t2m+1 ), Ea,b ] = (ta tb )Ea,b e adesso ti+m = ti , t2m+1 = 0 si ha:
[H, Ei,j Ej+m,i+m ]
[H, Ek,l+m El,k+m ]
[H, Ek,l+m El,k+m ]
[H, Ek+m,l El+m,k ]
[H, Ep,2m+1 E2m+1,p+m ]
[H, Ep+m,2m+1 E2m+1,p ]

=
(ti tj )(Ei,j Ej+m,i+m ),
=
(ti tj )(Ei,j Ej+m,i+m ),
=
(tk + tl )(Ek,l+m El,k+m ),
= (tk + tl )(Ek+m,l El+m,k ),
=
tp (Ep,2m+1 E2m+1,p+m ),
= tp (Ep+m,2m+1 E2m+1,p ),

1 i, j m, i 6= j,
1 i, j m, i 6= j,
1 k < l m,
1 k < l m,
1 p m,
1 p m.

8 GRUPPI ORTOGONALI

150

Questo implica che se X so(2m + 1), X 6 h allora [H, X] 6= 0 per un certo H h. Quindi h
`e una sottoalgebra commutativa massimale, e perci`o h `e unalgebra di Cartan di so(2m + 1).
In pi`
u abbiamo trovato la decomposizione di so(2m + 1) in spazi peso per la rappresentazione
aggiunta. Le radici di so(2m + 1) sono:
L i Lj ,

(Lk + Ll ),

1 i, j, k, l, p m, i 6= j, k < l.
P
P
Ogni applicazione l : hR = Rn = RLi R, l( ai Li ) =
li ai con li > li+1 > 0 `e regolare
(si veda 6.3.1). Le radici positive sono gli Li Lj con i < j, gli Lk + Ll con k 6= l e gli Lp ,
1 p m.
Si pu`o verificare, similmente al caso di sl(n), si veda 6.1.15, che il gruppo di Weyl agisce
nel modo seguente. Se = Li Lj la riflessione s permuta Li e Lj e fissa le altre radici. Se
= Lk + Ll ,
Lk 7 Ll ,

s :

, Lp

Ll 7 Lk ,

Li 7 Li

i 6= k, l)

( = Lk + Ll ,

e sLp manda Lp 7 Lp e fissa gli altri Lq .


Il prodotto scalare su hR definito dalla forma di Killing su h `e invariante sotto il gruppo di
Weyl e perci`o `e uguale, a meno di moltiplicazione per uno scalare, al prodotto scalare standard
dato da (Li , Lj ) = ij . Si noti che le radici di so(2m + 1) sono esattamente i vettori con
(, ) = 1, 2, quindi il sistema di radici `e Bn (si veda 6.3.5).
Le radici semplici sono
1 = L1 L2 ,

2 = L2 L3 , . . . , m1 = Lm Lm1 ,

Il loro diagramma di Dynkin `e il seguente:


1
2
3
e

n2 n1
e

e >

n
e

m = Lm .

Bn

8.5.3 Le rappresentazioni fondamentali di so(2m + 1). I pesi fondamentali i , i =


1, . . . , m, di so(2m), definiti da
< i , j >= 2(i , j )/(i , i ) = ij
(si veda 7.1.4) sono:
1 = L 1 ,

2 = L 1 + L 2 , . . . ,

m1 = L1 + L2 + . . . + Lm1 ,

L1 + L2 + . . . + Lm1 + Lm
.
2
I pesi dominanti di so(2m) sono allora:
m =

Pm
+
W = {
i=1 mi i : mi Z0 }

= (m1 + . . . + mm1 + m2m )L1 + . . . + (mm1 +

mm
)Lm1
2

mm
Lm
2

8 GRUPPI ORTOGONALI

151

P
Quindi un peso = m
e dominante se a1 a2 . . . am1 am 0 (e dunque
i=1 ai Li `
mm = 2am , mm1 = am1 2am , mm2 = am2 am1 , . . ., m1 = a1 a2 ).
Nella rappresentazione standard di so(2m + 1) su V := C2m+1 , lalgebra di Cartan `e data
dalle H = diag(t1 , . . . , tm , t1 , . . . , tm , 0) e Li (H) = ti per i = 1, . . . , m. Quindi i pesi di V
sono Li e 0. Si pu`o mostrare (si veda [FH], Thm 19.14) che
V (k ) = k V,

k = 1, 2, . . . , m 1.

Un vettore con peso massimale in Vk = k V `e ovviamente e1 e2 . . .ek . La rappresentazione


m V `e anche irriducibile, ma il suo peso massimale `e L1 + . . . + Lm = 2m , che non `e un peso
fondamentale.
Poiche la rappresentazione V (m ) ha pesi con coefficienti che non sono interi rispetto alla
base L1 , . . . , Lm di hR , non `e possibile trovarli nei prodotti tensoriali delle V (1 ), . . . , V (m1 )
(che poi sono tutti contenuti nei prodotti tensoriali di V = V (1 )).
I pesi di V (m ), la rappresentazione
irriducibile generata da un vettore massimale con peso
Pm
m , sono del tipo m i=1 ni i con ni 0. Nessuno di questi pesi `e dominante, tranne m
stesso. Poiche ogni peso `e nellorbita di un peso dominante per il gruppo di Weyl, ogni peso
di V (m ) deve essere nellorbita di m . In pi`
u, ogni spazio peso `e isomorfo allo spazio del peso
pi`
u alto, in particolare, `e unidimensionale. Il gruppo di Weyl agisce per permutazioni delle Li
e cambiamenti di segno, quindi i pesi di V (m ) sono i:
(1 L1 + 2 L2 + . . . + m Lm )/2,

i {+1, 1}.

Ogni peso di V (m ) ha moltiplicit`a uno e la rappresentazione ne ha 2m , quindi:


dim V (m ) = 2m .
La rappresentazione fondamentale V (m ) si chiama rappresentazione spinoriale (Inglese: spin
representation). Costruiremo questa rappresentazione di so(2m + 1) in 9.3.6.
8.5.4 Il caso so(3). Nel caso m = 1, lalgebra di Lie so(3) ha base H1 , E1,3 E3,2 , E2,3 E3,1
ed `e isomorfo con sl(2). La rappresentazione standard C3 di so(3) ha peso dominante L1 = 21 ,
e la rappresentazione con peso dominante 1 `e la rappresentazione standard C2 di sl(2). La
rappresentazione C3 `e S 2 (C2 ) di sl(2), che `e anche la rappresentazione aggiunta. Vedi 8.2.3 per
il legame tra i gruppi di Lie nel caso K = R (che si generalizza al caso K = C).

9 RAPPRESENTAZIONI DI SPIN

152

Rappresentazioni di Spin

Testi consigliati: [FH].

9.1

Lalgebra di Clifford

9.1.1 Definizione. Lalgebra di Clifford di una forma quadratica generalizza lalgebra dei
quaternioni e permette di definire le rappresentazioni spinoriali dei gruppi ortogonali.
Sia V uno spazio vettoriale su un campo K, con K = R oppure K = C e sia Q : V K
una forma quadratica definita da una forma bilineare B, Q(v) = B(v, v) e poi (si veda 8.1.4):
Q(v + w) Q(v) Q(w) = 2B(v, w)

(v, w V ).

Lalgebra di Clifford di (V, Q), indicata con C(Q), `e una K-algebra che contiene K e V , in pi`
u,
il prodotto di un v V C(Q) con se stesso `e tale che v 2 = Q(v)(!).
Per costruire C(Q) consideriamo lideale bilaterale IQ dellalgebra tensoriale T (V ) = k V k
(si veda 1.3.3) generato dagli elementi
v v Q(v)

T (V )

(v V ).

Quindi un elemento di IQ `e una combinazione lineare di elementi del tipo x (v v Q(v)) y


con x, y T (V ) e v V . Nel caso Q = 0, si ottiene lideale I di 1.3.3 e T (V )/I `e lalgebra
esterna. In generale, lalgebra che si ottiene `e per definizione lalgebra di Clifford (di Q):

C(Q) := T (V )/IQ = V k /IQ .
Ci sono testi in cui si usa Q per definire C(Q), cio`e si usa lideale generato dalle x x + Q(x)
invece di IQ . I gruppi ortogonali di Q e Q sono ovviamente uguali e si pu`o mostrare che
il gruppo Spin e le rappresentazioni spinoriali di so(Q) non cambiano. Usiamo le seguente
notazioni (si veda 8.1.4):
C(p, q) := C(Ip,q ),

se K = R;

C(n) = C(In ) se K = C.

Ci sono le applicazioni lineari V k , T (V ) C(Q) dove `e la mappa canonica che manda


x 7 x + IQ . Queste applicazioni sono iniettive se k = 0, 1 (si veda 9.1.4). Per K = V 0 o
v V = V 1 scriviamo semplicemente e v per limmagine di e v in C(Q). Allora si ha:
v 2 = Q(v),

vw + wv = 2B(v, w)

(v, w V C(Q)),

la prima relazione segue dal fatto che v v Q(v) IQ quindi v 2 Q(v) = 0 in C(Q), la
seconda segue da Q(v + w) Q(v) Q(w) = 2B(v, w) e:
Q(v + w) = (v + w)2 = v 2 + w2 + vw + vw = Q(v) + Q(w) + vw + wv.
Sia ei , 1 i n = dim V , una K-base di V . Usando queste regole, limmagine di un tensore
ei1 . . . eik V k si scrive come combinazione lineare di prodotti ej1 . . . ejl con l n e indici

9 RAPPRESENTAZIONI DI SPIN

153

distinti (eja = ejb solo se a = b). In particolare, dim C(Q) 2n . Si pu`o dimostrare (si veda
9.1.4, [FH], Lemma 20.3) che C(Q) ha una base data dalle eI ,
C(Q) = I KeI ;

eI = ei1 ei2 . . . eik

se I = {i1 , . . . , ik },

1 i1 < i2 < . . . < ik n,

dove I percorre tutti gli insiemi ordinati con al pi`


u n elementi, e e = 1. In particolare,
dim C(Q) = 2n .
9.1.2 Esempi. Sia V = R2 con base e1 , e2 . Sia Q = I2 , quindi Q(v1 e1 + v2 e2 ) = v12 + v22 .
Allora in C(Q) = C(2, 0) si ha
e21 = e22 = 1,

e1 e2 + e2 e1 = 0 quindi e1 e2 = e2 e1 .

In pi`
u il quadrato di e1 e2 `e:
(e1 e2 )2 = e1 e2 e1 e2 = e1 (e1 e2 )e2 = 1 1 = 1.
Un semplice calcolo mostra che lapplicazione

F : C(2, 0) M2 (R),

a + be1 + ce2 + de1 e2 7

a+b cd
c+d ab

`e un isomorfismo di algebre (cio`e F `e R-lineare, F (x + y) = F (x) + F (y) e F (xy) = F (x)F (y)).


Sia V come sopra e sia Q = I2 , allora in C(Q) = C(0, 2) si ha:
e21 = e22 = 1,

e1 e2 = e2 e1 ,

(e1 e2 )2 = e1 (e1 e2 )e2 = 1.

Un semplice calcolo mostra che lapplicazione


G : C(0, 2) H,

a + be1 + ce2 + de1 e2 7 a + bi + cj + dk

`e un isomorfismo di algebre, dove H `e lalgebra di quaternioni (si veda 8.3.1).


Sia V come sopra e sia Q = I1,1 , allora in C(Q) = C(1, 1) si ha:
e21 = 1,

e22 = 1,

e1 e2 = e2 e1 ,

(e1 e2 )2 = e1 (e1 e2 )e2 = 1.

Un semplice calcolo mostra che lapplicazione



H : C(1, 1) M2 (R),

a + be1 + ce2 + de1 e2 7

a+b c+d
c + d a b

`e un isomorfismo di algebre.
Nel caso K = C e Q = I2 si ha C(Q) = C(2)
= M2 (C).
9.1.3 Le propriet`
a universale dellalgebra di Clifford. Lalgebra di Clifford C(Q) gode
delle seguente propriet`a, che `e molto conveniente per definire automorfismi di C(Q).

9 RAPPRESENTAZIONI DI SPIN

154

Sia E una K-algebra (associativa) con elemento unit`a 1 E e sia data unapplicazione
lineare
j : V E,
tale che j(v)2 = Q(v)
per ogni v V , allora esiste un unico omomorfismo di K-algebre J che estende j:
J : C(Q) E,

(v V C(Q)).

tale che J(v) = j(v)

Per definire J, si definisce prima, per ogni k, unapplicazione multilineare V . . . V E per


(v1 , v2 , . . . , vk ) 7 j(v1 )j(v2 ) . . . j(vk ). Queste applicazioni definiscono delle mappe lineari Jk :
V k E (si veda 1.1.8) che sono componenti di un omomorfismo di K-algebre J : T (V ) E,
cio`e J = Jk su V k . Se t IQ , t `e combinazione lineare di x (v v Q(v)) y e
J(x (v v Q(v)) y) = J(x)J(v v Q(v))J(y) = J(x)(J(v)J(v) Q(v))J(y) = 0
perche J(v) = j(v) e j(v)2 = Q(v). Quindi J definisce unomomorfismo di K-algebre C(Q) =
T (V )/IQ E. Lunicit`a segue dal fatto che le propriet`a J(v) = j(v) e J(x y) = J(x)J(y)
determinano limmagine di ogni tensore in T (V ) mediante J.
9.1.4 La dimensione di C(Q). Si ricordi che C(Qp,q ) , M2 (C) se p + q = 2, per esempio
C0,2
= H , M2 (C), si veda 8.3.1. Dato un omomorfismo iniettivo : C(Qp,q ) , MN (C), sia
Mi MN (C) limmagine di ei Rn . In particolare, si ha
(x1 M1 + . . . + xn Mn )2 = (x21 + . . . + x2p ) (x2p+1 + . . . + x2n )IN = Qp,q (x)IN ,
equivalentamente, gli Mi soddisfano:
Mi Mj + Mj Mi = 0,

Mi2


= i IN ,

i =

1 se 1 i p,
1 se p + 1 i n,

Sia Q = Qp+1,q oppure Qp,q+1 , quindi Q(en+1 ) = 1 oppure 1. Definiamo unapplicazione


lineare




0 Mi
0
n+1
0
0
R
M2N (C),
ei 7 Mi :=
, en+1 7 Mn+1 =
,
Mi 0
0
dove = i se Q(en+1 ) = +1 e = 1 se Q(en+1 ) = 1. Allora si verifica facilmente che gli Mi0
soddisfano le stesse relazioni degli Mi e in pi`
u
0
(Mn+1
)2 = Q(en+1 ),

0
0
Mi0 Mn+1
+ Mn+1
Mi0 = 0,

quindi si ha:
n+1
X

!2
xi Mi0

n+1
X
= Q(
xi ei ).

i=1

i=1

Perci`o la propriet`a universale di C(Q) d`a un omomorfismo di R-algebre


: C(Q) M2N (C),

ei 7 Mi0 .

9 RAPPRESENTAZIONI DI SPIN

155

Poiche : C(Qp,q ) , MN (C) `e definito da ei 7 Mi , 1 i n, anche `e iniettivo su C(Qp,q ),


: Cp,q , M2N (C). Ogni elemento di C(Q) si scrive come x+yen+1 con x, y C(Qp,q ) C(Q)

e adesso `e facile vedere che `e iniettivo. Si noti che se dim C(Qp,q ) = K, allora dim (C(Q))
=
n
2K. Per induzione su n = p + q si conclude che dim C(Q) = 2 se n = dim V e che gli eI sono
una base di C(Q).

9.2

Lalgebra di Clifford e il gruppo spinoriale.

9.2.1 Lalgebra di Clifford e il gruppo ortogonale. Linclusione V , E = C(Q) `e


K-lineare e soddisfa v 2 = Q(v) per costruzione. Per ogni A O(Q), il gruppo ortogonale di Q,
anche lapplicazione lineare
jA : V E = C(Q),

v 7 Av

(A O(Q), v V )

soddisfa jA (v)2 = (Av)2 = Q(Av) = Q(v). In particolare, esiste unomomorfismo di K-algebre


JA : C(Q) C(Q)

tale che JA (v) = Av

(A O(Q), v V C(Q)).

Consideriamo il caso di un prodotto AB O(Q) con A, B O(Q). Allora JAB v = ABv e


JAB `e lunico omomorfismo con questa propriet`a. Poiche anche JA JB `e un omomorfismo con
JA (JB (v)) = JA (Bv) = ABv si ha
JAB = JA JB ,

in particolare: JIV = IC(Q) ,

con IV lidentit`a su V e JIV = IC(Q) lidentit`a su C(Q). Perci`o lapplicazione


J : O(Q) Aut(C(Q)),

A 7 JA

`e un omomorfismo di gruppi, iniettivo perche JA v = Av per v V C(Q).


9.2.2 Lalgebra di Clifford pari e lautomorfismo . Un caso particolare di A O(Q)
`e A = IV = I. Si indica
:= JI : C(Q) C(Q),

2 = IC(Q)

perche (IV )2 = IV . La decomposizione di C(Q) in autospazi `e indicata con


C(Q) = C(Q)+ C(Q) ,

C(Q) = {x C(Q) : (x) = x }.

Dato che `e K-lineare e (xy) = (x)(y) `e facile verificare che C(Q)+ `e una sottoalgebra di
C(Q).
Per un elemento di base eI di C(Q), si veda 9.1.1 con ]I = k, si ha (eI ) = (1)k eI , quindi
C(Q)+ = I KeI ,

]I {0, 2, . . .},

quindi

dim C(Q)+ = 2n1 .

9 RAPPRESENTAZIONI DI SPIN

156

Per C , le algebre C(Q) e C(Q) sono isomorfe, perche = 2 per un C e


lapplicazione lineare
j : V C(Q),
v 7 1 v
soddisfa j (v)2 = (1 v)2 = 2 v 2 = 2 Q(v) = Q(v) in C(Q), quindi j si estende a
un omomorfismo di C-algebre J : C(Q) C(Q). Per simmetria, si ha un omomorfismo
J1 : C(Q) C(Q) e J1 `e linverso di J (perche J1 (J (v)) = v per ogni v V e quindi
sia J1 J , sia 1C(Q) , `e lunica estensione di 1V . Negli esempi 9.1.2 si vede che C(Q)
6= C(Q)
nel caso K = R.
Invece per ogni R si ha C(Q)+
= C(Q)+ perche se ei `e una R-base di V (e quindi
`e una C-base della complessificazione VC ) lomomorfismo J : C(Q)C C(Q)C manda eI =
ei1 . . . ei2k C(Q)+ C(Q)C in 2k eI = k eI C(Q)+ C(Q)C . Quindi J induce un
isomorfismo tra le sottoalgebre reali C(Q)+ C(Q)C e C ( Q)+ C(Q)C :

J : C(Q)C C(Q)C

induce C(Q)+ C(Q)+ .

9.2.3 Esempi di algebre di Clifford pari. Nel caso V abbia base e1 , e2 , come negli esempi
9.1.2, lalgebra di Clifford pari `e
C + (Q) = K Ke1 e2 .
Nel caso K = R, nelle algebre C(2, 0) e C(0, 2) si ha (e1 e2 )2 = 1. In tali casi C + (Q)
=C
2
tramite a+be1 e2 7 a+bi. Nellalgebra C(1, 1) si ha (e1 e2 ) = 1 che implica (1+e1 e2 )(1e1 e2 ) =
0, (1 e1 e2 )2 = 2(1 e1 e2 ). Sia
:= (1 e1 e2 )/2,

allora 1 = + + ,

+ = 0 = + ,

= ,

come si verifica facilmente. In particolare, per x C + (1, 1) si ha x = x1 = (x+ ) + (x ) =


x+ + x e il prodotto `e dato da (x+ + x )(y+ + y ) = (x+ y+ ) + (x y ). Poiche (a + be1 e2 ) =
(a b) , si ottiene un isomorfismo di algebre:

C(1, 1)+ R R,

x = a + be1 e2 7 (a + b, a b),

con + 7 (1, 0), 7 (0, 1).


Lalgebra C + (0, 3)+ ha dimensione 4 e base 1, e1 e2 , e1 e3 , e1 e3 . Poiche e2i = 1, i = 1, 2, 3, e
ei ej = ei ej in C(0, 3), si ha, se i, j, k sono distinti:
(ei ej )2 = ei ej ei ej = e2i e2j = 1,

(ei ej )(ei ek ) = e2i ej ek = ej ek = (ei ek )(ei ej ).

Segue che lalgebra C(0, 3)+ `e isomorfa allalgebra dei quaternioni:

C(0, 3)+ H,

a + be1 e2 + ce1 e3 + de2 e3 7 a + bi + cj + dk.

Nellalgebra C(0, 3) si ha:


ei = ei ,

dove := e1 e2 e3 C(0, 3)

9 RAPPRESENTAZIONI DI SPIN

157

e, in pi`
u,
2 = (e1 e2 e3 )(e1 e2 e3 ) = e21 e2 e3 e2 e3 = (1)e22 e33 = +1.
quindi, come prima, gli elementi := (1 )/2 sono idempotenti centrali (cio`e commutano
con ogni x C(0, 3)), e perci`o C(0, 3)
= (+ C(0, 3)) ( C(0, 3)). E facile vedere che
C(0, 3)+ C(0, 3),

x 7 x

`e unomomorfismo di algebre iniettivo. Quindi dim C(0, 3) 4, poiche dim C(0, 3) = 8 si ha


allora dim C(0, 3) = 4 e C(0, 3)
= H. Perci`o:

C(0, 3) H H.
9.2.4 Riflessioni e lalgebra di Clifford. In 9.2.1 abbiamo costruito un omomorfismo
iniettivo O(Q) Aut(C(Q)), A 7 JA . Ora studiamo questazione di O(Q) su C(Q), prima
per le riflessioni in O(Q).
Sia v V tale che Q(v) 6= 0. Poiche v 2 = Q(v) si ha v 1 = Q(v)1 v in C(Q). Consideriamo
lapplicazione
(v) : C(Q) C(Q),
x 7 vxv 1 .
Si consideri il caso in cui x V , e si ricordi che vx = xv + 2B(x, v) e Q(x) = B(x, x):
(v)(x) =

vxv
xv 2 2B(x, v)v
xQ(v) 2B(x, v)v
B(x, v)
=
=
=x2
v
Q(v)
Q(v)
Q(v)
B(v, v)

che mostra che, se K = R e B `e un prodotto scalare, (x) coincide su V C(Q) con la


riflessione Rv rispetto alliperpiano v (si veda 6.1.13). In generale, si verifica che (v) O(Q)
e questapplicazione `e detta riflessione.
Si noti che (v) non `e un automorfismo di C(Q), per esempio (v)(1) = v1v 1 = 1
mentre un K-algebra automorfismo manda 1 in 1. Gli automorfismi JA , per A O(Q) si
possono ottenere nel modo seguente. Prima si osservi che per w V si ha (w) = w e quindi
(v)(w) = vwv 1 = v(w)v 1 = v(w)v 1

(v, w V, B(v) 6= 0).

Per v V con Q(v) 6= 0 il sollevamento della riflessione Rv O(Q) `e dato da:


JRv : C(Q) C(Q)

x 7 v(x)v 1 .

Si verifica facilmente che JRv `e un automorfismo, per esempio v(xy)v 1 = v(x)(y)v 1 =


(v(x)v 1 )(v(y)v 1 ). In pi`
u, JRv coincide con Rv su V C(Q) e, per lunicit`a di un tale
automorfismo, si ha quindi JRv (x) = v(x)v 1 .
Nel caso B sia nondegenere, un teorema di Cartan e Dieudonne afferma che ogni A O(Q) `e
un prodotto di riflessioni Rv . Quindi JA `e un prodotto di tali JRv . In particolare, sia A SO(n),

9 RAPPRESENTAZIONI DI SPIN

158

allora A = Rv1 . . . Rv2k per certe vi V . Poiche 2 = IC(Q) , (xy) = (x)(y) e (v) = v per
v V , si ha, per ogni x C(Q):
JA (x) = JRv1 . . . JRv2k (x) =
=
=
=
=

1
JRv1 . . . JRv2k1 (v2k (x)v2k
)
1 1
JRv1 . . . JRv2k2 (v2k1 (v2k (x)v2k
)v2k1 )
1 1
JRv1 . . . JRv2k2 (v2k1 v2k xv2k v2k1 )
...
v1 . . . v2k x(v1 . . . v2k )1 .

Quindi per A SO(Q), lautomorfismo JA di C(Q) `e dato dalla coniugazione con v1 . . . v2k
C(Q)+ .
9.2.5 Il gruppo moltiplicativo di C(Q). Si potrebbe tentare di definire un omomorfismo
di gruppi O(Q) C(Q) , il gruppo moltiplicativo dato dagli elementi invertibili in C(Q), in
modo tale che Rv 7 v, allora si avrebbe
?

A 7 x = v1 . . . v2k ,

se JA (w) = xwx1 .

La formula per Rv mostra per`o che Rv = Rv per ogni non nullo K. Quindi non c`e una
scelta canonica per limmagine di Rv in C(Q) .
Visto che per definire Rv si dovrebbe avere Q(v) 6= 0, e Q(v) = 2 Q(v), `e ragionevole
scegliere K tale che 2 Q(v) = 1 (oppure 2 Q(v) = 1 se K = R e Q(v) < 0). Quindi ci
sono due scelte naturali per .
Come gi`a visto, un tale omomorfismo non esiste sempre, si veda 8.3.4. In quel caso Q = I3,0
e C(Q)+
= H (si veda 9.2.3) e c`e un sottogruppo SU (2) H con un omomorfismo
= C(Q)+
suriettivo SU (2) SO(3, R) con nucleo {I}. Questo si pu`o generalizare, si veda Proposizione
9.2.8: esiste un sottogruppo Spin(Q) di (C(Q)+ ) che `e un rivestimento doppio di SO(Q).
9.2.6 Le antiinvoluzioni e di C(Q). Lalgebra T (V ) = k V k ha unantiinvoluzione
data da
: v1 v2 . . . vk 7 vk vk1 . . . v1 ,

(x y) = (y) (x).

Poch`e (v v Q(v)) = v v Q(v), preserva lideale (IQ ) = IQ , segue che induce


unantiinvoluzione, ancora indicata con :
: C(Q) C(Q),

(v1 v2 . . . vk ) = vk . . . v2 v1 ,

(xy) = (y) (x).

Si noti che se Q(vi ) = 1, allora vi2 = 1 e v1 v2 . . . vk (v1 v2 . . . vk ) = v1 v2 . . . vk vk . . . v2 v1 = 1.


La composizione di e `e lantiinvoluzione chiamata la coniugazione su C(Q) e si scrive:
: C(Q) C(Q),

x 7 x ,

(v1 v2 . . . vk ) = (1)k vk . . . v2 v1 .

9.2.7 Il gruppo Spin(Q). Ora si pu`o dare una definizone del gruppo Spin che non sfrutta
in modo esplicito le reflessioni:

1 se K = R,
+

1
Spin(Q) := { x C(Q) : xx = , xV x V },
=
1 se K = C.

9 RAPPRESENTAZIONI DI SPIN

159

Il gruppo Spin(Q) `e un sottogruppo di (C(Q)+ ) (x1 = x per x Spin(Q)) e si pu`o mostrare


che `e un gruppo di Lie. Nel caso K = R, Spin(Q) non `e connessa se ci sono x Spin(Q)
con xx = 1. Questo occorre soltanto se esiste una base di V tale che Q `e dato da Ip,q con
p, q 1.
Per la definizione di Spin(Q), si ha un omomorfismo
: Spin(Q) GL(V ),

(x)(w) := xwx1

(w V )

9.2.8 Proposizione. Sia B una forma bilineare nondegenere su uno spazio vettoriale V sul
campo K = R o C e sia Q(x) := B(x, x). Allora (Spin(Q)) = SO(Q) e ker() = {1}.
Dimostrazione. Per la dimostrazione abbiamo bisogno delle riflessioni. Quindi definiamo
P in(Q) := { x C(Q) : xx = 1,

(x)V x1 V },

si noti che Spin(Q) P in(Q). Si definisce unestensione dellomomorfismo come


: P in(Q) GL(V ),

(x)(w) = (x)wx1 .

Per x Spin(Q) C + si ha (x) = x e quindi (x)(w) = xwx1 come prima in 9.2.7.


Mostriamo che (P in(Q)) = O(Q). Si ha , perche se x P in(Q) e w V si ha
(x)(w) V quindi ((x)(w)) = (x)(w):
Q((x)w) =
=
=
=
=
=
=
=
=

((x)w)2
(x)(w)((x)(w))
((x)wx1 )((x)wx1 )
(x)wx1 (x1 ) w (x)
(x)ww (x)
(x)w2 (x)
Q(w)(x)(x)
Q(w)(xx )
Q(w).

(xx1 = 1 (x1 ) x = 1 (x1 ) = (x )1 )


(w = w)
(w2 = Q(w))
(xx = 1 (xx ) = 1)

Linclusione segue dal fatto che se v V e Q(v) 6= 0 esiste K tale che Q(v) = 1.
Sia x = v, allora Rv = Rx e x = x. Perci`o xx = x2 = 1 e xwx1 = Rx (w) V
se w W , quindi x P in(Q). Ora si ha (x) = Rx come visto in 9.2.4. Perci`o (P in(Q))
contiene tutte le riflessioni e dal teorema di Cartan e Dieudonne segue che (P in(Q)) O(Q).
Adesso mostriamo che (Spin(Q)) = SO(Q). Come visto in 9.2.4, dato A SO(n), ci sono
vi V tali che A = Rv1 . . . Rv2k e inoltre si ha JA (w) = xwx1 dove x = v1 . . . v2k C(Q)+ .
Normalizzando i vi in modo tale che Q(vi ) = 1 se K = R e Q(vi ) = 1 se K = C si vede che
xx = (v1 . . . v2k ) (1)2k (v2k . . . v1 ) = (v1 . . . v2k1 )Q(v2k )(v2k1 . . . v1 ) = . . . = Q(v1 ) . . . Q(v2k ),
che `e 1 se K = C e 1 se K = R, quindi x Spin(Q) e (x) = A come desiderato.

9 RAPPRESENTAZIONI DI SPIN

160

Determiniamo il nucleo di : P in(Q) O(Q). Sia x ker(), cio`e, (x)v = vx per ogni
v V . Scriviamo x = x+ + x con x C(Q) , allora segue che
x = x+ + x ker() =

x+ v = vx+ ,

x v = vx .

Sia ei una base ortogonale per V , quindi ei ej = ej ei se i 6= j e e2i K {0}. Adesso

+
+

scriviamo x+ = x+
1 + e1 y1 dove x1 C(Q) , y1 C(Q) sono combinazioni lineari degli eI

k
con 1 6 I, cio`e e1 non compare in x+
1 e y1 . In particolare eI e1 = (1) e1 eI dove k = ]I. Allora
+
+
se scegliamo v = e1 , lequazione x v = vx d`a
2
+

e1 x+
1 + e1 y1 = x1 e1 + e1 y1 e1

2
+
2
cio`e e1 x+
1 + e1 y1 = e1 x1 e1 y1 ,

perci`o y1 = 0, quindi e1 non compare in x+ . Procedendo in questo modo si ottiene che x+ non
+

+
+
contiene nessun ei quindi x+ K. Poi scriviamo x = x
1 +e1 y1 dove x1 C(Q) , y1 C(Q)

+
e e1 non compare in x1 e y1 . Con v = e1 otteniamo
2 +

+
(e1 x
1 + e1 y1 ) = x1 e1 + e1 y1 e1

cio`e

2 +

2 +
e1 x
1 e1 y1 = e1 x1 + e1 y1

quindi y1+ = 0 e perci`o x non contiene e1 , quindi nessun ei , perci`o x = 0, perche x C(Q) .
La conclusione `e che x = x+ K.
Adesso consideriamo ker( : Spin(Q) SO(Q)), quindi imponiamo la condizione xx = 1
se K = C e xx =  se K = R. Poiche x = x per x K e x2 = 1 implica x = 1, segue che
ker() = {1}.
2

9.3

Le rappresentazioni spinoriali di so(n).

9.3.1 Linclusione so(Q) , C(Q)+ . Lomomorfismo di gruppi di Lie : Spin(Q)


SO(Q) induce un isomorfismo di algebre di Lie
(d)1 : T1 Spin(Q) = Lie(Spin(Q)) TI SO(Q) = so(Q).
Poiche Spin(Q) (C(Q)+ ) , il gruppo dei elementi invertibili in C(Q)+ , e C(Q)+ `e uno spazio
vettoriale, si ha Lie(Spin(Q)) C(Q)+ .
In pi`
u, `e facile verificare (come gi`a fatto nel caso analogo di GL(n, R) = Mn (R) Mn (R),
si veda 5.1.9) che le parentesi di Lie su Lie(Spin(Q)) sono date da [X, Y ] = XY Y X dove
XY `e il prodotto di X, Y Lie(Spin(Q)) C(Q)+ in C(Q)+ :
so(Q)
= T1 Spin(Q) , C(Q)+ ,

[X, Y ] = XY Y X

(X, Y so(Q) C(Q)+ ).

Si noti che ora abbiamo trovato una rappresentazione dellalgebra di Lie so(Q) sullo spazio
vettoriale C(Q)+ :
so(Q) End(C(Q)+ ),
X 7 [x 7 Xx].
Cio`e, X so(Q) C(Q)+ agisce per moltipicazione e poiche [X, Y ]x = (XY Y X)x =
X(Y x) Y (Xx) si ha proprio una rappresentazione.

9 RAPPRESENTAZIONI DI SPIN

161

Questa rappresentazione non `e irriducibile in generale, perche dato un qualunque z C(Q)+


si ha (Xx)z = X(xz) e quindi lapplicazione lineare C(Q)+ C(Q)+ , x 7 xz, commuta con
la rappresentazione di so(n).
Nel caso K = C la decomposizione della rappresentazione di so(Q) = so(n) in rappresentazioni irriducibili `e data in 9.3.5 e 9.3.6. Per questo si usa lalgebra di Cartan di so(n), vista
come sottospazio di C(Q)+ .
In generale, si pu`o mostrare che Lie(Spin(Q)) = so(Q) C(Q)+ `e generata dagli elementi
vw B(v, w) C(Q)+ , dove v, w variano in V (si veda [FH] 20.1). Si pu`o anche verificare
direttamente che:
Lie(Spin(Q)) := {x C(Q)+ : x + x = 0,

xv + vx V

v V }.

E facile verificare che vw B(v, w) Lie(Spin(Q)). Poiche dim Spin(Q) = dim SO(Q), segue
che dim Lie(Spin(Q)) = n(n 1)/2 dove n = dim V e che gli ei ej B(ei , ej ), dove ei `e una
base di V e i < j, sono una base di Lie(Spin(Q)).
In 9.3.3 determiniamo in modo esplicito la base Hi dellalgebra di Cartan h di so(n), vista
come sottospazio di C(Q)+ .
9.3.2 Lalgebra di Clifford di Q. Dora in avanti consideriamo sempre la forma quadratica
Q su Cn data da
Q(x) = x1 xm + . . . + xm x2m

oppure Q(x) = x1 xm + . . . + xm x2m + x22m+1

se n = 2m `e pari oppure n = 2m + 1 `e dispari. La forma bilineare B tale che Q(x) = B(x, x)


(e quindi 2B(x, y) = Q(x + y) Q(x) Q(y) `e data da:
B(x, y) = 21 (x1 y2 + x2 y1 + . . . + xm y2m + x2m ym )
oppure da
B(x, y) = 12 (x1 y2 + x2 y1 + . . . + xm y2m + x2m ym ) + x2m+1 y2m+1 .
In C(Q) si ha quindi:
e2i = 0,

1 i 2m,

ej ej+m + ej ej+m = 1,

ea eb + eb ea = 0,

(|a b| =
6 m)

dove 1 i, a, b 2m e 1 j m. In pi`
u e2m+1 anticommuta con questi ei e e22m+1 = 1.
9.3.3 Lalgebra di Cartan. Lalgebra di Cartan di so(n) = so(Q) `e generata dalle Hi ,
1 i m dove n = 2m o n = 2m + 1, con
Hi ej = 0,

se j 6= i, i + m,

Hi ei = ei ,

Hi ei+m = ei+m .

Quindi Hi = := (d/dt)(t)|t=0 dove (t) SO(n) `e dato da


: C SO(n),

(t)ei = tei ,

(t)ei+m = t1 ei+m

(t)ei = 1 se j 6= i, i + m.

9 RAPPRESENTAZIONI DI SPIN

162

Si noti che sullo spazio due dimensionale W con base ei , ei+m si ha


Q(x1 ei + x2 ei+m ) = x1 x2 ,

B(x1 ei + x2 ei+m , y1 ei + y2 ei+m ) = 12 (x1 y2 + x2 y1 ),

e (t) induce lapplicazione lineare seguente su W , dove scegliamo un s C con s2 = t:



 
 1 



 2
1
s
0 1
0 s2
s
0
2
,
= Rv Rw , v =
, w=
=
(s ) =
s
s2
0
1
1 0
0 s2
dove t = s2 e si ha Q(v) = Q(w) = 1, come si verifica facilmente. Su W sia (t) sia Rv Rw
sono lidentit`a, quindi si ha x(t) = Rv Rw su V = Cn . Poiche x = x per x V si ha
(vw) = (w)(v) = wv e (vw)(vw) = vwwv = vQ(w)v = Q(w)Q(v) = 1, quindi
vw = (ei + ei+m )(s1 ei + sei+m ) = s1 ei ei+m + sei+m si = s1 + (s s1 )ei ei+m Spin(Q),
qui abbiamo usato e2i = e2i+m = 0 e ei ei+m + ei+m ei = 2B(ei , ei+m ) = 1.
Definiamo un cammino
: C Spin(n),

(s) = s1 + (s s1 )ei ei+m .

Allora si ha:
2

(
(s)) = Rv Rw = (s ),

% Spin(n)

& SO(n),

quindi `e un sollevamento del cammino a Spin(n). Si noti che `e 2:1 su (C ) ma che C


`e connesso, quindi anche Spin(n) `e connesso.
Linclusione so(n) C(Q)+ `e definita tramite linverso dellomomorfismo (d)1 :
T1 Spin(n) so(n). In particolare, X T1 Spin(n) corrisponde con Hi so(n) se e solo
se (d)1 (X) = Hi .
Un cammino definisce un vettore tangente (si veda 4.3.3) e si ha (si veda 4.3.5)
(d)1 (
) = ( ) = .
In particolare,
= (d/ds)
(s)|s=1 = 1 + 2ei ei+m

( so(n) C(Q)+ )

e la sua immagine mediante (d)1 in so(n) `e:


(d)1 (
) = (d/ds)(s2 )|s=1 = 2(d/dt)(t)|t=1 = 2Hi
quindi si ha
Hi = 21 = 12 + ei ei+m

( so(n) C(Q)+ ).

9.3.4 Vettori peso in C(Q). Adesso determiniamo alcuni vettori peso in CQ) per h
C(Q)+ . Per i m si ha in C(Q) (si veda 9.3.2):
(ei ei+m )ei = ei (ei ei+m + 1) = ei ,

(ei ei+m )ej = ej (ei ei+m )

(j 6= i, i + m).

9 RAPPRESENTAZIONI DI SPIN

163

Usando ci`o si trova in C(Q), per ogni i, 1 i m:


Hi (e1 e2 . . . em ) = ( 12 + ei ei+m )(e1 e2 . . . em ) = 12 (e1 e2 . . . em ) + e1 e2 . . . em = 21 e1 e2 . . . em .
I pesi Li : h C soddisfano Li (Hj ) = ij . Quindi e1 e2 . . . em `e un vettore peso per h:
H(e1 e2 . . . em1 em ) = m (H)e1 e2 . . . em1 em ,

m = 21 (L1 + . . . + Lm ).

In modo simile, si verifica:


H(e1 e2 . . . em1 e2m ) = 21 (L1 + . . . + Lm1 Lm )(H)(e1 e2 . . . em1 e2m ).
Per ogni z C(Q), si trova nello stesso modo:
H(e1 . . . em z) = 12 (L1 + . . . + Lm )(H)e1 . . . em z,
e similmente
H(e1 . . . em1 e2m z) = 12 (L1 + . . . + Lm1 Lm )(H)e1 . . . em1 e2m z.
9.3.5 Le rappresentazioni spinoriali di so(2m). Si ricordi che le rappresentazioni
spinoriali di so(2m) sono le rappresentazioni irriducibili con peso dominante
m1 = 21 (L1 + . . . + Lm1 Lm ),

m = 12 (L1 + . . . + Lm ),

si veda 8.4.3.
Consideriamo la rappresentazione di so(2m) C(Q)+ su C + (Q) di 9.3.1. Supponiamo
prima che m sia pari. In questo caso
x = e1 . . . em ,

y = e1 . . . em1 e2m

sono in C(Q)+ e sono vettori pesi con peso m e m1 rispettivamente. Per


J {m + 1, . . . , 2m},

K {m, m + 1, . . . , 2m 1} con ]J, ]K 0 mod 2,

i vettori xeJ e yeK sono vettori peso indipendenti in C + (Q) con lo stesso peso m e m1
rispettivamente. Quindi la moltiplicit`a di questi pesi `e almeno:
+
m1
.
dim C(Q)+
m1 , dim C(Q)m 2

Ogni peso nellorbita di m1 o m sotto il gruppo di Weyl ha la stessa moltiplicit`a, e ci sono


2m1 pesi in ognuna delle due orbite (si veda 8.4.3). Quindi ognuno dei 2m1 + 2m1 = 2m pesi
nellunione delle orbite di m1 e m ha moltiplicit`a almeno 2m1 . La somma diretta di questi
spazi peso ha allora dimensione almeno 2m 2m1 = 22m1 = dim C(Q)+ . In particolare, ogni
peso di h su C + (Q) `e nellorbita di Weyl di m1 o m e perci`o
2m1
C(Q)+
.
= (V (m1 ) V (m ))

9 RAPPRESENTAZIONI DI SPIN

164

Lo stesso isomorfismo vale se m `e dispari. In tal caso x, y C(Q) , per`o per ogni J, K come
come sopra, con ]J, ]K 1 mod 2, i vettori xeJ e yeK sono vettori peso in C(Q)+ . Quindi
+
troviamo ancora almeno 2m1 vettori pesi indipendenti in C(Q)+
m1 e C(Q)m e si ottiene
lisomorfismo desiderato.
9.3.6 La rappresentazione spinoriale di so(2m + 1). Si ricordi che la rappresentazione
spinoriale di so(2m + 1) `e la rappresentazione irriducibile con peso dominante
m = 21 (L1 + . . . + Lm ),
si veda 8.5.3. Se m `e pari allora per ogni J {m + 1, . . . , 2m + 1} con ]J pari, il vettore
e1 . . . em eJ sta in C(Q)+ e ha peso m . Se invece m `e dispari, il vettore e1 . . . em eJ con ]J
dispari sta in C(Q)+ . In entrambi i casi troviamo che
m
dim C(Q)+
m 2 .

Poiche ogni peso nellorbita del gruppo di Weyl di m ha la stessa moltiplicit`a, e ce ne sono 2m
di tali pesi (si veda 8.5.3), la somma diretta di questi spazi ha dimensione almeno 2m 2m = 22m .
Poiche dim C(Q)+ = 2n1 = 22m concludiamo
2m
C(Q)+
= (V (m )) .

9.3.7
Isomorfismi di algebre.
m1
(V (m1 ) V (m ))2
implica che

Nel caso n

2m, lisomorfismo C(Q)+

Homso(2m) (C(Q)+ , C(Q)+ )


= M2m1 (C) M2m1 (C).
Si noti che dim Homso(2m) (C(Q)+ , C(Q)+ ) = 2 22(m1) = 22m1 .
Daltra parte, per ogni z C + (Q) lapplicazione lineare C(Q)+ C(Q)+ , y 7 yz sta in
Homso(2m) (C(Q)+ , C(Q)+ ) (perche x so(n) C(Q)+ agisce per y 7 xy). Per ottenere un
omomorfismo di algebre, definiamo
: C(Q)+ Homso(2m) (C(Q)+ , C(Q)+ ),

z 7 [x 7 xz ]

allora (yz)(x) = x(yz) = (xz )y = ((y) (z))(x), quindi `e un omomorfismo di algebre.


Visto che 1 C(Q)+ e 1z = z, `e iniettiva. Dato che dim C(Q)+ = 2n1 = 22m1 concludiamo
C(Q)+
= M2m1 (C) M2m1 (C)
In modo simile si trova

C(Q)+
= M2m (C),

(n = 2m).

(n = 2m + 1).

Si noti che Spin(Q) (C(Q)+ ) = M2m (C) = GL(2m , C) e questa inclusione `e una
m
rappresentazione di Spin(Q) su C2 , che induce la rappresentazione spinoriale di so(2m + 1)
m
su C2
= V (m ). In modo simile si ottengono le rappresentazioni spinoriali di so(2m).

9 RAPPRESENTAZIONI DI SPIN

165

9.4 Spinori
Vediamo ora alcune definizioni di uso comune nel linguaggio fisico.
9.4.1 Spinori di Dirac. Sia Q una forma quadratica non-degenere su Cn . In 9.3.7 abbiamo
trovato gli isomorfismi di algebre complesse C(Q)+
= M2m1 (C) M2m1 (C) se n = 2m e
+
C(Q) = M2m (C) se n = 2m + 1. In particolare, se n = 2m o 2m + 1, lalgebra di Clifford
m
pari agisce su C2 e questo induce le rappresentazioni spinoriali di so(2m) e so(2m + 1).
m
Gli elementi dello spazio C2 sono detti spinori di Dirac. Il gruppo Spin(Q) (C(Q)+ )
agisce sugli spinori di Dirac.
9.4.2 Spinori di Weyl. Nel caso che n = 2m sia pari, gli elementi dei due sottospazi, di
dimensione 2m1 invarianti per C(Q)+
= M2m1 (C) M2m1 (C) si chiamano spinori di Weyl.
In particolare, in questo caso ogni spinore di Dirac `e una coppia di spinori di Weyl.
9.4.3 Spinori di Majorana. La forma quadratica Qr,s , con r + s = n, su Rn , definisce una
forma quadratica non-degenere Q su Cn (data dallo stesso polinomio x21 + . . . + x2p (x2p+1 +
. . . + x2n )). Quindi si ha C(r, s)+ := C(Qr,s )+ , C(Q)+ . In generale per`o non `e vero che
C(r, s)+
= M2m1 (R) M2m1 (R) se n = 2m e C(Q)+
= M2m (R) se n = 2m + 1. Per esempio,
+
+
C(0, 3) = H, un corpo (si veda 9.2.3) e C(1, 3) = M2 (C).
m
Nel caso in qui esista un sottospazio reale V , di dimensione reale 2m , di C2 che sia invariante
per lazione di C(r, s)+ si dice che gli elementi di V sono spinori di Majorana. Per esempio
C(1, 3)+
= M2 (C) e in questo caso esiste un tale V : si noti che A + Bi M2 (C), con A, B
M2 (R) agisce su R4 nel modo seguente


A B
M2 (C) , M4 (R),
A + Bi 7
.
B A
9.4.4 Spinori di Majorana-Weyl. Nel caso n = 2m, e se esiste anche uno spazio vettoriale
V di spinori di Majorana ci si pu`o inoltre chiedere se esistano due sottospazi reale V+ , V di V ,
di dimensione reale 2m1 , che siano invarianti per lazione di C(r, s)+ . nel caso affermativo gli
elementi di V+ e V sono detti spinori di Majorana-Weyl.
9.4.5 Esistenza di spinori dei vari tipi per C(1, s)+ . Nella tabella qui sotto si d`a
lesistenza o meno di spinori dei vari tipi per C(1, s)+ (
= C(s, 1)+ , si veda 9.2.2). Il risultato
dipende soltanto da n = 1 + s mod 8.
n mod 8
0
1 2 3
4
5
6
7
Majorana
s` s` s` s` s` no no no
Majorana-Weyl no no s` no no no no no
Naturalmente gli spinori di Dirac esistono sempre.

10 STRUTTURE GEOMETRICHE

10

166

Strutture geometriche

Testi consigliati: [dC], [D], [DNF1], [DNF2], [KN], [N1], [N2] [T], [Wa].

10.1

Fibrati

Nel capitolo 4 `e stato introdotto il concetto di fibrato tangente che `e poi stato generalizzato ad
alcuni altri casi quali il fibrato cotangente o i fibrati ottenuti dai prodotti tensori o dai prodotti
esterni. Tali concetti possono essere ulteriormente generalizzati per permettere la considerazione di situazioni pi`
u generali che risultano frequenti anche nelle applicazioni fisiche. Infatti
abbiamo finora visto i campi vettoriali su una variet`a M come sezioni del fibrato tangente,
ovvero come mappe verticali V : M T M , M V := idM . Tuttavia `e possibile pensare a
campi che in ogni punto hanno valori in spazi pi`
u generali, che possono essere spazi vettoriali,
reali o complessi, algebre di Lie ma anche gruppi o variet`a differenziali. I concetti fondamentali per la costruzione dei fibrati generali sono tutti contenuti nelle propriet`a fondamentali del
fibrato tangente.

10.1.1 Fibrati vettoriali. Un fibrato vettoriale si indica con E M e consiste dei seguenti
ingredienti
una variet`a differenziale ndimensionale M , provvista di un atlante A = {U , }A ;
uno spazio vettoriale su campo K m dimensionale, detto fibra di riferimento;
una variet`a differenziale (n + m)-dimensionale E, detta lo spazio totale del fibrato;
una mappa differenziabile suriettiva M : E M detta proiezione;
1
1
una famiglia di omeomorfismi locali : M
(U ) U F tale che (M
(x)) = {x}F
per ogni x U ,

i quali devono soddisfare


1
per ogni x M linsieme Ex = M
(x) deve essere uno spazio vettoriale isomorfo a F . Ex
si chiama fibra su x. Un punto di E sar`a quindi localmente individuato da una coppia
(x, v), x M e v F ;

se U := U U 6= allora le mappe
1
: U F U F ,

(x, v) 7 (x, g (x)v) ,

dove g : U GL(F ) sono mappe differenziabili dette funzioni di incollamento.


La dimensione della fibra `e detta anche rango del fibrato. Il fatto che le funzioni di incollamento
si riducano essenzialmente allazione del gruppo GL(F ) sulle fibre, pu`o essere interpretato come
se lincollamento degli intorni locali avvenisse attaccando assieme le fibre comuni, cio`e se i due
intorni U e U hanno intersezione non vuota U allora si incolla la fibra {x} F U F

10 STRUTTURE GEOMETRICHE

167

con la fibra {x} F U F al variare di x U , dopo averle identificate a meno di


una trasformazione lineare in G := GL(F ). In questo senso la struttura del fibrato dipende
essenzialmente dallazione del gruppo G nellincollamento delle fibre e per tale motivo esso viene
chiamato il gruppo di struttura del fibrato. Talvolta scriveremo (E, , M, G, F ) per mettere in
evidenza anche il gruppo di struttura.
Pi`
u in generale, dato un atlante per M e uno spazio vettoriale F , si chiamano funzioni di
incollamento una famiglia di applicazioni
g : U GL(F ) ,
tali che
g (x) = g (x)1 ,
e
g (x)g (x)g (x) = I GL(F ) ,
per ogni , , tale che U := U U U 6= . Nella seconda condizione naturalmente le
mappe si intendono tutte ristrette a U . Essa viene detta anche relazione di cociclo. Dalle
mappe di incollamento possiamo quindi ricostruire il fibrato vettoriale tramite la relazione
!
a
E=
(U F ) / ,

dove (x, v) U F e (y, w) U F sono equivalenti se


x = y U

w = g v .

10.1.2 Esempio. Un esempio di fibrato vettoriale `e il fibrato tangente con E = T M , F = Rn


e G = GL(n, R). Vediamo allora che lelemento g nel caso del fibrato tangente non `e altro
che la matrice jacobiana J GL(n, R) della mappa 1
indotta dalle carte locali (U , ) e
(U , ). Confrontando con quanto visto in 3.1 ed utilizzando le convenzioni introdotte in 1.2.4
si pu`o dunque interpretare linversa di J come la matrice di cambiamento di riferimento nella
fibra fissata (che dunque agisce a destra), cosicche le componenti (controvarianti) del vettore
v Rn trasformano appunto con la matrice J. In altre parole, nel linguaggio del paragrafo
1.2.6, il gruppo di struttura individua il gruppo rispetto al quale i vettori (e pi`
u in generale i
tensori) si comportano come tali.
10.1.3 Esempio. Il fibrato banale. Un fibrato vettoriale si dice banale se E = M F . In
tal caso la proiezione sul fibrato coincide con la proiezione sul primo fattore.
10.1.4 Il punto di vista fisico. La propriet`a di incollamento `e particolarmente importante
nelle applicazioni fisiche. Nelle trattazioni pi`
u elementari di fisica un campo vettoriale in una
certa regione U viene trattato semplicemente come una mappa V : U Rn . Il grafico di tale
mappa `e linsieme delle coppie (x, V (x)) U Rn sicche possiamo rivedere il campo come

10 STRUTTURE GEOMETRICHE

168

unapplicazione V : U U Rn che composta con la proiezione sul primo elemento si riduce


allidentit`a. Tale descrizione `e dunque rigorosa finche ci si riduce ad una regione limitata (cio`e
una descrizione locale) in quanto T M |U ' U Rn , ma non `e pi`
u corretta per una definizione
del campo vettoriale su tutta la variet`a M , a meno che non si abbia T M ' M Rn . Un fibrato
siffatto si dice banalizzabile e la mappa che realizza tale isomorfismo si dice banalizzazione del
fibrato. Il fatto che in generale i fibrati siano non banali dimostra la loro importanza in fisica.
Per esempio si dimostra che per le sfere si ha T S n ' S n Rn solamente per n = 1, 3, 7.
Daltra parte la descrizione locale continua ad essere indispensabile in quanto la descrizione
fisica sperimentale non pu`o avvenire altrimenti. Lapparato sperimentale e linterpretazione
relativa dei dati per la definizione fisica del campo richiede essenzialmente ldentificazione locale
del fibrato con un prodotto cartesiano: nella regione U in cui si effettuano le misure, i vettori
misurati vengono tutti individuati con elementi di un unico spazio vettoriale Rn e non di un
differente spazio vettoriale (fibra) per ogni punto. Dal punto di vista fisico quindi il fibrato
viene costruito necessariamente a pezzi, che vanno poi incollati per costruire il fibrato completo
(e dunque la teoria generale). Tale ruolo viene svolto dalle funzioni di incollamento.

i
M , i = 1, 2 si dicono isomorfi
10.1.5 Isomorfismo tra fibrati. Due fibrati vettoriali Ei
se esiste un diffeomorfismo f : E1 E2 che ristretto alle fibre si riduce ad un isomorfismo tra
spazi vettoriali e che sottende lidentit`a sulla base, cio`e 2 f = 1 . In altre parole una fibra
sul punto x viene mandata nella fibra sullo stesso punto.
Un fibrato si dice banalizzabile se `e isomorfo ad un fibrato banale.

10.1.6 Esempi. Un esempio di fibrato banale `e il cilindro, visto come fibrato di rette sul
cerchio S 1 situato nellorigine delle rette stesse. Un fibrato banalizzabile, come visto nel capitolo
4, `e il fibrato tangente sul cerchio S 1 . Un fibrato non banalizzabile `e invece il nastro di Mobius
anchesso visto come fibrato vettoriale su S 1 . Dato un fibrato, la sua restrizione ad una carta
locale opportuna `e per definizione un fibrato banalizzabile e si dimostra in realt`a che `e banale,
cio`e tutti i possibili isomorfismi sono equivalenti.

10.1.7 Sezioni di un fibrato. Dato un fibrato E M si chiamano sezioni o sezioni


trasversali del fibrato le mappe differenziabili
: M E ,
che soddisfano = idM . Si scrive (M, E). In particolare si dice che `e una sezione
globale se `e definita su tutto M . Si dice invece che `e locale se `e definita solamente su un intorno
aperto U in M e si scrive (U, E).
Queste definizioni sono vere anche per fibrati pi`
u generali di quelli vettoriali (si veda pi`
u avanti).
10.1.8 Criterio di banalizzabilit`
a. Non `e difficile dimostrare che un fibrato vettoriale con
fibra mdimensionale `e banalizzabile se e soltanto se ammette lesistenza di m sezioni globali
ovunque linearmente indipendenti (esercizio). In pratica la scelta di un riferimento di sezioni
globali idividua un isomorfismo con il fibrato M F . Tuttavia, dati due riferimenti, non `e

10 STRUTTURE GEOMETRICHE

169

detto che sia possibile deformare luno nellaltro con continuit`a tramite una famiglia continua
di riferimenti.

1
10.1.9 Prodotto fibrato e prodotto tensoriale di fibrati vettoriali. Siano E1
Me
2
E2
M due fibrati vettoriali su M con fibre F1 ed F2 . Si costruisce allora il prodotto fibrato

E1 M E2 M su M , con fibra F1 F2 dove lo spazio totale `e

E1 M E2 := {(1 , 2 ) E1 E2 | 1 1 = 2 2 } .

In modo del tutto analogo si costruisce il prodotto tensore E1 M E2 M su M , con fibra


F1 F2 dove lo spazio totale `e
E1 M E2 := {1 2 |(1 , 2 ) E1 E2 e 1 1 = 2 2 } .
Un modo pi`
u semplice di definire tali fibrati `e attraverso le funzioni di incollamento. Indichiamo
(i)
con g : U GL(Fi ), i = 1, 2 le funzioni di incollamento dei due fibrati. Per il prodotto
fibrato, di fibra F1 F2 , avremo
!
a
E1 M E2 =
U (F1 F2 ) / ,

dove la relazione di equivalenza `e


(1)

(2)

(x, (v, w)) (x, (g (x)v, g (x)w)) ,

x U , v F1 , w F2 .

Analogamente per il prodotto tensore, di fibra F1 F2 , avremo


!
a
E1 M E2 =
U (F1 F2 ) / ,

dove la relazione di equivalenza `e lestensione lineare di


(1)

(2)

(x, v w) (x, g (x)v g (x)w) ,

x U , v F1 , w F2 .

` ovvio come tali definizioni si estendano al caso di un numero arbitrario di fibrati.


E

10.1.10 Duale di un fibrato vettoriale. Dato un fibrato vettoriale E M di fibra F


si pu`o costruire il suo duale E semplicemente sostituendo ogni fibra Ex ' F con il suo duale
Ex . Usando le funzioni di struttura come sopra, vediamo che
!
a
E =
U (F ) / ,

dove `e definita dalla rappresentazione controgradiente di GL(F ) su F .

10 STRUTTURE GEOMETRICHE

170

10.1.11 Fibrati principali. Finora abbiamo individuato il gruppo di struttura di un fibrato vettoriale con fibra F con il gruppo GL(F ). Tuttavia pi`
u in generale pu`o accadere che
le funzioni di incollamento abbiano valori in un sottogruppo G GL(F ). Limportanza del
ruolo del gruppo di struttura G nella costruzione dei fibrati vettoriali suggerisce di introdurre
il seguente concetto.
Un fibrato principale con gruppo di struttura G `e una quadrupla {P, M , M, G} (che in generale
M
indicheremo semplicemente con P o con P
M ) dove P ed M sono due variet`a differenziabili, M : P M unapplicazione differenziabile suriettiva, G un gruppo di Lie che agisce
1
liberamente a destra su P, preservando ciascuna fibra Px := M
(x) e lazione `e transitiva sulle
fibre. Infine si richiede che esistano degli omeomorfismi locali che banalizzino localmente il
fibrato e che siano compatibili con lazione di G:
1
: M
(U ) U G

tale che (Px ) = {x} G,

(pg) = (p)g

dove (x, h)g := (x, hg) per x U e g, h G.


In particolare dunque Px ' G e ( 1
)(x, h) = (x, g (x)h) per una mappa differenziabile
g : U G. Poiche tali funzioni devono chiaramente soddisfare le relazioni di cociclo
(si veda 10.1.1) come vedremo da un fibrato principale si pu`o sempre costruire un fibrato
vettoriale. Si noti che la richiesta che le rispettino lazione a destra impone che esso definisca
essenzialmente unazione a sinistra sulle fibre. In sostanza possiamo scrivere
!
a
P=
U G / ,

dove
(x, h) (x, g (x)h) ,

x U , h G .

Un esempio di fibrato principale, di particolare importanza in relativit`a generale, `e il fibrato


dei riferimenti.
Nota. Una sezione di un fibrato principale si dice globale se `e ovunque ben definita. Allora un
fibrato principale `e banalizzabile se e solo se ammette almeno una sezione globale.
10.1.12 Il fibrato dei riferimenti. Il fibrato dei riferimenti pu`o essere definito per ogni
fibrato vettoriale. Tuttavia, per motivi di definitezza e per il significato che assume in relativit`a
generale, ci concentriamo qui nel caso del fibrato tangente. Sia
M : T M M
il fibrato tangente a M . Ad ogni x M , anziche uno spazio vettoriale Tx M , si associ linsieme
dei riferimenti18 in Tx M , che denoteremo con Rx M . Rx M non `e uno spazio vettoriale ma `e
2
un sottoinsieme aperto di Rn e quindi una variet`a dfferenziale n2 dimensionale. Su di essa
vi `e unazione19 libera e transitiva di GL(n, R) il quale risulta perci`o isomorfo (come variet`a)
18
19

cio`e n-uple di vettori linearmente indipendenti, n = dimM , cio`e una base ordinata
a destra secondo le convenzioni in 1.2.4

10 STRUTTURE GEOMETRICHE

171

alla fibra stessa, una volta che si sia identificato un punto e Rx M con lelemento neutro
I GL(n, R). Sullinsieme
a
RM :=
Rp M ,
pM

e le sue restrizioni RM |U := pU Rp M agli intorni delle carte locali (U , ), si vede che la


precedente identificazione individua degli omeomorfismi locali
1
: M
(U ) RM |U U GL(n, R) ,

i quali danno a RM la struttura di una variet`a differenziale ((n2 + n)dimensionale). Qui M


`e la proiezione naturale che associa x M ad ogni fibra Rx M .
Loggetto cos` costruito si chiama il fibrato dei riferimenti su M . Esso `e costituito da
una quadrupla {RM, M , M, GL(n, R)} dove RM ed M sono due variet`a differenziabili,
M : RM M unapplicazione differenziabile suriettiva e il gruppo di Lie GL(n, R) agisce
liberamente e transitivamente a destra su RM preservando le fibre.
10.1.13 Fibrati vettoriali associati ad un fibrato principale. Sia P un fibrato principale
di gruppo G e (, F ) una rappresentazione di G sullo spazio vettoriale F (finito-dimensionale).
Si pu`o costruire un fibrato vettoriale

E
E = P G F
M

con gruppo di struttura G ponendo


E = P F := (P F )/ ,
dove la relazione di equivalenza `e data da
(p, h) (pg, (g 1 )v) ,

p P, g G, v F .

Se con P indichiamo la relazione di equivalenza che definisce P, abbiamo


!
!
a
E=
U G / P F .

Dunque se (x, h, v)((x, h), v) `e un rappresentante di un punto di E e se g sono le funzioni di


transizione di P, si ha
(x, h, v) (x, e, (h)v) P (x, g (x), (h)v) (x, e, (g (x))(h)v) ,
dove e `e lidentit`a del gruppo. Poiche la mappa v 7 (e, v) definisce un isomorfismo tra G V
e V , possiamo scrivere la catena di equivalenze nella forma (dove in questo caso particolare
w ' (e, w) ' (h, v))
(x, w) E (x, (g (x))w) ,

10 STRUTTURE GEOMETRICHE

172

cosicche

!
E=

U F

/ E .

In altre parole, se g sono le funzioni di transizione di P, allora le funzioni di transizione del


fibrato vettoriale associato sono le (g ).
10.1.14 Esempio. Il fibrato tangente. Il fibrato tangente `e il fibrato vettoriale associato
al fibrato dei riferimenti, dove V = Rn (n = dim(M )) e se A `e una matrice di GL(n, R) allora
(A) agisce su Rn semplicemente con lusuale prodotto riga per colonna della matrice A per i
vettori colonna di Rn . Infatti possiamo costruire esplicitamente la mappa che lega il fibrato dei
riferimenti al fibrato tangente
n

: R R T M , (r, v) 7

n
X

fi ai Tx M ,

i=1

dove r = (f1 (x), . . . , fn (x)) Rx `e un riferimento in x e v = (a1 , . . . , an ) Rn una n-upla


reale. Il gruppo GL(n, R) agisce a destra sui riferimenti in modo che se A GL(n, R), allora
RA r = r = (f1 , . . . , fn ) ,

fi =

n
X

fj Aji .

j=1

Allora (A1 ) `e la matrice inversa di A che agisce a destra nella trasformazione dei riferimenti,
cio`e
n
X
1
1
n
i
(A )v = v = (
a ,...,a
), a
=
(A1 )ij aj .
j=1

Infatti in tal modo gli elementi (r, v) e (


r, v), che sono equivalenti, vengono mappati nello
stesso elemento di T M :
(
r, v) =

n X
n X
n
X
i=1 j=1 k=1

fi Aij (A1 )jk ak =

n X
n
X
i=1 k=1

fi ik ak =

n
X

fi ai = (r, v) .

i=1

Questo, oltre a mostrare esplicitamente come il fibrato vettoriale venga realizzato tramite le
classi di equivalenza, mette in evidenza come in pratica la relazione tra fibrato principale e fibrato vettoriale sia una generalizzazione della relazione tra vettori, componenti e basi descritta
nel capitolo 1.
Il fibrato cotangente si ottiene allo stesso modo sostituendo a la sua rappresentazione
controgradiente. Pi`
u in generale si pu`o usare 3.1 per definire i fibrati tensoriali.
10.1.15 Osservazioni. Si pu`o generalizzare ulteriormente il concetto di fibrato. Ci`o che
occorre sono
tre variet`a differenziabili E, M, F con dim(E) = dim(M )+dim(F ), dette rispettivamente
spazio totale, base e fibra di riferimento;

10 STRUTTURE GEOMETRICHE

173

E
una mappa differenziabile suriettiva M
: E M;

associata ad un atlante {(U , )}A di M , una famiglia di omeomorfismi locali E


:
E 1
(M ) (U ) U F ;
E 1
un gruppo di struttura G che agisce su F e tale cio`e che E
( ) ((p, f )) = (p, g f )
se p U U e f F mentre g G.

Si definisce cos` un fibrato differenziale E su M con fibra F e gruppo di struttura G.


Si noti ancora una volta che le funzioni di incollamento g devono soddisfare le condizioni di
cociclo
1
g
= g ,
g g g = idU ,
essendo U = U U U .
Tutte le precedenti definizioni sono casi particolari di questa, dove in particolare F = G nel
caso di un fibrato principale.
Si vede inoltre facilmente che ogni fibrato sottende sempre un fibrato principale. Nella
costruzione di tutti i possibili fibrati, la fibra non ha quindi particolare importanza dato che
tutti i fibrati possono essere ricondotti al fibrato principale sotteso. Di qui la particolare importanza dei fibrati principali: per classificare tutti i fibrati differenziali su una variet`a `e sufficiente
classificarne i possibili fibrati principali.
10.1.16 Esempio: fibrati sulla sfera. Se consideriamo M = S n , la sfera n-dimensionale
con lusuale struttura differenziale individuata ad esempio dallimmersione in Rn+1 , come noto
si pu`o utilizzare un atlante costituito da due sole carte locali, diciamo una che copre lemisfero
boreale
S+ = {x = (x0 , . . . , xn ) Rn+1 |x x = 1, x0 > } ,
e laltra che copre lemisfero australe
S = {x = (x0 , . . . , xn ) Rn+1 |x x = 1, x0 < } ,
che si intersecano in un intorno (piccolo a piacere) della sfera equatoriale Se = S+ S = S n1 .
Ogni fibrato sulla sfera `e quindi individuato da una sola funzione di transizione, essenzialmente
ge : Se GL(n, R). Per classificare tutti i fibrati (o meglio le loro classi di equivalenza) sulla
sfera S n , occorre classificare le mappe S n1 GL(n, R) (o meglio le loro classi di omotopia).
10.1.17 Osservazione. Notiamo infine che pu`o essere utile talvolta utilizzare la seguente

10 STRUTTURE GEOMETRICHE

174

raffigurazione pittorica per un fibrato E : M con fibra F


Fibrato differenziale

F
s

s v = ()

Ex

x = ()

10.2

Geometria e gruppi di Lie

Vediamo alcuni aspetti della geometria dei gruppi di Lie dal punto di vista delle variet`a
differenziali. Sia dunque G un gruppo di Lie ndimensionale.
10.2.1 La 1forma di Cartan. Come si `e visto in 5.1.9 su G `e definita una mappa Lg di
traslazione a sinistra, che permette di definire lalgebra di Lie associata al gruppo come lalgebra
dei campi vettoriali invarianti a sinistra ed identificarla con lo spazio tangente allidentit`a. Una
base di campi vettoriali invarianti a sinistra `e data da {i }ni=1 dove i |g = Lg i , essendo i gli
elementi di una base di Te G. Similmente se j individuano la base duale di Te G, i (j ) = ji ,
allora la base delle 1forme invarianti a sinistra (canonicamente duale a quella dei campi) `e
data da J i |g = Lg1 (i ). Si definisce allora la forma di Cartan J := i J i , che per costruzione `e
dunque una 1forma a valori nellalgebra di Lie che risulta essere invariante a sinistra. Poiche
i si possono identificare con i si vede che la forma di Cartan agisce come lidentit`a sui campi
invarianti a sinistra. In particolare dunque J `e indipendente dalla scelta della base i . Infine `e
un utile esercizio la dimostrazione della importante propriet`a Rg J = Ad(g 1 ) J.
10.2.2 La forma di Killing. Sullalgebra di Lie g si definisce una forma bilineare K :
g g C, detta forma di Killing, tramite la relazione K(a, b) = T r(ad(a)ad(b)) per ogni
a, b g, dove T r indica la traccia. Essa soddisfa le propriet`a di simmetria K(a, b) = K(b, a) e
di ad-invarianza K([a, b], c) = K(a, [b, c]), che segue facilmente dalle identit`a di Jacobi. Posto

10 STRUTTURE GEOMETRICHE

175

Kij = K(i , j ) si pu`o scrivere K = Kij i j . La forma di Killing si estende facilmente ad


una forma bilineare simmetrica ad-invariante
KG T G S T G

:= Sym2 (T G)

tramite pull-back: KG |g = Lg1 K. Dunque KG = T r(ad(J) ad(J)) = Kij J i J j `e invariante


a sinistra.
Si noti che scelta una base j dellalgebra, con costanti di struttura cjk l e con base duale j , si
ha
Kij = T r(ad(i ) ad(j )) =

n
X

((ad(i ) ad(j ))(l )) =

l=1

n
X

n
X

l ([i , cjl k k ])

l,k=1

cil k cjks l (s ) ,

l,k,s=1

sicche, adottando la convenzione di Einstein, Kij = cil k cjkl . Inoltre la condizione di adinvarianza assume la forma cij l Klk = cik l Klj che equivale a dire che i coefficienti cijk := cij l Klk
sono completamente antisimmetrici negli indici.
10.2.3 Lequazione di Maurer-Cartan. Vogliamo calcolare d1 J ovvero d1 J i . Poiche le
J i sono invarianti a sinistra e, come si dimostra facilmente, loperatore di derivazione esterna
commuta con il pull-back, le due forme d1 J i saranno anchesse invarianti a sinistra. Per determinarle `e dunque sufficiente valutarle sulla base j di campi invarianti a sinistra. Utilizzando
la formula di Cartan in 4.5.8 e il fatto che J i (j ) = ji , si ottiene
dJ i (j , k ) = J i ([j , k ]) = cjkl J i (k ) = cjki ,
essendo cjkl le costanti di struttura dellalgebra nella data base: [j , k ] = cjk l l . Segue che
dJ = 21 J j J k cjk l l , che si trova talvolta scritta nella forma
1
dJ + [J, J] = 0
2
dove si intende convenzionalmente che per due 1-forme J, K a valori in unalgebra di Lie
[J, K](, ) := [J(), K()] [J(), K()] ,
cosicche [J, J] := [i , j ]J i J j .
10.2.4 Forma di Killing per gruppi semisemplici. Si dimostra che K `e non degenere se
e soltanto se lalgebra g `e semisemplice. Ricordiamo che nondegenere significa che K(a, b) = 0
b g implica a = 0 (lanalogo scambiando a con b segue dalla simmetria), che equivale a
det Kij 6= 0.
Dimostriamo che se K non `e degenere allora g `e semisemplice. Per assurdo sia I g un ideale

10 STRUTTURE GEOMETRICHE

176

abeliano non banale. Allora K(I, g) = 0 cio`e K(i, a) = 0 per ogni i I,P
a g. Infatti, scelta
j
la base i di g e la sua duale , sia ha K(i, a) = T r(ad(i) ad(a)) = nl=1 l ([i, [a, l ]]). Se
s = dim(I) allora scegliamo la base i in modo che i primi elementi generino I. Perci`o
K(i, a) =

s
X

([i, [a, l ]]) +

l=1

n
X

l ([i, [a, l ]]) = 0 ,

l=s+1

dato che nella prima sommatoria [a, l ] I ha parentesi nulle con i (essendo I abeliano) mentre
nella seconda sommatoria l `e valutato su I, ma l > s.
In particolare dunque KG `e nondegenere per i gruppi semisemplici. Se lalgebra di Lie `e reale,
allora K definisce una metrica con segnatura, che `e euclidea nel caso si tratti di una forma
compatta. Una metrica invariante a sinistra sul gruppo `e perci`o ds2 = KG , essendo una
costante di normalizzazione.
10.2.5 Esempio. Il caso dei gruppi matriciali. Consideriamo il caso in cui G sia un
sottogruppo di Lie di GL(N, C). Sia (U, ) una carta locale contenente lidentit`a e = 1 (0).
Posto V := (U ) Rn , dove n = dim(G), indichiamo con g(x) = 1 (x) il generico punto di U
e sia (x) := g(x)1 dg. Si tratta di una 1forma su V con le seguenti propriet`a di immediata
verifica:
(0) : T0 V Te G ' g;
se hg(x) U allora (Lh 1 ) = ;
(0)(/xj ) = 1 (/xj ).
Ne segue che := `e una 1forma U con le propriet`a
(e) : Te U Te G ' g;
se hg U allora (Lh ) = , cio`e `e invariante a sinistra;
(e)(i ) = (0)( (i )) = i ,
cosicche = J| `e la restrizione a U della forma di Cartan. Per i gruppi matriciali si ha quindi
una costruzione semplice della forma di Cartan che si indica semplicemente con J = g 1 dg. Essa
permette anche una deduzione elementare dellequazione di Maurer-Cartan. Poiche g 1 g = e,
si trova che dg 1 = g 1 dg g 1 , da cui segue immediatamente che dJ = J J. Daltra
parte, posto J = J i i , usando lantisimmetria del prodotto esterno, si ha J J = i j J i J j =
1
[ j i ]J i J j = 21 [i , j ]J i J j , che porta allequazione di Maurer-Cartan.
2 i j
` il gruppo delle matrici 2 2 unitarie, U U = U U = 1,
10.2.6 Esempio. SU (2). E
con det U = 1. Il differenziale di queste relazioni mostra che lalgebra consiste delle matrici
antihermitiane di traccia nulla. Una base conveniente `e data dalle i = ii , i = 1, 2, 3 con






0 1
0 i
1 0
1 =
, 2 =
, 3 =
.
1 0
i 0
0 1

10 STRUTTURE GEOMETRICHE

177

Le costanti di struttura sono cij l = 2ijl , cio`e due volte il tensore di Levi-Civita. La metrica
` definita negativa ed in particolare nondegenere,
di Killing `e perci`o Kij = cik l cil k = 8ij . E
conseguenza della semplicit`a di su(2).
Per individuare lelemento generico di SU (2) si pu`o adoperare la parametrizzazione di Eulero
g(, , ) = e3 e2 e3 dove [0, [, [0, /2[, [0, 2[. Allora si trova per la forma
di Cartan20
J = g 1 dg = [ cos(2) sin(2)d + sin(2)d]1 + [sin(2) sin(2)d + cos(2)d]2
+[d + cos(2)d]3 ,
e quindi per la forma di Killing sul gruppo21
KG = 8[d2 + d2 + d 2 + 2 cos(2)dd] .
10.2.7 Misura invariante su gruppi semisemplici. In Rn si pu`o definire una misura di
Lebesgue d(x) = dx1 . . . dxn . Sia (M, ) una variet`a dotata di una metrica . Scegliamo
una carta locale (U, ) con coordinate x. Si definisce allora una misura su U nel seguente
modo: poiche `e un omeomorfismo, allora V U sar`a misurabile se lo `e (V ) e poniamo
Z
p
| det |d (x) ,
(V ) =
(V )

. Essa `e ben definito poiche | det |d (x) non dipende dalla scelta delle
dove := 1p
coordinate22 e | det | `e strettamente positivo su (U ). Inoltre pu`o essere estesa a tutta M
tramite una partizione dellunit`a.
Consideriamo allora il caso di un gruppo semisemplice reale. Su di esso la metrica invariante
d`a origine ad una misura invariante. Infatti sia V Z e Lg V U , dove (Z, ) `e una seconda
carta locale di coordinate y. Allora
Z
Z
q
q

| det 1 (KG )|d (x) =


| det 1 Lg1 (KG )|d (y)
(Lg V ) =
(V )
(Lg V )
Z
q
=
| det 1 (KG )|d (y) = (V ) .
(V )

Giustificazione della misura: in un dato punto `e sempre possibile scegliere delle coordinate
ortogonali per le quali cio`e il tensore metrico = gij dxi dxj `e diagonale. Se in tale sistema
consideriamo le curve coordinate infinitesime xi , ciascuna ottenuta variando di p
xi la corrispondente coordinata, esse individuano un cubetto i cui lati sono lunghi |xi | = |gii |xi e
20

come duso omettiamo di mettere in evidenza il fatto che in realt`a stiamo esprimendo le seguenti quantit`a
in coordinate locali
21
usiamo la notazione dx2 := dx dx e dxdy := dx S dy = 12 (dx dy + dy dx)
22
verificare!

10 STRUTTURE GEOMETRICHE

178

p
Q
che ha dunque volume | det g| ni=1 xi .
Se sul gruppo usiamo la metrica = KG , allora si ha
gij dxi dxj = Kij J i J j = Klm Jil Jjm dxi dxj ,
p
p
da cui |detgij | = | det Kij || det Jji |. La determinazione della misura invariante sul gruppo
si riduce allora essenzialmente al calcolo del determinante della matrice Jji .
10.2.8 Esempio. La misura invariante per SU (2). La matrice associata alla forma di
Cartan `e

cos(2) sin(2) sin(2) 0


Jli = sin(2) sin(2) cos(2) 0 ,
cos(2)
0
1
e quindi | det Jli | = sin(2), che determina lintera misura se scegliamo ad esempio = 81 .
Si noti che in questo caso il calcolo della misura si poteva fare direttamente partendo da KG .
Tuttavia nel caso generale le difficolt`a tecniche diventano tali che il calcolo di KG `e praticamente
impossibile mentre il calcolo di J e del suo determinante sono ancora fattibili.

10.3

Connessioni

Dato un fibrato differenziale (E, , M, G, F ) ha senso introdurre il concetto di campi su M a


valori nello spazio vettoriale F . Si tratter`a delle sezioni (M ; E), cio`e le mappe
: M E ,

= idM .

Nasce allora la necessit`a di introdurre il concetto di derivazione di un tale campo, che estenda
quello delle usuali funzioni, e che ammetta per`o linterpretazione di confronto tra i valori del
campo in punti vicini. La difficolt`a principale `e insita nel fatto che (x) 1 (x) e (y)
1 (y) per x 6= y appartengono a due spazi vettoriali isomorfi ma distinti e perci`o la loro
differenza non ha alcun significato. Per poter confrontare i due vettori (x) e (y) occorre in
qualche modo trovare il modo di trasportare uno dei due vettori nello spazio vettoriale dellaltro.
Bisogna perci`o in qualche modo connettere i due spazi vettoriali e una volta che si sia stabilita
una tale connessione si pu`o pensare di trasportare uno dei due vettori da uno spazio vettoriale
allaltro. Un tale trasporto viene detto anche trasporto parallelo.
10.3.1 Esempio. Spazi affini.
Consideriamo il caso in cui M sia uno spazio affine
ndimensionale reale. Come variet`a differenziale M ' Rn . Consideriamo un campo vettoriale
X (M ) = (M, T M ). In questo caso si ha T M ' M Rn ' R2n . Fissato un punto
x M , si ha lisomorfismo naturale TxM ' Rn . In pratica, possiamo pensare pittoricamente
a Tx M come allinsieme dei vettori che spiccano da x e terminano nei punti y di M . Usando
le propriet`a dello spazio affine, dati i punti x, y M c`e un modo naturale di trasportare il
vettore (y) in x. Infatti se (y) = z y per qualche z M , sia w = x + (z y). In
pratica x, y, z, w sono i vertici di un parallelogramma. Possiamo allora pensare a w x come
al trasporto parallelo di (y) in x.

10 STRUTTURE GEOMETRICHE

179

Conviene vedere la regola di trasporto che abbiamo assegnato dal punto di vista del fibrato.
Scriviamo T M ' Rn(1) Rn(2) e vediamo i due fattori del prodotto come se fossero ascisse ed
ordinate: le ascisse individuano i punti di M ' Rn(1) . Liperpiano individuato da un fissato
valore delle ascisse rappresenta la fibra nel dato punto. Posto (y) = (y, v) il suo trasporto in
x `e semplicemente (x, v). In altre parole la regola stabilita `e la seguente: quando ci si sposta
da y in x, lungo una qualche curva ((0) = y, (1) = x), corrispondentemente il punto in
T M si sposta nelliperpiano (Rn(1) , v) lungo la curva (, v).
Questo modo di eseguire il trasporto `e banale, ma `e reso possibile dal fatto che il fibrato `e
banale. Poiche T M ' M Rn possiamo trasformare una curva in M in una curva = (, v)
in T M ed usarla per eseguire il trasporto: il punto iniziale `e quello da trasportare mentre quello
finale `e il risultato del trasporto lungo la curva.
Per fibrati non banali non `e possibile associare alla curva M una curva T M che
determini il trasporto, in modo altrettanto naturale. Osserviamo inoltre che per Rn la curva
non sembra giocare in realt`a nessun ruolo, mentre si vede facilmente che il trasporto dipende
decisamente dalla curva nei casi non banali.
10.3.2 Esempio. Connessioni metriche su S 2 .
Naturalmente possiamo pensare S 2
immerso in R3 per cui T S 2 R3 R3 , dove R3 `e dotato della metrica euclidea. Questa metrica
induce una metrica su S 2 , con la quale si possono misurare le lunghezze e gli angoli tra i vettori
tangenti in un punto della sfera. Un trasporto parallelo che conserva tali angoli si dice essere
indotto da una connessione metrica. Comunque una volta fissata una metrica la connessione
metrica non `e univoca poiche occorre caratterizzare anche le curve rispetto alle quali langolo
viene conservato. Per chiarire questo punto nel caso di una sfera esiste una rappresentazione
pittorica.
Connessione di Levi-Civita
Sia v Tp S 2 il vettore da trasportare sulla sfera. Possiamo supporre che p sia il polo sud e
Tp S 2 sia un piano sul quale la sfera `e appoggiata. Identificando il piano con lo spazio affine
R2 possiamo spostare parallelamente il vettore v ovunque e quindi immaginare che in ogni suo
punto vi sia un vettore parallelo a v.
Supponiamo di far rotolare la sfera sul piano. La regola `e che non ruoti mai su s`e stessa attorno
al punto dappoggio. Allora man mano che rotola il punto dappoggio traccia sulla sfera un
arco diametrale che mantiene sempre lo stesso angolo rispetto ai vettori fissati sul piano. Se
la fermiamo, essa si appogger`a nel punto q (sullarco massimo) e possiamo identificare il piano
con Tq S 2 . Il vettore in q parallelo a v (sul piano!) pu`o allora essere identificato con il trasporto
parallelo di v in q. Si noti che il vettore unitario tangente alla curva in ogni punto coincide con
il trasporto parallelo del vettore unitario tangente in p lungo la curva. Si dice che tale curva `e
autoparallela.
Se vogliamo trasportare lo stesso vettore v lungo una curva arbitraria sulla sfera, potremo disegnare la curva sulla sfera, e farla rotolare in modo che poggi sul piano sempre con i punti segnati
dalla curva senza mai ruotare rispetto allasse verticale. Il vettore unitario tangente alla sfera
lungo la curva arbitraria non coincide con il trasporto parallelo del vettore unitario tangente
alla curva in p. Se introduciamo delle coordinate locali x e se nel punto fissato consideriamo
uno spostamento cos` breve da essere considerato rettilineo, allora nello spostamento lungo il

10 STRUTTURE GEOMETRICHE

180

trattino di curva d, il vettore v = v x rester`a invariato e, se l `e la lunghezza darco che

parametrizza la curva, avremo dvdl = o(dl), cio`e si annulla a meno di termini di ordine (dl)2 ,
essendo dl la lunghezza infinitesima del trattino.
Connessione metrica con torsione
Possiamo usare la stessa rappresentazione per introdurre un trasporto parallelo pi`
u complicato.
Si faccia rotolare la sfera accompagnando il suo movimento con una leggera rotazione attorno
al punto dappoggio, proporzionale di volta in volta allo spostamento (vettoriale) infinitesimo
della sfera, in particolare se `e ferma non ruota su s`e stessa, ed eventualmente dipendente dal
punto di appoggio. Se in tali circostanze si vuole che il vettore tangente alla sfera sia trasportato
parallelamente, otterremo una curva in generale diversa da una curva diametrale. Sicche anche
questo trasporto `e indotto da una connessione metrica, tuttavia `e differente dal precedente
poiche si distingue per le curve autoparallele.

Lungo una curva arbitraria, con le stesse convenzioni del caso precedente, avremo dvdl =
d K v + o(dl), dove R = d K `e la matrice di rotazione infinitesima secondo la
suddetta regola. Nel dato punto, loggetto a tre indici K , che ovviamente dipende dal punto e che in funzione della direzione fornisce la velocit`a di rotazione della sfera rispetto alla
lunghezza darco di spostamento, definisce dunque un tensore detto contorsione. In questo caso
si parla di trasporto parallelo indotto da una connessione metrica con torsione.
Da questi esempi si vede che per determinare un trasporto parallelo occorre assegnare una

regola che esprima dvdl in funzione di v stesso e della curva considerata. Come osservato in
10.3.1 in effetti il problema di determinare il trasporto parallelo pu`o essere tradotto in quello di
associare opportunamente alla curva una curva (l) = ((l), v(l)) T M . Il vettore tangente

T (T M ). Ora il vettore da trasportare giace sulla


a tale curva in ogni punto sar`a allora d
dl
fibra T(l) M e quindi, essendo T(l) (T(l) M ) naturalmente contenuto come sottospazio vettoriale
in T (T M ), euristicamente possiamo dire che la velocit`a di variazione del vettore nel trasporto,

dv
non `e altro che la proiezione di d
sul sottospazio T(l) (T(l) M ). Si dice anche che ne `e la
dl
dl
componente verticale.
Spazi orizzontali

H0

F
0

V
l
l
l
l
l
l s
I
l
% l
l V T E
V 0
l
l
l
l
Ex

x = ()

10 STRUTTURE GEOMETRICHE

181

Tuttavia, come si vede dal disegno, questa interpretazione diventa significativa solamente
se `e possibile la determinazione anche di una componente orizzontale che in pratica fornisce
limmersione di T M in T (T M ) come spazio degli spostamenti da una fibra allaltra, che
non `e affatto naturale. In altre parole `e necessario assegnare ad ogni punto T M una
spazio orizzontale ndimensionale H che determini una decomposizione diretta T (T M ) '
TM () M H . Si noti infatti che lindividuazione di un sottospazio vettoriale di uno spazio V
non `e sufficiente a determinare una decomposizione diretta. Nel disegno vediamo che fissato
un vettore V T E, la sua componente verticale V lungo la fibra Ex non `e determinata
univocamente dalla conoscenza di T Ex . Occorre specificare anche lo spazio orizzontale! Se
scegiamo H come spazio orizzontale allora in particolare V `e orizzontale e la sua componente
lungo lo spazio tangente alla fibra `e nulla. Se invece scegliamo H0 allora V non `e pi`
u orizzontale
ed ha una componente verticale non nulla. Si noti inoltre che invece che per un vettore, come
ad esempio V 0 , la caratteristica di essere verticale, cio`e tale che V 0 = 0, non dipende dalla
scelta di uno spazio orizzontale.
10.3.3 Distribuzioni involutive [KN]. Data una variet`a M di dimensione n, si chiama
distribuzione d-dimensionale su M lassegnazione di un sottospazio d-dimensionale x Tx M
ad ogni punto x M . Si dice che `e differenziabile se per ogni x esiste un intorno aperto
U M di x e d campi vettoriali differenziabili i X (U ), i = 1, . . . , d tali che {i (y)}di=1 siano
una base di y per ogni y U . Dato un campo vettoriale X , si dice che appartiene a
se (x) x per ogni x M . Infine si dice che `e una distribuzione involutiva se la parentesi
di Lie di due campi in `e ancora in .
Sia dunque M dotato di una distribuzione e sia S una sottovariet`a connessa di M e i : S , M
la sua immersione in M . Si dice che S `e una variet`a integrale per se i (Tx S) = x per ogni
x S. Si dice che S `e massimale se non ci sono variet`a integrali per che la contengono.
Lesistenza di una variet`a integrale massimale `e sempre garantita per distribuzioni differenziabili
involutive, si veda 10.5.1.
E
10.3.4 Connessione su un fibrato differenziale. Sia (E, M
, M, F, G) un fibrato differenziale su una variet`a ndimensionale M e fibra F . Si chiama connessione una distribuzione
differenziabile su E che assegni ad ogni punto E un sottospazio orizzontale ndimensionale
H di T E, dove per orizzontale si intende trasversale alla fibra (che per convenzione si dice
essere verticale) cio`e tale per cui
E () H .
T E ' T FM

E
In pratica significa che la proiezione di M
: E M induce un isomorfismo tra H e Tx M ,
E
dove x = M ().

10.3.5 Trasporto parallelo. Una connessione determina allora un trasporto parallelo locale
E
nel seguente modo: sia 0 Ep (con p = M
(0 )) il punto della fibra da trasportare lungo

10 STRUTTURE GEOMETRICHE

182

la curva : R M , (0) = p. Sia poi  > 0 sufficientemente piccolo perche la curva


E 1
ristretta a I := (, ) non si autointersechi. Allora = M
((I ) definisce un fibrato
su := (I ), con le stesse fibre di E. In particolare T T E `e un sottospazio lineare
per il quale la decomposizione stabilita dalla connessione induce una analoga decomposizione
E () h , dove h `
T ' T FM
e un sottospazio unidimensionale . Dunque h individua un
campo di direzioni preferenziali in T . Esiste quindi ununica curva : I , univocamente
determinata dalla curva integrale definita dal campo di direzioni e passante per 0 (si veda 4.5.4).
Il fatto che il trasporto ottenuto sia solamente locale `e dovuto al fatto che si tratta di un
problema di Cauchy di cui `e garantita solamente lesistenza e unicit`a locale, mentre pu`o capitare che nel prolungamento la curva vada allinfinito lungo le fibre23 .
I casi interessanti sono quelli in cui `e garantita lesistenza globale. La curva cos` univocamente
determinata si chiama sollevamento orizzontale di e definisce il trasporto parallelo del vettore
in modo ovvio: (1) T(1) M `e il trasporto parallelo di (0) = 0 Fp in T(1) M lungo il
cammino .
Se il cammino `e chiuso allora (1) = (0), ma in generale (1) 6= (0). Il trasporto parallelo lungo i cammini chiusi definisce un automorfismo della fibra. Se tale automorfismo individua sempre un elemento del gruppo di trasformazioni G, si parla di Gconnessione. Le Gconnessioni
hanno il vantaggio di poter essere definite passando attraverso il fibrato principale e sono sempre
buone nel senso che garantiscono lesistenza globale dei sollevamenti orizzontali.
10.3.6 Campi verticali e campi fondamentali. Sia E lo spazio totale di un fibrato

E M . Una sezione X (E) si dice campo verticale se (d)() = 0. Se si tratta di un


fibrato principale E = P, allora si ha unazione libera, e transitiva sulle fibre, R : G P P.
Fissato p P, introduciamo lapplicazione
fp : G P ,

g 7 R(g, p) .

Il differenziale di fp `e una mappa che ad ogni elemento X Lie(G) associa un vettore verticale
p (X) Tp P:
(dfp )e : Te G = Lie(G) Tp P
X
7 p (X).
Il campo (X) X (P) cos` ottenuto si chiama campo fondamentale associato a X. Il fatto
che lazione di G sia libera e transitiva implica il fatto importante che ad ogni vettore verticale
Tp P corrisponde un unico X Lie(G) tale che p (X) = . In generale dunque parlando
di campi verticali su un fibrato principale intenderemo i campi fondamentali associati.
10.3.7 Connessione infinitesima. Lidea di come costruire una connessione su un fibrato
vettoriale : E M `e piuttosto semplice. Dato un vettore T E, si pu`o stabilire in modo
naturale se sia verticale, ovvero se giace lungo le fibre: ci`o avviene se = 0. Tuttavia in
generale non `e possibile scomporre il vettore in componente orizzontale e componente verticale, a meno che in ogni punto E non sia assegnata una scomposizione T E ' T F H .
Questo `e infatti il ruolo della connessione.
23

il problema non si pone nel caso di fibre compatte per cui il teorema di esistenza e unicit`a `e garantito
globalmente

10 STRUTTURE GEOMETRICHE

183

Daltra parte una tale scomposizione definisce un operatore lineare : T E T F che altro
non `e che il proiettore sulla T F e che di ogni vettore T E ci d`a la sua componente verticale. Se H `e una distribuzione differenziabile allora definisce una uno forma su E a valori
in F ' T F .
Viceversa sia : T E T F una mappa lineare suriettiva. Essa definisce allora una
scomposizione
T E ' T F ker( ) .
Se dipende in modo liscio da allora otteniamo una connessione ponendo H := ker( ). Si
dice allora che `e una connessione infinitesima su E.
Data una connessione infinitesima E , il sollevamento orizzontale per di una curva : R M
`e la curva : R E che risolve lequazione differenziale E (
(t))[ (t)] = 0, con (0) = . Vale
allora il seguente teorema.
10.3.8 Teorema. Sia : E M un fibrato vettoriale sul quale sia definita una connessione
infinitesima E . Allora E definisce il trasporto parallelo delle fibre lungo ogni curva :
[, ] M .
10.3.9 Connessione sui fibrati prodotto. Siano E1 ed E2 due fibrati vettoriali su M ,
ciascuno dotato di una connessione ci : T Ei Hi Ei , i = 1, 2 dove Hi, Ei `e il sottospazio
orizzontale di T Ei , Ei . Sia poi E = E1 M E2 il loro prodotto tensore. Allora le
connessioni ci inducono una connessione c = c1 c2 su E. Basta infatti osservare (esercizio)
che T E ' T E1 T M T E2 , cosicche basta scegliere H E := H1,1 E1 T M H2,2 E2 , cio`e lo spazio
orizzontale del prodotto tensore `e il prodotto fibrato degli spazi orizzontali.
10.3.10 Connessione sul fibrato duale. In modo analogo la connessione c su un fibrato
vettoriale E individua una connessione c sul fibrato duale E : gli spazi orizzontali di T E sono
` una buona definizione grazie al fatto che
semplicemente i duali degli spazi orizzontali di T E. E

T E ' (T E) (verificare).
10.3.11 G-connessioni sui fibrati principali. Spesso `e conveniente considerare le connesM
sioni sui fibrati principali. Sia P
M un fibrato principale con gruppo G. Una connessione
su P assegna in ogni punto P una decomposizione T P ' T Px H ed una proiezione
: T P T Px , (H ) = 0 dove si `e posto x = M (). Si dice che `e una Gconnessione
se la distribuzione di direzioni orizzontali `e invariante a destra, cio`e se Rg (H ) = HRg . In
particolare dunque Rg commuta con la proiezione .
10.3.12 Connessione infinitesima su un fibrato principale. Analogamente al caso dei
fibrati vettoriali, si pu`o costruire anche su P una connessione infinitesima. Si otterr`a allora una
uno forma su P che ad ogni campo X (P) associa la sua proiezione verticale. Dato che i
campi verticali si identificano con quelli fondamentali, avremo allora che per ogni p P
p : Tp P Lie(G) .

10 STRUTTURE GEOMETRICHE

184

In altre parole se `e un campo verticale allora p (p ) = X, lunico elemento di Lie(G) individuato dal campo fondamentale corrispondente. In pi`
u se la connessione su P `e una G-connessione
allora lasciamo come esercizio la verifica del fatto che Rg = Ad(g 1 )() per ogni g G, dove
Rg come al solito indica lazione a destra di G su P. Chiameremo questa una G-connessione
infinitesima.
In particolare possiamo dire che essenzialmente la restrizione di alle fibre si identifica
con la forma di Cartan J su G. Si ricordi infatti che ogni fibra `e isomorfa a G e le propriet`a
di J descritte in 10.2.1. In conclusione si chiama G-connessione infinitesima una 1forma
(P) Lie(G) con le propriet`a
1. |Px = J per ogni x M , e per ogni isomorfismo : Px G indotto da una
banalizzazione locale. Ovviamente J `e la forma di Cartan sul gruppo;
2. Rg = Ad(g 1 )() per ogni g G.
Abbiamo dunque visto che una Gconnessione definisce una connessione infinitesima. Ma `e
vero anche il contrario, dato che una connessione infinitesima grazie alla propriet`a 1) individua
una famiglia di direzioni orizzontali H in ogni punto, che risulta essere invariante a destra in
conseguenza alla propriet`a 2). Non `e difficile dimostrare che su ogni fibrato principale `e sempre
possibile determinare una connessione infinitesima e quindi una Gconnessione. In sostanza
`e sufficiente costruirla su ogni banalizzazione locale di P e poi definirla su tutto P tramite una
partizione dellunit`a. Data , il sollevamento orizzontale per di una curva : R M `e la
curva : R P che risolve lequazione differenziale (
(t))[ (t)] = 0, con (0) = .
10.3.13 Teorema. Sia : P M un fibrato principale su M dotato di una connessione
infinitesima . Allora definisce il trasporto parallelo delle fibre lungo ogni curva : [a, b]
M.
10.3.14 Connessioni infinitesime e fibrati associati. Vediamo infine il legame tra le
connessioni infinitesime sui fibrati vettoriali e quelle sui fibrati principali. Ricordiamo che il
legame tra un fibrato principale e quello vettoriale associato `e E = P F . Allora avremo
T E = T P T F , sicche per un vettore nel punto [p, v] di E (con le parentesi quadre indichiamo
la classe di equivalenza)
(p , wv ) ((Rg ())Rg (p) , ((g) w)(g)v ) ,

p Tp P , wv Tv F .

Si noti che qui con non si intende la rappresentazione dellalgebra di Lie del gruppo di
struttura, ma piuttosto lazione di G su T F ottenuta differenziando la mappa
g : F F ,

v 7 (g)v .

Si noti inoltre che come sopra si identifica con un elemento di Lie(G) (si veda 10.3.6), come
sottintenderemo qui di seguito.
Sia ora una connessione infinitesima su P. Fissiamo un punto E. In termini del fibrato
principale potremo scrivere = [p, v]. Un vettore V T E sar`a allora individuato da una

10 STRUTTURE GEOMETRICHE

185

coppia (p , wv ), che come sopra definisce una classe di equivalenza V = [p , wv ]. Infine si usi
per indicare la rappresentazione di Lie(G) indotta da . Allora induce su E la connessione
infinitesima
E | ((p , wv )) = (p (p ))wv Tv F ,
cio`e `e definita dallazione dellelemento p (p ) Lie(G) su T F .
Per vedere che essa `e ben definita occorre verificare che non dipende dalla scelta dei
rappresentanti delle classi di equivalenza, cio`e deve essere equivariante. Infatti se
(0 , w0 ) = ((Rg ())Rg (p) , ((g) w)(g)v )
`e un altro rappresentante in = (Rg (p), (g)v) E deve far corrispondere il vettore
(g) E | ((p , wv )) T(g)v F.
Per capire meglio questo fatto, si osservi che la connessione infinitesima su E deve avere valore
in T F . Nella descrizione di E in termini di P ed F , si ha che i suoi punti sono determinati dalle
coppie (p, v), cosicche T F `e descritto da Tv F . Tuttavia, per la precisione con T F si intende la
parte verticale di T E, la quale dipende solamente da e non dal rappresentante. Se cambiamo
rappresentante per , passando al rappresentante (p0 , v 0 ) = (pg, (g)v), allora T F sar`a ora
identificato con Tv0 F e la relazioni di equivalenza introdotte sopra richiedono ldentificazione
Tv0 F = (g) Tv F , che significa che i vettori w Tv F e (g) Tv0 F vanno identificati in T F .
Lasciamo come esercizio al lettore la dimostrazione del fatto che dunque E `e ben definita se e
solo se `e una G-connessione.
Viceversa, data una connessione su E si pu`o determinare la connessione sul fibrato principale
sottostante, imponendo la stessa relazione di cui sopra tra E ed . Si ottiene allora una
G-connessione.
10.3.15 Osservazione. La costruzione test`e data per la connessione infinitesima su E pu`o
sembrare piuttosto involuta. Infatti le notazioni e la definizione stessa di connessione infinitesima su E potrebbero essere alleggerite sfruttando lisomorfismo naturale tra T F ed F . Tuttavia,
senza tali restrizioni, il formalismo qui utilizzato pu`o resta valido per estensioni a fibrati pi`
u
generali dei fibrati vettoriali. Si noti infatti che per un fibrato differenziale differenziale (in cui
F `e una variet`a che ammette unazione di G) allora T F `e pur sempre uno spazio vettoriale
(non pi`
u identificabile con F ) su cui G agisce tramite .

10.4

Derivate covarianti (connessioni di Koszul)

Torniamo ora sul problema della definizione di una derivata covariante.


10.4.1 Derivata covariante (connessione di Koszul). Sia : E M un fibrato Kvettoriale su una variet`a M . Sia (M, E) il C (M )-modulo delle sezione globali di E (si
ricodi che per s (M, E) e f C (M ) la sezione globale f s (M, E) `e definita da
(f s)(x) := f (x)s(x) Ex per x X). Sia
p (M, E) := (M, (p M ) E),

10 STRUTTURE GEOMETRICHE

186

il C -modulo delle p-forme differenziali a valori in E, cio`e le sezioni globali del fibrato vettoriale
(p M ) E dove p M `e il fibrato delle p-forme su M . In particolare, 0 (M, E) = (M, E).
Una derivata covariante o conessione di Koszul su E `e unapplicazione K-lineare
: (M, E) 1 (M, E) = (M, T M E),
con la propriet`a (regola di Leibnitz)
(f ) = df + f ,
per ogni f C (M, K) e (M, E). In pratica, la derivata covariante ad ogni sezione del
fibrato vettoriale associa una 1-forma a valori nello stesso fibrato.
La valutazione della 1-forma su un campo vettoriale X (M ) definisce la derivata
covariante direzionale associata a .
10.4.2 Motivazione. Sia : E M un fibrato vettoriale. Dato un campo di vettori X su
M e una sezione liscia s : M E del fibrato, vogliamo cercare di definire una derivata Xs di
s tale che anche Xs sia una sezione del fibrato E. Si noti che per x M il differenziale
(ds)x : Tx M Ts(x) E
permette di definere (ds)x (X(x)) Ts(x) E, mentre noi ora vogliamo ottenere un elemento di
Ex .
Se possibile, questo `e collegato alla definizione di un trasporto parallello: dato un x M e un
v Ex := 1 (x), il suo trasporto parallelo sar`a dato da una sezione s del fibrato in un intorno
di x tale che s(x) = v e Xs = 0.
Facciamo subito un primo tentativo: sia U M un intorno di coordinate tale che il fibrato,
indicato ancora con ,
: EU := 1 U U ,
sia banale

: EU U Rn
con un isomorfismo di fibrati. Allora le sezioni lisce s : U EU corrisponderanno alle mappe
lisce e : U Rn nel modo seguente:
( s)(x) = (x, e(x))
( U Rn ).
P
Un campo di vettori X su U si scrive come X = i ai (/xi ) dove le xi sono le coordinate su
U e ai C (U ). Allora si potrebbe definire una sezione
Xs : U EU ,

(Xs)(x) := 1 (x, (Xe)(x)),

dove e = (e1 , . . . , en ) con ei C (U ) e X(e) = (X(e1 ), . . . , X(en )). Un problema di questa


definizione `e che X(s) dipende in modo essenziale dallisomorfismo . Considerando un isomorfismo 2 : EU U Rn si ha (2 1 )(x, e(x)) = (x, g(x)e(x)) per unapplicazione liscia

10 STRUTTURE GEOMETRICHE

187

g : U GLn (R), e la regola di Leibnitz applicata a X(ge) mostra che in generale non vale la
relazione X(ge)(x) = g(x)(Xe)(x). Quindi questa definizione di Xs dipende dalla scelta di .
` meglio dunque definire in modo globale tali derivate di sezioni e poi studiare come si
E
pu`o calcolarle localmente.
10.4.3 Derivata covariante direzionale. Sia una connessione di Koszul su E e sia
X X (M ) un campo di vettori su M . Allora definiamo unapplicazione, detta derivata
covariante direzionale,
X : (M, E) (M, E),

7 ()(X),

cio`e si usa la contrazione 1 (M ) = (M, 1 M ) C (M ) data da 7 (X), per passare da


() (M, (1 M ) E) a ()(X) (M, E).
La derivata direzionale ha le seguenti propriet`a:
X (f ) = (f () + (df ) )(X) = f X + X(f ),
detta regola di Leibnitz. In pi`
u si ha
f X+gY () = f X () + gY ()
per (M, E), X, Y X (M ) e f, g C (M ) perche se `e una 1-forma, si ha (f X) =
f (X) e quindi f X+gY () := ()(f X + gY ) = f ()(X) + g()(Y ).
10.4.4 Simboli di Christoffel. Sia : E M un fibrato vettoriale di rango n, sia
U M un aperto coordinato, con coordinate x1 , . . . , xm : U R (dove m = dim M ), e sia
: EU U Rn una banalizazzione. Siano e1 , . . . , en i vettori di una base standard di Rn e
1
siano ei : U EU le sezioni
Allora ogni sezione : U EU
P corrispondenti, ei (x) := (x, ei ).
si scrive come (x) = i (x)ei (x) per certe funzione i C (U ).
Sia una derivata covariante su un fibrato : E M , allora si ha:
n
n
X
X
() = (
i ei ) =
k (ek ) + (dk ) ek .
i=1

i=k

P
Poiche ogni una forma su U si scrive come = aj dxj per certe funzioni aj C (U ), ogni
uno forma E su U con valori in E si scriver`a come
E =

n
X
i=1

ei i =

n X
m
X

( 1 (U, E))

aij ei dxj

i=1 j=1

per certe aij C (U ). Quindi per ogni k, k = 1, . . . , n, la uno forma (ek ) con valori in E si
scrive come:
n X
m
m
X
X
i
(ek ) =
kj ei dxj =
ki ei ,
i=1 j=1

j=1

10 STRUTTURE GEOMETRICHE

188

per certe funzioni ikj C (U ), dette i simboli di Christoffel, e la matrice n n con coefficienti
in 1 (U )
m
X
= (ki )1i,kn ( Mn (1 (U )),
ki =
ikj dxj
j=1

`e detta matrice di uno forme della connessione di Koszul (su U , rispetto a ). Con queste
definizioni, si ha (ek ) = ek .
P
Ogni campo vettoriale X su U si scrive localmente come X = l al (/xl ) con al C (U ),
l = 1, . . . , m. Poiche dxj (/xl ) = jl , si ha
!
n X
m
n
X
X
i
(/xl ) (ek ) := (ek )(/xl ) =
kj ei dxj (/xl ) =
ikl ei .
i=1 j=1

i=1

Per X generale, si ha allora


X (ek ) =

al (/xl ) (ek )

m X
n
X

al ikl ei .

l=1 i=1

Non `e difficile rendersi conto del fatto che i coefficienti di Christoffel non individuano dei tensori,
cio`e sezioni del fibrato T M T M T M . Rimandiamo comunque tale questione a 10.6.17.
Vediamo invece un primo legame tra connessione infinitesima e la derivata covariante.
10.4.5 Connessione infinitesima e derivata covariante direzionale. Sia Xp Tp M e
E
(M ; E) una sezione di un fibrato E
M su M . Sia poi : [0, 1] M una curva in
M tale che (0) = p e (0)

= Xp . Sia infine c il trasporto parallelo lungo indotto da una


connessione infinitesima su E. Otteniamo una derivata covariante di lungo il vettore Xp
nel punto p tramite
1
Xp (p) := lim {c1
(h) (((h))) (p)} .
h0 h
In pratica si confrontano i valori di in due punti distinti trasportando il secondo nella stessa
` un esercizio dimostrare che infatti (p) esiste sempre e non dipende da
fibra del primo. E
Xp
ma solamente da p e Xp e dalla connessione . In particolare se Xp = X(p) `e il valore in p di
un campo vettoriale X (M, T M ), allora lassegnazione x 7 X (x) definisce una sezione
liscia del fibrato E, che chiameremo X .
Si lascia come esercizio la verifica del fatto che X ha le propriet`a una derivata covariante
direzionale. Per larbitrariet`a di X, una connessione su un fibrato vettoriale definisce dunque
una derivata covariante . Vedremo pi`
u avanti che in effetti vale anche il discorso inverso.
10.4.6 Derivata covariante, prodotto tensore e duale. Siano E1 ed E2 due fibrati
vettoriali dotati di derivate covarianti i , i = 1, 2. Si ottiene una derivata covariante sul
prodotto tensore dei fibrati ponendo
= 1 id2 + id1 2 ,

10 STRUTTURE GEOMETRICHE

189

dove i := (M, Ei ).
Analogamente si determina la derivata covariante sul duale E di un fibrato vettoriale E. Se
(M, E) e (M, E ) si impone la relazione d(())[] = ( )[] + ( ).
10.4.7 Esercizio. Si dimostri che si ottengono le stesse relazioni utilizzando la connessione
prodotto 10.3.9, la connessione duale 10.3.10 e la relazione in 10.4.5.
10.4.8 Derivata covariante e sollevamento orizzontale. Indichiamo con la derivata
covariante associata alla connessione infinitesima . Sia poi il sollevamento orizzontale in E
di una curva : [0, 1] M , costruito a partire da .
Posto = ([0, 1]) limmagine di in M , supponiamo per semplicit`a che individui una sottovariet`a monodimensionale di M . Per ogni sezione liscia (, E) `e quindi ben definita
la derivata covariante ottenuta per restrizione a di e la conseguente derivata direzionale
lungo i vettori tangenti a . In altre parole `e ben definita la derivata ( ) =: ()((t)).
In particolare essa risulta ben definita su e dalla definizione data in 10.4.3 si ottiene immediatamente = 0.
Questo suggerisce come, viceversa, si puossa costruire una connessione partendo da una
derivata covariante , definendo i sollevamenti orizzontali mediante le soluzioni dellequazione
= 0. Lasciamo come esercizio i dettagli di una tale costruzione. Vogliamo ora approfondire
il legame tra e .
10.4.9 Sezioni e funzioni equivarianti. Allo scopo di determinare una relazione pi`
u esplicita tra derivata covariante e connessione `e conveniente analizzare pi`
u a fondo la corrispondenza
tra il fibrato principale P e il fibrato vettoriale associato E di fibra V . Ricordiamo che quest
ultimo `e costruito a partire dalle classi di equivalenza [p, v] = [Rg p, (g 1 )(v)] dove (g) `e lelemento di Aut(V ) individuato dalla rappresentazione del gruppo di struttura G su V . Sia
(M, E) una sezione liscia. Allora potremo scrivere (x) = [p(x), v(x)], dove p(x) Px
e v(x) V . Ricordando che lazione di G su ogni fibra Px `e libera e transitiva, possiamo
allora associare alla sezione una applicazione : P V , tale che (x) = [p, (p)]. Per
consistenza deve accadere che
[Rg p, (Rg p)] = [p, (p)] = [Rg p, (g 1 )(p)] ,
e quindi Rg = (g 1 ) . Diremo che `e Gequivariante e scriveremo M ap(P, V )G .
Si verifica allora facilmente che lapplicazione
G : (M, E) M ap(P, V )G ,

7 ,

`e un isomorfismo di Kspazi vettoriali.


10.4.10 Forme tensoriali. Pi`
u in generale questa corrispondenza si estende dalle sezioni
allo spazio delle forme tensoriali k (M, E), le kforme a valore nel fibrato. Se i Tx M ,
i = 1, . . . , k, allora sian i i rispettivi sollevamenti orizzontali. Allora, per ogni k (M, E)
si ottiene una unica forma orizzontale G () k (P, V ) equivariante tale che
(1 , . . . , k ) = [p, G ()(1 , . . . , k )] ,

10 STRUTTURE GEOMETRICHE

190

dove orizzontale significa i G () = 0 per ogni campo verticale . Naturalmente G () deve


essere Gequivariante (par.10.4.9) affinche la mappa sia ben definita. In particolare `e un
isomorfismo. Scriveremo G : k (M, E) G
H (P, V ).
Questo ci permette di estendere la connessione di Koszul alle forme tensoriali
: k (M, E) k+1 (M, E) .
Localmente k (U, E) sar`a generato da forme del tipo = dove (U, E) e k (M ),
cosicche
= d + (1)k .
10.4.11 Derivata covariante e connessione infinitesima. Vogliamo ora determinare
una corrispondenza esplicita tra la derivata covariante e la connessione infinitesima sul fibrato
principale.
Utilizziamo la mappa G per calcolare il limite in 10.4.3. Posto che y P tale che (y) = p M
sia il sollevamento orizzontale di in P, passante per y. Allora avremo che (p) = [y, (y)]
1

e ((h)) = [
(h), (
(h))]. Infine cE
(h))], sicche
(h) (((h))) = [y, (
1
1
(p) = lim {cE
(h) (((h))) (p)}
h0 h
1
= lim {[y, (
(h))] [y, (y)]}
h0 h
= [y, d (p)[ H ]] ,
dove H `e il sollevamento orizzontale di H in P. Dunque possiamo scrivere G = H .
Ora osserviamo che la rappresentazione di G su V induce una rappresentazione di Lie(G) su
V , ottenuta differenziando nellidentit`a di G. La relazione di Gequivarianza per assume
allora la forma a + (a) = 0, dove a `e il campo verticale generato dallelemento
a Lie(G). Utilizzando questa relazione otteniamo d ( H ) = (d + ()) () e quindi
G = (d + ()) () .
Questa formula rappresenta la relazione cercata ed ha una semplice interpretazione: `e in
pratica la componente lungo la fibra del campo vettoriale. Per garantire la covarianza della
derivata occorre correggere il differenziale tramite la trasformazione infinitesima associata allo
spostamento infinitesimo degli spazi vettoriali da confrontare. Tale trasformazione `e descritta
dallelemento dellalgebra, che agisce sulla fibra tramite la rappresentazione .
Viceversa tale formula permette di definire e calcolare in modo pratico la derivata covariante
su un fibrato vettoriale. Infatti si noti che
d + () : 0H (P, V ) 1H (P, V ) .
Un ragionamento analogo, pi`
u semplice, pu`o essere fatto per trovare il legame tra la
connessione infinitesima E su E e la derivata covariante. Lo lasciamo come esercizio.

10 STRUTTURE GEOMETRICHE

10.5

191

Curvature

Una volta definita una connessione su un fibrato, `e naturale introdurre il concetto di curvatura.
Infatti la connessione individua in ogni punto dello spazio totale E una separazione T E '
T F H . La scelta di H definisce una distribuzione differenziabile (si veda 10.3.3). Ci si pu`o
chiedere allora se tale distribuzione sia integrabile, cio`e se essenzialmente sia possibile costruire
il sollevamento orizzontale dellintera variet`a M in E. In altre parole ci`o accade se per ogni
E esiste unimmersione regolare di i : M , E, tale che i T M H, vale a dire che in
ogni punto i vettori tangenti allimmagine dellimmersione sono orizzontali e che appartenga
allimmagine di i. Questo implica che le parentesi di Lie tra due campi orizzontali debbano
dare sempre un campo orizzontale (verificare). Nel linguaggio di 10.3.3 ci`o significa che H
`e una distribuzione involutiva e che M H () := i(M ) `e una variet`a integrale per H, passante
per . Ricordiamo che essa si dice massimale se non esistono superfici integrali per H che la
contengano propriamente. Enunciamo senza dimostrarlo il seguente importante risultato.
10.5.1 Teorema di Frobenius. Sia H una distribuzione differenziabile involutiva su E.
Allora, per ogni E esiste una unica variet`a integrale massimale M H () di H.
A commento di questo teorema osserviamo il suo significato intuitivo: se `e un vettore
orizzontale in i(x), allora la sua curva integrale in E deve giacere nellimmagine di i e tutti
i suoi vettori tangenti devono essere orizzontali. Questo deve essere vero per ogni vettore
orizzontale di un intorno di x. Dunque la propriet`a appena vista deve essere vera per il flusso
locale. Dato che il flusso locale determina la derivata di Lie e a sua volta le parentesi di Lie,
si vede che la involutivit`a `e una condizione necessaria. Non `e molto difficile vedere che `e anche
localmente sufficiente.
10.5.2 Forma di curvatura. Linvolutivit`a di H `e dunque una condizione necessaria e
sufficiente per la sua integrabilit`a. Siano X e Y due campi orizzontali secondo la connessione
infinitesima su E. Chiaramente [X, Y ] `e orizzontale se e solo se ([X, Y ]) = 0. Perci`o la
quantit`a ([X, Y ]) determina lostruzione allintegrabilit`a di H.
Ovviamente la decomposizione Tp E ' Tp F Hp definisce un proiettore
H : Tp E Hp ,
per ogni p E che indicheremo con XpH = H (Xp ) per ogni Xp Tp E.
Data una pforma p (E), si chiama parte orizzontale di la pforma H definita da
H
H(1 , . . . , p ) := (H
1 , . . . , p ) per ogni pupla di campi vettoriali su E, i X (E).
Si chiama forma di curvatura la due forma E := H(d) 2 (M, E). Cio`e per ogni coppia
X, Y X (E) si ha
E (X, Y ) = d(X H , Y H ) ,
dove, come sopra, X H e Y H sono le parti orizzontali dei campi X e Y . Utilizzando la formula
di Cartan si trova
E (X, Y ) = X H ((Y H )) Y H ((X H )) ([X H , Y H ]) = ([H , H ]) ,

10 STRUTTURE GEOMETRICHE

192

cio`e la curvatura misura proprio lostruzione allintegrabilit`a di H. Esattamente come in


precedenza in generale `e sufficiente considerare la curvatura sul fibrato principale.
10.5.3 Proposizione. Equazione di struttura. Sia : P M un fibrato principale con
gruppo di struttura G, dotato di una G-connessione infinitesima . La connessione infinitesima
sul fibrato principale P e la relativa curvatura soddifano lequazione
1
= d + [, ] .
2
Dimostrazione. Sia X un campo verticale associato allelemento A dellalgebra Lie(G).
Allora (X) = A. Inoltre, se g = exp(tA), la Gequivarianza di pu`o essere scritta nella
forma infinitesima LX + [A, ] = 0. Usiamo questa relazione per dimostrare dapprima che,
:= d + 1 [, ] `e orizzontale. Infatti
come , anche
2
1
iX (d + [, ]) = LX d iX () + [A, ] = 0 ,
2
per la suddetta relazione e poiche diX () = dA = 0.
su una coppia di vettori orizzontali Yp e Zp , per vedere che coincide con
Basta allora valutare
.
2
Un corollario immediato `e il seguente risultato, di cui si lascia la dimostrazione come esercizio.
10.5.4 Proposizione. Identit`
a di Bianchi. La forma di curvatura sul fibrato principale
P dotato di una G-connessione soddisfa le seguenti identit`a:
d = [, ] ,

ovvero Hd = 0 .

10.5.5 Tensore di curvatura. Sia E il fibrato vettoriale associato a P tramite la rappresentazione (, F ). Supponiamo di dotare P di una G-connessione infinitesima . Sia poi la
forma di curvatura associata alla connessione su P. Dunque `e una due forma orizzontale
su P a valori in Lie(G), che soddisfa Rg = Adg1 . Siano X, Y Tp P e = [p, v] E(p) un
vettore della fibra in x. Allora `e ben definita lapplicazione lineare
T X,Y : Ex Ex ,

[p, v] 7 [p, ((X, Y ))(v)] ,

endomorfismo della fibra Ex ,dove `e la rappresentazione di Lie(G) su V indotta da . Si noti


in particolare che, dati X, Y X (P) la mappa
AX,Y (v) : P V ;

p 7 ((X, Y ))(v) ,

`e equivariante. Ci`o permette, tramite lisomorfismo G , di definire sulla base M del fibrato
una due forma a valori in End(E) che, ad ogni sezione (M, E) e per ogni coppia di
campi , X (M ), associ la sezione

))(
(, )(x) = [p, ((,

(p))] ,

10 STRUTTURE GEOMETRICHE

193

dove e sono i sollevamenti orizzontali di e in P nel punto p su x. Evidentemente


(, ) (M, E). La forma si chiama tensore di curvatura e definisce una sezione di
(T M T M ) (E E).
10.5.6 Proposizione. Il tensore di curvatura `e legato alloperatore di derivazione
covariante dalla relazione
(, ) = [ , ] [,] ,
in cui le parentesi tra le derivate covarianti sono il commutatore, mentre quelle tra i campi sono
le parentesi di Lie
Dimostrazione. Anzitutto abbiamo24
]
[,
]
]
G ([ , ] [,] ) =

] = [,
[]
,
,
dove abbiamo usato il fatto che i campi verticali sono un ideale nellalgebra dei campi. Posto
]
Z := [,
X (E) abbiamo perci`o che
G ([ , ] [,] ) = Z V = iZ V d = LZ V ,
dove Z V `e la parte verticale di Z. Ma la Ginvarianza di , se A Lie(G) `e il generatore di
Z V , in forma infinitesima si scrive LZ V ( ) =
(A) . Poiche infine A = (Z V ), otteniamo

]))
G ([ , ] [,] ) = (([,

= G ( (, )) ,

che implica la tesi, essendo G un isomorfismo.

10.5.7 Proposizione. Il tensore di curvatura `e legato alla derivata covariante dalla relazione
= 2 .
Dimostrazione. Basta mostrare che per ogni coppia di campi , X (M ) e sezione
(M, E) si ha i i 2 = [ , ] [,] . Poiche 1 (M, E), localmente esisteranno
delle 1forme k e delle sezioni j di E tali che = j j . Allora
= dj j j j .
Basta allora applicarlo a (, ) utilizzando la formula di Cartan per dj (, ) e confrontare con
il calolo diretto di [ , ] [,] . I dettagli sono lasciati come esercizio.
2

10.6

Strutture Riemanniane

10.6.1 Esempio: fibrato tangente. Un esempio particolarmente interessante `e quello del


fibrato tangente. In tal caso il fibrato principale `e il fibrato dei riferimenti R e il gruppo
di struttura `e GL(n, R), essendo n la dimensione della base M . Un riferimento in x M
24

ovunque adoperando il tilde per indicare il sollevamento orizzontale

10 STRUTTURE GEOMETRICHE

194

`e individuato da n vettori {v1 , . . . , vn } linearmente indipendenti in Tx M . Su di essa M ij


GL(n, R) agisce come {vj } 7 {vi M ij }. Se x sono delle coordinate locali su M allora vj = vj x
e {x , vj } sono coordinate locali per R (che `e infatti una variet`a (n2 + n)dimensionale).
Assumiamo infine che su R sia data una connessione . Infine, data lovvia azione di GL(n, R)
e della sua algebra di Lie su Rn , indicheremo semplicemente con gX e AX tali azioni, dove
g GL(n, R), A gl(n, R) e X Rn .
10.6.2 Campo orizzontale canonico e forma orizzontale canonica. Un riferimento
pu`o essere visto come una mappa lineare bijettiva v : Rn Tx M , che associa il vettore vi

allelemento ei della base canonica di Rn . Se R M `e il fibrato dei riferimenti, dotato di una


connessione infinitesima , per ogni X Rn si definisce il campo orizzontale canonico C(X),
tale che se p R allora C(X)p Tp R `e lunico vettore orizzontale che soddisfa C(X)p = v(X).
Si chiama forma orizzontale canonica il suo duale = v 1 . Si ha evidentemente
(C(X)) = X.
Si noti che il campo orizzontale canonico non `e in realt`a canonico su un fibrato dei riferimenti,
ma piuttosto sul fibrato dei riferimenti con una connessione. La forma canonica invece `e veramente canonica, nel senso che non richiede una specificazione di una connessione per essere

definita. Sia infatti R M un fibrato dei riferimenti e sia Tp R, p R. Allora p individua un riferimento in Tx M , x = (p), che definisce un isomorfismo v : Rn Tx M . Pertanto
si pu`o definire () = v 1 . Si tratta evidentemente di una forma orizzontale, dato che si
annulla sui vettori verticali.
10.6.3 Forma di torsione.
definita da

Si chiama forma di torsione la 2forma su R a valori in Rn


T := Hd ,

dove ricordiamo che Hd indica la parte orizzontale di d, cio`e, se X, Y T R allora


Hd(X, Y ) = d(X H , Y H ) .
Come si verifica facilmente si tratta di una forma orizzontale equivariante e quindi vi corrisponde
un tensore di curvatura T tale che G (T ) = T che risulta essere una sezione di (T M T M )
T M . In maniera del tutto analoga a 10.5.7 si dimostra la seguente proposizione.
10.6.4 Proposizione. Il tensore di torsione soddisfa la relazione
T (, ) = [, ] ,

( X (M ))

per ogni coppia di campi , X (M ).


10.6.5 Proposizione. I equazione di struttura. La forma di torsione soddisfa lequazione
T = (d + ), dove `e la connessione su R.
Dimostrazione. Prima di tutto vediamo che, come T , (d + ) `e orizzontale. Infatti, se (A)
`e il campo fondamentale associato ad A gl(n, R), si ha
i(A) (d + ) = L(A) d(i(A) ) + (i(A) ) i(A) = L(A) + A = 0 ,

10 STRUTTURE GEOMETRICHE

195

dove abbiamo usato il fatto che `e orizzontale e, nellultimo passaggio, lequivarianza di .


Dopodiche per verificare luguaglianza basta applicare entrambi i membri ad una coppia di
vettori orizzontali.
2
Nota. Lequazione di struttura che coinvolge la curvatura viene anche detta II equazione di
struttura. Differenziando la prima equazione di struttura si ottiene inoltre la seguente identit`a.
10.6.6 I identit`
a di Bianchi. Vale
dT + T = .
Lidentit`a di Bianchi che coinvolge d in 10.5.4 si chiama anche II identit`a di Bianchi.
10.6.7 Connessione metrica e di Levi-Civita. Si dice che su M `e definita una struttura
Riemanniana se `e assegnata una sezione g (M, T M T M ) simmetrica e definita positiva.
In particolare per ogni x M , g(x) Tx M Tx M `e un prodotto scalare su Tx M . Scelta una
base per Tx M , g(x) sar`a individuato da una matrice simmetrica con autovalori tutti positivi.
Si dice che la struttura `e pseudo-Riemanniana se g `e simmetrica e non degenere. Si chiama
segnatura s la differenza tra il numero di autovalori positivi e il numero di autovalori negativi.
Si dice che la struttura `e Lorentziana se |s| = n 2, essendo n la dimensione di M . Mentre
`e sempre possibile assegnare una struttura Riemanniana ad una variet`a liscia, ci`o non `e vero
in generale per le strutture pseudo-Riemanniane. In senso improprio g viene chiamata metrica
anche nel caso pseudo-Riemanniano.
Sia una connessione sul fibrato principale R. Si dice che `e una connessione metrica se g `e
parallela, cio`e se
g = 0 .
Dato che per ogni X, Y, Z X (M ) si ha (si veda 10.4.6)
iZ d(g(X, Y )) = (Z g)(X, Y ) + g(Z X, Y ) + g(X, Z Y ) ,
la condizione di metricit`a equivale a
Z g(X, Y ) = g(Z X, Y ) + g(X, Z Y ) ,

X, Y, Z X (M ) .

` per`o
La metricit`a della connessione non determina univocamente la connessione stessa. E
fatto ben noto che la connessione `e univocamente determinata se oltre alla metricit`a si richiede
lannullamento della torsione. In tal caso la connessione `e detta di Levi Civita. Vale il
seguente importante teorema.
10.6.8 Teorema. Sia (M, g) una variet`a pseudo-Riemanniana. Allora esiste una unica
derivata covariante LC tale che LC g = 0 e T =0.
Dimostrazione. Dati i campi X, Y, Z X (M ), usiamo ripetutamente le relazioni
Z g(X, Y ) = g(Z X, Y ) + g(X, Z Y ) , metricit`a della connessione
Z X X Z = [Z, X] , torsione nulla

10 STRUTTURE GEOMETRICHE

196

con le varie permutazioni degli indici:


Zg(X, Y ) = g(Z X, Y ) + g(X, Z Y )
= g(X Z, Y ) + g(X, Y Z) + g([Z, X], Y ) + g(X, [Z, Y ])
= Xg(Z, Y ) g(Z, X Y ) + Y g(X, Z) g(Y X, Z) + g([Z, X], Y ) + g(X, [Z, Y ])
= 2g(Z, X Y ) + Xg(Z, Y ) + Y g(X, Z) g([Y, X], Z) + g([Z, X], Y ) + g(X, [Z, Y ]) ,
da cui
2g(Z, X Y ) = Xg(Z, Y ) + Y g(X, Z) g([Y, X], Z) + g([Z, X], Y ) + g(X, [Z, Y ]) Z g(X, Y ) .
Poiche questa uguaglianza vale per ogni scelta dei campi e dato che g `e nondegenere, X Y e
quindi sono univocamente determinate da questa espressione.
2
Lasciamo invece come esercizio la verifica del fatto che una connessione `e metrica se e
soltanto se `e una connessione sul fibrato O dei riferimenti ortonormali.
10.6.9 Tensore di Riemann, di Ricci e curvatura scalare. Abbiamo definito il tensore
di curvatura come una due forma a valori in End(E). Nel nostro caso E = T M . Si chiama
campo tensoriale di Riemann R, o semplicemente Tensore di Riemann, il campo tensoriale
covariante di grado 4 definito da
R(X, Y, W, Z) := g( (W, Z)Y, X) ,

X, Y, W, Z X (M ) .

Sia {ei }ni=1 una base ortonormale per T U , U essendo un aperto di una carta locale per M
(dunque con M banalizzabile). Si definisce allora il tensore di Ricci S come il tensore covariante
di grado due
S(X, Y ) := R(ei , X, ej , Y ) ij ,
X, Y X (M ) .
` facile verificare che S non dipende dalla scelta
Qui `e lusuale metrica (pseudo)euclidea. E
della base ortonormale.
Infine si definisce lo scalare di curvatura Ric tramite
Ric := S(ei , ej ) ij .
Di nuovo si verifica lindipendenza dalla scelta della base.
Si chiama tensore di Einstein G la particolare combinazione
G := S

Ric
g.
2

10.6.10 Nota. Soprattutto in fisica `e duso indicare le componenti del tensore di Riemann
rispetto ad un sistema di coordinate con R , quelle del tensore di Ricci con R e lo scalare
di curvatura con R.
10.6.11 Simmetrie dei tensori di curvatura e curvatura sezionale. Il tensore di
Riemann gode delle tre seguenti propriet`a di simmetria, di cui lasciamo al lettore i dettagli
della deduzione

10 STRUTTURE GEOMETRICHE

197

R(X, Y, W, Z) = R(X, Y, Z, W ), che segue dal fatto che ovviamente (W, Z) =


(Z, W );
R(X, Y, W, Z) = R(Y, X, W, Z). Questa `e invece conseguenza del fatto che la connessione `e metrica. Uno dei modi per verificarlo `e infatti osservando che se la connessione `e
metrica, essa `e definita su O e quindi la curvatura ha valori in nellalgebra di Lie del
gruppo ortogonale, che si identifica con le matrici Mi j che soddisfano Mij = Mji , dove
Mij := Mi k kj . Dopodiche basta sfruttare i legami tra ed e tra ed R;
R(X, Y, W, Z) + R(X, W, Z, Y ) + R(X, Z, Y, W ) = 0. Questa `e conseguenza della torsione
nulla. Essa segue dalla I identit`a di Bianchi, con T = 0, in modo analogo al punto
precedente.
Si dimostra facilmente che da queste tre propriet`a ne segue una quarta:
R(X, Y, W, Z) = R(W, Z, X, Y ) .
Sia ora x un piano bidimensionale in Tx M . Sia poi e1 , e2 Tx P una base ortonormale per
x . Si chiama curvatura sezionale relativa al piano x il numero reale
(x ) = R(e1 , e2 , e1 , e2 ) .
` un semplice esercizio verificare che (x ) non dipende dalla scelta della base ortonorE
male. Limportanza della curvatura sezionale `e dovuta alle due seguenti proposizioni, la cui
dimostrazione `e lasciata come esercizio.
10.6.12 Proposizione. Sia T un tensore covariante di grado 4 che gode delle stesse propriet`a
di simmetria del tensore di Riemann. Se
T(X, Y, X, Y ) = R(X, Y, X, Y )

X, Y Tx M, x M ,

allora T = R.
10.6.13 Proposizione. Se X e Y sono due vettori che formano una base per x , allora
(x ) =

R(X, Y, X, Y )
.
g(X, X)g(Y, Y ) g(X, Y )2

10.6.14 Osservazioni pratiche. Per rendere operativa la teoria sviluppata, almeno nel caso
del fibrato tangente (il caso generale sar`a considerato nel prossimo capitolo) consideriamo le cose
da un punto di vista fisico. Per misurare ad esempio i vettori velocit`a in ogni punto della variet`a
`e necessario introdurre in ciascun punto un sistema di riferimento, in modo che il passaggio da
un sistema allaltro sia differenziabile. Dal punto di vista matematico ci`o significa considerare
una sezione locale : U R. In generale una tale sezione non esister`a globalmente, a meno
che T M sia banalizzabile. Definiamo allora la 1forma locale e 1 (U ) tramite e := (),

10 STRUTTURE GEOMETRICHE

198

essendo la forma orizzontale canonica definita in 10.6.2. Allora, se X (U ) e x U ,


poiche = idM si ha
e ()x = ()() = v 1 d( (x )) = v 1 () ,
dove vx : Rn Tx M `e la mappa indotta dal riferimento vx = veps (x) (e che chiamiamo con
lo stesso nome). In pratica dunque, scelte delle coordinate locali x su U , potremo scrivere
ei = ei (x)dx e = (x) x , cosicche e ()i = ei (x) . In altre parole x = ei vi , cio`e ei
sono le componenti di x rispetto al riferimento {vi }.
In particolare se su M `e definito un campo tensoriale metrico g (M, T M S T M ), allora



g := g
= ei ej g(vi , vj ) .
,
x x
Si dice che il riferimento locale `e ortonormale se g(vi , vj ) = ij , la metrica di Minkowski su Rn .
La 1forma locale e viene allora detta vielbein.
Considerando la I equazione di struttura si ha
de = d () = (d) = ( + T ) .
Posto := (), lespressione locale della connessione infinitesima, abbiamo perci`o de +
e = (T ). Lasciamo come esercizio la dimostrazione della seguente semplice proposizione.
10.6.15 Proposizione. Si ha (T ) = v 1 (T ), dove T `e il tensore di torsione.
In altre parole possiamo scrivere25 dei + i j ej = T i , dove T i = ei T .
10.6.16 Osservazioni. Questa formula, valida localmente, risulta essere estremamente pratica
nelle applicazioni concrete. Si consideri ad esempio di aver a che fare con una variet`a pseudoeuclidea {M, g} e si supponga di voler determinare la connessione di Levi-Civita. Allora dovr`a
anzitutto essere T = 0. Daltra parte la condizione di metricit`a g = 0 (par. 10.6.7) assume
la forma ik k j + kj k i = 0 in termini di un determinato vielbein ei (verificare!). Ci`o significa
semplicemente che ha valori nellalgebra delle isometrie della metrica piatta . Posto ij :=
ik k j , possiamo allora scrivere le equazioni per la connessione nella forma
dei + i j ej = 0 ,

ij = ji .

Poiche si tratta di n(n 1)/2 equazioni lineari indipendenti per altrettante incognite (le ij ),
la connessione risulta essere completamente determinata in funzione del vielbein.
Si pu`o determinare una formula altrettanto pratica per il calcolo del tensore di curvatura.
Infatti, similmente a prima, dalla II equazione di struttura e tenendo conto del fatto che nel
caso del fibrato dei riferimenti si ha evidentemente 12 [, ] = , si ricava immediatamente
d + = () .
25

omettiamo il pedice relativo alla carta locale per evitare confusione con il pedice referentesi alla
componente esima nelle coordinate locali

10 STRUTTURE GEOMETRICHE

199

Similmente a prima si ottiene allora che in componenti, rispetto ad una scelta delle coordinate locali, si ha (si veda 10.6.21) ()i j = ei ej 12 R dx dx , dove ei sono le
componenti di vi rispetto alla base coordinata (ovvero `e linversa della matrice di coefficienti
ei ). Queste formule forniscono un metodo relativamente rapido per il calcolo del tensore di
curvatura. Ribadiamo per`o il fatto che la loro origine `e nelle equazioni di struttura che sono
equazioni sul fibrato principale, mentre i tensori di curvatura e di torsione sono sulla variet`a M .

10.6.17 Cambio di carta. Vogliamo confrontare le espressioni locali di una data connessione
infinitesima rispetto a due riferimenti locali sulla stessa carta. Siano = {vi } e = {
vj } due
sezioni locali rispetto alle quali la connessione infinitesima ammette le espressioni locali
= . Sia X . Usando il linguaggio in 10.4.9, potremo scrivere, sulla data

= e
carta locale,
(x) = [vi (x), i (x)] = [
vi (x), i (x)] ,
e similmente
(x)i j (x)] ,
(x) = [vi (x), d i (x) +
(x)i j j (x)] = [
vi (x), di (x) +
j
essendo x appartenente allintorno locale U considerato. Daltra parte deve esistere una funzione
continua h : U G tale che = Rg , dove G = GL(n, R) (oppure un gruppo ortogonale
se ci si restringe a riferimenti ortonormali) in modo che vi (x) = vj (x)hj i (x) per ogni x U .
Dallequivarianza di d + e dalle relazioni appena scritte segue allora
(x) = h1 (x)(x)h(x) + h1 (x)dh(x) .

Questa relazione `e il caso particolare di una propriet`a molto generale che verr`a considerata nel
capitolo successivo.

10.6.18 Ancora sui simboli di Christoffel. Ulteriori espressioni pratiche le otteniamo in


base alle seguenti osservazioni. Se anziche scegliere una base ortonormale si decide di utilizzare la base coordinata, allora la forma locale e avr`a componenti26 e = . In tal caso le
componenti delespressione locale di vengono tradizionalmente indicate con la lettera :
= dx

e la I equazione di struttura assume la forma dx dx = T = 21 T


dx dx ovvero

T
= .

In particolare nel caso di torsione nulla i coefficienti sono simmetrici nei due indici e .
La matrice di componenti ei rappresenta la matrice h di trasformazione tra la base vi e la base
coordinata: x = vi ei , perci`o si trova
ij ei ,
dx = ej dej + ej
26

conviene in tal caso usare la lettera greca anche per lindice relativo alla base v =

10 STRUTTURE GEOMETRICHE

200

Si noti che in particolare si ha x = x , dove := dx . Se allora X (M ) in


coordinate locali avremo = x e quindi
= (d + )

.
x

La condizione di metricit`a permette allora di determinare i coefficienti in funzione della


metrica e del tensore di torsione. Nel caso di torsione nulla e connessione metrica, si ottiene la
ben nota espressione


1 g g g

.
g =
2 x
x
x
Osserviamo inoltre che per una base coordinata si ha [x , x ] = 0 e quindi posto (si veda
10.6.9)
( , )( ) = R ,
usando 10.5.6 e le propriet`a di , si ottiene
R = ( ) ( ) = + ( ) ( ) ,
da cui
R = + .
10.6.19 Nota. Nellintorno di un punto O si possono scegliere delle coordinate locali, dette
coordinate normali, per le quali g (O) = , la metrica di Minkowski o euclidea, e (O) = 0.
Si pu`o verificare allora che (si veda 11.4.4)
1
g (x) = + R (O)x x + O(|x |3 ) .
3
Questo risultato mostra come la curvatura individui la deformazione rispetto alla geometria
euclidea.
10.6.20 Esercizio. Si usi la suddetta espressione approssimata, in coordinate normali, per la
metrica in un intorno U nel quale le correzioni di ordine superiore al secondo siano trascurabili,
per calcolare i simboli di Christoffel nel dato intorno. Si calcoli il trasporo infinitesimo di un
vettore tangente in O lungo un cammino rettangolare chiuso tutto contenuto in O. Si dimostri
che, se il parallelogramma `e generato dai vettori y e z e se v `e il vettore da trasportare,
allora si ottiene per il vettore trasportato
1
v = R v ,
2
dove si `e posto = y z z y .
Poiche nel punto dato la metrica `e (pseudo-)euclidea le componenti del tensore di Riemann
possono essere identificate con quelle della forma di curvatura (in pratica le componenti del

10 STRUTTURE GEOMETRICHE

201

vielbein sono ei = i ) e quindi questo esercizio mette in evidenza uninteressante propriet`a


geometrica del tensore di curvatura, che permette di interpretare lazione di visto come
operatore lineare sullo spazio tangente. Esso individua la rotazione subita dal vettore quando
viene trasportato lungo il cammino chiuso.
10.6.21 Esercizio. Si dimostri che, posto (nelle notazioni di 10.6.16)
1 i k
jkl e el = d i j + i k k j ,
2
si ottiene
R = ei ej i jkl ek el ,
dove si ricordi che ei indica la matrice inversa della ei .
10.6.22 Un esempio fisico. Il sistema di riferimento ruotante. Sebbene rimandiamo
al capitolo successivo le applicazioni (e le motivazioni) fisiche, vediamo qui un esempio particolarmente interessante che mette in evidenza alcuni degli aspetti finora considerati. Vogliamo
cio`e considerare, nellambito della relativit`a, il confronto tra due osservatori O e O , il primo
inerziale ed il secondo che ruota uniformemente con velocit`a angolare rispetto al primo. Nasce
anzitutto il problema di definire esattamente ci`o che si intende.
Per quanto riguarda losservatore inerziale O, sappiamo che egli `e in grado di costruire globalmente un sistema di riferimento inerziale, disponendo ovunque di orologi che sincronizzer`a
lanciando e ricevendo raggi luminosi, secondo la ben nota procedura che non andremo qui
dunque a ripetere. Chiamiamo perci`o K il sistema di riferimento inerziale di cui O rappresenta
lorigine.
La situazione diventa un p`o pi`
u complicata per losservatore O . Supponiamo che possieda
degli orologi del tutto identici a quelli di O. Li disporr`a ovunque in modo che gli appaiano
sempre immobili. Esattamente come fa O, anche O vuol utilizzare il proprio orologio per
individuare la coordinata temporale degli eventi contemporanei. Deve dunque sincronizzare gli
orologi. Anzitutto, il suo orologio pu`o essere sincronizzato a quello di O, poiche sono in ogni
istante spazialmente coincidenti. Per sincronizzare gli orologi restanti egli pu`o usare lo stesso
metodo di O, mandando raggi luminosi che gli vengono poi riflessi da ciascun orologio. Benche
il raggio luminoso non percorrer`a (secondo O ) un cammino rettilineo da O allorologio P ,
n`e si muover`a alla velocit`a c, un semplice argomento di simmetria (che lasciamo svolgere come
esercizio) mostra che i tempi di andata e di ritorno del raggio luminoso devono coincidere. Egli
direbbe allora che lorologio P `e sincronizzato con il proprio se nel momento in cui riceve il
segnale, P indica lora tp = (t1 t0 )/2 se t0 `e lora segnata da O nel momento in cui lancia il
segnale e t1 `e listante in cui O riceve il segnale di risposta.
Tuttavia tale procedura non `e ancora sufficente. La sua costruzione richiede infatti che lorologio di P cammini alla stessa frequenza del suo. Ma pur essendo identici per costruzione, una
volta posto nella sua posizione P indicher`a il suo tempo proprio. Dal punto di vista di O, P
si muove p
lungo un orbita circolare di raggio r alla velocit`a r. Il suo tempo proprio `e perci`o
u lentamente di O e quindi di O . Se O a un
= 0 + 1 2 r2 /c2 t, cosicche P cammina pi`
dato istante pensa di aver sincronizzato il suo orologio con P , dopo un po si accorge che si

10 STRUTTURE GEOMETRICHE

202

desincronizzano.
Per assegnare una coordinata temporale sincrona a P , O `e perci`o costretto a fornire P di un
orologio diverso da O , costruito in modo che una volta posto in P appaia camminare alla
stessa frequenza di O.27 Assegnata tale coordinata temporale a P , `e evidente che le coodinate
temporali costruite da O e O sono legate dalla relazione t(P ) = t (P ). Due eventi sono contemporanei per O se e soltanto se lo sono anche per O !
Dato che O e O concordano sulla contemporaneit`a, concordano anche sulle misure di lunghezza gicche misurare la lunghezza di un segmento equivale a registrarne la posizione simultanea
degli estremi. Se quindi i due osservatori dispongono di due regoli identici, essi appariranno
entrambi di pari lunghezza ad ognuno dei due osservatori indipendentemente dalla posizione e
dallorientamento dei regoli (ciascuno fermo nel proprio sistema di riferimento).
In conclusione dunque O con il suo regolo pu`o costruire un sistema di coordinate spaziali
cilindriche (r , , z ) che saranno legate alle coordinate cilindriche di O dalla relazione28

t = t ,

r = r ,
= t ,

z = z .
La metrica. La metrica minkowskiana nelle coordinate ruotanti assume la forma


2 r2 2 2
2
c dt dr2 2r2 d dt r2 d2 dz2 .
ds = 1 2
c
Come esercizio verifichiamolo nei dettagli. Le coordinate cartesiane inerziali sono per definizione
coordinate (t, x, y, z) per le quali
ds2 = c2 dt2 dx2 dy 2 dz 2 .
Prima di tutto introduciamo delle coordinate cilindriche (t, r, , z) tali che x = r cos e y =
r sin . Differenziando si ha
dx = cos dr r sin d ,

dy = sin dr + r cos d

e ricordando che, ad esempio, dx2 := dx dx, si ha


dx2 + dy 2 = (cos2 dr2 + r2 sin2 d2 2r cos sin dr d)
+(sin2 dr2 + r2 cos2 d2 + 2r cos sin dr d)
= dr2 + r2 d2 ,
e quindi la metrica di Minkowski assume la forma
ds2 = c2 dt2 dr2 r2 d2 dz 2 .
27

Equivalentemente O potrebbe mandare a P un impulso al secondo, dicendogli di usare quegli impulsi come
orologio, identificando il primo impulso con tP = (t0 + t1 )/2. In altre parole O usa esclusivamente il proprio
orologio per attribuire la coordinata temporale agli eventi.
28
lasciamo come esercizio i dettagli della deduzione

10 STRUTTURE GEOMETRICHE

203

Per esprimerla in termini delle coordinate ruotranti occorre invertire la trasformazione di


coordinate che lega le coordinate cilindriche a quelle ruotanti:

t = t ,

r = r ,
= + t ,

z = z ,
dopodiche, differenziando

dt = dt ,
dr = dr ,
d = d + dt ,

dz = dz ,
e sostituendo nella metrica di Minkowski, si ottiene
ds2 = c2 dt2 dr2 r2 d2 dz 2
= c2 dt2 dr2 (d + dt )2 dz2 ,
che coincide con la tesi.
Come si vede le coordinate di O sono limitate alla regione r < c/. Si noti che il tempo proprio
p di un orologio di posizione spaziale fissa rispetto ad O fornito dalla metrica `e
d = 1 r2 2 /c2 dt , coincidente con la relazione dedotta da O utilizzando la dilatazione
relativistica. Mentre O interpreta il rallentamento dellorologio P come un effetto cinematico,
O lo vede come conseguenza del campo gravitazionale individuato dal potenziale V = gctt2 1
(che in pratica rappresenta il potenziale centrifugo). Ci`o che `e fondamentale non `e decidere
quale sia la giusta interpretazione, ma piuttosto che entrambi arrivino alla stessa conclusione:
gli orologi rallentano! Questa `e unespressione del principio di equivalenza.
Base ortonormale, connessione di spin e connessione di Levi-Civita.
Una possibile tetrade associata alla metrica `e data dalle 1forme (e0 , e1 , e2 , e3 ) dove
e0 = cdt = cdt ,

e1 = dr = dr ,

e2 = rd = r (d + dt ) ,

e3 = dz = dz .

Questa tetrade individua in ogni punto dello spazio-tempo un sistema di riferimento ortonormale
fisso rispetto a quello di O. Si rammenti che non si tratta di un sistema di coordinate ma di
un riferimento per lo spazio tangente nel punto dato. La connessione di spin riemanniana `e
determinata dalle equazioni
dei = i j ej ,
Si trova immediatamente che gli unici termini non

0 0
0
e2
0 0
r
=
0 e2 0
r
0 0
0

ij = ji .
nulli sono 1 2 = 2 1 =

0
0
.
0
0

e2
r

o anche

10 STRUTTURE GEOMETRICHE

204

Utilizzando le relazioni in 10.6.14 si ottiene per i simboli di Christoffel nelle coordinate di O 29


sono date dalle 1forme := dx , dove x0 = t , x1 = r , x2 = , x3 = z e

0
0
0
0
2 r dt r d
0
r d r dt 0
.
=

1
1

dr
dt + r d
dr
0
r
r
r
0
0
0
0
Mentre sappiamo quale sia il significato geometrico di , `e interessante studiarne linterpretazione fisica. Supponiamo che O osservi il punto P di coordinate (ct , r , , z ), fisso nel suo
riferimento. Le componenti della quadrivelocit`a di P calcolata rispetto al tempo misurato dal
proprio orologio sono u = (1, 0, 0, 0) in ogni istante. Tuttavia per confrontare u (t + t ) con
u (t ) egli deve portarlo in tale punto tramite . Lo spostamento infinitesimo `e rappresentato
dal vettore := t t sicche
u (t + t ) 7 u (t + t ) + () u (t + t )
ed essendo

0
2 r t
() =

0
0

0
0
0
r t

dt
0
r
0
0

0
0
,
0
0

ovvero u = (0, 2 r t , 0, 0). Il punto P appare dunque soggetto ad una accelerazione radiale
2 r , laccelerazione centrifuga, che O potrebbe interpretare come un campo di forze gravitazionali. Se in P vi fosse situata una masserella m, essa dovrebbe perci`o essere trattenuta da
P con una forza mur / , essendo il tempo proprio misurato da P , cio`e
2

r
f~ = m q
ur ,
2 r2
1 c2
essendo ur il versore radiale. In particolare tale forza diverge allavvicinarsi di r al suo valore
limite c/, rendendo evidente la difficolt`a di una realizzazione fisica del sistema ruotante. Simili
analisi possono essere fatte per interpretare le restanti componenti di .
10.6.23 Sistemi inerziali comoventi e la precessione di Thomas. Vogliamo ora considerare il punto di vista di O mentre osserva il suddetto punto P fermo nel sistema di O . Poiche
O `e inerziale, ha una predilezione per i sistemi inerziali cosicche, nel considerare il moto di P ,
lo confronta istante per istante con il sistema inerziale comovente con P . Ricordiamo che O
gi`a disponeva di una tetrade di riferimenti ei , che per`o non sono comoventi con P ma piuttosto
con O. Da questa si ottiene la tetrade dei sistemi comoventi semplicemente con un boost (in
1
ogni punto) in direzione u di velocit`a v = r. Posto = (1 2 r2 ) 2 ,30 il boost `e generato
29
30

ovviamente sono nulli nelle coordinate di O


in questa ultima parte scegliamo le unit`
a in cui c = 1 per alleggerire le formule

10 STRUTTURE GEOMETRICHE

205

dalla matrice G = SO(1, 3)

0
=
r
0

0 r 0
1
0
0
,
0

0
0
0
1

cosicche, usando le osservazioni in 10.6.14 si ha


e0 = (e0 re2 ) ,
e

e1 = e1 ,

e2 (e2 re0 ) ,

0
e2 2 e1
2
2
e
0
e
r

= 1 + 1 d =
2 e1 e2
0
r
0
0
0

e3 = e3

0
0
.
0
0

La particella P porta con s`e il sistema di riferimento individuato in ogni punto dai vettori t ,

, , le cui componenti rispetto al sistema ortonormale di vettori duali alle tetradi ei e


r z
ei sono dati dai coefficienti ei e ei rispettivamente, cio`e

1
0

0
1

r
0
t
r
0
0

0
0

, 0 , 0
r z 0
0
1

rispetto ad ei e
r2

0
c

1
0
0

,
,

0
0
r
t
r

0
0
0


, 0 ,
z 0
1

rispetto a ei . Questi vettori rappresentano il sistema di riferimento associato alla particella dalle
coordinate ruotanti, visti da O e dalla famiglia di sistemi inerziali comoventi rispettivamente.
Nello spostamento di P lungo il tratto = (t, 0, t, 0) dellorbita, secondo O31 le componenti
v i di un vettore nel dato punto subiranno una variazione ()i j v j rispetto al riferimento nel
medesimo punto. Dunque secondo O


0
0
0
0
2 rt
0
rt
0

,
,
,

0
0
t
r t

z 0
0
0
0
0
31

ripetendo il ragionamento precedentemente fatto con , ma questa volta utilizzando

10 STRUTTURE GEOMETRICHE

206

Un osservatore comovente registrer`a invece la variazione

0
0
2 rt

rt
0
, rt

0
t
0
t
r

0
0
0
Per confrontare con le sue misure O deve applicare il boost inverso

0
0
0
2 rt
0
rt

0
0
t
r t

0
0
0

0
0

z 0
0

1 , ottenendo

0
0

z 0
0

Come si vede dunque O vede una discrepanza tra la sua misura e quella fatta da O, che
corrisponde ad una rotazione degli assi ur e u attorno allasse uz di un angolo


1
1 dt = (1 )d .
=

In altre parole secondo O la particella P nel muoversi subisce rispetto ai sistemi comoventi un
movimento di precessione lungo lasse z, con velocit`a di precessione p = (1 ) rispetto al
tempo proprio. Tale fenomeno relativistico `e noto come precessione di Thomas. Alcuni autori
attribuiscono tale fenomeno al fatto che nel moto accelerato della particella vengono a mancare
le propriet`a pseudoeuclidee dello spazio-tempo. Tuttavia abbiamo visto invece che si tratta di
un fenomeno relativo da attribuire alle differenti descrizioni della connessione metrica euclidea
secondo le differenti scelte fatte sul fibrato dei riferimenti dello spazio piatto di Minkowski.
In particolare non abbiamo affatto dovuto modificare la metrica di Minkowski, ma solamente
esprimerla in coordinate differenti e utilizzare in maniera adeguata la descrizione sul fibrato dei
riferimenti. Tuttalpi`
u pu`o essere attribuito al fatto che lo spazio delle velocit`a non `e euclideo,
ma `e piuttosto uno spazio di Lobachewski.

11 TEORIA DINAMICA DELLE SIMMETRIE.

11

207

Teoria dinamica delle simmetrie.

Testi consigliati: [CDF], [N1], [N2].


Vogliamo ora considerare uninterpretazione fisica dei concetti introdotti nel capitolo 10.
Questo verr`a fatto da un punto di vista classico o tuttalpi`
u in prima quantizzazione, dove tutti
i campi in gioco sono comunque classici. Assumeremo inoltre che i gruppi in gioco siano sempre
dei gruppi di Lie.

11.1

Campi di materia.

Cominciamo a descrivere una certa classe di campi che chiameremo campi di materia.
11.1.1 Simmetrie esterne ed interne. Su una variet`a M si consideri un campo, termine
con il quale intenderemo qui la funzione donda che descrive un qualche tipo di particella.
La natura esatta del campo (scalare, vettoriale,. . .) dipender`a dal gruppo di struttura e dalla
rispettiva rappresentazione. Si pu`o ad esempio pensare che si tratti della funzione donda di
una particella su M . Qui M pu`o essere lo spazio-tempo (in una teoria relativistica ad esempio)
o solamente lo spazio (nel caso non relativistico).
Dal punto di vista pratico un campo di materia `e semplicemente una mappa da un certo intorno
locale a valori in uno spazio vettoriale:
: U V ,
ad esempio V = C se si tratta del campo di Schrodinger di una particella senza spin. Dal
punto di vista matematico si tratta della sezione di qualche fibrato vettoriale: (M, ),
= (E, , M, G, (, V )). La descrizione locale del campo pu`o essere fatta scegliendo una carta
locale (U, ) nellatlante di M . Allora esister`a una mappa : 1 (U ) (U ) V , con
= 1 32 , tramite la quale si ottiene la descrizione locale U : O V , dove abbiamo posto
O := (U ) Rn e U = 2 1 . Tale descrizione semplificata del campo ci permette
di introdurre in forma elementare il seguente problema.
Nel descrivere una situazione fisica si ricorre spesso al concetto di simmetria. Vediamo cosa si
intende nel caso semplice in cui il campo sia la mappa
U : O V .
Supponiamo che un osservatore stia descrivendo un certo sistema fisico in una regione O attorno
a lui, tramite il campo U . Il modo pi`
u semplice in cui pu`o manifestarsi una simmetria `e tramite
il fatto che la sua descrizione non dipenda sempre dal modo in cui lui osserva il sistema.
Per esempio potrebbe accadere che guardandosi attorno, senza alzare o abbassare lo sguardo,
la descrizione del mondo circostante rimanga sempre la stessa. Egli dir`a che tale mondo `e
simmetrico per rotazione attorno al proprio asse. Naturalmente la conclusione non dipende dal
fatto che sia lui a ruotare su s`e stesso o sia il sistema a ruotare attorno a lui. Il primo `e detto
punto di vista passivo, mentre il secondo `e il punto di vista attivo. Il punto di vista attivo mette
32

1 e 2 sono le due proiezioni naturali sul primo e secondo fattore del prodotto cartesiano.

11 TEORIA DINAMICA DELLE SIMMETRIE.

208

in evidenza il fatto che la rotazione debba mandare O in s`e stesso. Losservatore dir`a allora che
le rotazioni sono trasformazioni di simmetria. Resta da specificare cosa si intenda dicendo che
la descrizione resta la stessa. Dato che lunico modo di testare il mondo fisico `e tramite delle
misure, la trasformazione deve lasciare invariate le quantit`a misurabili. Se ad esempio U (x) `e
osservabile e R : O O `e una trasformazione di simmetria, dovr`a aversi U (x) = U (R(x)).
Chiaramente se due trasformazioni sono trasformazioni di simmetria, anche la loro composizione
lo `e e dunque linsieme di tutte le trasformazioni di simmetria formano un gruppo, detto gruppo
di simmetria.
Esiste tuttavia un secondo tipo di trasformazioni di simmetria, che lasciano cio`e invariate le
osservabili fisiche. Si tratta delle trasformazioni di V , cio`e T : V V . Per esempio se U
`e una funzione donda per una particella scalare non relativistica, allora la trasformazione di
fase U (x) 7 ei U (x) `e una tale simmetria. In particolare diremo che `e locale o globale a
seconda che dipenda o meno dal punto x. Queste trasformazioni si dicono interne, dato che
non sono associate direttamente ad una trasformazione geometrica dello spazio osservabile O,
ma piuttosto allo spazio astratto V sul quale losservatore non pu`o agire direttamente. V `e
talvolta detto spazio interno per U . Per contro il primo tipo di simmetrie si dicono esterne.
Pi`
u in generale le trasformazioni esterne si mischieranno con quelle interne.

11.1.2 Trasformazioni. Sia E M un fibrato su M . Chiamiamo trasformazione del


fibrato un diffeomorfismo T : E E che rispetti la struttura delle fibre, cio`e tale che
:= T 1 : M M `e un diffeomorfismo;
T |Ex : Ex E (x) `e un isomorfismo tra le fibre.33
Diremo che la trasformazione `e interna se `e lidentit`a (cio`e se T `e un isomorfismo di fibrati).
Una trasformazione dei fibrati induce una trasformazione dei campi associati, T : (M, E)
(M, E), definita da T = T 1 per ogni (M, E). Si chiama trasformazione esterna
` chiaro
del campo la trasformazione 7 , indotta da un diffeomorfismo : M M . E
che ogni trasformazione pu`o allora essere decomposta in trasformazioni interne ed esterne.
11.1.3 Osservazione. La definizione precedente pu`o essere indebolita osservando che nella
descrizione fisica non `e a priori necessario fissare un determinato fibrato: un altro fibrato
isomorfo andrebbe altrettanto bene. Perci`o una trasformazione pu`o essere definita come un
diffeomorfismo T : E E tra due fibrati isomorfi. In questo senso `e naturale pensare alle
trasformazioni come simmetrie del sistema, nel senso che mandano un fibrato in un altro,
potenzialmente equivalente per descrivere la fisica. Il potenzialmente sottolinea il fatto che
lequivalenza non `e ancora garantita. Infatti la fisica non `e descritta solamente dagli oggetti
(i campi e i fibrati), ma anche dalle relative equazioni del moto che caratterizzano il sistema.
Una simmetria deve quindi rispettare anche le equazioni del moto.
'

11.1.4 Significato. In una descrizione locale : 1 (U ) U V , una trasformazione


33

Un isomorfismo lineare se il fibrato `e vettoriale, di gruppi se `e un fibrato principale e cos` via.

11 TEORIA DINAMICA DELLE SIMMETRIE.

209

interna sar`a determinata da una funzione locale


f : U V V ,
in modo che la trasformazione sar`a descritta dallapplicazione
(x, v) 7 (x, f (x, v)) .
Tale applicazione deve agire linearmente sulla fibra,34 e poich`e le trasformazioni formano un
gruppo, la funzione f si riduce a sua volta ad unapplicazione
T : U Aut(V ) ,
a valori negli automorfismi di V cosicche
f (x, v) = T (x)v .
Il sottogruppo di Aut(V ) generato dalle trasformazioni T (x) , x U realizza un gruppo U, in
generale diverso dal gruppo di struttura G. Possiamo sempre pensare a questo come alla rappresentazione di U sulla fibra Ex ' V . Viceversa dato un gruppo U e una sua rappresentazione
su V , possiamo costruire un gruppo di trasformazioni con la procedura inversa. Data cio`e una
mappa
f : U U ,
la trasformazione sar`a descritta dallapplicazione
(x, v) 7 (x, (f (x))(v)) .
Per capire ancora meglio il significato delle trasformazioni, supponiamo supponiamo che V ' R3
e U sia il gruppo delle rotazioni. Sia poi R la rappresentazione di U su V . La trasformazione
(x, v) 7 (x, R(f (x))(v)) ,
corrisponde allora a far ruotare V tramite una rotazione R(f (x)). Poiche tale rotazione dipende
dal punto x dobbiamo pensare che per ogni x lo spazio V subisca una rotazione diversa per
ogni punto. Questo giustifica il fatto che sia conveniente pensare alla trasformazone agente
su una copia`
diversa Ex ' V di V per ogni punto e ai campi come a delle funzioni a valori
in U V = xU Ex anziche in V . La struttura di fibrato `e dunque quella pi`
u naturale per
descrivere le trasformazioni.
Osserviamo che comunque, a differenza del gruppo di struttura G, il gruppo di trasformazioni
U non lascia invariati i vettori di E n`e tantomeno le sue sezioni. Il fibrato che occorre costruire
per poter descrivere dei campi di E soggetti a trasformazioni non `e dunque in generale lo stesso
di E. Sia allora il fibrato principale con gruppo U. Possiamo procedere in due modi. Se P `e
il fibrato principale con gruppo G sotteso da E, si pu`o costruire il fibrato principale P su
cui agiscono sia G che U , e quindi ricostruire il fibrato E con la struttura arricchita. Tuttavia
34

consideriamo campi vettoriali

11 TEORIA DINAMICA DELLE SIMMETRIE.

210

dal punto di vista fisico, dovendo distinguere tra i campi vettoriali rispetto alla struttura G e
le Utrasformazioni, conviene adottare la corrispondenza individuata nella sezione 10.4.9.
11.1.5 Campi di materia e trasformazioni di gauge. Chiamiamo campo di materia
calibrabile o gauge covariante su E una mappa equivariante : E, tale che E = .
Equivariante significa che `e equivariante su ogni fibra.
Lasciamo come utile esercizio la verifica del fatto che una trasformazione interna di un campo
di materia su E `e allora indotta da una trasformazione di . A tale scopo si introduca una
descrizione locale di E e indotta da una carta locale (U, ) dellatlante di M e si descriva la
trasformazione interna di un campo osservando che lazione di U sulle fibre di `e transitiva.
Si chiama scelta del gauge o calibrazione la scelta di una sezione (M, ). In tal caso si
dice che la sezione := (M, E) rappresenta il campo nel gauge fissato. La trasformazione che corrisponde al passaggio da una sezione ad una seconda sezione
si chiama
trasformazione di gauge o ricalibrazione.
In una descrizione locale `e individuata da una funzione (che continuiamo a chiamare)
: U U, cosicche esister`a una funzione f : U U tale che
(x) = (x)f (x)1 per
ogni x U . Allora, sempre nella descrizione locale, avremo = ( f )( ).
Come abbiamo osservato in precedenza, le trasformazioni di gauge vengono promosse a simmetrie di gauge se sono delle simmetrie, ed in particolare se lasciano invariate (o covarianti)
le equazioni del moto. Si noti che la seconda condizione `e in generale pi`
u debole della prima:
essa significa che la trasformazione di gauge manda una soluzione delle equazioni del moto in
unaltra soluzione, ma non `e detto che la nuova soluzione abbia lo stesso significato fisico della
vecchia, come invece pretende una simmetria. Se la soluzione `e una nuova soluzione fisica si
dice che la trasformazione `e una dualit`a.
Nelle teorie di gauge comunque si assume come principio che le trasformazioni di gauge siano
simmetrie, cosicche solo alle quantit`a invarianti per trasformazioni di gauge, detti gli invarianti
di gauge, viene attribuito un significato fisico.

11.2

Campi di gauge.

Le equazioni del moto per i campi di materia in una teoria di gauge devono essere scritte in
forma covariante. Un modo naturale per farlo `e di scriverle in termini di derivate covarianti,
come mostrato nel capitolo 10. Tuttavia, prima di procedere in via sistematica, vogliamo
illustrare il punto di vista euristico dei fisici.
11.2.1 Costruzione euristica dei campi di gauge. Consideriamo dapprima un esempio
particolarmente semplice. Sia M = R3,1 lo spazio-tempo di Minkowski e : M C un
campo scalare, al quale non diamo alcun significato particolare, ma semplicemente assumiamo
che tutte le quantit`a misurabili siano funzioni di (x) (x) = |(x)|2 e delle quantit`a conservate
associate allazione
Z
S[] =
(x) (x)d4 x .
M

11 TEORIA DINAMICA DELLE SIMMETRIE.

211

Si osservi che allora lazione `e invariante per trasformazioni di fase costante


7 ei
dove : M R `e una mappa costante.
Usando il teorema di Noether35 si trova la corrente conservata j (x) = i((x) (x)
(x) (x) ) che infatti, per ogni che risolve le equazioni del moto, soddisfa j = 0. Fissato
un sistema di riferimento (ct, x1 , x2 , x3 ) e una fissata regione spaziale V di bordo S = V fissa
nel dato riferimento si ha perci`o
Z
Z
I
Z
0
d
0
3
3
l 3
j (x)d x =
j (x)d x = c
l j d x = c jl (x)nl (x)d,
dt V
t
V
V
S
in cui abbiamo dapprima utilizzato lequazione di continuit`
a j = 0 e poi il teorema di
Stocks. In particolare l si somma da 1 a 3 e R~n `e il versore normale alla superficie e s lelemento
di superficie. Dunque la quantit`a Q := V j 0 d3 x si conserva nel tempo se non vi `e flusso
di ~j attraverso la superficie. Si noti che, come doveva essere, anche la corrente conservata `e
invariante per la trasformazione di fase costante.
Vogliamo ora chiederci cosa accade se facciamo una trasformazione di fase dipendente dal punto,
in cui cio`e C (M ) non sia pi`
u costante. In primo luogo non `e pi`
u conveniente pensare al
campo come ad una funzione a valori complessi, ma piuttosto come una sezione
: M M C , tale che 1 = idM .
`
In questo modo, posto Cx := 11 (x) ' C, avremo M C := xM Cx e potremo pensare
alla trasformazione di fase 7 ei come associata ad una diversa rotazione di fase di angolo
(x) per ciascun piano complesso Cx . Questo mette in luce la struttura di fibrato necessaria.
Tuttavia la trasformazione ottenuta non `e una simmetria poiche non lascia invariata n`e lazione
n`e le equazioni del moto. Per vedere come modificare la teoria per renderla una teoria di
gauge analizziamo in che modo risulta violata linvarianza e come possa essere ripristinata. Per
farlo, generalizziamo un po lesempio, assumendo che abbia valore in Cn e che la simmetria
originale sia 7 g, dove g : M G `e una funzione costante a valori nel sottogruppo G
di U (n, C)36 . Per rendere locale la simmetria assumiamo dunque che g non sia pi`
u costante.
Lazione sia semplicemente
Z
S[] =
h (x), (x)id4 x ,
M

scritta in termini del prodotto hermitiano in Cn . Vediamo subito che linvarianza dellazione
cade a causa del semplice fatto che
(g(x)(x)) 6= g(x) (x) .
35

o direttamente dalle equazioni del moto


= 0

36

lesempio originale si riottiene allora per n = 1

11 TEORIA DINAMICA DELLE SIMMETRIE.

212

Per ripristinare la simmetria occorre ripristinare tale propriet`a. Bisogna cio`e covariantizzare la
derivata. A bisogna sostituire una nuova derivata D covariante. Nel linguaggio di 11.1.5

diremo che se (x)


= g(x)(x) rappresenta la trasformazione di gauge, allora anche la derivata
in modo che valga
D deve trasformarsi in D

(x)
D
= g(x)D (x) ,
cio`e la derivata (trasformata) del trasformato deve essere pari al trasformato della derivata. In
altre parole, esattamente come avviene per , D sar`a solo lespressione nel gauge fissato della
derivata. Se la condizione suddetta `e soddisfatta, otteniamo una teoria di gauge semplicemente
sostituendo D a .
Cerchiamo ora di capire come debba essere fatta lespressione locale (cio`e nel dato gauge) della
derivata D . Possiamo scrivere D = + A (x), dove
A (x) : Cn Cn
sar`a un qualche operatore lineare che deve agire sul campo . Nel nuovo gauge avremo invece
= + A (x). Imponendo la suddetta condizione di covarianza otteniamo che deve essere
D
A (x) = g(x)A (x)g(x)1 g(x)1 g(x) .
Questa relazione ci dice come deve essere fatto loperatore A (x). Se U `e il gruppo di trasformazioni allora g(x)1 g(x) Lie((U))37 e quindi A `e localmente un campo a valori in
Lie(U), ed agisce sul campo tramite la rappresentazione di Lie(U) indotta da . Tuttavia
A non `e un campo di materia, poiche sotto trasformazioni di gauge non trasforma come una
sezione, a causa del termine additivo g(x)1 g(x). Per tale motivo A viene invece chiamato
campo di gauge.
11.2.2 Osservazione. Nel caso in cui il gruppo di gauge sia U (1) allora iA avr`a valori in R e
alla trasformazione di fase con angolo corrisponde la trasformazione di gauge iA = iA + .
Dunque iA si comporta esattamente come il quadripotenziale del campo elettromagnetico!
Questa affermazione induce a dare proprio tale interpretazione ad A . In tal caso sappiamo
rendere dinamico A associandovi il campo di forze F = A A e la relativa azione
Z
S[A] =
F F d4 x .
M

Da questo punto di vista possiamo dire che i campi di gauge e i relativi campi di forze sono
conseguenza del fatto che si siano rese locale delle simmetrie globali. In un certo senso sono il
manifestarsi di una simmetria che per qualche motivo non pu`o essere globale. Si osservi anche
che F in questo caso `e invariante di gauge e quindi `e osservabile, a differenza di A .
Prima di considerare il caso di un gruppo generico, torniamo allinterpretazione geometrica
rigorosa.
37

dove `e la rappresentazione di U su V

11 TEORIA DINAMICA DELLE SIMMETRIE.

213

11.2.3 Connessione e campi di gauge. Consideriamo il fibrato principale delle trasformazioni di gauge . Sia T : una trasformazione di gauge, cio`e un automorfismo di
che induce lidentit`a su M . Per descrivere tale trasformazione osserviamo che T determina
univocamente una funzione equivariante T : G, cio`e tale che
T (g) = Adg1 (T ())
per ogni e g G. Infatti, per definizione, T manda ogni fibra in s`e, sicche se x
allora si ha T () x . Daltra parte G agisce transitivamente e liberamente su ogni fibra, e
quindi deve esistere un unico g G tale che T () = g. Tale g `e univocamente determinato da
e T e quindi possiamo definire T () := g, cio`e
T () =: T () .
Daltra parte la trasformazione deve essere compatibile con lazione a destra, cio`e T (h) = T ()h
per ogni h G. Da ci`o segue che T `e equivariante:
(h)T (h) = (T ())h = T (h) = h1 T ()h .
Viceversa, una mappa equivariante : G determina univocamente una trasformazione
T : . Basta porre T () = ().
Su possiamo introdurre una connessione infinitesima con la quale definire una derivata
covariante che agisca sui campi di materia, come introdotto in 10.3.12 e 10.4.11. Vogliamo
innanzitutto vedere quale sia leffetto di una trasformazione T sulla connessione.
11.2.4 Proposizione. La 1forma T `e ancora una connessione infinitesima su e si ha
T () = AdT ()1 (T () ) + dL1 () ) dT () .
T

Qui abbiamo usato il pedice per indicare la valutazione nel punto .


Dimostrazione. Diamo una traccia della dimostrazione.
Per verificare la formula per T () basta applicare T () ad un campo vettoriale su
usando T () (()) = (T ()()) e T () = T () per calcolare il push forward, dove
usiamo g per Rg ().
Una volta verificata la formula, si verifichi che lespressione nel membro di destra soddisfa le
propriet`a di una connessione infinitesima.
2
La mappa
dL1 () dT () : T Lie(G)
T

viene usualmente indicata con T ()1 dT () e chiamata derivata logaritmica di T .


Naturalmente
dL1 () : TT () U Te G
T

`e lazione a sinistra su T G (ristretta ad T ()) indotta dalla moltiplicazione a sinistra sul


gruppo.

11 TEORIA DINAMICA DELLE SIMMETRIE.

214

Sia (U, ) una carta locale. Supponiamo ora di fissare un gauge (U, ). Questa `e
unoperazione che pu`o essere fatta solo localmente. Il motivo `e che in generale un fibrato
principale `e banale se e solo se ammette una sezione globale38 . Dunque non esistono sezioni
globali se il fibrato non `e banale. Detto ci`o, potremo definire la connessione locale nel gauge
fissato come A := . Si tratta di una 1-forma a valori in Lie(G). Cosa accade se cambiamo
gauge, cio`e se passiamo da a
(U, )? Il cambiamento pu`o evidentemente essere visto
come indotto da una trasformazione del fibrato |U e quindi sar`a descritto allora da una
mappa equivariante T cio`e
(x) := T (x) = (x)T ((x)) =: (x)g(x). Nel nuovo gauge la

connessione locale A sar`a allora legata ad A dalla relazione A = T A ed applicando la regola


di trasformazione della proposizione otteniamo

A(x) = g(x)1 A(x)g(x)


g(x)1 dg(x) ,
che `e proprio la formula dedotta euristicamente dal punto di vista fisico. Basta inoltre applicare
10.4.11 per verificare che la derivata covariante D `e semplicemente lespressione locale della
derivata covariante geometrica sui campi di materia.
Si noti in particolare che il campo A visto come un campo su M `e ben definito solo localmente,
mentre loggetto globale `e che vive su . Questo mostra limportanza del concetto di fibrato
nella costruzione delle teorie di gauge.
11.2.5 Curvatura e campo di forze. Data la connessione infinitesima su , possiamo
anche considerarne la forma di curvatura = H(d). Lequazione di struttura (sezione 10.5.3)
ci dice allora che = d + 21 [, ]. Scelto un gauge locale possiamo introdurre il concetto di
curvatura locale F := = . Allora F = dA + 21 [A, A] `e una 2-forma a valori in Lie(G). In
particolare se G = U (1) allora F = dA `e il tensore di Faraday. Dunque la forma di curvatura
rappresenta il campo di forze o fieldstrength associato al campo di gauge.
` un semplice esercizio verificare che in una trasformazione di gauge il campo di forze trasforma
E
secondo la rappresentazione aggiunta: se
(x) = (x)g(x) allora F (x) = dAdg(x) (F (x)).39 In
effetti si tratta dellespressione locale della seguente proposizione di facile dimostrazione.
11.2.6 Proposizione. Sia T : una trasformazione di gauge. Se `e la forma di
curvatura associata ad allora T `e la forma di curvatura associata a T e si ha
T = dAdT ()1 T () .

11.3

Teorie di Yang-Mills.

Riassumendo, il campo di gauge `e geometricamente individuato dalla connessione infinitesima


sul fibrato principale, mentre il campo di forze `e individuato dalla forma di curvatura. Linterazione di tali campi con i campi di materia avviene tramite lazione della derivata covariante
e del corrispondente campo di curvatura sui campi di materia. Si noti che in un particolare
gauge avremo ad esempio (x) = + (A(x))(x), dove `e la rappresentazione di Lie(G)
38
39

la dimostrazione `e un esercizio
ovviamente dAdg `e lazione aggiunta del gruppo sullalgebra ottenuta differenziando Adg : U U

11 TEORIA DINAMICA DELLE SIMMETRIE.

215

su V . Se inoltre fissiamo una base {a }na=1 dellalgebra di Lie di G, con costanti di struttura
cbc a , allora A = Aa a , F = F a a e
a
F
= Aa Aa + cbc a Ab Ac .

Ovviamente dal punto di vista fisico `e conveniente identificare il campo di forze con che vive
su M , anziche con che vive su .40 . In tal senso il campo di forze `e globalmente definito
su M , a differenza del campo di gauge. In questo senso il campo di forze appare pi`
u fisico
del campo di gauge che rappresenta piuttosto un potenziale per il campo di forze. Tuttavia
possiamo notare che solamente se il gruppo di gauge `e abeliano il campo di forze `e invariante
di gauge. Nel caso non abeliano F trasforma con laggiunta e non `e direttamente osservabile.
Lo saranno piuttosto le quantit`a invarianti che si possono costruire a partire da F .
11.3.1 Interazioni di gauge.
Laccoppiamento tra connessione e campi di materia ha come effetto secondario uninterazione tra i campi di materia mediata dai campi di gauge, detta anche interazione di gauge.
Per esempio nel caso eletromagnetico possiamo dire che linterazione elettromagnetica tra campi
carichi41 `e mediata dal quadripotenziale A . Abbiamo visto come nel caso abeliano sia possibile rendere
R dinamico il campo di gauge introducendo unazione quadratica nel campo di forze:
S[A] = F F d4 x. Nel caso nonabeliano tale espressione non `e invariante di gauge, ma lo
`e la sua traccia. Dunque su una variet`a (pseudo-)metrica ha senso definire almeno localmente
Z
p
SU [A] = T r{F (x)F (x)} g(x)d4 x ,
U

dove g(x) `e il modulo del determinante della matrice metrica, (U, ) una carta locale e la
traccia `e presa nella rappresentazione aggiunta (composta con la rappresentazione ). Se U `e
un secondo aperto locale che ha intersezione non vuota con U allora sullintersezione F ed F
differiranno per una trasformazione di coordinate composta con una trasformazione di gauge.
Chiaramente lintegrale con la misura indotta dalla metrica non dipende dalla scelta delle
coordinate. Poiche la trasformazione di gauge corrisponde allazione aggiunta del gruppo su F
e dato che la traccia `e invariante sotto tale azione, si ha allora

SU [A]|
= SU [A]|U U
.
U U
Quindi le due azioni locali sono compatibili ed `e possibile determinare una partizione dellunit`a
associata allatlante di M e definire quindi SM [A]. In assenza di altri termini, le equazioni del
moto conseguenti sono dunque42
0=
40

p
SM
= 4Kab ( g(x)F b (x)) ,
a
A (x)

sappiamo per`
o che sono equivalenti
diremo che un campo di materia `e carico se trasforma in maniera non banale sotto trasformazioni di gauge
42
calcolata ad esempio scegliendo una variazione Aa a supporto compatto in U
41

11 TEORIA DINAMICA DELLE SIMMETRIE.

216

dove Kab = T r(a b ) `e la metrica di Killing sullalgebra di Lie del gruppo di gauge. Inoltre F
deve soddisfare le identit`a di Bianchi 10.5.4 che assumono la forma43
Da F (x) + Da F (x) + Da F (x) = 0 ,
dove si `e posto
c
a
(x) + cbc a Ab (x)F
(x) .
Da F (x) := F

Le teorie di gauge la cui dinamica viene definita dallazione quadratica teste definita si chiamano
teorie di Yang-Mills. Se il gruppo di gauge `e abeliano si riducono essenzialmente alla teoria
del campo elettromagnetico, per cui ci si riferisce al caso non-abeliano quando si parla di teorie
di Yang-Mills. Si noti che in tal caso lazione SM [Aa ] non `e quadratica nei campi ma contiene
anche termini cubici e quartici.44 Dal punto di vista fisico questo significa che nemmeno in
assenza di sorgenti i campi di gauge non-abeliani soddisfano il principio di sovrapposizione, a
causa dei termini cubici e quartici che si interpretano allora come termini di autointerazione.
Questa interprtazione `e chiara dal punto di vista perturbativo in cui i termini non lineari nelle
a
:= Aa Aa ,
equazioni del moto vengono considerati perturbativamente. Posto allora F(0),
a
le equazioni del moto assumono la forma F(0)
= j a , dove j a contengono termini quadratici
a
e cubici nei campi di gauge e a livello perturbativo definiscono la sorgente per il campo F(0),
.
` interessante comunque osservare che esistono tecniche per determinare e descrivere soluzioni
E
esatte di queste equazioni che, oltre a permettere di descrivere fenomeni non perturbativi in
fisica, introducono una pi`
u profonda interazione tra fisica e matematica. Ci limiteremo invece
a concludere le nostre considerazioni sulle teorie di Yang-Mills con alcune osservazioni.
11.3.2 Osservazioni. Scelta una base a dellalgebra di Lie asociata al gruppo di gauge,
anziche parlare di campo di gauge A , in fisica si preferisce parlare di campi di gauge Aa . Ad
esempio se il gruppo di gauge `e SU (n), ci saranno n2 1 campi di gauge. Un solo campo per
U (1) (il fotone), tre per SU (2) (la luce pesante Z, W ), otto per SU (3) (i gluoni). Ad ogni
campo di gauge `e associata una carica, che chiameremo carica di gauge in generale ma che
assume il nome specifico di carica elettrica, elettrodebole e di colore nei casi sopra citati.
Consideriamo un campo di materia su cui agisca un gruppo compatto K (di Lie) come gruppo
di gauge, in qualche rappresentazione . Se il gruppo `e compatto
allora si pu`o sempre scrivere
P
a

localmente la trasformazione di gauge nella forma (x)


= e a qa (x)a (x). Le costanti qa sono
appunto le cariche del campo, che determinano come il campo si trasforma sotto lazione del
gruppo. In particolare la connessione infinitesima sar`a ragionevolmente scritta, dal punto di
vista fisico, nella forma
X
(x) =
q a a Aa ,
a

dove `e il gauge fissato. Si noti che alcune delle cariche possono essere nulle, tuttavia quelle
non nulle devono corrispondere ad una sottoalgebra dellalgebra di Lie. In tal caso la teoria
di gauge si riduce al sottogruppo corrispondente. In ogni caso possiamo pensare alle cariche
43
44

verificare!
si scriva esplicitamente SM [A] in termini di Aa

11 TEORIA DINAMICA DELLE SIMMETRIE.

217

come dei parametri che determinano la rappresentazione con la quale la connessione (che ha
valori nellalgebra del gruppo di gauge) agisce sul campo di materia. Tali cariche dipendono
comunque dal campo di materia e non dal campo di gauge la cui natura `e fissata.
Infine osserviamo che finora abbiamo parlato di gruppo di gauge riferendoci al gruppo di Lie
compatto indotto su ogni fibra. Tuttavia pi`
u propriamente il gruppo di gauge `e il gruppo delle
trasformazioni del fibrato principale e si tratta dunque di un gruppo di Lie infinito dimensionale,
ben pi`
u complicato dei gruppi di Lie da noi considerati.

11.4

Simmetrie esterne e relativit`


a.

Finora abbiamo considerato le simmetrie che riguardano le trasformazioni dello spazio interno,
che costituisce parte della definizione dei campi. Tuttavia un ruolo non meno importante ce
lhanno le trasformazioni esterne, che riguardano cio`e lo spazio-tempo. Esse infatti sono determinanti nella costruzione stessa dei campi e non solo nella loro dinamica e sono ovviamente i
fondamenti delle teorie relativistiche. Nel capitolo 12 vedremo ad esempio il ruolo della relativit`a ristretta nella determinazione dei campi fondamenteli e delle relative equazioni del moto
che trovano posto nel modello standard delle particelle elementari, il cui contenuto geometrico
verr`a illustrato nel capitolo 13. In questa sezione ci occuperemo invece di alcuni aspetti della
relativit`a generale.
11.4.1 Relativit`
a generale e leggi fisiche. Mentre in relativit`a ristretta si privilegiano
i sistemi di riferimento inerziali, nella relativit`a generale non viene privilegiato alcun sistema
di riferimento. Poiche costruire un sistema di riferimento in una regione dello spaziotempo
corrisponde a introdurvi un sistema di coordinate locali, le equazioni fisiche devono essere nella
loro essenza indipendenti dalla scelta delle coordinate. In altri termini le equazioni fisiche vanno
scritte in forma tensoriale (covariante o controvariante) nelle coordinate locali. Gli argomenti
considerati nei precedenti capitoli ci portano a pensare che lo spazio-tempo debba essere allora
considerato come una variet`a differenziale. Le leggi fisiche andranno allora scritte in termini di
sezioni di fibrati associati al fibrato dei riferimenti. In questo modo le equazioni risulteranno
indipendenti dalla scelta delle coordinate, ovvero trasformeranno in maniera covariante rispetto
a cambiamenti di coordinate.
Da questo punto di vista dunque una scelta di coordinate locali `e equivalente a una scelta di
gauge nelle teorie di gauge. Tuttavia in questo caso la questione `e un po pi`
u delicata, poiche
non possiamo dire a priori che solo le quantit`a indipendenti dalla scelta delle coordinate sono
osservabili. I fenomeni relativistici sono appunto quelli in cui i risultati delle misure dipendono
dalle coordinate (cio`e dal sistema di riferimento). Nella maggior parte dei casi sono proprio
le componenti dei tensori ad essere misurabili, sebbene dipendano ovviamente dal riferimento.
Tuttavia `e evidente che le quantit`a invarianti avranno un significato pi`
u profondo.
11.4.2 Il principio di equivalenza e la geometria dello spazio-tempo. Il principio di
equivalenza pu`o essere espresso nei seguenti due punti
si consideri una particella in caduta libera (cio`e muoventesi in assenza di forze differenti

11 TEORIA DINAMICA DELLE SIMMETRIE.

218

da quella gravitazionale). Allora la sua traiettoria non dipende dalla composizione e dalla
struttura interna della particella; (principio di equivalenza debole)
esperimenti locali eseguiti in riferimenti in caduta libera danno risultati indipendenti
dalla velocit`a del riferimento considerato, dalistante e dal luogo delluniverso in cui essi
vengono eseguiti.
Il primo punto era gi`a rispettato dalla teoria della gravitazione di Newton. Il secondo punto,
aggiunto al primo, definisce il principio di equivalenza forte. Esso afferma che nellintorno di
ogni punto si pu`o costruire un laboratorio abbastanza piccolo in cui gli effetti gravitazionali
risultino completamente trascurabili ed inavvertibili, almeno per tempi piccoli, per cui la fisica
sar`a descritta (allinterno di tale laboratorio) dalla fisica dei sistemi inerziali. Nella teoria della
relativit`a generale si assume usualmente che questa sia la fisica Minkowskiana. Ci`o non significa
che il campo gravitazionale non sia misurabile dato che gli osservatori potranno determinare le
forze di marea, come vedremo pi`
u avanti.
Si consideri ad esempio una particella massiva in caduta libera. In un laboratorio localmente
inerziale il suo moto sar`a descritto, nelle fissate coordinate, dallequazione del moto libero
d2 x
=0,
d 2
dove `e il tempo proprio. Questo `e certamente vero in un intorno del punto x0 := x (0), il
nostro laboratorio. Questa piccola regione dello spaziotempo verr`a descritta con una metrica
Minkowskiana . Consideriamo ora un secondo sistema di riferimento arbitrario, rispetto al
di questo
quale il moto della particella sar`a descritto da coordinate x = x(x). Gli osservatori O
laboratorio vedranno allora le correlazioni spaziotemporali descritte dallosservatore inerziale
x
. Applicando la trasformazione di coordinate
O, in termini di una metrica g (
x) = x
x
x

descrive il moto della particella:


allequazione del moto si ottiene lequazione che secondo O
d2 x
x
x d
d
+

=0,

d 2
d d
in cui sono proprio i simboli di Christoffel determinati dalla metrica g . Questa `e lequazione di una curva autoparallela su una variet`a di metrica g dotata della connessione di
Levi-Civita. Questa osservazione, unita con la terza parte del principio di equivalenza, suggerisce che lo spazio-tempo debba essere identificato con una variet`a differenziale dotata di una
metrica di segnatura Minkowskiana, in cui le equazioni che descrivono quei fenomeni localmente non gravitazionali vengano ottenute semplicemente covariantizzando le corrispondenti
equazioni note nel limite inerziale. Questo a livello pratico significherebbe sostituire la metrica generica g in luogo di quella di Minkowski e la derivata covariante in luogo di quella
ordinaria. In ogni dato punto si potranno sempre scegliere delle coordinate locali per le quali
la matrice metrica sar`a proprio . Tuttavia non `e vero che questo sia possibile farlo in tutto lintorno dato: questo dipende da quale sia realmente la metrica sullo spazio tempo. Tale
eventuale impossibilit`a sar`a allora la manifestazione delle forze gravitazionali e la loro intensit`a determiner`a lampiezza della regione dello spazio-tempo in cui il limite minkowskiano sar`a
approssimativamente valido.

11 TEORIA DINAMICA DELLE SIMMETRIE.

219

Il principio di equivalenza pu`o essere indebolito, richiedendo che nel secondo punto solo gli
esperimenti locali non gravitazionali eseguiti in riferimenti in caduta libera diano risultati indipendenti dalla velocit`a del riferimento considerato, dalistante e dal luogo delluniverso in
cui essi vengono eseguiti. Questo viene chiamato anche principio di equivalenza di Einstein.
Distinguendo gli esperimenti gravitazionali da quelli non gravitazionali tale principio in realt`a
`e pi`
u debole ed `e quindi soddisfatto da una classe pi`
u ampia di teorie rispetto a quelle che
soddisfano il principio di equivalenza forte. In particolare la teoria della relativit`a generale `e
lunica finora nota che soddisfi il principio di equivalenza forte. Perci`o chiameremo il principio
di equivalenza forte principio di relativit`
a generale.
11.4.3 Relativit`
a generale e geometria. Quanto osservato finora richiede alcuni ulteriori
commenti. Quando si covariantizza, non vi `e ununica possibilit`a di scegliere la derivata covariante. Dato il ruolo attribuito alla metrica, `e chiaro che la connessione dovr`a essere metrica.
Tuttavia questa condizione non `e sufficiente a determinare univocamente la connessione, che
pu`o ancora dipendere dalla scelta di una torsione. Lequazione sopra determinata per il moto
della particella, non `e ancora sufficiente a decidere che la connessione debba essere proprio
quella di Levi-Civita. Dapprima osserviamo che in questa equazione non pu`o esservi torsione.
Si faccia infatti lesercizio di dimostrare che se esistono delle coordinate per le quali in un
punto dato la metrica `e quella di Minkowski e = 0 (unarbitraria connessione metrica),
allora necessariamente in quel punto la torsione `e nulla. Il principio di equivalenza richiede
che questo debba valere ovunque e sempre, per cui in questa equazione si deve usare la connessione di Levi-Civita. Questa `e una manifestazione dellequivalenza tra massa inerziale e massa
gravitazionale. Non sarebbe per`o strano che la torsione comparisse in altre equazioni. Questa
particolare equazione sarebbe significativa su una variet`a metrica a prescindere dalla presenza
o meno di una torsione. Semplicemente non sarebbe pi`
u lequazione di una curva autoparallela, continuerebbe ad essere lequazione di una curva geodetica, che rende cio`e stazionario il
funzionale lunghezza darco
Z
S[] = mc ds ,

dove ds = cd `e il tempo proprio (e c la velocit`a della luce, m la massa della particella). Mentre
lasciamo come esercizio la verifica di tale fatto, possiamo commentare che dunque le particelle
si devono muovere di moto geodetico e questo non `e affatto incompatibile con la presenza di
una eventuale torsione. Lunica condizione di compatibilit`a richiesta `e che la connessione sia
metrica. Tuttavia il punto `e che il principio di equivalenza deve valere per tutte le equazioni
che riguardano i fenomeni localizzati. Questo significa che nel dato punto la torsione, nelle
date coordinate, deve scomparire da tutte le equazioni, per cui ovunque bisogna utilizzare la
connessione metrica. Il principio di relativit`a generale quindi richiede che lo spazio-tempo debba
essere una variet`a di Levi-Civita.
Accertato questo fatto, occorre determinare delle equazioni che stabiliscano quale debba essere
la metrica sullo spaziotempo che determina gli effetti gravitazionali. Queste saranno appunto
le equazioni di Einstein. Vi sono diversi modi di introdurre le equazioni di Einstein. Per essere

11 TEORIA DINAMICA DELLE SIMMETRIE.

220

brevi adotteremo un approccio che, sebbene non sia necessariamente quello preferibile dal punto
di vista fisico, mette in luce gli aspetti geometrici.
Il principio di equivalenza di Einstein, come lo abbiamo scritto sopra, permette invece
lesistenza di campi diversi dal campo gravitazionale, come generatori delle interazioni gravitazionali. Per esempio diventa ammissibile una torsione (gravit`a con torsione) non nulla oppure la presenza di ulteriori campi, oltre al campo metrico, come responsabili delle interazioni
gravitazionali.
11.4.4 Esercizio. Si supponga di introdurre nellintorno di un punto O delle coordinate
localmente inerziali, per le quali g (O) = e (O) = 0. Si dimostri che (se le coordinate
di O sono nulle) allora
1
g (x) = + R (O)x x + O(|x |3 ) .
3
Come si vede dallesercizio il campo gravitazionale si manifesta attraverso il tensore di Riemann.
Nello stesso limite ad esempio lequazione geodetica assume la forma
2
x + R 00 (O)x = 0 ,
3
dove abbiamo ipotizzato una particella inizialmente in quiete. In particolare quindi losservatore
O vedr`a le particelle a lui molto vicine subire delle quadriforze f = 23 mR 00 (O)x , nelle
varie direzioni, che interpreter`a come forze di marea e che potr`a misurare per determinare la
presenza del campo gravitazionale.
11.4.5 Il principio dazione: equazioni di Einstein. In questa sezione accenneremo ad
un metodo geometrico di costruzione dellazione di gravit`a, evidenziando le idee principali e
lasciando i dettagli come esercizio [CDF]. Poiche il campo di gauge in questo caso `e la metrica,
vogliamo costruire unazione per il campo gravitazionale, che sia invariante per trasformazioni
generali, che manifesti linvarianza locale di Lorentz e le cui equazioni del moto contengano
derivate di ordine non superiore al secondo. Nella costruzione del principio di azione vi `e un
punto delicato che riguarda i termini di bordo e che va considerato con cautela nei casi in cui
si debbano considerare particolari condizioni di bordo. Qui non tratteremo tali questioni (che
escono dai nostri scopi) ipotizzando che i termini di bordo non diano mai problemi.
Anzitutto, cominciamo con losservare che, a differenza delle teorie di Yang-Mills, non `e possibile a priori scegliere la variet`a M che individua lo spazio-tempo. Infatti, mentre a priori
qualunque variet`a ammette almeno una metrica Riemanniana, non tutte le variet`a ammettono metrica Lorentziana. Probabilmente non `e nemmeno nota una classificazione delle variet`a
che ammettono una metrica con segnatura Minkowskiana. Questo significa che in realt`a le
equazioni di Einstein devono determinare non solo la metrica, ma anche la variet`a (o meglio
la classe di isomorfismo) su cui tale metrica `e definita. Una possibilit`a `e quella di costruire
lazione e le relative equazioni del moto solo localmente, ed ottenere poi le soluzioni globali
incollando le carte locali e facendo uso di qualche principio di completezza, che comunque qui

11 TEORIA DINAMICA DELLE SIMMETRIE.

221

non considereremo.
Invece di procedere in questo modo, costruiamo unazione globale in cui sia la metrica che
la variet`a siano incognite. Sia M una variet`a, ipotetica soluzione delle equazioni di Einstein.
Sappiamo che una teoria indipendente dai sistemi di riferimento pu`o essere costruita passando
attraverso il fibrato principale dei riferimenti R associato a T M . Possiamo allora pensare di
definire unazione parziale iniziale su R. Ammettere che su M possa essere definita una metrica
lorentziana equivale ad ammettere che il fibrato dei riferimenti possa essere allora ridotto ai
sistemi di riferimento ortonormali (nel senso lorentziano), il fibrato che chiameremo O. Tutte
le quantit`a costruite sul fibrato R possono essere naturalmente costruite sul fibrato O. In particolare la connessione infinitesima e la forma di curvatura avranno valori in so(1, 3) (si veda
il capitolo 8). Si noti che il gruppo di struttura in generale non sar`a ridotto a SO(1, 3) ma a
O(1, 3). Si verifichi che la riduzione a SO(1, 3) pu`o essere fatta solamente se M `e orientabile.
Indichiamo sempre con la forma orizzontale canonica su O. Non solo `e una uno-forma a valori
in R4 : su R4 `e definito un prodotto scalare Minkowskiano , tale che
g(())( (X), (Y )) = ( (X), (Y ) ,

O , X, Y T O .

Questa, che lasciamo verificare come esercizio, non `e altro che la relazione che lega il vielbein
alla metrica.
Lidea `e quella di usare solo questi ingredienti per costruire unazione su O, invariante sotto
lazione del gruppo di struttura, quindi per trasformazioni di gauge, oltre che per diffeomorfismi.
Linvarianza sotto lazione del gruppo di struttura permette quindi di ridurre lintegrazione sul
quoziente O/G ' M . Poiche non si hanno ulteriori strutture, lazione deve essere costruita
integrando delle quattro-forme su O/G, costruite a partire dalle forme su O, che sono , la
connessione infinitesima e la forma di curvature . Linvarianza di gauge richiede che la
dipendenza da possa avvenire solamente attraverso . La richiesta che le equazioni del moto
siano al pi`
u del secondo ordine equivale a dire che lazione deve dipendere al pi`
u linearmente
da . Infine lazione deve avere la giusta parit`a. Per capire quest ultimo punto, osserviamo che
un possibile esempio di termine da considerare sarebbe
Z
S1 =
(, ) ,
O/G

dove il punto indica lazione di so(1, 3) su R4 . Naturalmente, poich`e gli argomenti del prodotto
scalare sono forme a valore vettoriale e il prodotto va inteso sulla valutazione delle forme,
lintegranda
`e una quattroforma a valori reali. Approfittiamone per specificare cosa si intende
R
con O/G , G essendo il gruppo di struttura. Poiche assumiamo che M sia paracompatto,
ammetter`a un atlante al pi`
u numerabile al quale sia associata una partizione dellunit`a. Questo
ci permette di definire lintegrale localmente, cio`e su U := 1 (U )/G, se U `e un intorno locale.
A questo punto, basta scegliere una qualunque sezione locale (U, O). Detta la quattroforma invariante da integrare, allora
Z
Z
:=
,

11 TEORIA DINAMICA DELLE SIMMETRIE.

222

non dipende dalla scelta di , data linvarianza. Daltra parte `e il vierbein ea (in termini
della base canonica di R4 ). Come esercizio si verifichi che allora
Z
p
Rabcd abcd | det g|d4 x .
S1 |U
U

Questo definisce la densit`a lagrangiana L1 tramite


Z
Z
p
p
4
Rabcd abcd | det g|d4 x ,
L1 | det g|d x :=
U

dove L1 non `e realmente una funzione scalare, dato che si comporta come tale solo per trasformazioni che conservano lorientamento (lo si verifichi!). In questo senso diciamo che S1 non ha
la giusta parit`a.
In conclusione dopo aver elencato tutti i possibili termini lineari in , si ottiene che solo due
soddisfano i requisiti richiesti:
il primo termine, per a R, `e
Z
;

Sa = a
O/G

il secondo termine si costruisce tramite il seguente automorfismo  : so(1, 3) so(1, 3)


per il quale aa b 7 21 a bcd acd . Per b reale sia allora
Z
Sb = b
(, () ) .
O/G

Lazione gravitazionale assume quindi la forma Sa,b = Sa + Sb .


11.4.6 Esercizio. Si dimostri che lespressione locale dei due termini dellazione `e
Z

Sa =
gd4 x ,
ZM

R(x) gd4 x ,
Sb =
M

dove R `e lo scalare di curvatua, una costante proporzionale a b e una seconda costante


proporzionale ad a/b.
Per concludere la nostra deduzione dellazione gravitazionale osserviamo che se 6= 0 allora la
metrica di Minkowski non `e ammessa in assenza di materia. Questo contrasta con il principio di
equivalenza forte, almeno nella versione cos` forte in cui `e enunciato. In conclusione lazione di
Einstein-Hilbert Sb `e lunica compatibile con il principio di equivalenza forte unito alla richiesta
di equazioni del moto di ordine al pi`
u quadratico.
11.4.7 Osservazione. La costante `e la costante cosmologica. In una teoria strettamente
fedele al principio di equivalenza forte essa pu`o comparire come termine efficace proveniente

11 TEORIA DINAMICA DELLE SIMMETRIE.

223

dallazione che contiene i campi di materia (ad esempio le fluttuazioni di vuoto quantistico).
Alternativamente potrebbe in realt`a accadere che il gruppo relativistico in assenza di materia
sia piuttosto un gruppo di de Sitter. In tal caso si dimostra che lazione pi`
u generale compatibile
con tale gruppo sarebbe proprio Sa,b con a e b entrambi non nulli.
11.4.8 Osservazione. Nel costruire Sa , avremmo potuto considerare a non costante, sotto
il segno di integrale. In tal caso lunica scelta possibile sarebbe stata a = + , con e
costanti e una funzione scalare espressa come funzione lineare della curvatura. Il termine
lineare in sarebbe allora della stessa forma di Sb , per cui non si `e persa alcuna generalit`a
nellassumere a costante.

12 CAMPI SCALARI E SPINORIALI.

12

224

Campi scalari e spinoriali.

Testi consigliati: [We], [N1], [N2].


Nel capitolo 11 abbiamo visto come possano essere costruite le teorie di gauge nello spaziotempo di Minkowski. Si `e anche accennato al fatto che esse si accoppiano in modo semplice
ai campi di materia: basta covariantizzare le equazioni del moto tramite la connessione del
campo di gauge, che agisce sui campi tramite una data rappresentazione. In questo capitolo
vogliamo vedere quali siano appunto tali equazioni del moto, limitandoci ai casi interessanti
per lapplicazione al modello standard delle particelle.

12.1

Le particelle e il gruppo di Poincar


e.

Lo studio delle rappresentazioni del gruppo di poincare e la connessione con le particelle elementari richiederebbe un capitolo a s`e stante. Per motivi di spazio accenneremo qui solamente
lidea, rimandando gli approfondimenti a [We].
12.1.1 Algebra di Poincar
e. La relativit`a ristretta identifica lo spazio-tempo con lo spazio
di Minkowski. Come ben noto si tratta di uno spazio isotropo ed omogeneo, il cui gruppo di simmetria (le trasformazioni isometriche) `e il gruppo di Poincare P , costituito dalle trasformazioni
di Lorentz, composte con le traslazioni spazio-temporali:
x x + b ,

O(1, 3) ,

b R4 .

Un campo di materia sar`a caratterizzato da come si comporta sotto trasformazioni di Poincare.


Se pensiamo a come la funzione donda di una singola particella, essa individuer`a un elemento
di uno spazio di Hilbert H, sul quale la trasformazione dovr`a agire unitariamente:
U (, b) .
La mappa U : P U (H), essendo una rappresentazione unitaria di P su H, deve soddisfare
la regola di composizione
U (1 , b1 )U (2 , b2 ) = U (1 2 , b1 + 1 b2 ) .
Il problema diventa quello di classificare le rappresentazioni di questo tipo (infinito dimensionali!). A tale scopo conviene sfruttare la mappa esponenziale riducendosi dunque allo studio
dellalgebra. Non entreremo nei dettagli, non avendo considerato gruppi di Lie infinito dimensionali. Lalgebra di Lie di U (H) `e lalgebra degli operatori antiautoaggiunti su H (non ci
preoccupiamo qui delle questioni di dominio!). Daltra parte lalgebra di Poincare `e generata
dalle matrici a con a := arho antisimmetrica e dalle traslazioni stesse individuate dai
vettori . Possiamo usare {a , } come coordinate locali dellalgebra. Nellintorno dello zero
esse diventano coordinate locali anche per il gruppo, per cui potremo scrivere
i
U (a, ) = exp( a M i P ) ,
2

12 CAMPI SCALARI E SPINORIALI.

225

dove M = M e P sono operatori hermitiani su H. In particolare nelle date coordinate


b)U (, a)1
avremo = + a + . . .. Applicando la regola di composizione a U (, a)U (,
per due arbitrarie trasformazioni infinitesime si trova allora
[M , M ] = i(M + M M M ) ,
[M , P ] = i( P P ) ,
[P , P ] = 0 .
H := P 0 `e il generatore delle traslazioni temporali e pu`o essere identificato con loperatore
hamiltoniano. I generatori che commutano con H sono P i e J i con i = 1, 2, 3 e J 1 = M 2,3 ,
J 2 = M 3,1 e J 3 = M 1,2 . P i sono gli operatori di quantit`a di moto e J i quelli di momento
angolare. Infine K i := M i,0 generano i boost.
12.1.2 Rappresentazioni e piccolo gruppo. Poiche gli operatori P commutano tra loro
si possono considerarne gli autostati (in senso generalizzato):
P k , = k k , ,
dove `e un indice di degenerazione. Su tali stati una pura traslazione U (1, b) agir`a come
U (1, b)k , = eik

k , .

Fissata la segnatura {.+, +, +} per , le rappresentazioni fisicamente significative sono quelle


per le quali k 2 := k k 0 e k 0 > 0.
Una trasformazione di Lorentz U (, 0) agir`a mandando un autostato k , in un altro autostato
di P con autovalore k , come segue dalla regola di composizione. Quindi
X
L(, k) (k) , .
[U (, 0)]k , =

La trasformazione L agisce dunque sugli indici di degenerazione. Essa dovr`a a sua volta rappresentare il gruppo delle trasformazioni di Lorentz ed in realt`a il sottogruppo che lascia invariato
k . Tale gruppo si chiama il piccolo gruppo. Lidea `e dunuque quella di caratterizzare il campo
secondo le rappresentazioni del piccolo gruppo. Rimandando i dettagli a [We], ci accontentiamo
di osservare che vi sono due caratterizzazioni del piccolo gruppo che inducono rappresentazioni
unitarie di interesse fisico:
se k 2 < 0 e k 0 > 0, il piccolo gruppo `e isomorfo al sottogruppo del gruppo di Lorentz che
lascia invariato il vettore (m, 0, 0, 0). m > 0 `e la massa e il piccolo gruppo `e SO(3);
se k 2 = 0 e k 0 := , si ha la rappresentazione a massa nulla e il piccolo gruppo `e isomorfo
` isomorfo al gruppo ISO(2, R) delle
al gruppo che lascia invariato il vettore (, , 0, 0). E
rototraslazioni di un piano euclideo.
Prima di concludere le nostre osservazioni, aggiungiamo un ulteriore commento di tipo generale
sulle rappresentazioni.

12 CAMPI SCALARI E SPINORIALI.

226

12.1.3 Rappresentazioni proiettive e gruppo di ricoprimento. Nelle teorie quantistiche


gli stati sono raggi in uno spazio di Hilbert, dunque risultano definiti a meno di una fase complessa. Ci`o significa in sostanza che in luogo di rappresentazioni lineari nella fisica quantistica
`e pi`
u opportuno considerare rappresentazioni proiettive. Supponiamo cio`e di considerare un
gruppo G del quale vogliamo una rappresentazione unitaria su uno spazio di Hilbert H. Poiche
ogni stato `e definito a meno di una fase, anziche lusuale regola di composizione, pi`
u in generale
potremo richiedere che U : G U (H) soddisfi
U (g1 g2 ) = ei(g1 ,g2 ) U (g1 )U (g2 ) ,

g1 , g2 G ,

dove : G G R `e una funzione che determina la fase. Se si impone lassociativit`a si


ottiene che la funzione di fase deve soddiafare la relazione
(g1 , g2 ) + (g1 g2 , g3 ) = (g2 , g3 ) + (g1 , g2 g3 ) .
Questa viene detta relazione di cociclo ed una sua soluzione si chiama un 2-cociclo chiuso. Ogni
rappresentazione proiettiva `e caratterizzata dunque da un cociclo chiuso. Di questa equazione
esiste sempre una classe di soluzioni, dette cocicli banali o esatti e sono determinati dalle funzioni
f : G R, secondo la relazione
(g1 , g2 ) = f (g1 g2 ) f (g1 ) f (g2 ) ,
e si scrive = f . Si dicono banali perche se = f allora la rappresentazione proiettiva
pu`o essere ridotta ad una lineare (cio`e senza fase) tramite la mappa U 7 U , dove U (g) :=
eif (g) U (g). Se invece un cociclo chiuso non `e banale, la rappresentazione `e intrinsecamente
proiettiva.
Si noti che la moltiplicazione per una fase `e essa stessa un operatore unitario su H, che possiamo
scrivere nella forma eiI , dove I : H H `e loperatore identit`a. Questo ci permette di dire
che dal punto di vista algebrico `e come aggiungere allalgebra dei generatori del gruppo U (G)
loperatore I, che commuta con tutti i generatori in modo che se lalgebra originale era della
forma
[Ja , Jb ] = cab c Jc ,
lalgebra estesa assumer`a ora la forma
[Ja , Jb ] = cab c Jc + cab I ,
[I, Ja ] = 0 .
La nuova algebra si chiama l estensione centrale della vecchia. Le costanti Cab si chiamano
cariche centrali. Lequivalente della condizione di cociclo a livello algebrico `e lidentit`a di Jacobi,
che in particolare implica
cad cd bc + cbd cd ca + ccd cd ab = 0 .
Questa pu`o essere vista come unequazione per le costanti cab .
Dato che lalgebra di partenza soddisfa di per s`e le identit`a di Jacobi, una soluzione banale `e
data da
cab = d cd ab

12 CAMPI SCALARI E SPINORIALI.

227

con d costanti (e sottintendendo la somma su d). Di nuovo questa `e detta banale poiche in tal
caso `e sufficiente ridefinire i generatori Ja := Ja + a I, per eliminare le cariche centrali. Diremo
allora che lestensione centrale in questo caso `e banale. Vale la seguente proposizione.
12.1.4
banali.

Proposizione. Le algebre semisemplici ammettono solamente estensioni centrali

Dimostrazione. Si consideri lequazione


cad cd bc + cbd cd ca + ccd cd ab = 0 ,
di cui si supponga di aver determinato una qualunque soluzione cab . Poiche lalgebra `e semisemplice, la forma di Killing di componenti Kab = cac d cbd c `e non degenere e pu`o essere adoperata per
alzare ed abbassare gli indici delle costanti di struttura. Come al solito K ab indica la matrice
inversa di Kab , mentra Kba = ba . Posto allora
cab c = K ad K bf Kcl cdf l ,
si ha
cd bc cbc a = ad ,
dove si `e usato anche il fatto che cabc `e completamente antisimmetrico a conseguenza della
ad-invarianza. Contraendo allora lequazione di partenza con cbc e , otteniamo
cae = cbd cd ca cbc e + ccd cd ab cbc e = cbd (cd ca cbc e + cd ac ccb e ) = 2cbd cd ca cbc e ,
dove abbiamo ribattezzato gli indici muti (cio`e quelli sommati secondo la convenzione di Einstein) e usato le propriet`a di simmetria. A questo punto usiamo lidentit`a di Jacobi nella
forma
cd ca cbc e = cdc b ce c a cd ce ca cb
per ottenere
cbd cd ca cbc e = cbd (cdbc ce c a + cd ce cbc a ) ,
e, poiche45
cbd cd ce cbc a = cbd cd ca cbc e ,
da cui infine
cae = cbd cdbc ce c a = cae c (cbd cbd c ) = cae c c ,
con c = cbd cbd c . Quindi, se esiste una soluzione, `e necessariamente banale, ovvero tutte le
soluzioni sono banali.
2
12.1.5 Esercizio. Si estenda tale proposizione allalgebra di Poincar`e e alle rototraslazioni.
12.1.6 Ostruzioni topologiche. Ne concludiamo che nei casi che ci interessano, a livello algebrico esistono solo estensioni centrali banali. Questo non basta a impedire lesistenza
45

si usi ad esempio cbd = cdb e si ribattezzino poi opportunamente gli indici muti

12 CAMPI SCALARI E SPINORIALI.

228

di rappresentazioni intrinsecamente proiettive, dato che le questioni algebriche sono locali e


riguardano lintorno dellidentit`a (o un qualunque intorno locale per traslazione). Ci possono
ancora essere questioni globali, di natura topologica. Vale il seguente teorema.
12.1.7 Teorema. Sia G un gruppo di Lie finito dimensionale la cui algebra di Lie ammetta
solamente estensioni centrali banali. Allora la rispettiva equazione di cociclo ammette solo
soluzioni non banali se e soltanto se G non `e semplicemente connesso.
Dimostrazione. Si veda [We].
2
I gruppi ortogonali, euclidei o con segnatura, non sono semplicemente connessi, dato che
contengono cammini noncontraibili. Dunque, benche semplici, ammettono rappresentazioni
proiettive intrinseche, cio`e rappresentazioni per le quali non si pu`o ridefinire la fase con una
ridefinizione. Tuttavia ogni tale gruppo ammette un unico ricoprimento universale (a meno di
che ammette un diffeomorfismo locale
isomorfismi), cio`e un gruppo semplicemente connesso G
e suriettivo
G .
:G
sono quindi solamente lineari. Per i gruppi semplici Ker() `e semLe rapprsentazioni di G
pre un gruppo puntuale finito. Per i gruppi ortogonali speciali il gruppo di ricoprimento `e il
gruppo di spin. In particolare SU (2) `e il ricoprimento di SO(3) e SL(2, C) `e il ricoprimento di
SO(1, 3). In ogni caso Ker = Z2 =: {e, e}.46 Ne segue immediatamente che ogni rappresen In particolare, dato che
tazione proiettiva di G proviene da una rappresentazione lineare di G.
le uniche possibilit`a sono U (e) = I oppure U (e) = I, `e evidente che le rappresentazioni
intrinsecamente proiettive sono quelle per cui U (e) = I. In altre parole sono proprio le rappresentazioni di spin dei gruppi ortogonali che devono comparire nella descrizione quantistica
del mondo. Questo spiega ad esempio perche nella teoria generale del momento angolare compare lintero gruppo SU (2) in luogo di SO(3). In particolare le particelle di spin semidispari (i
fermioni) corrispondono alle rappresentazioni intrinsecamente proiettive di SO(3).
12.1.8 Conclusione. Tornando alle rappresentazioni del piccolo gruppo, si vede dunque
che le rappresentazioni massive, oltre che dal valore della massa m, sono individuate dalle
rappresentazioni spinoriali di SO(3). Possiamo dire che le particelle massive, dal punto di
vista delle simmetrie esterne, sono classificate dalla massa e dallo spin. Naturalmente ulteriori
sottoclassificazioni possono essere indotte dalle simmetrie interne.
Per quanto riguarda invece le particelle di massa nulla occorre considerare le rappresentazioni
di ISO(2). Nel caso in cui si fissi k = (, 0, 0, ) i generatori infinitesimi son J 3 , A :=
K 1 + J 2 e B := K 2 J 1 . Di nuovo non entriamo qui nel dettaglio di come si costruiscono
le rappresentazioni irriducibili, ma ci accontentiamo di enunciare che quelle di interesse fisico
sono classificate dallautovalore delloperatore J 3 , che rappresenta la proiezione del momento
angolare lungo la direzione spaziale della quantit`a di moto. Tale numero quantico si chiama
elicit`
a. Come lo spin, `e vincolata ad assumere valori seminteri, ma questa volta per motivi
topologici anziche algebrici. Nuovamente rimandiamo a [We] per i dettagli.
Osserviamo infine che il gruppo di Lorentz proprio SO(1, 3) non `e connesso, la sua componente
46

indichiamo cio`e con e il generatore di Z2

12 CAMPI SCALARI E SPINORIALI.

229

connessa essendo il sottogruppo che preserva lordinamento temporale, detto gruppo di Lorentz
proprio ed ortocrono.

12.2

Equazione di Klein-Gordon.

Sia M lo spazio-tempo di Minkowski d + 1 dimensionale. I campi scalari sono i campi


che trasformano in maniera banale sotto trasformazioni del gruppo di Lorentz proprio ed
ortocrono. Saranno perci`o sezioni di un fibrato vettoriale (E, , M, SO(1, d), (0 , V )), dove
0 : SO(1, d) Aut(V ) `e la rappresentazione banale SO(1, d) 7 I, I essendo lapplicazione
identica. In generale tuttavia su V potr`a agire la rappresentazione non banale di un gruppo
di gauge. Nel caso di particelle libere qualunque interazione, compresa quella di gauge, deve
essere trascurata. In particolare questo ci porta a richiedere che le equazioni del campo libero
debbano essere lineari.
12.2.1 Particelle scalari libere. Si noti anche che il fibrato dei riferimenti inerziali su M
`e in questo caso banale, cosicche, finche non intervengono le interazioni di gauge, possiamo in
questo caso considerare i campi scalari come funzioni : M V . In fisica si parla allora di
un multipletto di campi scalari di dimensione n pari alla dimensione di V . Possiamo pertanto
assumere semplicemente V = R: il caso generale lo si otterr`a moltiplicando tensorialmente per
V il campo scalare. Del gruppo di Poincare (proprio ed ortocrono) sui campi scalari solamente il
sottogruppo delle traslazioni pu`o agire in maniera non banale. In particolare, dato il loro ruolo
nella determinazione della classificazione dei campi, vogliamo ammettere che gli autostati di P
siano essi stessi soluzioni (in senso generalizzato) delle equazioni del moto. Ne concludiamo che
lequazione per deve essere determinata esclusivamente in termini di m e delloperatore P .
Essendo P il generatore delle traslazioni, esso agir`a sui campi scalari con la rappresentazione
P = i , come si pu`o verificare facilmente.
12.2.2 Esercizio. Si dimostri che sui campi scalari lazione delle trasformazioni infinitesime
:= x P x P .
a `e generata dagli operatori M
La richiesta che le autofunzioni di P siano soluzioni impedisce la comparsa degli operatori
se si vuole che le equazioni differenziali non superino il secondo ordine. In ogni caso M

M
non son caratterizzanti della rappresentazione, dato che non forniscono una rappresentazione
irriducibile del piccolo gruppo. Ne segue che lunica equazione compatibile con le richieste fatte
`e P P = m2 , ovvero (nelle opportune unit`a di misura)
(2 + m2 ) = 0 ,
dove 2 := `e loperatore quadratello. Questa equazione `e nota come equazione di
Klein-Gordon.
12.2.3 Osservazione importante. Abbiamo dedotto lequazione di Klein-Gordon come
lequazione per i campi scalari. Tuttavia supponiamo ora di considerare un campo qualunque
, dove lindice interno individua la rappresentazione non banale del gruppo di Lorentz sullo
spazio interno e che caratterizza il tipo di particella (scalare, spinore,. . .). Essendo naturale

12 CAMPI SCALARI E SPINORIALI.

230

chiedere che gli stati k , che supportano la rappresentazione costituiscano il campo, poiche
P P k , = m2 k , , ne segue che deve valere
(2 + m2 ) = 0
ovvero le singole componenti di un qualunque campo devono soddisfare lequazione di KleinGordon.
Tuttavia, mentre per i campi scalari questa `e lunica equazione (libera) ammessa di ordine
inferiore al terzo, per i restanti campi vi saranno altre equazioni caratterizzanti.
12.2.4 Accoppiamento con il campo di gauge. Supponiamo ora di avere un multipletto
di campi scalari accoppiato con una simmetria di gauge. Ci`o significa che il campo avr`a valore
in uno spazio vettoriale V , sul quale agisce un gruppo G tramite una rappresentazione non
banale . Sia dunque : M V il campo scalare. Sappiamo che possiamo accoppiare questo
campo con un campo di gauge, introducendo un fibrato principale con gruppo di struttura G
sul quale `e definita la connessione che individua il campo di gauge. Se per brevit`a chiamiamo
anche la rappresentazione di Lie(G) su V , indotta dalla rappresentazione di G su V , allora, in
un fissato gauge locale su un aperto U , avremo che il campo di gauge sar`a individuato da una
uno-forma A a valori in (Lie(G)). Scelta una base {a }na=1 dellalgebra, poniamo ia := (a ).
Qui stiamo ammettendo che la rappresentazione sia unitaria, cosicche lunit`a immaginaria rende
hermitiani i generatori a . Fissiamo inoltre una base {ei }m
i=1 di V in modo da rendere matriciale
la rappresentazione. Il multipletto scalare sar`a perci`o individuato da m campi scalari i che
si accoppiano con il campo di gauge tramite la covariantizzazione + iAa a ovvero
dovranno risolvere lequazione
i
( i j + iAa aj
)( j k + iAb bj k )k + m2 i = 0 .

Come si vede, a causa della connessione, i vari campi i non sono pi`
u disaccoppiati. Essi
interagiscono tramite il campo di gauge, cio`e sono carichi rispetto al campo di gauge.
12.2.5 Esercizio. Si scriva unazione S per lequazione di Klein-Gordon
accoppiata con il
R
campo di gauge. Si aggiunga a questa lazione di Yang-Mills SY M = M T r[F F ]d4 x e si
ricavino le equazioni complete del moto, per A e .
12.2.6 Particelle scalari con potenziale. Nel caso dei campi scalare `e interessante considerare il caso in cui il campo sia anche direttamente autointeragente. Ci`o significa che le
equazioni del moto non saranno pi`
u lineari neppure in assenza di campi esterni. Lazione che
genera le equazioni del moto (se ammettiamo che ammettano principio variazionale) non `e pi`
u
vincolata a contenere termini quadratici nei campi. Se L0 `e la densit`a che definisce lazione
libera, lazione del campo autointeragente pu`o essere ottenuta aggiungendo un potenziale alla
lagrangiana:
Z
S[] =
(L0 ())d4 x .
M

Naturalmente il potenziale () dovr`a essere invariante sotto lazione del gruppo di gauge G. Se
ad esempio il gruppo di gauge agisce unitariamente sullo spazio V in cui il campo assume valore,

12 CAMPI SCALARI E SPINORIALI.

231

allora V sar`a ovviamente dotato di un prodotto scalare (, ) : V V C, rispetto al quale (g)


`e unitario, se g G. In tal caso si potr`a considerare come potenziale ((x)) = f (((x), (x))),
dove f `e unopportuna funzione a valori reali. Un tipico esempio `e f (x) = (x v)2 , per un
fissato parametro v R.

12.3

Equazione di Dirac.

Vogliamo ora considerare il caso di particelle spinoriali. Naturalmente siamo interessati al


caso di uno spazio-tempo quadridimensionale, tuttavia vale la pena nuovamente prendere in
considerazione il caso di uno spazio d + 1 dimensionale, come si `e fatto per il campo scalare,
giacche in teorie moderne vengono presi in considerazione spazi-tempo di dimensione maggiore.
Comunque accade in generale che per campi non scalari si ha una forte dipendenza dalla dimensione.
Per esempio basti osservare che nel caso generale, per particelle massive il piccolo gruppo `e
SO(d), e dunque la classificazione delle particelle `e individuata dalle rappresentazioni spinoriali irriducibili di SO(d), che dipendono da d. In generale il caso a massa nulla richiederebbe
unanalisi a s`e stante, tuttavia otterremo le equazioni a massa nulla considerando a partire
dal limite per m 0 delle equazioni massive. Per semplicit`a chiameremo elettrone il campo
spinoriale massivo. Con campo spinoriale intenderemo naturalmente la sezione di un opportuno fibrato. Dedicandoci per ora al caso puramente Minkowskiano, rimandiamo pi`
u avanti le
specificazioni relative alla struttura di tale fibrato.
12.3.1 Lelettrone e le algebre di Clifford. Vogliamo costruire il campo di spin come
una funzione a valori in una rappresentazione del gruppo di spin associato al gruppo di Lorentz
m
SO(d, 1). Se d = 2m o d = 2m 1, le rappresentazioni di spin possono essere costruite su C2 ,
che pu`o infatti essere esteso ad un modulo sinistro sullalgebra di Clifford (complessificata)
Cl(d, 1) R C. Questo definisce un accoppiamento (pairing)
m

: C(d, 1) C2 C2 ,

(, z) 7 z .

Come sappiamo lalgebra di Clifford `e essenziale nella realizzazione del gruppo di spin. Ricordiamo che nel nostro caso lo spazio di partenza `e lo spaziotempo di Minkowski M = Rd,1 ,
provvisto della forma quadratica . Il punto essenziale `e che nellalgebra di Clifford `e contenuto
M come sottospazio vettoriale, cosicch`e il suddetto pairing induce il pairing
m

: M C2 C2 .
In realt`a, nel caso d = 2m 1 in cui lo spazio-tempo ha dimensione pari, come mostrato in
9.2.2, lalgebra di Clifford possiede un automorfismo che la separa negli autospazi positivo
e negativo: C() = C()+ C() . Ad esso corrisponde una decomposizione dello spazio di
m
m1
m1
rappresentazione S := C2 nella somma diretta S = S + S = C2
C2 , che individuano
due sottospazi per rappresentazioni irriducibili per il gruppo di spin. Tuttavia il suddetto
pairing, che risulter`a essenziale nella determinazione delle equazioni del moto, tiene in gioco

12 CAMPI SCALARI E SPINORIALI.

232

entrambe le rappresentazioni, dato che si ha


: M S + S ,
: M S S + .
Il secondo punto fondamentale `e la proposizione 9.2.8 riguardante lomomorfismo . Sia la
rappresentazione di spin del gruppo si Lorentz su S.47 Dati s S, x M e un elemento del
gruppo di Lorentz, vale la propriet`a notevole
()(x s) = ((())x) ((s)) .
La proposizione ci dice dunque che () `e una rappresentazione del gruppo di Lorentz su M ,
cio`e proprio la rappresentazione fondamentale.
Consideriamo ora un campo spinoriale massivo, cio`e una mappa equivariante
: M S ,
che trasforma cio`e secondo la rappresentazione di spin sotto trasformazioni di Lorentz. Alternativamente diremo che (M, SM ), dove SM ' M S `e detto il fibrato di spin. (si
veda 12.6.2). La scelta di un sistema di coordinate inerziali su M , corrisponde ad aver definito
48
su T M delle sezioni {ei }d+1
In particolare, se
i=1 X (M ) tali che (ei , ej ) = ij e [ei , ej ] = 0.

i
`e la derivata covariante di Levi-Civita, si avr`a ei = xi , se x sono le relative coordinate
inerziali. Una trasformazione di Lorentz agir`a tramite su S e tramite := sulle
coordinate in modo che49
j
()(i ) = (1 )i j () .
Ora ricordiamo che lo scopo `e quello di determinare la pi`
u semplice equazione che contenga P j ed
m. Nel caso del campo scalare lunico ingrediente aggiuntivo era la metrica , che ci costringeva
a scrivere unequazione di secondo ordine, in questo caso disponiamo di un ingrediente in pi`
u:
lalgebra di Clifford. Se : M , C(d, 1) `e linclusione di M nellalgebradi Clifford allora
poniamo i := ei . In particolare i j + j i = 2ij . Costruiamo quindi loperatore
D : (M, SM ) (M, SM ) ,

7 D := ij ei j .

Loperatore D `e detto operatore di Dirac. Lasciamo come esercizio la verifica dei seguenti due
punti
loperatore di Dirac non dipende dalla scelta della base ortonormale;
loperatore di Dirac `e covariante sotto trasformazioni di Lorentz su M: ()(D) =
D(()).
47

dunque nel prodotto diretto di due rappresentazioni irriducibili nel caso di dimensione pari
si noti che ci`
o `e possibile poiche T M `e banale
49
cio`e xi 7 ()i j xj
48

12 CAMPI SCALARI E SPINORIALI.

233

La seconda propriet`a segue dalla prima e dalla suddetta propriet`a notevole. In fisica si preferisce
al solito usare Pi = ii , cosicche si costruisce loperatore P
/ := iD. Lequazione cercata
deve quindi avere la forma (P
/ + f (m)) = 0. Applicando loperatore P
/ f (m) ed usando
losservazione 12.2.3 si ottiene che deve essere f (m) = m. Otteniamo finalmente lequazione
di Dirac
(P
/ m) = 0 .
12.3.2 Dimensione pari e chiralit`
a. Consideriamo ora in particolare il caso di spazitempo di dimensione pari. In tal caso un campo di Dirac `e una sezione del fibrato SM =
S + M S M . Il campo si decompone allora nella somma diretta = + + , dove `e una
sezione di S M e sono dette componenti chirali del campo (positiva e negativa). Benche S sono
sottospazi irriducibili per la rappresentazione del gruppo di spin, lequazione di Dirac mischia le
diverse componenti chirali, dato che evidentemente D : (M, S M ) (M, S M ), mentre
la moltiplicazione per la massa agisce in modo banale. In un campo massivo necessariamente
compaiono entrambe le chiralit`a. Le cose cambiano tuttavia per i campi di massa nulla.
12.3.3 Campi chirali: il neutrino. Nel caso di massa nulla ha senso considerare campi
che siano sezioni di S + M o di S M . Essi vengono detti campi chirali, sinistrorso e destrosro
rispettivamente (left e right). Assumiamo che le loro equazioni del moto siano quelle ottenute
dallequazione di Dirac per m = 0. In questo caso esse non mischiano pi`
u componenti left con
componenti right ed ha perci`o senso considerare separatamente campi left o campi right. Si
parla allora di campi chirali. In senso stretto si parla di teoria chirale quando si ha a che fare
con una teoria che coinvolge solamente campi di una determinata chiralit`a. Pi`
u in generale
pu`o accadere che entrambi i tipi di campi compaiano, ma che giuochino un ruolo differente.
Cos` ad esempio nella teoria elettrodebole compaiono elettroni e neutrini e le corrispondenti
antiparticelle. Il campo elettronico contiene entrambe le componenti chirali del campo, mentre
i neutrini sono campi chirali left, che si accoppiano (debolmente) solamente con la componente
left dellelettrone (si veda il capitolo successivo). A questa asimmetria tra campi left e right
corrisponde una violazione della simmetria di parit`a spaziale, come accenneremo nell esempio
12.3.8.
12.3.4 Accoppiamento con i campi di gauge. Come prima laccoppiamento con il campo
di gauge lo si ottiene introducendo una connessione sul fibrato principale in cui viene definito
il gruppo di gauge. Lazione del gruppo di gauge sul campo di spin pu`o avvenire diretta
mente tramite una rappresentazione sullo stesso spazio S, (ad esempio una simmetria U (1)) o
eventualmente su una sua estensione tramite uno spazio di rappresentazione V , come nel caso
del campo scalare. In tal caso potremo parlare di un multipletto di campi spinoriali. Lasciamo
i dettagli come esercizio. Procedendo come in 12.2.4 si ottiene
(i j k + Ab bj k ) k + m j = 0 .
12.3.5 Esempio. Lelettrone in 4D. Consideriamo il caso di uno spazio-tempo
minkowskiano quadridimensionale. In tal caso il campo di Dirac, in un dato riferimento in-

12 CAMPI SCALARI E SPINORIALI.

234

erziale, sar`a descritto da una funzione : M C4 . Se e := definisce il riferimento


ortogonale e = (e ), lazione di su S = C4 puo essere realizzata in termini matriciali. Si possono cio`e determinare delle matrici GL(C4 ) tali che + = 2 I e
( s) = s , dove = 1, . . . , 4 indica la componente in C4 . Le matrici si chiamano
matrici di Dirac. Ricordiamo che esse non sono univocamente determinate, dato che su C4 si
pu`o agire con una trasformazione di spin. Essa corrisponde ad un cambiamento di riferimento
nello spazio interno. Esiste una scelta standard di riferimento rispetto alla quale le matrici di
Dirac assumono la seguente forma








I O
0 1
O 2
O 3
0 =
, 1 =
, 2 =
, 3 =
,
O I
1 0
2 O
3 O
dove i , i = 1, 2, 3 sono le matrici di Pauli




0 1
0 i
1 =
, 2 =
,
1 0
i 0


3 =

1 0
0 1


.

Questo riferimento `e noto come rappresentazione di Dirac. La struttura a blocchi suggerisce di


scrivere il campo di Dirac nella forma


(x)
(x) =
,
(x)
dove e hanno valori in C2 .
Vogliamo considerare il caso in cui lelettrone si accoppi con un campo elettromagnetico. Dal
punto di vista delle teorie di gauge ci`o significa che c`e una simmetria U (1) locale, (x) 7
eiq(x) (x). Il parametro q rappresenta la carica del campo rispetto al gruppo di gauge50 .
Lequazione di Dirac assume pertanto la forma
(P + qA ) m = 0 .
Per chiarire il significato fisico `e opportuno introdurre le unit`a di misura che mettano in evidenza
i parametri fisici: la costante di Planck ~ e la velocit`a della luce c.51 Inoltre conviene scrivere
le equazioni in termini dei campi e
i~t = mc2 + c

3
X
i=1

i~t = mc2 + c

q
q
i (i~i + Ai ) + A0 ,
c
c

3
X
i=1

q
q
i (i~i + Ai ) + A0 .
c
c
2

Nel limite non


dominano
i termini in mc2 e si ha eimc t/~ u , eimc t/~ u ,
 relativistico



1
0
dove u+ =
e u =
. Si noti che in particolare corrisponde a stati ad energia
0
1
50

se q = 0 allora il campo trasforma banalmente per trasformazioni di gauge. In tal caso si dice che il campo`e
neutro
51
in particolare x0 = ct

12 CAMPI SCALARI E SPINORIALI.

235

negativa. Per interpretare fisicamente il campo di Dirac nel limite relativistico, cerchiamo
soluzioni a energia positiva, imponendo la dipendenza temporale in tale limite nella forma
2
2
= eimc t/~ e = eimc t/~ . Dalla seconda equazione (trascurando i termini in t e in
A0 ) si ricava allora in funzione di , che sostituito nella prima fornisce
3

,
i~t = H

X
q 2
q ~X
= 1
H
i Bi + qV ,
P i + Ai +
2m i=1
c
mc 2 i=1

Questa `e lequazione di Schrodinger per un elettrone in un campo elettromagnetico con


~ = rotA,
~ se m `e la massa sellelettrone e q = e la sua
quadripotenziale A , A0 = cV , B
carica.
12.3.6 Esercizio. Si consideri lequazione di Dirac per un campo massivo (in 4D). Si
dimostri che = = h, i (il prodotto hermitiano in C4 ) definisce la densit`a di una quantit`a
conservata. In particolare si verifichi che la corrente spaziale associata `e j i = 0 i .
12.3.7 Principio dazione per il campo di Dirac. Come al solito `e conveniente disporre
di un principio dazione, ad esempio per includere il campo di Dirac in teorie contenenti altri
campi. Lesercizio precedente suggerisce immediatamente quale debba essere lazione per il
campo di Dirac: posto := 0 , si dimostri che lazione
Z
/ m)d4 x ,
(P
SD [] = k
M

` ovviamente
fornisce un principio variazionale per lequazione di Dirac. Qui si usi P
/ = . E
0
importante il fatto che nella rappresentazione di Dirac sia hermitiana mentre i sono antihermitiane rispetto al prodotto scalare di C4 . Per definire lazione nel caso generale occorre
mostrare che esistono sempre delle matrici di Dirac in qualunque dimensione. Questo lo si fa
facilmente per induzione. Sia d la dimensione dello spaziotempo.
m
Consideriamo dapprima il caso d = 2m. I campi di Dirac (massivi) avranno perci`o valori in C2 .
m
Supponiamo di conoscere una rappresentazione di Dirac: le matrici di Dirac, GL(C2 ),
= 0, i e i = 1, . . . , d 1 soddisferanno { , } = e saranno antihermitiane se i = ,
mentre 0 sar`a hermitiana.
N GL(C2m ), N = 0, . . . , d nello spaziotempo
Vogliamo allora costruire le matrici di Dirac
di dimensione d + 1 = 2m + 1. Si verifica immediatamente che basta porre
:= ,

= 0, . . . , d 1 ,
d1
Y

d :=
.
=0
m

Viceversa, supponiamo d = 2m+1 e siano note le matrici di Dirac GL(C2 ), = 0, . . . , d


M GL(C2m+1 ), M = 0, . . . , d, nel
1, con le proprieta richieste. Costruiamo allora le matrici

12 CAMPI SCALARI E SPINORIALI.

236

seguente modo


0 :=

i :=

d :=

I O
O I
O i
i O

,


O i0
i0 O

i = 1, . . . , d 1 ,

,

.

12.3.8 Esempio. Chiralit`


a e parit`
a. Tornando al caso d = 4, si introduca la matrice
5 := i0 1 2 3 . Essa `e hermitiana e anticommuta con le matrici di Dirac. Inoltre si tratta di
una matrice a traccia nulla il cui quadrato `e lidentit`a. Consideriamo la trasformazione di spin
7 5 . Ad essa corrisponde la trasformazione 7 = ( ), dove `e lautomorfismo
dellalgebra di Clifford che definisce la chiralit`a.
Si consideri ora trasformazione di inversione spaziale, che cambia segno alle coordinate spaziali,
lasciando invariata quella temporale. Essa sar`a rappresentata da qualche operatore P si sui
campi di spin, tale che P i P 1 = i se i = 1, 2, 3, mentre P commuta con 0 . Ne segue che
in particolare P 5 P 1 = 5 . Questo significa che loperatore di parit`a scambia tra di loro gli
stati di chiralit`a opposta. Una teoria che privilegia in modo differente stati di diversa chiralit`a
non pu`o perci`o essere simmetrica per inversione spaziale. Daltra parte `e noto che la parit`a `e
violata in natura.

12.4

Il gruppo SO(1, 3)

Vale la pena approfondire lanalisi delle rappresentazioni di Spin del gruppo di Lorentz, come
applicazione della teoria sviluppata nel capitolo 9.
12.4.1 Matrici . Come in 12.3.5 consideriamo le seguenti 4 matrici 0 , . . . , 3 M4 (C):








O 2
O 3
I O
O 1
,
0 =
, 1 =
, 2 =
, 3 =
3 O
2 O
O I
1 O
dove i , i = 1, 2, 3 sono le matrici di Pauli




0 1
0 i
1 =
, 2 =
,
1 0
i 0


3 =

1 0
0 1


.

Si notino in particolare le propriet`a seguenti:


1 2 = 2 1 = i3 ,

1 3 = 3 1 = i2 ,

2 3 = 2 3 = i1 ,

che sono utili per mostrare che


20 = I,

2i = I,

(i = 1, 2, 3),

i j = j i

(i, j = 0, 1, 2, 4).

12 CAMPI SCALARI E SPINORIALI.

237

Ne segue che lapplicazione lineare


j : R4 M4 (C),

j((x0 , . . . , x3 )) = x0 0 + . . . + x3 3

(cio`e j(ei ) = i ) soddisfa:


j(x)2 = (x0 0 + . . . + x3 3 )2 = (x20 x21 x22 x23 )I.
La propriet`a universale dellalgebra di Clifford d`a allora un omomorfismo di R-algebre:
J : C(1, 3) := C(Q1,3 ) M4 (C)

tale che J(v) = j(v)

per ogni v R4 C(1, 3).


Poiche vogliamo descrivere il gruppo di spin
Spin(1, 3) := { x C(1, 3)+ : xx = 1,

xV x1 V },

cominciamo anzitutto a caratterizzare lalgebra di Clifford pari.


12.4.2 Lalgebra di Clifford pari. Lalgebra di Clifford pari C + (1, 3) ha dimensione 8 (su R)
ed ha una base data da 1, ei ej , e1 e2 e3 e4 dove gli ei sono i vettori base di R4 . Quindi J(C + (1, 3))
`e generato dalle matrici I, 0 j (j = 1, 2, 3), j k (1 j < k 3) e 5 := 0 1 2 3 . Si ha:



 



0 j
j k
0
il
0
0 iI
0 j =
, j k =
=
, 5 =
,
j 0
0
j k
0
il
iI 0
dove {j, k, l} = {1, 2, 3}. La propriet`a i j = j i per i 6= j implica che per ogni j:
5 j = j 5

quindi 5 (j k ) = (j k )5

qundi 5 commuta con ogni elemento dellalgebra di Clifford pari C + (1, 3). Segue che ogni
autospazio di 5 `e invariante per C + (1, 3).
Consideriamo lapplicazione C-lineare
+, : C2 C4 ,

+ (z1 , z2 ) = (z1 , z2 , z1 , z2 ),

(z1 , z2 ) = (z1 , z2 , z1 , z2 ),

cio`e, in blocchi, si ha + (z) = (z, z) e (z) = (z, z). Allora (C2 ) sono i due autospazi di
5 con autovalori i:

  

0 iI
z
iz
5 (z) = i (z),
perche
=
iI 0
z
iz
e similmente 5 + (z) = +i+ (z). Poiche sono C-lineari si ha 5 (z) = (iz).
Come si `e detto prima, questi autospazi sono invarianti per C + (1, 3). In particolare, per
ogni J(C + (1, 3)) esiste un A End(C2 ) = M2 (C) tale che
(z) = (A z)

per ogni z C2 .

12 CAMPI SCALARI E SPINORIALI.

238

Si verifica facilmente che si ha:


0 j (z) = (j z),

j k (z) = (il z).

In questo modo otteniamo un omomorfismo di algebre:


J(C(1, 3)+ ) End(C2 ) = M2 (C),

7 A

e si ha:
AI4 = I2 ,

A0 j = j ,

Aj k = il ,

A5 = iI2 .

Ora `e facile vedere che questo omomorfismo `e suriettivo. Poiche dimR C + (1, 3) = 23 = 8 =
dimR M2 (C) si hanno allora gli isomorfismi:

C(1, 3)+ J(C + (1, 3)) M2 (C),

c 7 J(c) = 7 A .

12.4.3 Il gruppo Spin(1, 3). Da 9.2.7 si ha la definizione


Spin(1, 3) := { x C(1, 3)+ : xx = 1,

xV x1 V },

dove, per x = x1 . . . x2k C + (1, 3) si ha x = x2k . . . x1 . Come appena visto in 12.4.2,


C + (1, 3)
= J(C + (1, 3)) M4 (C) e J(C + (1, 3))
= M2 (C).
+
+
Lantiinvoluzione : C (1, 3) C (1, 3) induce allora unantiinvoluzione, indicata ancora
con , su M2 (C) nel modo seguente:
: M2 (C) M2 (C),

A = AJ(x) 7 A := AJ(x ) .

Se j 6= k, si ha j k = k j . Quindi
j = A0 j 7 j = Aj 0 = A0 j = j ,

il = Aj k 7 Aj k = il ,

e si noti che
5 = (0 1 2 3 ) = 3 2 1 0 = 0 1 2 3 = 5 ,

quindi iI = A5 7 A5 = iI.

Perci`o lantiinvoluzione manda la base I, iI, j , ij (j = 1, 2, 3) di M2 (C) nella base


I, iI, j , ij . Cio`e, fissa le matrici diagonali e cambia il segno alle matrici con traccia
zero:




a+b
c
a b c

X=
7 X :=
.
d
ab
d a + b
Gli elementi x C + (1, 3) con xx = 1 corrispondono alle matrici X M2 (C) tale che
XX = I, cio`e:


  2
 

a+b
c
a b c
a b2 cd
0
1 0

XX =
=
=
,
d
ab
d a + b
0
a2 b2 cd
0 1

12 CAMPI SCALARI E SPINORIALI.

239

poiche det X = a2 b2 cd, troviamo allora


{x C + (1, 3) : xx = 1 }
= SL(2, C).
Dato che SL(2, C) `e connesso, la componente connessa Spin(1, 3)o di Spin(1, 3) che contiene
lidentit`a `e contenuta in SL(2, C). Visto che SL(2, C) ha dimensione complessa 3 e quindi
dimR SL(2, C) = 6 = dim SO(1, 3) = dim Spin(1, 3), concludiamo che
Spin(1, 3)o
= SL(2, C),
un risultato che abbiamo gi`a ottenuto ad hoc in 8.2.5 (si noti che O(1, 3)
= O(3, 1)).
12.4.4 Spinori di Majorana. Esiste un sottospazio reale V C4 , con dimR V = 4, tale che
J(x)v v,

x C + (1, 3), v V

e t.c. C4 = V iV
= V R C.

Gli elementi di V sono detti spinori di Majorana (vedi 9.4.3). Si noti che tale V non `e unico:
per ogni t C anche il sottospazio reale tV = {tv : v V } soddisfa le stesse condizioni.
Lalgebra reale J(C + (1, 3))
= C + (1, 3) ha R-base I, 0 i , j k , 5 = 1 . . . 4 con i = 1, 2, 3
e 1 j < k 3. Poiche j k = 0 j 0 k , basta trovare un sottospazio reale V tale che
0 i v V per ogni v V , i = 1, 2, 3 e tale che C4 = V iV .
Per trovare tale V osserviamo che lazione di x C + (1, 3) su (C2 ) `e data da AJ(x) (vedi
12.4.2). In maniera simile, sia BJ(x) M2 (C) definito da
J(x)+ (z) = + (BJ(x) z)

(z C2 );

si ha 0 i + (z) = + (j z)

come si verifica facilmente. Si ricordi che C4 = + (C2 ) (C2 ) (la decomposizione in autospazi
per 5 ), e quindi si ha
(+ (z) + (w)) = + (B z) + (A w)

( J(C + (1, 3), z, w C2 ).

Le matrici A e B non sono indipendenti, infatti si verifica facilmente che:




0 1
i S = Si ,
(i = 1, 2, 3) con S =
1 0
(si noti che il complesso coniugato i di i `e i stesso se i = 1, 3 e 2 se i = 2). Questo implica
che i = Si S 1 e poiche (i , i ) = (B0 i , A0 i ) otteniamo
B0 i = SA0 i S 1 .
Poiche A0 = A A0 per ogni , 0 J(C + (1, 3)) e similmente per B, com`e facile verificare,
otteniamo:
Bj k = B0 j B0 k = SA0 j S 1 SA0 k S 1 = SA0 j A0 k S 1 = SAj k S 1 ,

12 CAMPI SCALARI E SPINORIALI.

240

e analogamente B5 = SA5 S 1 . Quindi per ogni J(C + (1, 3)), cio`e una combinazione
lineare con coefficienti reali di prodotti 0 i , si ha
J(C + (1, 3)).

B S = SA ,

Come gi`a osservato, rispetto alla decomposizione C4 = + (C2 ) (C2 ), lazione di


J(C + (1, 3)) `e data da (B , A ) = (SA S 1 , A ). Adesso `e facile vedere che il sottospazio reale
V

:= {+ (Sz) + (z) C4 : z C2 }
= {(z2 , z1 , z2 , z1 ) + (z1 , z2 , z1 , z2 ) C4 : z1 , z2 C }

`e invariante per lazione di J(C + (1, 3)):


(+ (Sz) + (z)) =
=
=
=

+ (B Sz) + (A z)
+ (SA (z)) + (A z)
+ (SA z)) + (A z)
+ (Sw) + (w) V,

dove w := A z C2 . Una R-base di V `e data dai quattro vettori


f1 = (1, 1, 1, 1),

f2 = (i, i, i, i),

f3 = (1, 1, 1, 1),

f4 = (i, i, i, i)

(si noti che f1 = + (S(1, 0)) + ((1, 0)), f1 = + (S(i, 0)) + ((i, 0)) ecc.). Lazione dei
generatori 0 i di J(C + (1, 3)) su questa base `e data da
0 1
0 2
0 3

f1 f2
f3
f4
f3 f4
f1
f2
f2 f1 f3 f4
f1 f2 f3 f4 ,

e si noti che i coefficienti delle matrici di 0 i rispetto a questa base sono proprio reali. E facile
vedere che C4 = V iV (si considerino f1 f3 , f2 f4 ), quindi abbiamo trovato gli spinori di
Majorana.
12.4.5 Loperatore di coniugazione di carica C. Alla luce di quanto appena visto, si
consideri loperatore
C : C4 C4 , + (z) + (w) 7 + (S w)
+ (S z) .
Esso `e detto operatore coniugazione di carica per il motivo che vedremo in 12.4.7. E evidente
che se V `e lo spazio reale che individua gli spinori di Majorana allora
C|V = idV
ed inoltre `e antilineare e involutivo (si ricordi che S 2 `e lidentit`a). Dunque possiamo dire che
gli spinori di Majorana sono gli spinori reali rispetto alla coniugazione C.

12 CAMPI SCALARI E SPINORIALI.

241

12.4.6 Esercizio. Si dimostri che


C = i2 ,
dove `e lusuale coniugazione complessa in C4 .
12.4.7 Esempio. Il positrone e le antiparticelle. Sia la funzione donda di un elettrone,
che quindi soddisfa lequazione di Dirac
(P + qA ) m = 0 .
Notando che 2 i 2 = i (il complesso coniugato della matrice i ), posto
C := C ,
si ottiene immediatamente che C `e soluzione dellequazione
(P qA ) C m C = 0 ,
cio`e la stessa dellelettrone, ma con carica opposta. La particella descritta da C si chiama
il positrone. Tale risultato `e valido per qualunque particella di spin 12 , sia che sia carica o
meno, sia che sia massiva o meno. In ogni caso C descrive lantiparticella corrispondente alla
particella descritta da . Per esempio per il neutrino chirale a massa nulla, lantineutrino ha
chiralit`a opposta.
Tale propriet`a, che ad ogni particella corrisponde unantiparticella, `e vera per qualunque tipo
di particella, a prescindere dallo spin.52
12.4.8 Esercizio. Si consideri una particella scalare carica descritta da un campo di KleinGordon massivo. Si dimostri che a meno della moltiplicazione per un fattore di fase, loperatore
di coniugazione di carica `e dato semplicemente dalla coniugazione complessa.
12.4.9 La complessificazione di Lie(SO(1, 3)). La rappresentazione di SO(1, 3)o
=
2
2
SL(2, C) su C induce una rappresentazione dellalgebra di Lie Lie(SO(1, 3)) su C )
R : Lie(SO(1, 3)) End(C2 ).
Lalgebra di Lie Lie(SO(1, 3)) `e un algebra di Lie reale (perche SO(1, 3) `e un gruppo di Lie
reale), anche se, per un miracolo,
Lie(SO(1, 3))
= Lie(SL(2, C))
= M2 (C)o ) := {X M2 (C) : tr(X) = 0 },
le matrici con traccia nulla, formano gi`a uno spazio vettoriale complesso di dimensione tre.
Per ottenere il legame con la teoria delle rappresentazioni di algebre di Lie complesse semplici, dobbiamo allora considerare la complessificazione dellalgebra di Lie Lie(SO(1, 3)) che ha
una rappresentazione sulla complessificazione di C2 , cio`e, la rappresentazione
: Lie(SO(1, 3))C := Lie(SO(1, 3)) R C End(C2 ) R C,
52

X z 7 R (X) z,

Eventualmente lantiparticella coincide con la particella, come accade ad esempio per il fotone.

12 CAMPI SCALARI E SPINORIALI.

242

per X Lie(SO(1, 3)) e z C.


Nel caso in cui uno spazio vettoriale V abbia gi`a una struttura di spazio vettoriale complesso,
la sua complessificazione VC := V R C ha una decomposizione canonica (cio`e intrinseca), data
dai due autospazi per lazione di C su V . Quindi si considera laplicazione R-lineare
J : V V,

Jv := iv.

Gli autovalori di J sono i, i C (si usi J 2 = I) e VC `e la somma diretta degli autospazi di


J:
VC = Vi Vi ,
Vi := {w VC : (i 1)w = (1 (i))w }.
Si noti che questa decomposizione gode della propriet`a seguente: se
v 7 (v+ , v ) Vi Vi

allora ((a + bi)v) z 7 ((a + bi)zv+ , (a bi)zv )

per v V , a + bi, z C con a, b R.


In particolare, otteniamo
Lie(SO(1, 3)C
= End(C2 )oC
= End(C2 )o End(C2 )o ,
e, poiche Lie(SO(1, 3)C
= Lie(SO(4)) = so(4), questo `e lisomorfismo di algebre di Lie so(4)
=
sl(2) sl(2) che abbiamo gi`a osservato in 8.4.4. La rappresentazione , che `e C-lineare, `e la
somma diretta delle due rappresentazioni spinoriali di so(4):
: Lie(SO(1, 3))C
= Endo (C) Endo (C) End(C2 )C = End(C2 ) End(C2 ),
la C-linearit`a di R : Lie(SO(1, 3)) = End(C2 )o End(C2 ) garantisce infatti che mandi gli
autospazi della moltiplicazione con i1 su End(C2 )o negli autospazi corrispondenti in End(C2 ).

12.5

Campi di spin 1.

Benche la costruzione delle equazioni del moto per i campi di spin 1 richiederebbe unanalisi
ulteriore, usiamo un punto di vista semplificativo per i nostri scopi. Da 12.3.7 e lesercizio
precedente, segue facilmente che da un campo di Dirac massivo si pu`o ottenere un campo
. Oltre allequazione di Klein-Gordon esso soddisfa lequazione
vettoriale definendo V :=
V = 0. Assumeremo entrambe come equazioni definitorie per un campo vettoriale.

12.6

Campi e gravit`
a (cenni).

Vogliamo ora considerare molto brevemente alcune questioni riguardanti laccoppiamento dei
campi di materia con il campo gravitazionale.
12.6.1 Esercizio. Equazioni covarianti. Si `e mostrato che un modo di introdurre laccoppiamento con il campo gravitazionale `e quello di covariantizzare le equazioni, introducendo

12 CAMPI SCALARI E SPINORIALI.

243

una metrica e la derivata covariante di Levi-Civita. Consideriamo ad esempio un campo di


Klein-Gordon (2 + m2 ) = 0. Allora la covariantizzazione ci porta allequazione
(g + m2 ) = 0 .
Tuttavia notiamo che esiste un secondo modo di scrivere lequazione di Klein-Gordon nello
spazio di Minkowski. Posto d := d, dove `e il duale di Hodge, allora si ha (sulla 0forma
) 2 = 12 (d d + dd ). Nel caso di un manifold arbitrario con metrica g il duale di Hodge si
costruisce come in 1.3.7, utilizzando un vielbein. Si usi
1
(d d + dd ) + m2 = 0
2
per definire lequazione di Klein-Gordon su uno spazio curvo. La si esprima esplicitamente in
termini della derivata covariante e si confronti il risultato con lequazione precedente.
12.6.2 Fibrati spinoriali. Lequazione di Dirac pu`o essere definita su variet`a che ammettano
la struttura di fibrato spinoriale. Per definire una tale struttura occorre poter restringere
il gruppo di struttura dal gruppo lineare generale al gruppo di spin. Poiche daltra parte
quest ultimo `e il ricoprimento del gruppo speciale ortogonale, deve accadere anzitutto che M
sia una variet`a orientabile. Data una famiglia di banalizzazioni locali del fibrato tangente,
come mostrato in 10.1, il fibrato sar`a caratterizzato da una famiglia di mappe di transizione
1
g : U U SO(p, q).53 Esse devono soddisfare ovviamente le condizioni g = g
e g g g = 1. Nella seconda relazione ovviamente le funzioni si intendono ristrette su
U U U . Il punto `e che per generare un fibrato di spin bisogna poter sollevare le funzioni
di struttura a funzioni a valori nel gruppo di spin, cio`e : U U Spin(p, q), con le stesse
suddette propriet`a. Si fissi un sollevamento qualunque (per ogni U U ). Da 9.2.8 vediamo che
deve essere = g e, poiche Ker() = 1, ne segue che = 1. Si dimostri che si
pu`o ottenere il sollevamento cercato se esiste una famiglia di funzioni : U U {1, 1},
tale che = . Questa `e detta condizione di cociclo e se esiste, si dice che
la mappa w : U U U `e un cociclo banale. La banalit`a di w `e una propriet`a
topologica della variet`a di base M . Se M ha una tale propriet`a diremo che `e una variet`a di
spin.
Sia dunque M una variet`a di spin. Possiamo quindi costruire il fibrato di spin SM . Fissato
localmente un vielbein ei ed una connessione su SM , `e be definito loperatore di Dirac
D : (M, SM ) (M, SM ) tramite D := ij ei ej , dove il punto indica il pairing
: T M SM SM indotto dal prodotto di Clifford, come in precedenza. In particolare
se `e la connessione infinitesima sul fibrato dei riferimenti,54 si ottiene la derivata covariante
sui campi spinoriali tramite := (ei + 21 ij ij ), dove ij := 12 [i , j ]. Segue infatti da
9.3.1 che ij , 0 i < j d 1 (dove d = dim(M )) sono i generatori di una rappresentazione
spinoriale di so(p, q). Chiameremo questa la connessione di spin.
12.6.3 Esercizio. Su una variet`a di spin M , si consideri lequazione di Dirac costruita con
la connessione di spin: (iD m) = 0. Si ricavi lequazione del secondo ordine ottenuta
53
54

dove p, q individuano la segnatura


dunque una 1forma a valori in so(p, q)

12 CAMPI SCALARI E SPINORIALI.

244

moltiplicando per loperatore iD + m. Si discuta il risultato alla luce del precedente esercizio
e delle osservazioni fatte in 12.2.3.

13 GEOMETRIA DEL MODELLO STANDARD E GUT.

13

245

Geometria del Modello Standard e GUT.

Testi consigliati: [CL], [CL2].


Poiche una ricostruzione del modello standard delle particelle richiederebbe ovviamente
molto spazio, ci accontentiamo di unesposizione rapida che porti direttamente ad evidenziarne
il contenuto geometrico. Ovunque in questo capitolo adotteremo il formalismo dei fisici, valido
in coordinate locali o in un fissato gauge, lasciando come esercizio la formulazione rigorosa
nei termini matematici introdotti nei capitoli precedenti. La sezione seguente `e puramente
descrittiva.

13.1

I campi del modello standard.

Vediamo anzitutto quali sono i campi che intervengono nella fisica delle particelle elementari.
13.1.1 I leptoni. Vi sono due classi evidenti di particelle costituenti la materia. La prima
classe consiste di particelle elementari leggere: i leptoni. Si tratta di particelle di spin 1/2,
suddivise in tre famiglie.
La prima famiglia `e costituita dallelettrone e , il neutrino elettronico e e le rispettive
antiparticelle, il positrone e+ e lantineutrino elettronico. Lelettrone e il positrone sono
carichi, mentre i rispettivi neutrini sono neutri e la loro massa `e talmente piccola da
potersi considerare in prima approssimazione nulla55 .
La seconda famiglia `e costituita dal muone , il neutrino muonico e le rispettive
antiparticelle. Mentre le cariche sono le stesse, il muone `e molto pi`
u pesante dellelettrone.
La terza famiglia `e costituita dal tauone , il neutrino tauonico e le rispettive
antiparticelle. Il tauone `e il pi`
u pesante dei leptoni.
Le particelle cariche ovviamente interagiscono elettromagneticamente. Tutti i leptoni comunque
interagiscono anche in un secondo modo, cio`e mediante interazione debole. Essa `e responsabile
ad esempio del decadimento del muone che si trasforma in elettrone emettendo un neutrino
muonico ed un antineutrino elettronico. Linterazione debole vede in effetti ogni neutrino con
il corrispondente leptone carico, come le due componenti di un doppietto isotopico, sul quale
agisce una simmetria SU (2). Alcuni esperimenti mostrano inoltre che linterazione debole
viola la parit`a spaziale. In effetti si trova che tali esperimenti sono ben descritti dalla teoria
se si assume che i neutrini siano chirali con chiralit`a left. Essi interagiscono solamente con le
componenti left dei leptoni carichi negativamente. Le componenti right di questi ultimi saranno
dunque descritte da singoletti di SU (2).56
13.1.2 Gli adroni e lottuplice via. Gli adroni costituiscono una vastissima collezione di
particelle che si suddividono in due principali famiglie: i mesoni e i barioni. Tutte queste particelle sono composte e interagiscono sia elettromagneticamente, sia debolmente e sia fortemente.
55
56

la questione sulla massa dei neutrini non verr`a qui considerata e in ogni caso assumiamo che sia trascurabile
per le antiparticelle i termini left e right vanno interscambiati

13 GEOMETRIA DEL MODELLO STANDARD E GUT.

246

Linterazione forte `e responsabile ad esempio dellattrazione tra nucleoni o di decadimenti molto


veloci (con tempi di decadimento dellordine di 1023 secondi). I mesoni sono particelle con spin
intero, dunque bosoni, e quelli instabili possono decadere lasciando solamente leptoni o fotoni
come prodotti di decadimento. I barioni, che comprendono protoni e neutroni, sono invece
particelle di spin semidispari, dunque fermioni, e quelli instabili decadono lasciando comunque
barioni come prodotti di reazione.
Come si `e detto gli adroni non sono particelle elementari, ma sono composte. I mattoni costituenti sono i quark, che sono particelle di spin 1/2 e carica frazionaria. I mesoni sono costituiti
ad esempio da coppie di quark ed antiquark, mentre i barioni sono costituiti da un numero da
tre quarks (o tre antiquarks). Consistentemente ad ogni quark si associa numero barionico 1/3
(con il segno meno per gli antiquarks). Il decadimento del neutrone, che si trasforma in un
protone emettendo un elettrone ed un antineutrino elettronico, oltre a mostrare che i quark
come i leptoni possono interagire anche debolmente, suggerisce appunto che i quark compaiano
in doppietti isotopici, proprio perche se non differissero per la carica, neutrone e protone compaiono in maniera simmetrica nelle interazioni nucleari. Originariamente si pensava dunque a
due quarks: lup e il down costituenti il doppietto
 
u
.
d
Poiche a neutrone e protone si associava spin isotopico 1/2, con terza componente +1/2 per
il protone e 1/2 per il neutrone, si faceva lidentificazione p = uud e n = ddu. Le cariche
elettriche dei quark devono essere dunque 2/3 per u e 1/3 per d. Oggi si sa che i quark, come
i leptoni, sono suddivisi in tre famiglie (con i corrispondenti antiquarks)57 , di masse via via
crescenti:
i quarks up (u) e down (d) con terza componente dello spin isotopico T3 =
rispettivamente e cariche q = 32 e q = 13 ;

1
, 12
2

il quark charm (c al quale `e associato il numero quantico di incanto c = 1) con T3 = 12 ,


q = 23 e il quark strange (s avente stranezza s = 1) con T3 = 12 , q = 13 ;
il quark top (t al quale `e associato il numero quantico t = 1) con T3 = 12 , q =
beauty (o bottom) (b avente bellezza b = 1) con T3 = 12 , q = 13 .

2
3

e il quark

Come prima, i doppietti riguardano le componenti left responsabili delle interazioni deboli,
` comunque interessante osservare
mentre le componenti right sono disposte in singoletti. E
che, dato che i quarks c, b, t sono molto pesanti, furono scoperte dapprima quelle particelle
costituite dai quark up, down e strange. In particolare vi erano alcuni decadimenti che dovevano
essere attribuiti a interazioni forti (dato che non coinvolgevano n`e fotoni n`e neutrini), ma
ciononostante avvenivano in tempi molto pi`
u lunghi di quelli tipici delle interazioni forti. Le
particelle che decadono in questo modo vennero perci`o battezzate strane e il fenomeno fu
attribuito alla tendenza a conservare un nuovo tipo di numero quantico, detto appunto la
stranezza.
57

pi`
u precisamente la quantizzazione risulta consistente solamente se il numero di famiglie di quarks `e uguale
al numero di famiglie leptoniche

13 GEOMETRIA DEL MODELLO STANDARD E GUT.

247

c
c

c
s s

T
 T
c
c

T

T
c

T

T

Tscd
u
sc

Q = 1/3

T3

csu
sc
T

T

c
T

T

c
c
T

T 
Tsc

0
0ss
c

(dss)

csp (uud)
T
T
c
T
T
c
T
T
Tcs+ (uus)
T3


c


c


sc 0


K 0 (d
s)

Q=0

sc





c


(d
u) s
c
T
T
c
T
T
c
T
T
Tsc

(s
u)

Q = 1

Q=1

Decupletto dei Barioni


Q = 1
(ddd)

Ottetto dei Mesoni

(uss)

Q = 1

T3

sc





c


(dds) s
c
T
T
c
T
T
c
T
T
Tsc

Q = 1/3

Ottetto dei Barioni


n (ddu)

c
Q = 2/3

c
d

Q = 2/3

Q=0

Q=1

0 (ddu)

+ (uud)

Q=2
++ (uuu)

s
sc
sc
s
T

T

c
c
c
T

T

c
c
T

T

0 (dus)
+
(dds)Tsc

cs (uus)
sc
T

T3
T

c
c
T

T

c
c
c
T

T

Tsc

sc
 0 (uss)
(dss) T
T

c
T

T

T

T 
Ts
(sss)

0
c
ss

csK + (us)
T
T
c
T
T
c
T
T

Tcs+ (ud)
T3


c


c


sc 0
K (sd)

Q=0

Q=1

13 GEOMETRIA DEL MODELLO STANDARD E GUT.

248

Le particelle potevano quindi essere classificate riunendole in schemi, secondo la loro stranezza (disposta in maniera crescente dal basso verso lalto) e alla loro carica (crescente nella direzione obliqua SO-NE), come mostrato nella pagina precedente. Gli ottetti e il decupletto in
effetti ricordavano i pesi delle rappresentazioni irriducibili di su(3) mentre gli schemi associati
alle rappresentazioni fondamentali non comparivano. Nonostante ci`o, era naturale ipotizzare
lesistenza di tre particelle (e le loro antiparticelle) corrispondenti a tali rappresentazioni, e che
dovessero costituire i mattoni fondamentali della materia. Essi furono chiamati quark.58 Il fatto
che tuttora non si riescano a vedere i quark liberi, cio`e non in stati legati come nei multipletti,
`e attribuito ad un meccanismo che impedisce ai quarks di muoversi liberamente, almeno alle
energie finora disponibili: il meccanismo del confinamento. In particolare si noti che tutti gli
stati legati che compaiono, hanno carica elettrica intera. Il meccanismo del confinamento `e un
mistero che a tuttoggi attende una spiegazione soddisfacente. La ricerca di stati con carica
frazionaria, o dei quark isolati ha comunque fino ad ora dato esito negativo.
Se assumiamo che i quark up, down e strange siano i tre stati della rappresentazione fondamentale e gli antiquark quelli della coniugata, allora lo schema dei mesoni rientra in modo
naturale nella rappresentazione 3 3 = 8 1, mentre gli schemi dei barioni sono individuati
dalla rappresentazione 3 3 3 = 10 8 8 1. Questa simmetria SU (3), viene detta simmetria di sapore59 . Tale simmetria non `e esatta, cosa che si manifesta nel fatto che le masse
dei quark (e delle particelle nei multipletti) sono diverse. La scoperta degli altri quark porta
inoltre ad allargare la simmetria dei sapori a SU (6), con schemi molto complicati, ma molto
meno evidenti, a causa delle notevoli differenze di massa dei rimanenti quark. Il punto interessante nellindividuazione di tali schemi non `e comunque nellaver individuato il manifestarsi
di una simmetria (non esatta) di sapore. Si consideri il decupletto dei barioni. Inizialmente
esso non era completo, poiche mancava in realt`a uno dei vertici (le particelle ). Ci`o non era
sorprendente, poiche avendo i quark spin 12 la funzione donda che descrive lo stato composto
da tre quark deve essere antisimmetrica nello scambio qualunque di due di essi. Nel caso delle
particelle ai vertici del diagramma, in cui i quark hanno esattamente gli stessi numeri quantici,
sarebbero dunque permessi solamente stati con configurazioni spaziali di momento angolare
superiore, difficili da realizzare (tenendo conto anche dellelevata massa delle particelle). Tuttavia quando la particella fu scoperta, venne prodotta nello stato fondamentale con momento
angolare nullo.
13.1.3 I quark e i colori. Sia s (; x) la funzione donda a valori complessi che descrive
un quark strange con numeri quantici . Se i numeri quantici sono la carica, lo spin il sapore
e lo spin isotopico, poiche lo spin ha solamente due valori mentre i restanti numeri quantici
sono completamente fissati, `e impossibile costruire, dal prodotto tensore di tre di tali funzioni,
una funzione donda a tre particelle completamente antisimmetrica nello scambio dei quark,
con tutti e tre i quark nello stato corrispondente a momento angolare nullo. Lo stato a energia
pi`
u bassa dovrebbe corrispondere al momento angolare ~ (con due quark di momento nullo
e uno di momento ~). Lanalisi dello spettro di energia degli stati eccitati della particella
58

Suggerito da Gell-Mann, ispirandosi a una frase del romanzo Finnegans wake di J.A.A. Joyce. Quark in
tedesco e in inglese significa ricotta.
59
i numeri quantici u, d, s, c, b e t vengono infatti detti sapori

13 GEOMETRIA DEL MODELLO STANDARD E GUT.

249

evidenzia invece che lo stato a energia pi`


u bassa ha momento angolare nullo e deve dunque
corrispondere al caso in cui tutti e tre i quark hanno momento nullo. Ci`o `e vietato dal principio
di esclusione di Pauli, a meno che non esista un nuovo numero quantico che per ogni quark
possa assumere tre distinti valori. Tale numero quantico viene detto colore e i tre possibili
valori vengono indicati con rosso, blu e verde per i quark e antirosso, antiblu e antiverde per gli
antiquark. Sullo spazio dei colori agisce il gruppo di simmetria SU (3)C (cio`e SU (3) di colore)
ritenuto responsabile delle interazioni forti. A differenza delle simmetrie di sapore, si ritiene
che la simmetria di colore sia esatta.
13.1.4 I campi di gauge. Assumendo che le interazioni tra le particelle siano mediate da
dei campi di gauge, tramite la manifestazione di simmetrie locali come descritto nei precedenti
capitoli, si pu`o pensare che mentre linterazione elettromagnetica `e associata ad un gruppo di
gauge U (1), le interazioni debole e forte siano associate ai gruppi SU (2)L e SU (3)C . Il gruppo
di gauge del modello standard `e identificato con
GM S = U (1)Y SU (2)L SU (3)C .
Il gruppo di gauge U (1)Y viene detto gruppo di ipercarica e non coincide con il gruppo U (1)em
responsabile dellinterazione elettromagnetica. La carica associata ad U (1)Y viene detta ipercarica. Poiche U (1)Y commuta co SU (2)L , le componenti di un fissato doppietto di SU (2)L
devono avere la stessa ipercarica, cosa che non avviene invece per la carica elettrica. Ad esempio neutrino elettronico ed elettrone devono avere la stessa ipercarica ma lelettrone `e carico
mentre il neutrino no. Daltra parte se si assume che T1 , T2 , T3 siano i tre generatori infinitesimi
di SU (2)L e che T3 sia diagonale, allora per ogni doppietto leptonico o dei quark, cos` come
per i singoletti, si ottiene che q t3 (t3 essendo lautovalore di T3 ) `e costante e pu`o essere
identificato con lipercarica a meno di una costante moltiplicativa. `e convenzionale scegliere la
normalizzazione in modo tale che Q = T3 + Y2 .
Il gruppo U (1)em `e quindi una combinazione dei gruppi U (1)Y e del sottogruppo U (1) di SU (2)
generato da T3 . Al gruppo U (1)Y si associa un campo di gauge abeliano AY , come nellelettromagnetismo. Al gruppo SU (2)L invece corrisponde un campo di gauge a valori in su(2) ovvero

3
tre campi di gauge: AL = A+
L T+ + AL T + AL T3 , di cui AL individuano due campi di gauge che

3
risultano essere carichi elettricamente (W ), mentre AL si combina con AY per dare origine al
campo di gauge elettromagnetico Aem ed un altro campo neutro (Z 0 ). Aem rappresenta i fotoni,
mentre gli altri campi vengono anche detti luce pesante. Infine il gruppo SU (3)C definisce 8
campi di gauge colorati AC = AC , dove sono i generatori della rappresentazione aggiunta
di SU (3). Questi campi, che trasportano carica frazionaria e carica di colore si chiamano i
gluoni.
13.1.5 Il bosone di Higgs. Oltre ai campi finora discussi nel modello standard compare
un campo scalare complesso: il bosone di Higgs. Il punto `e che, come abbiamo visto, la teoria
elettrodebole `e basata su una simmetria chirale, e pertanto richiede lannullarsi delle masse
` un fatto sperimentale evidente che invece solamente il fotone e (forse) i neutrini
in gioco. E
hanno massa nulla. Ci`o significa che la simmetria debole deve essere rotta in qualche modo.
Poiche la massa di un campo compare nella lagrangiana tramite un termine quadratico nel

13 GEOMETRIA DEL MODELLO STANDARD E GUT.

250

campo, si potrebbero aggiungere tali termini a mano. Questo metodo esplicito di rompere la
simmetria fin dallinizio `e per`o troppo brutale e rende pi`
u difficoltosa la quantizzazione della
teoria. Un metodo pi`
u sottile consiste invece nellaggiungere un campo scalare opportunamente
accoppiato con gli altri campi e descritto da un potenziale che rispetta tutte le simmetrie del
modello. Il trucco sta nel scegliere un potenziale per il quale le configurazioni di minima
energia non rispettino la simmetria, cosicche per una fissata soluzione delle equazioni del moto
la simmetria si rompe e vengono generati i termini di massa. Questo `e detto meccanismo di
Higgs e si parla allora di rottura spontanea della simmetria. Del bosone di Higgs non vi `e tuttora
alcuna evidenza sperimentale.

13.2

Costruzione del Modello Standard.

Una volta stabiliti gli ingredienti principali del modello standard, si pu`o procedere nella sua
costruzione.
13.2.1 Il modello elettrodebole. Consideriamo per prima la parte di interazione elettrodebole. A tale scopo trascureremo momentaneamente linterazione forte che verr`a aggiunta
successivamente covariantizzando rispetto al gruppo SU (3)C .
I campi di gauge.
Il gruppo di gauge elettrodebole `e U (1)Y SU (2)L . Il campo di gauge U (1)Y `e AY con campo
di forze FY = AY AY .PPer SU (2)L avremo invece tre campi Ai , i = 1, 2, 3 con campi
i
= Ai Ai + g j,k ijk Aj Ak , dove g `e la costante di accoppiamento. Lazione
di forze F
di Yang-Mills elettrodebole `e quindi
Z
X
1
i
ed
[FY FY +
F
F i ]d4 x .
SY M =
4
i
I campi di materia.
Consideriamo una famiglia di campi di materia. Essa consiste di:
un doppietto di isospin contenente quark left,
L : M C2 C4
dove M `e lo spazio-tempo di Minkowski, il fattore C2 `e lo spazio di supporto per la
rappresentazione fondamentale di SU (2) e C4 lo `e per la rappresentazione spinoriale del
gruppo di spin di SO(1, 3). Tipicamente si scrive


UL
L =
DL
dove UL e DL hanno valori in C4 . A tali campi si associa ipercarica Y = 31 . La notazione
adottata `e la seguente: se U `e la funzione donda (di Dirac) per il quark di tipo up (ad
esempio u), allora
1 5 U
1 + 5 U
UL =
, UR =
,
2
2

13 GEOMETRIA DEL MODELLO STANDARD E GUT.

251

e cos` via. Alternativamente scriveremo ad esempio


L =

1 5
,
2

dove ha valori in C2 C4 e le matrici gamma agiscono come lidentit`a su C2 ;


un doppietto di isospin con i leploni left,


V`L
`
L

di ipercarica Y = 1;
un singoletto con il quark UR di ipercarica Y =

4
3

e chiralit`a negativa;

un singoletto con il quark DR di ipercarica Y = 32 e chiralit`a negativa;


un singoletto con il leptone `
a negativa.
R di ipercarica Y = 2 e chiralit`
Rammentando che ogni quark ha tre stati di colore, si tratta in tutto di 15 stati chirali, ai quali
si aggiungono i quindici stati di antiparticella. Utilizzando il metodo di covariantizzazione
illustrato ad esempio nel capitolo 12 `e semplice costruire la lagrangiana relativa ai campi di
materia. Per ottenere una scrittura compatta introduciamo le notazioni seguenti
 V 
 U 

e
Q
, :=
:=
`
D
in modo che ad esempio
1 5 Q
=
2

UL
DL


,

1 + 5 e
=
2

0
`
R


,

e
Q = (U , D ) .
Indichiamo con Y loperatore di ipercarica e con i , i = 1, 2, 3 gli operatori di isospin. Essi
agiranno come lo zero sui singoletti e come i = 12 i sui doppietti, i essendo le matrici di
Pauli. Le matrici di Pauli agiscono come lidentit`a sul fattore C4 , mentre agiscono in maniera
non banale su C2 . Ad esempio


V
e
Y =
` `
R
e
1 1 5 Q
i Q = i
.
2
2
In altre parole le matrici agiscono sulle singole componenti del doppietto, mentre le matrici
di Pauli agiscono sullindice di doppietto, cio`e ad esempio
 U  

 U   D 

=
, 1
=
.
D
D
D
U

13 GEOMETRIA DEL MODELLO STANDARD E GUT.

252

Ci`o significa semplicemente che Q ha valore nello spazio di supporto delle rappresentazione
prodotto SU (2) Spin(1,3) , SU (2) essendo la rappresentazione fondamentale. Con queste
notazioni lazione per il modello elettrodebole `e
Z
ed
Smat = (iQ D Q + ie D e ) ,
dove


D =

ged
1 5
Y
i Ai i
igY AY
2
2
2


.

Il meccanismo di Higgs.
Nellazione finora costruita la chiralit`a dellinterazione debole ha forzato a considerare solamente campi di massa nulla. Vediamo molto brevemente come si possa generare una massa
accoppiando il sistema con un campo scalare. Si consideri un campo scalare complesso costituito
da un doppietto di isospin con ipercarica Y = 1
 + 
H
2
.
H : M C ,
H=
H0
Diciamo che H `e un doppietto scalare, poiche il gruppo di Lorentz agisce banalmente su di
esso. In altre parole H assume valori in C2 C2 C0 , supporto per la rappresentazione
SU (2) 1SO(1,3) . Assumiamo dunque per tale campo lazione di Klein-Gordon covariantizzata
Z
SH = [(D H) D H V (H)]d4 x ,
con derivata covariante

D H =


1
ged i
i A i igY AY H
2
2

e potenziale a fondo di bottiglia


1
1
V (H) = m2H H H + H (H H)2 .
2
2

Posto come duso v := mH / H R, tale potenziale ha minimo per |H| = v/ 2. A meno di


una trasformazione di gauge globale U (1)Y SU (2)L , sullo stato di vuoto il campo assumer`a
dunque valore di aspettazione


0
C2 .
hHi =
v
2

Le fluttuazioni attorno a tale configurazione di vuoto si possono parametrizzare nella forma


!
0
i i i
H(x) = e
,
v+(x)

13 GEOMETRIA DEL MODELLO STANDARD E GUT.

253

dove e sono campi con valore di aspettazione nullo sul vuoto. La fase a pu`o essere eliminata
con una trasformazione di gauge locale SU (2)L , sotto la quale trasformeranno anche i campi
left e il campo di gauge A, mentre resteranno invariati i campi right e AY . Prima di farlo si
consideri linterazione tra il campo scalare e quelli di materia


Z 
i
Q

e L H`R + L D HDR + U 2 H UR d4 x + h.c. ,


Smassa =
2
dove h.c. significa hermitiano coniugato.
13.2.2 Esercizio. Si esegua la suddetta trasformazione di gauge e si dimostri che
1. nellazione Smassa compaiono i termini di massa per i campi ` , U e D, con masse
` v
m` = ,
2

U v
mU = ,
2

D v
mD = ;
2

2. in SH rimane il campo dinamico con massa mH (il campo di Higgs fisico);


3. se Ai `e il campo elettrodebole trasformato, allora in SH compaiono dei termini di massa
per i campi di gauge nella forma

Z  2 2
2 2
ged
v + gY2 v 2 0 0 4
ged v
+

W W +
Z Z
dx,
4
8
dove
W :=
sono campi di massa mW =

ged v
,
2

A1 iA2

mentre

Z0 = cos W A3 sin W AY ,
A = sin W A3 + cos W AY ,
in cui W `e detto angolo di Weinberg e soddisfa tan W =
massa nulla mentre Z0 ha massa mZ = mW / cos W ;

gY
,
ged

cosicche A ha ancora

4. mentre la simmetria SU (2)L `e rotta, si verifichi che sopravvive ancora una simmetria
U (1)em generata da 3 + Y2 , sotto cui A trasforma come campo di gauge e W hanno
carica 1 mentre Z0 e A sono scarichi. Dunque A pu`o essere identificato con il campo
elettromagnetico. I restanti campi di gauge diventano massivi e sono anche chiamati luce
pesante;
5. in particolare si verifichi che i campi neutri si accoppiano alle correnti attraverso i termini
ejem A +
dove sin2 W jew = j3 j0 e e = g sin W ;

g
j 0 Z 0 ,
cos W

13 GEOMETRIA DEL MODELLO STANDARD E GUT.

254

6. si verifichi che la condizione Y = 1 per il campo di Higgs (cio`e una delle componenti ha
carica nulla) `e necessaria a garantire la sopravvivenza di un gruppo non rotto U (1)em .
Il meccanismo di Higgs dunque realizza la rottura di simmetria
U (1)Y SU (2)L U (1)em .
Le particelle W e Z 0 sono in effetti state rilevate al CERN, mentre manca tuttora evidenza
dellesistenza del bosone di Higgs, che confermi la realt`a del meccanismo di Higgs.
13.2.3 Langolo di Cabibbo e la matrice di Kobaiashi-Maskawa. Il punto `e che non c`e
ununica famiglia di leptoni, ma ne sono note tre. Se alle funzioni donda assegnamo un indice
di famiglia a , a = 1, 2, 3 per le famiglie contenenti lelettrone, il muone e il tauone, mentre
lazione per i campi fermionici sar`a la somma delle azioni delle singole particelle, linterazione
tra il campo di Higgs e le famiglie potr`a avvenire attraverso matrici A,ab dove A = e, U, D.
Utilizzando questo nellazione Smassa si ottiene allora che i termini di massa potranno essere
rappresentati da matrici
v
MA,ab = A,ab ,
2
che in generale non saranno diagonali. In altre parole gli autostati di gauge non coincidono con
gli autostati di massa. Se le matrici di massa fossero hermitiane, le si potrebbe diagonalizzare
con una rotazione unitaria. Si potrebbe cio`e scrivere
A UA ,
MA = UA M
con MA diagonale e UA unitaria. Tuttavia tali matrici non sono necessariamente unitarie
cosicche per diagonalizzarle non basta una sola matrice UA (per ogni A), ma `e necessario
utilizzare una coppia di matrici unitarie XA,ab e VA,ab (definite a meno di matrici diagonali
unitarie), in modo che
A VA ,
MA = XA M
A matrici diagonali. I termini di massa per i fermioni assumono perci`o la forma
essendo M
M

L,a Mab R,b =
L,a ab R,b ,
dove abbiamo omesso lindice di famiglia per semplicit`a e introdotto gli autostati di massa
L = X L ,

R = V R .

13.2.4 Esercizio. Si considerino tali trasformazioni nellazione SD . Si dimostri che


i bosoni carichi W si accoppiano alle correnti cariche
j

A U B h.c.

L AB L

,
1
1
2i 2 2
dove A e B assumono i possibili calori A = U e B = D oppure A = B = `, mentre
UAB = XA VB e come al solito h.c. indica lhermitiano coniugato dellespressione ad esso
precedente; le matrici UAB si dicono matrici di mixing;

13 GEOMETRIA DEL MODELLO STANDARD E GUT.

255

si verifichi che se i neutrini hanno massa nulla, la matrice di mixing leptonico U`` `e
ininfluente; si verifichi che le interazioni neutre, definite dai termini contenenti Z0 o il
fotone, non contengono la matrice di mixing.
Da questo esercizio segue che anzitutto i leptoni non risentono del mixing delle famiglie. Per
quanto riguarda i quark ci`o `e vero solamente per le correnti neutre, che in termini degli autostati
di massa si ottengono da quelle di partenza sostituendo a . Lunica matrice di mixing influente `e dunque UKM := UU D , nota come matrice di Kobaiashi-Maskawa. Nelle interazioni che
coinvolgono i bosoni W , dette appunto interazioni cariche, i quark si mischiano comparendo
nellazione del modello standard attraverso le funzioni donda
 u 
 c 
 t 
L
L
L
,
,
,
d0
s0

b0
L

dove

d0

L
Ls0 := UKM
b0
L

Ld
Ls .
Lb

Poiche le particelle sono identificate dagli autostati di massa, sono le funzioni quelle che
descrivono gli stati associati alle singole particelle. Dunque, mentre le interazioni neutre conservano i sapori delle famiglie, le interazioni deboli cariche cariche mischiano le famiglie. In un
prima approssimazione si ha

cos c sin c 0
UKM sin c cos c 0 ,
0
0
1
dove c `e detto angolo di Cabibbo. Ci`o significa che ad esempio uno stato u pu`o decadere
debolmente, tramite uninterazione carica, in uno stato cos c d + sin c s , dando origine a
interazioni che per una frazione sin2 c violano la stranezza. Queste violazioni furono quelle
che portarono Cabibbo a introdurre il suo famoso angolo, in un momento in cui in realt`a esso
non aveva alcuna interpretazione ovvia, dato che ancora non vi era neppure alcuna ipotesi
sullesistenza dei quark c, b, t.
13.2.5 Nota. I valori sperimentali degli angoli di Weinberg e di Cabibbo sono sin W 0.23120
e sin c 0.225, tuttavia tale vicinanza dei valori `e del tutto accidentale. Infine osserviamo
senza ulteriori analisi che lambiguit`a di fase nelle matrici di rotazione `e collegata al fenomeno
della violazione di CP , cio`e della rottura della simmetria di parit`a e coniugazione di carica.
13.2.6 La cromodinamica (cenni). Per completare il modello standard ci rimane da
considerara linterazione di gauge SU (3)C . Tale interazione di gauge viene descritta dalla
connessione di colore AC = 12 AaC a dove a , a = 1, . . . , 8 sono le matrici di Gell-Mann

0 1 0
0 i 0
1 0 0
1 = 1 0 0 , 2 = i 0 0 , 3 = 0 1 0 ,
0 0 0
0 0 0
0 0 0

13 GEOMETRIA DEL MODELLO STANDARD E GUT.

0 0 1
0 0
4 = 0 0 0 , 5 = 0 0
1 0 0
i 0

0 0 0
1
7 = 0 0 i , 8 =
3
0 i 0

i
0 ,
0

256

0 0 0
6 = 0 0 1 ,
0 1 0

1 0 0
0 1 0 .
0 0 2

Si noti che 3 e 8 generano la sottoalgebra di Cartan. Gli 8 campi AaC , a = 1, . . . , 8 sono


i campi di gluoni e hanno sia cariche di colore che cariche elettriche frazionarie. Poiche fino
ad ora tale tipo di cariche non `e stato visto, i gluoni come i quark compaiono solo in stati
fortemente legati ed `e ragionevole ritenere che linterazione forte debba essere responsabile
del confinamento. Lazione della cromodinamica si ottiene dunque aggiungendo il termine di
Yang-Mills ottenuto con i campi di forze gluonici FC := AC AC igF [AC , AC ]
Z
1
crom
T r[FC FC ]d4 x ,
SY M =
2
e covariantizzando, rispetto alla connessione gluonica, le derivate parziali che agiscono sui quark:
Q 7 ( igF AC ) Q .
Non ci occuperemo di analizzare oltre gli aspetti della cromodinamica.
13.2.7 Esercizio. Si scriva lazione completa per il modello standard.

13.3

La massa dei neutrini.

Mentre nel modello standard si assume che la massa dei neutrini sia nulla, `e piuttosto recente
la conferma del fatto che in realt`a tra le famiglie di neutrini ci siano delle differenze di massa.
Se infatti i diversi neutrini avessero masse diverse, similmente a quanto avviene per esempio
nel caso dei quark vi sarebbe la possibilit`a che gli autostati di massa e quelli di sapore fossero
differenti. In altre parole i termini quadratici che determinano le masse dei neutrini nellazione
possono in generale avere la forma
X
Lmassa =
i Mij j ,
ij

dove la matrice dei coefficienti non `e diagonale e i, j assumono i valori simbolici e, , . Se gli
autostati di massa, cio`e gli stati che diagonalizzano la matrice M , sono differenti da quelli di
sapore,cio`e dal vettore (e , , ), allora ci sar`a una matrice analoga alla matrice di KobaiashiMaskawa che collega le due basi:

e
11 12 13
f1
= 21 22 23 f2 ,

31 32 33
f3

13 GEOMETRIA DEL MODELLO STANDARD E GUT.

257

dove abbiamo indicato con fa , a = 1, 2, 3 gli autostati di massa.


Sebbene la prima evidenza della massa del neutrino fu annunciata solo i primi di giugno del
199860 alla XVIIIth International Conference on Neutrino Physics and Astrophysics tenutasi
a Takayama, in Giappone, come risultato dellesperimento superKamiokande, tale possibilit`a
fu gi`a proposta dal fisico italiano (ma che allepoca si era da poco trasferito definitivamente
in Russia) Bruno Pontecorvo61 nel 1957. Il punto `e che un neutrino, diciamo ad esempio un
, prodotto in una determinata regione dello spazio, si muover`a come sovrapposizione degli
autostati di massa che infatti soddisferanno tre distinte equazioni di Dirac (lo si verifichi come
esercizio!) e si propagheranno perci`o in maniera indipendente. Un rivelatore del neutrino a
grandi distanze vedr`a perci`o in generale una diversa sovrapposizione di stati, che al tempo t
giungeranno al rivelatore con fasi differenti. Pertanto, riespresso in termini degli autostati di
sapore,62 lo stato che descriver`a il neutrino sar`a in generale diverso da quello iniziale e apparir`a
come combinazione lineare degli autostati di sapore. La probabilit`a di rilevare il neutrino come
un neutrino elettronico oppure tauonico sar`a perci`o diversa da zero e dipender`a dal tragitto
percorso.
Le oscillazioni dei neutrini implicano dunque delle differenze di massa tra i diversi tipi di
neutrini, tuttavia non permettono una misura diretta delle masse, che tra laltro risultano
essere troppo piccole per essere misurate senza difficolt`a, ed `e stato finora possibile dare delle
stime per i limiti superiori delle masse. In particolare non `e detto che tutti i tipi di neutrino
(noti) abbiano massa differente da zero. Il fatto che le masse dei neutrini siano molto piccole
pone un problema nuovo: se il meccanismo con cui i neutrini acquistano massa fosse lo stesso
che nel caso dei quark, sarebbe naturale aspettarsi per i neutrini una massa dello stesso ordine
di grandezza delle masse dei quark. A questo punto `e interessante notare che, se i neutrini
fossero di Majorana, allora vi `e una possibile meccanismo diverso di assegnare la massa ai
neutrini, che ora descriveremo brevemente.
13.3.1

Il meccanismo dellaltalena (Seesaw mechanism).

Nel modello standard il numero leptonico `e conservato. Se i neutrini hanno massa, devono
comparire dei termini quadratici nei campi dei neutrini. Tuttavia `e facile vedere che termini
di questo tipo che non violino il numero leptonico non possono esserci in assenza di neutrini di
tipo right. Devono allora esistere dei neutrini righta, che si indicano tipicamente con NiR , che
R ). Il coefficiente mD ,
si accoppiano con i neutrini left in termini della forma mD (
N R + N
che pi`
u in generale sar`a una matrice, si chiama termine di massa di Dirac e come suddetto ci si
aspetta che sia dellordine della scala di energia tipica del modello elettrodebole. Se il numero
leptonico `e effettivamente conservato, allora qui finisce la storia.
Se per`o ad esempio almeno i neutrini right fossero di Majorana, allora essi violerebbero certamente il numero leptonico, dato che un neutrino, essendo reale, pu`o trasformarsi nel proprio
antineutrino (essendo coincidenti). Ci`o permetterebbe di aggiungere allora termini di massa
60

ma il risultato definitivo delle misura delle oscillazioni dei neutrini `e stato pubblicato su Physical Review
D solamente nellottobre 2006!
61
fratello del regista Gillo
62
gli esperimenti che rivelano i neutrini sono basati sui processi nei quali si osservano i sapori leptonici!

13 GEOMETRIA DEL MODELLO STANDARD E GUT.

258

diagonali. Nella base ordinata (i , NiR ) la matrice di massa pu`o allora assumere la forma


0 mD
M=
.
mD mM
La matrice mM `e la matrice di massa di Majorana. Poiche i campi right sono per il resto
completamente disaccoppiati da tutti gli altri campi, non vi `e alcun meccanismo (simmetrie) che
prevenga gli autovalori di mM dallessere arbitrariamente elevati, ad esempio alle scale di energia
in cui si verifichi una eventuale grande unificazione (si noti che nelle teorie di grande unificazione
tipicamente il numero leptonico non si conserva, si vedano i paragrafi successivi). Gli autostati
di massa dei neutrini si determinano allora diagonalizzando la matrice M . Nellapprossimazione
in cui mM  mD indicando sempre con le stesse lettere gli ordini di grandezza degli autovalori
delle matrici date, avremo che i neutrini right avranno massa mR mM , mentre i neutrini left
avranno massa
m2
mL D ,
mM
che giustificherebbe le piccolissime masse dei neutrini osservati. Le masse dei neutrini right
saranno invece notevolmente elevate, rendendoli pertanto non osservabili.

13.4

Teorie GUT (cenni).

Il modello standard e il meccanismo di rottura spontanea suggeriscono lidea di una possibile


unificazione delle forze. Nel modello elettrodebole il gruppo U (1)em emerge dalla rottura di
simmetria. La struttura in prodotti U (1)Y SU (2)L SU (3)C del gruppo del modello standard
potrebbe in modo simile essere conseguenza di una rottura spontanea di simmetria da un unico
gruppo G che per mezzo di un meccanismo analogo a quello di Higgs porta alla rottura
G U (1)Y SU (2)L SU (3)C U (1)em SU (3)C .
Il gruppo G si chiama allora il gruppo di grande unificazione e la teoria relativa `e detta GUT
(Grand Unification Theory). Ci`o che alletta nella ricerca di una teoria GUT non `e solamente
lidea di unificare le forze, ma la spiegazione della quantizzazione della carica. Nel modello
standard infatti la carica Q = 3 + Y2 non `e automaticamente quantizzata. Ci`o avviene per il
fatto che a differenza di 3 che assume solo valori discreti, Y essendo associato a un gruppo U (1)
non semplice, pu`o assumere qualunque valore e i valori discreti gli vengono imposti in seguito alle
osservazioni sperimentali. Se invece U (1)Y , come avviene per il sottogruppo U (1) generato da
3 , fosse un sottogruppo di un gruppo compatto e semplice, allora sarebbe anchegli quantizzato
in modo naturale, e ci`o potrebbe fornire una giustificazione teorica della quantizzazione della
carica.
13.4.1 Il modello SU (5). Il pi`
u semplice modello di GUT `e quello con gruppo G = SU (5),
benche non sia storicamente il primo. Anzitutto SU (5) contiene il gruppo SU (2) SU (3) come
matrici diagonali a blocchi. Sappiamo anche dalla teoria che SU (5) ammette quattro rappresentazioni fondamentali, due di dimensione 5 e due di dimensione 10. In fisica `e usuale chiamare

13 GEOMETRIA DEL MODELLO STANDARD E GUT.

259

fondamentale solamente la rappresentazione di dimensione 5 associata al peso massimale L1 .


Essa viene indicata con 5. La sua coniugata, associata al peso massimale L1 +L2 +L3 +L4 , viene
indicata con 5 . La rappresentazione di dimensione 10 associata al peso L1 + L2 e che si ottiene
dal prodotto esterno 5 5 viene indicata con 10 e la sua coniugata con 10 . In particolare
la 10 viene realizzata sullo spazio delle matrici antisimmetriche. Tipicamente si fissa una base
per lalgebra di SU (5) data da matrici { 2i i }15
i=1 , dove i sono matrici hermitiane a traccia
nulla, normalizzate con la regola T ri j = 2ij (che ovviamente non identifica univocamente
la base). Esse possono essere costruite ad esempio sulla falsa riga delle matrici di Gell-Mann.
Per fissare le idee scegliamo la base


i 0
i =
, per i = 1, . . . , 8
0 0


0 0
i =
, per i = 9, . . . , 11
0 i8
1
12 = diag{2, 2, 2, 3, 3} ,
15
dove i e j sono ovviamente le matrici di Gell-Mann e di Pauli mentre le restanti 12 matrici
hanno elementi di matrice non nulli
{13 }1,4
{16 }2,4
{19 }1,5
{22 }2,5

= {13 }4,1 = 1 ,
= {16 }4,2 = i
= {19 }5,1 = 1 ,
= {22 }5,2 = i

{14 }1,4 = {14 }4,1 = i


, {17 }3,4 = {17 }4,3 = 1
{20 }1,5 = {20 }5,1 = i
, {23 }3,5 = {23 }5,3 = 1

,
,
,
,

{15 }2,4
{18 }3,4
{21 }2,5
{24 }3,5

= {15 }4,2 = 1 ,
= {18 }4,3 = i ,
= {21 }5,2 = 1 ,
= {24 }5,3 = i .

Tra le quattro matrici diagonali, oltre alle due di SU (3) e a quella di SU (2), compare 12 . Essa
commuta con le prime 11 matrici, ovvero con SU (2) SU (3) e pu`o perci`o essere identificata,
a meno di un fattore costante, con loperatore Y .
13.4.2 Le particelle in SU (5). Ricordando che ci sono 30 stati in una famiglia del modello
standard (includendo le antiparticelle), 15 potranno comparire nelle 5 e 10, e 15 nelle coniugate.
Per poter inserire le particelle in SU (5), occorre analizzare come si comportano rispetto al
sottogruppo SU (2) SU (3) di SU (5), la qual cosa ci viene rivelata dal modello standard.
Come usuale indicheremo con una coppia di numeri tale comportamento, dove il primo numero
si riferisce alla sottorappresentazione SU (2) e il secondo alla sottorappresentazione SU (3). Ad
esempio scriveremo per i quark up e down
(uL , dL ) (2, 3) ,
per intendere che essi trasformano come un doppietto per SU (2) e nella fondamentale 3 per
quanto riguarda lindice di colore . In pratica (a, b) `e una notazione per individuare la
rappresentazione prodotto tensore [a] [b] dove con [a] indichiamo una rappresentazione di
SU (2) di dimensione a e con [b] una rappresentazione di SU (3) di dimensione b. Perci`o la
dimensione di (a, b) `e ab. I restanti 9 stati di particella sono

uR (1, 3) , dR (1, 3) , (eL , e


L ) (2, 1) , eR (1, 1) ,

13 GEOMETRIA DEL MODELLO STANDARD E GUT.

260

ed ovviamente le antiparticelle. Naturalmente abbiamo


(1, 3) + (2, 1) = 5 ,

(1, 3 ) + (2 , 1) = 5 .

Per quanto riguarda la 10 osserviamo che


10 = 5 5 = ((1, 3) + (2, 1)) ((1, 3) + (2, 1)) = (1, 1) + (2, 3) + (1, 3 ) .
Una realizzazione esplicita di tale struttura la si ottiene (si veda [CL] capitolo 14) identificando
gli stati della 5 con
R = (d1R , d2R , d3R , e+
eR ) ,
R ,
dove il numero `e lindice di colore, e quelli della 10 con

0
u3L
u2L u1L

u3L
0
u1L
u2L
1
u2L
u1L
0
u3L
ij = ji =
2
3
2
1
uL uL uL
0
1
2
3
dL dL dL e+
L

d1L
d2L
d3L
e+
L
0

dove si `e usata la barra per indicare lantiparticella, tranne che per il positrone. Come prima
il numero rappresenta lindice di colore. La carica delle particelle `e allora Q = 3 + Y2 dove
r
1
5
12 .
3 = 11 , Y =
2
3
13.4.3 I campi di gauge. In modo simile si ottiene lanalisi dei campi di gauge. La
rappresentazione aggiunta di SU (5) ha dimensione 24 e si ottiene dalla decomposizione
5 5 = 24 1 ,
da cui si ottiene immediatamente
24 = (1, 8) + (3, 1) + (1, 1) + (2, 3) + (2, 3 ) .
La (1, 8) `e laggiunta di SU (3) e corrisponde ai gluoni. La (2, 1) `e laggiunta di SU (2) e
individua i bosoni vettori della teoria debole. (1, 1) `e il campo di gauge U (1)Y dellipercarica.
I rimanenti sono invece dei bosoni non contenuti nel modello standard, detti campi X e Y .
Naturalmente ci si aspetta che il gruppo di unificazione sia spontaneamente rotto e che il
meccanismo di rottura doti i campi X e Y di una massa estremamente elevata, ben superiore
a quelle dei bosoni pesanti W e Z 0 . Il problema del perche le rotture di simmetria
SU (5) U (1)Y SU (2)L SU (3)C
e
U (1)Y SU (2)L U (1)em

13 GEOMETRIA DEL MODELLO STANDARD E GUT.

261

debbano avvenire a scale di energia molto differenti viene indicato come il problema della
gerarchia.
I campi X e Y , sono responsabili delle interazioni miste tra quark e leptoni (gli stati detti
di lepto-quark) o tra quark e antiquark (i diquark). Di conseguenza essi sono responsabili di
fenomeni che violano il numero barionico, quali il decadimento del protone in stati leptonici.
Losservata stabilit`a del protone (se decade deve farlo con una vita media di almeno 1035 anni)
pone forti costrizioni alla teoria GUT. Non considereremo qui ulteriori dettagli (si veda [CL]
capitolo 14).
13.4.4 Il modello SO(10). Storicamente il primo modello di teoria GUT fu realizzato con
il gruppo di gauge SO(10). Il punto era che SO(10) ammette una rappresentazione spinoriale
chirale Spin(10)+ di dimensione 16, che poteva quindi accomodare i 15 stati del modello standard, mentre gli altri 15 venivano inseriti nella rappresentazione Spin(10) . Lo stato in pi`
u era
attribuito al neutrino right e veniva abilmente fatto scomparire nella costruzione del modello.
Per vedere come si possa costruire un modello GUT con gruppo SO(10), procediamo invece
allinverso osservando anzitutto che SU (5) pu`o essere visto come sottogruppo di SO(10). Se
scriviamo la generica matrice M dellalgebra so(10) in blocchi 55 (che indicheremo con lettere
greche), allora si ha



A=

dove , , M (5, R) e e sono antisimmetriche. Tali blocchi corrispondono alla
decomposizione
R10 = R5 R5 = {(x, y) R5 R5 } .
La sottoalgebra delle matrici di so(10) per le quali = mentre `e simmetrica a traccia
nulla, si identificano con su(5) tramite la mappa A 7 A iB agenti su C5 generato dai vettori
z = x + iy.
Si pu`o perci`o passare attraverso su(5) per individuare i campi del modello standard in so(10).
Si ricordi che i pesi di spin(10)+ sono
1
 = (L1 L2 L3 L4 L5 )
2
per tutte le possibili combinazioni di segni che abbiano numero pari di segni . Si osservi anche
che le radici positive di so(10) sono
Li L j ,

1i<j5,

dunque 20, mentre quelle di su(5) sono


Li L j ,

1i<j5.

Le sottorappresentazioni di su(5) in so(10) si ottengono quindi guardando come le radici di


su(5) agiscono sui vettori peso di spin(10)+ . Addizionando e sottraendo le radici di su(5) ai
pesi di spin(10)+ si vede che devono agire sui vettori peso conservando il numero di segni .
Si hanno perci`o tre sottospazi invarianti per su(5):

13 GEOMETRIA DEL MODELLO STANDARD E GUT.

262

un sottospazio unidimensionale corrispondente al peso massimo 12 (L1 +L2 +L3 +L4 +L5 )
0, dato che per su(5) si ha L1 + L2 + L3 + L4 + L5 0;
un sottospazio 5dimensionale corrispondente ai 5 pesi con 4 segni . Il peso massimo
rispetto a su(5) `e 21 (L1 L2 L3 L4 L5 ) L1 ;
un sottospazio 10dimensionale corrispondente ai 10 pesi con 2 segni meno. In questo
caso il peso massimo `e evidentemente 12 (L1 + L2 + L3 L4 L5 ) L1 + L2 + L3 .
Quindi possiamo dire che spin(10)+ si decompone in 1 + 5 + 10 secondo le rappresentazioni
di SU (5). Questo metodo pu`o essere ulteriormente applicato a SU (5) per decomporlo secondo
SU (2) SU (3) (in alternativa al metodo adottato nella sezione 13.4.2). Poiche una volta
individuata la decomposizione, la costruzione delle funzioni donda `e la stessa come in 13.4.2
(con laccortezza di aggiungere il neutrino right nel singoletto), non consideriamo qui ulteriori
dettagli. Si veda eventualmente [CL2], capitolo 14.
13.4.5 Esercizio. Si costruisca lanaloga decomposizione della rappresentazione aggiunta 45
di SO(10) rispetto a SU (5).

14 LE RAPPRESENTAZIONI DELLALGEBRE DI LIE SL(3)

14

263

Le rappresentazioni dellalgebre di Lie sl(3)

Testi consigliati: [FH], [Ha], [Hu].

14.1

Lalgebra di Lie sl(3).

14.1.1 Introduzione. In questo capitolo daremo la classificazione delle rappresentazioni


irriducibili delle algebre di Lie sl(3) e su(3).
Il risultato `e che le rappresentazioni irriducibili di sl(3) sono classificate da una coppia di
interi positivi, o meglio, da un peso dominante. In 7.4.7 mostriamo che c`e una biiezione tra le
rappresentazioni irriducibili di sl(3) e quelle di su(3). Questultime sono di grande importanza
per il modello standard delle particelle elementari, si veda il capitolo 13.
14.1.2 Lalgebra di Lie sl(3). Lalgebra di Lie sl(3) del gruppo di Lie SL(3) `e data da:
sl(3) = { X M3 (C) : T r(X) := X11 + X22 + X33 = 0 }
(vedi 5.1.7), in particolare, sl(3) `e uno spazio vettoriale complesso di dim sl(n) = 32 1 = 8.
Sia h il sottospazio di sl(3) delle matrici diagonali:
h = {H = diag(t1 , t2 , t3 ) M3 (C) : t1 + t2 + t3 = 0 },
si noti che dim h = 2. Se H1 , H2 h, allora H1 H2 = H2 H1 perche H1 , H2 sono matrici diagonali,
quindi si ha [H1 , H2 ] = 0. Perci`o h `e una sottoalgebra abeliana di sl(3).
Ogni H h definisce una mappa lineare
ad(H) : sl(3) sl(3),

X 7 ad(H)(X) := [H, X] (= HX XH).

Un X sl(3) `e un autovettore, con autovalore C, di ad(H) se ad(H)(X) = X. Dato


che ad(H)(H1 ) = 0 per ogni H1 h, ogni elemento nel sottospazio h `e un autovettore di ad(H)
con autovalore = 0, e questo per ogni H h.
Per trovare gli altri autovettori di ad(H) calcoliamo in modo esplicito questa mappa:

t1 0 0
x11 x12 x13
t1 x11 t1 x12 t1 x13
HX = 0 t2 0 x21 x22 x23 = t2 x21 t2 x22 t2 x23 ,
0 0 t3
x31 x32 x33
t3 x31 t3 x32 t3 x33
e similmente

x11 x12 x13


t1 0 0
t1 x11 t2 x12 t3 x13
XH = x21 x22 x23 0 t2 0 = t1 x21 t2 x22 t3 x23 .
x31 x32 x33
0 0 t3
t1 x31 t2 x32 t3 x33
Quindi si ha

0
(t1 t2 )x12 (t1 t3 )x13
0
(t2 t3 )x23 .
ad(H)(X) = [H, X] = HX XH = (t2 t1 )x21
(t3 t1 )x31 (t3 t2 )x32
0

(1)

14 LE RAPPRESENTAZIONI DELLALGEBRE DI LIE SL(3)

264

Si noti che una matrice X = (xij ) che ha tutti i coefficienti xij = 0, tranne x12 6= 0, `e un
autovettore con autovalore t1 t2 . Similmente per le altre coppie i, j con i 6= j.
Quindi conviene introdurre una base di sl(3) di matrici elementari. Sia Ei,j la matrice
elementare:
Ei,j Mn (C),
(Ei,j )kl = ik jl
dove ab `e la delta di Kronecker: ab = 1 se a = b e zero altrimenti. In particolare, tutti i
coefficienti di Ei,j sono zero tranne il coefficiente nella i-esima riga e j-esima colonna che `e
(Ei,j )ij = 1. Per esempio

1 0 0
0 1 0
0 0 0
E1,1 = 0 0 0 ,
E1,2 = 0 0 0 , E2,1 = 1 0 0 .
0 0 0
0 0 0
0 0 0
La matrice Ei,i 6 sl(3) (perche T r(Ei,i ) = 1 6= 0), ma per esempio le due matrici H12 , H23
definite da
H12 := E1,1 E2,2 ,
H23 := E2,2 E3,3
sono in sl(3) ed insieme sono una base di h. Una base di sl(3) `e allora data da H12 , H23 e le sei
matrici Ei,j con 1 i, j 3 e i 6= j.
Il calcolo esplicito di ad(H)(X) (vedi equazione 1) mostra allora che ognuno di questi 8
vettori di base di sl(3) `e un autovettore di ad(H) e lautovalore di Ei,j `e ti tj :
ad(H)(Ei,j ) = [H, Ei,j ] = (ti tj )Ei,j .
In particolare, sulla base H12 , H23 , E1,2 , E2,3 , E1,3 , E2,1 , E3,2 , E3,1 di sl(3) la matrice di ad(H) `e
data da una matrice 8 8 diagonale:
ad(H) = diag(0, 0, t1 t2 , t2 t3 , t1 t3 , t2 t1 , t3 t2 , t3 t1 ),

H = diag(t1 , t2 , t3 ). (2)

14.1.3 Lalgebra di Cartan h. Ogni matrice H h `e diagonale. Secondo un teorema (vedi


5.3.6), in ogni rappresentazione di sl(3), la matrice (H) pu`o allora essere diagonalizzata per
ogni H h.
Lalgebra h `e abeliana. Se X sl(3) e X 6 h, allora almeno un coefficiente xij di X con i 6= j
`e non-zero. Questo implica, usando lequazione (1), che [H, X] 6= 0 se H = diag(t1 , t2 , t3 ) h
e ti 6= tj . Quindi non esiste una sottoalgebra h0 sl(3), pi`
u grande di h (cio`e h h0 ) tale che
h0 sia abeliana. In generale una tale algebra `e detta algebra di Cartan:
14.1.4 Definizione. Sia g unalgebra di Lie complessa semplice. Una sottoalgebra di Lie
h g `e detta unalgebra di Cartan se h `e abeliana, se ogni elemento di h `e diagonalizzabile
(in una e quindi in ogni rappresentazione di g, vedi 5.3.6) e se h `e massimale rispetto a tale
propriet`a (vedi [FH], Definition D.2).
Si pu`o mostrare che se h, h0 sono due algebre di Cartan di g, allora esiste un automorfismo
g g0 che manda h in h0 , quindi h `e essenzialmente unica (vedi [FH] D.3).

14 LE RAPPRESENTAZIONI DELLALGEBRE DI LIE SL(3)

265

Il rango l di g `e la dimensione di unalgebra di Cartan di g:


l = rango(g) := dimC h.
In particolare, il rango di sl(3) `e l = 2.
14.1.5 I pesi delle rappresentazioni di sl(3). Sia h lalgebra di Cartan di sl(3) come in
14.1.2, sia V uno spazio vettoriale complesso e sia
: g End(V )
una rappresentazione di g.
Poiche (H) `e diagonalizzabile per ogni H h, si pu`o decomporre V in autospazi per
(H12 ). Sia V V lautospazio di (H12 ) con autovalore . La mappa lineare (H23 ) induce
una mappa lineare V V , cio`e (H23 )V V , perche:
(H12 )((H23 )v) = (H23 )((H12 )v) = (H23 )(v) = ((H23 )v),

(v V ).

Poiche anche (H23 ) `e diagonalizzabile, il sottospazio V ammette una decomposizione in


autospazi per H23 . Per , C definiamo un sottospazio V, di V (e quindi di V ) tramite
V, = {v V, : (H12 )v = v,

(H23 )v = v },

cio`e il sottospazio di V di autovettori di (H12 ) con autovalore e di autovettori di (H23 ) con


autovalore . Allora V = V, e V = (,) V, .
Adesso consideriamo gli autovalori di (H) per un elemento generico H h. Tale H h si
scrive, in modo unico, come H = aH12 + bH23 per certi a, b C. Poiche `e lineare si ha per
v V, :


(H)v =

a(H12 ) + b(H23 ) v = (a + b)v

(v V, ).

Quindi (H) ha lautovalore a + b su V, , si noti che lautovalore dipende in modo lineare


dagli elementi di H. Un autospazio V, definisce allora una mappa lineare (un peso)
L : h C,

H = aH12 + bH23 7 a + b,

tale che (H)v = L(H)v

per ogni v V, . Si scrive VL := V, e VL `e detto uno spazio peso (invece di autospazio per
tutti gli elementi di h) con peso L h , lo spazio duale di h.
In particolare, ogni rappresentazione V ammette una decomposizione in spazi peso:
V = Lh VL ,

(H)v = L(H)v

(v VL ).

Poiche dim V `e finita, VL = 0 tranne che per un numero finito di L h , questi L sono detti i
pesi della rappresentazione . La molteplicit`a di un peso L `e per definizione la dimensione di
VL .

14 LE RAPPRESENTAZIONI DELLALGEBRE DI LIE SL(3)

266

14.1.6 La rappresentazione aggiunta di sl(3). La rappresentazione aggiunta dellalgebra


di Lie sl(3) `e (vedi 5.3.2 e 14.1.2):
ad : g End(g),

X 7 (ad(X) : Y 7 [X, Y ]).

Abbiamo visto che rispetto a una base opportuna di sl(3) si ha (vedi equazione 2 di 14.1.2):
ad(diag(t1 , t2 , t3 )) = diag(0, 0, t1 t2 , t2 t3 , t1 t3 , t2 t1 , t3 t2 , t3 t1 ).
Definiamo Li h con:
Li : h C,
Poiche

Li (diag(t1 , t2 , t3 )) = ti .

ti = 0 gli Li h non sono indipendenti in h ma si ha:


L 1 + L2 + L3 = 0 h ,

In particolare, Li e Li c(L1 + L2 + L3 ) sono la stessa mappa lineare su h per ogni c C. Una


base dello spazio due dimensionale h `e L1 L2 , L2 L3 .
Visto che (Li Lj )(H) = ti tj otteniamo allora che i pesi della rappresentazione aggiunta
di sl(3) sono L = 0 e
1 := L1 L2 ,

2 := L2 L3 ,

L1 L 3 ,

L2 L1 ,

L3 L 2 ,

L3 L 1 ,

questi sei pesi hanno molteplicit`a uno, il peso 0 ha molteplicit`a 2. In particolare, lalgebra di
Lie sl(3) ha la decomposizione in spazi peso:
sl(3) = h (h {0} g )
dove il sottospazio g `e definito da:
g := {X sl(3) : [H, X] = (H)X },
se = Li Lj allora g = CEi,j , in particolare ogni g `e uno dimensionale.
14.1.7 Le radici di sl(3). Un elemento h `e detto una radice (inglese: root) di g = sl(3)
se 6= 0 e g 6= 0. Linsieme delle radici `e indicato con R, quindi R = {(Li Lj ) : i 6= j}.
Lo spazio radice (inglese root space) `e lautospazio g di g, dove R.
Una radice = Li Lj `e detta positiva se i < j, linsieme delle tre radici positive lo si
indica con R+ .
Per una radice = Li Lj positiva si definisce
H := Ei,i Ej,j ,

X := Ei,j ,

X := Ej,i ,

si noti che H h, X g e X g . Nel caso = L1 L2 si ha H12 = H ecc. Il


sottospazio tridimensionale di g generato da H , X , X `e una sottoalgebra di Lie di g isomorfa
a sl(2), infatti si verifica che:
[H , X ] = 2X ,

[H , X ] = 2X ,

[X , X ] = H ,

14 LE RAPPRESENTAZIONI DELLALGEBRE DI LIE SL(3)

267

che coincide con i commutatori di sl(2) (vedi 5.2.4).


14.1.8 Il sistema delle radici di sl(3). Per visualizzare le radici di sl(3), che sono vettori
in h
= C2 , conviene anzitutto osservare che le sei radici generano un sottospazio reale di
dimensione due, indicato con hR ,
hR := R R2 ,

:= L1 L2 , 2 := L2 L3 .
P
P
Come abbiamo visto in 14.1.6 le mappe lineari i ai Li e i ai Li c(L1 + L2 + L3 ) sono uguali
su P
h . Conviene
P normalizzare il modo di scrivere un peso nel modo seguente: la normalizzazione
di i ai Li `e i ai Li c(L1 + L2 + L3 ) con c = (a1 + a2 + a3 )/3; con questa normalizzazione si
ha
X
X
X
X
X
bi Li :=
ai Li 31 (
ai )(L1 + L2 + L3 ), con b1 + b2 + b3 = (
ai ) 3 13 (
ai ) = 0.
i

Usando questa normalizzazione, si pu`o definire un prodotto scalare (, ) su hR nel modo


seguente:
X
X
X
X
(
ai Li ,
bi Li ) = a1 b1 + a2 b2 + a3 b3 ,
(
ai =
bi = 0).
P
P
E importante la normalizzazione
ai =
bi = 0, per esempio, senza questa, (L1 , L1 ) = 1
mentre in realt`a:
(L1 , L1 ) = ((2L1 L2 L3 )/3, (2L1 L2 L3 )/3) = (4 + 1 + 1)/9 = 2/3.
Le radici 1 = L1 L2 , 2 = L2 L3 sono gi`a normalizzate e si ha
(1 , 1 ) = (2 , 2 ) = 2,

(1 , 2 ) = 1.

In 14.5 si d`a un modo meno ad-hoc per costruire il prodotto scalare su h .


Un disegno del sistema di radici `e allora:

1 + 2
- 1

1 = L1 L2 ,
2 = L2 L3 ,

1 + 2 = L1 L3 .

14.1.9 Il gruppo di Weyl. Per una radice , denotiamo con liperpiano perpendicolare
ad :
:= {x hR : (x, ) = 0 }
( hR ).

14 LE RAPPRESENTAZIONI DELLALGEBRE DI LIE SL(3)

268

Sia s la riflessione in :
s : hR hR ,

x 7 x 2

(x, )
= x (x, ),
(, )

(lultima ugualianza vale perche (, ) = 2 per ogni radice di sl(3)), per verificare la formula
basta notare la linearit`a, che s (x) = x se x , cio`e se (x, ) = 0, e che s () = per
R. Si noti che s = s per ogni .
Il sottogruppo del gruppo ortogonale di hR generato dalle s , R `e il gruppo di Weyl di
g, denotato
W = W (g) := h s : R i
( O(hR )).
Dal diagramma in 14.1.8 si vede (e si verifca facilmente) che, con 1 = L1 L2 , 2 = L2 L3 ,
si ha



1 7 1 ,
1 7 1 + 2 ,
1 7 2 ,
s1 :
s2 :
s1 +2 :
2 7 1 + 2 ,
2 7 2 ,
2 7 1 .
Linsieme delle sei radici R rimane quindi invariante sotto W . Si noti che s1 permuta L1 , L2
e fissa L3 , s2 permuta L2 , L3 e fissa L1 mentre s1 +2 permuta L1 , L3 e fissa L2 , per esempio
s1 +2 (1 ) = s1 +2 (L1 L2 ) = L3 L2 = (L2 L3 ) = 2 .
E facile vedere che il gruppo di Weyl di sl(3) `e isomorfo al gruppo simmetrico S3 per esempio
perche permuta le Li .
14.1.10 Pesi e prodotto scalare. Sia = Li Lj R+ eP
sia H = Ei,i Ej,j lelemento
di
h
nella
copia
di
sl(2)
definito
da

(vedi
14.1.7).
Sia

=
ai Li h , normalizzata, cio`e
P
ai = 0. Allora
X
(H ) = (
ai Li )(Ei,i Ej,j ) = ai aj .
Daltra parte, poiche e Li Lj sono normalizzati, anche:
X
(, ) = (
ai Li , Li Lj ) = ai aj .
Quindi otteniamo lidentit`a, per ogni h e ogni R:
(H ) = (, ).
14.1.11 Commutatori e radici in sl(3).
commutatori:
[g , g ] g+

(3)

Mostriamo che le radici determinano vari


(, R),

in particolare [g , g ] = 0 se + 6 R. La dimostrazione `e facile, sia X g , X g , allora


[H, [X , X ]] = [[H, X ], X ] + [X , [H, X ]]
= (H)[X , X ] + (H)[X , X ]
= ( + )(H)[X , X ]

14 LE RAPPRESENTAZIONI DELLALGEBRE DI LIE SL(3)

269

e perci`o [X , X ] g+ , dove abbiamo usato lidentit`a di Jacobi come in 5.3.2. Si pu`o mostrare
che [g , g ] = g+ se + R.

14.2

Pesi: integralit`
a e simmetria

14.2.1 I pesi di una rappresentazione. In 14.1.5 abbiamo visto che ogni rappresentazione
: sl(3) End(V )
d`a una decomposizione di V in spazi peso (autospazi per gli elementi dellalgebra di Cartan h):
V = V ,

(H)v = (H)v

(H h, v V )

dove : h C `e unapplicazione lineare. Linsieme delle h per le quali V 6= 0 `e detto


linsieme dei pesi di .
Per esempio, i pesi della rappresentazione aggiunta di g sono le radici e = 0 (vedi 6.1.5)
sl(3) = h (R g ).
Un altro esempio `e V = C3 , la rappresentazione standard di g = sl(3).
diag(t1 , t2 , t3 ) h `e gi`a diagonale sulla base standard ei di V , si ha:
V = C3 = VL1 VL2 VL3 ,

VLi = Cei ,

Poiche H =

perche Hei = ti ei = Li (H)ei .

14.2.2 Integralit`
a e reticolo dei pesi W . Lalgebra di Cartan h `e generata su C da
H12 = H1 e H23 = H2 .
Dato un H , ci sono X g tali che < H , X , X > sia una sottoalgebra di Lie di
g isomorfa a sl(2) e tale che [H , X ] = 2X (vedi 14.1.7). In particolare, la restrizione
della rappresentazione a questa sl(2) `e una rappresentazione di sl(2) e quindi gli autovalori
di (H ) su V sono interi (vedi 5.4.8).
Perci`o, per ogni peso di V e per ogni R si ha:
(H ) Z
Questo `e equivalente a (vedi 14.1.10):
(, ) Z

( R).

Quindi un peso di una rappresentazione di sl(3) `e contenuto nellinsieme:


W := { hR : (, ) Z R }.
Ognuna delle sei radici 1 , 2 , (1 + 2 ) di sl(3) si scrive come a1 + b2 , con a, b Z.
Quindi (, ) Z per ogni R se e solo se (, i ) Z per i = 1, 2.

14 LE RAPPRESENTAZIONI DELLALGEBRE DI LIE SL(3)

270

I pesi fondamentali di sl(3) sono gli elementi 1 , 2 hR definiti da




(1 , 1 ) = 1,
(2 , 1 ) = 0,
,
(1 , 2 ) = 0,
(2 , 2 ) = 1,
dove 1 = L1 L2 , 2 = L2 L3 `e la base standard di h . Poiche (, ) `e un prodotto scalare
su hR segue che anche 1 , 2 `e una base di hR e per definizione 1 , 2 W .
In pi`
u, si ha
X
X
(
ai i , 1 ) Z a1 Z,
(
ai i , 2 ) Z a2 Z.
Quindi otteniamo che:
W = Z1 Z2 .
Linsieme W `e quindi un sottogruppo abeliano di rango 2 di hR e genera questo spazio. Esso
si chiama il reticolo dei pesi (weight lattice) di sl(3).
Un semplice calcolo mostra che
1 = L1 = (2L1 L2 L3 )/3

c
c

c
c

c
c

c
c

c
c

sc

sc

sc

c1

sc

sc

c
c

2 = L1 + L2 = (L1 + L2 2L3 )/3.

c
c

c
c

c
c

c
c

sc

sc

Pesi fondamentali e radici di sl(3)

14 LE RAPPRESENTAZIONI DELLALGEBRE DI LIE SL(3)

271

14.2.3 Il reticolo delle radici di sl(3). Il reticolo delle radici di sl(3) `e il gruppo:
1 = L1 L2 , 2 = L2 L3 .

R := Z1 + Z2

Poiche ogni radice `e una combinazione lineare con coefficienti interi delle radici semplici 1 , 2 ,
si ha R R . Inoltre, ogni radice `e un peso della rappresentazione aggiunta e quindi R W .
In modo esplicito:
1 = L1 L2 = 21 2 ,

2 = L2 L3 = 1 + 22 .

Il gruppo quoziente W /R risulta essere un gruppo finito con tre elementi e ha (pi`
u precisamente, il suo duale) uninterpretazione in termini del gruppo di Lie SL(3, C), vedi [FH]
p.372-374.
14.2.4 Radici e pesi. Lalgebra di Lie sl(3) ammette la decomposizione in spazi peso per la
rappresentazione aggiunta:
sl(3) = h (R g ).
Mostriamo che lazione di un (X ), con X g , manda V in V+ ,
(X ) : V V+

(X g ).

Per verificare ci`o, sia v V :


(H)((X )v) =
=
=
=

(([H, X ]) + (X )(H))v
(((H)X ) + (X )(H))v
((H) + (H))((X )v)
( + )(H)((X )v),

quindi (X )v V+ .
14.2.5 Il gruppo di Weyl e i pesi. Mostriamo che per R+ e un peso di V , anche
s () `e un peso di V , cio`e linsieme dei pesi di una rappresentazione `e invariante per lazione
del gruppo di Weyl su hR . In pi`
u dim V = dim Vs () , cio`e, i pesi nella stessa orbita del gruppo
di Weyl hanno la stessa molteplicit`a.
Anzitutto si ha:
s () = (, ) = (H ).
Consideriamo la restrizione di : sl(3) End(V ) a sl(2) :=< H , X , X > (vedi 14.1.7).
Visto che (H )v = (H )v per ogni v V , lo spazio V `e uno spazio peso per sl(2) con peso
k := (H ) e molteplicit`a dim V . Come visto in 14.2.4, (X )V V . Quindi otteniamo
una rappresentazione di sl(2) sul sottospazio V[] di V definita da:
V[] := nZ V+n

( V ).

Il sottospazio V+n `e uno spazio peso per H sl(2) con peso ( + n)(H ) = (H ) + 2n
perche (H ) = (, ) = 2.

14 LE RAPPRESENTAZIONI DELLALGEBRE DI LIE SL(3)

272

Dalla teoria delle rappresentazioni di sl(2) segue che se k `e un peso di una rappresentazione
di sl(2), allora anche k `e un peso con la stessa molteplicit`a e che (X )k : V[],k V[],k `e
un isomorfismo (con segno se k > 0). Poiche
k = (H ) = (H ) 2(H ) = ( (H ))(H )
il sottospazio di V[] con peso (H ) per sl(2) `e V(H ) = Vs () . Quindi anche Vs () `e uno
spazio peso e dim Vs () = dim V .

14.3

Il peso massimale di una rappresentazione irriducibile

14.3.1 La camera di Weyl. Poiche il gruppo di Weyl W permuta i pesi di ogni rappresentazione di g, `e interessante avere un modo di determinare un unico elemento (almeno, quasi
sempre) in ogni orbita di W , dove lorbita di un peso sotto W `e linsieme delle w() dove w
percorre W . Visto che W
= S3 permuta le Li , lorbita di 1 = (2L1 L2 L3 )/3 `e
{(2L1 L2 L3 )/3 = 1 , (L1 + 2L2 L3 )/3 = 1 + 2 , (L1 L2 + 2L3 )/3 = 2 }
(si noti che s2 fissa 1 ), mentre lorbita di 1 = L1 L2 `e R, linsieme delle radici.
La camera di Weyl fondamentale (chiusa) `e il sottoinsieme di hR dato da:
C = {x hR : (x, i ) 0,

i = 1, 2 }.

Nel diagramma in 14.2.2, i bordi di C, detti pareti della camera di Weyl fondamentale, sono le
due semirette indicate; la parte triangolare che essi definiscono `e C.
Allora `e facile vedere che per ogni x hR esiste un w W tale che w(x) C. Questo w `e
unico tranne se w(x) `e su una delle due pareti di C, nel qual caso la riflessione in quella parete
fissa w(x) (vedi [FH], Lemma D.31).
14.3.2 I pesi dominanti. Un peso W `e detto dominante se W C. Linsieme dei
pesi dominanti `e indicato con
nX
o
+
:=

C
=
m

:
m

Z
,
W
i i
i
0
W
P
lultima ugualianza segue dal fatto che ( mi i , j ) = mj .
14.3.3 Vettori massimali e pesi massimali. Sia : sl(3) End(V ) una rappresentazione
di sl(3). Un peso di `e detto massimale se esiste v V , v 6= 0, tale che (X )v = 0 per
ogni R+ . Il vettore v V `e detto vettore massimale di .
Ci`o generalizza il concetto di vettore massimale per una rappresentazione di sl(2), vedi 5.4.5.
Nel caso g = sl(2) i pesi massimali (in quel caso, interi n Z0 ) classificano le rappresentazioni
irriducibili di g (vedi 5.4.10).
Visto che R+ = {1 , 2 , 1 + 2 } e X1 +2 = [X1 , X2 ], si ha:
(X1 +2 ) = (X1 )(X2 ) (X2 )(X1 ),

14 LE RAPPRESENTAZIONI DELLALGEBRE DI LIE SL(3)

273

quindi un vettore v V `e massimale se e solo se (Xi )v = 0 per i = 1, 2.


Se `e un peso tale che V+1 = V+2 = 0, allora, poiche (X )(V ) V+ , ogni v V ,
v 6= 0, `e un vettore massimale di .
14.3.4 I pesi massimali sono dominanti. Mostriamo che un peso massimale `e un peso
dominante. Sia un peso massimale e sia v V un vettore massimale. Sia hH , X i sl(3)
la copia di sl(2) definita da , allora il vettore massimale v V `e un vettore massimale per
questa sl(2). Perci`o (H )v = (H )v con (H ) 0. Per le radici 1 , 2 R+ si ha allora
0 (Hi ) = (, i ), quindi `e dominante.
14.3.5 Esistenza di un vettore massimale. Linsieme dei pesi di una rappresentazione
di sl(3) `e un insieme finito, quindi esiste un peso tale che V 6= 0 ma V+ = 0 per ogni
R+ .
Quindi `e un peso massimale di e ogni v V , v 6= 0 `e un vettore massimale di .
14.3.6 Esempio. Consideriamo la rappresentazione aggiunta V = sl(3) di sl(3). I suoi pesi
sono lo 0 e gli Li Lj con i 6= j. Tra questi, i pesi dominanti sono 0 e L1 L3 = 1 +2 = 1 +2 .
Quindi se v V `e un vettore massimale, si ha v V0 = h oppure v VL1 L3 = CE1,3 .
Un vettore v V0 si scrive come v = aH12 + bH23 = aH1 + bH2 per certi a, b C. Poi v
`e massimale sse (Xi )v = 0 per i = 1, 2. Si ricordi che [H , X ] = (H )X = (, )X , cos`


(X1 )v = [X1 , aH1 + bH2 ] = a1 (H1 ) b1 (H2 ) X1 = (2a + b)X1 ,
quindi se v `e massimale si ha b = 2a. In modo simile, (X2 )v = (a 2b)X2 , quindi se v `e
massimale anche a 2b = 0 cio`e a 4a = 0 e perci`o a = b = 0. La conclusione `e che non ci
sono vettori massimali in V0 .
In 14.3.5 abbiamo visto che V dovrebbe avere un vettore massimale, e quindi ci deve essere
un vettore massimale in VL1 L3 . Poiche dim VL1 L3 = 1, ogni vettore non-zero in VL1 L3 `e
massimale. Si noti anche che VL1 L3 = V1 +2 e che 1 + 2 + i non `e un peso di V per
i = 1, 2; questo implica che ogni vettore in V1 +2 `e massimale.
14.3.7 La rappresentazione irriducibile generata da un vettore massimale. Sia v V
un vettore massimale. Sia W il sottospazio generato dalle immagini di v mediante successive
applicazioni di elementi di g con R .
Mostriamo che W `e una sottorappresentazione di g := sl(3). Sia R = {1 = L2 L1 , 2 =
L3 L2 , 3 = L3 L1 },
Wn := h (Xi1 ) . . . (Xik )v : ij R , 0 k n i,

W =
n=0 Wn .

Poiche : g End(V ) `e lineare, basta mostrare che (X)x W per ogni x W e X =


H, X , X con H h, R e R+ .
Sia x = (Xi1 ) . . . (Xik )v Wn con k n. Allora (H)x = (H)x con = + i1 +
. . . + ik (vedi 7.1.6), quindi (H)x W e, in pi`
u, x V . In particolare,
(h)Wn Wn

(n Z0 ),

14 LE RAPPRESENTAZIONI DELLALGEBRE DI LIE SL(3)

274

e segue che (H)W W per ogni H h. Lunico vettore (a meno di moltiplicazione per uno
scalare) in W con peso `e v:
W = Cv,
e ogni altro peso di W si scrive come = + i1 + . . . + ik con k 1 e ij R , cio`e
= k l2 con k, l Z0 dove 1 = L1 L2 , 2 = L2 L3 .
La definizione di Wn mostra che per x Wn e R si ha (X )x Wn+1 . Segue che
(X )W W per ogni R .
Infine, mostriamo per induzione su n che
(X )Wn Wn

X g , R+ ;

da ci`o segue che (X )W W per ogni R+ . Se n = 0, si ha W0 = Cv e (X )v = 0 perche


v `e un vettore massimale. Se x Wn e n > 0, allora x = (X )y con y Wn1 e R ,
quindi
(X )x = (X )(X )y
= (X )(X )y + ([X , X ])y.
Si noti che Y := [X , X ] g+ . Se + 6 R {0}, g+ = 0 e quindi Y = 0. Se
+ = 0, Y h e quindi (Y )y Wn . Se + R allora (Y )y Wn perche y Wn1 .
Se + R+ si ha (Y )y Wn1 per lipotesi di induzione. Quindi in ogni caso si ha
([X , X ])y Wn . Sempre per lipotesi di induzione, per y Wn1 si ha (X )y Wn1 , e
perci`o (X )(X )y Wn . Allora anche (X )(X )y + ([X , X ])y Wn e concludiamo che
(X )x Wn .
14.3.8 La rappresentazione W `
e irriducibile. Mostriamo che la rappresentazione W
di g generata dal vettore massimale v `e irriducibile. Sia W = W 0 W 00 , dove W 0 , W 00 sono
sottorappresentazioni. Decomponendo ciascuna in spazi peso, lo spazio peso W = Cv, che ha
dimensione uno, `e contenuto in W 0 oppure W 00 . Poiche la rappresentazione di g generata da v
`e W si ha W 0 = W oppure W 00 = W , quindi W `e irriducibile.
14.3.9 Il vettore massimale `
e unico. Mostriamo che v `e lunico vettore massimale (a meno
di moltiplicazione per uno scalare) nella rappresentazione W . Sia v 0 W , v 0 (6= 0) un vettore
massimale. Allora v 0 genera una sottorappresentazione W 0 W . Dato che W `e irriducibile e
W 0 6= 0, si ha allora W 0 = W . Sia W il peso di v 0 , allora = n1 m2 per certi
n, m Z0 e 1 = L1 L2 , 2 = L2 L3 .
Ogni altro peso di W 0 si scrive come = k1 l2 per certi k, l Z0 . Dato che v W 0
e il peso di v `e segue allora che = k1 l2 = (k + n)1 (l + m)2 e quindi
k + n = l + n = 0 ma poiche k, l, m, n 0 segue allora n = m = 0 e perci`o = . Dato che
W = Cv, segue v 0 Cv. In particolare, una rappresentazione irriducibile ha un unico vettore
massimale, a meno di moltiplicazione per uno scalare.
14.3.10 Conclusione. Data una rappresentazione : g End(V ), il teorema di Weyl (vedi
5.3.8) afferma che V = V1 V2 . . . Vk , dove ogni Vi `e una rappresentazione irriducibile.
I risultati appena ottenuti mostrano che ogni Vi ha un vettore massimale vi e che il vettore

14 LE RAPPRESENTAZIONI DELLALGEBRE DI LIE SL(3)

275

massimale vi genera una sottorappresentazione irriducibile di Vi , che `e quindi Vi . In particolare,


la dimensione dello spazio generato dai vettori massimali `e k.
Se la rappresentazione `e irriducibile, allora ha un unico vettore massimale (a meno di
moltiplicazione per uno scalare). Il peso = del vettore massimale `e allora determinato
in modo unico dalla rappresentazione. Questo peso `e massimale (per definizione) e abbiamo
mostrato che `e quindi dominante (si veda 14.3.4).
Nell esempio 14.3.6 abbiamo visto che la rappresentazione aggiunta ad ha un unico vettore
massimale, quindi ad `e irriducibile. In pi`
u si ha ad = 1 + 2 .
Mostriamo che il peso determina in modo unico (a meno di isomorfismi) la rappresentazione irriducibile W generata dal vettore massimale. Questa rappresentazione irriducibile
verr`a indicata con V ().
Poi c`e da stabilire se un peso dominante determini una rappresentazione irriducibile il
cui vettore massimale abbia peso (si veda 14.4.2).
14.3.11 Unicit`
a della rappresentazione irriducibile. Due rappresentazioni irriducibili
V , W di g su spazi vettoriali V, W rispettivamente, con vettori massimali v V e w W e
lo stesso peso +
W sono isomorfe. Per vedere questo, si consideri la somma diretta V W ,
che `e una rappresentazione di g con
: g End(V W ),

(X)(x, y) := (V (X)x, W (X)y).

Sia U V W la sottorappresentazione generata da (v, w). Allora U `e irriducibile perche


(v, w) `e un vettore massimale in V W . La proiezione
V : U V,

(x, y) 7 x,

soddisfa V (X) = V (X)V

per ogni X g come si verifica facilmente. Quindi V `e un omomorfismo di rappresentazioni e


perci`o ker(V ) e im(V ) sono sottospazi invarianti (vedi 5.3.7). Poiche (v, w) U e V (v, w) =
v V , si ha ker(V ) 6= U e im(V ) 6= 0. Dato che U e V sono irriducibili, si ha allora
ker(V ) = 0 e im(V ) = V , quindi V `e un isomorfismo. Similmente, usando W , si trova che
U
= W , quindi V
= W.

14.4

Le rappresentazioni irriducibili di sl(3)

14.4.1 Classificazione. In 14.3.10 abbiamo visto che una rappresentazione irriducibile


: sl(3) End(V )
ha un unico vettore massimale (a meno di moltiplicazione per uno scalare) v e che v sta in
uno spazio peso V di V . Il peso = `e allora lunico peso massimale di V . In pi`
u `e sempre
un peso dominante. In 14.3.11 abbiamo visto che il peso determina in modo unico.
Mostriamo che vice versa ogni peso dominante definisce una rappresentazione irriducibile
di sl(3), denotata V (), tale che lunico vettore massimale di V () ha peso .

14 LE RAPPRESENTAZIONI DELLALGEBRE DI LIE SL(3)

276

Fatto questo, segue che le rappresentazioni irriducibili di sl(3) sono classificate dal loro peso
massimale e c`e una biiezione tra linsieme dei pesi dominanti +
W e linsieme delle rappresentazioni irriducibili di sl(3) data da 7 V () con inversa 7 , lunico peso massimale di
.
bi

+
W = { m1 1 + m2 2 : mi Z0 } { rappr. irrid. di sl(3) },

7 V ().

14.4.2 Le rappresentazioni irriducibili fondamentali. Per costruire la rappresentazione


V (), con dominante, mostriamo prima che le rappresentazioni V (1 ) e V (2 ) sono la
rappresentazione standard di sl(3) e il suo duale. Le rappresentazioni V (i ) si chiamano
rappresentazioni fondamentali di sl(3).
Si ricordi che i pesi della rappresentazione standard C3 di sl(3) sono L1 , L2 , L3 (vedi 14.1.5),
`e facile verificare che L1 `e lunico peso dominante di C3 . Quindi L1 `e lunico peso massimale
e poiche dimVL1 = 1 la rappresentazione C3 `e irriducibile, con peso massimale L1 . Visto che
L1 = (2L1 L2 L3 )/3 = 1 (vedi 14.2.2), C3 `e allora la rappresentazione irriducibile che
corrisponde al peso dominante 1 :
V (1 ) = C3 .
Si ricordi che lazione di A SL(3, C) sullo spazio duale `e data dalla matrice t A1 (vedi
1.1.12). Per lalgebra di Lie questo implica (si usi un cammino (t) con (0) = I e 0 (0) = X)
che lazione di X sl(3) sullo spazio duale `e data da t X. In particolare, se H = diag(t1 , t2 , t3 )
allora rispetto alla base duale di V (1 ) = C3 lazione di H `e diag(t1 , t2 , t3 ). Perci`o i pesi
della rappresentazione duale V (1 ) sono L1 , L2 , L3 . Si verifica che lunico peso dominante
di V (1 ) `e il peso
L3 = L1 + L2 = (L1 + L2 2L3 )/3 = 2 ,

quindi V (2 ) = V (1 ) .

Per mostrare che una rappresentazione con peso massimale = m1 1 + m2 2 e mi 0


esiste, consideriamo prodotti tensoriali di V (1 ) e V (2 ).
14.4.3 Prodotti tensoriali e pesi. Il prodotto tensoriale di rappresentazioni V , W di
unalgebra di Lie g `e definito da
V W (X)(v w) = ((X)v) w + v (W (X)w).
In particolare, se X = H g e
V (H)v = 1 (H)v,

W (H)w = 2 (H)w

V W (H)(v w) = (1 + 2 )(H)(v w).

Quindi se V1 e W2 sono spazi peso di V e W , il loro prodotto tensoriale `e contenuto in uno


spazio peso di V W :
V1 W2 (V W )1 +2 .
In generale si ha V1 . . . Vk V1 +...+k .

14 LE RAPPRESENTAZIONI DELLALGEBRE DI LIE SL(3)

277

14.4.4 Costruzione delle V (). Sia = m1 1 + m2 2 , mi Z0 un peso dominante.


Consideriamo il prodotto tensoriale
V := V (1 ) . . . V (1 ) V (2 ) . . . V (2 ) =: V (1 )m1 V (2 )m2 .
|
{z
} |
{z
}
m1

m2

Sia vi V (i ) un vettore massimale e sia


v := v1 . . . v1 v2 . . . v2
|
{z
} |
{z
}
m1

( V ).

m2

Dato che vi V (i ) `e un vettore massimale, cio`e i (X )vi = 0 per ogni i R+ , si ha


(X )v = 1 (X )v1 v1 . . . v2 + . . . + v1 v1 . . . 2 (X )v2 = 0 + . . . + 0 = 0.
Quindi v `e un vettore massimale in V con peso (massimale e quindi dominante):
(H)v = (m1 1 + m2 2 )(H)v = (H)v.
Perci`o v genera una rappresentazione irriducibile W V con (un unico) peso massimale (vedi
14.3.7). Questa rappresentazione W `e lunica rappresentazione irriducibile con peso massimale
(vedi 14.3.11) ed `e la rappresentazione indicata con V (), cio`e V () := W .
In questo modo si conclude la classificazione delle rappresentazioni irriducibili di sl(3). Per`o
per determinare la dimensione (vedi 7.2.14 per una formula esplicita) o per poter decomporrere
prodotti tensoriali di rappresentazioni di sl(3) ci vuole uno studio pi`
u approfondito, vedi 7.4.
Il legame con le rappresentazioni di su(3) `e dato in 7.4.7.

14.5

La forma di Killing per sl(3).

14.5.1 In questa sezione definiamo la forma di Killing per lalgebra di Lie sl(3) e mostriamo
che dalla forma di Killing si ottiene in modo naturale il prodotto scalare su h introdotto in
14.1.8, a meno di uno scalare.
14.5.2 Una forma bilineare su End(V ). Sia V uno spazio vettoriale complesso. Lo spazio
vettoriale complesso End(V ) ha una forma bilineare naturale data da BV (X, Y ) := Tr(XY )
dove Tr(Z) `e la traccia dellendomorfismo Z di V . Scegliendo una base di V , cio`e un isomorfismo
V
= Cn , si pu`o esplicitare tale forma bilineare e si ottiene:
Bn : Mn (C) Mn (C) C,

Bn (X, Y ) = Tr(XY ) =

n X
n
X
(
Xlk Ykl ),
l=1 k=1

dove Tr(Z) = l Zll `e la traccia della matrice Z. La formula per Bn mostra che Tr(XY ) =
Tr(Y X), quindi B `e simmetrico: B(X, Y ) = B(Y, X) per ogni X, Y End(V ). Poiche la
traccia `e lineare, Tr(X + Y ) = Tr(X) + Tr(Y ), si ha T r([X, Y ]) = T r(XY Y X) = 0.

14 LE RAPPRESENTAZIONI DELLALGEBRE DI LIE SL(3)

278

Unaltra propriet`a importante della forma di Killing `e:


B([X, Y ], Z) = B(X, [Y, Z])

(X, Y, Z Mn (C)),

cio`e, che vale Tr((XY Y X)Z) = Tr(X(Y Z ZY )). Per mostrarlo si consideri la differenza
tra i due lati e si usi:
Tr((XY Y X)Z X(Y Z ZY )) = Tr(XZY Y XZ) = Tr([XZ, Y ]) = 0,
come appena visto.
La rappresentazione aggiunta di unalgebra di Lie semplice g d`a una inclusione ad : g ,
End(g)
= Mn (C) dove n = dim g. Quindi otteniamo una forma bilineare su g, detta forma di
Killing, definita da
B : g g C,

B(X, Y ) := Bg (ad(X), ad(Y ))

e, come appena visto, questa forma bilineare soddisfa B([X, Y ], Z) = B(X, [Y, Z]).
Una propriet`a importante della forma di Killing `e che `e nondegenere, cio`e, per ogni X g,
X 6= 0, esiste uno Z g tale che B(X, Z) 6= 0.
14.5.3 La forma di Killing su h. Lalgebra di Cartan h ha dimensione 2 e ha C-base H12 =
diag(1, 1, 0), H23 = diag(0, 1, 1). Mostriamo che la restrizione di B ad h `e non-degenere con
un calcolo esplicito. Dall equazione 2 di 14.1.2 si ha:
ad(H12 ) = diag(0, 0, 2, 1, 1, 2, 1, 1)
ad(H23 ) = diag(0, 0, 1, 2, 1, 1, 2, 1)
quindi:
ad(H12 )ad(H12 ) = diag(0, 0, 4, 1, 1, 4, 1, 1)
ad(H23 )ad(H23 ) = diag(0, 0, 1, 4, 1, 1, 4, 1)
ad(H12 )ad(H23 ) = diag(0, 0, 2, 2, 1, 2, 2, 1)

T r(ad(H12 )ad(H12 )) = 12,


T r(ad(H23 )ad(H23 )) = 12,
T r(ad(H12 )ad(H23 )) = 6,

e, per simmetria di B, allora anche B(H23 , H12 ) = 6. Segue che





2 1
y1
= 6(2x1 y1 x1 y2 x2 y1 +2x2 y2 ).
B(x1 H12 +x2 H23 , y1 H12 +y2 H23 ) = 6(x1 x2 )
1 2
y2
2 1
Poiche la matrice (1
e non-degenere.
2 ) ha determinante 6= 0, la forma di Killing ristretta ad h `
Questo implica che B definisce una dualit`a, sempre indicata con B, cio`e un isomorfismo:

B : h h,

7 T

se (H) = B(T , H)

per ogni H h, cio`e le forme lineari e B(T , ) sono la stessa su h. Tramite questo
isomorfismo si definisce un prodotto scalare su hR nel modo seguente:
(, )B := (T , T )

(, hR ).

14 LE RAPPRESENTAZIONI DELLALGEBRE DI LIE SL(3)

279

Per calcolare il prodotto scalare in modo esplicito determiniamo Ti := Ti h per i = 1, 2.


Si noti che 1 (H) = t1 t2 se H = diag(t1 , t2 , t3 ) h. Daltre parte, T1 = x1 H12 + x2 H23 per
certe xi C e, poiche t1 + t2 + t3 = 0, H = diag(t1 , t2 , t3 ) = t1 H12 + (t1 + t2 )H23 , quindi
B(T , H) = B(x1 H12 + x2 H23 , t1 H12 + (t1 + t2 )H23 )


= 6 2x1 t1 x1 (t1 + t2 ) x2 t1 + 2x2 (t1 + t2 )
= 6(x1 + x2 )t1 + 6(x1 + 2x2 )t2
perci`o si ha: 1 (H) = B(T1 , H) per ogni H h se e solo se 6(x1 + x2 ) = 1, 6(x1 + 2x2 ) = 1;
quindi x1 = 1/6, x2 = 0 e perci`o T1 = H12 /6. In modo simile si ha T2 = H23 /6. Allora
(1 , 2 )B = (H12 /6, H23 /6) = 1/6,

(1 , 1 )B = (2 , 2 )B = 2/6,

e questo `e, a meno di una fattore 1/6, il prodotto scalare (, ) su hR . Si noti che
H1 := H12 =

2
T1 ,
B(T1 , T1 )

(si veda 6.1.11 per il caso generale).

H2 := H23 =

2
T2
B(T2 , T2 )

RIFERIMENTI BIBLIOGRAFICI

280

Riferimenti bibliografici
[A]

M. Artin, Algebra, Bollati Boringhieri 1997.

[CDF] L. Castellani, R. DAuria, P. Fre, Supergravity and Superstrings, Vol. 1, parte I, World
Scientific 1991.
[CL] T.-P. Cheng, L.-F. Li, Gauge theory of elementary particle physics, Oxford University
Press, 2004.
[CL2] T.-P. Cheng, L.-F. Li, Gauge theory of elementary particle physics: Problems and
solutions, Oxford University Press, 2000.
[dC] M.P. do Carmo, Riemannian geometry, Birkhauser Boston, 1992.
[D]

R.W.R. Darling, Differential forms and connections, Cambridge University Press, 1994.

[DNF1] B.A. Dubrovin, S.P. Novikov, A.T. Fomenko, Geometria delle superfici, dei gruppi di
trasformazioni e dei campi, Editori Riuniti 1987.
[DNF2] B.A. Dubrovin, S.P. Novikov, A.T. Fomenko, Geometria e topologia delle variet`a,
Editori Riuniti 1988.
[FH] W. Fulton, J. Harris, Representation Theory, GTM 129, Springer 1991.
[Ha] B.C. Hall, Lie groups, Lie algebras, and representations, GTM 222, Springer 2003.
[Hu] J.E. Humphreys, Introduction to Lie algebras and representation theory, GTM 9, Springer
1978.
[KN] S. Kobayashi, K. Nomizu, Foundations of differential geometry, Vol. I. Wiley Classics
Library. A Wiley-Interscience Publication. John Wiley & Sons, Inc., 1996
[Lie] Sito: http://www-math.univ-poitiers.fr/ maavl/
[MB] S. Mac Lane, G. Birkhoff, Algebra, Mursia.
[N1] G.L. Naber, Topology, geometry, and gauge fields, Foundations, TAM 25, Springer 1997.
[N2] G.L. Naber, Topology, geometry, and gauge fields. Interactions, AMS 141. Springer 2000.
[S]

J-P. Serre, Linear representations of finite groups, GTM 42, Springer 1977.

[T]

W. Thirring, Classical mathematical physics. Dynamical systems and field theories,


Springer 1997.

[We] S. Weinberg, The Quantum Theory of Fields, Vol. 1, Cambridge University Press.
[Wa] F.W. Warner, Foundations of differentiable manifolds and Lie groups, GTM 94, Springer
1983.

Indice analitico
Adroni, 245
Aggiunta, Ad, 84
aggiunta, ad, 86
Algebra
di Clifford
ed elettrone, 231
di Poincare, 224
Algebra di Lie, 87
Algebra di Lie semplice, 89
Angolo di Cabibbo, 255
Angolo di Weinberg, 253
Antiparticella, 241
Applicazione liscia, 59
Atlante, 58
Azione
per lequazione di Dirac, 235
Barioni, 246
Bellezza, 246
Bosone di Higgs, 249
Calibrazione, 210
Camera di Weyl, 119
Cammino, 64
Campbell-Baker-Hausdorff, 87
Campi di gauge
costruzione euristica, 210
Campi di materia, 207
calibrabili o gauge covarianti, 210
Campo
orizzontale, 194
vettoriale
fondamentale, 182
verticale, 182
Campo di gauge, 210, 212
Campo hamiltoniano, 78
Campo scalare, 229
carico, 230
con potenziale, 230
libero, 229
Campo spinoriale, 231

Campo vettoriale
di Spin 1, 242
Carattere, 30
Carta locale, 58
Chiralit`a, 233
e parit`a, 236
Ciclo, 37
Classe di coniugio, 37
Colori, 248
Complessificazione
di SO(1, 3), 241
Confinamento, 248
Connessione, 178
G-connessione, 183
di Koszul, 185
di Levi-Civita, 195
e vielbein, 198
in coordinate locali, 200
di Spin, 243
e cambiamento di carta locale, 199
e campi di gauge, 213
metrica, 195
su spazi affini, 178
su un fibrato differenziale, 181
Connessione infinitesima
G-connessione infinitesima, 184
e derivata covariante, 188
su un fibrato principale, 183
su un fibrato vettoriale, 182
sul fibrato duale, 183
sul fibrato prodotto, 183
coordinate normali, 200
Costante cosmologica, 222
Cromodinamica, 255
Curvatura, 191
e campo di forze, 214
forma di, 191
rispetto a un sistema di coordinate, 200
rispetto a un vielbein, 198
scalare, 196
281

INDICE ANALITICO
sezionale, 197
tensore di, 192
Decadimento del protone, 261
Decomposizione di Jordan, 92
Derivata covariante, 185
sul prodotto di fibrati, 188
direzionale, 187
e connessione infinitesima, 190
e trasporto parallelo, 189
sul fibrato duale, 189
Derivata di Lie, 81
Derivata esterna, 69
Derivazione, 63
Diagramma di Dynkin, 111
Diagramma di Young, 41
Diffeomorfismo, 58
Differenziale di unapplicazione liscia, 64
Differenziale di una funzione liscia, 65
Diquark, 261
Distribuzione, 181
differenziale, 181
involutiva, 181
Doppietto isotopico, 245
Dualit`a, 210
Elettrone, 233
Elicit`a, 228
Equazione
di Dirac, 233
di Klein-Gordon, 229
di Maurer-Cartan, 175
di struttura, 192
I, 194
II, 192
Equazione di Newton, 74
Equazioni di Einstein, 220
Equazioni di Hamilton, 78
Esponenziale, 87
Estensione centrale, 226
Famiglie leptoniche, 245
Fibrato, 166
associato, 171

282
banale, 167
dei riferimenti, 170
differenziale, 172
duale, 169
principale, 170
prodotto, 169
spinoriale, 243
sulla sfera, 173
vettoriale, 166
Fibrato tangente, 65
Flusso di un campo vettoriale, 79
Forma
di Cartan, 174
di curvatura, 191
di torsione, 194
orizzontale canonica, 194
tensoriale, 189
Forma canonica (sul fibrato cotangente), 73
Forma di Killing, 174
per gruppi semisemplici, 175
Forma differenziale, 69
Forma quadratica, 137
Formula di Cartan, 81
Forze di marea, 220
Funzione hamiltoniana, 78
Funzione liscia, 59
Funzioni equivarianti, 189
Geometria
dei gruppi di Lie, 174
Germe, 63
Groupring, 36
Gruppo
di Lorentz
proprio ed ortocrono, 229
di Spin
Spin(1, 3), 238
Gruppo di Lie, 83
Gruppo di simmetria, 208
Gruppo ortogonale, 62, 138
Gruppo speciale, 61
GUT, 258
modello SO(10), 261

INDICE ANALITICO
modello SU (5), 258
Hooklength, 43
Ideale, 89
Idempotente, 31
Identit`a di Bianchi, 192
I, 195
II, 192
Identit`a di Jacobi, 68
Incanto, 246
Interazioni di gauge, 215
Invarianti di gauge, 210
Ipercarica, 249
Legge di Sylvester, 137
Lemma di Schur, 29
Lepto-quark, 261
Leptoni, 245
Luce pesante, 249
W , Z 0 , 253
Mappa regolare, 110
Massa dei neutrini, 256
Matrice di Kobaiashi-Maskawa, 255
Matrice jacobiana, 58
Matrici
, 236
di Dirac, 234, 236
di Gell-Mann, 255
di Pauli, 234, 236
Meccanica Hamiltoniana, 77
Meccanismo
di Higgs, 252
Mesoni, 246
Misura invariante, 177
per SU (2), 178
Modello
elettrodebole, 250
standard, 250
Neutrino, 233
Nondegenere, 137
O(1,1), 140

283
Omomorfismo di gruppi di Lie, 83
Operatore
coniugazione di carica, 240
di Dirac, 232
Oscillazioni dei neutrini, 257
Parentesi di Lie, 68
Partizione, 37
Peso dominante, 120
Peso massimale, 120
Piccolo gruppo, 225
Positrone, 241
Precessione di Thomas, 204
Principio di equivalenza, 217
debole, 218
forte, 218
Principio di relativit`a generale, 219
Problema della gerarchia, 261
Proiettore, 31
Pull-back (di forme differenziali), 70
Pullback, 79
Pushforward, 80
Quark
beauty, 246
charm, 246
down, 246
strange, 246
top, 246
up, 246
Radice semplice, 110
Radici positive, 110
Rango di un fibrato, 166
Rango di una mappa liscia, 60
Rappresentazione
di Dirac, 234
di Spin
di SO(1, 3), 236
intrinsecamente proiettiva, 226
proiettiva, 226
Rappresentazione di un algebra di Lie, 90
Rappresentazione di un gruppo di Lie, 84
Rappresentazione fondamentale, 123

INDICE ANALITICO
Rappresentazione regolare, 34
Relazione di cociclo
per rappresentazioni proiettive, 226
Reticolo dei pesi, 117
Reticolo delle radici, 118
Ricoprimento universale, 228
Scalare di curvatura, 196
Seesaw mechanism, 257
Sezione
di un fibrato, 168
e funzioni equivarianti, 189
globale, 168
locale, 168
Simboli di Christoffel, 187, 199
Simmetrie
esterne, 207
interne, 207
Simmetrie di gauge, 210
Simmetrie interne
e relativit`a, 217
Simmetrizzatore di Young, 42
Sistema di radici duali, 114
Sistema di riferimento ruotante, 201
Sommersioni, 60
Sottogruppo di Lie, 83
Sottogruppo di Lie immerso, 83
Sottospazio
orizzontale, 181
Sottovariet`a, 60
Spazio cotangente, 65
Spazio degli invarianti, 31
Spazio tangente, 63
Spinori
di Majorana, 239
Stranezza, 246
Struttura Riemanniana, 195
Struttura simplettica, 78
Strutture geometriche, 166
Riemanniane, 193, 195
Tensore
di curvatura, 192
simmetrie, 196

284
di Einstein, 196
di Ricci, 196
di Riemann, 196
di torsione, 194
Teorema
di Frobenius, 191
Teorie di grande unificazione, 258
Teorie di Yang-Mills, 214
Torsione
forma di, 194
rispetto a un sistema di coordinate, 199
rispetto a un vielbein, 198
tensore di, 194
Trasformazione di gauge
della connessione, 213
della curvatura, 214
Trasformazioni, 208
di gauge, 210
esterne, 208
interne, 208
Trasformazioni di simmetria, 208
Trasporto parallelo, 178, 181
su spazi affini, 178
sulla sfera S 2 , 179
Variet`a differenziabile, 59
Vettore tangente, 63
Vielbein, 198
e connessione di Levi-Civita, 198
e curvatura, 198
e tensore di torsione, 198

You might also like