You are on page 1of 385

Appunti

di
Fisica Subnucleare

E. Iacopini
Dipartimento di Fisica e Astronomia, Università di Firenze
e
Istituto Nazionale di Fisica Nucleare, Sezione di Firenze
June 10, 2010

1
Libri consigliati da consultare:

• D. Griffiths: Introduction to elementary particles


• W.R. Frazer : Elementary particles
• D.H. Perkins: Introduction to high energy physics
• I.J.R. Aitchinson: Gauge theory in particle physics
• J.D. Bjorken, S.D. Drell : Relativistic quantum mechanics
• J.D. Bjorken, S.D. Drell : Relativistic quantum fields
• S. Weinberg : The Quantum Theory of Fields
• H. Muirhead : The Physics of elementary particles

2
Contents
1 Introduzione 7

2 Cenni di Teoria dei Campi 9


2.1 Introduzione alla Teoria dei Campi classica . . . . . . . . . . . . 9
2.2 Simmetrie discrete . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2.1 La Parità . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.2.2 La Coniugazione di Carica . . . . . . . . . . . . . . . . . . 32
2.2.3 La simmetria di inversione temporale . . . . . . . . . . . . 33
2.2.4 L’operatore T 2 . . . . . . . . . . . . . . . . . . . . . . . . 41
2.2.5 Il momento di dipolo elettrico, la parità e l’inversione tem-
porale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.2.6 Una curiosità: il vettore di Runge-Lenz . . . . . . . . . . . 53
2.2.7 Il sistema dei Kappa neutri . . . . . . . . . . . . . . . . . 57
2.3 La seconda quantizzazione . . . . . . . . . . . . . . . . . . . . . . 70
2.3.1 Il campo scalare libero . . . . . . . . . . . . . . . . . . . . 70
2.3.2 Il campo vettoriale libero . . . . . . . . . . . . . . . . . . . 89
2.3.3 Il decadimento del π 0 . . . . . . . . . . . . . . . . . . . . . 115
2.3.4 Il campo di Dirac libero . . . . . . . . . . . . . . . . . . . 119
2.3.5 Il decadimento del positronio . . . . . . . . . . . . . . . . 158

3 Scattering e decadimenti 162


3.1 La matrice S . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
3.2 Proprietà di S sotto CPT . . . . . . . . . . . . . . . . . . . . . . . 168
3.3 Lo scattering in QFT . . . . . . . . . . . . . . . . . . . . . . . . . 171
3.4 Lo spazio delle fasi . . . . . . . . . . . . . . . . . . . . . . . . . . 182
3.4.1 Lo spazio delle fasi di due particelle . . . . . . . . . . . . . 182
3.4.2 Lo spazio delle fasi di tre particelle: il plot di Dalitz . . . . 191
3.4.3 Lo spazio delle fasi di n particelle . . . . . . . . . . . . . . 199
3.5 Applicazione allo scattering (quasi-)elastico . . . . . . . . . . . . . 201
3.5.1 Lo spin del pione π + . . . . . . . . . . . . . . . . . . . . . 210
3.5.2 Lo scattering quasi-elastico ν̄ + p → n + e+ . . . . . . . . . 214
3.5.3 Lo scattering QE non polarizzato di CC di ν e ν̄ . . . . . . 226
3.6 Applicazione a processi di decadimento . . . . . . . . . . . . . . . 227
3.6.1 Il decadimento del pione . . . . . . . . . . . . . . . . . . 227
3.6.2 Il decadimento del muone . . . . . . . . . . . . . . . . . . 250

A Appendix: Generalità 261


A.1 Le unità di misura . . . . . . . . . . . . . . . . . . . . . . . . . . 261
A.2 Le notazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
A.3 Su alcune rappresentazioni finite di SO(n) ed SO(n,m) . . . . . . 269
A.4 Parametrizzazione del gruppo di Lorentz . . . . . . . . . . . . . . 278

3
A.5 La rappresentazione spinoriale . . . . . . . . . . . . . . . . . . . . 286

B Appendix: Cenni di Teoria Classica dei Campi 289


B.1 Le equazioni di Eulero-Lagrange per campi classici . . . . . . . . 291
B.2 Invarianza in valore . . . . . . . . . . . . . . . . . . . . . . . . . . 292
B.3 Invarianza in forma . . . . . . . . . . . . . . . . . . . . . . . . . 296
B.3.1 Alcuni esempi di lagrangiane . . . . . . . . . . . . . . . . . 298
B.4 Il teorema di Noëther . . . . . . . . . . . . . . . . . . . . . . . . . 303
B.4.1 L’invarianza sotto il gruppo di Poincaré . . . . . . . . . . 310
B.4.2 L’invarianza di gauge di prima specie . . . . . . . . . . . . 321

C Appendix: Le simmetrie C, P e T in Teoria Quantistica dei


Campi 324
C.1 Generalità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324
C.2 La Coniugazione di Carica . . . . . . . . . . . . . . . . . . . . . . 325
C.3 La Parità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346
C.4 L’inversione temporale . . . . . . . . . . . . . . . . . . . . . . . . 357
C.5 Riassumendo ... . . . . . . . . . . . . . . . . . . . . . . . . . . . . 376

D Appendix: Cenni di Teoria formale dello Scattering 379

4
E io stesso ho osservato anche che ogni fatica
e tutta l’abilità messe in un lavoro
non sono che rivalità dell’uno con l’altro.
Anche questo è vanità e un correr dietro al vento.

Salomone, Ecclesiaste 4:4

5
La Filosofia è scritta in questo grandissimo libro che continuamento ci sta
aperto innanzi a gli occhi (io dico l’universo), ma non si può intendere se prima
non s’impara a intender la lingua, e conoscer i caratteri, ne’ quali è scritto.
Egli è scritto in lingua matematica, e i caratteri son triangoli, cerchi ed altre
figure geometriche, senza i quali mezi è impossibile a intenderne umanamente
parola; senza questi è un aggirarsi vanamente per un oscuro laberinto.

Il Saggiatore (1623).

Figure 1: Galileo Galilei (1564-1642)

6
1 Introduzione
La Fisica subnucleare studia le interazioni fondamentali più rilevanti1 che esistono
fra le particelle elementari2 .
1
L’interazione gravitazionale è del tutto trascurabile, almeno nel dominio di energie a cui
siamo interessati. Si noti, a questo proposito, per esempio, che il rapporto fra l’energia di
interazione gravitazionale ed elettromagnetica fra due protoni vale circa 0.8 × 10−38 !
2
Ricordiamo a questo proposito che ad una particella elementare dobbiamo richiedere di
avere definite almeno due quantità fisiche tipiche, che sono la sua massa m ed il suo spin s.
Questa esigenza discende, come è noto, dal fatto che, se lo spazio-tempo è omogeneo (invariante
per traslazioni) e vale l’invarianza relativistica, allora lo spazio di Hilbert H degli stati di una
particella deve essere trasformato in sé sotto il gruppo di Poincaré P (traslazioni in quattro
dimensioni e trasformazioni del gruppo di Lorentz ortocrono proprio L↑+ ), i cui elementi agiscono
in H come simmetrie unitarie.
Alla particella elementare viene richiesto di essere tale per cui lo spazio di Hilbert H degli
stati non deve avere sottospazi invarianti (non banali) sotto queste trasformazioni, ovvero di
essere caratterizzata dal fatto che la rappresentazione unitaria di P su H sia irriducibile.
Queste rappresentazioni, come è stato dimostrato da Wigner, per esempio, in
E. Wigner: On Unitary Representations of the Inhomogeneous Lorentz Group
Ann. Math. 40, 149 (1939)
sono individuate completamente dagli autovalori assunti sullo spazio di Hilbert degli stati del
sistema dai due soli operatori di Casimir (costruiti quindi con i generatori del gruppo) indipen-
denti (almeno nel caso di particelle con massa), i quali commutano con tutti i generatori del
gruppo stesso, i.e. gli invarianti
1
P µ P µ → m2 ; W µ Wµ → − m2 s(s + 1)
2
dove P µ è l’operatore di quadrimpulso, i.e. l’operatore che genera le traslazioni nello spazio-
tempo, mentre il quadrivettore di Pauli-Lubanski Wµ ≡ ϵµνσρ M νσ P ρ è legato anche ai gener-
atori M σρ del gruppo di Lorentz, per cui risulta

W 0 = P⃗ · J;
⃗ ⃗ = P0 J⃗ − P⃗ × K
W ⃗

essendo i generatori M σρ definiti implicitamente dalla consueta parametrizzazione della generica


trasformazione di Lorentz (attiva), secondo la quale abbiamo

Λ = e− 2 αµν M ;
i µν
(M µν )α
. β = i(δ δβ − δ να δβµ )
µα ν
(1.1)

con αµν matrice reale antisimmetrica.


⃗ = eiϕ· ⃗ J⃗
Usando la consueta definizione dei generatori delle rotazioni J⃗ ( ⇒ R(ϕ) ) e dei gener-
n·K
⃗ −1
atori dei boosts di Lorentz K ( ⇒ B(η⃗n) = e
⃗ iη ⃗
; η ≡ th β) ne segue che (sia le rotazioni
che i boost sono trasformazioni attive, cioè agenti sul sistema e non sul riferimento, che resta
fisso !)

J⃗ ≡ (M 23 , M 31 , M 12 ); ⃗ ≡ (M 01 , M 02 , M 03 )
K (1.2)
[Jm , Jn ] = iϵmnr Jr ; [Jm , Kn ] = iϵmnr Kr ; [Km , Kn ] = −iϵmnr Jr (1.3)

Circa poi le regole di commutazione di questi generatori con l’impulso, ricordiamo che risulta

[M µν , P σ ] = −i(P µ δ νσ − P ν δ µσ ) (1.4)

i.e. [Jm , Pn ] = iϵmnr Pr ; [Jm , P0 ] = 0; [Km , Pn ] = i P0 δmn ; [Km , P0 ] = −i Pm

7
Nel seguito daremo per noto quanto già illustrato nella parte propedeutica,
cioè nel Corso di ”Complementi di Fisica Nucleare e Subnucleare”.
In quell’ambito abbiamo visto come il quadro delle particelle elementari3 e delle
loro interazioni costituisca il cosiddetto Modello Standard.
Quanto alle particelle elementari, come si è visto, in questo modello esse sono rag-
gruppate in tre famiglie di massa crescente di ”leptoni”, soggetti solo all’interazione
elettrodebole

νe (ν̄e ) νµ (ν̄µ ) ντ (ν̄τ ) carica 0


e− (e+ ) µ− (µ+ ) τ − (τ + ) carica − 1(+1)

ed in tre famiglie di massa crescente di ”quarks”, soggetti anche all’interazione


forte

u(ū) c(c̄) t(t̄) q = +2/3 (−2/3)


¯
d(d) s(s̄) b(b̄) q = −1/3 (+1/3)

Nel Modello Standard, le interazioni fra le particelle elementari di cui sopra sono
descritte nel contesto della Teoria dei Campi Relativistica (QF T ), e ciascuna di
esse possiede un opportuno mediatore, i.e.

• il fotone, per l’interazione elettromagnetica;

• il W ± e lo Z 0 , per l’interazione debole4 propriamente detta;

• i gluoni, per l’interazione forte.

Sia la Teoria elettrodebole (EW ) che quella forte (QCD) hanno la struttura
di teorie di gauge e sono teorie di campo rinormalizzabili.

da cui segue in particolare che lo scalare di Lorentz W µ Wµ commuta con P σ .


Venendo infine al caso della massa nulla, le rappresentazione irriducibili di P sono ancora
più semplicemente caratterizzate solo in termini di un numero quantico intero o semidispari λ,
che è chiamato elicità, la quale descrive la proiezione dello spin intrinseco della particella nella
direzione del suo impulso. Questa quantità, se la massa è nulla e quindi la particella viaggia
costantemente alla velocità della luce, è invariante per trasformazioni di Lorentz.
3
Ricordiamo che per particella elementare intendiamo una particella di cui non è nota alcuna
struttura interna. Questo aspetto, come già abbiamo avuto modo di mettere in evidenza, non
ha nulla a che vedere con l’eventuale instabilità della particella stessa poiché l’instabilità non è
legata al fatto che i prodotti del decadimento siano costituenti della particella instabile!
Il muone, per esempio, che decade in un elettrone, un neutrino ed un antineutrino, per quanto
ne sappiamo fino ad oggi, è una particella elementare e l’elettrone il neutrino e l’antineutrino
a cui dà luogo non sono in nessun senso suoi costituenti. Il decadimento avviene solo perché le
interazioni deboli accoppiano lo stato di muone con quello fatto dalle tre particelle suddette,
per cui è possibile una transizione da uno stato all’altro...
4
In realtà l’interazione elettromagnetica e debole sono unificate nella Teoria Elettrodebole.

8
2 Cenni di Teoria dei Campi
2.1 Introduzione alla Teoria dei Campi classica
La Teoria Quantistica dei Campi (QFT) nasce dalla sintesi della teoria classica
dei campi (cfr. Appendice), il cui paradigma principale è il campo elettromag-
netico classico, con la teoria delle Meccanica Quantistica e quella della Relatività
Ristretta.
Il campo, che indicheremo per il momento genericamente con Φ(x), ma senza
implicare con questo che esso non possa avere più componenti, viene visto, in ogni
punto dello spazio-tempo, come una sorta di coordinata lagrangiana generalizzata
e come tale, in M Q, esso è un operatore che agisce nello spazio di Hilbert degli
stati. La sua evoluzione, cioè le equazioni del campo, sono ottenute a partire
da una opportuna densità lagrangiana, funzione del campo e delle sue derivate
L(Φ(x), ∂Φ(x), x), attraverso il principio di minima azione, che fornisce, come è
noto, l’equazione
∂L ∂L
− ∂ µ =0 (2.1)
∂Φα ∂(∂µ Φα )
dove abbiamo riportato esplicitamente l’eventuale indice associato alle possibili
componenti del campo Φ.
Sempre attraverso la densità lagrangiana possiamo poi definire l’impulso co-
niugato al campo (ricordiamo che il campo in ogni punto deve essere visto come
una coordinata lagrangiana generalizzata ...)
∂L
Π(x) = (2.2)
∂ Φ̇
e quindi stabilire l’algebra del campo, attraverso le regole di commutazione (o
anticommutazione) canoniche.

Un concetto cruciale per la comprensione del quadro attuale delle particelle


elementari e delle loro interazioni, su cui vogliamo adesso fare qualche consider-
azione di carattere generale, è certamente quello della simmetria5,6 .
5
A questo proposito, ricordiamo che, come avremo modo di giustificare in seguito, un oper-
atore O che descriva un isomorfismo unitario o antiunitario dello spazio di Hilbert degli stati
in sé, è detto costituire una simmetria del sistema considerato.
Essa è conservata o esatta se lo stato di minima energia (vuoto) è non degenere ed O-invariante,
mentre la lagrangiana del sistema risulta invariante in forma sotto la trasformazione in ques-
tione, ovvero se l’operatore O commuta con l’hamiltoniana del sistema e dunque ne rispetta la
dinamica.
Si parla poi, invece, di simmetria rotta spontaneamente se la lagrangiana è invariante in forma
ma lo stato di minima energia è degenere e non invariante sotto O. Infine, la simmetria è
detta semplicemente rotta se la lagrangiana non è invariante in forma sotto O, ovvero se O non
commuta con l’hamiltoniana del sistema.
6
La parola simmetria significa ”della stessa misura” ed esprimeva, nel mondo greco, il

9
Nel seguito tratteremo più diffusamente il caso delle simmetrie discrete, ma
non possiamo non richiamare brevemente uno dei risultati più importanti ottenuti
concetto di commensurabilità, proporzione, rapporto armonico di dimensioni ... e per questo
era legato anche al concetto stesso di bellezza. Da allora, il concetto di simmetria si è evoluto
e certamente una sua definizione fra le più espressive e chiare è quella operativa di Hermann
Weyl, secondo il quale una entità possiede una simmetria se c’è qualcosa che possiamo fargli
in modo che, dopo che l’abbiamo fatta, l’entità in questione continua ad apparire esattamente
come prima. In questa accezione, simmetria e invarianza risultano evidentemente sinonimi:
torneremo in seguito su questo aspetto !
Una simmetria che in Natura è molto comune è quella destra-sinistra, cioè la simmetria bilaterale
o chirale: una specie di prendi 2 e paghi 1 !
L’insieme delle operazioni che lasciano invariante un sistema assegnato costituisce, come oggi
sappiamo, un gruppo, ed è proprio questo strumento matematico che ha reso, poi, estremamente
fertile il concetto di simmetria in Fisica.
Ma come si è arrivati al concetto di gruppo di simmetria ?
Dal tentativo di trovare la formula risolutiva delle equazioni algebriche di grado duperiore al
quarto ! Vediamo brevemente come è successo.
L’idea dell’equazione di primo grado e quindi l’idea stessa dell’incognita era nota, forse, già in
epoca babilonese (1650 a.C., papiro di Ahmes) e si sapeva anche come risolverla

ax + b = 0 ⇒ x = −b/a

Anche l’equazione di secondo grado ax2 + bx + c = 0 si sa risolvere da tempo immemorabile,


certamente da Diofanto (250 d.C.) in poi, anche se venivano cercate solo soluzioni positive
(superfici, lunghezze, compensi ...) per cui accadeva talvolta che le soluzioni erano due, talvolta
una sola e talvolta addirittura nessuna !
E’ solo da Gauss (1777 − 1855) in poi, infatti, che sappiamo che, pur di cercare le soluzioni
nel posto giusto, cioè nel campo complesso, una equazione di grado n ammette n soluzioni
(eventualmente in parte coincidenti). Comunque, ben prima di Gauss, cioè fin dall’inizio del
sedicesimo secolo, si sapeva risolvere l’equazione generale di terzo grado (Del Ferro, Tartaglia,
Cardano) ed anche quella di quarto grado (Ferrari, 1545); però, quanto all’equazione di quinto
grado, ogni sforzo continuava miseramente a fallire !
Furono Ruffini (1799) ed Abel (1824) i quali, indipendentemente, dimostrarono che ogni sforzo
per trovare una risolvente generale era vano, ma la vera spiegazione del motivo del fallimento
fu trovata successivamente da Evariste Galois (1832), il quale affrontò il problema da un lato
completamente nuovo, ed è qui che entra, appunto, la simmetria ! Egli provò a caratterizzare
le equazioni attraverso le proprietà di permutazione dei polinomi a coefficienti razionali che si
annullano sulle soluzioni dell’equazione data.
Sembra un discorso complicato ma non lo è: prendiamo, per esempio, la generica equazione
(propria) di secondo grado x2 + bx + c = 0 con b, c razionali. Se x1 ed x2 sono le sue radici,
allora
(x − x1 )(x − x2 ) = x2 + bx + c ⇒ b = −(x1 + x2 ); c = x1 x2
dunque esistono almeno due polinomi razionali indipendenti

P1 (α, β) = α + β + b; P2 (α, β) = αβ − c

che si annullano sulle soluzioni dell’equazione data, ed essi sono simmetrici per scambio.
L’idea di Galois fu dunque di considerare tutti i polinomi a coefficienti razionali che si annullano
sulle radici dell’equazione data. Le permutazioni delle variabili del polinomio che lasciano
invariante il suo valore (nullo) quando viene valutato sulle soluzioni dell’equazione costituiscono
il gruppo di Galois associato all’equazione. Egli dimostrò, in generale, che questo gruppo

10
nel ventesimo secolo, riguardo al legame fra simmetrie e costanti del moto, cioè il
Teorema di Noëther (1918) (per la sua dimostrazione rimandiamo all’Appendice).
Questo Teorema vale per simmetrie ”continue”, descritte cioè da un gruppo di Lie
ed afferma che, per ogni parametro del gruppo, esiste una corrente conservata.
Più precisamente, esso stabilisce che, data una lagrangiana L(ϕ(x), ∂µ ϕ(x), x) la
quale sia invariante in forma sotto le trasformazioni descritte da un gruppo di
Lie G(ωa ), allora, se l’azione della generica trasformazione del gruppo descritta
dal parametro ωa è tale che, quando esso sia preso infinitesimo, risulta

x → x′ : x′µ = xµ + Ξµa (x) dωa ≡ xµ + δxµ (2.3)


ϕα (x) → ψ α (x′ ) : ψ α (x′ ) = (δβα + Γαaβ dωa ) ϕβ (x) ≡ ϕα (x) + δϕα (x) (2.4)

ne segue che le quadricorrenti


[ ] ∂L
Θµa (x) ≡ −Γαaβ ϕβ (x) + ∂ν ϕα (x) Ξνa (x) − L Ξµa (x) (2.5)
∂(∂µ ϕα )
sono tutte, separatamente conservate.
Vediamo ora due applicazioni del teorema (per una trattazione più esaustiva,
rimandiamo di nuovo all’Appendice).
Se la lagrangiana non dipende esplicitamente dalle coordinate spazio-temporali,
ovvero se L = L(ϕ(x), ∂µ ϕ(x)), allora essa è necessariamente invariante in forma
sotto il gruppo di Lie a quattro parametri delle traslazioni, la cui azione è definita
da

x → x′ : x µ = xµ + δaµ dω a ⇒ Ξµa = δaµ (2.6)
ϕα (x) → ψ α (x′ ) = δβα ϕβ (x) ⇒ Γµaβ = 0 (2.7)

per cui, secondo la (2.5), le seguenti quattro correnti (ponendo, per maggiore
chiarezza di notazioni, a = ν)
∂L ∂L
Θµν (x) = [∂ρ ϕα (x) δνρ ] µ α
− L δµν = ∂ν ϕα (x) − L δµν (2.8)
∂(∂ ϕ ) ∂(∂ µ ϕα )
coincide con il gruppo Sn delle permutazioni di n oggetti, dove n è il grado dell’equazione.
Galois dimostrò altresı̀ che le radici di un’equazione potevano essere espresse a partire dalle
quattro operazioni ed estrazioni di radice su espressioni costruite con i suoi coefficienti se e solo
se, ordinando il gruppo in sottogruppi normali (S è un sottogruppo normale se, dato comunque
un elemento x del gruppo, allora sSx−1 = S ) massimali, i rapporti fra le loro cardinalità erano
numeri primi.
Nel caso di S2 , S3 ed S4 questo è vero, mentre da S5 in poi questo diventa falso ...
E’ dunque per questa strada che si giunse al concetto di gruppo ed in particolare a quello di
gruppo di simmetria. Ma una volta definito il gruppo, questa entità matematica astratta può
venire slegata dalla sua particolare rappresentazione su un qualunque sistema assegnato, per
cui si è finito oggi per separare il concetto di simmetria (operazione) da quello di invarianza
(effetto dell’operazione sul sistema dato), anche se, talvolta, si continuano a confondere i due
aspetti.

11
soddisfano separatamente la condizione di conservazione ∂ µ Θµν (x) = 0 e dunque
risulta che, definendo

Pν (t) ≡ d3 x Θ0ν (x) (2.9)

questa ”carica” è conservata nel tempo, ovvero è una costante del moto.
Nel caso presente, non è difficile riconoscere nella (2.8) la definizione del tensore
energia-impulso
∂L
Tµν (x) = ∂ν ϕα (x) − L δµν (2.10)
∂(∂ µ ϕα )

per cui il teorema di Noëther mostra come la conservazione del quadrimpulso in


un sistema isolato sia la conseguenza dell’invarianza (simmetria) per traslazioni
della lagrangiana del sistema considerato.
Passiamo adesso al secondo esempio di applicazione del Teorema di Noëther,
particolarmente rilevante nell’ambito della Meccanica Quantistica.
Assumiamo che la Lagrangiana L riguardi i campi ψ ≡ ψ1 e ψ ∗ ≡ ψ2 , indipendenti
nel senso della loro parte reale e immaginaria. Assumiamo altresı̀ che L sia
invariante in forma sotto una trasformazione di gauge di prima specie7 , i.e. sotto
la trasformazione infinitesima interna ai campi8

x′µ → xµ Ξµ (x) = 0 ;
ψ → ψ + iα ψ ⇒ Γ11 = i ; Γ12 = 0 ;
ψ∗ → ψ ∗ − iα ψ ∗ 2
Γ1 = 0 ; Γ22 = −i ;

In questo caso, la corrente conservata garantita dal Teorema di Noëther, poiché


la trasformazione non ha effetto sulle coordinate, è unicamente determinata dal
solo effetto sui campi ed ha la forma seguente
[ ]
∂L ∂L
J (x) = i −
µ
ψ+ ∗
ψ∗ (2.11)
∂(∂µ ψ) ∂(∂µ ψ )

che, almeno nello schema di prima quantizzazione, è proporzionale alla densità


di corrente di probabilità.

7
In questo caso il gruppo di simmetria è il gruppo di Lie (abeliano) ad un parametro U (1)
fatto dagli elementi eiαA , dove A è il generatore del gruppo stesso che, nella rappresentazione
del gruppo che descrive la gauge di prima specie, coincide semplicemente con l’unità.
8
Quanto agli indici, per uniformità di notazione con quanto precede, associeremo l’indice 1
al campo ψ e l’indice 2 al campo ψ ∗ .

12
2.2 Simmetrie discrete
Nel Modello Standard (M S) tutte le particelle elementari sono descritte da un
campo Φ(x), in generale complesso, le cui proprietà di trasformazione dipendono
dalle caratteristiche specifiche della particella stessa.
Se il campo è intrinsecamente complesso, ovvero se, più propriamente, Φ† (x) è
indipendente9 da Φ(x), allora particella e antiparticella risultano distinte (pur
avendo esse la stessa massa e lo stesso spin), mentre se questo non accade come,
per esempio, nel caso di un campo reale, la particella descritta è una sola e par-
ticella ed antiparticella coincidono10 : il discrimine fra i due casi è l’eventuale
presenza di carica (non necessariamente elettrica ...) associata alla particella:
affinché essa possa essere antiparticella di se stessa è necessario che tutte le sue
cariche (ovvero i numeri quantici additivi che la caratterizzano, come il numero
barionico, la stranezza, etc ...) siano nulle. Dunque, per esempio, nel caso
dei fermioni, essendo essi tipicamente carichi, la particella risulta solitamente
distinta11 dall’antiparticella12 .
Nemmeno per i bosoni neutri (come il fotone) però la cosa è cosı̀ automatica:
come sappiamo, il π 0 è antiparticella di se stesso, ma il K 0 no !
Il punto sta nella legge di trasformazione del campo per coniugazione di carica
C, una simmetria discreta che, insieme alla inversione temporale T ed alla parità
9
Questa affermazione va intesa nel senso che i campi (Φ + Φ† ) e i(Φ − Φ† ) sono indipendenti.
10
Un caso in cui questo accade è, per esempio, quello del fotone: il campo Aµ è intrinseca-
mente reale ed il fotone non è diverso dall’antifotone.
11
Questo non è in nessun modo una necessità legata al fatto che il campo usato per descrivere
i fermioni è spinoriale, infatti il campo di Majorana, pur essendo spinoriale, non distingue
la particella dall’antiparticella. Dipende invece unicamente dal fatto che il campo ed il suo
aggiunto siano o no indipendenti fra loro.
12
Per i neutrini non è ancora chiaro se questo sia vero, cioè se si tratti di particelle di Dirac
(⇒ neutrino ̸= antineutrino) o di Majorana (⇒ neutrino ≡ antineutrino).
Ricordiamo, per prima cosa, che noi siamo soliti definire antineutrino quella particella che,
interagendo, può convertirsi in un leptone carico positivamente, cioè in un antileptone, o che,
in un processo di interazione debole, viene emesso simultaneamente ad un leptone carico nega-
tivamente. In modo analogo definiamo il neutrino come quella particella che, interagendo, può
convertirsi in un leptone negativo oppure che è emesso, in un processo debole, simultaneamente
ad un leptone positivo.
E’ lecito ora chiedersi, però, quale sia la caratteristica intrinseca che rende un neutrino capace
di produrre leptoni negativi e che conferisce all’antineutrino le caratteristiche opposte.
Se i neutrini hanno massa non nulla, sono possibili due risposte distinte.
La prima possibilità è che i neutrini posseggano una carica, il numero leptonico, che si
conserva rigorosamente e che vale −1 per neutrini e leptoni carichi negativamente, e +1 per
antineutrini e leptoni carichi positivamente. In questo caso, il neutrino è distinto dalla sua an-
tiparticella dal numero leptonico, in modo simile a quanto avviene per esempio per l’elettrone
quanto alla carica elettrica. Si parla allora di ”particella di Dirac” in quanto gli stati (liberi)
di un tale neutrino possono essere descritti in termini di soluzioni dell’equazione di Dirac, i.e.

(iγ µ ∂µ − m)Ψ(x) = 0

13
P vogliamo adesso provare ad approfondire.
Per chiarire meglio il significato di queste simmetrie, inizieremo trattandole
nell’ambito dello schema di prima quantizzazione, ovvero nell’ambito della Mec-
canica Quantistica non relativistica elementare.
Anche se può sembrare banale, inizieremo con il puntualizzare, in questo
contesto, la distinzione fra proprietà cinematiche e dinamiche di un sistema
fisico, perchè questo è un punto che deve essere ben chiaro, per poter afferrare
poi compiutamente il concetto stesso di simmetria.
A questo scopo inizieremo richiamando, innanzitutto, alcuni aspetti formali
relativi alla formulazione della M Q, che dovrebbero comunque essere già a tutti
ben noti, e che sono essenziali perchè sia chiara la distinzione in questione.

C’è però una seconda possibilità in accordo con i dati sperimentali secondo la quale tutte le
particelle che chiamiamo neutrini potrebbero essere semplicemente caratterizzate dall’avere una
elicità negativa, mentre per gli antineutrini essa sarebbe positiva. Potremmo quindi attribuire
all’elicità il ruolo di distinguere neutrini da antineutrini.
In questo caso neutrino ed antineutrino sono semplicemente la stessa particella, differenziate
solo dallo stato di spin: il numero leptonico non ha nessun significato fisico.
In questo scenario, un neutrino siffatto può essere descritto in termini di soluzioni dell’equazione
di Majorana (E. Majorana, Teoria simmetrica dell’elettrone e del positrone , Il Nuovo Cimento
14 (1937) 171-184), i.e.
iγ µ ∂µ Ψ(x) − mΨC (x) = 0
dove ΨC (x) ≡ iγ 2 Ψ∗ (x) (questo è equivalente alla notazione che useremo in seguito per il campo
di Dirac, in cui ΨC = C −1 Ψ̄t , con C = iγ 0 γ 2 = −C −1 ).
Nel caso particolare in cui Ψ = ΨC , l’equazione descrive una particella che coincide con la
propria antiparticella, i.e. una particella di Majorana.
Se i neutrini sono privi di massa, le due descrizioni sono indistinguibili. Essendo in questo
caso l’elicità un buon numero quantico (cioè invariante di Lorentz), scegliere una descrizione
o l’altra risulta solo in una pura operazione di natura nominalistica, in cui si sostituisce, per
esempio, l’espressione ”elicità negativa” a quella ”numero leptonico = −1 ” e viceversa.
I neutrini di Dirac hanno due componenti sterili che quelli di Majorana non hanno, ma, nel
caso di massa nulla, non ci sono comunque differenze osservabili fra i due tipi di neutrino legate
alle interazioni deboli.
Se però i neutrini hanno una massa non nulla, siccome l’elicità non è un buon numero quan-
tico, come lo dimostra il fatto che un opportuno boost di Lorentz è in grado di cambiarne il
valore, ecco che passando da un riferimento ad un altro, un neutrino di Majorana può compor-
tarsi come quello che, se fosse invece un neutrino di Dirac, diremmo essere un antineutrino e
viceversa. Nel caso di neutrini massivi di Majorana diventa possibile, per esempio, il decadi-
mento doppio beta senza emissione di neutrini (decadimento proibito nel primo schema in cui
il numero leptonico L è conservato),

(A, Z) → (A, Z + 2) + 2e−

proprio perchè la particella neutra creata nel decadimento beta ha elicità +1 e questa può essere
riassorbita dal nucleo (A, Z + 1) con conseguente seconda emissione beta, dato che, nel caso di
massa diversa da zero, il proiettore chirale χ− presente nella lagrangiana debole determina un
elemento di matrice non nullo anche riguardo all’annichilazione di una particella di elicità +1.

14
Questi aspetti riguardano

• la struttura matematica entro cui l’evoluzione temporale (il moto) e gli stati
del sistema fisico vengono descritti;

• il set delle osservabili cinematiche (quantità misurabili, la cui definizione


operativa prescinde dalle interazioni, ovvero dalle forze) e le relazioni (non
causali) fra di loro (come le loro regole di commutazione) che determinano la
struttura specifica dell’algebra delle osservabili associata ad un dato sistema
fisico;

• la struttura generale delle equazioni della dinamica, che forniscono la re-


lazione causale fra le variabili cinematiche.

Iniziamo dal primo punto, cioè dalla struttura matematica.


Dalla teoria elementare della M Q (prima quantizzazione) sappiamo che

1. ogni stato puro è descritto da un raggio R definito in generale come sot-


tospazio lineare unidimensionale, privato del vettore nullo in uno spazio di
Hilbert separabile13 H, i.e.
R = {|ψ >= a eiα |ψ0 >, a > 0, α ∈ R , < ψ0 |ψ0 >= 1};

2. se |a > e |b > sono due vettori dello spazio di Hilbert H degli stati, allora,
dati α e β numeri complessi qualsiasi, anche il vettore |ψ >= α|a > +β|b >
individua, a meno di una fase, uno stato14 possibile del sistema (principio
di sovrapposizione lineare);

3. dati i vettori |ϕ > e |ψ > normalizzati, allora la quantità < ϕ|ψ > rap-
presenta l’ampiezza di transizione da |ψ > a |ϕ >, ovvero | < ϕ|ψ > |2
fornisce la probabilità che una osservabile che abbia |ϕ > come autovettore,
determini, con una sua misura, la transizione |ψ >→ |ϕ >;

4. ogni quantità misurabile è rappresentata da un operatore lineare hermitiano


da H in sé;

5. i soli valori ottenibili da una misura di un’osservabile sono gli autovalori


dell’operatore hermitiano associato;

6. il valore di aspettazione di una data osservabile Q su uno stato puro |ψ >


è < ψ|Q|ψ > quando < ψ|ψ >= 1.
13
Uno spazio di Hilbert H è separabile se e solo se ogni suo elemento può essere scritto come
sovrapposizione di elementi di una base ortonormale numerabile opportuna e1 , e2 , ..., en , ... .
14
Ignoreremo, per il momento, il problema dell’esistenza delle regole di superselezione.

15
Veniamo ora al secondo punto, relativo alle proprietà cinematiche delle osservabili
del sistema.
Le relazioni cinematiche sono definite attraverso l’algebra degli operatori costruiti
a partire da quelli che rappresentano le variabili del sistema e sono usualmente
formulate come regole di commutazione, le quali determinano appunto la strut-
tura dell’algebra delle osservabili. Esempi ben noti sono
[x, p] = ih̄ (2.12)
[Ji , Jj ] = i h̄ ϵijk Jk (2.13)
Altre proprietà interne (ulteriori gradi di libertà ...) del sistema come, per esem-
pio, lo spin isotopico, richiedono l’introduzione di altre variabili e delle relative
regole di commutazione sia fra di loro che con le altre variabili che servono a
caratterizzare il sistema.
Circa, infine, l’ultimo punto relativo alla dinamica, sappiamo che quest’ultima
è definita completamente dall’operatore hamiltoniano H, il quale è esso stesso una
osservabile, funzione, in generale, di variabili cinematiche (⃗p, ⃗x, etc...).
Nella Schröedinger Picture (SP ), come sappiamo, sono gli stati ad evolvere, i.e.

i h̄ |ψ, t >= H |ψ, t > (2.14)
∂t
mentre nella Heisenberg Picture (HP ) evolvono le osservabili e risulta equivalen-
temente che, se H non dipende esplicitamente dal tempo, è
i h̄ Q̇(t) = [Q(t), H] (2.15)

Dopo aver puntualizzato questi aspetti generali ben noti, torniamo adesso alla
questione generale di che cosa debba essere considerato una Simmetria in M Q.

Partiamo per questo dal fatto che il prodotto scalare fra vettori di stato che
siano normalizzati ha un significato fisico ben preciso: la quantità
| < a| b > |2 (2.16)
rappresenta la probabilità di transizione fra gli stati |a > e |b >, ovvero, per
esempio, la probabilità che, effettuando una misura15 sullo stato | b >, si possa
ottenere come risultato lo stato | a >.
Si capisce quindi la ragione per la quale, ad una Simmetria del sistema, che as-
sumeremo genericamente rappresentata dall’operatore O, è richiesto di conservare
la (2.16), i.e., di essere tale per cui
| < O a|O b > |2 = | < a| b > |2 ∀| a >, | b >∈ H (2.17)
15
L’osservabile corrispondente deve avere | a > come suo autovettore ...

16
In altre parole, ad una Simmetria viene richiesto di essere un isomorfismo fra gli
stati, tale da mantenere invariata la loro soggiacente struttura probabilistica.
Segue allora dalla (2.17) che possono aversi solo due casi16 : o l’operatore O è

16
Una dimostrazione di questa conclusione si trova sia nell’Appendice al Capitolo 20 del libro
E. P. Wigner: Group Theory and its applications to the quantum mechanics of the atomic
spectra, Academic Press, New York 1959.
come pure nell’Appendice A del secondo Capitolo del libro
S. Weinberg: The Quantum Theory of Fields, Cambridge Univ. Press, 1995.
Vediamo in breve come procede il ragionamento.
Ricordiamo per questo che una Simmetria va considerata, in buona sostanza, come un cambi-
amento di punto di vista.
Se un osservatore vede un sistema fisico in uno stato (puro) rappresentato da un raggio R1
o R2 o, genericamente, Rn , allora un altro osservatore, in virtù della trasformazione di sim-
metria, vedrà il sistema, rispettivamente, negli stati descritti dai raggi R′1 , R′2 , ..., R′n : i due
osservatori, però, osservando lo stesso sistema da punti di vista differenti, dovranno comunque
concordare sul valore delle probabilità di transizione fra stati corrispondenti, i.e.

P (Ri → Rj ) ≡ P (R′i → R′j ) (2.18)

e questa è l’unica condizione che viene imposta affinché si possa parlare di simmetria !
Si osservi dunque che, in base a quanto stiamo dicendo, a priori dobbiamo intendere la
simmetria come definita solo sui raggi, da cui ne segue la possibilità di definirla su almeno un
vettore normalizzato per raggio.
Ricordiamo a questo proposito che un vettore di stato normalizzato |e > è definito e definisce
un raggio R ≡ { a eiα |e >, a > 0, α ∈ R} nello spazio di Hilbert H degli stati (il raggio è,
tecnicamente, un sottospazio vettoriale unidimensionale di H, privato dell’origine...).
Questo significa che se Ra ed Rb sono due raggi qualsiasi, individuati rispettivamente, modulo
una fase, dai vettori normalizzati |ϕ > e |ψ >, allora S è una Simmetria se e solo se, essendo
SRa ed SRb i raggi corrispondenti attraverso S ad Ra e Rb e |S ϕ > e |S ψ > i vettori
normalizzati che, sempre modulo una fase, individuano i raggi trasformati, risulta

| < Sϕ|Sψ > |2 = | < ϕ|ψ > |2 (2.19)

Possiamo dimostrare adesso, seguendo la strada tracciata da Wigner già nel 1931, che, in questa
ipotesi, S individua in modo univoco (a meno di una fase globale) un operatore unitario oppure
antiunitario che opera dallo spazio di Hilbert in sé.
Iniziamo dimostrando che S deve essere invertibile sui raggi e per questo procediamo per
assurdo. Se S non è invertibile, allora esisteranno due raggi differenti Ra e Rb , individuati da
due opportuni vettori normalizzati |ϕ > e ψ > linearmente indipendenti, i quali sono mandati
da S nello stesso raggio SR, e quindi

|Sϕ >= |Sψ > (2.20)

Ma allora, da un lato avremmo che | < Sϕ|Sψ > |2 = | < Sϕ|Sϕ > |2 = 1 mentre, essendo, per
ipotesi, i due vettori |ϕ > e ψ > indipendenti e normalizzati, non può che essere
| < Sϕ|Sψ > |2 = | < ϕ|ψ > |2 < 1, da cui l’assurdo.

17
Consideriamo adesso una base ortonormale numerabile in H (lo spazio di Hilbert, per ipotesi,
è separabile e dunque ammette almeno una base ortonormale numerabile), fatta dai vettori
{|ek >, k = 1, ..., n, ...}, ciascuno dei quali indivividua, quindi, il raggio Rk ≡ { a eiα |ek >}.
Per ipotesi, dunque

< ei |ej >= δij (2.21)

Consideriamo adesso i raggi trasformati dalla simmetria S, i.e.



Rk → SRk ≡ Rk = { b eiβ |Sek >} (2.22)

dove i vettori normalizzati |Sek >, sulla base del fatto che è loro richiesto solo di definire i raggi
SRk , sono evidentemente definiti a meno di una fase arbitraria.
Vogliamo dimostrare che anche {|Sek >, k = 1, ..., n, ...} è una base ortonormale dello spazio
di Hilbert dato. Infatti, dalla (2.19) segue che

| < ei |ej > |2 = δij = | < S ei |S ej > |2 (2.23)

e dunque i vettori S ej costituiscono un set di vettori ortonormali. Affinché essi costituiscano


una base, occorre anche che non esista alcun vettore non nullo che sia ortogonale a tutti loro.
Di nuovo procediamo per assurdo e sia |Ω > questo vettore che, senza perdita di generalità,
potremo assumere normalizzato. Per ipotesi

∀j : < Ω|S ej >= 0 (2.24)

Il vettore |Ω > individua comunque un raggio che, essendo S invertibile sui raggi, è controim-
magine di un altro opportuno raggio descritto (modulo una fase) dal vettore normalizzato che
indicheremo con Ω̂ , per cui risulta

|Ω >= |S Ω̂ > (2.25)

Sostituendo nella (2.24) ed usando la (2.19), abbiamo

∀j : 0 = | < Ω|S ej > |2 = | < S Ω̂|S ej > |2 = | < Ω̂|ej > |2 (2.26)

e questo è impossibile perché Ω̂ è normalizzato e quindi non nullo e {|ei >} è, per ipotesi, una
base: resta cosı̀ dimostrato che {|S ej >} è anch’essa una base ortonormale.
Ciascuno dei vettori |Sej > è definito a meno di una fase arbitraria: per poter estendere
la definizione di S ai vettori dello spazio di Hilbert dobbiamo adesso fissare una opportuna
convenzione di fase al riguardo. Per fare questo, consideriamo i vettori
1
|ϕk >= √ (|e1 > +|ek >), k>1 (2.27)
2
Ciascuno di essi individua univocamente il raggio Rk che, attraverso la simmetria S, sarà

trasformato nel raggio Rk ≡ S Rk , a sua volta individuato da un opportuno versore |S ϕk > ,
definito, per ogni k, a meno di una fase arbitraria. Per la (2.19), abbiamo
1
| < Sϕk |Se1 > |2 = | < ϕk |e1 > |2 = = | < Sϕk |Sek > |2 (2.28)
2

18
mentre, per la stessa ragione, tutti gli altri coefficienti dello sviluppo di |S ϕk > nella base
|S ej > sono identicamente nulli. Dunque
1 ( )
|S ϕk >= √ eiα |S e1 > +eiβ |S ek > (2.29)
2
Ma |S ϕk > è definito a meno di una fase e cosı̀ pure i vettori normalizzati |S ej >: possiamo
dunque fissare la convenzione di fase in modo che risulti
1
∀k > 1 : |S ϕk >= √ (|S e1 > + |S ek >) (2.30)
2
e resta comunque ancora indeterminata una fase ”globale” del tutto irrilevante ...
Ma che cosa accade ad un generico vettore normalizzato, relativo ad un generico raggio R ?
Partiamo dunque dal vettore

|ψ >= λj |ej > (2.31)
j

che assumeremo, senza perdita alcuna di generalità, essere tale che λ1 ̸= 0 (altrimenti basterà
rinominare i vettori della base ...). Sia adesso |Sψ > il versore (definito a meno di una fase)
che individua il raggio trasformato S R. Chiaramente, dalla definizione stessa di base, segue
che
∑ ′
|S ψ >= λj |S ej > (2.32)
j

Ma usando la (2.19), ricaviamo subito che



∀j : | < ej |ψ > |2 = | < S ej |S ψ > |2 ⇒ |λj |2 = |λj |2 (2.33)
e analogamente
′ ′
∀k > 1 : | < ϕk |ψ > |2 = | < S ϕk |S ψ > |2 ⇒ |λ1 + λk |2 = |λ1 + λk |2 (2.34)
da cui, usando il fatto che abbiamo assunto, per ipotesi, λ1 ̸= 0, si ha
2 2
λ1 + λk 2 λ′1 + λ′k λ λ
′ 2
k
k
λ1 = λ′ ⇒ 1 + λ1 = 1 + λ′ (2.35)
1 1
′ ′
la quale, visto che deve altresı̀ risultare |λk /λ1 | = |λk /λ1 |, implica che

λk λ
(a) : = k′ (2.36)
λ1 λ1
( ′ )∗
λk λk
(b) : = ′ (2.37)
λ1 λ1

A priori potrebbe accadere, comunque, che, al variare di k potesse valere l’una o l’altra delle
due condizioni di cui sopra ...
Non è cosı̀ !
Per dimostrarlo, procediamo per assurdo e supponiamo che per un indice k ̸= 1 valga la
condizione (a) mentre per un indice j ̸= 1 valga la condizione (b) (assumeremo che i rapporti
siano intrinsecamente complessi e quindi deve essere necessariamente anche che j ̸= k ...).
Definiamo allora il vettore normalizzato
1
|ϕkj >= √ (|e1 > +|ek > +|ej >) (2.38)
3

19
lineare e allora la Simmetria che esso descrive è rappresentata da un operatore
O = U unitario, infatti

< U a|U b > ≡ < a|U † U b >=< a| b > ⇔ U† U = I (2.48)

oppure l’operatore O è antilineare17 , e allora la Simmetria è rappresentata da un


Poiché i rapporti fra i coefficienti che esprimono il vettore dato nella base dei vettori |ei > sono
tutti reali, in ogni caso resteranno reali anche nel caso del vettore |Sϕ > espresso nella base
|S ei >, e quindi

eiα
|S ϕkj >= √ (|Se1 > +|Sek > +|Sej >) (2.39)
3
ma allora, ritornando al generico vettore di stato |ψ >, abbiamo che deve essere altresı̀
′ ′ ′
| < ϕkj |ψ > |2 = | < Sϕkj |Sψ > |2 ⇒ |λ1 + λk + λj |2 = |λ1 + λk + λj |2 = (2.40)

unitamente al fatto che |λ1 | = |λ1 |. Risulta allora
2
λj
′ ′ 2
λk λj λk
2 ′
|λ1 + λk + λj | = |λ1 + λk + λj |
′ ′
2
⇒ 1 + + = 1 + ′ + ′ (2.41)
λ1 λ1 λ1 λ1

e quindi, per l’ipotesi fatta sopra,


2 ( )∗ 2

1 + λk + λj = 1 + λk + λj (2.42)
λ1 λ1 λ1 λ1

Ma in generale, dati due numeri complessi z e z ′ ,



′ 2
|1 + z + z ′ | = 1 + z + z ∗ ⇔ (ℑ(z + z ′ )) = (ℑ(z − z ′ )) ⇒ ℑ(z) · ℑ(z ′ ) = 0
2 2 2
(2.43)

che, nel caso particolare della (2.42), in generale è falso.


Resta dunque provato che, data una simmetria S che soddisfa la (2.19), può accadere che
′ ′
λk λ ′ λ ′
∀k : = k′ ⇔ λk = λk 1 ⇔ λk = eiϵ λk (2.44)
λ1 λ1 λ1

oppure può essere che


( ′
)∗ ′
λk λk ′ λ1 ′
∀k : = ′ ⇔ λk = λ∗k ∗ ⇔ λk = eiϵ λ∗k (2.45)
λ1 λ1 λ1

Ridefinendo la trasformazione a meno della fase globale eiϵ inessenziale, arriviamo alle sole due
possibilità:

(a) : λk = λk (2.46)

(a) : λk = λ∗k (2.47)

estendibili in modo ovvio a tutto lo spazio di Hilbert in modo che, nel caso (a) l’operatore che
descrive la simmetria sia lineare e unitario, mentre nel caso (b) sia antilineare e antiunitario.
17
Ricordiamo che, nella ben nota terminologia di Dirac, ad ogni ket |ψ > dello spazio di

20
Hilbert H degli stati, è associato un bra < ψ| nel duale di H (coincidente con esso, data la sua
struttura hilbertiana) tale che

|ψ >= α | a > +β | b > ⇔ < ψ| = α∗ < a | + β ∗ < b | (2.49)

Un operatore O dello spazio di Hilbert in sé è lineare se accade che

O (α | a > +β | b >) = α O | a > +β O | b > (2.50)

mentre è antilineare se

O (α | a > +β | b >) = α∗ O | a > +β ∗ O | b > (2.51)

Vediamo le conseguenze che discendono da queste definizioni.


Se | e1 >, ..., | en >, ... è una base ortonormale dello spazio di Hilbert, allora ogni suo vettore è
univocamente rappresentato da un’unica combinazione lineare dei vettori della base.
Posto dunque che sia

| ψ >= λi | ei > (2.52)

ne segue che per l’operatore lineare V risulta

V | ψ >= λi V | ei >≡ λi Vji | ej > (2.53)

dove la matrice complessa Vji descrive appunto l’azione dell’operatore V sugli elementi della
base, i.e.

V | ei >≡ Vji | ej > ⇔ Vji ≡< ej |V ei >≡< ej |V | ei > (2.54)

Per l’operatore antilineare A, invece, risulta

A |ψ >= λ∗i A | ei >≡ λ∗i Aji | ej > (2.55)

dove la matrice complessa Aji descrive, anche in questo caso, l’azione dell’operatore A sugli
elementi della base assegnata, in modo formalmente identico al caso precedente, i.e.

A | ei >= Aji | ej > ⇔ Aji ≡< ej |A ei >≡< ej |A| ei > (2.56)

Come si vede, sugli elementi della base, gli operatori lineari e antilineari agiscono sostanzial-
mente nello stesso modo, essendo la loro azione descritta in entrambi i casi da una opportuna
matrice complessa. Ciò che li differenzia è il comportamento sulle combinazioni lineari a coef-
ficienti complessi degli elementi della base. Inoltre, dati due vettori generici

| ψ >= λi | ei >, | ϕ >= µj | ej > (2.57)

per un operatore lineare si ha

< ϕ| V | ψ >≡< ϕ| V ψ >= µ∗j < ej |λi Vki ek >= µ∗j Vji λi (2.58)

Anche per un operatore antilineare si ha ancora

< ϕ | A ψ >≡ µ∗j < ej | A ψ > (2.59)

21
ma adesso è

| A ψ >= A (λi | ei >) = λ∗i A | ei >= λ∗i Aki | ek > (2.60)

per cui ne segue che, in questo caso, risulta

< ϕ | A ψ >= µ∗j λ∗i Aji (2.61)

Come si vede, la differenza rispetto al caso dell’operatore lineare è che i coefficienti dello sviluppo
del ket a cui l’operatore antilineare è applicato, entrano nel prodotto scalare non direttamente
ma attraverso i loro complessi coniugati.
Ad ogni operatore lineare V viene poi associato il suo aggiunto V † , ponendo

< V ϕ|ψ >≡< ϕ|V † ψ > ⇔ < V ϕ| =< ϕ|V † (2.62)

Dalla definizione segue che per un operatore lineare è

< ei | V † ≡< V ei | = Vji∗ < ej | (2.63)

e dunque, definita la matrice V + come l’hermitiana coniugata della matrice V , si ha

< ei | V † ej >≡< ei |V † | ej >= (V + )ij (2.64)

ovvero, su due generici vettori | ψ > e | ϕ >, è appunto

< V ϕ| ψ > = < V (µi ei )| λk ek >= µ∗i Vki



λk = µ∗i λk (V + )ik
≡ < ϕ| V † ψ >= µ∗i λk (V + )ik
⇔ (V † ) = V + (2.65)

Dunque, nel caso di un operatore lineare V , la matrice che descrive, in una base assegnata,
l’operatore V † è la matrice V + , hermitiana coniugata della matrice che, nella stessa base,
descrive l’operatore V stesso.
Anche per un operatore antilineare A si può definire l’aggiunto A† , però occorre qualche
cautela, dato che la definizione usata per l’operatore lineare (2.62) non è più direttamente
applicabile, come lo dimostra il fatto che, se λ è un numero complesso qualsiasi, allora

< A(λ ϕ)|ψ >=< λ∗ A ψ|ψ >= λ < A ϕ|ψ > (2.66)

mentre

< λ ϕ|A† ψ >= λ∗ < ϕ| A† ψ > (2.67)

L’unica definizione di operatore aggiunto che sia coerente con il carattere antilineare di A è
infatti quella secondo cui anche A† è antilineare e risulta

< A ϕ| ψ >≡< ϕ| A† ψ >∗ (2.68)

Abbiamo allora

< Aϕ|ψ > = < A(µi ei )|λj ej >=< µ∗i Aki ek |λj ej >= µi A∗ki λk = µi λk (A+ )ik
≡ < ϕ|A† ψ >∗ =< µi ei |λ∗j (A† )kj ek >∗ = [µ∗i λ∗j (A† )ij ]∗ = µi λj (A† )∗ij
⇒ (A† ) = At (2.69)

22
operatore O = A antiunitario, per il quale risulta

< A a|A b > ≡ < a|A† A b >∗ = < a| b >∗ (2.72)

Sempre a proposito degli operatori antiunitari, osserviamo che, fissata una


base ortonormale qualsiasi | e1 >, ..., | en >, ... possiamo definire su questa base
l’operatore antiunitario K di coniugazione complessa nel modo seguente18
∑ ∑
K | ei > ≡ | ei > ⇒ K λi | ei >= λ∗i | ei > (2.73)
i i

Esso è antiunitario, infatti, se

|ψ >= λi | ei >, |ϕ >= µj | ej > (2.74)

allora risulta

K |ψ > = λ∗i | ei >;


K |ϕ > = µ∗j | ej > ⇒ < K ϕ| = µj < ej | (2.75)

e dunque

< K ϕ| K ψ >= µi λ∗i ≡< ψ|ϕ > (2.76)

Evidentemente, poi, dalla (2.73) risulta altresı̀ che

K2 = I ⇔ K = K −1 (2.77)
Dunque, per l’operatore antilineare A, la matrice che descrive il suo aggiunto A† in una base
assegnata è la matrice (At ), trasposta della matrice che, nella stessa base, descrive appunto
l’operatore A.
Si parla infine di un operatore lineare V come di un operatore unitario se accade che

< V ϕ| V ψ >≡< ϕ | V † V ψ >=< ϕ|ψ > ⇔ V †V = I (2.70)

Questa definizione resta formalmente la stessa anche nel caso di un operatore antilineare; infatti
A è antiunitario se accade che

< A ϕ| A ψ >≡< ϕ | A† A ψ >∗ =< ϕ|ψ >∗ ⇔ A† A = I (2.71)

18
Si osservi che, date due basi diverse |ei > ed |fj >, i due operatori di coniugazione complessa
Ke e Kf definiti in ciascuna base attraverso la (2.73) non coincidono, bensı̀ differiscono per
una trasformazione unitaria. Abbiamo infatti che, poiché |ei > ed |fj > sono entrambe basi
ortonormali, potremo certamente scrivere |fj >= Uij |ei > per cui
∗ ∗
( ) ( )
Ke | fj >= Uij | ei >= Uij (U −1 )ki | fk >= U −1 (U + )t kj | fk >≡ U −1 (U + )t kj Kf | fk >

e la matrice U −1 (U + )t = U −1 (U −1 )t è, evidentemente, unitaria ma, in generale, differente


dall’identità ...

23
e siccome K è antiunitario, dunque tale per cui K † K = I, evidentemente si ha

K = K† (2.78)

In termini di questo operatore K, dimostreremo adesso che ogni operatore


antiunitario A si può scrivere come

A=UK (2.79)

dove U è un opportuno operatore unitario.


Consideriamo infatti l’operatore A K e dimostriamo che esso è unitario.
Poiché, per ipotesi, A è antiunitario, si ha infatti

< (A K)ϕ| (A K)ψ > = < K ϕ| K ψ >∗ ≡ < K ψ| K ϕ >=< ϕ|ψ > (2.80)

la quale dimostra come l’operatore AK = U sia appunto unitario19 e quindi,


moltiplicando a destra per K e tenendo conto che K 2 = I, che valga appunto la
(2.79). Come già detto, K viene chiamato operatore di coniugazione complessa.

Vale la pena vederlo in azione in un caso molto semplice.


Consideriamo una particella senza gradi di libertà interni. Sappiamo allora che
possiamo scegliere come base dello spazio di Hilbert quella fatta dagli autovettori
|x > della posizione, per cui, dalla definizione, in questa base è

K |x >= |x > (2.81)

Consideriamo lo stato |ψ >, descritto dalla funzione d’onda ψ(x),



| ψ >= dx ψ(x) |x > (2.82)

Evidentemente questo stato viene trasformato dall’operatore K in quello descritto


dalla funzione d’onda ψ ∗ (x), infatti
∫ ∫ ∫

K | ψ >= K dx ψ(x) |x >= dx ψ (x) K |x >= dx ψ ∗ (x) |x > (2.83)

Un altro modo equivalente per determinare la funzione d’onda associata allo stato
K |ψ > è il seguente.
Evidentemente, cosı̀ come la funzione d’onda associata, in rappresentazione delle
coordinate, allo stato |ψ > è

ψ(x) =< x|ψ > (2.84)


19
In generale, risulta infatti che il prodotto di un operatore unitario per un operatore antiu-
nitario è antiunitario, mentre il prodotto di due operatori antiunitari risulta unitario.

24
analogamente la funzione d’onda associata, nella stessa rappresentazione, allo
stato K |ψ >, sarà

< x| K ψ > (2.85)

D’altronde K è antiunitario, K 2 = I e, per definizione, K|x >= |x >, per cui


risulta

< x| K ψ >=< K K x| K ψ >=< K x| K ψ >=< x|ψ >∗ ≡ ψ ∗ (x) (2.86)

E’ interessante, a questo punto, osservare, data la definizione (2.81), che cosa


succede ad un autostato dell’impulso. Si ha
1 ∫ 3 i⃗p·⃗x
| p⃗ >= d x e | ⃗x > (2.87)
(2π)3/2
per cui, evidentemente, risulta
1 ∫ 3 −i⃗p·⃗x
K| p⃗ >= dxe | ⃗x >= | − p⃗ > (2.88)
(2π)3/2
ovvero, avendo definito K in modo che lasci invariati gli autostati della posizione,
ecco che questo operatore manda | p⃗ > in | − p⃗ >.
Naturalmente, se altrettanto lecitamente avessimo definito K partendo dalla base
degli autostati dell’impulso |p >, sarebbero stati gli autostati della posizione a
cambiare di segno sotto il suo effetto ...

Ma riprendiamo adesso la questione delle Simmetrie in M Q.


Abbiamo concluso con Wigner che una simmetria deve essere rappresentata da
un operatore unitario o da un operatore antiunitario O , il quale manda lo spazio
di Hilbert degli stati H in sé

O : H→H (2.89)

e dunque ne costituisce un isomorfismo che, nel linguaggio della teoria degli spazi
di Hilbert, è un modo per dire che esso descrive una trasformazione di base
ortonormale20

| ei >→ O| ei >≡ | ei >′ : δij =< ei | ej >=< O ei | O ej > (2.91)


20
E’ facile convincersi che questo vale sia nel caso (ovvio !) dell’operatore unitario che in
quello dell’operatore antiunitario, visto che, in ogni caso risulta

| < Oei | Oej > | = | < ei |ej > | = δij (2.90)

25
In Meccanica Quantistica, però, sappiamo che gli effetti prodotti da una
trasformazione O sui vettori di stato, possono essere resi equivalentemente21 con
la seguente trasformazione sulle osservabili Q del sistema

Q → Q′ = O† Q O (2.92)

per cui, nel caso di simmetrie in cui, come abbiamo visto, O† = O−1 possiamo
equivalentemente adottare i due punti di vista per cui

a) |ei >→ |e′i >= O|ei >; Q→Q (2.93)


′ −1
b) Q → Q = O Q O; |ei >→ |ei > (2.94)

Chiaramente, se indichiamo adesso con A l’algebra delle osservabili Q del sistema


dato e con A′ quella definita dalle osservabili Q′ , la simmetria O definisce a sua
volta un isomorfismo fra le due algebre (peraltro coincidenti ...)

I : A → A′ per cui Q′ = I(Q) ≡ O−1 Q O (2.95)

il quale, in quanto isomorfismo, conserva certamente le regole di commutazione


(anticommutazione) fra gli operatori22 dell’algebra.
In molti casi, però, non si conosce esplicitamente l’operatore O, ovvero il
suo modo di agire sugli stati del sistema, bensı̀, magari, si hanno informazioni
a priori sulla forma che l’isomorfismo indotto da O dovrebbe produrre su un set
opportuno di osservabili o operatori dell’algebra A.
In questo caso, per definire O, si può procedere partendo proprio da queste leggi
21
Se O è un operatore lineare, la conclusione è immediata per il fatto che risulta

< Oψ|Q|Oϕ >=< Oψ|QOϕ >=< ψ|O† QOϕ >=< ψ|O† QO|ϕ >

Altrimenti, c’è una differenza legata al carattere antilineare dell’operatore, e risulta

< Oψ|Q|Oϕ >=< Oψ|QOϕ >=< ψ|O† QOϕ >∗ =< ψ|O† QO|ϕ >∗

22
Per capirci meglio, se R è una rotazione e OR l’operatore (unitario) che la rappresenta,
allora, per esempio, per quanto riguarda il momento angolare, che è un operatore vettoriale, si
avrà
−1
OR Ji OR ≡ Ji′ = Rij Jj (2.96)

e deve aversi (come in realtà si ha)

[Ji′ , Jj′ ] = i ϵijk Jk′ (2.97)

cosı̀ come è

[Ji , Jj ] = i ϵijk Jk (2.98)

26
di trasformazione, badando bene a verificare, comunque, la loro compatibilità
cinematica con la struttura dell’algebra, i.e. la loro compatibilità con le regole di
commutazione o anticommutazione in essa definite.
Una simmetria, insomma, rispetterà la struttura probabilistica presente nello
spazio di Hilbert degli stati, e questo implica che essa sarà anche una trasfor-
mazione cinematicamente ammissibile.
Parleremo poi, come già detto, di simmetria conservata se essa è anche com-
patibile con la dinamica e di simmetria rotta, se invece questo non accade.
Per una simmetria conservata, se |ψ, t > è il risultato al tempo t dell’evoluzione
temporale dello stato |ψ, 0 > al tempo t = 0, allora deve accadere che O|ψ, t >
descriva il risultato al tempo t dell’evoluzione temporale dello stato O|ψ, 0 > al
tempo t = 0, ottenuto a partire dalla stessa dinamica !
E’ facile convincersi che se l’operatore O che descrive la simmetria è unitario,
la simmetria è conservata se e solo se risulta [O, H] = 0, ovvero se l’operatore
che descrive la simmetria commuta con l’hamiltoniana.
Partiamo infatti dall’equazione di evoluzione temporale per gli stati

ih̄ |ψ, t >= H |ψ, t > (2.99)
∂t
Evidentemente risulta
( )

O ih̄ |ψ, t > = O|ψ, t > (2.100)
∂t

ma, poiché O è unitario, risulterà


( )
∂ ∂
O ih̄ |ψ, t > = ih̄ O |ψ, t > (2.101)
∂t ∂t

dunque

ih̄ O |ψ, t >= O H |ψ, t >= O H O−1 O |ψ, t > (2.102)
∂t
la quale mostra che l’hamiltoniana con cui evolve O |ψ, t > è O H O−1 .
Dunque, se vogliamo che la dinamica dei due stati sia la stessa, allora

O H O−1 = H ⇒ O H = H O ⇒ [O, H] = 0 (2.103)

27
In modo analogo, per una generica simmetria antiunitaria O, si arriva invece
alla conclusione che, per essere conservata, essa deve anticommutare23 con H, i.e.

{O, H} = 0 (2.105)

Questo fatto, però ha come conseguenza che se |E > è autovettore di H per


l’autovalore E, allora il vettore O|E > è autovettore di H per l’autovalore −E
e dunque lo spettro dell’hamiltoniana deve essere simmetrico rispetto all’origine.
Questo, però, non è possibile perché lo spettro dell’hamiltoniana H è limitato
verso il basso (esiste uno stato di minima energia del sitema), mentre non lo è
per valori positivi ...
Questa è la ragione per la quale Wigner, all’inizio, escluse la possibilità che es-
istessero simmetrie antiunitarie: come vedremo, questa conclusione ha una ec-
cezione che è proprio la time-reversal T (in cui, comunque H e T commutano !).

In alcune formulazioni, poi, nel concetto si simmetria si include pure la richi-


esta che anche la dinamica libera sia compatibile con la trasformazione, ovvero
che

[O, H0 ] = 0 (2.106)

dove
p2
H0 = (2.107)
2m

Nel seguito del Corso, come già anticipato, ci limiteremo a trattare solo il caso
delle simmetrie discrete24 di parità P , di coniugazione di carica C e inversione
temporale (time-reversal) T .
23
Se |ψ, t > è soluzione dell’equazione di evoluzione temporale e {O, H} = 0, allora
( )
∂ ∂
ih̄ |ψ, t > = H |ψ, t >⇒ O ih̄ |ψ, t > = O H |ψ, t >
∂t ∂t

⇒ −ih̄ O |ψ, t >= O H |ψ, t >= −H O |ψ, t > (2.104)
∂t
dunque anche O |ψ, t > è soluzione dell’equazione di evoluzione temporale per la stessa hamil-
toniana. Analogamente si procede all’inverso ...
24
Il caso delle simmetrie continue e analitiche, cioè il caso in cui le simmetrie unitarie del
sistema costituiscono un gruppo di Lie, non verrà trattato.
Ricordiamo soltanto che, in questo caso, ogni simmetria sarà rappresentata nello spazio di

28
2.2.1 La Parità
Consideriamo adesso la simmetria di parità P .
Questa deve operare sulle osservabili rispettando il loro modo classico di trasfor-
marsi ed inoltre, come ogni simmetria, deve essere cinematicamente ammissibile.
Iniziamo richiedendo dunque che, sulla base dell’analogia classica, sia

X ⃗ ′ ≡ P −1 X
⃗ →X ⃗ P = −X
⃗ (2.108)

da cui segue evidentemente25 che P | ⃗x > deve essere autovettore della posizione
⃗ per l’autovalore −⃗x (ma non necessariamente coincidente con − | ⃗x > !).
X
Una conseguenza26 è allora che P 2 | ⃗x > deve concidere, di nuovo, con il vettore
di stato iniziale, a meno di un possibile fattore di fase, i.e.

P 2 | ⃗x >= eiη | ⃗x > (2.110)

Siccome | ⃗x > è una base, se vogliamo che P 2 rispetti il principio di sovrappo-


sizione, la fase η deve essere unica in tutto lo spazio di Hilbert degli stati e quindi,
assumendo che P sia unitario, essa può essere riassorbita27 nella definizione stessa
dell’operatore P in modo tale che risulti

P2 = I (2.111)
Hilbert degli stati del sistema da un operatore unitario che commuta con l’hamiltoniana.
Affinché questo accada, occorre e basta che l’hamiltoniana commuti con i generatori del gruppo
(o, piuttosto, con la loro rappresentazione nello spazio di Hilbert ...) i quali quindi, essendo
hermitiani, rappresentano osservabili che risultano dunque conservate durante l’evoluzione tem-
porale del sistema.
Di questo genere è la simmetria imposta dal principio di Relatività e dalla richiesta di omo-
geneità dello spazio-tempo, secondo cui lo spazio di Hilbert degli stati di un qualunque sistema
fisico che sia isolato deve essere isomorfo a se stesso quando si osservi il sistema dato da un
diverso sistema di riferimento inerziale.
Questo significa, come sappiamo, che deve essere definita sullo spazio di Hilbert degli stati del
sistema una rappresentazione unitaria del gruppo di Poincaré U (a, Λ), dove (a, Λ) è il generico
elemento del gruppo, con a generica traslazione nello spazio-tempo e Λ generica trasformazione
del gruppo di Lorentz ortocrono proprio.
25
Infatti se |⃗x > è autovettore dell’osservabile X
⃗ per l’autovalore ⃗x, allora, dalla (2.108) segue
evidentemente che
⃗ ′ |⃗x >= −⃗x|⃗x >= P −1 X
X ⃗ P |⃗x >⇒ −⃗xP |⃗x >= X
⃗ P |⃗x > (2.109)

26
Stiamo qui assumendo che il sistema sia semplice e senza spin, altrimenti occorre tenere
conto anche delle proprietà di trasformazione delle altre variabili che, insieme alle coordinate,
costituiscono un set completo di osservabili per il sistema.
27
Con questo intendiamo dire che se P 2 | ⃗x > deve rappresentare lo stesso stato rappresentato
dal vettore | ⃗x >, allora P 2 (| ⃗x > +| ⃗y >) deve anch’esso coincidere con | ⃗x > +| ⃗y > a meno
di un fattore di fase, e questo può accadere solo se η è indipendente da ⃗x. Ridefinendo allora
P̂ ≡ e−iη/2 P ecco che, nell’ipotesi che P sia unitario, P̂ 2 = I ...

29
Per quanto riguarda P , a priori saremmo autorizzati solo a dire che

P | ⃗x >= eiα(⃗x) | − ⃗x > (2.112)

ed il vincolo su P 2 impone solo che α(⃗x) + α(−⃗x) = 0.


Assumeremo28 ancora, oltre al fatto già citato che P sia unitaria, che la fase α
non dipenda da ⃗x e dunque, dovendo essere P 2 = I, potrà essere solo

P | ⃗x >= ± | − ⃗x > (2.113)

Chiameremo ”scalari” i sistemi per cui P | ⃗x >= | − ⃗x > e ”pseudoscalari” quelli


per cui, invece P | ⃗x >= −| − ⃗x >.
Osserviamo adesso che, avendo in questo modo definito l’operatore di parità
P su una base29 , esso risulta completamente determinato.
Vediamo dunque come agisce, per esempio, sull’operatore di impulso P⃗ .
Ricordiamo che P⃗ è il generatore delle traslazioni spaziali, per cui una traslazione
infinitesima δ⃗a è rappresentata dall’operatore
i ⃗
T (δ⃗a) ≈ I + P · δ⃗a (2.114)

Siccome, classicamente, una traslazione di a seguita da una parità è equivalente
ad una parità seguita da una traslazione di a nel verso opposto, ovvero di −a,
per coerenza dobbiamo richiedere che

P T (δ⃗a) = T (−δ⃗a) P (2.115)

ovvero che
( ) ( )
i i
P I + P⃗ · δ⃗a = I − P⃗ · δ⃗a P = (2.116)
h̄ h̄
e dunque che

P (iP⃗ ) = −i P⃗ P (2.117)

Questa relazione, se l’operatore P è unitario, implica che, come ci aspettiamo in


base all’analogia classica, la parità anticommuti anche con l’impulso, i.e. risulti

P −1 P⃗ P = −P⃗ (2.118)

Quanto poi all’azione indotta dalla simmetria di parità P sull’algebra delle


osservabili, visto il modo come siamo arrivati alla sua definizione e cioè attraverso
28
Non dimentichiamoci, infatti, che quanto stiamo facendo è di cercare di arrivare ad
una definizione di P , per cui abbiamo ampia libertà sul suo modo di operare, limitata solo
dall’analogia classica, dalla coerenza interna e dal fatto che vogliamo arrivare alla definizione
di una simmetria che, almeno nei casi in cui classicamente questo già accade, sia conservata.
29
Di nuovo, stiamo qui assumendo di trattare il caso della particella singola senza spin.

30
la sua azione su una base (quella degli autostati delle coordinate ...), questa non
può che essere compatibile30 con le regole di commutazione che, in ultima analisi,
si riducono a quelle canoniche fra posizione e impulso

[Xi , Pj ] = ih̄ δij (2.119)

dato che, come sappiamo, tutta l’algebra delle osservabili31 della particella mate-
riale senza struttura interna poggia unicamente su queste regole di commutazione.
Perchè poi questa simmetria sia conservata, come abbiamo già detto, occorre
e basta che

[P, H] = 0 (2.122)

ovvero, essendo

|P⃗ |2
H= + V (⃗x) (2.123)
2m
occorre e basta32 che P −1 V P = V ⇔ V (−⃗x) = V (⃗x) , cioè, come c’era ovvia-
mente da aspettarci, che il potenziale sia una funzione pari della posizione.

30
Si osservi che se avessimo assunto P come antiunitario, allora per la (2.117) esso dovrebbe
commutare con l’impulso e questo sarebbe ancora compatibile con le regole di commutazione
canoniche!
Solamente, secondo questa definizione, si andrebbe contro l’aspettativa classica, in base alla
quale ci attendiamo che, sotto parità, tutte le grandezze vettoriali cambino di segno ...
31
Un’altra variabile cinematica importante per il sistema di una particella singola senza spin
è certamente il momento angolare J. ⃗ Esso, essendo definito come

⃗ × P⃗
J⃗ = X (2.120)

ha proprietà di trasformazione sotto parità immediatamente deducibili da quelle della posizione


(2.108) e dell’impulso (2.118), risultando, ovviamente,

⃗ P] = 0
[J, (2.121)

in accordo con quanto ci aspetteremmo in base all’analogia classica, visto che J⃗ è un vettore
assiale (pseudovettore).
32
Si osservi che l’operatore di parità P cosı̀ definito commuta certamente con l’hamiltoniana
libera H0 = 2m 1
|⃗
p|2 .

31
2.2.2 La Coniugazione di Carica
Un’altra simmetria discreta molto interessante è certamente quella della coni-
ugazione di carica C. Essa è più facilmente comprensibile nell’ambito della Teoria
Quantistica dei Campi e per poterne parlare in modo non banale nello schema
della prima quantizzazione, occorre considerare un sistema fatto da una carica in
interazione con il campo elettromagnetico, per cui l’hamiltoniana completa del
sistema è
( )
1 ⃗ e⃗ 2
H = P − A + eV =
2m c
|P |
⃗ 2
e ( ⃗ ⃗ ⃗ ⃗) e2 ⃗ 2
= − A·P +P ·A + |A| + e V (2.124)
2m 2mc 2mc2
⃗ è il potenziale vettore e V il potenziale scalare.
dove e è la carica elettrica, A
E’ immediato verificare che l’hamiltoniana di cui sopra è invariante sotto la
seguente trasformazione33 di simmetria C del campo elettromagnetico e della
carica elettrica

e → −e (2.125)
A → −A
⃗ ⃗ (2.126)
V → −V (2.127)

con P⃗ e X
⃗ invariati.
Visto che gli operatori di impulso e di posizione non cambiano sotto C, affinché
essa conservi le regole di commutazione è necessario che risulti

C −1 i C = i (2.128)

ovvero che C sia lineare e non antilineare, e dunque sia una simmetria unitaria.
Avremo modo di capirne meglio il significato ed il suo modo di agire quando
la riprenderemo nell’ambito della Teoria Quantistica dei Campi.

33
Questa trasformazione, in questo contesto, deve agire necessariamente anche sulla carica
elettrica la quale, però, in prima quantizzazione non è un operatore, come non sono operatori
i potenziali V ed A.⃗
Anche per questo motivo, la coniugazione di carica C è correttamente inseribile nel quadro
delle simmetrie discrete solo nello schema della seconda quantizzazione, ovvero della teoria dei
campi.

32
2.2.3 La simmetria di inversione temporale
Si tratta della simmetria discreta meno intuitiva di tutte.
Intanto va notato che essa, nonostante il nome, non ha tanto a che vedere con
l’inversione del tempo, quanto piuttosto con la reversibilità dei processi fisici.
Per meglio capire di che si tratta, vale la pena iniziare addirittura dalla Meccanica
Classica, considerando appunto un sistema meccanico, per esempio un punto
materiale di massa m il quale, al tempo t abbia velocità ⃗v (t) e sia semplicemente
soggetto, per esempio, alla forza di gravità.

Figure 2: Reversibilità della traiettorie di un punto materiale nel campo della


gravità

( Al tempo t + ∆t, fissate


) le condizioni iniziali al tempo t, i.e.
X(t) ≡ X0 , ⃗v (t) ≡ ⃗v0 , il punto materiale si troverà nella posizione X(t
⃗ ⃗ ⃗ + ∆t)
ed il suo stato di moto sarà tale che
′ ′
vx (t + ∆t) = v0x ≡ vx ; vy (t + ∆t) = v0y + g ∆t ≡ vy (2.129)

Chiedersi se c’è invarianza per inversione temporale (Time-reversal) della legge


del moto significa

• (prendere come nuovo punto di partenza ) quello di arrivo, i.e.


⃗ + ∆t) ≡ X
X(t ⃗ ′ , ⃗v (t + ∆t) ≡ ⃗v ′ ;

• applicare la trasformazione di Time-reversal allo stato e dunque cambiare


′ ′ ′
il segno della velocità ⃗v → T (⃗v ) ≡ −⃗v , lasciando inalterata la posizione;

33
• lasciare evolvere lo stato cosı̀ ottenuto ancora per il solito intervallo di tempo
∆t, secondo la stessa dinamica;
• verificare se il nuovo stato finale cosı̀ ottenuto coincide o meno con il
T −trasformato di quello di partenza.
Nel caso considerato della sola forza di gravità in assenza di attrito, questo è
ciò che effettivamente accade, infatti, dopo il tempo ∆t, la stessa legge di moto
avrà fatto sı̀ che la nuova velocità acquisita dal punto materiale sia

vx” = T (vx ) = −v0x

vy” = T (vy ) + g ∆t = − (v0y + g ∆t) + g ∆t = −v0y
ed avrà fatto ripercorrere a ritroso la stessa traiettoria descritta originariamente
dal grave, per cui possiamo concludere che il moto di un punto materiale nel
campo della gravità è effettivamente T −invariante.
E’ opportuno, comunque, puntualizzare che, nel trarre questa conclusione, abbi-
amo implicitamente assunto che la massa m del corpo ed il campo della gravi-
tazione non siano alterati dalla trasformazione di Time-reversal, ovvero che siano
T −invarianti. Per capire meglio cosa intendiamo dire, osserviamo che, nella trat-
tazione precedente, nulla cambierebbe se, al posto di un punto materiale nel
campo della gravità ci fosse una carica elettrica in un campo elettrico E(⃗⃗ x) dato.
Avremmo ancora reversibilità del moto, pur di assumere che la carica ed il campo
elettrico siano invarianti per Time-reversal.
Che succederebbe, però, se oltre al campo elettrico fosse presente, per esempio,
anche un campo magnetico?
E’ evidente dall’espressione della forza di Lorentz che, visto che per Time-reversal
la velocità cambia segno, affinchè T possa essere una simmetria conservata in elet-
trodinamica, occorre assumere che B, ⃗ a differenza di E, ⃗ cambi segno34 sotto T .
Tutto questo per dire che, nel momento in cui dovremo trattare un problema
in cui è presente un’interazione con campi esterni, prima di trarre conclusioni,
sarà necessario tenere conto anche delle proprietà di trasformazione di questi
ultimi sotto la simmetria considerata ...
Un altro modo equivalente a quello esposto sopra per verificare se in un certo
sistema meccanico è rispettata l’invarianza per Time-reversal è quello di partire
dalla legge di moto
⃗x = ⃗x(t) (2.130)
e verificare se, sotto la trasformazione
T : t → t̄ = −t (2.131)
⃗x(t) → ⃗xT (t̄) = ⃗x(t) (2.132)
34
Questo non ha nulla di misterioso né di contraddittorio con quanto accade per il campo
elettrico, visto che il campo magnetico è prodotto da cariche in moto e che, sotto T , il moto
cambia verso ...

34
la nuova legge di moto

⃗xT (t̄) = ⃗x(−t̄) (2.133)

implica comunque la stessa dinamica35 (relativamente alla variabile temporale t̄).

Ma veniamo adesso al problema della simmetria di Time-reversal in Mecca-


nica Quantistica e poniamoci, per comodità, nella Schröedinger Picture.
Alla luce di quanto detto sopra, se |ψ, t > è l’evoluto al tempo t dello stato |ψ >
al tempo t = 0, vogliamo che, se T è rispettata, allora lo stato T |ψ, t >, lasciato
evolvere ancora per un tempo t, conduca di nuovo a T |ψ >.
Ma come agisce l’operatore T sui vettori dello spazio di Hilbert ?
Cosı̀ come abbiamo fatto per la Parità e la Coniugazione di Carica, occupiamoci
innanzi tutto di definire l’azione di T sulle consuete osservabili X ⃗ e P⃗ , usando
l’analogia classica e avendo bene in mente la necessità che questa definizione sia
anche compatibile con le regole di commutazione canoniche (compatibilità cine-
matica).
Evidentemente, partendo dal significato classico che attribuiamo a questa sim-
metria, richiederemo ragionevolmente che risulti

T −1 X⃗T = X⃗ (2.139)
T −1 P⃗ T = −P⃗ (2.140)

Queste due semplici richieste, però, sono già sufficienti per dirci che se vogliamo
che T sia una simmetria, ovvero che rispetti le regole di commutazione canoniche
35
Evidentemente, nel caso di un punto materiale di massa m soggetto ad una forza esterna
F = F⃗ (⃗x) , questo è sempre vero, poiché la seconda legge della dinamica

d2 ⃗x
m = F⃗ (⃗x) (2.134)
dt2
è invariante sotto la trasformazione t → t̄ = −t , per la quale risulta

⃗x(t) → ⃗xT (t̄) = ⃗x(−t̄) = ⃗x(t) (2.135)


⃗x˙ (t) → ⃗x˙ T (t̄) = −⃗x˙ (−t̄) = −⃗x˙ (t) (2.136)
¨ (t) → ⃗x
⃗x ¨ T (t̄) = ⃗x
¨ (−t̄) = ⃗x
¨ (t) (2.137)

Più in generale, in Meccanica Classica c’è invarianza per Time reversal quando il sistema
è retto da un potenziale funzione solo delle coordinate e quindi il sistema è descritto da una
lagrangiana del tipo
1
L= Aij q̇i q̇j − V (qi ) (2.138)
2
che, chiaramente, è invariante in forma sotto la trasformazione (2.131), i.e. sotto la trasfor-
mazione qi → qi , q̇i → −q̇i .

35
[xi , pj ] = i h̄ δij , allora è necessario che

T −1 i T = −i (2.141)

ovvero che T sia rappresentato da un operatore antiunitario36 .


Vediamo quindi che cosa deve essere richiesto37 all’hamiltoniana affinchè la sim-
metria di Time-reversal cosı̀ introdotta sia conservata.
Ripartiamo per questo dalla legge di evoluzione temporale degli stati che ben
conosciamo

i h̄ |ψ, t >= H |ψ, t > (2.144)
∂t

⇒ T H |ψ, t >= T i h̄ |ψ, t > (2.145)
∂t
e poniamo per definizione

T |ψ, t >≡ |ψT , t̄ > (2.146)

Per quanto detto, T sarà una simmetria conservata se | ψT , t̄ > evolve nella
variabile temporale t̄ con la stessa dinamica (i.e., con la stessa hamiltoniana)
secondo la quale lo stato | ψ, t > evolve nella variabile temporale t.
Quali ne sono le implicazioni?

36
Nel suo lavoro originario del 1932
E.P. Wigner; Über die Operation der Zeitumhehr in der Quantenmechanick
Nachr. Ges. Wiss. Göttingen, Math.-Physik Kl. 32, 546 (1932)
Wigner richiede che l’hamiltoniana libera H0 sia T −invariante ed usa l’equazione di evoluzione
temporale nella Schröedinger Picture per dimostrare che T deve essere antiunitario.

Questo viene dedotto dal fatto che l’equazione contiene il fattore ih̄ ∂t al primo ordine.
Ciò però non è corretto, infatti, nel caso, per esempio, della generalizzazione relativistica
dell’equazione del moto libero di una particella (scalare), l’equazione di Klein-Gordon è del
secondo ordine ...
In realtà l’antiunitarietà dell’operatore T è imposta piuttosto dal rispetto delle condizioni cin-
ematiche ovvero dal rispetto delle regole di commutazione fra posizione ed impulso !
Si osservi che è ancora il carattere antiunitario di T a garantire la sua consistenza con le regole
di commutazione del momento angolare, i.e.

[Ji , Jj ] = i h̄ ϵijk Jk (2.142)

dovendo essere, per la (2.139) e la (2.140) ed il suo significato classico

T −1 J⃗ T = −J⃗ (2.143)

37
Si ricorderà che, per una generica simmetria antiunitaria, avevamo dimostrato che, per
essere conservata, essa doveva anticommutare con H, da cui, poi, il problema dello spettro di
H non limitato verso il basso ...

36
Essendo, per ipotesi, T antiunitario, risulta
∂ ∂ ∂
T i h̄ = −i h̄ T = i h̄ T (2.147)
∂t ∂t ∂ t̄
e quindi si ha
∂ ∂
T H|ψ, t >= T i h̄ |ψ, t >= i h̄ T |ψ, t > (2.148)
∂t ∂ t̄
Se e solo se H e T commutano, i.e.

[H, T ] = 0 (2.149)

allora l’equazione (2.148) diviene


H T |ψ, t >= T H|ψ, t > = i h̄ T |ψ, t >
∂ t̄

⇒ H |ψT , t̄ >= i h̄ |ψT , t̄ > (2.150)
∂ t̄
la quale mostra che se |ψ, t > è soluzione dell’equazione di evoluzione temporale
per l’hamiltoniana H, allora anche |ψT , t̄ >≡ T |ψ, t > lo è, e viceversa.
Quindi, per quanto riguarda l’operatore di inversione temporale T , possiamo
concludere che esso deve essere antiunitario e, affinché possa rappresentare una
simmetria conservata del sistema, cosı̀ come nel caso delle simmetrie unitarie,
deve commutare con l’hamiltoniana.
Vediamo adesso di esplicitare l’azione dell’operatore T nel caso più semplice
della particella senza spin.
Come sappiamo, lo stato fisico | ψ, t > di una generica particella di massa m
senza spin è univocamente determinato dalla sua funzione d’onda

ψ(x, t) =< x|ψ, t > (2.151)

tale quindi per cui



|ψ, t >= dx ψ(x, t) |x > (2.152)

Per il fatto che T ed X commutano, poniamo

T |x >= |x > (2.153)

ovvero definiamo T sulla base degli autostati della posizione in modo che sia
coincidente con l’operatore di coniugazione complessa K, che abbiamo preceden-

37
temente già incontrato, definito sulla stessa base. Ne segue dunque che38

T |ψ, t >= dx ψ(x, t)∗ |x > (2.156)

e dunque che la funzione d’onda associata allo stato T |ψ, t >≡ |ψT , t̄ > è sem-
plicemente la funzione ψ ∗ (x, t) ≡ ψ ∗ (x, −t̄).
Verifichiamo ora che, come occorre aspettarsi in base all’analogia classica, T sarà
una simmetria conservata se e solo se la particella interagisce con un potenziale
funzione solo delle coordinate ma non del tempo. In quel caso, infatti, se ψ(x, t)
è soluzione dell’equazione di evoluzione temporale (equazione di Schröedinger)
∂ψ
i h̄ =Hψ (2.157)
∂t

con H = −h̄
2
2m
∇2 + V (x), allora, dovendo essere la funzione V reale affinchè
l’operatore H possa essere hermitiano, evidentemente risulta, prendendo il com-
plesso coniugato dell’equazione data, che vale anche la relazione
∂ψ ∗
−i h̄ = H ψ∗ (2.158)
∂t
e dunque, essendo t̄ = −t ed H indipendente da t, ecco che si ha
∂ψ ∗
i h̄ = H ψ∗ (2.159)
∂ t̄
la quale dimostra quanto enunciato sopra.

Una volta ancora, per fissare bene le idee su come agisce la trasformazione
di Time-Reversal prima definita, vale la pena, adesso, di vedere che cosa succede
nel caso della particella libera (senza spin) di impulso definito p⃗.
Chiaramente lo stato | p⃗, t >, posto E ≡ p2 /2m, ha come funzione d’onda la
funzione
1
ψ(⃗x, t) ≡< ⃗x| p⃗, t >= ei⃗p·⃗x/h̄ e−iE t/h̄ (2.160)
(2π)3/2
38
Ricordiamo che, partendo dalla definizione dell’operatore di coniugazione complessa definito
sulla base delle coordinate, abbiamo già visto, per la (2.88), che risulta

K | p⃗ >= | − p⃗ > (2.154)

ovvero, dato che abbiamo identificato T con K, ne risulta che l’operatore di inversione temporale
applicato all’autostato dell’impulso per l’autovalore p⃗ lo trasforma nell’autostato dello stesso
operatore per l’autovalore −⃗ p, i.e.

T | p⃗ >= | − p⃗ > (2.155)

in perfetto accordo con quanto ci aspetteremmo in base all’analogia classica.

38
Per quanto abbiamo detto, la funzione d’onda associata allo stato T | p⃗, t > risulta
coincidere con la funzione che si ottiene dalla (2.160) prendendone la complessa
coniugata, ma scritta come funzione di t̄ = −t, i.e.

< ⃗x| T | p⃗, t >= ψ ∗ (⃗x, t) = ψT (⃗x, t̄) (2.161)

e dunque
1
ψT (⃗x, t̄) = e−i⃗p·⃗x/h̄ e−iE t̄/h̄ (2.162)
(2π)3/2

da cui, evidentemente, ne concludiamo che lo stato descritto dal vettore T | p⃗, t >
risulta avere impulso opposto a quello dello stato iniziale (come avevamo già os-
servato) ma continua ad avere la stessa energia dello stato di partenza, e non
energia opposta (che non significherebbe nulla di sensato ...), come potremmo
erroneamente ritenere, basandoci solo sull’effetto della coniugazione complessa.
Questo fatto39 discende formalmente dall’azione congiunta della coniugazione
complessa e dal fatto che, dopo la trasformazione T , la nuova variabile tem-
porale rispetto a cui occorre riferire l’evoluzione dello stato è t̄ e non t medesima!

Vediamo adesso che cosa succede quando c’è anche lo spin.


In questo caso la sola coniugazione complessa K in generale non basta più per
rappresentare T nello spazio di Hilbert delle funzioni d’onda poichè questo oper-
atore non è sufficiente per garantire l’invarianza delle regole di commutazione per
quanto concerne gli operatori di spin. Ricordiamo infatti che S ⃗ dovrà, come il
momento orbitale J,⃗ anticommutare con T , ovvero questo operatore dovrà essere
tale che

T Sk = −Sk T (2.163)

Poniamoci, per semplicità, nel caso di spin 1/2: gli operatori di spin sono pro-
porzionali alle matrici di Pauli Sx , Sy ed Sz

39
La conclusione a cui siamo giunti era del tutto prevedibile sulla base dell’analogia classica.
Nell’ambito della M Q, comunque, le cose non cambiano; infatti se T è conservata allora, come
sappiamo, essa deve commutare con l’hamiltoniana H del sistema e quindi risulta

H |E >= E |E > ⇒ T H |E >= H T |E >= E T |E >

la quale mostra appunto che se |E > è autostato di H per l’autovalore E, allora anche T |E >
lo è, per lo stesso autovalore.

39
( )
h̄ 0 1 h̄
Sx = = σ1 (2.164)
2 1 0 2
( )
h̄ 0 −i h̄
Sy = = σ2 (2.165)
2 i 0 2
( )
h̄ 1 0 h̄
Sz = = σ3 (2.166)
2 0 −1 2

E’ subito evidente, allora, che in effetti la sola coniugazione complessa non può
essere più sufficiente, infatti essa, mentre potrebbe bastare per Sy , che è rapp-
resentata da una matrice fatta da immaginari puri, certamente non può bastare
per Sx ed Sz , rappresentate entrambe da matrici reali.
Ci dobbiamo dunque attendere adesso che risulti

T =UK (2.167)

dove U sarà una matrice unitaria che agisce nello spazio dello spin in modo da
garantire, complessivamente, che T soddisfi la (2.163).
Quali sono allora le condizioni sulla matrice U ?
Evidentemente, per quanto detto, occorre che U , commutando con Sy , inverta il
segno di Sx e Sz .
Chiaramente si deve trattare quindi di una rotazione di π intorno all’asse y, i.e.
dell’operatore unitario40
π
U = e i 2 σ2 (2.170)
( )
0 1
= I cos(π/2) + iσ2 sin(π/2) = iσ2 = ≡R (2.171)
−1 0

Dunque, nel caso dello spin 1/2, proprio per ragioni cinematiche, i.e. affinché le
regole di commutazione (dello spin) siano preservate, sarà

T = RK (2.172)

dove R è la matrice di rotazione (unitaria) data dalla (2.171).


40
Ricordiamo infatti che, per definizione
1 1
eiασ2 ≡ I + iασ2 + (iασ2 )2 + (iασ2 )3 + ... (2.168)
2! 3!
ma siccome (σ2 )2 = I, ne segue che
[ ] [ ]
iασ2 1 2 1 3
e = I 1 + (iα) + ... + σ2 iα + (iα) + ... = I cosα + i σ2 sinα (2.169)
2! 3!

40
2.2.4 L’operatore T 2
In generale, il semplice fatto che T sia antiunitario ha una conseguenza molto
importante.
Consideriamo l’operatore T 2 : esso è unitario e, applicato ad uno stato qualsiasi,
questo potrà cambiarlo solo per un fattore di fase che, essendo T antiunitario,
non può essere riassorbito attraverso una sua ridefinizione. Decidiamo dunque
una base ortonormale qualsiasi | e1 >, ..., | en >, ... dello spazio di Hilbert. Sarà

T 2 | ei >= eiηi | ei > (2.173)

D’altronde T è antiunitario, quindi, in generale, in termini dell’operatore di co-


niugazione complessa K già introdotto, esso può essere scritto con l’ausilio di un
opportuno operatore unitario U nella forma T = U K. Abbiamo allora

T =UK ⇒ T2 = U K U K (2.174)

ovvero, posto che

U | ei >= Uji | ej > (2.175)

risulta

T 2 | ei > = U K U K | ei >= U K U | ei >= U K Uji | ej >) = U Uji∗ | ej >=


[ ]
= Uji∗ Ukj | ek >= (U U ∗ )ki | ek >= U (U t )−1 | ek > (2.176)
ki

D’altronde sappiamo per la (2.173) che T 2 è diagonale e se indichiamo con D la


matrice diagonale che lo rappresenta, i.e. (non sommato sugli indici ripetuti ...)

Dij = δij eiηj (2.177)

allora

U (U t )−1 = D ⇒ U = D Ut (2.178)

e prendendo la trasposta di entrambi i membri

Ut = U D (2.179)

e quindi, sostituendo nella (2.178)

U = DU D (2.180)

Questo significa dunque che


∑ ∑
Uij = Dik Ukn Dnj = eiηi δik Ukn δnj eiηj = Uij ei(ηi +ηj ) (2.181)
k,n k,n

41
ovvero, facendo i = j, che

eiηi = ±1 (2.182)

e quindi, considerando i ̸= j, che

∀i : eiηi = eiη = ±1 (2.183)

Dunque D ≡ T 2 deve essere multipla dell’identità ed i valori41 possibili di T 2 in


un dato spazio di Hilbert di stati, cioè per un sistema fisico assegnato, possono
essere soltanto ±1.

Per capire meglio il significato fisico di questo risultato, vediamone il legame


con lo spin.
Iniziamo considerando un sistema con spin intero S e siano |S, m > gli autostati
di Sz per l’autovalore m. Siccome T Sz = −Sz T , ne segue che deve essere42

T |S, m >= eiϕ(m) |S, −m > (2.184)

D’altronde esiste lo stato di momento angolare nullo, per il quale deve, evidente-
mente, essere

T |S, 0 >= eiϕ |S, 0 > (2.185)

Ma siccome T è antiunitario, allora, applicandolo ancora una volta, avremo

T (T |S, 0 >) = e−iϕ T |S, 0 >= e−iϕ eiϕ |S, 0 >= |S, 0 > (2.186)

ovvero

T 2 |S, 0 >= |S, 0 > (2.187)

Dunque, per quanto già detto, su tutti gli stati del sistema sovrapponibili con
quello considerato deve essere T 2 = 1, i.e. i sistemi con spin intero sono tutti
caratterizzati dal fatto che, su di essi

T2 = I (2.188)
41
Questa conclusione non è valida per operatori unitari come P e C, per i quali, a priori, nulla
vieta che P 2 = eiα e C 2 = eiβ . Resta comunque vero che, dato il principio di sovrapposizione
lineare, per tutti questi operatori P, C, T il fattore di fase è unico per tutti i vettori dello spazio
di Hilbert (a meno di regole di superselezione). Come abbiamo già avuto modo di dire, questo
fatto consente, nel caso degli operatori unitari P e C, di riassorbire l’eventuale fattore di fase
presente nel loro quadrato, in modo che risulti comunque P 2 = C 2 = I.
Per il suo carattere antiunitario, questo non è possibile per T , infatti, anche ponendo T ′ = eiϕ T ,
risulta comunque che che (T ′ )2 = T 2 !
42
Questa conclusione discende, in realtà, dal fatto che T commuta con S 2 , per cui i sottospazi
con S fissato sono T -invarianti.

42
Veniamo ora ai sistemi con spin semidispari.
Ovviamente, l’argomento usato prima non si può più usare perché non esiste
l’autostato con m = 0.
Iniziamo dunque dal caso già studiato di spin 1/2.
Si è visto che, definita la matrice R attraverso la (2.171), è
T = RK ⇒ T 2 = R (Rt )−1 (2.189)
Ma R, nel caso considerato, è reale, dunque, essendo unitaria, è tale che
(Rt )−1 = (R+ )−1 = R, e dunque
( )( ) ( )
0 1 0 1 −1 0
T 2 = R2 = = ≡ −I (2.190)
−1 0 −1 0 0 −1
Questo risultato, come mostreremo adesso, è del tutto generale: nel caso di spin
semidispari risulta necessariamente che T 2 = −I, per cui, vista la conclusione
opposta a cui siamo giunti per gli spin interi, evidentemente l’operatore T 2 dis-
crimina i fermioni dai bosoni !
Veniamo alla dimostrazione generale.
Consideriamo un sistema con momento angolare S qualsiasi (intero o semidispari)
e siano |S, m > gli autostati simultanei di S 2 e di Sz .
La (usuale) convenzione43 di fase fatta è tale per cui (h̄ = 1)
Sz |S, m > = m |S, m > (2.191)

S+ |S, m > = (S − m)(S + m + 1) |S, m + 1 > (2.192)

S− |S, m > = (S + m)(S − m + 1) |S, m − 1 > (2.193)
dove
S+ + S− S+ − S−
S± = Sx ± i S y ⇒ Sx = ; Sy = −i (2.194)
2 2
E’ evidente, allora, che, cosı̀ come nel caso di spin 1/2, gli operatori Sz e Sx
sono rappresentati da matrici reali, mentre Sy è rappresentato da una matrice
immaginaria pura.
L’operatore T , che anticommuta con S, ⃗ non può quindi essere rappresentato solo
dall’operatore K, ma occorre, in generale, che questa sia accompagnata anche da
una opportuna trasformazione unitaria che anticommuti con Sx e Sz e commuti
invece con Sy .
Giungiamo cosı̀, in generale, alla conclusione già tratta nel caso dello spin 1/2,
ovvero che, in presenza di qualsivoglia spin, la trasformazione U che, insieme a
K, descrive l’inversione temporale, è una rotazione di π intorno all’asse y, i.e.
T = U K; U = eiπ Sy (2.195)
43
Si tratta della convenzione seguita, per esempio, da
L. Landau, E. Lifchitz: Mécanique Quantique, ed. MIR 1974, pag 110

43
D’altronde, essendo Sy immaginario puro, U è reale, per cui

T 2 = U K U K = U U KK = U U = e2iπ Sy (2.196)

quindi, nella base considerata, T 2 è sempre una rotazione di 2π intorno all’asse y.


Solo che, nel caso degli spin interi, questa rotazione è semplicemente l’identità I,
mentre per gli spin semidispari, come sappiamo, essa vale −I (nel gruppo SU (2)
è la rotazione di 4π che torna ad essere l’identità ...).

Veniamo infine ad un’ultima conseguenza che si ha per i sistemi caratterizzati


dall’avere T 2 = −1.
Supponiamo di avere un sistema per cui T 2 = −I ed assumiamo che l’inversione
temporale sia una simmetria conservata. Indichiamo con |E > un generico au-
tostato dell’hamiltoniana. Siccome T è conservata, l’operatore T commuta con
l’hamiltoniana e quindi anche

|E(T ) >≡ T |E > (2.197)

è autostato dell’hamiltoniana per lo stesso autovalore E. Si ha

< E|E(T ) > ≡ < E|T E >=< T E|E >∗ =< T T E|T E >=
= − < E|T E >≡ − < E|E(T ) > (2.198)

dove le prime due uguaglianze sono ovvie, la terza proviene dall’antiunitarietà di


T e l’ultima dal fatto che, per ipotesi, T 2 = −I.
La relazione ottenuta mostra chiaramente che gli stati |E > ed |E T > sono
necessariamente ortogonali fra loro e quindi che descrivono stati diversi44 .
Si tratta della cosiddetta degenerazione di Kramer e vale, per quanto visto, solo
per sistemi con spin semidispari.

44
Il risultato ottenuto implica che, se T 2 = −I allora l’hamiltoniana non può costituire, da
sola, un set completo di osservabili. Il sistema deve possedere anche un qualche grado di libertà
che viene cambiato da T , in modo da produrre la degenerazione: solitamente (ma non è sempre
cosı̀) questo grado di libertà è la componente z dello spin.

44
2.2.5 Il momento di dipolo elettrico, la parità e l’inversione temporale
Consideriamo un sistema fisico come, per esempio, quello di una particella ele-
mentare, un atomo, una molecola, etc ... che sia posto in un campo elettrico
esterno ”debole”. L’energia del sistema, in funzione del campo elettrico, potrà
essere scritta come

⃗ + 1 Qij Ei Ej + ...
E = q V + d⃗ · E (2.199)
2
dove V ed Ei sono calcolati nel punto dove si trova il sistema di carica q, momento
⃗ momento di quadrupolo Q, ... .
di dipolo elettrico (EDM ) d,
Il momento di dipolo d,⃗ come è ben noto dall’elettrodinamica classica, è una
misura della polarizzazione della carica nel sistema, preesistente all’applicazione
del campo elettrico esterno. Risulta infatti

d⃗ = ei ⃗ri (2.200)

ed esso è indipendente dalla scelta del sistema di coordinate se il sistema fisico


considerato è globalmente neutro (q = 0).
Supponiamo adesso che la parità P sia una simmetria conservata nel sistema
fisico considerato, i.e. che

[P, H] = 0 (2.201)

Gli stati stazionari possono allora essere scelti in modo che siano anche auto-
stati della parità e, se il sistema è non presenta degenerazione accidentale (oltre
a quella eventualmente legata al momento angolare45 ), allora ad ogni autoval-
ore dell’hamiltoniana corripondono autostati di parità definita, eventualmente
degeneri in Jz . Anche lo stato fondamentale avrà dunque parità definita, per cui
⃗ 0 > = < ψ0 |P † P d⃗ P † P |ψ0 >=< P ψ0 |P d⃗ P −1 |P ψ0 >=
< ψ0 |d|ψ
= < ψ0 |P d⃗ P −1 |ψ0 >= − < ψo |d|ψ
⃗ 0> (2.202)

ovvero il suo momento di dipolo46 dovrà essere nullo47 .


Questo argomento fu usato per verificare la conservazione della parità nelle in-
45
Se il sistema è invariante per rotazioni (e siamo in assenza di spin) H, J 2 e Jz costituiscono
un set completo di osservabili che commutano. Siccome il momento angolare commuta a sua
volta con la parità, se non ci sono degenerazioni accidentali, ciascun multipletto deve avere
parità definita.
46
Abbiamo qui usato il fatto che ψ0 ha parità definita e che P d⃗ P −1 = P −1 d⃗ P = −d. ⃗
Chiaramente infatti, data la definizione (2.200), assumendo che la carica elettrica sia uno scalare
per parità, il momento di dipolo risulta essere un operatore vettoriale e dunque deve anticom-
mutare con P, cosı̀ come ⃗r.
47
Si noti che questo argomento vale non solo per lo stato fondamentale ma anche per
qualunque altro autostato dell’hamiltoniana, visto che discende unicamente dal fatto che esso
ha, necessariamente, parità definita, per l’ipotesi di assenza di degenerazione accidentale.

45
terazioni forti, misurando l’eventuale EDM del neutrone48 .

Fu però osservato successivamente da Landau49 che un eventuale valore non


nullo dell’EDM di un sistema elementare non degenere libero richiedeva anche
la violazione di T . Vediamo perché.
Nel caso di un sistema con momento angolare complessivo J intero (e quindi
con spin S intero ...), la degenerazione di Kramer non è presente e, se il sis-
tema non presenta alcuna degenerazione accidentale, allora una base dello spazio
di Hilbert degli stati del sistema potrà essere costituita da autostati simultanei
dell’hamiltoniana, di J 2 e di Jz , i.e. potrà essere data nella forma50

| EJ , J, m > (2.203)

dove, per l’ipotesi sulla non esistenza di alcuna degenerazione accidentale, fissato
EJ , J risulta a sua volta univocamente determinato.
In questo caso, se T è una simmetria conservata e dunque commuta con H, allora
lo stato T | EJ , J, m > deve appartenere al multipletto corrispondente all’energia
EJ e, per quanto già osservato, è evidente che dovrà essere

T | EJ , J, m >= U−m m |EJ , J, −m > (2.204)

dove la matrice unitaria U risulta essere, come sappiamo, semplicemente la ro-


tazione di π intorno all’asse y, i.e.

U = eiπ Jy (2.205)

Veniamo ora al momento di dipolo elettrico. Poiché d⃗ è un vettore, per il


48
Nell’articolo sottocitato, gli autori considerano la possibilità che il nucleone possa avere un
momento di dipolo elettrico, data lo scarsa conoscenza che si aveva a quel tempo (1950) delle
interazioni forti e delle loro proprietà.
E.M. Purcell, N.F. Ramsey: On the possibility od electric dipole moment for elementary particles
and nuclei Phys. Rev. 78, 807, (1950)
Usando la tecnica della risonanza magnetica applicata ad un fascio di neutroni polarizzati, essi
raggiunsero la precisione di 5 · 10−20 e · cm, come risulta dalla loro successiva pubblicazione
J.H. Smith, E.M. Purcell, N.F. Ramsey: Experimental limit to the electric dipole moment of
the neutron Phys. Rev. 108, 120, (1957)
Ad oggi, la precisione raggiunta nella misura del momento di dipolo elettrico del neutrone con
la tecnica N M R applicata all’atomo di 199 Hg (I = 1/2) è di ≈ 10−25 e · cm (cfr. R. Galub,
S.K. Lamoreaux: Neutron electric dipole moment, ultracold neutrons and polarized 3 He)
Phys. Rep. 237, 1, (1994)
ed esistono esperimenti in corso che dovrebbero giungere a sensibilità intorno a 10−28 e · cm.
49
L. Landau; On the conservation laws in weak interactions
Nucl. Phys. 3, 127 (1957)
50
Nel caso di spin semidispari, la degenerazione di Kramer, comunque, non altera il discorso
che stiamo facendo perché, siccome T commuta con J 2 come si è già avuto modo di osservare,
T non può far uscire dal multipletto.

46
teorema51 di Wigner-Eckart risulta allora che52
⃗ J , J, m >= C(EJ ) < J, m|J|J,
< EJ , J, m|d|E ⃗ m> (2.208)

da cui ne segue quindi, per esempio, che è

< EJ , J, m|dz |EJ , J, m >= C(EJ ) < J, m|Jz |J, m >= m C(EJ ) (2.209)

Riguardo a T , abbiamo già detto che risulta

T |EJ , J, m >= U−m m |EJ , J, −m > (2.210)

D’altronde, evidentemente è

< EJ , J, m|dz |EJ , J, m >= < EJ , J, m|T −1 T dz T −1 T |EJ , J, m > (2.211)

ma, per la (2.139) e la definizione (2.199), risulta

T −1 d⃗ T = d⃗ ⇔ T d⃗ T −1 = d⃗ ⇒ T dz T −1 = dz (2.212)

quindi

< EJ , J, m|dz |EJ , J, m > = < EJ , J, m|T −1 dz T |EJ , J, m >≡


≡ < EJ , J, m|T −1 dz T (EJ , J, m) >=
= < T −1 T (EJ , J, m)|T −1 dz T (EJ , J, m) >
51
Ricordiamo che il teorema di Wigner-Eckart stabilisce che, se OkL è la componente k di un
operatore tensoriale (per rotazioni) di ordine L, allora, su stati che siano anche autostati di J 2 e
di Jz , risulta in generale che, in termini del coefficiente di Clebsh-Gordan < J ′ , m′ |L, J; k, m >,
si ha

< J ′ , m′ , α′ | OkL |J, m, α >=< J ′ , α′ ||O||J, α > < J ′ , m′ |L, J; k, m > (2.206)

dove < J ′ , α′ ||O||J, α > viene detto elemento di matrice ridotto.


Per un operatore vettoriale in particolare, questa relazione può essere riscritta, all’interno dello
stesso multipletto, più semplicemente come

< J, m′ , α| V
⃗ |J, m, α >= C(α, J) < J, m′ |J|J,
⃗ m> (2.207)

dove C(α, J) è il rapporto fra l’elemento di matrice ridotto definito sopra per l’operatore V ⃗ e
quello per J (certamente non nullo in multipletti in cui J ̸= 0: se J = 0, comunque, la relazione

resta valida in quanto sia V ⃗ che J⃗ hanno comunque solo elementi di matrice solo nulli).
Si osservi che la proporzionalità fra V ⃗ e J⃗ esiste solo e soltanto all’interno di uno stesso multi-
pletto (e la costante può dipendere dal multipletto stesso ...).
Nel caso di multipletti con J differente, mentre può accadere che V ⃗ abbia elementi di matrice
e quindi che < J ′ , α′ ||V ||J, α ≯= 0, è certo che J⃗ non può averne perché esso commuta con J 2
e dunque, se J ̸= J ′ o α ̸= α′ ⇒< J ′ , α′ ||J||J, α >= 0 !
52
Siccome per ipotesi il sistema non possiede degenerazione accidentale, questo implica che EJ
determina univocamente J per cui è inutile precisare formalmente la dipendenza della costante
C anche dall’autovalore di J.

47
ovvero, tenendo conto che T e quindi T −1 sono antiunitari ed usando la (2.204),
abbiamo

< EJ , J, m|dz |EJ , J, m > = < T (EJ , J, m)| dz T (EJ , J, m) >∗ =


= < U−m m (EJ , J, −m)| dz U−m m (EJ , J, −m) >∗ =
= |U−m m |2 < EJ , J, −m| dz |EJ , J, −m >∗ (2.213)

ma dz è un operatore hermitiano, quindi

< EJ , J, −m| dz |EJ , J, −m >∗ =< EJ , J, −m| dz |EJ , J, −m >

e dunque

< EJ , J, m|dz |EJ , J, m > = |U−m m |2 < EJ , J, −m| dz |EJ , J, −m >

relazione che, evidentemente, non può essere in accordo con la (2.209) senza che
C(EJ ) = 0, visto che essa fornisce la relazione

m C(EJ ) = −m |U−m m |2 C(EJ ) (2.214)

Questo significa che, su un qualunque autostato dell’hamiltoniana T -invariante


di un sistema che non presenta degenerazione accidentale, il momento di dipolo
elettrico (EDM ) d⃗ di quello stato deve avere valore medio nullo.
In particolare, questa conclusione è vera, ovviamente, per lo stato fondamentale
del sistema in esame.

Ma significa questo che nessun sistema può mai avere un EDM non nullo
senza che T sia violata ? Dopo tutto, sappiamo, per esempio, che certe molecole,
come quella dell’acqua, sono polari ...
La risposta alla domanda sta nel fatto che sia verificata o meno l’ipotesi di as-
senza di di degenerazione accidentale, ovvero nel fatto che il sistema non possieda
un’altra direzione intrinseca indipendente da quella definita dal momento ango-
lare.
Se questo accade, la conclusione per cui la presenza di un momento di dipolo
elettrico non nullo implica violazione di T non è più corretta.

Un caso particolarmente istruttivo è quello dello stesso atomo di idrogeno. La


teoria non relativistica dell’atomo di idrogeno senza spin prevede infatti, come
è ben noto, che tutti gli stati con lo stesso numero quantico principale n siano
degeneri fra loro e quindi che esistano, a parte il caso n = 1, multipletti cor-
rispondenti a un diverso valore del momento angolare L, da L = 0 a L = n − 1,
aventi tutti la stessa energia.

48
Questo implica che l’atomo possieda sul generico autostato | n1 , n2 , m > (co-
ordinate paraboliche53 , lungo z) un momento di dipolo elettrico

3 h̄2 3 ̸ λc
dz = n(n1 − n2 ) |e| 2
= n(n1 − n2 ) |e| (2.220)
2 me 2 α
dove n1 ed n2 sono interi non negativi legati al numero quantico principale54 n
ed all’autovalore m di Lz dalla relazione55

n = n1 + n2 + 1 + |m| (2.221)

ed abbiamo indicato, come è consuetudine, con ̸ λc la lunghezza d’onda Compton


ridotta dell’elettrone e con α la costante di struttura fina.
Questo EDM non nullo, ovviamente, non implica alcuna violazione né di T
né di P , visto che c’è degenerazione accidentale.
Questa degenerazione accidentale discende dal fatto che, nel caso del potenziale
53
L’hamiltoniana dell’atomo di idrogeno è separabile anche in coordinate paraboliche, la cui
definizione è la seguente:

x = ξη cosϕ (2.215)

y = ξη sinϕ (2.216)
1
z = (ξ − η) (2.217)
2
con ξ, η ≥ 0 e ϕ compreso fra 0 e 2π. Risulta
√ 1
r = x2 + y 2 + z 2 = (ξ + η) (2.218)
2
y
ξ = r + z; η = r − z; ϕ = arctg (2.219)
x
e le superfici ξ = cost e η = cost sono, appunto, paraboloidi di rotazione intorno all’asse z
con fuoco nell’origine.
54
Fissato n, i possibili valori di |m| vanno da 0 a n − 1. Fissati n e |m|, data la (2.221) n1
può assumere tutti i valori che vanno da 0 a n − |m| − 1, ovvero può assumere n − |m| valori
differenti, dopodichè n2 , invece, è univocamente fissato. Tenendo conto che per ogni m > 0
esiste un corrispondente m < 0, ecco che gli stati |n1 , n2 , m > con n fissato sono


n−1
2 (n − m) + (n − 0)
m=1

dove l’ultimo addendo corrisponde ad m = 0. Risulta quindi


n−1
2 (n − m) + (n − 0) = 2n(n − 1) − n(n − 1) + n = n2
m=1

che rappresenta, come sappiamo, la degenerazione del livello n dell’atomo di idrogeno.


55
Cfr. L. Landau E. Lifchitz: Mécanique Quantique Ed. Mir, 1974, pagg. 154 e successive e
pagg. 328 e successive.

49
coulombiano V (⃗r) = −k/r, esiste un altro vettore conservato, indipendente da
⃗ che è il vettore di Runge-Lenz, il quale classicamente, è dato da
L,

⃗ = 1 P⃗ × L
A ⃗ − k ⃗r (2.222)
m r
Quantisticamente56 ciascuna di queste componenti commuta57 con la sua omologa
componente di L, ⃗ ma non con L2 , e le tre componenti Ai non commutano58 fra
loro. L’esistenza di questa osservabile conservata che non commuta con L2 im-
plica l’esistenza di una degenerazione ulteriore dei livelli energetici, oltre a quella
legata a Lz , che è detta, appunto, accidentale nel senso che la sua esistenza è
direttamente legata al fatto che il potenziale è coulombiano.

La base consueta (coordinate sferiche) | n, L, m > usata per descrivere gli


autostati dell’atomo di idrogeno è fatta, come ben noto, da stati in cui, oltre
all’energia, sono diagonali anche L2 e Lz , mentre la base |n1 , n2 , m > sopra citata
è fatta da stati dove, oltre all’energia, sono diagonali Lz ed Az , i cui autovalori
sono proporzionali a n2 −nn
1
.

L’osservabile d, nel supermultipletto definito dal numero quantico principale
n, invece che essere parallela a L,⃗ come dovrebbe accadere se non ci fosse alcuna
degenerazione accidentale (con le conseguenze viste sopra circa < |d| ⃗ >, dovute,
in buona sostanza al fatto che T e L ⃗ anticommutano mentre T e d⃗ commutano),
56
Siccome P⃗ e L⃗ non commutano fra loro, la definizione quantistica, che rende altresı̀

l’operatore A hermitiano, è la seguente
1 ri
Ai = ϵijk ( Pj Lk + Lk Pj ) − k (2.223)
2m r

57 ⃗ è un operatore vettoriale per rotazioni, dunque tale che


A

[Lj , Ak ] = ih̄ ϵjkn An (2.224)

Essendo A ⃗ un vettore polare, esso anticommuta con la parità e dunque non può avere elementi
di matrice diversi da zero fra stati all’interno di uno stesso multipletto (stati aventi la stessa
parità ...) mentre può avere elementi di matrice fra multipletti diversi, degeneri in energia (solo
con |∆L| = 1, essendo l’operatore A ⃗ dispari di spin 1 ...).
58
Come mostrato in
A. Bohm: Quantum mechanics: foundations and√ applications, III edition, 1993, Springer, Ch.VI
opportunamente rinormalizzati (Ai → Âi = Ai / −2H/m, dove H è hamiltoniana del sistema
di massa m), il commutatore degli Âj riproduce le componenti del momento angolare orbitale,
i.e.

[Âj , Âk ] = ih̄ ϵjkn Ln (2.225)

e questo implica che il gruppo di invarianza dell’hamiltoniana relativa al potenziale coulombiano


è più esteso del solo gruppo delle rotazioni e coincide in effetti con SO(4), che spiega il motivo
per cui il livello energetico n−esimo ha degenerazione n2 .

50
⃗ >, visto che
⃗ (senza conseguenze su < |d|
risulta in questo caso parallela ad A
anche T ed A ⃗ commutano), infatti si dimostra che risulta59

⃗ >= 3 |e|
< |d| < |A|
⃗ > (2.232)
4 < |E| >

Questo per quanto riguarda T .

59
Le due osservabili d⃗ ed A⃗ non sono proporzionali tra loro poiché la costante che le lega
è in effetti funzione dell’energia e quindi la proporzionalità è limitata solo all’interno di un
multipletto degenere. Risulta infatti

3 h̄2 3 ̸
λ
< |dz | > = − n(n1 − n2 )|e| 2 ≡ − n(n1 − n2 ) |e| (2.226)
2 me 2 α
n1 − n2
< |Az | > = α h̄c (2.227)
n
dunque

3 ̸ < |Az | >


λ
< |dz | > = − n2 |e| (2.228)
2 α αh̄c
ma, come è noto, l’energia del livello n−esimo è data da

me4 m α2 h̄2 c2 1
< |E| > = − = − = −mc2 α2 2 (2.229)
2h̄2 n2 2h̄2 n2 2n
dunque risulta

mc2 α2
n2 = − (2.230)
2 < |E| >

e quindi si ha infine che

3 ̸ < |Az | > mc2 α2


λ
< |dz | > = |e| =
2 α αh̄c 2 < |E| >
3 |e| mc 3 |e|
= , λ̸ < |Az | >= < |Az | > (2.231)
4 < |E| > h̄ 4 < |E| >

51
Torniamo infine al legame fra EDM e parità, da cui eravamo partiti.
Siccome Az non commuta con L2 bensı̀ ha elementi di matrice fra stati con
|∆L| = 1, gli stati60 |n1 , n2 , m > sono, in generale, combinazioni lineari di stati
con lo stesso autovalore di Lz (ovvio !), ma appartenenti a multipletti differenti,
corrispondenti allo stesso numero quantico principale n. Questo implica in par-
ticolare che essi non abbiano parità definita, per cui, l’esistenza di un EDM non
nullo su questi autostati dell’hamiltoniana, non implica, evidentemente, alcuna
violazione di P nella dinamica !

60
Giusto per completezza, osserviamo che se consideriamo, per esempio, il primo livello ecci-
tato (n = 2), allora, nella base |n1 , n2 , m > i quattro stati degeneri, espressi come combinazione
degli stati nella base più consueta |n, L, m >, sono dati da
1
|1, 0, 0 > = √ (|2, 0, 0 > +|2, 1, 0 >) (2.233)
2
1
|0, 1, 0 > = √ (|2, 0, 0 > −|2, 1, 0 >) (2.234)
2
|0, 0, 1 > = |2, 1, 1 > (2.235)
|0, 0, −1 > = |2, 1, −1 > (2.236)

ed è allora del tutto evidente come dz possa avere valor medio non nullo sugli stati |1, 0, 0 >
e |0, 1, 0 > visto che la funzione d’onda di |2, 0, 0 > ha simmetria sferica, mentre quella di
|2, 1, 0 > è proporzionale a z.
Si osservi infine che entrambe le funzioni d’onda possono essere scelte reali, per cui gli stati
⃗ che d⃗ ...
|1, 0, 0 > e |0, 1, 0 > risultano entrambi T-invarianti come tanto A

52
2.2.6 Una curiosità: il vettore di Runge-Lenz
Classicamente, nel caso del moto di un punto materiale di massa m in un campo
coulombiano o newtoniano, fra le grandezze fisiche conservate c’è, come è noto,
il vettore assiale del momento angolare61
⃗ ≡ ⃗r × p⃗ ≡ m ⃗r × ⃗r˙
L
⃗ . Se l’hamiltoniana
e, oltre a questo, il cosiddetto vettore (polare) di Runge−Lenz M

p2 k
H= −
2m r
allora il vettore di Runge-Lenz è definito come

⃗ = 1 p⃗ × L
A ⃗ − k ⃗r (2.237)
m r
Esso, come vedremo, individua la direzione dell’asse fuoco-direttrice, nel verso
del perielio.
Iniziamo provando che A ⃗ è davvero una costante del moto. Ricordiamo a

questo proposito che L è indipendente dal tempo, per cui
( )
( )
d 1 ⃗ = d ⃗r˙ × L
p⃗ × L ⃗ = r̈ × L
⃗ (2.238)
dt m dt
ma, per la seconda legge della dinamica si ha che
1 k
⃗¨r = (−⃗r) (2.239)
m r3
dunque
( )
d 1 ⃗ = − k ⃗r × L
⃗ = − k ⃗r × (⃗r × (m⃗r˙ )) = − k ⃗r × (⃗r × ⃗r˙ )
p⃗ × L 3
dt m mr mr3 r3
D’altronde, risultando evidentemente

⃗r = r ⃗n ⇒ ⃗r˙ = ṙ ⃗n + r ⃗n˙ (2.240)

si ha che

⃗r × ⃗r˙ = ⃗r × (r ⃗n˙ ) = r (⃗r × ⃗n˙ ) (2.241)


61
Questo è dovuto al carattere centrale della forza, i.e. al fatto che F⃗ (⃗r) = f (r) ⃗n, dove
⃗n ≡ ⃗rr , infatti

dL d(⃗r × ⃗r˙ )
=m = m ⃗r˙ × ⃗r˙ + m ⃗r × ⃗¨r = f (r) ⃗r × ⃗n = 0
dt dt

53
per cui ne segue che
( ) [ ]
d 1 ⃗ = − k ⃗r × (⃗r × ⃗n˙ ) = − k ⃗r (⃗r · ⃗n˙ ) − ⃗n˙ r2
p⃗ × L (2.242)
dt m r2 r2
D’altronde, essendo

n2 = ⃗n · ⃗n = 1 ⇒ ⃗n˙ · ⃗n = 0 ⇒ ⃗n˙ · ⃗r = 0

e quindi, finalmente, si ha
( ) ( )
d 1 ⃗ = k ⃗n˙ d 1
p⃗ × L ⇒ p⃗ × L
⃗ − k ⃗n = 0 (2.243)
dt m dt m
che prova appunto il fatto che il vettore di Runge-Lenz sia una costante del moto.

Vediamo ora come da questa legge di conservazione si possa dedurre che la


traiettoria percorsa dal punto materiale deve essere una conica.
⃗ per la coordinata radiale ⃗r: si ha
Moltiplichiamo scalarmente il vettore A

⃗ · ⃗r = 1 (⃗p × L)
A ⃗ · ⃗r − k r ⇒ A r cosθ = (⃗r˙ × L)
⃗ · ⃗r − k r (2.244)
m
⃗ Ricordiamo adesso l’identità vettoriale
dove l’angolo θ è l’angolo fra ⃗r e A.

(⃗a × ⃗b) · ⃗c = (⃗c × ⃗a) · ⃗b

per cui risulta che


2
(⃗r˙ × L) ⃗ = 1 |L|
⃗ · ⃗r = (⃗r × ⃗r˙ ) · L ⃗ 2≡ l
m m
dove abbiamo indicato con l il modulo (costante) del momento angolare della
particella. Dunque abbiamo

l2 l2
A r cosθ = − k r ⇒ r (A cosθ + k) =
m m
1 km A m
⇒ = 2 + 2 cosθ (2.245)
r l l
che è appunto l’equazione di una conica di eccentricità
Am
l2 A
ϵ= = (2.246)
km
l2
|k|

Nel caso di potenziale attrattivo (k > 0) e nel caso particolare di un sistema


legato, come è noto la traiettoria è un’ellisse.

54
Vediamo, in questo caso, come è fatto il vettore A.⃗
⃗ a
Senza perdita di generalità, visto che il moto è piano data la costanza di L
cui il vettore posizione è ovviamente sempre ortogonale, possiamo supporre che
esso avvenga nel piano (x, y). Poniamo allora

⃗r = r (cosϕ, sinϕ, 0) (2.247)

e dunque

⃗r˙ = ṙ (cosϕ, sinϕ, 0) + r ϕ̇ (−sinϕ, cosϕ, 0) (2.248)

da cui
⃗ = m ⃗r × ⃗r˙ = m r2 ϕ̇ (0, 0, 1) ≡ (0, 0, l)
L (2.249)
⃗ dalla definizione si ha
Veniamo ora al calcolo esplicito di A:
2
⃗ = 1 p⃗ × (⃗r × p⃗) − k ⃗n = p ⃗r − 1 p⃗ (⃗r · p⃗) − k ⃗n
A (2.250)
m m m
ma per determinare il vettore, essendo costante durante il moto, basta calcolarlo
in un punto qualsiasi dell’orbita. Osserviamo allora che, essendo

⃗r · p⃗ = m ⃗r · ⃗r˙ = m r ṙ

il secondo addendo nell’espressione (2.249) è nullo sia al perielio che all’afelio,


dove ṙ = 0. In ciascuno di questi due punti, quindi, l’espressione del vettore di
Runge-Lenz si semplifica in
( )
2 2 2
⃗ = p ⃗r − 1 p⃗ (⃗r · p⃗) − k ⃗n ⇒ A = p ⃗r − k ⃗n = ⃗n r p − k
A (2.251)
m m m m
D’altronde l’energia totale E della particella è anch’essa una costante del moto e
vale
p2 k
E= −
2m r
per cui ne segue che
p2
2r E = r − 2k (2.252)
m
da cui, sempre solo al perielio e all’afelio, è
⃗ = (2rE + k) ⃗n
A (2.253)

Ma in un moto kepleriano l’energia totale E risulta


k
E=−
d

55
dove d è la lunghezza dell’asse maggiore dell’ellisse per cui, detti a e b (a > b),
rispettivamente, la distanza dell’afelio e del perielio dall’origine (fuoco dell’ellisse),
risulta
k
E=− (2.254)
a+b
per cui risulta
( )
−k k(b − a)
⃗ = ⃗na
af elio : A 2a +k = ⃗na = |E|(b − a)⃗na (2.255)
a+b a+b
( )
−k k(a − b)
⃗ = ⃗nb 2b
perielio : A +k = ⃗nb = |E|(a − b)⃗nb (2.256)
a+b a+b
ed evidentemente i due risultati, come devono, sono coincidenti visto che ⃗na =
−⃗nb .
Concludendo, il vettore di Runge-Lenz classico (vedi fig.3) ha per modulo il
prodotto del valore assoluto dell’energia totale per la differenza afelio-perielio, ha
per direzione quella dell’asse dell’ellisse e verso quello che va dal fuoco al perielio.

L’interesse per questo vettore sta nel fatto che, come sappiamo, esso è, per es-
empio, all’origine della degenerazione accidentale dei livelli nell’atomo di idrogeno
(trattazione non relativistica, senza spin), per la quale l’energia dipende solo dal
numero quantico principale n e sono degeneri tutti i livelli con J = 0, ...n − 1.

Figure 3: Vettore di Runge Lenz

56
2.2.7 Il sistema dei Kappa neutri

I mesoni K neutri sono particelle pseudoscalari, i.e. essi hanno parità intrinseca
P = −1 ed hanno spin nullo. Come si ricorderà, essi furono individuati da
Rochester e Butler nel 1947 in interazioni di raggi cosmici in camera a nebbia
come particelle V 0 , ed infatti un loro modo frequente di decadimento è quello in
due pioni
K 0 → π+ π−
Poiché questi mesoni hanno stranezza, essi non possono coincidere con la propria
antiparticella, quindi dovranno esistere sia il K 0 che il K̄ 0 .
In termine di quarks, oggi sappiamo infatti che
|K 0 >= |ds̄ >; ¯ >
|K̄ 0 >= |ds
e la stranezza del K 0 è S = +1, mentre quella del K̄ 0 è S = −1.
Come si poteva, però, essere certi di questo, cioè che davvero K 0 ̸= K̄ 0 ?
Gell-Mann e Pais furono i primi che si posero il problema62 delle conseguenze
osservabili che derivano dall’esistenza di due mesoni neutri coniugati di carica.
Essi partirono dall’assunto che C fosse una simmetria rispettata63 anche dalle
interazioni deboli: oggi sappiamo che questo non è vero, anzi che essa è violata in
modo massimale, ma vale la pena ripercorrere il loro ragionamento sostituendo
semplicemente alla loro l’ipotesi quella che sia invece CP la simmetria conservata
anche dalle interazioni deboli. Siccome CP è violata molto marginalmente, questa
resta comunque una ipotesi di lavoro molto utile e tutt’altro che peregrina !
Assumiamo dunque che esistano i due stati ortogonali |K 0 > e |K̄ 0 > e definiamo
la simmetria di coniugazione di carica fissandone la convenzione di fase in modo
che risulti
CP |K 0 >= |K̄ 0 >; CP |K̄ 0 >= |K 0 > (2.257)
Iniziamo trattando il problema dell’evoluzione del sistema delle due particelle
nell’ipotesi di assenza di interazione debole.
Chiaramente, in questa ipotesi, esse non possono decadere e, ponendo
( )
a(t)
Ψ(t) = a(t) |K 0 > + b(t) |K̄ 0 >≡ (2.258)
b(t)
ne segue che Ψ(t), nel riferimento di quiete, evolve in modo tale che
( )
∂ M 0
ih̄ Ψ(t) = H Ψ(t), H= (2.259)
∂t 0 M
62
M. Gell-Mann, A. Pais: Behavior of neutral particles under charge conjugation,
Phys. Rev. 97, 1387 (1955)
63
Si ricordi che la violazione della parità nelle interazioni deboli fu appurata solo nel 1957,
cioè due anni dopo l’analisi di Gell-Mann e Pais.

57
dove si è assunta valida la simmetria CP T e dunque che64

m(K 0 ) = m(K̄ 0 ) ≡ M (2.263)

In questa ipotesi, il sistema è dunque costituito da due stati degeneri.


Immaginiamo adesso di ”accendere” l’interazione debole.
A causa, per esempio, del fatto che sia il |K 0 > che il |K̄ 0 > possono decadere
in una coppia di pioni, si apre la possibilità che essi si trasformino, al secondo
ordine nelle interazioni deboli, l’uno nell’altro, i.e. che
( )
|K 0 >→ π π; |K̄ 0 >→ π π ⇒ |K 0 >→ π π → |K̄ 0 > (2.264)

Dunque la dinamica debole deve consentire (al secondo ordine) oscillazioni del
tipo

|K 0 > ↔ |K̄ 0 > (2.265)


{ }
per cui l’hamiltoniana del sistema |K 0 >, |K̄ 0 > , deve piuttosto essere della
forma65
( )
M ∆1
H= (2.267)
∆2 M
64
Infatti abbiamo che (si ricordi che CP T è antiunitario)

m(K 0 ) ≡ < K 0 | H |K 0 >=< K 0 | (CP T )−1 H(CP T ) K 0 >=


= < (CP T )−1 (CP T ) K 0 |(CP T )−1 H(CP T ) K 0 >=
= < (CP T ) K 0 |H(CP T ) K 0 >∗ (2.260)

D’altronde, siccome siamo nel riferimento di quiete, evidentemente trattandosi di particelle


(pseudo)scalari e quindi senza spin, risulta che

T |K 0 >= |K 0 >; T |K¯0 >= |K¯0 > (2.261)

e dunque si ha

m(K 0 ) = < (CP T ) K 0 | H (CP T ) K 0 >∗ =< K¯0 | H K¯0 >∗ =


= < H K¯0 | K¯0 >=< K¯0 | H |K¯0 >≡ m(K¯0 ) (2.262)

65
L’invarianza sotto CP T implica, come si è visto, che < K 0 |H|K 0 >=< K¯0 |H|K¯0 > ma
non fornisce, in generale, alcuna condizione sui termini fuori diagonale, infatti si ha

< K 0 | H |K¯0 > = < K 0 |(CP T )−1 H(CP T )K¯0 >=< (CP T )−1 (CP T )K 0 |(CP T )−1 H (CP T )K¯0 >=
= < (CP T )K 0 |H (CP T )K¯0 >∗ =< K¯0 |H, K 0 >∗ =< K 0 | H |K¯0 > ... (2.266)

58
Se però CP è conservata dall’hamiltoniana, allora

∆1 = < K 0 | H |K̄ 0 >=< K 0 | (CP )−1 H (CP ) |K̄ 0 >=


= < K 0 | (CP )† H (CP ) |K̄ 0 >=< (CP ) K 0 | H (CP ) K̄ 0 >=
= < K̄ 0 | H |K 0 > = ∆2 (2.268)

e dunque l’hamiltoniana H sarà in realtà del tipo66


( )
M ∆
H= (2.270)
∆ M

Questa hamiltoniana, indipendentemente dal valore effettivo di ∆ (che, pur es-


sendo certamente piccolissimo in confronto ad M , visto che descrive un processo
al secondo ordine nell’interazione debole, esso non è quindi certamente nullo ...),
ha comunque i due autovettori della forma
( )
1 1 1 ( )
|K10> = √ ≡ √ |K 0 > + |K̄ 0 > (2.271)
2 1 2
( )
1 1 1 ( )
|K2 > = √
0
≡ √ |K 0 > − |K̄ 0 > (2.272)
2 −1 2

corrispondenti, rispettivamente, agli autovalori M ± ∆ e quindi non più degeneri.


Siccome per ipotesi [H, CP ] = 0 questi autovettori dell’hamiltoniana devono
essere anche autovettori simultanei di CP ed è immediato che lo sono per gli
autovalori +1 e −1, rispettivamente.
L’interazione debole, però, come abbiamo visto, accoppia gli stati di |K 0 > e
|K̄ > anche ad altri stati i quali non stanno nello spazio di Hilbert bidimensionale
0

fin’ora considerato: questo significa che non è possibile descrivere completamente


l’evoluzione del sistema senza allargare lo spazio degli stati stessi.
Se però non siamo interessati a conoscere il dettaglio gli stati finali ma solo a
sapere che cosa accade agli stati di |K 0 > e di |K̄ 0 >, allora si può ancora
restare nello spazio bidimensionale da essi definito ma occorre ammettere che
l’hamiltoniana non sia più hermitiana bensı̀ contenga i termini opportuni che
descrivono il decadimento esponenziale di queste particelle. Sempre nell’ipotesi
che CP sia una simmetria rispettata dall’interazione debole, i due stati ortogonali
|K10 > e |K20 > decadranno verso stati con CP opposta senza mescolamenti
66
Si osservi che, in queste ipoetsi, ∆ deve essere reale a causa dell’invarianza sotto CP T
che, in presenza della simmetria conservata CP , implica la conservazione della simmetria di
inversione temporale T e dunque che

< K 0 | H |K¯0 > = < K 0 |T −1 H T K¯0 >=< T −1 T K 0 |T −1 H T K¯0 >=


= < T K 0 |H T K¯0 >∗ =< K 0 |H K¯0 >∗ =< K¯0 | H |K 0 > (2.269)

59
reciproci, ciascuno con una propria larghezza di decadimento Γ1 e Γ2 , per cui, in
questa stessa base, avremo
( )
M + ∆ − 2i Γ1 0
H= (2.273)
0 M − ∆ − 2i Γ2

e dunque, quanto all’evoluzione temporale, sarà (h̄ = c = 1)

|K10 , t > = e−i(M +∆− 2 Γ1 )t |K10 >= e−i(M +∆)t e− 2 Γ1 t |K10 >
i 1
(2.274)
−i(M −∆− 2i Γ2 )t −i(M −∆)t − 12 Γ2 t
|K20 , t > = e |K20 >= e e |K20 > (2.275)

Ciò che Gell-Mann e Pais misero in evidenza era che mentre il |K10 > poteva
decadere in due pioni perché questo è uno stato CP -pari67 , se CP era conservata,
il |K20 > non poteva farlo, bensı̀ doveva decadere in almeno tre pioni.
Però, in questo caso, per esempio già lo spazio delle fasi era più ridotto e quindi
c’era da aspettarsi che il |K20 > avesse una vita media sensibilmente più lunga.
Va osservato comunque che, nel processo di produzione per interazione forte dei
mesoni strani, non vengono prodotti né il |K10 > né il |K20 >, bensı̀ viene prodotto
tipicamente un K 0 , magari insieme alla Λ o ad una Σ ... E’ quindi dell’evoluzione
dello stato di K 0 cosı̀ prodotto di cui occorre, piuttosto, occuparci !
Per sapere come esso evolve, basta in realtà applicare semplicemente i principi
primi della Meccanica Quantistica. Essa ci dice infatti che
1 ( )
|K 0 >= √ |K10 > +|K20 > (2.276)
2
dunque, in vuoto, avremo
1 ( )
|K 0 , t >= √ e−i(M +∆/2)t e−it∆/2 e−tΓ1 /2 |K10 > + eit∆/2 e−tΓ2 /2 |K20 > (2.277)
2
Questo implica che, al tempo t, le probabilità di osservare ancora un |K10 >
oppure con un |K20 > varranno, rispettivamente
1
| < K10 |K 0 , t > |2 = e−tΓ1 (2.278)
2
1
| < K2 |K , t > | = e−tΓ2
0 0 2
(2.279)
2
67
Nel caso, per esempio, del sistema π + π − , coniugazione di carica e parità equivalgono en-
trambe alla simmetria di scambio e dunque moltiplicano ciascuna la funzione d’onda dello stato
per (−1)L , per cui l’applicazione di entrambe lascia la funzione d’onda inalterata.
Nel caso di due pioni neutri, la coniugazione di carica non altera lo stato, ma la parità continua
ad equivalere allo scambio e, trattandosi di bosoni identici ...
Il contrario accade, per esempio, nel decadimento in tre π 0 che devono avere la funzione d’onda
globalmente simmetrica, da cui ne segue che, essendo la parità intrinseca del π 0 negativa, la
parità complessiva dello stato e dunque l’autovalore di CP risulterà necessariamente −1.

60
per cui, su tempi brevi, osserveremo molto frequentemente il decadimento del
|K10 > in due pioni, che procede con la vita media più breve Γ1 , mentre su
tempi lunghi, lo stato tenderà a divenire uno stato puro di |K20 > perchè la
componente |K10 > sarà nel frattempo tutta decaduta, e quindi, per tempi lunghi,
dovremo aspettarci decadimenti a tre pioni (e verso altri canali tipici del K20 ),
ma certamente non più decadimenti a due pioni !
Effettivamente in natura si osserva sia uno stato di K neutro, chiamato |KS >,
il quale decade tipicamente in due pioni (carichi o neutri) con una vita media
relativamente breve (τS = 0.895 × 10−10 s) come pure uno stato chiamato |KL >
il quale decade in tre pioni (oltre ad alcuni canali semileptonici) con una vita
media relativamente lunga (τL = 5.12 × 10−8 s).
Tutto bene, dunque ! Non esattamente ...
La novità venne con l’esperimento68 di Cronin, Christenson, Fitch e Turlay che
mostrò come il |KL > poteva decadere, in circa lo 0.2% dei casi in due pioni.
Come poteva succedere ?

Figure 4: Apparato sperimentale di Cronin et al.

J.H. Christenson, J.W. Cronin, V.L. Fitch, R. Turlay: Evidence for 2π decay of the |K20 >
68

meson, Phys. rev. Lett. 13, 138 (1964)

61
Le spiegazioni possibili richiedevano di rimettere in discussione la simmetria CP
ed erano sostanzialmente due:
• i due autostati dell’hamiltoniana |KS > e |KL > non coincidevano esat-
tamente con |K10 > e |K20 > e quindi non erano autostati di CP , ma il
decadimento rispettava questa simmetria.
E’ questo il cosiddetto meccanismo della violazione indiretta.
• CP non era rispettata nel decadimento debole: è il meccanismo della vio-
lazione diretta.
Oggi sappiamo che sono presenti entrambi i meccanismi, però quanto osservato
da Cronin e collaboratori era un effetto dovuto alla violazione indiretta.
Cerchiamo di capire che cosa questo significa e come avviene.
Ripartiamo per questo dall’hamiltoniana H che descrive l’evoluzione del sistema
|K 0 >, |K̄ 0 > in questa stessa base. Nel caso più generale possibile, essa sarà
una matrice complessa 2 × 2, i.e. della forma
( )
a b
H= (2.280)
c d
I suoi autovalori sono
[ √ ]
1
λ± = a + d ± (d − a)2 + 4bc (2.281)
2
( )
p
ed i corrispondenti autovettori sono tali che il rapporto fra le loro due
q ±
componenti è dato da
( ) √
q λ± − a d−a± (d − a)2 + 4bc
= = (2.282)
p ±
b 2b
Ricordiamo però che l’hamiltoniana deve commutare almeno con CP T , per cui69
i
a = M− Γ = d (2.285)
2
69
La simmetria CP T non implica solo che la massa M debba essere la stessa per particella
e antiparticella ma anche che le loro larghezze di decadimento Γ lo debbano essere.
Ricordiamo che, nel sistema del CM , la larghezza differenziale di decadimento di una particella
a di massa M e spin S verso uno stato finale f è data da
1 1
dΓ = |Mf a |2 dΦ (2.283)
2S + 1 2M
dove Mf a è l’elemento di matrice relativo al decadimento a → f e dΦ è lo spazio delle fasi
invariante associato allo stato finale. Nel caso di un processo di decadimento al primo ordine
(il risultato che troveremo è vero anche per decadimenti che avvengono coinvolgendo anche gli
ordini perturbativi successivi al primo, ma la dimostrazione è un po’ più complicata) si ha
Mf a = < f |L(0)|a >=< f |(CP T )−1 (CP T )L(0)(CP T )−1 (CP T )|a >=

62
Questo significa che, per la (2.281), risulta
i √
λ± = M − Γ ± bc (2.286)
2
ovvero, definendo70
√ ( )
1 i
bc ≡ ∆M + ∆Γ (2.287)
2 2
quanto agli autovalori dell’hamiltoniana si ha
( )
i 1 i
λ± = M − Γ± ∆M + ∆Γ (2.288)
2 2 2
Veniamo ora agli autovettori dell’hamiltoniana H.
Dalla (2.282) risulta adesso che
( ) √
q c
=± (2.289)
p ±
b
Nell’ipotesi in cui CP sia una simmetria conservata, come abbiamo visto la quan-
tità sotto radice vale proprio 1: poniamo allora

c
≡ −ρ eiβ (2.290)
b
dove ρ è un numero reale non negativo e β è una fase opportuna. Definiamo
quindi il seguente parametro complesso ϵ
1−ϵ 1 − ρeiβ
= ρ eiβ ⇔ ϵ ≡ (2.291)
1+ϵ 1 + ρeiβ
Da quanto precede discende allora che gli autovettori corripondenti agli autovalori
λ± sono tali che (p è un numero complesso arbitrario ...)
[ ]
1−ϵ
|± > = p |K > ∓ 0
|K̄ 0 > =
1+ϵ
p [ ]
= (1 + ϵ)|K 0 >) ∓ (1 − ϵ) |K̄ 0 >) =
1+ϵ
p [ ]
= (|K 0 > ∓|K̄ 0 >) + ϵ (|K 0 > ±|K̄ 0 >) (2.292)
1+ϵ
= < (CP T )−1 (CP T ) f |(CP T )−1 (CP T )L(0)(CP T )−1 (CP T ) a >=
= < (CP T ) f |(CP T )L(0)(CP T )−1 (CP T ) a >∗ =
= < f¯|(CP T )L(0)(CP T )−1 ā >∗ =< f¯|L(0)| ā >∗ = M∗¯ f ā (2.284)

dove si è usato il fatto che, per ipotesi, L(0) è CP T invariante.


Siccome dΓ dipende dal modulo quadro dell’elemento di matrice, sia nel caso del decadimento
della particella che dell’antiparticella si trova lo stesso valore: particella e antiparticella hanno
la stessa vita media !
70
Per definizione, la radice è scelta in modo che la sua parte reale sia positiva, i.e. ∆M > 0.
Nel caso dei mesoni K, accade che anche ∆Γ < 0.

63
ovvero, normalizzandoli, abbiamo finalmente71
1 [ ]
|+ > ≡ |KL >= √ |K20 > + ϵ |K10 > (2.294)
1 + |ϵ|2
1 [ ]
|− > ≡ |KS >= √ |K10 > + ϵ |K20 > (2.295)
1 + |ϵ|2

la quale mostra come una hamiltoniana CP T -invariante che descriva l’evoluzione


del sistema |K 0 >, |K̄ 0 > in cui, però, siano presenti termini che violano CP , può
generare un mescolamento degli stati con CP opposta e quindi può, appunto, ren-
dere conto72 , attraverso il meccanismo della violazione indiretta, dell’osservazione
fatta da Cronin e collaboratori.
71
Si osservi che gli stati |KL > e |KS >, pur essendo autostati dell’hamiltoniana, non essendo
questa hermitiana, non sono ortogonali fra loro. Si ha
1 [ ] 2ℜϵ
< KL |KS >= ϵ < K20 |K20 > +ϵ∗ < K10 |K10 > = (2.293)
1 + |ϵ|2 1 + |ϵ|2

Sul significato fisico di questa quantità, torneremo più oltre, quando tratteremo l’asimmetria
di carica nel decadimento dei KL .
72
Le due espressioni trovate del KS e del KL in termini degli autostati di CP K10 e K20
sono perfettamente simmetriche quanto al mescolamento. Come si spiega, allora, per esempio,
il fatto che il BR del decadimento KL → 2π 0 , dovuto alla componente ϵ|K10 > nel KL , vale
8.85 × 10−4 mentre quello del KS in tre π 0 , dovuto alla componente ϵ|K20 > nel KS , è cosı̀
piccolo che ne è noto solo il limite superiore, pari a 1.2 × 10−7 ?
Il punto è che la probabilità per unità di tempo che avvenga il decadimento KL → 2π 0 è data
da
|ϵ|2
ΓL × BR(KL → 2π 0 ) ∝ |M(K10 → 2π 0 )|2 (2.296)
1 + |ϵ|2

D’altronde, per l’analogo decadimento del KS sarà


1
ΓS × BR(KS → 2π 0 ) ∝ |M(K10 → 2π 0 )|2 (2.297)
1 + |ϵ|2

e dunque ne ricaviamo che


ΓS 2
BR(KL → 2π 0 ) = |ϵ| BR(KS → 2π 0 ) (2.298)
ΓL

Venendo ai numeri, secondo il P DG − 2008, risulta che τS = Γ1S = 0.8958 × 10−10 s mentre
τL = Γ1L = 5.116 × 10−8 s ed |ϵ|, nella convenzione di fase riguardo alla coniugazione di carica
C da noi scelta, vale |ϵ| = 2.229 × 10−3 .
Siccome il valore sperimentale del BR del KS in due π 0 vale BR(KS → 2π 0 ) = 0.3069 =
30.69%, la (2.298 ) implica che

5.116 × 10−8
BR(KL → 2π 0 ) = |2.229 × 10−3 |2 × 0.3069 = 0.87 × 10−3 (2.299)
0.8958 × 10−10
in perfetto accordo con i dati sperimentali.

64
La correttezza di questa spiegazione è dimostrata anche dalla asimmetria di
carica osservata nei decadimenti semileptonici del KL .
Vediamo di che si tratta.
Il mesone |K 0 > è un sistema (ds̄) e, via corrente carica, il quark s̄ può trasfor-
marsi in ū emettendo un W + che può materializzarsi in una coppia leptonica, per
esempio e+ νe . Ne discende quindi il decadimento

|K 0 >≡ |ds̄ >→ |dū > + e+ + νe ≡ π − e+ νe (2.301)

Per lo stesso motivo accade però che

|K̄ 0 >≡ |sd¯ >→ |ud¯ > + e− + ν̄e ≡ π + e− ν̄e (2.302)

Se adesso abbiamo un fascio di KL (basta mettersi abbastanza lontani dalla loro


sorgente e questo accade naturalmente ...) siccome il |K 0 > vi compare pesato
con (1 + ϵ) mentre il |K̄ 0 > vi compare pesato con (1 − ϵ), ecco che se N+ indica
il numero degli eventi di decadimento con positrone e N− quello degli eventi con
elettrone, allora questi numeri differiranno fra loro in relazione proprio al valore
di ϵ, infatti avremo
N+ − N− |1 + ϵ|2 − |1 − ϵ|2 2ℜe(ϵ)
δ≡ = = ≈ 2ℜe(ϵ) (2.303)
N+ + N− |1 + ϵ| + |1 − ϵ|
2 2 1 + |ϵ|2
Sperimentalmente il valore misurato è

δ = (3.32 ± 0.06) × 10−3 (2.304)

Non è affatto un caso che la quantità osservabile73 δ non misuri il parametro


di mixing ϵ ma la combinazione 2ℜe(ϵ)
1+|ϵ|2
.
Il punto sta nel fatto che la simmetria di coniugazione di carica C contiene, nella
sua definizione, una arbitrarietà di fase che occorre fissare.
Definendo la base (2.257) noi lo abbiamo fatto in modo
{ implicito: è}la convenzione
di fase di Wu-Yang. Però, al posto della base |K 0 >, |K̄ 0 > cosı̀ definita,
{ }
avremmo potuto equivalentemente usare la base |Kα0 >, |K̄α0 > seguente

|Kα0 > ≡ e−iα/2 |K 0 > CP |Kα0 > ≡ e−iα |K̄α0 >


⇔ (2.305)
|K̄α0 > ≡ eiα/2 |K̄ 0 > CP |K̄α0 > ≡ eiα |Kα0 >
Quanto, infine, al canale del KS in tre π 0 , ripetendo lo stesso conto di cui sopra troviamo
ΓL 2
BR(KS → 3π 0 ) = |ϵ| BR(KL → 3π 0 ) (2.300)
ΓS
e siccome ΓS /ΓL = 571, è chiaro che, pur essendo il decadimento KL → 3π 0 abbastanza
frequente (BR = 0.1952), non c’è certo da aspettarsi che il BR(KS → 3π 0 ) sia simile a
BR(KL → 2π 0 ) !
73
Si osservi che, proprio per il meccanismo che la genera, l’asimmetria di carica deve risultare
la stessa anche quando la coppia leptonica sia fatta da µ+ νµ !

65
In questa base l’hamiltoniana (2.280) assume la forma74 seguente:
( ) ( )
′ a′ b′ a b e−iα
H → H = = (2.306)
c′ d′ c eiα d

Le due descrizioni del sistema dei due mesoni K neutri devono però essere equiv-
alenti e dunque nessuna osservabile fisica deve poter essere affetta da questa
trasformazione. Però dalla definizione (2.291) risulta evidente che
√ √
c c′ 1 − ϵ′
= −ρ eiβ → = −ρei(α+β)
≡ (2.307)
b b′ 1 + ϵ′
Evidentemente, per l’arbitrarietà di α, solo il parametro ρ può avere un signifi-
cato indipendente dalla convenzione di fase e dunque solo ρ può essere legato a
quantità osservabili. In particolare accade che la violazione di CP è presente nel
sistema se e solo se ρ ̸= 1, indipendentemente dal valore della fase β.
A conferma di questa affermazione, abbiamo per esempio che il parametro δ
definito dalla (2.303), il quale misura appunto l’asimmetria di carica nel decadi-
mento dei KL , direttamente legato alla violazione indiretta, dipende da ϵ solo
attraverso ρ, essendo infatti75

2ℜe(ϵ) 1 − ρ2
= (2.310)
1 + |ϵ|2 1 + ρ2

74
Non meravigli che adesso i termini fuori diagonale siano proporzionali a fattori di fase inversi
uno dell’altro: abbiamo cambiato la definizione di C e quindi di CP per cui, per esempio, non
è più vero che i due termini debbano essere uguali se CP è conservata ...
75
Poniamo per semplicità

c 1−z 1 − z 1 + z∗ 1 − |z|2 − 2iℑm(z)
= −ρ eiβ ≡ −z ⇒ ϵ = = ∗
= ⇒
b 1+z 1+z1+z 1 + |z|2 + 2ℜe(z)
1 − ρ2
⇒ ℜe(ϵ) = (2.308)
1 + ρ2 + 2ℜe(z)

D’altronde
1 − z 1 − z∗ 1 + |z|2 − 2ℜe(z) 1 + ρ2 − 2ℜe(z)
1 + |ϵ|2 = 1+ ∗
=1+ =1+ =
1+z1+z 1 + |z| + 2ℜe(z)
2 1 + ρ2 + 2ℜe(z)
1 + ρ2
= 2 (2.309)
1 + ρ2 + 2ℜe(z)

e mettendo insieme questa relazione con la precedente (2.308), otteniamo immediatamente la


(2.310).

66
Un altro fenomeno molto interessante che vale la pena di ricordare riguarda
la cosiddetta oscillazione di stranezza.
Supponiamo che al tempo t = 0 sia stato formato uno stato di |K0 > (di |K̄ 0 >):
ci domandiamo quale sia la probabilità che al tempo t esso sia trovato (per esempio
attraverso un decadimento semileptonico) in uno stato di |K̄ 0 > (|K0 >).

Trattiamo senz’altro il problema nella convenzione di fase di Wu-Yang, dove


risulta
1 [ ]
|+ > ≡ |KL >= √ |K20 > + ϵ |K10 > =
1 + |ϵ|2
1 1 [( ) ( )]
= √ √ |K0 > −|K̄ 0 > + ϵ |K0 > +|K̄ 0 > =
2 1 + |ϵ|2
1 1 [ ]
= √ √ (1 + ϵ)|K0 > −(1 − ϵ)|K̄ 0 > (2.311)
2 1 + |ϵ|2

e analogamente
1 [ ]
|− > ≡ |KS >= √ |K10 > + ϵ |K20 > =
1 + |ϵ|2
1 1 [( ) ( )]
= √ √ |K0 > +|K̄ 0 > + ϵ |K0 > −|K̄ 0 > =
2 1 + |ϵ|2
1 1 [ ]
= √ √ (1 + ϵ)|K0 > +(1 − ϵ)|K̄ 0 > (2.312)
2 1 + |ϵ|2

per cui abbiamo che



1 + |ϵ|2
|K0 > = √ (|KS > + |KL >) (2.313)
2(1 + ϵ)

1 + |ϵ|2
|K̄ 0 > = √ (|KS > − |KL >) (2.314)
2(1 + ϵ)

Evidentemente, allora

1 + |ϵ|2
|K0 , t > = √ (|KL , t > + |KS , t >) (2.315)
2(1 + ϵ)

67
Ma gli stati |KL > e |KS > sono, per definizione, autostati dell’hamiltoniana
per gli autovalori λ± di cui alla (2.288), quindi

|KL , t > = e−i[M − 2 Γ+ 2 (∆M + 2 ∆Γ)]t |KL >= e−i[M + 2 ∆M )]t e−[Γ− 2 ∆Γ)]t/2 |KL >≡
i 1 i 1 1

≡ a(t) |KL > (2.316)

|KS , t > = e−i[M − 2 Γ− 2 (∆M + 2 ∆Γ)]t |KS >= e−i[M − 2 ∆M )]t e−[Γ+ 2 ∆Γ)]t/2 |KS >≡
i 1 i 1 1

≡ b(t) |KS > (2.317)

dove abbiamo posto, per comodità

a(t) = e−i[M + 2 ∆M )]t e−[Γ− 2 ∆Γ)]t/2


1 1
(2.318)
−i[M − 21 ∆M )]t −[Γ+ 12 ∆Γ)]t/2
b(t) = e e (2.319)

Ne segue allora che la probabilità cercata vale

1 + |ϵ|2 2

| < K̄ 0 |K0 , t > |2 = a(t) < K̄ 0 |KL > + b(t) < K̄ 0 |KS > =
2|1 + ϵ|2
1 + |ϵ|2 {
= |a(t)|2 | < K̄ 0 |KL > |2 + |b(t)|2 | < K̄ 0 |KS > |2 +
2|1 + ϵ|2
( )}
+ 2ℜe a(t)b(t)∗ < K̄ 0 |KL >< K̄ 0 |KS >∗ (2.320)

ovvero, usando il fatto che risulta

| < K̄ 0 |KS > |2 = | < K̄ 0 |KL > |2 = − < K̄ 0 |KS >< K̄ 0 |KL >∗ =

1 − ϵ 2

= (2.321)
2(1 + |ϵ| )
2

e che, posto ΓL = Γ − ∆Γ/2 e ΓS = Γ + ∆Γ/2, risulta

|a(t)|2 = e−t ΓL ; |b(t)|2 = e−t ΓS ; a(t)b(t)∗ = e−t (ΓS +ΓL )/2 e−i∆M t (2.322)

per cui abbiamo infine che



1 − ϵ 2 [ ]

| < K̄ |K0 , t > |
0 2
= e−t ΓS + e−t ΓL − 2 e−t (ΓS +ΓL )/2 cos(∆M t) =
2(1 + ϵ)
ρ2 [ −t ΓS ]
= e + e−t ΓL − 2 e−t (ΓS +ΓL )/2 cos(∆M t) (2.323)
4

68
Se adesso ripetiamo il calcolo per il caso inverso, otteniamo invece
1 [ −t ΓS −t ΓL −t (ΓS +ΓL )/2
]
| < K 0 |K̄ 0 , t > |2 = e + e − 2 e cos(∆M t) (2.324)
4ρ2
la quale mostra che le due probabilità di oscillazione non coincidono quando
ρ ̸= 1, ovvero se CP è violata !

Per concludere l’argomento, nel 2002 è stato infine dimostrato76 sperimental-


mente che, oltre al meccanismo indiretto descritto sopra, nel decadimento dei K
neutri in due pioni, è presente anche un contributo di violazione diretta legata
all’interazione debole, come previsto dal M S attraverso la fase complessa nella
matrice di mixing dei quarks.

76
NA48 Collaboration: A precision measurement of direct CP violation in the decay of neutral
kaons into two pions, Phys. Lett. 544B, 97, (2002)

69
2.3 La seconda quantizzazione
Affrontiamo adesso il problema della quantizzazione dei campi.

2.3.1 Il campo scalare libero


L’evoluzione libera del campo77 scalare78 carico di massa m, come sappiamo, è
retta dalla lagrangiana

L = (∂µ ϕ)(∂ µ ϕ† ) − m2 ϕ ϕ† (2.329)

da cui ricaviamo appunto l’equazione di Klein-Gordon sia per ϕ che per ϕ† (con-
siderati indipendenti)

2ϕ + m2 ϕ = 0; 2ϕ† + m2 ϕ† = 0; (2.330)

Per effettuarne la quantizzazione, il campo scalare (complesso) ϕ(x) viene


espanso in termini di operatori di creazione/distruzione di singola particella79 nel
modo seguente:

d3 p
ϕ(x) = {a(⃗p) e−ipx + b† (⃗p) eipx } (2.333)
2Ep (2π)3
77
Ricordiamo di nuovo che in Teoria Quantistica dei Campi (QF T ), i campi non sono più
delle funzioni, bensı̀ sono operatori che agiscono nello spazio di Hilbert degli stati del sistema.
78
Per un campo scalare, la legge di trasformazione sotto il gruppo di Poincaré è la seguente

(a, Λ) : x → x′ = a + Λx (2.325)
′ ′
ϕ(x) → ϕ (x ) = ϕ(x) (2.326)

e l’azione sul campo scalare ϕ degli operatori U (a, Λ) della rappresentazione unitaria del gruppo
di Poincaré definita sullo spazio di Hilbert degli stati del sistema è, per definizione, la seguente

U −1 (a, Λ) ϕ(x) U (a, Λ) = ϕ′ (x) ≡ ϕ(Λ−1 (x − a)) (2.327)

dove la seconda uguaglianza discende dalla (2.326).


Equivalentemente risulta

U (a, Λ) ϕ(x) U −1 (a, Λ) = ϕ(Λx + a) (2.328)

Si noti che, mentre la (2.328) descrive l’effetto della trasformazione quando la si pensi effettuata
sul sistema di riferimento (trasformazione passiva), la (2.326), equivalente alla (2.327), descrive
la corrispondente trasformazione sul campo (trasformazione attiva).
79
Coerentemente con la (2.327) e la (2.328), l’azione degli operatori unitari U (a, Λ) sugli
operatori di creazione e distruzione a(⃗ p), a† (⃗ p) e b† (⃗
p), b(⃗ p) è la seguente:

U −1 (a, Λ) c(⃗ ⃗ p);


p) U (a, Λ) = eia·p c(Λ−1 p) U −1 (a, Λ) = e−ia·Λp c(Λp)
U (a, Λ) c(⃗ ⃗ (2.331)
U −1 (a, Λ) c† (⃗
p) U (a, Λ) = e−ia·p c† (Λ−1
⃗ p); U (a, Λ) c† (⃗
p) U −1 (a, Λ) = eia·Λp c† (Λp)
⃗ (2.332)

dove c sta per a oppure b e analogamente


√ c† per a† o b† , mentre Λp ⃗ indica concisamente la
parte spaziale del quadrivettore Λ( m2 + |⃗
p|2 , p⃗), essendo m la massa del campo.

70
da cui

† d3 p
ϕ (x) = {b(⃗p) e−ipx + a† (⃗p) eipx } (2.334)
2Ep (2π)3
dove

• p è il quadrimpulso della particella/antiparticella: p ≡ (Ep , p⃗) ≡ ( m2 + |⃗p|2 , p⃗);

• a(⃗p) annichila la particella di quadrimpulso (Ep , p⃗);


• a† (⃗p) crea la particella di quadrimpulso (Ep , p⃗);
• b(⃗p) annichila l’antiparticella di quadrimpulso (Ep , p⃗);
• b† (⃗p) crea l’antiparticella di quadrimpulso (Ep , p⃗);
ed questi operatori80 soddisfano le seguenti regole di commutazione che, come
vedremo, garantiscono il rispetto delle regole di commutazione canoniche quando
si considerino i campi stessi, appunto, come variabili lagrangiane generalizzate
(tutte le altre coppie di operatori commutano fra loro ...)

[a(⃗p), a† (p⃗′ )] = [b(⃗p), a† (p⃗′ )] = 2 Ep (2π 3 ) δ 3 (⃗p − p⃗′ ) (2.335)

Naturalmente, essendo gli operatori ϕ e ϕ† soluzioni di una equazione differen-


ziale lineare e omogenea (l’equazione di Klein-Gordon), essi sono evidentemente
indeterminati a meno di una costante moltiplicativa.
La scelta fatta attraverso lo (2.335) è quella per cui la funzione d’onda ψq⃗(x)
associata
√ allo stato81 |⃗q >≡ a† (⃗q)|Ω >, autostato del quadrimpulso per l’autovalore
( m2 + |⃗q|2 , ⃗q), è semplicemente un’onda piana, i.e.

ψq⃗(⃗x, t) = e−iqx ≡ e−i(Et−⃗q·⃗x) = e−iEt ei⃗q·⃗x (2.336)

A priori, per il solo fatto che, per definizione dell’operatore di creazione, a† (⃗q)|Ω >
è autostato del quadrimpulso, ne segue solo che la funzione d’onda ψq⃗(x) sarà tale
che ψ⃗q(x) = Kq⃗ e−iqx .
La costante K è definita proprio dal fatto che

< p⃗|⃗q > = < Ω|a(⃗p) a† (⃗q)|Ω >=< Ω|[a(⃗p), a† (⃗q)]|Ω >= 2Ep (2π)3 δ 3 (⃗p − ⃗q)

la quale implica dunque che sia

< ψp⃗ |ψq⃗ >= 2Ep (2π)3 δ 3 (⃗p − ⃗q) (2.337)


80
Si noti che gli operatori di creazione/annichilazione
√ si riferiscono sempre a particelle o
antiparticelle aventi energia Ep = m2 + |⃗ p|2 positiva !
81
Indicheremo qui e nel seguito con |Ω > lo stato di vuoto, i.e. lo stato di minima ener-
gia del sistema considerato: assumeremo inoltre che esso sia non degenere e invariante per
trasformazioni del gruppo di Poincaré, nonché sotto C, P , e T .

71
D’altronde, ricordiamo82 che se ψ1 (x) e ψ2 (x) sono due funzioni d’onda soluzioni
82
La funzione d’onda ψ̂(⃗ p) che in rappresentazione dell’impulso è associata ad un generico
stato di singola particella |ψ > (per l’antiparticella vale un discorso del tutto analogo con a ↔ b,
ovvero ϕ ↔ ϕ† ), per definizione, è tale che
∫ ∫
d3 p d3 p
|ψ >≡ ψ̂(⃗
p) |⃗
p >= p) a† (⃗
ψ̂(⃗ p)|Ω > (2.338)
2Ep (2π)3 2Ep (2π)3

da cui discende, evidentemente, che il prodotto scalare dei due stati generici |ψ1 > e |ψ2 > è
dato da (si ricordi che< ⃗q|⃗ p − ⃗q))
p >= (2π)3 2Eq δ 3 (⃗
∫ ∫
d3 p d3 p
< ψ1 |ψ2 >= d3 q 2Eq (2π)3 ψ̂1∗ (⃗q) ψ̂2 (⃗
p) < ⃗q|⃗
p >= ψ̂ ∗ (⃗
p) ψ̂2 (⃗
p) (2.339)
2Ep (2π)3 2Ep (2π)3 1

Poiché per quanto visto precedentemente la funzione d’onda che descrive, in rappresentazione
p >≡ a† (⃗
delle coordinate, lo stato |⃗ p)|Ω > è semplicemente l’esponenziale e−ipx , ecco che allo
stato |ψ > possiamo associare, in rappresentazione delle coordinate, la funzione d’onda

d3 p
ψ(x) = p) e−ipx
ψ̂(⃗ (2.340)
2Ep (2π)3

la quale soddisfa, ovviamente, l’equazione di Klein-Gordon relativa alla massa m.


E’ immediato allora che risulta

ψ(x) =< Ω|ϕ(x)|ψ > (2.341)

infatti

d3 p d3 q
< Ω|ϕ(x)|ψ > = p) e−ipx b† (⃗
< Ω|{a(⃗ p) eipx }a† (⃗q)|Ω > ψ̂(⃗q) =
2Ep (2π)3 2Eq (2π)3

d3 p
= e−ipx ψ̂(⃗
p) (2.342)
2E(2π)3

Questo è coerente con il fatto che lo stato ϕ† (x)|Ω > di cui < Ω|ϕ(x) è il bra, è uno stato di
singola particella autostato della posizione per l’autovalore x, infatti risulta evidentemente che

d3 p
ϕ† (x)|Ω >= eipx |⃗
p >≡ |x > (2.343)
2E(2π)3

ma in rappresentazione dell’impulso l’operatore di quadriposizione X µ è rappresentato da


X µ = −i ∂p∂µ , cosı̀ come in rappresentazione delle coordinate l’operatore di quadriimpulso è
rappresentato da P µ = i ∂x∂ µ , per cui è immediato che

† ∂ d3 p
X ϕ (x)|Ω >= −i
µ
p >= xµ ϕ† (x)|Ω >
eipx |⃗ (2.344)
∂pµ 2E(2π)3

Quanto infine alla normalizzazione di questi autostati della posizione, abbiamo



d3 p
< y|x >=< Ω|ϕ(y)ϕd ag(x)|Ω >= eip(y−x) ≡ ∆+ (y − x) (2.345)
2E(2π)3

dove la funzione impropria ∆+ (x) verrà descritta più diffusamente in seguito.

72
dell’equazione di Klein-Gordon, allora il loro prodotto scalare83 è il seguente
∫ [ ]
< ψ1 |ψ2 >= i d3 x ψ1∗ (∂ 0 ψ2 ) − (∂ 0 ψ1∗ )ψ2 (2.351)

dove le due funzioni sono valutate allo stesso tempo t.


83
L’espressione (2.351) non è, a stretto rigore, un prodotto scalare nel senso solito di questo
termine in Meccanica Quantistica perché su due generiche soluzioni dell’equazione di Klein-
Gordon non è, in generale, definito positivo. La struttura di questo prodotto nasce dal fatto
che se ψ1 (x) e ψ2 (x) sono soluzioni dell’equazione di Klein-Gordon, allora l’unica corrente
conservata antilineare in ψ1 e lineare in ψ2 (ovvero sequilineare in ψ1 , ψ2 ...) risulta essere
proporzionale a

J µ (x) = i [ψ1∗ (x)(∂ µ ψ2 (x)) − (∂ µ ψ1 (x))∗ ψ2 (x)] (2.346)

da cui ne segue che


∫ ∫
[ ]
d3 x J 0 (t, ⃗x) = i d3 x ψ1∗ (∂ 0 ψ2 ) − (∂ 0 ψ1∗ )ψ2 (2.347)

è certamente indipendente dal tempo e dunque rappresenta l’unica generalizzazione possibile


(a meno di costanti moltiplicative) del prodotto scalare che non sia in conflitto con la dinamica.
Ricordiamo di nuovo che la struttura (2.346) della corrente J µ (x) origina ancora una volta
dal teorema di Noëther: se ψ1∗ e ψ2 soddisfano entrambe l’equazione di Klein-Gordon, allora le
loro equazioni del moto possono essere ottenute dalla densità lagrangiana (anche se sui generis
perché non reale ...)

L(x) = (∂ µ ψ1∗ ) (∂µ ψ2 ) − m2 ψ1∗ ψ2 (2.348)

la quale è invariante in forma per trasformazioni di gauge di prima specie, cioè sotto il gruppo
U )1), da cui segue, via teorema di Noëther, la conservazione, appunto, della corrente
[ ]
∂L ∗ ∂L
µ
J (x) = i ψ − ψ2 (2.349)
∂(∂µ ψ1∗ ) 1 ∂(∂µ ψ2 )

Venendo, comunque, al caso di due generici stati di singola particella o di singola antiparticella,
il prodotto scalare in questione è definito positivo, e, in accordo con la (2.339), risulta pari a

[ ]
< ψ1 |ψ2 >= i d3 x ψ1∗ (⃗x, t)(∂ 0 ψ2 (⃗x, t)) − (∂ 0 ψ1∗ (⃗x, t))ψ2 (⃗x, t) =
∫ [ ( ) ( ) ]
d3 p d3 q ∗ −iqx ∗ −iqx
= i d3 x ψ̂ 1 (⃗
p )e ipx
∂ 0
ψ̂ 2 (⃗
q )e − ∂ 0
ψ̂ 1 (⃗
p )e ipx
ψ̂ 2 (⃗q )e =
2Ep (2π)3 2Eq (2π)3
∫ [ ]
d3 p d3 q 0 ∗ −iqx 0 ∗ −iqx
= d3 x q ψ̂ 1 (⃗
p)e ipx
ψ̂2 (⃗q )e + p ψ̂ 1 (⃗p )e ipx
ψ̂ 2 (⃗
q )e =
2Ep (2π)3 2Eq (2π)3
∫ [ ]
d3 p d3 q
= d3 xe−i⃗x·(⃗p−⃗q) e −it(q 0 −p0 )
q 0 ∗
ψ̂ 1 (⃗
p ) ψ̂ 2 (⃗
q ) + p 0 ∗
ψ̂ 1 (⃗p) ψ̂ 2 (⃗q ) =
2Ep (2π)3 2Eq (2π)3
∫ [ ]
d3 p d3 q −it(q 0 −p0 ) 0 ∗ 0 ∗
= p − ⃗q)
(2π)3 δ 3 (⃗ e q ψ̂ 1 (⃗p) ψ̂ 2 (⃗q ) + p ψ̂ 1 (⃗
p ) ψ̂ 2 (⃗
q ) =
2Ep (2π)3 2Eq (2π)3

d3 p
= ψ̂ ∗ (⃗
p) ψ̂2 (⃗
p) (2.350)
2Ep (2π)3 1

73
Nel caso in esame, abbiamo dunque
∫ [ ]
< ψp⃗ |ψq⃗ > = i Kp⃗∗ K q⃗ d3 x eipx (−iq 0 ) e−iqx − ip0 eipx e−iqx =

Kp⃗∗ K q⃗ d3 x(q 0 + p0 )eix(p−q) = Kp⃗∗ K q⃗(q 0 + p0 ) eit(p
0 −q 0 )
= (2π)3 δ 3 (⃗p − ⃗q) =
= |Kp⃗ |2 2Ep (2π)3 δ 3 (⃗p − ⃗q)

ed il confronto con la (2.337) impone appunto che, indipendentemente da p⃗ , sia


|K|2 = 1, ovvero84 K = 1.

Vogliamo notare infine che, siccome la densità di corrente85 di probabilità


associata alla generica funzione d’onda ψ che soddisfa l’equazione di Klein-Gordon
è data da

j µ (x) = i [ψ ∗ (∂ µ ψ) − (∂ µ ψ ∗ )ψ] (2.353)

la funzione d’onda ψp⃗ (x) = e−ipx rappresenta uno stato con densità di particelle
pari a
[ ]
ρ(x) = J 0 (x) = i ψ ∗ (∂ 0 ψ) − (∂ 0 ψ ∗ )ψ = 2E (2.354)

Concludendo, dunque, possiamo dire che la normalizzazione scelta è tale per


cui gli stati di particella singola a+ (⃗q)|Ω > descrivono stati con 2E particelle per
unità di volume. Questo risultato, come vedremo, ci ritornerà utile in seguito,
quando tratteremo il problema dello spazio delle fasi, nell’ambito della teoria
dello scattering.

Veniamo infine alla questione dei commutatori dei campi.


Sulla base dell’analogia classica secondo cui, fissato comunque un tempo t, il
campo ϕ(⃗x; t) costituisce una generalizzazione del concetto di coordinata la-
grangiana, ci aspettiamo che risulti
[ ]
[ϕ(⃗x; t), ϕ(⃗y ; t)] = 0 ⇒ ϕ† (⃗x; t), ϕ† (⃗y ; t) = 0 (2.355)
[ ]
Ma che dire del commutatore ϕ(⃗x; t), ϕ† (⃗y ; t) ?
84
Si noti che |K|2 = 1 impone solo che K abbia modulo unitario e dunque sia una fase che
può essere semplicemente riassorbita nella definizione della base.
85
Come abbiamo visto in precedenza, parlando del teorema di Noëther, se la lagrangiana è
invariante in forma sotto il gruppo U (1) delle trasformazioni di gauge di prima specie x → x,
ψ → eiα ψ, ψ † → e−iα ψ † allora la corrente conservata che ne deriva è la seguente (cfr. (2.11))
[ ]
∂L ∂L ∗
J µ (x) = i − ψ+ ψ (2.352)
∂(∂µ ψ) ∂(∂µ ψ ∗ )

74
Questo non può essere altrettanto semplice, infatti, proprio per l’analogia
classica secondo cui il momento coniugato alla variabile lagrangiana q è
∂L
p≡
∂ q̇
ne segue che il ”momento coniugato” al campo ϕ(⃗x, t) sarà il campo
∂L
π(⃗x, t) = = ∂t ϕ† (⃗x, t) (2.356)
∂(∂t ϕ)
e, analogamente, quello coniugato al campo ϕ† (⃗x, t) risulta essere
∂L
π † (⃗x, t) = = ∂t ϕ(⃗x, t) (2.357)
∂(∂t ϕ† )
Quindi, proprio per l’analogia con la Meccanica Quantistica di prima quantiz-
zazione, per cui (h̄ = 1) risulta
[p, x] = −i (2.358)
dobbiamo adesso aspettarci86 che valga la ovvia generalizzazione al caso continuo
della (2.358), i.e.
[π(⃗y , t), ϕ(⃗x, t)] = −i δ 3 (⃗y − ⃗x)
[ ]
⇒ ϕ(⃗x, t), ∂t ϕ† (⃗y , t) = i δ 3 (⃗x − ⃗y ) (2.359)
e, analogamente, quindi, che sia
[ ]
ϕ† (⃗x, t), ∂t ϕ(⃗y , t) = i δ 3 (⃗x − ⃗y ) (2.360)
Questo è, in effetti, esattamente quanto accade usando le regole di commu-
tazione (2.335) fissate per gli operatori di creazione e distruzione. Infatti si ha
[ ]
ϕ(⃗x, t), ∂t ϕ† (⃗y , t) =
[∫ ∫ ]
d3 p −ipx † d3 q
= 3
{a(⃗p)e + b (⃗p)e } , ∂t
ipx
3
{b(⃗q)e−iqy + a† (⃗q)eiqy } =
2Ep (2π) 2Eq (2π) t=x0 =y 0
∫ { [ ] [ ] }
d3 p d3 q † −ipx iqy † ipx −iqy
= iq 0
a(⃗
p), a (⃗
q ) e e − iq 0
b (⃗
p), b(⃗ q ) e e =
2Ep (2π)3 2Eq (2π)3 t=x0 =y 0
∫ { [ ]}
d3 p d3 q p·⃗
x−⃗
q ·⃗ −i(⃗p·⃗
x−⃗q ·⃗
= iE q 2E q (2π) 3 3
δ (⃗p − ⃗
q ) ei(⃗ y)
+ e y)
2Ep 2Eq (2π)6
dove si è usata la definizione (2.335) unitamente al fatto che
86
E’ importante notare che, in base all’analogia con la M Q di prima quantizzazione, le regole
di commutazione possono essere definite solo a tempi uguali. Una volta che queste siano state
assegnate (proprietà cinematica), le regole di commutazione a tempi diversi sono determinate
dall’evoluzione del sistema nel tempo, cioè dalla sua dinamica, ovvero dalle soluzioni esplicite
dell’equazione del moto.

75
• abbiamo posto per definizione px ≡ p0 x0 − p⃗ · ⃗x
• risulta x0 = y 0 = t,
• ed è q 0 ≡ Eq
per cui, visto che per la presenza nell’integrale della funzione delta proveniente
dal commutatore, è Ep = Eq , si può evidentemente assumere che
p0 x0 − q 0 y 0 = t(p0 − q 0 ) = 0
Ne segue quindi che il commutatore in studio, integrando la delta, vale
[ ] ∫ { }
† d3 p p·(⃗
i⃗ x−⃗
y) −i⃗
p·(⃗
x−⃗
y)
ϕ(⃗x, t), ∂t ϕ (⃗y , t) = iE p e + e (2.361)
2Ep (2π)3
Ma ∫ ∫
p·(⃗
x−⃗
dp e3 i⃗ y)
= (2π) δ(⃗x − ⃗y ) =
3
d3 p e−i⃗p·(⃗x−⃗y)
quindi esso, alla fine, risulta pari a
[ ]
ϕ(⃗x, t), ∂t ϕ† (⃗y , t) = i δ 3 (⃗x − ⃗y ) (2.362)
che è quanto ci attendevamo in base all’analogia con la prima quantizzazione.
Lo stesso accade, ovviamente, anche per il commutatore [ϕ† , ∂t ϕ] per il quale
risulta ancora
[ ]
ϕ† (⃗x, t), ∂t ϕ(⃗y , t) = i δ 3 (⃗x − ⃗y ) (2.363)
Questo dimostra quindi che le regole di commutazione fissate per gli operatori di
creazione e distruzione (2.335) sono esattamente quelle in grado di riprodurre le
regole di commutazione che debbono valere, a tempi uguali, fra i campi ed i loro
momenti coniugati.
Ovviamente, poi le regole di commutazione (2.335) consentono di determinare le
regole di commutazione fra i campi stessi ed in generale87 risulta
[ ]
ϕ(x), ϕ† (y) =
[∫ ]
d3 p { } ∫ d3 q { }
−ipx † ipx −iqy † iqy
= a(⃗p)e + b (⃗
p)e , b(⃗
q )e + a (⃗
q )e =
2Ep (2π)3 2Eq (2π)3
∫ {[ ] [ ] }
d3 p d3 q † −ipx iqy † ipx −iqy
= a(⃗
p ), a (⃗
q ) e e + b (⃗
p), b(⃗q ) e e =
2Ep (2π)3 2Eq (2π)3
∫ { }
d3 p d3 q −ipx iqy ipx −iqy
= 2E p (2π) 3 3
δ (⃗
p − ⃗
q )e e − 2E p (2π) 3 3
δ (⃗
p − ⃗
q )e e
2Ep (2π)3 2Eq (2π)3
87
Evidentemente dalle regole di commutazione (2.335) segue immediatamente che
[ϕ(x), ϕ(y)] = [ϕ† (x), ϕ† (y)] = 0

76

Integrando in d3 p, dato che quando p⃗ = ⃗q anche p0 = q 0 = Ep = Eq ≡ m2 + |⃗q|2 ,
abbiamo
[ ] ∫ [ ]
d3 q
ϕ(x), ϕ† (y) = e −iq(x−y)
− e iq(x−y)
≡ ∆+ (x − y) + ∆− (x − y) (2.364)
2Eq (2π)3

dove le funzioni improprie ∆+ e ∆− sono cosı̀ definite88



d3 q
∆ (x − y) ≡
+
e−iq(x−y) (2.367)
2Eq (2π)3

d3 q
∆− (x − y) ≡ − eiq(x−y) (2.368)
2Eq (2π)3

L’integrale (2.364), usando il fatto che

d3 q
= d4 q δ(q 2 − m2 ) Θ(q 0 ) (2.369)
2Eq

può essere anche riscritto nel modo seguente


[ ] ∫
† 1
ϕ(x), ϕ (y) = d4 q δ(q 2 − m2 ) Θ(q 0 ) e−iq(x−y) −
(2π)3
1 ∫ 4
− 3
d q δ(q 2 − m2 ) Θ(q 0 ) eiq(x−y) (2.370)
(2π)

ovvero, con la sostituzione q → −q nel secondo integrale, finalmente otteniamo


[ ] 1 ∫ 4 [ ]
ϕ(x), ϕ† (y) = d q δ(q 2
− m 2
) e−iq(x−y)
Θ(q 0
) − Θ(−q 0
) =
(2π)3
≡ i ∆(x − y; m) (2.371)

dove si è fatto uso della definizione della funzione impropria


i ∫ 4 −iq(x−y)
[ ]
∆(x − y; m) ≡ − d q δ(q 2
− m 2
) e Θ(q 0
) − Θ(−q 0
) (2.372)
(2π)3

88
Le notazioni sono quelle usate anche nel libro Relativistic Quantum Fields di J.D. Bjorkeen
e S.D. Drell. Si osservi che dalle definizioni (2.367) e (2.368) segue, in particolare, che

∆± (x) = −∆∓ (−x) (2.365)


[ ± ]∗
∆ (x) = −∆∓ (x) (2.366)

77
La funzione ∆, definita dalla (2.372)

• soddisfa l’equazione di Klein-Gordon89


( )
2 + m2 ∆(x; m) = 0 (2.373)

• è tale per cui90

∂t ∆(⃗x, t; m)|t=0 = −δ(⃗x) (2.375)

• è reale91

• è dispari92

• è manifestamente scalare93 sotto il gruppo di Lorentz.


89
Infatti abbiamo
( ) ( )
2 + m2 ∆(x; m) = −i 2 + m2 [ϕ(x), ϕ† (0)] = 0
( )
essendo 2 + m2 ϕ(x) = 0.
90
Infatti risulta
[ ] [ ]
∂t ∆(⃗x, t; m)|t=0 = −i∂t ϕ(x), ϕ† (0) t=0 = −i ∂t ϕ(x)|t=0 , ϕ† (0) =
[ ]
= −i Π† (⃗x, 0), ϕ† (⃗0, 0) = −i [−iδ(⃗x)] = −δ(⃗x) (2.374)

dove abbiamo usato il fatto che


∂L
Π† (x) ≡ = ϕ̇(x)
∂ ϕ̇†
e che, a tempi uguali, risulta appunto, come abbiamo visto, che

[Π(⃗x, t), ϕ(⃗y , t)] = −iδ(⃗x − ⃗y )

91
Infatti, essendo i∆(x) ≡ ∆+ (x) + ∆− (x) abbiamo che
∗ ( )∗ ( )∗
[i∆(x)] = −i∆∗ (x) = ∆+ (x) + ∆− (x) = −∆− (x) − ∆+ (x) = −i∆(x) ⇒ ∆∗ (x) = ∆(x)

92
Infatti

i∆(−x) = ∆+ (−x) + ∆− (−x) = −∆− (x) − ∆+ (x) = −i∆(x) ⇒ ∆(−x) = −∆(x)

93
La struttura della funzione, cosı̀ come risulta dalla (2.372), non lascia dubbi in proposito:
l’elemento di volume è invariante e la funzione integranda è scalare perché le funzioni Θ(±q 0 )
sono entrambe costanti su ciascuno dei due iperboloidi definiti dalla condizione di massa espressa
dalla equazione p2 −m2 = 0, in quanto il segno della componente temporale di un quadrivettore
time-like, come sappiamo, è invariante sotto trasformazioni del gruppo di Lorentz ortocrono
proprio.

78
Si noti che dalla sua natura dispari e dal fatto che è scalare sotto il gruppo
di Lorentz, ne segue che la funzione ∆ è nulla se x è un quadrivettore space-
like, potendo x essere cambiato di segno con una opportuna trasformazione
di Lorentz. Questo implica che il commutatore [ϕ(x), ϕ† (y)] è nullo quando il
quadrivettore x − y è space-like, ovvero quando non è possibile connettere x con
y in modo causale e quindi, in particolare, per esempio, quando x0 = y 0 , i.e.
∆(⃗x, 0; m) = 0 .
Questo risultato era comunque da attenderselo perché, se vogliamo coerenza con
la relatività ristretta, variabili non causalmente correlabili non possono influen-
zarsi a vicenda e dunque non possono che commutare fra loro !
La funzione ∆(x) ≡ ∆(x; m), o funzioni ad essa collegate, si ritrovano in ogni
teoria di campo perché, alla fine, ognuna di queste teorie tratta di particelle con
massa definita e dunque che soddisfano anche l’equazione doi Klein-Gordon con
massa opportuna.
Vediamo dunque di studiarne meglio le proprietà e le caratteristiche.
Osserviamo che, evidentemente, essendo il commutatore (2.371) un c-numero
(una funzione a valori complessi ...), risulta
[ ]
< Ω| ϕ(x), ϕ† (y) |Ω >= i ∆(x − y) = ∆+ (x − y) + ∆− (x − y) (2.376)

Vediamo adesso un po’ meglio qual è il significato fisico dei due termini ∆+ e ∆− .
Consideriamo per questo le quantità seguenti

< Ω|ϕ(x), ϕ† (y)|Ω > e < Ω|ϕ(y)† , ϕ(x)|Ω > (2.377)

Si ha che94
∫ ∫
d3 p d3 p
ϕ† (y)|Ω >= a †
(⃗
p)|Ω > e ipy
≡ eipy |p > (2.378)
(2π)3 2Ep (2π)3 2Ep
dove |p > è lo stato di singola particella di quadriimpulso p.
Evidentemente, passando al bra, si ha altresı̀ che

d3 q
< Ω|ϕ(x) = e−iqx < q| (2.379)
(2π)3 2Eq
per cui abbiamo

d3 p d3 q
< Ω|ϕ(x)ϕ† (y)|Ω >= eipy e−iqx < q|p >=
(2π)3 2Ep (2π)3 2Eq

d3 p d3 q
= 3 3
eipy e−iqx (2π)3 2Eq δ(⃗q − p⃗) =
(2π) 2Ep (2π) 2Eq

d3 p
= e−ip(x−y) ≡ ∆+ (x − y) (2.380)
(2π)3 2Ep
94
autovalore della posizione ....

79
Per quanto riguarda l’altro termine, cioè < Ω|ϕ(y)† , ϕ(x)|Ω >, ripartiamo dal
fatto che
∫ ∫
d3 p † d3 p
ϕ(x)|Ω >= b (⃗
p)|Ω > eipx
≡ eipx |p > (2.381)
(2π)3 2Ep (2π)3 2Ep

dove però, stavolta, |p > è lo stato di singola antiparticella di quadriimpulso p.


Ripetendo il conto fatto sopra, abbiamo che

d3 p d3 q
< Ω|ϕd ag(y)ϕ(x)|Ω >= eipx e−iqy < q|p >=
(2π)3 2Ep (2π)3 2Eq

d3 p
= eip(x−y) ≡ −∆− (x − y) (2.382)
(2π)3 2Ep

Ecco dunque il senso delle funzioni improprie ∆± : sono i valori di aspettazione sul
vuoto delle forme bilineari nei campi ϕ(x)ϕ† (y) e ϕd ag(y)ϕ(x), rispettivamente.
Un altro modo interessante di rappresentare sia la ∆ che le funzioni ∆± passa
attraverso la definizione seguente

1 ∫ 4 eiqx
ˆ
∆(x) ≡ d q (2.383)
(2π)4 C q 2 − m2

dove Eq è definita, al solito, come Eq ≡ |⃗q|2 + m2 mentre C è un cammino di
integrazione che è chiuso nel piano complesso q0 , contiene entrambi i poli della
funzione integranda q0 = ±Eq ed è percorso in senso antiorario (vedi Fig. 5).

ˆ
Figure 5: Cammino di integrazione relativo alla funzione ∆

80
Abbiamo dunque

ˆ 1 ∫ 4 eiqx 1 ∫ 3 −i⃗q·⃗x ∫ 0 eiq0 t


∆(x) = d q = d qe dq =
(2π)4 C q 2 − m2 (2π)4 C q02 − Eq2
[ ]
1 ∫ 3 −i⃗q·⃗x eiEq t e−iEq t
= d qe (2π i) + =
(2π)4 2Eq −2Eq
i ∫ d3 q ( iqx −iqx
)
= e − e = −i∆+ (x) − i∆− (x) =
(2π)3 2Eq
= −i(∆+ (x) + ∆− (x)) = ∆(x) (2.384)

dove nel secondo addendo dell’integrale presente nel penultimo rigo abbiamo ef-
fettuato la sostituzione ⃗q → −⃗q.
ˆ
Dunque la funzione ∆(x) definita dalla (2.383 ) è semplicemente un altro modo
di rappresentare la funzione ∆ stessa. Questa rappresentazione, a sua volta, ci
consente di reinterpretare le funzioni ∆± , infatti abbiamo evidentemente che

1 ∫ 4 eiqx
ˆ
∆(x) ≡ dq 2 = −i(∆+ + ∆− ) ⇒
4
(2π) C q −m 2

− i ∫ 4 eiqx
⇒ ∆ + ∆ = i∆(x) =
+ ˆ d q =
(2π)4 C q 2 − m2
i ∫ 4 eiqx i ∫ 4 eiqx
= d q + d q (2.385)
(2π)4 C + q 2 − m2 (2π)4 C − q 2 − m2

dove i percorsi C ± sono i percorsi chiusi in senso antiorario intorno a ciascun polo
(vedi fig. 6)

Figure 6: Cammino di integrazione relativo alle funzione ∆±

81
E’ facile verificare95 che risulta allora
i ∫ eiqx
∆± (x) = d4
q (2.388)
(2π)4 C ∓ q 2 − m2

Come già detto varie volte, le funzioni improprie ∆± (x) e ∆(x) sono soluzioni
dell’equazione di Klein-Gordon per la massa m.
Veniamo ora a considerare un’altra funzione molto importante in teoria dei
campi, legata anch’essa in modo speciale alle funzioni ∆p m, che è la funzione di
Green G(x) ovvero il propagatore96 del campo stesso.
La definizione97 che adotteremo per la funzione impropria G(x) è la seguente
( )
2 + m2 G(x) = −δ 4 (x) (2.391)

Per esplicitare G(x) assumeremo che essa sia rappresentabile in integrale di


95
Infatti si ha
∫ ∫ ∫ 0
i eiqx i eiq t
d4 q = d3 qe−i⃗q·⃗x =
(2π)4 C− q − m2
2 (2π)4 C− (q − Eq )(q 0 + Eq )
0
∫ −iEq t ∫
i e 1
= d3 qe−i⃗q·⃗x (2πi) = d3 qe−i⃗q·⃗x e−iEq t =
(2π)4 −2Eq 2Eq (2π)3

d3 q
= e−iqx = ∆+ (x) (2.386)
2Eq (2π)3

dove abbiamo effettuato nel penultimo integrale la solita sostituzione ⃗q → −⃗q.


Analogamente risulta
∫ ∫ ∫ 0
i eiqx
4 i 3 −i⃗q ·⃗
x eiq t
d q 2 = d qe =
(2π)4
C+ q − m2 (2π)4 C − (q − Eq )(q + Eq )
0 0
∫ ∫
i 3 −i⃗ q ·⃗ eiEq t 1
= 4
d qe x
(2πi) = d3 qe−i⃗q·⃗x e−iEq t =
(2π) 2Eq 2Eq (2π)3

d3 q
= − eiqx = ∆− (x) (2.387)
2Eq (2π)3

96
Come e noto, il nome propagatore trae la sua origine dal fatto che, in presenza di un
termine di sorgente S(x) del campo, ovvero nel caso dell’equazione inomogenea
( )
2 + m2 ϕ(x) = S(x) (2.389)

la soluzione si può scrivere formalmente nel modo seguente



ϕ(x) = ϕ0 (x) − d4 y G(x − y)S(x) (2.390)

dove ϕ0 (x) è una qualunque soluzione dell’equazione omogenea.


97
In matematica la definizione usuale della funzione di Green differisce da qualla da noi
adottata per il segno. La ragione della scelta diversa sta semplicemente nella maggior praticità
d’uso nel caso dei campi, legata a sua volta alla scelta della metrica.

82
Fourier e dunque assumeremo di poter scrivere

G(x) = d4 p e−ipx Ĝ(p) (2.392)

Siccome
4 1 ∫ 4 −ipx
δ (x) = d pe (2.393)
(2π)4
la (2.391) implica che debba essere
1 1 1
(−p2 + m2 )Ĝ(p) = − ⇒ Ĝ(p) = (2.394)
(2π)4 (2π) p − m2
4 2

ovvero, quindi
1 ∫ 4 e−ipx
G(x) = dp 2 (2.395)
(2π)4 p − m2
E’ evidente, allora, dalla (2.395), la stretta similitudine con le funzioni ∆p m(x)
e ∆(x).
Ma come si spiega che le funzioni ∆± (x) e ∆(x) soddisfano l’equazione di Klein-
Gordon omogenea, mentre il propagatore G(x) verifica l’equazione disomogena
(2.391) ? Il punto è che la (2.395) non è sufficiente, da sola, per definire la
funzione G(x) a causa della presenza dei due zeri al denominatore della funzione
integranda, per p0 = ±Ep . Per definire G(x) occorre anche definire il percorso di
integrazione relativamente a p0 , ovvero decidere la prescrizione con cui trattare
i poli. La prescrizione che si usa quanto al propagatore è quella, cosiddetta, di
Feynman-Stueckelberg, per cui
1 1
Ĝ(p) → (2.396)
(2π) p − m2 + iϵ
4 2

dove ϵ verrà poi mandato a zero al momento opportuno e serve solo per definire
il modo, appunto, di operare intorno ai poli. Con questa prescrizione, il denomi-
natore della funzione integranda diviene infatti
( )2

p2 − m2 + iϵ = p20 − |⃗p|2 − m2 + iϵ = p20 − Ep2 + iϵ ≈ p20 − Ep − (2.397)
2Ep
ovvero si azzera non più sull’asse reale, bensı̀ nei punti del piano complesso tali
che
( )

p0 = ± Ep − ≡ (Ep − iϵ′ ) (2.398)
2Ep
Accade dunque che il polo con parte reale positiva Ep si abbassa sotto l’asse reale
della quantità ϵ′ = 2Eϵ p , mentre il polo in −Ep si alza sopra l’asse reale della stessa

83
Figure 7: Cammino di integrazione relativo al propagatore G = ∆F

quantità (vedi fig.7 a)). In questo modo, sull’asse reale q 0 non ci sono più poli e
l’integrazione da −∞ a +∞ può procedere senza necessità di altre precisazioni98 .
Abbiamo

1 ∫ 4 e−ipx ∫
d3 p i⃗p·⃗x ∫ +∞ 0 e−ip t
0

G(x) = dp 2 = e dp 2 =
(2π)4 p − m2 + iϵ (2π)4 −∞ p0 − Ep2 + iϵ
1 ∫ 3 i⃗p·⃗x ∫ +∞ 0 e−ip t
0

= d pe dp 0 (2.399)
(2π)4 −∞ [p − (Ep − iϵ′ ] [p0 + (Ep − iϵ′ )]

Si osservi adesso che la funzione integranda è olomorfa in tutto il piano complesso


p0 , a parte i due poli semplici in p0 = ±(Ep −iϵ′ , e l’integrale è sull’asse reale. Nel
caso in cui t > 0, la presenza dell’esponenziale e−ip t nella funzione integranda
0

consente di chiudere il cammino di integrazione all’infinito su una semicircon-


ferenza nel semipiano inferiore (ℑm(p0 ) < 0), senza che questo contributo alteri
il valore dell’integrale sull’asse reale in quanto l’integrale sulla semicirconferenza
sarà comunque nullo a causa dell’esponenziale reale negativo che si realizza su
questo cammino. D’altronde, proprio perché la funzione integranda è olomorfa in
tutto il piano complesso all’infuori dei due poli semplici ben noti, sappiamo che
98
Evidentemente lo stesso risultato si ottiene senza introdurre il termine immaginario pro-
porzionale ad ϵ, ma valutando l’integrale seguendo semplicemente la prescrizione illustrata nella
figura 7 b).

84
un qualunque suo integrale su un percorso chiuso avrà come risultato la somma
dei residui ai poli contenuti all’interno del cammino di integrazione.
Per t > 0, richiudendo verso il basso, il solo polo che viene compreso nel cammino
di integrazione è quello per p0 = (Ep − iϵ′ ), percorso in senso orario.
Dunque, per ϵ → 0, abbiamo
1 ∫ e−ipx
t>0: G(x) = − d4
p (2.400)
(2π)4 C + p 2 − m2
D’altronde
1 ∫ e−ipx 1 ∫ 3 i⃗p·⃗x ∫ e−ip0 t
− d 4
p = − d pe dp 0 =
(2π)4 C + p 2 − m2 (2π)4 C+ (p0 − Ep )(p0 + Ep )
1 ∫ 3 i⃗p·⃗x e−iEp t −i ∫ d3 p −ipx
− d pe (2πi) = e ≡ −i∆+ (x) (2.401)
(2π)4 2Ep (2π 3 ) 2Ep
Nel caso in cui t < 0, dovendo richiudere il cammino nel semipiano superiore, il
polo da considerare è quello per p0 = −(Ep − iϵ′ ) e dunque, siccome stavolta il
senso di circolazione è quello antiorario, risulta
1 ∫ 4 e−ipx
t>0: G(x) = d p (2.402)
(2π)4 C − p2 − m2
Ma
1 ∫ 4 e−ipx 1 ∫ 3 i⃗p·⃗x ∫ e−ip0 t
d p = d pe dp 0 =
(2π)4 C − p 2 − m2 (2π)4 C− (p0 − Ep )(p0 + Ep )
1 ∫ 3 i⃗p·⃗x eiEp t −i ∫ d3 p ipx
d pe (2πi) = e ≡ i∆− (x) (2.403)
(2π)4 −2Ep (2π 3 ) 2Ep
per cui, in conclusione, abbiamo

x0 > y 0 ⇔ t > 0 : G(x) = −i∆+ (x − y) (2.404)


x0 < y 0 ⇔ t < 0 : G(x) = i∆− (x − y) (2.405)

D’altronde, per loro stessa definizione, risulta

< Ω|ϕ(x)ϕ† (y)|Ω > = ∆+ (x − y) (2.406)


< Ω|ϕ† (y)ϕ(x)|Ω > = −∆− (x − y) (2.407)

e dunque, ponendo adesso

i∆F (x − y) ≡ iG(x − y) (2.408)

abbiamo che
( )
i∆F (x − y) =< Ω|T ϕ(x)ϕ† (y) |Ω > (2.409)

85
Dove il simbolo T indica99 indica il prodotto T -ordinato o di Dyson, per cui, dati
due campi A(x) e B(x), risulta

T (A(x) B(y)) = A(x)B(y) se x0 > y 0


T (A(x) B(y)) = B(y)A(x) se y 0 > x0

(il campo a sinistra ha il tempo maggiore), ovvero

T (A(x) B(y)) = A(x)B(y)Θ(x0 − y 0 ) + B(y)A(x)Θ(y 0 − x0 ) (2.410)

Prima di concludere questo argomento è senz’altro utile ritornare sulla assun-


zione (2.396) da cui segue appunto che

1 ∫ 4 e−ipx
i∆F (x) = d p (2.411)
(2π)4 p2 − m2 + iϵ

E’ del tutto evidente che, effettivamente, risulta

1 ∫ 4 (m2 − p2 )e−ipx
(2 + m2 )i∆F (x) = dp 2 = −iδ 4 (x) (2.412)
(2π)4 p − m + iϵ
2

ma è altresı̀ evidente che vale anche la relazione


1 ∫ 4 (m2 − p2 )eipx
(2 + m2 )i∆∗F (x) = dp 2 = −iδ 4 (x) (2.413)
(2π)4 p − m2 − iϵ

Qual è la differenza fra le due possibili scelte della funzione di Green e perché
sono due ?
Cominciamo con il dire che sono due perché l’equazione di Klein-Gordon è del
secondo ordine: la scelta fatta, come si è visto, ha condotto ad identificare la
funzione di Green con il valore di aspettazione sul vuoto del prodotto T -ordinato
dei campi ϕ e ϕ† nel senso dal passato verso il futuro. Se avessimo fatto l’altra
scelta saremmo giunti ad un’analoga conclusione ma con un ordinamento non
fisico dal futuro verso il passato.
Per finire, siccome evidentemente ∆F (x) − ∆∗F (x) dovrà soddisfare l’equazione di
Klein Gordon omogenea, possiamo chiederci quale sia il suo legame con le ∆± (x).
Iniziamo osservando che
( )∗
t>0: ∆F (x) = −i∆+ (x) ⇔ (∆F (x))∗ = i ∆+ (x) = −i∆− (2.414)
(x)
( )∗
t<0: ∆F (x) = i∆− (x) ⇔ (∆F (x))∗ = −i ∆− (x) = i∆+ (x)
(2.415)

e dunque, indipendentemente dal valore di t, risulta


( )
∆F (x) − ∆∗F (x) = −i ∆+ (x) − ∆− (x) (2.416)

86
Figure 8: Cammino di integrazione relativo alla funzione ∆F − ∆∗F

che corrisponde all’integrazione della funzione

i ∫ 4 eiqx
d q
(2π)4 q 2 − m2
sul cammino indicato in fig. 8.
Quanto, infine, all’azione delle simmetrie discrete C, P e T , si dimostra che
risulta (cfr. Appendice)

C a(⃗p) C −1 = e−iηc b(⃗p) ←→ C a† (⃗p) C −1 = eiηc b† (⃗p) (2.417)


C b(⃗p) C −1 = eiηc a(⃗p) ←→ C b† (⃗p) C −1 = e−iηc a† (⃗p) (2.418)
C ϕ(x) C −1 = e−iηc ϕ† (x) ←→ C ϕ† (x) C −1 = eiηc ϕ(x) (2.419)

P a(⃗p) P −1 = e−iηp a(−⃗p) ←→ P a† (⃗p) P −1 = eiηp a† (−⃗p) (2.420)


P b(⃗p) P −1 = eiηp b(−⃗p) ←→ P b† (⃗p) P −1 = e−iηp b† (−⃗p) (2.421)
P ϕ(x) P −1 = e−iηp ϕ(P x) ←→ P ϕ† (x) P −1 = eiηp ϕ† (P x) (2.422)
eiηp = ±1 (2.423)

T a(⃗p) T −1 = e−iηT a(−⃗p) ←→ T a† (⃗p) T −1 = eiηT a† (−⃗p) (2.424)


T b(⃗p) T −1 = eiηT b(−⃗p) ←→ T b† (⃗p) T −1 = e−iηT b† (−⃗p) (2.425)
T ϕ(x) T −1 = e−iηT ϕ(T x) ←→ T ϕ† (x) T −1 = eiηT ϕ† (T x) (2.426)

dove, se x = (t, ⃗x), allora P x ≡ (t, −⃗x) e T x ≡ (−t, ⃗x).


99
Cfr. pag 42 di relativistic Quantum Fields di J.D. Bjorkeen e S.D. Drell, edito da McGraw-
Hill, 1965.

87
Si osservi che la condizione C 2 = I , per come agisce la trasformazione C, non
può dare condizioni sul valore della fase eiηc , mentre la condizione P 2 = I
implica che, quanto a eiηp , non possa essere che eiηp = ±1 .
Quanto invece a T 2 , evidentemente T 2 = I , dato che lo spin della particella è
nullo e quindi è intero: essendo l’operatore T antiunitario, questa condizione,
però, non può fornire condizioni di sorta sulla fase eiηT .

Un altro operatore, infine, di cui è interessante verificare la legge di trasfor-


mazione sotto le simmetrie C, P e T è senz’altro la quadricorrente conservata
J µ (x) associata all’invarianza di gauge di prima specie della lagrangiana (2.329),
i.e. l’osservabile100
[ ]
∂L ∂L [ ]
† † µ †
J (x) = i −
µ
ϕ+ ϕ = i (∂ µ
ϕ)(x) ϕ (x) − (∂ ϕ )(x) ϕ(x) (2.427)
∂(∂µ ϕ) ∂(∂µ ϕ† )

Risulta (cfr. Appendice)

C J µ (x) C −1 = −J µ (x) (2.428)


P J µ (x) P −1 = Jµ (P x) (2.429)
T J µ (x) T −1 = Jµ (T x) (2.430)

100
La quadricorrente (2.427) è un operatore autoaggiunto, dunque è un’osservabile, a differenza
dei campi stessi che, ovviamente, come gli operatori di creazione e distruzione, non lo sono.

88
2.3.2 Il campo vettoriale libero
Le equazioni di moto per i campi101 che descrivono particelle vettoriali (cioè di
spin 1) sono102 le seguenti
(2 + m2 )W µ = 0
(2.436)
∂µ W µ = 0
dove m è la loro massa, che assumeremo per adesso diversa da zero.
Una Lagrangiana che, attraverso il principio di minima azione, determina le
equazioni di moto (2.436) per il campo classico è la seguente
1 µν ∗
L = F Fµν − m2 W µ Wµ∗ (2.437)
2
dove
F µν ≡ ∂ µ W ν − ∂ ν W µ (2.438)
Infatti, dalle equazioni di Lagrange
∂L ∂L
∂µ − =0
∂(∂µ Wν ) ∂Wν
∂L ∂L
∂µ − =0
∂(∂µ Wν ) ∂Wν∗

otteniamo, rispettivamente
∂µ F ∗µν + m2 W ∗ν = 0 ⇒ 2W ∗ν − ∂ ν (∂µ W ∗µ ) + m2 W ∗ν = 0 (2.439)
∂µ F µν + m2 W ν = 0 ⇒ 2W ν − ∂ ν (∂µ W µ ) + m2 W ν = 0 (2.440)
101
Ricordiamo che, per un campo vettoriale, la legge di trasformazione sotto il gruppo di
Poincaré è la seguente:
(a, Λ) : x → x′ = a + Λx (2.431)


W (x) → W (x ) =
µ µ
Λµ.ν ν
W (x) (2.432)
ovvero (trasformazione attiva)

U −1 (a, Λ) W µ (x) U (a, Λ) = W µ (x) (2.433)
equivalente a
U −1 (a, Λ)W µ (x)U (a, Λ) = Λµ.ν W ν (Λ−1 (x − a)) (2.434)
da cui (trasformazione passiva)
U (a, Λ) W µ (x) U −1 (a, Λ) = (Λ−1 )µ.ν W ν (Λx + a) (2.435)

102
Un campo quadrivettoriale come W µ , dal punto di vista delle rotazioni, è la somma diretta
di un campo vettoriale (s = 1) e di un campo scalare (s = 0). La condizione ∂µ W µ = 0 elimina
la componente scalare e quindi lascia solo lo spin 1.

89
D’altronde, essendo F µν ovviamente antisimmetrico, è

∂µ ∂ν F µν = 0

per cui, usando l’espressione di sinistra dell’equazione del moto (2.440) se ne


deduce che

∂µ [m2 W µ ] = 0 ⇒ ∂µ W µ = 0 (2.441)

dove si è fatto uso del fatto che la massa del campo non è nulla.
Analogamente, partendo da F ∗µν , si dimostra che anche la quadridivergenza di
W ∗µ è nulla, per cui, in definitiva, risultano cosı̀ dimostrate le equazioni di moto
(2.436) sia per W µ che per W ∗µ .
La densità lagrangiana (2.437) è poi evidentemente invariante per trasfor-
mazioni di gauge di prima specie: la corrente conservata che, via il teorema di
Noëther, consegue da questa invarianza è, come ben noto, la seguente
[ ]
∂L ∂L
µ
J (x) = i Wρ − W∗ (2.442)
∂(∂µ Wρ ) ∂(∂µ Wρ∗ ) ρ
ovvero
[ ] [ ]
J µ (x) = i F ∗µρ Wρ − F µρ Wρ∗ = i (∂ µ W ∗ρ − ∂ ρ W ∗µ ) Wρ − (∂ µ W ρ − ∂ ρ W µ ) Wρ∗ =
[ ]
= i (∂ µ W ∗ρ ) Wρ − (∂ ρ W ∗µ ) Wρ − (∂ µ W ρ ) Wρ∗ + (∂ ρ W µ ) Wρ∗ (2.443)

che, tenendo conto che ∂ρ W ρ = 0, si può riscrivere come


[ ]
J µ (x) = i (∂ µ W ∗ρ ) Wρ − (∂ µ W ρ ) Wρ∗ − i∂ρ [W ∗µ W ρ − W µ W ∗ρ ](2.444)

ma il termine

Jˆµ ≡ −i∂ρ [W ∗µ W ρ − W µ W ∗ρ ] (2.445)

• essendo antisimmetrico in µ e ρ, soddisfa separatamente l’equazione di con-


tinuità ∂µ Jˆµ = 0;

• il suo contributo all’integrale spaziale di J 0 (x) è nullo perché


[ ] [ ]
Jˆ0 ≡ −i∂ρ W ∗0 W ρ − W 0 W ∗ρ = −i∂k W ∗0 W k − W 0 W ∗k

coincide con una divergenza nelle sole variabili spaziali;

Per questo motivo, l’espressione canonica della corrente conservata per il campo
vettoriale di massa m è la seguente

J µ = −i [(∂ µ W ν ) Wν∗ − (∂ µ Wν∗ ) W ν ] (2.446)

90
in stretta analogia con quanto già visto nel caso scalare.
La quantizzazione del campo W µ , al solito, viene effettuata espandendolo in
termini di operatori di creazione/distruzione, nel modo seguente
3 ∫
∑ d3 p [ −ipx † ∗µ
]
W µ (x) = A(r, p
⃗) ϵ µ
(r, p
⃗) e + B (r, p
⃗) ϵ (r, p
⃗) e ipx
(2.447)
r=1 2Ep (2π)3
3 ∫
∑ d3 p [ ]
W †µ (x) = B(r, p
⃗) ϵ µ
(r, p
⃗) e−ipx
+ A†
(r, p
⃗) ϵ ∗µ
(r, p
⃗) e ipx
(2.448)
r=1 2Ep (2π)3
dove

• A(r, p⃗) annichila la particella di quadrimpulso (Ep , p⃗) = ( m2 + |⃗p|2 , p⃗) e
di stato di polarizzazione r;
• A† (r, p⃗) crea la particella di quadrimpulso p ≡ (Ep , p⃗) e polarizzazione r;
• B(r, p⃗) annichila l’antiparticella di quadrimpulso p e polarizzazione r;
• B † (r, p⃗) crea l’antiparticella di quadrimpulso p e polarizzazione r;
e questi operatori soddisfano le seguenti regole di commutazione (tutte le altre
sono nulle ...)
[ ] [ ]
A(r, p⃗), A† (s, p⃗′ ) = B(r, p⃗), B † (s, p⃗′ ) = 2 Ep (2π)3 δrs δ 3 (⃗p − p⃗′ ) (2.449)

dove δrs è il simbolo di Kronecker.


Quanto allo stato di polarizzazione, esso è specificato dai tre quadrivettori ϵµ (r, p⃗),
per r = 1, 2, 3. Questi quadrivettori, affinché sia garantita la condizione di
quadridivergenza nulla ∂µ W µ = 0, devono soddisfare il vincolo

pµ ϵµ (r, p⃗) = 0 (2.450)

Sempre nel caso di una particella di massa m ̸= 0, la scelta consueta è quella


di fissare i quadrivettori ϵµ (r, ⃗0) nel sistema di riferimento dove la particella è
ferma, ovvero dove essa ha quadrimpulso p̂ ≡ (m, 0, 0, 0) e quindi di definirli nel
riferimento dove essa ha impulso p⃗, usando il boost che effettua la trasformazione
B(p) · p̂ ≡ (E, p⃗) senza ruotare gli assi, i.e. attraverso la matrice di Lorentz
 E px py py 
m m m m
 px px px px py px pz 
 1 + m(E+m) 
B(p) = 

m
py py px
m(E+m)
py py
m(E+m)
py pz 
 (2.451)
 m m(E+m)
1 + m(E+m) m(E+m) 
pz pz px pz py pz pz
m m(E+m) m(E+m)
1 + m(E+m)

Nel riferimento dove la particella è ferma, la polarizzazione, dovendo essere or-


togonale al quadrimpulso (nella metrica di Minkowski), deve essere tale che

ϵµ (r, ⃗0) = (0,⃗ϵ(r))

91
dove gli ⃗ϵ(r) sono tre versori indipendenti, individuati ciascuno dall’indice r.
Se indichiamo con ⃗e1 = ⃗ex , ⃗e2 = ⃗ey e ⃗e3 = ⃗ez i versori dei tre assi coordinati,
allora una scelta possibile è semplicemente la seguente103 (polarizzazioni lineari)

⃗ϵ(r) ≡ ⃗er

la quale conduce, secondo la regola sopra indicata, a quadrivettori di polariz-


zazione reali coincidenti semplicemente con le colonne della matrice B(p), ovvero
risultano104 essere espressi dalla relazione
( )
pr pi pr
µ
ϵ (r, p⃗) = B(p)µ.ν ϵ (r, ⃗0) =
ν
, δir + (2.454)
m m(E + m)

dove pr indica la componente r−esima del vettore p⃗ e δir è il simbolo di Kronecker.


I quadrivettori di polarizzazione cosi definiti soddisfano inoltre la condizione di
completezza105 seguente


3
pµ pν
ϵµ (r, p⃗)ϵ∗ν (r, p⃗) = −δ µν + (2.462)
r=1 m2

e risulta

ϵµ (s, p⃗) = ϵ∗µ (r, p⃗) = −ϵµ (s, −⃗p) (2.463)


103
Un’altra scelta equivalente è, naturalmente, la seguente (polarizzazioni circolari)
−1 1
⃗ϵ(+) ≡ √ (⃗ex + i⃗ey ) ; ⃗ϵ(0) ≡ ⃗ez ; ⃗ϵ(−) ≡ √ (⃗ex − i⃗ey ) ; (2.452)
2 2

104
Si osservi che se indichiamo con ⃗n il versore dell’impulso spaziale della particella, essendo
allora pr = mγβnr , ne segue che

ϵµ (r, p⃗) = (γβ nr , δir + (γ − 1)nr ni ) (2.453)


2 2
dove abbiamo usato il fatto che βγ+1
γ
= γ − 1.
105
Osserviamo che, dalla definizione, è

ϵµ (r, p⃗) = B(p)µ.ν ϵν (r, ⃗0) = B(p)µ.ν δrν = B(p)µ.r = −B(p)µ r (2.455)

Dunque


3 ∑
3
ϵµ (r, p⃗)ϵ∗ν (r, p⃗) = − p)µ.r B(p)ν r = −B(p)µ.ρ B(p)ν ρ + B(p)µ.0 B(p)ν 0
B(⃗ (2.456)
r=1 r=1

ma, per le ben note proprietà delle matrici di Lorentz, risulta

B(p)µ.ρ B(p)ν ρ = B(p)µ.ρ B(p).σρ δ σν = δσµ δ σν = δ µν (2.457)

92
Quanto poi alla funzione d’onda ψ µ (r, p⃗; x) che, in rappresentazione delle co-
ordinate è associata allo stato

|r, p⃗ >≡ A† (r, p⃗)|Ω >

essa106 è data ancora da

ψ µ (r, p⃗; x) = ϵµ (r, p⃗) e−ipx ≡< Ω| W µ (x) |r, p⃗ > (2.464)

Coerentemente con l’espressione107 della corrente di probabilità conservata in


virtù dell’invarianza di gauge di prima specie della Lagrangiana (2.437),
[ ] ∫
J µ
= −i (∂ W µ ν
) Wν† − (∂ µ
Wν† ) W ν ⇒ d3 x J 0 (x, t) = cost
∂ ∫ 3 [ 0 ν ]
⇒ −i d x (∂ W ) Wν† − (∂ 0 Wν† ) W ν = 0 (2.465)
∂t
il prodotto scalare fra due stati di singola particella |a > e |b >, rappresentati
dunque, essendo
pµ pν pµ pν
B(p)µ.0 B(p)ν 0 =
=
m m m2
abbiamo infine la relazione di completezza cercata, i.e.


3
pµ pν
ϵµ (r, p⃗)ϵ∗ν (r, p⃗) = −δ µν + (2.458)
r=1
m2

Si osservi altresı̀ che, sempre dalla loro definizione, segue che

ϵµ (s, p⃗) ϵ∗µ (r, p⃗) = −δsr (2.459)

Infatti
( ) ( )∗
ϵµ (s, p⃗) ϵ∗µ (r, p⃗) = B(p) ϵ(s, ⃗0) · B(p) ϵ(r, ⃗0) (2.460)

e per il fatto che le matrici di Lorentz sono reali e le ben note proprietà del prodotto scalare
fra quadrivettori, questa quantità è pari, in effetti, a

ϵµ (s, ⃗0) ϵ∗µ (r, ⃗0) = −δsr (2.461)

visto come sono definite queste stesse polarizzazioni nel sistema del CM .
106
Per lo stato B † (r, p⃗)|Ω > occorre semplicemente scambiare W con il suo hermitiano coniu-
gato W † .
107
Si osservi che la definizione di J µ che usiamo per il campo vettoriale è opposta a quella usata
nel caso del campo scalare. La ragione sta proprio nella normalizzazione delle polarizzazioni e
nella scelta che abbiamo fatto riguardo al tensore metrico di coincidere con −I sulle variabili
spaziali.

93
µ µ
dalle funzioni d’onda ψ(a) (x) e ψ(b) (x) si deve scrivere108
∫ [( ) ( ) ]
∗ ∗µ
< a|b >= −i d3 x µ
∂ 0 ψ(b) (⃗x, t) ψ(a)µ (⃗x, t) − ∂ 0 ψ(a) µ
(⃗x, t) ψ(b) (⃗x, t) (2.468)

per cui, di nuovo, la densità di particelle associata alla funzione d’onda (2.464)
vale 2E, infatti, per la (2.459), risulta
[ ]
ρ(x) = J 0 (x) = −i (∂ 0 ψ µ (r, p⃗; x))ψµ∗ (r, p⃗; x) − (∂ 0 ψ ∗µ (r, p⃗; x))ψ µ (r, p⃗; x) =
= 2p0 ≡ 2E (2.469)

Veniamo adesso alla legge di trasformazione degli operatori di creazione e


distruzione sotto il gruppo di Poincaré. Ricordiamo che il campo vettoriale gode
della proprietà per cui

U (a, Λ) W µ (x) U −1 (a, Λ) = (Λ−1 )µ.ν W ν (Λx + a) (2.470)

La presenza dei vettori di polarizzazione nella rappresentazione del campo


3 ∫
∑ d3 p [ −ipx † ∗µ
]
W µ (x) = A(r, p
⃗) ϵ µ
(r, p
⃗) e + B (r, p
⃗) ϵ (r, p
⃗) e ipx
(2.471)
r=1 2Ep (2π)3

richiede che, per stabilire la legge di trasformazione degli operatori di creazione


e distruzione in modo coerente con la (2.470), si debbano conoscere preventiva-
mente come gli ϵµ (r, p⃗) si trasformano sotto il gruppo di Lorentz.
Ricordiamo che, per la definizione (2.454), risulta

ϵµ (s, p⃗) ≡ B(p)µ.ν ϵν (s, ⃗0) (2.472)

Dimostriamo adesso che il quadrivettore Λ · ϵ(s, p⃗) è combinazione lineare delle


⃗ qualsiasi siano Λ e p⃗, i.e. che si ha
polarizzazioni ϵ(r, Λp),

Λ · ϵ(s, p⃗) = Mrs ϵ(r, Λp)


⃗ (2.473)
108
Per gli autostati dell’impulso di cui sopra, si ha

[( ) ( ) ]
< r, p⃗|s, ⃗q >= −i d3 x ∂ 0 ψ µ (s, ⃗q; x) ψµ∗ (r, p⃗; x) − ∂ 0 ψ ∗µ (r, p⃗; x) ψ µ (s, ⃗q; x) (2.466)

i.e., risulta

[ ]
< r, p⃗|s, ⃗q > = −i d3 x (∂ 0 e−iqx )ϵµ (s, ⃗q) ϵ∗µ (r, p⃗) eipx − ϵ∗µ (r, p⃗) (∂ 0 eipx )e−iqx ϵµ (s, ⃗q) =

= i 2
d3 x (q 0 + p0 )eix(p−q) ϵ∗µ (r, p⃗) ϵµ (s, ⃗q) = 2p0 δrs (2π 3 ) δ 3 (⃗
p − ⃗q) (2.467)

coerentemente con le regole di commutazione ...

94
con M matrice opportuna, che adesso determineremo.
La (2.473) può essere riscritta, usando la definizione (2.472), come segue

Λ · B(p) · ϵ(s, ⃗0) = Mrs B(Λp) · ϵ(r, ⃗0) ⇔


⇔ B −1 (Λp) · Λ · B(p) · ϵ(s, ⃗0) = Mrs ϵ(r, ⃗0) (2.474)

D’altronde B −1 (Λp) · Λ · B(p) è una rotazione, poiché trasforma p̂ in se stesso: si


tratta della rotazione di Wigner R(Λ, p⃗)

R(Λ, p⃗) ≡ B −1 (Λp) · Λ · B(p) (2.475)

E’ immediato allora osservare che, se Rjs è la matrice ortogonale che descrive la


rotazione di Wigner di cui sopra in tre dimensioni, è

R(Λ, p⃗)µ.ν ϵν (s, ⃗0) = Rjs ϵµ (j, ⃗0) ⇒ Mrs = Rrs (2.476)

cioè la matrice M che abbiamo introdotto con la (2.473) altri non è che la matrice
ortogonale definita dalla rotazione di Wigner R(Λ, p⃗).
Riprendendo allora la (2.473)

Λ · ϵ(s, p⃗) = Rrs ϵ(r, Λp)


⃗ (2.477)

e moltiplicando a sinistra per (R−1 )st , otteniamo (si ricordi che R è ortogonale)

(R−1 )st Λ · ϵ(s, p⃗) = (R−1 )st Rrs ϵ(r, Λp) ⃗ = (R−1 )st Λ ϵ(s, p⃗)
⃗ ⇒ ϵ(t, Λp)
⇒ ϵ(t, Λp)
⃗ = Rts Λ · ϵ(s, p⃗) ⇔ ϵµ (t, Λp) ⃗ = Rts Λµ · ϵν (s, p⃗)
.ν (2.478)

Dato questo modo di trasformarsi dei vettori di polarizzazione, la legge di trasfor-


mazione degli operatori di creazione e distruzione che garantisce la (2.470) è la
seguente

U (a, Λ) A(s, p⃗) U −1 (a, Λ) = e−ia·Λp Rrs A(r, Λp)


⃗ (2.479)
U (a, Λ) A† (s, p⃗) U −1 (a, Λ) = eia·Λp R∗ A† (r, Λp)
rs
⃗ (2.480)

e lo stesso per gli operatori B e B † .


Risulta infatti (U ≡ U (a, Λ)...)
3 ∫
∑ d3 p [
U (a, Λ) W µ (x) U −1 (a, Λ) = U A(r, p⃗) U −1 ϵµ (r, p⃗) e−ipx +
r=1 2Ep (2π)3
]
U B † (r, p⃗) U −1 ϵ∗µ (r, p⃗) eipx =
∑∫ d3 p [ −ia·Λp
= e ⃗ ϵµ (r, p⃗) e−ipx +
Rkr A(k, Λp)
r,k 2Ep (2π)3
]

eia·Λp Rkr B † (k, Λp)
⃗ ϵ∗µ (r, p⃗) eipx

95
Ponendo q = Λp ⇒ p · x = (Λp) · (Λx) = q · Λx, abbiamo allora

U (a, Λ) W µ (x) U −1 (a, Λ) =


∑∫ d3 q [
= 3
e−iq·(a+Λx) Rkr A(k, ⃗q) ϵµ (r, Λ−1
⃗ q) +
r,k 2E q (2π)
]

eiq·(a+Λx) Rkr B † (k, ⃗q) ϵ∗µ (r, Λ−1
⃗ q) (2.481)

ma, per la (2.478)


⃗ q) = Rkr R̂rt Λ−1 · ϵ(t, ⃗q)
Rkr ϵ(r, Λ−1 (2.482)

dove R̂ è adesso la rotazione di Wigner definita da


( )−1
R̂ = Λ−1 (Λ−1 q) · Λ−1 · Λ(q) = Λ−1 (q) · Λ · Λ(Λ−1 q) =
( )−1
= Λ−1 (Λp) · Λ · Λ(p) = (R)−1 (2.483)

e dunque
( )µ
⃗ q) = Λ−1
Rkr ϵµ (r, Λ−1 ϵν (k, ⃗q) (2.484)

Sostituendo la (2.484) nella (2.481), otteniamo immediatamente la (2.470) che


risulta cosı̀ dimostrata.

Quanto infine all’azione delle simmetrie C, P e T , data la definizione (2.454)


del vettore di polarizzazione per cui, come si è visto, risulta

ϵµ (r, p⃗) = −ϵµ (r, −⃗p) = ϵ∗µ (r, p⃗) (2.485)

abbiamo

C A(s, p⃗) C −1 = e−iηC B(s, p⃗) ←→ C A† (s, p⃗) C −1 = eiηC B † (s, p⃗) (2.486)
C B(s, p⃗) C −1 = eiηC A(s, p⃗) ←→ C B † (s, p⃗) C −1 = e−iηC A† (s, p⃗) (2.487)
C W µ (x) C −1 = e−iηC W †µ (x) ←→ C W †µ (x) C −1 = eiηC W µ (x) (2.488)

P A(s, p⃗) P −1 = −e−iηP A(s, −⃗p) ←→ P A† (s, p⃗) P −1 = −eiηP A† (s, −⃗p) (2.489)
P B(s, p⃗) P −1 = −eiηP B(s, −⃗p) ←→ P B † (s, p⃗) P −1 = −e−iηP B † (s, −⃗p) (2.490)
P W µ (x) P −1 = e−iηP Wµ (P x) ←→ P W µ (x) P −1 = e−iηP Wµ (P x) (2.491)

T A(s, p⃗) T −1 = −e−iηT A(s, −⃗p) ←→ T A† (s, p⃗) T −1 = −eiηT A† (s, −⃗p) (2.492)
T B(s, p⃗) T −1 = −eiηT B(s, −⃗p) ←→ T B † (s, p⃗) T −1 = −e−iηT B † (s, −⃗p) (2.493)
T W µ (x) T −1 = e−iηT Wµ (T x) ←→ T W µ (x) T −1 = e−iηT Wµ (T x) (2.494)

96
dalle quali, per quanto riguarda la corrente (2.446) quantizzata
[ ]
J µ = −i (∂ µ W ν ) Wν† − (∂ µ Wν† ) W ν (2.495)

ricaviamo di nuovo

C J µ (x) C −1 = −J µ (x) (2.496)


P J µ (x) P −1 = Jµ (P x) (2.497)
T J µ (x) T −1 = Jµ (T x) (2.498)

Veniamo adesso a considerare un caso molto particolare di campo vettoriale


cioè quello del campo elettromagnetico Aµ (x).
Ricordiamo che, classicamente, in assenza di cariche e correnti, il campo Aµ
soddisfa la seguente equazione del moto

∂µ F µν ≡ 2 Aν − ∂ ν (∂µ Aµ ) = 0 (2.499)

la quale può essere dedotta dalla lagrangiana già usata nel caso massivo (2.437),
ponendo m = 0, ovvero dalla lagrangiana109,110
1 µν
L = F Fµν (2.501)
4
dove F µν è il tensore di cui alla (2.438), i.e.

F µν ≡ ∂ µ Aν − ∂ ν Aµ (2.502)

che, nel caso attuale, è proprio il consueto tensore del campo elettromagnetico
 
0 − Ex − Ey − Ez
 Ex 0 − Bz By 
 
F µν ≡ ∂ µ Aν − ∂ ν Aµ =   (2.503)
 Ey Bz 0 − Bx 
Ez − By Bx 0
109
Rispetto al caso del campo vettoriale carico di massa m, la lagrangiana presenta adesso un
fattore 14 invece di 12 perché adesso ∂ µ Aν compare quattro volte in essa, visto che compare sia
in F µν che in Fµν essendo il campo Aµ intrinsecamente reale.
Chiaramente il fattore moltiplicativo non ha comunque effetto sulle equazioni di moto, essendo
esse omogenee nella lagrangiana: volendo scriverla correttamente normalizzata nel sistema c.g.s.
elettrostatico, il fattore sarebbe in realtà − 16π
1
.
110
Si noti che, nello scrivere la lagrangiana abbiamo usato il fatto che, proprio per il suo
significato fisico in termini dei campi classici E ⃗ e B,
⃗ F µν è reale, i.e.

F µν = F ∗µν (2.500)

e dunque al campo quantizzato Aµ dovrà poi essere richiesto di essere autoaggiunto.

97
A differenza del caso massivo, dall’equazione di moto (2.499) non discende
la condizione (2.441) di quadridivergenza nulla. Questa condizione può essere
imposta indipendentemente, usando il fatto che, fissato Fµν , cioè fissati i campi
⃗ e B,
elettromagnetici E ⃗ il potenziale Aµ è indeterminato a meno di una trasfor-
mazione di gauge

Aµ → A′µ = Aµ − ∂µ χ (2.504)

dove χ = χ(x) è una funzione scalare, a priori qualsiasi.


Questa arbitrarietà può essere usata per scegliere Aµ in modo che soddisfi la
condizione (gauge) di Lorentz111 , i.e.

∂µ Aµ = 0 (2.505)

In questo modo, l’equazione per il potenziale si semplifica e diventa

∂µ F µν ≡ 2 Aν − ∂ ν (∂µ Aµ ) = 0 ⇒ 2Aν = 0 (2.506)

L’equazione

2Aν = 0 (2.507)

ha soluzioni piane della forma

Aµ = N ϵµ e−ikx (2.508)

dove kµ k µ ≡ k 2 = 0, N è un opportuno fattore di normalizzazione ed ϵµ è il


quadrivettore che descrive appunto la polarizzazione dell’onda.
La condizione di Lorentz, come abbiamo già visto nel caso massivo, implica che
non tutte le quattro polarizzazioni indipendenti siano possibili, bensı̀ solo quelle
per cui

kµ ϵ µ = 0 (2.509)

Questo, ovviamente, riduce da quattro a tre le polarizzazioni112 possibili.


Ma noi sappiamo che gli stati di polarizzazione indipendenti di un fotone con
impulso ⃗k fissato sono solo due !
111
Come è ben noto dall’elettromagnetismo classico, basta che χ(x) sia scelto in modo che
soddisfi l’equazione 2χ = ∂ µ Aµ : evidentemente il campo A′µ che discende dalla (2.504) ha
quadridivergenza nulla ed è equivalente ad Aµ per quanto riguarda la descrizione dei campi
elettromagnetici.
112
Nel caso massivo, la condizione sulla quadridivergenza eliminava il contributo scalare, las-
ciando solo quello di spin 1. Nel caso di massa nulla, un’affermazione simile perderebbe di
significato perché, in questo caso, è lo spin come variabile a non essere più definito !
Per massa nulla, si può parlare, infatti, solo di stati di elicità definita (e questo è sempre uno
solo ...). La condizione sulla quadridivergenza elimina uno stato di elicità che corrisponde a
λ = 0.

98
L’ulteriore riduzione avviene, come noto, tenendo conto che la gauge di Lorentz
non esaurisce i gradi di arbitrarietà che abbiamo su Aµ , infatti l’ulteriore trasfor-
mazione di gauge ristretta

Aµ → A′µ = Aµ − ∂µ χ; 2χ = 0 (2.510)

lascia inalterate sia la condizione di Lorentz che il tensore F µν .


Quest’ultima libertà di gauge corrisponde, per le soluzioni piane, a traslare la
polarizzazione nel modo seguente (λ è un coefficiente complesso arbitrario)

ϵµ → ϵ µ = ϵµ + λk µ (2.511)

Questa possibilità ha conseguenze importanti, infatti proviamo a considerare una


soluzione con

k µ = (k 0 , ⃗k); ϵµ = (ϵ0 ,⃗ϵ) (2.512)

che soddisfa la condizione di Lorentz, i.e.

ϵ · k=0 (2.513)

La condizione di gauge (2.511) implica che si possa sommare ad ϵµ un qualunque


multiplo di k µ ed avere ancora un vettore di polarizzazione equivalente a quello
di partenza. Essendo certamente k 0 ̸= 0 dato che k è sul cono luce, possiamo
dunque sempre fare in modo che

ϵ0 = 0 ⇒ ϵµ = (0,⃗ϵ) (2.514)

La condizione di Lorentz diviene allora


⃗k · ⃗ϵ = 0 (2.515)

ovvero implica che ⃗ϵ, a sua volta, sia trasverso all’impulso spaziale del fotone e
dunque esistano solo due polarizzazioni indipendenti.
In questa gauge, evidentemente, div A ⃗ = 0 e, in assenza di cariche e correnti, il
potenziale scalare è nullo, i.e. A ≡ 0: è la gauge di radiazione detta anche gauge
0

di Coulomb 113 o anche gauge trasversa.


113
Il punto di partenza è sempre rappresentato, naturalmente, dalle equazioni di Maxwell per
i campi elettrico E ⃗ e magnetico B,
⃗ i.e.

1 ∂B⃗

div E = 4πρ ⃗ =−
rotE (2.516)
c ∂t


div B = 0 ⃗ = 4π J⃗ + 1 ∂ E
rotB (2.517)
c c ∂t
⃗ si conclude, come è noto, che possiamo trovare un poten-
Dall’equazione sulla divergenza di B

99
⃗ tale che
ziale vettore A
⃗ x, t) ≡ rotA(⃗
B(⃗ ⃗ x, t) (2.518)

Esso, proprio perché è definito a meno di un termine irrotazionale, è indeterminato a meno


della somma del gradiente di una funzione scalare Γ(⃗x, t) qualsiasi, i.e. vale la libertà di gauge
per cui
⃗ x, t) → A(⃗
A(⃗ ⃗ x, t) + ∇Γ(⃗
⃗ x, t) (2.519)

⃗ dall’equazione relativa alla sua rotazione abbiamo che


Venendo ora al campo elettrico E,
( )
1 ∂ ⃗
B 1 ∂ 1 ∂ ⃗
A
rotE⃗ =− =− ⃗ ⇒ rot E
rotA ⃗+ =0 (2.520)
c ∂t c ∂t c ∂t

e dunque è possibile trovare una funzione V (⃗x, t) tale che


⃗ + 1 ∂ A = −∇V
E ⃗ (2.521)
c ∂t
Sostituendo adesso nella equazione della divergenza del campo elettrico, si ha
( )
1 ∂ ⃗
A 1 ∂
4πρ = div E⃗ = div −∇V⃗ − = −∇2 V − ⃗
div A (2.522)
c ∂t c ∂t

ovvero otteniamo l’equazione


1 ∂
∇2 V = −4πρ − ⃗
div A (2.523)
c ∂t
⃗ ricaviamo che
Analogamente, dall’equazione per la rotazione di B,
( )
4π ⃗ 1 ∂ E⃗ 4π 1 ∂ 1 ∂ ⃗
A
J+ = rotB⃗ ⇒ J⃗ = − −∇V
⃗ − ⃗
+ rot rotA (2.524)
c c ∂t c c ∂t c ∂t

D’altronde, per un qualunque campo vettoriale ⃗a risulta che

rot rot ⃗a = −∇2⃗a + ∇


⃗ (div ⃗a) (2.525)

e dunque abbiamo che

4π ⃗ 1 ∂ ⃗ 1 ∂2A ⃗ ( )
J= ∇V + 2 2 − ∇2 A ⃗+∇⃗ div A

c c ∂t c ∂t
1 ∂ 2⃗
A 4π ⃗ 1 ∂ ⃗ ( )
⇒ ∇2 A
⃗− = − J + ∇V + ∇
⃗ div A
⃗ (2.526)
c2 ∂t2 c c ∂t

Usiamo adesso la libertà di gauge (2.519) per imporre che div A⃗ = 0.



Partendo infatti da un qualunque potenziale vettore  che riproduca, attraverso la sua rotazione
il campo magnetico B ⃗ assegnato, possiamo sommargli il gradiente della funzione Γ che soddisfa
l’equazione


∇2 Γ = −div  (2.527)

100

⃗ = Â
E’ immediato allora che il nuovo potenziale A + ∇Γ
⃗ ha divergenza nulla, infatti
( )
div A⃗ = div  + ∇Γ
⃗ = div  + ∇2 Γ ≡ 0 (2.528)

Questa gauge è appunto la gauge di Coulomb, detta anche gauge di radiazione perché parti-
colarmente utile per descrivere la radiazione elettromagnetica ovvero i campi elettromagnetici
in assenza di cariche e correnti.
In questa gauge, essendo div A⃗ = 0, i potenziali soddisfano le equazioni

∇2 V = −4πρ (2.529)
1 ∂2A⃗ 4π ⃗ 1 ∂ ⃗
∇2 A
⃗− = − J+ ∇V (2.530)
c2 ∂t2 c c ∂t
Il potenziale scalare appare come se si propagasse in modo istantaneo, cioè a velocità infinita,
mentre questo non accade per il potenziale vettore che, in questa gauge, soddisfa l’equazione
delle onde con un termine di sorgente che è − 4π c J + c ∂t ∇V .
⃗ 1∂ ⃗
Data anche questa differenza di comportamento, nessuna meraviglia che la gauge di Coulomb
non sia covariante per trasformazioni di Lorentz ! Comunque, riguardo alla propagazione
istantanea del potenziale scalare, sia chiaro che essa non prefigura alcuna inconsistenza con la
⃗ e
Relatività Ristretta perché, in effetti, ciò che determina il moto delle cariche sono i campi E

B e non il quadripotenziale e questi campi sono evidentemente invarianti rispetto alla gauge !
Concludiamo infine con una osservazione circa il significato della sorgente del potenziale
vettore (nella gauge di Coulomb). Abbiamo visto che

1 ∂2A⃗ 4π 1 ∂ ⃗
∇2 A
⃗−
2 2
= − J⃗ + ∇V (2.531)
c ∂t c c ∂t

Ricordiamo adesso che, come qualunque campo vettoriale, anche la corrente J⃗ può essere de-
composta in modo univoco nella somma di una parte irrotazionale J⃗L ed una parte a divergenza
nulla J⃗T

J⃗ = J⃗L + J⃗T con rotJ⃗L = 0 e div J⃗T = 0 (2.532)

La sorgente del campo vettoriale di cui alla (2.531) risulta essere appunto la parte a divergenza
⃗ infatti
nulla della corrente J,
( )
4π ⃗ 1 ∂ ⃗ 4π 1 ∂ 2 4π 4π ∂
div − J + ∇V = − div J⃗ + ∇ V = − div J⃗ − ρ=
c c ∂t c c ∂t c c ∂t
( )
4π ∂ρ
=− div J⃗ + =0 (2.533)
c ∂t

⃗ infatti se partiamo dall’identità


Essa può essere espressa in termini della sola corrente J,
⃗ = ∇(div
rot(rotJ) ⃗ ⃗ − ∇2 J⃗ ⇒ ∇2 (J⃗L + J⃗T ) = ∇(div
J) ⃗ J⃗L ) − rot(rotJ⃗T ) (2.534)

essendo, come ben noto, la funzione di Green del laplaciano data da − 4π


1
|⃗
1
x−⃗ y | , i.e.
( )
1 1
∇2x − = δ 3 (⃗x − ⃗y ) (2.535)
4π |⃗x − ⃗y |

101
Questa gauge non è covariante al cambiare del sistema di riferimento inerziale:
lo risulta unicamente a meno di una trasformazione di gauge ristretta !

Figure 9: Polarizzazioni lineari del fotone e sua direzione di propagazione

Per un’onda che viaggia nella direzione ⃗k dell’asse z, possiamo scegliere

⃗ϵz (1) = (1, 0, 0) (2.538)


⃗ϵz (2) = (0, 1, 0) (2.539)

e questo corrisponde a scegliere polarizzazioni lineari e reali, per cui, evidente-


mente risulta

⃗ϵz (i)∗ = ⃗ϵz (i), i = 1, 2 (2.540)

Per ipotesi, i versori ⃗ϵz (1), ⃗ϵz (2) e ⃗k/|⃗k| formano una terna destrorsa, rispet-
tivamente come gli assi cartesiani x, y, z: seguendo la convenzione usata da
Bjorken e Drell114 assumeremo che sia

⃗ϵ−z (1) = −⃗ϵz (1) (2.541)


⃗ϵ−z (2) = ⃗ϵz (2) (2.542)
ecco che, per quanto detto sopra circa l’indipendenza di J⃗L e J⃗T , risulta
∫ ⃗ y , t)
∇2 J⃗L = ∇(div
⃗ J⃗L ) ≡ ∇(div
⃗ ⃗ ⇒ J⃗L (⃗x, t) = − 1 ∇
J) ⃗ d3 y
div J(⃗
(2.536)
4π |⃗x − ⃗y |
∫ ⃗
⃗ ⇒ J⃗T (⃗x, t) = 1 rot rot d3 y J(⃗y , t) (2.537)
∇2 J⃗T = −rot(rotJ⃗T ) ≡ −rot(rotJ)
4π |⃗x − ⃗y |

114
J.D. Bjorken, S.D. Drell: Relativistic Quantum Fields, McGraw-Hill 1965

102
Un’altra scelta equivalente è quella di usare polarizzazioni circolari, i.e., sem-
pre per un fotone che viaggia lungo l’asse z
1 1
⃗ϵz (+) = √ (−⃗ϵz (1) − i⃗ϵz (2)) = − √ (1, i, 0) elicita′ λ = +1 (2.543)
2 2
1 1
⃗ϵz (−) = √ (⃗ϵz (1) − i⃗ϵz (2)) = √ (1, −i, 0) elicita′ λ = −1 (2.544)
2 2
ed in questo caso, risulta evidentemente che

⃗ϵz (±)∗ = −⃗ϵz (∓) (2.545)

Sempre nel caso di polarizzazioni circolari, date le (2.541) e (2.542), risulta altresı̀
1
⃗ϵ−z (+) = √ (⃗ϵz (1) − i⃗ϵz (2)) = ⃗ϵz (−) (2.546)
2
1
⃗ϵ−z (−) = √ (−⃗ϵz (1) − i⃗ϵz (2)) = ⃗ϵz (+) (2.547)
2
i.e.

⃗ϵ−z (±) = ⃗ϵz (∓) (2.548)

Fin qui si è sempre assunto che l’impulso sia diretto come l’asse z, nel suo verso
oppure in verso opposto.
Vediamo ora che succede nel caso generico in cui

k µ = (k, ⃗k) (2.549)

Posto che sia


⃗k = k (sinθ cosϕ, sinθ sinϕ, cosθ) (2.550)

allora iniziamo definendo la rotazione seguente:

R⃗k = Rz (ϕ) Ry (θ) Rz−1 (ϕ) ≡ e−iϕL3 e−iθL2 eiϕL3 (2.551)

dove gli Lj sono i consueti generatori delle rotazioni in tre dimensioni, i.e. le
matrici

(Lj )kl = −i ϵjkl (2.552)

103
Questa rotazione gode della proprietà per cui115

R⃗k (0, 0, 1) = (sinθ cosϕ, sinθ sinϕ, cosθ) ⇒ R⃗k (0, 0, k) = ⃗k (2.556)

Poniamo dunque, per definizione116

⃗ϵ(⃗k, s) ≡ R⃗k ⃗ϵz (s) ⇒ ϵµ (s, ⃗k) ≡ (0,⃗ϵ(⃗k, s)) (2.557)

Essendo R reale, ne segue in particolare che, per polarizzazioni circolari, risulta


(si ricordi che le componenti dei vettori di polarizzazione sono comunque solo
spaziali...)

⃗ϵz (±)∗ = −⃗ϵz (∓) ⇒ ϵ∗µ (λ, ⃗k) = −ϵµ (−λ, ⃗k) = ϵµ (−λ, ⃗k) (2.558)
⃗ϵz (±) = ⃗ϵ−z (∓) ⇒ ϵµ (λ, ⃗k) = ϵµ (−λ, −⃗k) = −ϵµ (−λ, −⃗k) (2.559)
115
Ricordiamo, per prima cosa, che una generica trasformazione attiva di rotazione R in tre
dimensioni può essere sempre scritta come R = e−i α⃗ ·L dove α

α| è l’asse di rotazione (lasciato
⃗ /|⃗
invariato dalla stessa ...) ed |⃗
α| è l’ampiezza della rotazione stessa (in senso antiorario, intorno
all’asse di cui sopra): la rotazione (2.551) risulta essere una rotazione di θ intorno all’asse
⃗n = Rz (ϕ)⃗n0 , dove ⃗n0 ≡ (0, 1, 0).
Per dimostarlo, partiamo dal fatto che, in generale, risulta che R ei⃗α·L R−1 = ei(R⃗α)·L , ovvero la
⃗ ⃗

trasformazione in questione sulla generica rotazione ei⃗α·L non altera l’ampiezza della rotazione

ma solo l’asse intorno cui essa avviene che, invece di essere individuato dall’originale α ⃗ , è
individuato da R⃗ α.
Essendo nel nostro caso

e−i⃗n0 ·L

Ry (θ) = (2.553)
 
cosϕ − sinϕ 0
Rz (ϕ) ≡ e−iϕ L3 =  sinϕ cosϕ 0  (2.554)
0 0 1

è evidente che Rz (ϕ)⃗n0 = (−sinϕ, cosϕ, 0) ≡ ⃗n è l’effettivo asse intorno a cui avviene la ro-
tazione (2.551) e dunque che Rz (ϕ) Ry (θ) Rz−1 (ϕ) descrive una rotazione di θ intorno all’asse ⃗n
che, su basi semplicemente geometriche, manda evidentemente il versore (0, 0, 1) in ⃗k.
Verifichiamolo adesso direttamente. Si ha infatti

Rz (ϕ) Ry (θ) Rz−1 (ϕ) (0, 0, k) = Rz (ϕ) Ry (θ) (0, 0, k) = Rz (ϕ) (k sinθ, 0, k cosθ) =
= k(sinθ cosϕ, sinθ sinϕ, cosθ)

che è quanto volevamo dimostrare. In forma esplicita, la rotazione in questione è


 
sin2 ϕ + cos2 ϕ cosθ sinϕ cosϕ(cosθ − 1) sinθ cosϕ
R⃗k =  sinϕ cosϕ(cosθ − 1) cos2 ϕ + sin2 ϕ cosθ sinθ sinϕ  (2.555)
−sinθ cosϕ − sinθ sinϕ cosθ

116
Ne segue, allora, per esempio, che la convenzione sopracitata di Bjorken e Drell (2.541)
e (2.542) corrisponde, semplicemente, ad individuare il vettore (0, 0, −k) rispetto al vettore
(0, 0, k) attraverso gli angoli di Eulero θ = π, ϕ = 0 ...

104
Riguardo allo sviluppo del campo elettromagnetico in termini di operatori di
creazione e distruzione, questo è dato117 da (Ep ≡ |⃗p|)
2 ∫
∑ d3 p [ −ipx † ∗µ
]
Aµ (x) = a(⃗
p , s) ϵ µ
(s, p
⃗) e + a (⃗
p , s) ϵ (s, p
⃗) e ipx

s=1 2Ep (2π)3


∑ ∫ d3 p [ ]
µ −ipx † ∗µ ipx
= a(⃗
p , λ) ϵ (λ, p
⃗) e + a (⃗
p , λ) ϵ (λ, p
⃗) e (2.560)
λ=±1 2Ep (2π)3

dove la somma è fatta solo sui due stati di polarizzazione fisici e ϵµ (λ, p⃗) de-
scrive appunto lo stato118 di polarizzazione del fotone generato dall’operatore di
creazione a† (⃗p, λ), quando esso viene applicato al vuoto.
Si osservi che, per come è stato definito, il campo Aµ (x) risulta certamente
autoaggiunto119 !
Quanto poi all’algebra del campo, essa è definita attraverso le seguenti uniche
regole di commutazione non banali
[a(⃗p, s) , a† (⃗q, r)] = 2Ep (2π)3 δ(⃗q − p⃗) δsr (2.562)

E veniamo adesso alla determinazione delle proprietà di trasformazione del


campo Aµ (x) sotto il gruppo di Poincaré.
E’ evidente, a questo riguardo, come sia fondamentale determinare per prima cosa
le proprietà di trasformazione delle polarizzazioni ϵµ sotto il gruppo di Lorentz.
Procediamo per questo in modo strettamente simile a quanto fatto nel caso
massivo ed iniziamo fissando un quadrimpulso ”canonico” del fotone k̂ cosı̀ fatto
p̂µ ≡ (k̂, 0, 0, k̂) (2.563)
117
cfr. J.D. Bjorkeen, S.D. Drell: Relativistic Quantum Fields, McGraw-Hill 1965, pag.74
Si faccia attenzione che, come vedremo fra breve, l’espressione (2.560) non conduce ad una
legge di trasformazione del campo Aµ di tipo quadrivettoriale, come potrebbe apparentemente
sembrare !
118
Infatti la funzione d’onda del fotone individuato dallo stato a† (⃗
p, λ) |Ω > è data, per le
ragioni già considerate in dettaglio in precedenza per il campo scalare, da
µ
ψp,λ (x) = < Ω| Aµ (x) a† (⃗
p, λ) |Ω >=
∑ ∫ 3
d q [ ]
= 3
< Ω| a(⃗q, λ′ ) ϵµ (⃗q, λ′ ) e−iqx + a† (⃗q, λ′ ) ϵ∗µ (⃗q, λ′ ) eiqx a† (⃗
p, λ) |Ω >=
(2π) 2Eq
λ′
∑∫ d3 q
= ϵµ (⃗q, λ′ ) e−iqx (2π)3 δλλ′ δ(⃗q − p⃗) 2Eq = ϵµ (⃗q, λ) e−ipx (2.561)

(2π)3 2Eq
λ

119
Essendo il campo Aµ autoaggiunto, la lagrangiana che ne descrive la dinamica non può
essere invariante per trasformazioni di gauge di prima specie e dunque non può esistere una
corrente conservata ad essa associata ...

105
che, come vedremo, giocherà il ruolo del quadrimpulso p̂ = (m, 0, 0, 0) per le
particelle provviste di massa.
Come si è detto, per questo quadrimpulso k̂, possiamo scegliere le due seguenti
polarizzazioni indipendenti
1 1
ϵµ (+, k̂) = √ (0, −1, −i, 0); ϵµ (−, k̂) = √ (0, 1, −i, 0) (2.564)
2 2
E’ poi immediato verificare che le polarizzazioni che noi abbiamo usato nel caso
di impulso spaziale di modulo qualsiasi k, ma comunque diretto lungo l’asse z si
ottengono a loro volta semplicemente attraverso la legge di trasformazione

ϵµ (±, k) = B(k)µ.ν ϵν (±, k̂) (2.565)

dove B(k) è il boost lungo l’asse z che trasforma il quadrivettore k̂ µ = (k̂, 0, 0, k̂)
in k µ = (k, 0, 0, k): essendo le componenti di ϵµ (±, k̂) trasverse rispetto all’asse
z, evidentemente questo boost non è in grado di modificarle, per cui (come del
resto noi avevamo assunto ...), in accordo con la (2.565) risulta

ϵµ (±, k) = ϵµ (±, k̂) (2.566)

Nel caso in cui ⃗k non sia diretto lungo l’asse z, abbiamo poi stabilito che

ϵµ (±, (k, ⃗k)) = R(⃗k) ϵµ (±, k) = R(⃗k) B(k) ϵµ (±, k̂) ≡ L(k)ϵµ (±, k̂) (2.567)

dove R(⃗k) è definita dalla (2.555) e la matrice di Lorentz L(k), funzione del
quadrivettore k = (|⃗k|, ⃗k), è definita come

L(k) ≡ R(⃗k) B(|⃗k|) (2.568)

e dunque è evidentemente tale che


( )µ
L(k)µ.ν k̂ ν = R(⃗k) B(|⃗k|) k̂ ν = k µ (2.569)

In questo modo le polarizzazioni ϵµ (±, k), qualunque sia il quadrimpulso k del


fotone, hanno comunque sempre parte temporale nulla (oltre, naturalmente ad
essere tali che kµ ϵµ = 0), sinonimo, questo, del fatto di operare nella gauge di
Coulomb.
D’altronde, se, come effettivamente accade data la (2.560 ), le proprietà di trasfor-
mazione del campo Aµ (x) sotto il gruppo di Lorentz sono una diretta conseguenza
di quelle della polarizzazione ϵµ , ecco che il campo non potrà trasformarsi sem-
plicemente come un campo quadrivettoriale perché una trasformazione di Lorentz
qualsiasi che opera sul quadrivettore ϵµ produce, in generale, anche una compo-
nente temporale che, per quanto detto, il campo non dovrebbe possedere ...
Cerchiamo dunque di capire meglio questo aspetto della questione.

106
Supponiamo per questo di voler determinare il quadrivettore Λ ϵ(±, k) con
k = (E, ⃗k) quadrivettore light-like generico (E = |⃗k|). Abbiamo che

Λ ϵ(±, k) = Λ L(k) ϵ(±, k̂) = L(Λk) L−1 (Λk) Λ L(k) ϵ(±, k̂) (2.570)

ma

L−1 (Λk) Λ L(k) k̂ = k̂ (2.571)

e dunque la matrice di Lorentz

P(Λ, k) ≡ L−1 (Λk) Λ L(k) (2.572)

appartiene al piccolo gruppo del quadrivettore k̂.


Sostituendo nella (2.570), ricaviamo

Λ ϵ(±, k) = L(Λk) P(Λ, k) ϵ(±, k̂) (2.573)

la quale mostra come, in ultima analisi, Λ ϵ(±, k) sia determinato dall’azione di


P(Λ, k) su ϵ(±, k̂).
Siccome, come si è detto, P(Λ, k) appartiene al piccolo gruppo di k̂, iniziamo con
lo studiare questo sottogruppo del gruppo di Lorentz.
Si può dimostrare che esso è un gruppo di Lie a tre parametri i cui generatori, in
termini dei consueti generatori del gruppo di Lorentz, sono i seguenti

X ≡ J1 + K2 ; Y ≡ J2 − K1 ; J3 (2.574)

e l’algebra di Lie del gruppo, di conseguenza, è definita dai commutatori120

[X, Y ] = 0; [J3 , X] = i Y ; [J3 , Y ] = −i X (2.578)

Come si vede, il piccolo gruppo di k̂ è isomorfo al gruppo euclideo in due di-


mensioni E(2), fatto dalle trasformazioni rigide del piano in sé (due traslazioni
indipendenti ed una rotazione ...).
Esplicitamente abbiamo
   
0 0 1 0 1 0 0−1
 0 0 0 0   0 0 0 0 
   
X = i  ⇒ X2 = −   ⇒ X3 = 0 (2.579)
 1 0 0−1   0 0 0 0 
0 0 1 0 1 0 0−1
120
Infatti abbiamo

[X, Y ] = [J1 + K2 , J2 − K1 ] = [J1 , J2 ] − [K2 , K1 ] = i J3 − iJ3 = 0 (2.575)


[J3 , X] = [J3 , J1 + K2 ] = i J2 − iK1 = i Y (2.576)
[J3 , Y ] = [J3 , J2 − K1 ] = −i J1 − iK2 = −i X (2.577)

107
per cui risulta che
 
α2 α2
1+ 0 −α −
 2 2 
α2 2  0 1 0 0 
eiαX = I + iα X − X =


 (2.580)
2  −α 0 1 α 
α2 2
2
0 −α 1 − α2

Analogamente abbiamo
   
0−1 0 0 1 0 0−1
 −1 0 0 1   0 0 0 0 
Y = i

 
 ⇒ Y 2 = −

 ⇒ Y3 =0 (2.581)
 0 0 0 0   0 0 0 0 
0−1 0 0 1 0 0−1

da cui ne segue che


 
β2 2
1+ β 0 − β2
 2 
β2 2  β 1 0 −β 
e iβY
= I + iβ Y − Y =


 (2.582)
2  0 0 1 0 
β2 2

2
β 0 1 − β2

Ed infine risulta
   
0 0 0 0 1 0 0 0
 0 0−1 0   0 cosϕ sinϕ 0 
   
J3 = i   ⇒ eiϕJ3 =   (2.583)
 0 1 0 0   0 − sinϕ cos ϕ 0 
0 0 0 0 0 0 0 1

Il generico elemento del piccolo gruppo del quadrivettore k̂ può dunque essere
messo sempre nella forma seguente121

P(α, β, ϕ) = ei(αX+βY ) eiϕJ3 (2.590)


121
Iniziamo osservando che, siccome X ed Y commutano tra loro, il termine ei(αX+βY ) nella
(2.590) non richiede particolari commenti. Quanto alla posizione della rotazione, si ricordi che
J⃗ e K⃗ sono operatori vettoriali, per cui

R−1 Jl R = Rlm Jm ; R−1 Kl R = Rlm Km (2.584)

e dunque, nel caso della rotazione R = R(ϕ) ≡ eiϕJ3 , abbiamo che

R−1 X R = X cosϕ + Y sinϕ; R−1 Y R = Y cosϕ − X sinϕ (2.585)

D’altronde evidentemente risulta

ei(αX+βY ) R = R R−1 ei(αX+βY ) R (2.586)

ma
−1
R−1 ei(αX+βY ) R = eiR (αX+βY )R
(2.587)

108
e, per ipotesi, esso lascia invariante il quadrivettore k̂, come del resto è immediato
provare direttamente dalle (2.580 ), (2.582 ) e (2.583 ) .
Nella (2.573), però, P(Λ, k) agisce sul quadrivettore di polarizzazione e non su k̂!
Quale ne è l’effetto ?
E’ immediato dalla (2.580 ) che risulta, in generale, che
iα iα
eiαX ϵµ (±, k̂) = ϵµ (±, k̂) + √ (1, 0, 0, 1) = ϵµ (±, k̂) + √ k̂ µ (2.591)
2 2k̂
e cosı̀ pure, dalla (2.582 ), che
β
eiβY ϵµ (±, k̂) = ϵµ (±, k̂) ∓ √ k̂ µ (2.592)
2k̂
ovvero, ponendo
α + iβ
√ ≡ ρ eiχ (2.593)
2k̂
si ha
α ± iβ µ
ei(αX+βY ) ϵµ (±, k̂) = ϵµ (±, k̂) + i √ k̂ =
2k̂
= ϵµ (±, k̂) + i ρ e±iχ k̂ µ (2.594)

mentre, evidentemente, risulta122

eiϕJ3 ϵµ (±, k̂) = e±iϕ ϵµ (±, k̂) (2.597)


mentre

R−1 (αX + βY )R = α(X cosϕ + Y sinϕ) + β(Y cosϕ − X sinϕ) =


= X(α cosϕ − β sinϕ) + Y (β cosϕ + α sinϕ) ≡ αR X + βR Y (2.588)

per cui possiamo concludere infine che vale comunque l’identità

ei(αX+βY ) R = R ei(αR X+βR Y ) (2.589)

{ }
122
La (2.594) e la (2.597) definiscono in ciascuno degli spazi lineari bidimensionali ϵ(+, k̂), k̂
{ }
e ϵ(−, k̂), k̂ una rappresentazione fedele del piccolo gruppo di k̂.
E’ del tutto evidente che entrambe le rappresentazioni sono irriducibili e quanto ai generatori
X, Y, J3 , posto per comodità di notazione ξ ≡ √12k̂ , risulta:
{ } ( ) ( ) ( )
0 0 0 0 1 0
ϵ(+, k̂), k̂ : X=ξ ; Y = iξ ; J3 = (2.595)
1 0 1 0 0 0
{ } ( ) ( ) ( )
0 0 0 0 1 0
ϵ(−, k̂), k̂ : X=ξ ; Y = −i ξ ; J3 = − (2.596)
1 0 1 0 0 0

per cui le due rappresentazioni sono palesemente entrambe non unitarie.

109
dunque, se poniamo

L−1 (Λk) Λ L(k) ≡ P(Λ, k) ≡ P(α, β, ϕ) (2.598)

dove α, β, ϕ saranno, evidentemente, funzioni opportune di Λ e k µ , ecco che


potremo concludere che

Λ ϵ(±, k) = L(Λk) P(α, β, ϕ) ϵ(±, k̂) =


[ ]
α ± iβ µ ±iϕ
= L(Λk) ϵ (±, k̂) + i √
µ
k̂ e =
2k̂
[ ]
= e±iϕ ϵµ (±, Λk) + i ρ e±iξ (Λk)µ (2.599)

Come si vede, dunque, sotto l’azione di una trasformazione del gruppo di Lorentz,
i quadrivettori di polarizzazione che abbiamo definito nella gauge di Coulomb ac-
quistano, in generale, un termine proporzionale a k µ .
Questo fatto è ineliminabile dal punto di vista algebrico ma, come vedremo
fra breve, è senza conseguenze osservabili, data proprio l’arbitrarietà di gauge
ristretta che abbiamo quanto al campo Aµ .
Ma procediamo con ordine.
Definiamo dunque la legge di trasformazione degli operatori di creazione e
distruzione associati al campo elettromagnetico, sotto l’azione della rappresen-
tazione unitaria123 del gruppo di Poincaré U (a, Λ) definita nello spazio di Hilbert
dei vettori di stato, nel modo seguente

U (a, Λ) a(k, ±) U −1 (a, Λ) = e−ia·Λk a(Λk, ±) e∓iϕ (2.600)


U (a, Λ) a† (k, ±) U −1 (a, Λ) = eia·Λk a† (Λk, ±) e±iϕ (2.601)

dove ϕ è la fase definita dalla trasformazione

P(α, β, ϕ) ≡ P(Λ, k) = L−1 (Λk) Λ L(k) ≡ ei(αX+βY ) eiϕJ3 (2.602)

123
Anche nel caso di massa nulla, il piccolo gruppo è non abeliano, come nel caso massivo. La
novità è che adesso esso è anche non-compatto e dunque non possiede rappresentazioni unitarie
fedeli (isomorfismi) di dimensioni finita.
Le uniche rappresentazioni unitarie di dimensione finita che esistono mandano il sottogruppo
generato da X ed Y nell’identità e quindi sono rappresentazioni del sottogruppo (compatto)
U (1) generato da J3 , e dunque, se irriducibili, sono unidimensionali.
Quanto ai quadrivettori di polarizzazione ϵ(±), gli elementi del piccolo gruppo agiscono su di
essi mescolando ciascuno di loro con k µ , per cui la rappresentazione del piccolo gruppo cosı̀
indotta è definita necessariamente in uno spazio bidimensionale fatto da ϵ(+) o ϵ(−), ciascuno
insieme a k.
Questa, in ultima analisi, è la ragione della impossibilità di mantenersi nella gauge di Coulomb.

110
Abbiamo allora che, posto per semplicità di notazione U ≡ U (a, Λ), da quanto
sopra risulta124
∑ ∫ d3 p [ ]
µ −1 −1 µ −ipx
U A (x) U = U a(p, λ) U ϵ (λ, p) e + h.c. =
λ=±1 2Ep (2π)3
∑ ∫ dp [
3 ]
−ia·Λp −iλϕ µ −ipx
= a(Λp, λ) e e ϵ (λ, p) e + h.c. =
λ=±1 2Ep (2π)3
∑ ∫ d3 q [ ]
−iaq −iλϕ µ −1 −iq·Λx
= a(q, λ) e e ϵ (λ, Λ q) e + h.c. (2.603)
λ=±1 2Eq (2π)3

dove si è posto q = Λp.


D’altronde dalla (2.599) si ricava immediatamente che (λ = ±1)

α + iλβ
ϵ(λ, Λp) = e−iλϕ Λϵ(λ, p) − i √ (Λp) = e−iλϕ Λϵ(λ, p) − iρ eiλξ (Λp) (2.604)
2k̂
essendo α, β, ϕ definiti dalla (2.602) per p ≡ k e ρ, ξ essendo definiti dalla (2.593)
in termini di α e β. Dunque, in tutta generalità, avremo

′ α′ + iλβ ′ −1
ϵ(λ, Λ−1 q) = e−iλϕ Λ−1 ϵ(λ, q) − i √ (Λ q) =
2k̂
′ ′
= e−iλϕ Λ−1 ϵ(λ, q) − iρ′ eiλξ (Λ−1 q) (2.605)

dove i parametri α′ , β ′ , ϕ′ (ed in conseguenza i parametri ρ′ e ξ ′ ) sono definiti


adesso dalla relazione (si ricordi che q ≡ Λp ...)
′ ′ ′
P ′ (α′ , β ′ , ϕ′ ) ≡ ei(α X+β Y ) eiϕ J3 = L−1 (Λ−1 q) Λ−1 L(q) =
[ ]−1 [ ]−1
= L−1 (q) Λ L(Λ−1 q) = L−1 (Λp) Λ L(p) (2.606)

Ma se, per definizione, risulta

P(α, β, ϕ) ≡ L−1 (Λp) Λ L(p) = ei(αX+βY ) eiϕJ3 (2.607)

allora, essendo evidentemente

P(α′ , β ′ , ϕ′ ) = P −1 (α, β, ϕ) (2.608)

risulta di conseguenza che

P(α′ , β ′ , ϕ′ ) = e−iϕJ3 e−i(αX+βY ) (2.609)


124
p, λ) ≡ a(p, λ) e
Rispetto alla (2.560), useremo qui di seguito notazioni semplificate, i.e. a(⃗
ϵ (λ, p⃗) ≡ ϵµ (λ, p).
µ

111
ovvero125 che

P(α′ , β ′ , ϕ′ ) = e−iϕJ3 e−i(αX+βY ) = e−i[αR X+βR Y ] e−iϕJ3 (2.611)

e dunque

α′ = −αR = −(αcosϕ − βsinϕ); β ′ = −βR = −(βcosϕ + αsinϕ) (2.612)


ϕ′ = −ϕ (2.613)

Prima di procedere, si osservi che, essendo i parametri α′ , β ′ semplicemente ruo-


tati di ϕ rispetto ad α, β e quindi cambiati di segno, ne segue che

ρ′ = ρ; ξ′ = ξ + ϕ + π (2.614)

e dunque

ρ′ eiξ = −ρ ei(ξ+ϕ) (2.615)

per cui risulta infine


( )
ϵ(λ, Λ−1 q) = eiλϕ Λ−1 ϵ(λ, q) + iρ eiλξ (Λ−1 p) (2.616)

Sostituendo nella (2.603 ) abbiamo allora che


∑ ∫ d3 q [ ]
µ −1 −iaq −iλϕ µ −1 −iq·Λx
U A (x) U = a(q, λ) e e ϵ (λ, Λ q) e + h.c. =
λ=±1 2Eq (2π)3
∑ ∫ d3 q [ ( ) ]
−iaq −iq·Λx −1 µ ν iλξ −1 µ
= a(q, λ) e e (Λ ).ν ϵ (λ, q) + iρe (Λ q) + h.c. =
λ=±1 2Eq (2π)3
∑ ∫ d3 q [ ]
= (Λ−1 )µ.ν a(q, λ) e−iaq −iq·Λx ν
e ϵ (λ, q) + h.c. +
λ=±1 2Eq (2π)3
∑ ∫ d3 q [ ]
−iaq −iq·Λx iλξ −1 µ
+ i a(q, λ) e e ρe (Λ q) + h.c.
λ=±1 2Eq (2π)3

Evidentemente, quanto al primo addendo nell’espressione precedente, risulta


∑ ∫ d3 q [ ]
(Λ−1 )µ.ν a(q, λ) e−iaq −iq·Λx ν
e ϵ (λ, q) + h.c. ≡
λ=±1 2Eq (2π)3
(Λ−1 )µ.ν ν
A (a + Λx) (2.617)
125
Infatti, usando la (2.589), abbiamo che
( )−1
P(α′ , β ′ , ϕ′ ) = e−iϕJ3 e−i(αX+βY ) = P −1 (α, β, ϕ) = ei(αX+βY ) eiϕJ3 =
( )−1
= eiϕJ3 ei(αR X+βR Y ) = e−i(αR X+βR Y ) e−iϕJ3 (2.610)

112
mentre, circa il secondo, esso può essere evidentemente espresso come
∑ ∫ d3 q [ ]
−iaq −iq·Λx iλξ −1 µ
a(q, λ) e e ρe (Λ q) + h.c. =
λ=±1 2Eq (2π)3
∑ ∫ d3 q [ ]
−iaq −i(Λ−1 q)·x iλξ −1 µ
= a(q, λ) e e ρe (Λ q) + h.c. =
λ=±1 2Eq (2π)3
∑ ∫ d3 q [ ]
−iaq −i(Λ−1 q)·x
= −∂ µ
a(q, λ) e e ρeiλξ
+ h.c. =
λ=±1 2Eq (2π)3
≡ ∂ µ Φ(x) (2.618)

dove abbiamo posto


∑ ∫ d3 q [ ]
−iaq −i(Λ−1 q)·x
Φ(x) ≡ − a(q, λ) e e ρeiλξ
+ h.c. =
λ=±1 2Eq (2π)3
∑ ∫ d3 q [ ]
−iaq −iq·Λx
= − a(q, λ) e e ρe iλξ
+ h.c. (2.619)
λ=±1 2Eq (2π)3

Dalla sua stessa definizione segue evidentemente che 2Φ(x) = 0, dunque il ter-
mine (2.618) descrive proprio una trasformazione di gauge ristretta su Aµ (x) e
quindi può essere eliminato senza conseguenze osservabili.

E’ solo in questo senso, cioè a meno di una trasformazione di gauge (a sua


volta
{ intimamente
} legata alle rappresentazioni del piccolo gruppo di k̂ negli spazi
ϵ(±, k̂), k̂ ), che possiamo concludere che il campo elettromagnetico si trasforma
come un campo quadrivettoriale, i.e. che risulta

U (a, Λ)Aµ (x) U −1 (a, Λ) = (Λ−1 )µ.ν Aν (a + Λx) (2.620)

113
Venendo infine all’azione delle simmetrie discrete C, P e T , usando stati di
polarizzazione circolari, risulta che

C a(⃗k, λ) C −1 = −a(⃗k, λ) ←→ C a† (⃗k, λ) C −1 = −a† (⃗k, λ) (2.621)


C Aµ (x) C −1 = −Aµ (x) (2.622)

P a(⃗k, λ) P −1 = −a(−⃗k, −λ) ←→ P a† (⃗k, λ) P −1 = −a† (−⃗k, −λ) (2.623)


P Aµ (x) P −1 = Aµ (P x) (2.624)

T a(⃗k, λ) T −1 = a(−⃗k, λ) ←→ T a† (⃗k, λ) T −1 = a† (−⃗k, λ) (2.625)


T Aµ (x) T −1 = Aµ (T x) (2.626)

Osserviamo adesso in particolare che, nel momento in cui richiediamo che

C a(⃗p, λ)C −1 = −a(⃗p, λ); C a† (⃗p, λ)C −1 = −a† (⃗p, λ) (2.627)

stiamo dicendo che fotone e antifotone sono la stessa particella, cosa del resto
ovvia visto che il campo è autoaggiunto ...
Come si vede, però, il fatto che particella e antiparticella in questo caso coinci-
dano, non implica che C non abbia alcun effetto sullo stato di fotone, infatti dalla
(2.627) segue immediatamente che

C | ⃗k, s >= − | ⃗k, s > (2.628)

ovvero che su uno stato di n fotoni, risulta

C | n f otoni >= (−1)n | n f otoni > (2.629)

e poiché l’elettrodinamica (QED) è invariante sotto C, da questo segue in par-


ticolare che non possono esistere elementi di matrice, dovuti all’interazione elet-
tromagnetica, fra stati C-dispari con un numero di fotoni pari e stati C-pari con
un numero di fotoni dispari: è, in buona sostanza, il teorema di Furry126 .

126
W.H. Furry: A symmetry theorem in the positron theory, Phys. Rev. 51, 125 (1937)

114
2.3.3 Il decadimento del π 0
Proviamo adesso ad applicare quanto detto fino ad ora circa le simmetrie discrete
ed i campi, per esempio, al caso del decadimento del pione π 0 .
Esso decade quasi unicamente per via elettromagnetica in due fotoni
π0 → γ γ (2.630)
attraverso l’annichilazione della coppia di quarks/antiquarks che lo compongono.
Siccome il processo è, appunto, elettromagnetico, si devono conservare separata-
mente C, P e T . Vediamo con quali conseguenze.
Iniziamo dalla conservazione di C.
Evidentemente, visto che i fotoni sono autostati dispari della coniugazione di car-
ica, i.e. eiηC (γ) = −1, ne segue immediatamente che il pione deve essere anch’esso
autostato della coniugazione di carica, corrispondente all’autovalore +1, dovendo
appunto essere
0
eiηC (π ) = eiηC (γ) · eiηC (γ) = (−1)2 = +1 (2.631)
i.e.
C|π 0 >= +|π 0 > (2.632)
Poi sappiamo anche che il pione è pseudoscalare127 : quali sono le conseguenze
sullo stato dei due fotoni in relazione alla conservazione di P ?
127
La parità intrinseca del π 0 viene determinata, come vedremo tra breve, proprio attraverso
lo studio della correlazione fra gli stati di polarizzazione lineare dei due fotoni emessi; ma questa
strada però, come è ovvio, è percorribile solo per il pione neutro...
Quanto, invece al pione carico, per esempio, al pione π − , la sua parità intrinseca è stata
determinata attraverso lo studio della reazione di cattura nucleare che segue alla cattura elet-
tromagnetica del π − da parte del deutone, i.e. la reazione

π− + d → n + n (2.633)

Il deutone, come è noto, è in uno stato J P = 1+ . Ricordiamo a questo proposito che, siccome la
forza forte conserva la parità, ci attendiamo che lo stato fondamentale di deutone abbia parità
definita: si trova infatti che questo sostanzialmente uno stato L = 0 con una piccola contami-
nazione da L = 2 (infatti possiede un piccolo momento di quadrupolo elettrico, incompatibile
con la simmetria sferica di L = 0), dunque uno stato pari. Quanto allo spin, esso deve essere
S = 1 per ragioni di statistica: i due nucleoni devono essere infatti in uno stato globalmente
dispari per scambio e, visto che l’isospin del deutone è nullo e dunque lo stato di isospin dei
due nucleoni che lo formano è dispari mentre la parte orbitale è pari, ne segue che lo stato di
spin deve essere anch’esso pari e dunque può essere solo S = 1.
Quanto al mesone π − , si assume di sapere che esso abbia spin nullo (la dimostrazione speri-
mentale di questo fatto sarà data in seguito e si basa sul confronto delle sezione d’urto della
reazione π + + d → p + p con quella della sua inversa).
Ne segue che (cfr. K. Brueckner et al. in Phys. Rev. 81, 575 (1951)), siccome la cattura
(2.633) avviene in onda S (la forza forte è una forza a corto range, perché possa agire è nec-
essario dunque che la funzione d’onda del pione si sovrapponga apprezzabilmente a quella del
deutone e questo, come è noto dalla teoria dell’atomo di idrogeno, avviene sostanzialmente solo

115
Consideriamo, per semplicità, il caso del decadimento a riposo.
La conservazione del quadriimpulso richiede che entrambi i fotoni abbiano la
stessa energia (pari a metà della massa del π 0 ...) ed impulsi spaziali esattamente
opposti: chiameremo asse z il loro asse di propagazione.
Sappiamo poi che il π 0 ha spin nullo, dunque le elicità dei due fotoni non potranno
che essere le stesse (conservazione del momento angolare) e quindi lo stato dei
due fotoni potrà essere rappresentato come

|k, + > | − k, + > e |k, − > | − k, − > (2.635)

Occorre però tenere ora di conto del fatto che i fotoni sono bosoni identici e quindi
che lo stato deve essere simmetrico di scambio, per cui, in realtà, gli stati possibili

per stati aventi L = 0) evidentemente lo stato di partenza deve essere tale che J P = 1x dove
x è appunto la parità intrinseca, ignota, del pione. Lo stato finale dei due neutroni, essendo la
reazione mediata dalla forza forte che conserva la Parità, ha la stessa parità dello stato iniziale
e dunque (visto che il momento angolare deve anche lui conservarsi !) è anch’esso tale per cui
J P = 1x . Trattandosi di un sistema non relativistico, spin e momento orbitale sono separabili:
siccome i neutroni hanno spin 1/2, lo stato di spin della coppia può essere solo S = 0 oppure
S = 1 per cui, per le ben note regole di composizione dei momenti angolari, dovendo lo stato
avere J = 1, può solo essere

J =1 ⇒ L = 0, S = 1
L = 1, S = 0
L = 1, S = 1
L = 2, S = 1

D’altronde lo stato dei due neutroni deve essere antisimmetrico per scambio, ovvero, visto che,
per scambio, la funzione d’onda orbitale va come (−1)L e quella di spin come (−1)S+1 , deve
risultare

(−1)L · (−1)S+1 = −1 (2.634)

la quale implica che L + S debba essere pari e l’unico caso che realizza questa condizione ed
è compatibile con J = 1 è L = 1, S = 1. Ma allora, assunto che la parità si conservi nel
processo (interazione forte), poiché la parità dello stato dei due neutroni è (−1)L = −1, questa
deve essere anche la parità dello stato iniziale. Ma il fatto che la cattura avvenga in onda S
garantisce che la parità orbitale dello stato (π − d) sia positiva e siccome la parità intrinseca
del deutone è anch’essa positiva (ricordiamo che, per convenzione, neutroni e protoni hanno
la stessa parità intrinseca che è definita pari a +1, senza che questo possa avere conseguenze
osservabili visto che il numero barionico si conserva), ne segue che la parità intrinseca del pione
deve essere Pπ = −1, cioè il pione negativo deve essere, appunto, una particella pseudoscalare.
Per il pione positivo, ovviamente non si può fare lo stesso ragionamento perché, essendo positivo,
non subisce la cattura elettromagnetica da parte del nucleo e quella nucleare che ne consegue;
però, siccome esso è C−coniugato con il pione negativo e le simmetrie P e C commutano, deve
valere anche per lui la stessa conlusione, i.e. che è pseudoscalare.

116
sono
1
|A > ≡ √ (|k, + > | − k, + > +| − k, + > |k, + >) (2.636)
2
1
|B > ≡ √ (|k, − > | − k, − > +| − k, − > |k, − >) (2.637)
2
dove il primo vettore descrive lo stato del fotone che chiamiamo ”1” mentre
il secondo vettore quello del fotone che chiamiamo ”2”, fra i quali si opera lo
scambio.
Poiché abbiamo visto che, per parità, risulta

P |⃗k, ± >= −| − ⃗k, ∓ > (2.638)

evidentemente né |A > né |B > sono autostati della parità, bensı̀128

P |A >= |B >; P |B >= |A > (2.639)

D’altronde, per la conservazione di P nelle interazioni elettromagnetiche, essendo

P |π 0 >= −|π 0 > (2.640)

lo stato dei due fotoni deve essere autovettore di P per l’autovalore −1, e quindi
deve essere descritto dalla combinazione lineare seguente
1
|2 γ dal π 0 > = √ [|A > −|B >] ≡ |2γ, P = −1 >=
2
1
= [|k, + > | − k, + > +| − k, + > |k, + > −
2
− |k, − > | − k, − > −| − k, − > |k, − >] (2.641)

Come possiamo distinguere questo stato, per esempio, da quello corrispondente


allo stato di parità +1 (che imporrebbe o la non conservazione della parità nel
decadimento o una parità intrinseca positiva del π 0 ) ?
Per esempio, se guardiamo il fotone che viaggia nel verso positivo dell’asse z ed
osserviamo che ha una certa elicità definita λ, è immediato che ne concludiamo
comunque che anche l’altro fotone ha la stessa elicità e quindi non ci apprendiamo
nulla circa la parità dello stato.
Proviamo invece a vedere che succede se misuriamo lo stato di polarizzazione
lineare del fotone che si muove nel verso positivo dell’asse z lungo, per esempio,
l’asse x. Poiché per la (2.543) e la (2.544) evidentemente è
1 ( )
⃗ϵx (⃗k) ≡ ⃗ϵ(⃗k, 1) = √ ⃗ϵ(⃗k, −) − ⃗ϵ(⃗k, +) (2.642)
2
128
Si noti che la parità intrinseca del fotone, ancorchè negativa, non ha rilevanza in quanto
stiamo dicendo essendo coinvolti un numero pari di fotoni ...

117
ecco che, se partiamo dallo stato |2γ, P = −1 > di cui sopra, allora se il fotone
che si muove nel verso positivo dell’asse z viene osservato trovarsi nello stato di
polarizzazione lungo l’asse x, ne segue che lo stato del fotone che si muove nel
verso negativo dell’asse z, vista la (2.641) e la (2.642) deve essere il seguente
1
|γ(−k) > = √ (−| − k, − > −| − k, − > −| − k, + > −| − k, + >)
2 2
1
= − √ (| − k, − > +| − k, + >) (2.643)
2
e dunque il suo stato di polarizzazione, sempre per le definizioni (2.543) e la
(2.544), risulta essere il seguente
1( )
⃗ϵ(γ(−k)) = − −2i⃗ϵ(−⃗k, 2) = i⃗ϵy (−k) (2.644)
2
ovvero il fotone che viaggia lungo il verso negativo dell’asse z deve risultare
polarizzato lungo y: in altri termini, la polarizzazione lineare dei due fotoni deve
risultare ortogonale.
Questo risultato è una diretta conseguenza della parità dello stato di partenza:
se assumiamo infatti che questa sia +1, ovvero che
1
|2 γ > = √ (|A > +|B >) ≡ |2γ, P = +1 >=
2
1
= (|k, + > | − k, + > +| − k, + > |k, + > +
2
+ |k, − > | − k, − > +| − k, − > |k, − >) (2.645)
allora, se è stata osservata la polarizzazione del fotone che viaggia nel verso
positivo dell’asse z allineata lungo l’asse x, lo stato del fotone che si propaga in
verso opposto deve necessariamente essere il seguente
1
|γ(−k) > = √ (| − k, − > +| − k, − > −| − k, + > −| − k, + >)
2 2
1
= √ (| − k, − > −| − k, + >) (2.646)
2
ed il suo stato di polarizzazione risulta allora il seguente
1( )
= 2⃗ϵ(−⃗k, 1) = ⃗ϵx (−k) (2.647)
2
ovvero le polarizzazioni lineari dei due fotoni sono, in questo caso, parallele.
Sperimentalmente si verifica che le polarizzazioni sono ortogonali129 , coerente-
mente con il fatto che P è conservata e che il π 0 è pseudoscalare.
129
La polarizzazione di un fotone di alta energia viene inferita attraverso l’osservazione del
piano definito dalla coppia e+ e− a cui esso dà origine, che tende ad essere allineato, appunto,
con la direzione di polarizzazione lineare del gamma, come mostrato da N.M. Kroll e W. Wada
in Phys. Rev. 98, 1355 (1955).

118
2.3.4 Il campo di Dirac libero
L’evoluzione del campo di Dirac130 libero è retta dalla lagrangiana131
i
L = [ψγ µ (∂µ ψ) − (∂µ ψ)γ µ ψ] − m ψψ (2.667)
2
130
Le matrici γ µ sono matrici 4 × 4 che anticommutano fra di loro, risultando (si tratta della
loro definizione costitutiva !)
{γ µ , γ ν } = 2 δ µν (2.648)
Per quanto riguarda la loro forma esplicita, useremo la rappresentazione di Dirac-Pauli, i.e.
( ) ( )
0 I 0 i 0 σi
γ = γ = (2.649)
0 −I −σi 0
essendo ⃗σ ≡ (σi ) le usuali matrici di Pauli, i.e.
( ) ( ) ( )
0 1 0 −i 1 0
σ1 = , σ2 = , σ3 = (2.650)
1 0 i 0 0 −1
Le γ µ sono quindi tutte reali, eccetto la γ 2 che è immaginaria pura.
Accanto alle matrici γ µ , si definisce altresı̀ la matrice reale γ5 nel modo seguente
( )
0 I
γ5 ≡ iγ γ γ γ =
0 1 2 3
⇒ (γ5 )2 = I (2.651)
I 0
Essa anticommuta con tutte le γ µ .
La matrice γ 0 (come pure la γ5 ...) è hermitiana, mentre le γ i sono antihermitiane (essendo le
matrici di Pauli, invece, ovviamente hermitiane...).
Da questo e dalla (2.648) segue immediatamente che
γ 0 (γ µ )† γ 0 = γ µ (2.652)
Venendo adesso alla legge di trasformazione sotto il gruppo di Poincaré del campo di Dirac,
essa è la seguente:
(a, Λ) : x → x′ = a + Λx (2.653)
ψ(x) → ψ ′ (x′ ) = S(Λ) ψ(x) (2.654)
ovvero, in termini delle trasformazioni unitarie U (a, Λ) che costituiscono la rappresentazione
del gruppo di Poincaré definita sullo spazio degli stati del sistema (trasformazione attiva)
U −1 (a, Λ) ψ(x) U (a, Λ) = ψ ′ (x) = S(Λ) ψ(Λ−1 (x − a)) (2.655)
da cui, equivalentemente, si ricava che
U (a, Λ) ψ(x) U −1 (a, Λ) = S −1 (Λ) ψ(Λx + a) (2.656)
La rappresentazione S(Λ) del gruppo di Lorentz (ortocrono proprio) è la rappresentazione
spinoriale ed è definita (cfr. (A.150)) nel modo seguente
i µν 1
S(Λ) = e 4 ω σµν
con σµν = [γµ , γν ] (2.657)
2i
Si dimostra (cfr. (A.153)) che, sotto questa rappresentazione, le γ µ si trasformano come un
quadrivettore, ovvero che risulta
S −1 (Λ) γ µ S(Λ) = Λµ.ν γ ν (2.658)

119
Dalla definizione (2.657) della rappresentazione S(Λ) discende direttamente che

• siccome (σµν )† = − 2i
1
(γµ γν − γν γµ ) = 1 † †
2i [γµ , γν ] e γ 0 㵆 γ 0 = γµ , ecco che si ha

γ 0 S(Λ)† γ 0 = S(Λ−1 ) = S −1 (Λ) (2.659)

per cui la rappresentazione S(Λ) non è unitaria (né potrebbe mai esserlo trattandosi di
una rappresentazione non banale di dimensione finita di un gruppo non abeliano non
compatto ...).
Dalla (2.659) segue in particolare che, prendendo l’hermitiana coniugata della (2.656) e
ricordando che (γ 0 )2 = I, quanto al campo ψ̄, risulta

U (a, Λ) ψ † (x) U −1 (a, Λ) = ψ † (Λx + a) S † (Λ−1 ) ⇒


⇒ U (a, Λ) ψ † (x) U −1 (a, Λ)γ 0 = ψ † (Λx + a) γ 0 γ 0 S † (Λ−1 )γ 0 ⇒
⇒ U (a, Λ) ψ̄(x) U −1 (a, Λ) = ψ̄(Λx + a) S(Λ) (2.660)

⃗ J⃗
⃗ = eiθ·
• la generica rotazione R(θ) , definita dal vettore di rotazione θ⃗ ≡ θ ⃗n, essa viene
rappresentata da
⃗Σ
⃗ = e 2i θ· ⃗
S(θ) = cos(θ/2) I + i(⃗n · Σ)
⃗ sin(θ/2) (2.661)

dove si è posto
( )
⃗ ≡ ⃗σ 0
Σ (2.662)
0 ⃗σ

• il generico boost B(⃗v ) = eiy ⃗n·K , definito dalla velocità v ⃗n , risulta rappresentato da

S(⃗v ) = e− 2 y ⃗n·⃗α = ch(y/2) I − (⃗n · α


1
⃗ ) sh(y/2) (2.663)

dove abbiamo definito la rapidità al solito modo, i.e. y ≡ th−1 (v) e si è posto
( )
0 ⃗σ
⃗≡
α (2.664)
⃗σ 0

• siccome la matrice γ5 anticommuta con tutte del γ µ , essa commuta con σµν ed è quindi
scalare per trasformazioni di Lorentz, i.e. risulta

S −1 (Λ) γ5 S(Λ) = γ5

131
Al posto della lagrangiana (2.667) viene spesso usata la forma seguente, non simmetrica
nei campi ψ e ψ̄

L = ψ(iγ µ ∂µ − m)ψ (2.665)

E’ immediato dimostrare che le due lagrangiane sono equivalenti fra loro, visto che la loro
differenza è una quadridivergenza dei campi, essendo appunto
i i
∆L = [ψγ µ (∂µ ψ) + (∂µ ψ)γ µ ψ] = ∂µ [ψ̄γ µ ψ] (2.666)
2 2

120
da cui si ricava appunto l’equazione132 di Dirac per ψ e per ψ̄ ≡ ψ † γ 0 , cosı̀
espressa

(i γ µ ∂µ − m) ψ = 0; i ∂µ ψ γ µ + m ψ = 0 (2.668)

√ 2
In prima quantizzazione, posto Ep ≡ p + m2 , le soluzioni piane dell’equazione
di Dirac hanno la forma

u(⃗p) e−ip·x ; v(⃗p) eip·x (2.669)

dove gli spinori u(⃗p) e v(⃗p) soddisfano, rispettivamente, alle seguenti equazioni133

(̸ p − m)u(⃗p) = 0 (2.670)
(̸ p + m)v(⃗p) = 0 (2.671)

dove p ≡ (Ep , p⃗) ed abbiamo definito134 ̸ p ≡ pµ γ µ .


Per quanto riguarda, poi, gli spinori ū e v̄, essi soddisfano le stesse equazioni
degli spinori u e v, con la sola differenza che adesso l’operatore agisce sullo spinore

132
Osserviamo che, moltiplicando, per esempio, l’equazione di Dirac per la ψ a sinistra per
l’operatore i ∂µ γ µ + m otteniamo

(i2 γ µ γ ν ∂µ ∂ν − m2 )ψ = 0

La condizione {γ µ , γ ν } = 2 δ µν è costitutiva della definzione delle γ proprio perché essa assicura


che la ψ (come pure la ψ ...) descrive una particella libera di massa m, i.e. soddisfa l’equazione
di Klein-Gordon
(2 + m2 )ψ = 0
Si osservi che questa equazione di K-G, comunque, avrebbe quattro soluzioni ad energia positiva
e quattro ad energia negativa, cioè il doppio di quelle dell’equazione di Dirac !
La cosa non deve stupire visto che è stata ottenuta ”iterando” in un certo senso l’equazione di
Dirac di partenza, passando da un’equazione alle derivate prima in una alle derivate seconde ...
133
Chiaramente, le equazioni (2.670) e (2.671) sono le equazioni algebriche in cui prende forma
l’equazione di Dirac quando si vada in rappresentazione dell’impulso !
134
Ricordiamo alcune proprietà algebriche degli operatori che stiamo trattando. Risulta

(̸p ± m)(̸p ± m) = (m± p̸ )(m± p̸ ) =


= (pµ γ µ ± m)(pν γ ν ± m) = pµ pν γ µ γ ν ± 2m p̸ + m2
1
= pµ pν {γ µ γ ν } ± 2m p̸ + m2 = p2 ± 2m p̸ + m2 =
2
= 2m2 ± 2m p̸ = 2m(m± p̸ ) (2.672)

mentre è

(̸p ± m)(̸p ∓ m) = pµ pν γ µ γ ν − m2 = 0 (2.673)

121
a destra, invece che a sinistra, i.e. risulta135

ū(⃗p)(̸ p − m) = 0 (2.678)
v̄(⃗p)(̸ p + m) = 0 (2.679)

Gli spinori u(⃗p) individuano soluzioni ad energia positiva, infatti

∂ [ ]
i u(⃗p) e−i p·x = Ep u(⃗p) e−i p·x (2.680)
∂t
a differenza degli spinori v(⃗p) che, invece, per la stessa ragione, individuano
soluzioni ad energia negativa: per entrambi i tipi di soluzione, poi, esistono due
componenti indipendenti dei relativi spinori, i quali, da ora in poi saranno quindi
individuati anche con un indice r opportuno, i.e.

u(⃗p) → u(r) (⃗p); v(⃗p) → v (r) (⃗p) r = 1, 2

La definizione esplicita degli spinori u e v che noi adotteremo è la seguente136


m+ ̸ p (r) (r) m+ ̸ p
u(r) (⃗p) ≡ √ u0 ⇔ ū(r) (⃗p) = ū0 √ (2.681)
m + Ep m + Ep
m− ̸ p (r) (r) m− ̸ p
v (r) (⃗p) ≡ √ v0 ⇔ v̄ (r) (⃗p) = v̄0 √ (2.682)
m + Ep m + Ep
135
Dimostriamo, per esempio, la (2.678). Prendiamo dunque l’hermitiana coniugata della
(2.670) e moltiplichiamola a destra per γ 0 .
Evidentemente si ha
+
[(̸p − m)u(⃗
p)] γ 0 = 0 (2.674)

ovvero

p)+ (̸p − m)+ γ 0 = u(⃗


0 = u(⃗ p)+ γ 0 γ 0 (̸p − m)+ γ 0 = ū(⃗
p) γ 0 (̸p − m)+ γ 0 (2.675)

e siccome le γ i sono antiermitiane ed anticommutano con γ 0 , che, invece, è hermitiana ed il suo


quadrato è pari all’identità, abbiamo

γ 0 (̸p − m)+ γ 0 = (̸p − m) (2.676)

per cui risulta infine che l’equazione per ū ha la forma seguente


+
[(̸p − m)u(⃗
p)] γ 0 = 0 ⇒ p) (̸p − m) = 0
ū(⃗ (2.677)

c.v.d.
136
Data la relazione (2.673), è evidente che gli spinori u e v definiti rispettivamente dalle
(2.681) e (2.682) soddisfano le equazioni (2.670 ), (2.671 ), i.e. l’equazione di Dirac. In più, oc-
corre osservare che le definizioni in questione servono a fissare la normalizzazione delle soluzioni.

122
dove abbiamo posto137
       
1 0 0 0
 0   1   0   0 
(1)   (2)   (1)   (2)  
u0 =   ; u0 =   ; v0 =   ; v0 = −   (2.683)
 0   0   0   1 
0 0 1 0
per cui, definendo per comodità
( ) ( )
1 0
w(1) = ; w(2) = (2.684)
0 1

si ha138
( )  √ 
1 (m + Ep ) w(r) Ep + m w(r)
u(r) (⃗p) = √ =  √  (2.686)
m + Ep (⃗p · ⃗σ ) w(r) Ep − m (⃗n · ⃗σ ) w(r)

dove si è usato il fatto che p⃗ = Ep2 − m2 ⃗n.
Per quanto riguarda, poi, gli spinori v (r) , ponendo adesso, in analogia con la
(2.684)
( ) ( )
0 1
w̃ (1)
=w (2)
= ; w̃ (2)
= −w (1)
=− (2.687)
1 0

dalla loro definizione139 risulta che


( )  √ 
1 (⃗p · ⃗σ ) w̃(r) Ep − m (⃗n · ⃗σ ) w̃(r)
(r)
v (⃗p) = √ =  √  (2.689)
m + Ep (m + Ep ) w̃(r) Ep + m w̃(r)

e queste due relazioni (2.686) e (2.689) mostrano chiaramente come, nel limite di
bassa energia, le piccole e le grandi componenti degli spinori u e v si separino in
modo opposto.
137
Può sembrare che la scelta (2.683) per quanto concerne le v sia quantomeno bizzarra. La
(1)
ragione è che, come vedremo, nel sistema di quiete, è proprio lo spinore associato a v0 che
descrive lo stato di antiparticella di componente di spin sz = 1/2 (ovvero lo stato con energia
(2)
negativa con sz = −1/2), mentre quello associato a v0 descrive quello con sz = −1/2.
138
Risulta infatti che, indicando con I l’identità in due dimensioni, esplicitamente risulta
( ) ( )
(m + Ep )I − ⃗σ · p⃗ (m − Ep )I ⃗σ · p⃗
(m+ p̸ ) = ; (m− p̸ ) = (2.685)
⃗σ · p⃗ (m − Ep )I −⃗σ · p⃗ (m + Ep )I

ed usando queste espressioni, le (2.686) e (2.689) seguono immediatamente dalle definizioni


(2.681) e (2.682), rispettivamente di u(r) (⃗
p) e v (r) (⃗
p).
139
Quanto ai vettori bidimensionali w e w̃(i) , risulta
(i)

w̃(i) = (−i σ2 )ji w(j) ⇐⇒ w(i) = (i σ2 )ji w̃(j) (2.688)

dove σ2 è la matrice di Pauli, generatore in SU (2) delle rotazioni intorno all’asse y.

123
Gli spinori u e v descrivono lo stato di spin della particella/antiparticella e
giocano, in buona sostanza, lo stesso ruolo giocato, per esempio, dal quadrivet-
tore di polarizzazione ϵµ (p) del campo vettoriale carico W µ .
Vediamo intanto quali sono le loro proprietà di trasformazione sotto la rappresen-
tazione del gruppo di Lorentz S(Λ) definita, appunto, nello spazio degli spinori.
Iniziamo per questo dimostrando che, se B(p) è il boost di Lorentz definito dalla
(2.451), tale per cui, posto p̂ ≡ (m, 0, 0, 0), allora B(p) p̂ = p, risulta semplice-
mente
u(s) (p) = S(B(p)) u(s) (p̂); v (s) (p) = S(B(p)) v (s) (p̂) (2.690)
Ricordiamo intanto che, per quanto si è già visto, per i boosts di Lorentz puri
(che agiscono, cioè, senza ruotare gli assi) vale la (2.663).
Nel nostro caso, poiché il boost, per sua stessa definizione, avviene con velocità
opposta a quella definita dall’impulso p⃗ della particella stessa, ecco che se poniamo
p⃗
⃗v = ≡ v ⃗n ed y = th−1 (v) (2.691)
E
ne segue che
y y
S(B(p)) = ch I + (⃗n · α
⃗ ) sh (2.692)
2 2
dove le matrici α
⃗ sono definite dalla (2.664). Risulta dunque
( )
ch y2 sh y2 (⃗n · ⃗σ )
S(B(p)) = (2.693)
sh 2 (⃗n · ⃗σ )
y
ch y2

per cui, in termini dei vettori a due dimensioni w(r) definiti dalla (2.684), per
quanto concerne gli spinori u, abbiamo
( )
(r)
√ ch y2 w(r)
S(B(p)) u (p̂) = 2m (2.694)
sh y2 (⃗n · ⃗σ ) w(r)
D’altronde, in tutta generalità, risulta

α α 1 + ch α α 1 + ch α
ch α = 2 ch2 − 1 ⇒ ch2 = ⇒ ch = (2.695)
2 2 2 2 2
e si ha anche
1 1
1 − th2 α = ⇒ ch 2
α = (2.696)
ch2 α 1 − th2 α
Da quest’ultima relazione, essendo, evidentemente, nel nostro caso th y = v, segue
che
√ √ √
1 y 1+γ 1 + E/m E+m
ch y = √ = γ ⇒ ch = = = (2.697)
1−v 2 2 2 2 2m

124
Analogamente abbiamo
√ √ √
y y E+m E−m
sh = ch2 − 1 = −1= (2.698)
2 2 2m 2m
per cui risulta infine che
( √ (r)
)
(r) √ E + m w
S(B(p)) u (p̂) = = u(r) (p) (2.699)
E − m (⃗n · ⃗σ ) w(r)

come mostra la (2.686).


Per lo spinore v risulta analogamente che
( )
(r)
√ sh y2 (⃗n · ⃗σ ) w̃(r)
S(B(p)) v (p̂) = 2m (2.700)
ch y2 w̃(r)

dove w̃(r) sono i vettori di cui alla (2.687).


Per le considerazioni svolte in precedenza riguardo agli spinori u e tenendo pre-
sente la (2.689), risulta altresı̀ provato che

S(B(p)) v (r) (p̂) = v (r) (p) (2.701)

Ma veniamo ora al caso generale, i.e. a valutare, per esempio, l’espressione


S(Γ) u(s) (p). Abbiamo

S(Γ) u(s) (p) = S(Γ) S(B(p)) u(s) (p̂) = S(B(Γp)) S(B −1 (Γp)) S(Γ) S(B(p)) u(s) (p̂) =
= S(B(Γp)) S(B−1 (Γp) Γ B(p)) u(s) (p̂) (2.702)

ma B −1 (Γp) Γ B(p) ≡ R(Γ, p) è la rotazione di Wigner individuata da p e Γ, che


abbiamo gia definito con la (2.475): come ogni rotazione, essa sarà individuata
da un opportuno vettore θ⃗ ≡ θ ⃗n, ed avremo allora, per la (2.661), che, in termini
di questo vettore, risulterà

S(R(Γ, p)) = cos(θ/2) I + i sin(θ/2) (⃗n · Σ)


⃗ (2.703)

dove le matrici Σ⃗ sono definite dalla (2.662).


Siccome S(R), come per qualunque rotazione, è evidentemente diagonale rispetto
alle grandi/piccole componenti, possiamo definire in modo ovvio la matrice R(θ, ⃗n)
di SU (2), corrispondente alla rotazione R(Γ, p), nel modo seguente

R(θ, ⃗n) = cos(θ/2) I + i sin(θ/2)(⃗n · ⃗σ ) ≡ R(Γ, p) (2.704)

e risulta allora

S(R(Γ, p))u(s) (p̂) = R(Γ, p)ks u(k) (p̂) (2.705)

125
e quindi, dalla (2.702), finalmente che

S(Γ) u(s) (p) = R(Γ, p)ks u(k) (Γp) (2.706)

Per quanto riguarda poi lo spinore v, siccome le rotazioni sono diagonali


rispetto alle piccole e grandi componenti ed agiscono su di loro nello stesso modo,
la conclusione sarebbe esattamente la stessa di quella tratta per lo spinore u se,
nella definizione di v (s) (p), fosse stato scelto il vettore w(s) di cui alla (2.684),
invece del vettore w̃(s) di cui alla (2.687), legati fra loro da una rotazione di 1800
intorno all’asse y, essendo infatti

w̃(r) = (−i σ2 )sr w(s) ⇐⇒ w(s) = (i σ2 )rs w̃(r) (2.707)

Si dimostra140 allora che, in termini della stessa matrice R(Γ, p) che compare nella
140
Dimostriamo direttamente la (2.721).
Applicando le stesse considerazioni svolte per u(s) (p), giungiamo evidentemente alla conclusione
per cui

S(Γ) v (s) (p) = S(B(Γp)) S(R(Γ, p)) v (s) (p̂) (2.708)

Ma, essendo R una rotazione, data la sua struttura (2.661), potrà solo rimescolare gli spinori
v (k) (p̂), k = 1, 2 fra di loro, i.e. necessariamente dovrà risultare

S(R(Γ, p)) v (s) (p̂) = Mrs v (r) (p̂) ⇒ S(Γ) v (s) (p) = Mrs v (r) (Γp) (2.709)

dove M sarà una matrice 2 × 2 opportuna, che adesso vogliamo determinare.


A questo scopo, osserviamo che, ponendo

(i σ2 )sa v (s) (p̂) ≡ v̂ (a) (p̂) (2.710)

data la (2.707), risulta che lo spinore v̂ (a) (p̂) è definito in termini del vettore w(a) esattamente
come u(a) (p̂) (a parte l’inversione grandi/piccole componenti, irrilevante per le considerazioni
che stiamo svolgendo vista la struttura ”diagonale” di S(R)), per cui possiamo senz’altro con-
cludere che

S(R(Γ, p)) v̂ (a) (p̂) = Rba v̂ (b) (p̂) (2.711)

ovvero che

(i σ2 )sa S(R(Γ, p)) v (s) (p̂) ≡ S(R(Γ, p)) v̂ (a) (p̂) = Rba v̂ (b) (p̂) ≡ Rba (i σ2 )tb v (t) (p̂) (2.712)

Sostituendo allora nella (2.708), abbiamo


[ ]
(i σ2 )sa S(Γ) v (s) (p) = (i σ2 )sa S(B(Γp)) · S(R(Γ, p)) v (s) (p̂) = S(B(Γp)) (i σ2 )sa S(R(Γ, p)) v (s) (p̂) =
[ ]
= S(B(Γp)) Rba (i σ2 )tb v (t) (p̂) = Rba (i σ2 )tb v (t) (Γp) ≡ (iσ2 · R)ta v (t) (Γp) (2.713)

ma, per la (2.709), deve essere anche che

S(Γ) v (s) (p) = Mrs v (r) (Γp) ⇒ (i σ2 )sa S(Γ) v (s) (p) = (i σ2 )sa Mrs v (r) (Γp) ≡
≡ (M · iσ2 )ra v (r) (Γp) (2.714)

126
(2.706), cioè dell’elemento R(Γ, p) di SU (2) definito dalla rotazione di Wigner

R(Γ, p) ≡ B −1 (Γp) Γ B(p) (2.720)

risulta adesso

S(Γ) v (s) (p) = R∗ (Γ, p)ks v (k) (Γp) (2.721)

Quanto infine agli spinori ū e v̄, siccome vale l’identità γ 0 S † (Γ)γ 0 = S −1 (Γ),
è facile dimostrare da quanto precede che risulta

ū(s) (⃗p) S −1 (Γ) = R(Γ, p)∗ks ū(k) (Γp)


⃗ (2.722)
v̄ (s) (⃗p) S −1 (Γ) = R(Γ, p)ks v̄ (k) (Γp)
⃗ (2.723)

e quindi, dal confronto della (2.713) con la (2.714), abbiamo infine che deve essere

(M · iσ2 ) = (iσ2 · R) ⇒ M = (iσ2 ) R (−iσ2 ) = σ2 R σ2 (2.715)

D’altronde, la rotazione R ≡ R(Γ, p) di SU (2) avrà necessariamente la struttura usuale di una


rotazione, i.e. se ⃗n individua l’asse di rotazione intorno a cui si procede per un angolo θ, sarà

R = e 2 θ ⃗n·⃗σ = I · cos(θ/2) + i(⃗n · ⃗σ )sin(θ/2)


i
(2.716)

per cui

σ2 R σ2 = I · cos(θ/2) + i[⃗n · (σ2⃗σ σ2 )]sin(θ/2) (2.717)

D’altronde è facile verificare che

−σi∗ = σ2 σi σ2 (2.718)

visto che σ2 e l’unica matrice di Pauli immaginaria pura e che le altre due anticommutano con
essa. Dunque
⃗ ∗
M = σ2 R σ2 = e− 2 θ·⃗σ = R∗
i
(2.719)

che dimostra, appunto, la (2.721).

127
Ritornando alle proprieta degli spinori u e v, dalle definizioni (2.681) e (2.682)
segue141 inoltre che gli spinori u e v soddisfano le relazioni algebriche seguenti

ū(s) (⃗p) u(r) (⃗p) = 2m δsr (2.724)


u†(s) (⃗p) u(r) (⃗p) = 2Ep δsr (2.725)
v †(s) (⃗p) v (r) (⃗p) = 2Ep δsr (2.726)
v̄ (s) (⃗p) v (r) (⃗p) = −2m δsr (2.727)

Passiamo adesso a definire i proiettori Λ± sugli stati di energia positiva e


negativa. Dalla definizioni delle u e delle v, unitamente alle (2.672) e (2.673),
141
Dalla definizione (2.681), usando la (2.672) e la (2.686), segue immediatamente che

(̸p + m) (̸p + m) (r)


ū(s) (p) u(r) (p) = ū(s) (0) u (0) =
m + Ep
2m
= ū(s) (0) (̸p + m) u(r) (0) = 2m δrs
m + Ep

la quale dimostra appunto la (2.724).


Un altro modo per arrivare alla stessa conclusione è quello di osservare che, data la (2.690),
ū u è scalare per trasformazioni di Lorentz e dunque basta valutarlo nel sistema del centro di
massa dove, evidentemente, esso vale proprio 2m δrs
Veniamo ora alla dimostrazione esplicita della (2.725). Per l’equazione di Dirac, si ha

ū(p) (̸p − m) = 0 = (̸p − m) u(p)

e quindi risulta
ū(p) [(̸p − m) γ µ + γ µ (̸p − m)] u(p) = 0
ovvero
−2m ū(p) γ µ u(p) + ū(p){̸p, γ µ }u(p) = 0
d’altronde
{̸p, γ µ } = pν {γ ν , γ µ } = pν 2δ µν = 2pµ
dunque
2m ū(p) γ µ u(p) = 2pµ ū(p) u(p)
µ
la quale ci dice che ū(p) γ µ u(p) = pm ū(p) u(p) ovvero che ū(p) γ µ u(p) è un quadrivettore, visto
che prima abbiamo dimostrato che ū(p) u(p) è uno scalare.
Va notato ancora una volta che il fatto che ū(p) γ µ u(p) sia un quadrivettore potevamo dedurlo
anche direttamente, infatti, sempre per la (2.690), risulta

ū(p)γ µ u(p) = ū(p̂) S −1 (Λp ) γ µ S(Λp ) u(p̂) = (Λp )µ.ν ū(p̂)γ ν u(p̂)

D’altronde, per come sono definiti, ū(s) (p̂)γ ν u(r) (p̂) = (2m, 0, 0, 0)δrs = 2p̂ δrs e dunque ritro-
viamo appunto che vale la relazione

ū(r) (p)γ µ u(s) (p) = 2pµ δrs

Facendo allora µ = 0, si ottiene infine la (2.725).


Analogamente si procede poi nei casi (2.726) e (2.727).

128
risulta evidente che questi proiettori, una volta fissato il quadrimpulso pµ , non
possono che essere i seguenti
m± ̸ p
Λ± ≡ Λ± (p) = (2.728)
2m
Infatti142
Λ+ + Λ− = I (2.731)
(Λ± )2 = Λ± (2.732)
Λ+ Λ− = 0 (2.733)
Λ+ u = u; Λ+ v = 0 (2.734)
Λ− u = 0; Λ− v = v (2.735)
ovvero essi proiettano rispettivamente sugli stati individuati dagli spinori u(p)
(il proiettore Λ+ (p)), che descrivono, in prima quantizzazione, stati con energia
positiva e su quelli individuati dagli spinori v(p) (il proiettore Λ− (p)), che, sempre
in prima quantizzazione, sono associati agli stati con energia negativa.
Un altro modo estremamente importante di rappresentare questi proiettori
(teorema di Casimir) è il seguente143
1 ∑ (r) (r) 1 ∑ ( (r) )
(Λ+ )αβ = (Γ+ )αβ ≡ uα (⃗p)ūβ (⃗p) = u (⃗p) ū(r) (⃗p) (2.736)
2m r 2m r αβ

−1 ∑ (r) (r) −1 ∑ ( (r) )


(Λ− )αβ = (Γ− )αβ ≡ vα (⃗p)v̄β (⃗p) = v (⃗p) v̄ (r) (⃗p) (2.737)
2m r 2m r αβ

Vediamolo nel caso di Γ+ : dalla definizione, risulta


{ }
1 ∑ (r) (r)
(Γ+ )αβ = (̸ p + m)u0 ū0 (̸ p + m) =
2m(m + Ep ) r αβ
{ [ ] }
1 ∑ (r) (r)
= (̸ p + m) u0 ū0 (̸ p + m) (2.738)
2m(m + Ep ) r αβ

ma in rappresentazione di Dirac-Pauli risulta (gli u0 sono reali ...)


∑ (r) (r) 1 + γ 0 ∑ (r) †(r)
u0 ū0 = ≡ u0 u0 (2.739)
r 2 r

142 †
Si osservi che, poiché per la (A.11) risulta che (γ µ ) = γ 0 γ µ γ 0 , ne segue che (γ 0 γ 0 = 1 ...)

(Λ± )† = γ 0 Λ± γ 0 (2.729)

e dunque, data comunque una soluzione ψ, se definiamo ψ± ≡ Λ± ψ, risulta che

ψ̄± ≡ (ψ± )† γ 0 = ψ † (Λ± )† γ 0 = ψ † γ 0 Λ± γ 0 γ 0 = ψ̄Λ± (2.730)

ovvero i proiettori Λ± agiscono nella stessa forma sia sulle ψ che sulle ψ̄.
143
La sommatoria sull’indice r è estesa, ovviamente, da 1 a 2.

129
dunque
1 1 + γ0
(Γ+ )αβ = (̸ p + m) (̸ p + m) =
2m(m + Ep ) 2
[ ]
1 1 1 0
= (̸ p + m)(̸ p + m) + (̸ p + m)γ (̸ p + m) (2.740)
2m(m + Ep ) 2 2
D’altronde, tenendo conto delle proprietà di anticommutazione delle matrici gamma,
risulta
γ 0 (̸ p + m) = mγ 0 + p0 γ 0 γ 0 + pi γ 0 γ i = mγ 0 + p0 γ 0 γ 0 − pi γ i γ 0 =
= mγ 0 + 2p0 γ 0 γ 0 − ̸ pγ 0 = 2Ep + (m− ̸ p)γ 0 (2.741)
quindi, usando anche la (2.672), si ha infine che
{ [ ] }
1 1
Γ+ = m(̸ p + m) + (̸ p + m) 2Ep + (m− ̸ p)γ 0 =
2m(m + Ep ) 2
1 ̸p + m
= {m(̸ p + m) + Ep (̸ p + m)} = = Λ+ (2.742)
2m(m + Ep ) 2m
Analogamente si dimostra che risulta altresı̀144
− ̸p + m
Γ− = = Λ− (2.744)
2m

Torniamo adesso alle soluzioni dell’equazione di Dirac. Noi sappiamo che,


fissato un impulso spaziale qualunque p⃗, esse sono quattro, per cui è ragionevole
aspettarci che possano esistere altri operatori di proiezione i quali
• commutano con Λ± ;
• separano le soluzioni r = 1, 2.
D’altronde, queste soluzioni, distinte dall’indice r, hanno a che fare con le due
possibili direzioni di polarizzazione dello spin, per cui ci dobbiamo attendere
che questi operatori Π± siano una sorta di generalizzazione del proiettore non
relativistico dello spin che, nella direzione del generico versore ⃗n, come è noto, è
dato, a seconda che il verso sia quello di ⃗n oppure il suo opposto, da
1 ± ⃗n · ⃗σ
P± (⃗n) ≡ (2.745)
2
144
Si ricordi che, pur essendo anche in questo caso gli spinori v0 reali, risulta però
∑ (r) (r) 1 − γ0 ∑ (r) †(r)
v0 v̄0 = − ≡− v0 v0 (2.743)
r
2 r

130
Il primo problema da risolvere, ovviamente, riguarda il modo di generalizzare
la direzione ⃗n in cui effettuare la proiezione: se vogliamo rendere la definizione
covariante145 occorre che questa sia definita tramite un quadrivettore che, nel
sistema del centro di massa individui una direzione spaziale, ovvero sia della
forma (0, ⃗n). Questa richiesta è praticamente già sufficiente allo scopo, infatti ci
dice che il quadrivettore nµ che stiamo cercando dovrà essere tale che

nµ nµ = −1; nµ p µ = 0 (2.746)

Queste condizioni restringono i gradi di libertà su nµ a solo due, e questo è


appunto il numero di gradi di libertà che ci aspettiamo per nµ , visto che una
direzione nello spazio è fissata in termini di soli due angoli. Osserviamo altresı̀
che le condizioni (2.746) non possono fissare il segno del quadrivettore n, e questa
ambiguità di segno corrisponde ai due versi possibili associati alla direzione data.
Proviamo dunque, tentativamente, a definire i proiettori di spin nel modo seguente
1
Π± = (1 ± γ5 ̸ n) (2.747)
2
dove γ5 , come si è già detto, è definita dalla (2.651). Risulta146 allora quanto
segue

[Π± , Λ± ] = 0 (2.755)
145
Come vedremo, questa condizione, in generale, non sarà possibile realizzarla per ogni
trasformazione di riferimento, ma solo per le trasformazioni da e verso il CM .
146
Iniziamo dimostrando la (2.755).
Si ha (l’arbitrarietà di segno è presente in entrambi i proiettori ...)
[ ]
1 ± γ5 n
̸ m± p̸ ±1
, = ̸ , p̸ ]
[γ5 n (2.748)
2 2m 4m
ma

̸ , p̸ ] = nµ pν (γ5 γ µ γ ν − γ ν γ5 γ µ )
[γ5 n (2.749)

e poiché γ5 anticommuta con le γ µ , ne segue che

̸ , p̸ ] = nµ pν γ5 (γ µ γ ν + γ ν γ µ ) = nµ pν γ5 {γ µ , γ ν } = 2 γ5 nµ pµ = 0
[γ5 n (2.750)

che prova quindi la (2.755).


Passiamo adesso a dimostrare la (2.756). Risulta
1 ± γ5 n
̸ 1 ± γ5 n
̸ 1 ± 2γ5 n
̸ + γ5 n
̸ γ5 n
̸
· = (2.751)
2 2 4
ma
1
γ5 n ̸ = nµ nν γ5 γ µ γ5 γ ν = −nµ nν (γ5 )2 γ µ γ ν = −nµ nν {γ µ , γ ν } = −nµ nµ = 1
̸ γ5 n (2.752)
2
per cui
1 ± γ5 n
̸ 1 ± γ5 n
̸ 2 ± 2γ5 n
̸ 1 ± γ5 n
̸
· = = (2.753)
2 2 4 2

131
(Π± )2 = Π± (2.756)
Π+ + Π− = I (2.757)
Π+ Π− = 0 (2.758)

Gli operatori147 Π± cosı̀ definiti hanno quindi le caratteristiche di proiettori che


commutano con le Λ± .
Vediamo adesso quali sono le loro proprietà di trasformazione nel passare dal
sistema del Laboratorio, dove l’impulso della particella è pµ ed il proiettore è
individuato dal quadrivettore nµ , al sistema del CM , attraverso il boost relativo.
Per fissare le idee, occupiamoci di Π+ e supponiamo, per esempio, che sia
( )
Π+ αs u(s) (⃗p) = αs u(s) (⃗p) (2.763)

Il secondo membro dell’equazione (2.763) può, però, scriversi anche come


( )
αs u(s) (⃗p) = αs S(B(p)) u(s) (p̂) = S(B(p)) αs u(s) (p̂) (2.764)

mentre, per quanto riguarda il primo membro, abbiamo


[ ] [ ( )]
Π+ αs u(s) (⃗p) = Π+ S(B(p)) αs u(s) (p̂) =
[ ]
= S(B(p))S −1 (B(p)) Π+ S(B(p)) αs u(s) (p̂) (2.765)

che prova appunto la (2.756).


Quanto poi alla (2.757), essa è evidente. Passando quindi alla (2.758), essa segue dalla (2.752),
infatti
1 ± γ5 n
̸ 1 ∓ γ5 n
̸ 1 − γ5 n̸ γ5 n
̸
· = =0 (2.754)
2 2 4

147
Anche per i proiettori Π± vale la stessa conclusione già tratta per i proiettori Λ± ovvero
che essi agiscono nella stessa forma sia sulle ψ che sulle ψ̄. Infatti
( )† ( )
† 1 ± γ5 n̸ 1± n ̸ † γ5†
(Π± ) = = (2.759)
2 2

ma, sia per il fatto che γ5† = γ5 che per il fatto che (cfr. (2.652)) (γ µ ) = γ 0 γ µ γ 0 , unitamente
al fatto che γ 5 anticommuta con le γ µ , ne segue che

̸ † γ5† = nµ (γ µ ) γ5 = nµ γ 0 γ µ γ 0 γ5 = nµ γ 0 γ5 γ µ γ 0 = γ 0 γ5 n
n ̸ γ0 (2.760)

e dunque, essendo γ 0 γ 0 = 1, risulta che


( )
† ̸ † γ5†
1± n
(Π± ) = = γ 0 Π± γ 0 (2.761)
2

per cui, assegnata comunque una soluzione ψ, se definiamo ψ± ≡ Π± ψ, risulta appunto che

ψ̄± ≡ (ψ± )† γ 0 = ψ † (Π± )† γ 0 = ψ † γ 0 Π± γ 0 γ 0 = ψ̄Π± (2.762)

132
e dal confronto delle due espressioni abbiamo quindi che
[ ] ′
[ ]
S −1 (B(p)) Π+ S(B(p)) αs u(s) (p̂) ≡ Π αs u(s) (p̂) = αs u(s) (p̂) (2.766)

ovvero il fatto che αs u(s) (⃗p) sia proiettato in sé dal proiettore Π+ è equivalente

a dire che il suo stato trasformato nel CM è trasformato in sé dall’operatore Π :
quest’ultimo, in buona sostanza, rappresenta nel CM quello che il proiettore Π+
rappresenta nel Laboratorio. Ma le proprietà di trasformazione delle matrici γ µ
e γ5 sotto la rappresentazione spinoriale dicono che

S −1 (Λ)γ5 nµ γ µ S(Λ) = nµ γ5 S −1 (Λ)γ µ S(Λ) = γ5 Λµ.ν nµ γ ν = γ5 (Λ−1 n)ν γ ν (2.767)

la quale consente di concludere infine che



• Π è esso stesso un proiettore del tipo di Π+ , individuato dal quadrivettore
B(p)−1 n,

• descrive nel CM la stessa proiezione descritta nel sistema del Laboratorio


dal proiettore Π+ .

Il passaggio Lab ↔ CM si manifesta dunque sul proiettore Π+ in modo semplice,


attraverso la trasformazione n → B(p)−1 n, essendo B(p) il boost CM → lab.

Vediamo adesso che i proiettori Π± nel CM coincidono proprio con proiettori di


spin non relativistici P± (⃗n) di cui alla (2.745) !
Infatti, nel riferimento di quiete, evidentemente, deve essere

nµ = (0, ⃗n) con |⃗n|2 = 1 (2.768)

e dunque
( )
0 − ⃗n · ⃗σ
̸ n = ni γ = −n γ =
i i i
(2.769)
⃗n · ⃗σ 0

ovvero risulta
( )
1 n·⃗
1±⃗ σ
0
(1 ± γ5 ̸ n) = 2
n·⃗
1∓⃗ σ (2.770)
2 0 2

da cui segue, in particolare, che, posto ⃗n = (0, 0, 1), risulta


   
1 0 0 0 0 0 0 0
 0 0 0 0   0 1 0 0 
   
Π+ =   ; Π− =   (2.771)
 0 0 0 0   0 0 1 0 
0 0 0 1 0 0 0 0

133
(1) (1)
e dunque148 gli stati u0 e v0 sono proiettati in se stessi da Π+ mentre sono
(2) (2)
annichilati da Π− e, viceversa, gli stati u0 e v0 sono proiettati in se stessi da
Π− mentre sono annichilati da Π+ , coerentemente con il fatto che, sia per gli stati
di particella che di antiparticella, r = 1 individua l’autostato della componente z
dello spin con autovalore +1/2 e r = 2 quello con autovalore −1/2, i.e.

u(1) → sz = +1/2; u(2) → sz = −1/2 (2.772)


v (1) → sz = +1/2; v (2) → sz = −1/2 (2.773)

L’interesse di aver scritto il proiettore di spin Π± nella forma (2.747) sta


nel fatto che, come si è già osservato, esso è covariante per boosts di Lorentz
Lab → CM e quindi l’effetto del proiettore può essere valutato facilmente in ogni
riferimento inerziale, riportandoci al sistema del CM con il boost relativo.
Ma che succede, in generale, per quanto riguarda la forma del proiettore, nel
passaggio da un riferimento inerziale ad un altro, che non sia quello del CM ?
Potrebbe sembrare che, di nuovo, basti trasformare nµ usando la trasformazione
di Lorentz che connette i due riferimenti ... ma purtroppo non è cosı̀ !
Supponiamo di partire dunque da un sistema di riferimento inerziale dove il
quadrimpulso della particella è pµ ed il quadrivettore di spin che ci interessa
è nµ . Se effettuiamo una trasformazione di Lorentz Γ, per cui il quadrimpulso
della particella diventa p′ = Γp, quale deve essere il quadrivettore n′ che individua
lo stesso proiettore di spin già individuato da n ?
Come abbiamo visto, la prescrizione è che i boosts inversi definiscano nel CM lo
stesso quadrivettore, i.e.

B(Γp)−1 n′ = B(p)−1 n ⇔ n′ = B(Γp) · B(p)−1 n (2.774)

La trasformazione che dovevamo individuare è dunque proprio B(Γp) · B(p)−1 !


Ma come è fatta ?
Iniziamo ricordando che la rotazione di Wigner R(Γ, p) è definita come

R(Γ, p) ≡ B(Γp)−1 Γ B(p) (2.775)

e dunque risulta

B(Γp) = Γ B(p) R(Γ, p)−1 (2.776)


148
Come mostra la (2.770), la forma dei proiettori di spin Π± sulle grandi e sulle piccole
componenti degli spinori è ”opposta”: questa è la ragione delle scelte apparentemente anomale
(1) (2)
di v0 e v0 , ottenuti per rotazione di 1800 intorno all’asse y (i.e. attraverso la rotazione −i σy )
(1) (2)
degli spinori a due componenti che definiscono, rispettivamente, u0 e u0 .
(r)
L’opportunità della definizione delle v0 sarà ancora più evidente allorché considereremo, tra
breve, la forma che assume la simmetria di coniugazione di carica sulle soluzioni dell’equazione
di Dirac.

134
per cui abbiamo che
( )
B(Γp) · B(p)−1 = Γ · B(p) · R(p, Γ)−1 · B(p)−1 (2.777)
la quale coincide quindi con Γ se e solo se la rotazione di Wigner che compare
nella sua definizione è la rotazione identica, ovvero se Γ è esso stesso un boost
che avviene nella direzione di p⃗, senza ruotare gli assi.

Vediamo adesso di arrivare ad una rappresentazione parametrica significativa


del quadrivettore di spin nµ .
Iniziamo dimostrando che se pµ è il quadrimpulso di una particella di massa m e
k µ è un qualunque quadrivettore light-like, allora possiamo sempre trovare uno ed
un solo (a parte il segno) quadrivettore di polarizzazione nµ della forma seguente
nµ = α pµ + β k µ (2.778)
che soddisfa, quindi, le condizioni di cui alla (2.746).
Cominciamo ad imporre la condizione di ortogonalità con il quadrimpulso: si ha
α m2
np = 0 ⇒ α m2 + β (pk) = 0 ⇒ β = − (2.779)
(pk)
D’altronde, dalla condizione di normalizzazione di n , si ricava che deve anche
essere
nn = −1 ⇒ α2 m2 + 2αβ (pk) = −1 (2.780)
e sostituendo allora la (2.779) nella (2.780), si ha
1
α2 m2 = 1 ⇒ α = ± (2.781)
m
e, di conseguenza149
m
β = ∓ (2.782)
(pk)
Abbiamo cosı̀ trovato che il problema che ci eravamo posti ha soluzione, anzi ne
ha due opposte150 , che sono
( )
1 m2 µ
n =∓
µ
k − pµ (2.783)
m (pk)
149
Si noti che il prodotto scalare (pk) non può, in nessun caso, essere nullo. Esso è infatti
un invariante di Lorentz e nel riferimento in cui la particella è ferma (riferimento del CM )

esso vale m k̂ 0 , dove abbiamo indicato con (k̂ 0 , k̂) la forma assunta dal quadrivettore k µ nel
riferimento del CM . Si noti altresı̀ che k µ oppure λ k µ definiscono lo stesso quadrivettore di
spin, qualunque sia il numero reale λ ̸= 0.
150
Il fatto di aver trovato due soluzioni opposte è già scritto nelle equazioni (2.746) che definis-
cono il quadrivettore nµ : esse non possono distinguerne il segno, quindi se nµ è soluzione, allora
anche −nµ lo è.
Su questo punto ritorneremo, comunque, più oltre.

135
Volendo usare questi quadrivettori per definire il proiettore di spin, il fatto di av-
erne trovati due opposti non amplia il numero delle soluzioni indipendenti perché,
evidentemente, si ha
Π± (nµ ) = Π∓ (−nµ )
Dati pµ e k µ in un riferimento assegnato, possiamo dunque, senza perdita alcuna
di generalità, limitarci a considerare i soli quadrivettori di spin nµ di cui alla
(2.783), corrispondenti alla sola scelta di α = −1/m , i.e.
( )
1 m2 µ
µ
n = k − pµ (2.784)
m (pk)

anche se, come vedremo, è più comodo mantenere comunque entrambe le scelte
possibili di α, ovvero entrambi i segni come dalla (2.783).
Per conoscere, in generale, quale direzione di polarizzazione è individuata da
questa soluzione, occorrerà riportarsi nel centro di massa senza ruotare gli assi
e cioè sarà necessario applicare ad nµ l’inversa della trasformazione di Lorentz
definita dalla (2.451), cioè il boost B(p)−1 tale che B(p)−1 p = (m, 0, 0, 0) ≡ p̂.
Come abbiamo appreso a suo tempo, la matrice B(p)−1 è cosı̀ definita
 
E
m
− px
m
− py
m
− pz
m
 − pmx px px px py px pz 
−1
 1 + m(E+m) 
B(p) =

m(E+m) m(E+m) 
 (2.785)
 − pmy py px
m(E+m)
py py
1 + m(E+m) py pz
m(E+m) 
− pmz pz px
m(E+m)
pz py
m(E+m)
1 + pz pz
m(E+m)

In questo modo, evidentemente


1 µ
− p → (−1, 0, 0, 0) (2.786)
m

mentre, indicando con k̂ µ l’espressione assunta dal quadrivettore k nel riferimento


del CM definito a partire dal riferimento del Laboratorio attraverso la trasfor-
mazione B(p)−1 , avremo


m2 1 µ k̂
k →
µ
k̂ = (1, ) (2.787)
m(pk) k̂ 0 k̂ 0
e dunque risulta che, nel CM , il quadrivettore nµ che descrive la direzione di
polarizzazione (2.784) diventa



n → (0, ⃗η ),
µ
dove ⃗η ≡ (2.788)
k̂ 0
per cui, in conclusione, avendo scelto nµ nella forma (2.784), è unicamente la
parte spaziale ⃗η del quadrivettore k µ vista nel sistema di riferimento del CM a

136
definire la direzione ed il verso nel quale viene effettuata la proiezione151 dello
spin dagli operatori
1 ± γ5 ̸ n
Π± =
2
(Π+ nel verso di ⃗η ).

151
Si può anche scegliere di limitarsi ad usare solo il segno positivo nella (2.783), perché, come
abbiamo già osservato, questo non conduce a nessuna limitazione sui possibili valori di ⃗η e
quindi essa è in grado, a priori, di descrivere la proiezione dello spin in qualunque direzione.
L’arbitrarietà nella scelta del segno nella (2.783) è dunque una specie di ridondanza...
Cerchiamo di vederne meglio la ragione per la quale è comunque meglio mantenerla !
Immaginiamo dunque di aver fissato in modo arbitrario la direzione del versore ⃗η nel riferimento
del CM . Costruiamo dunque il quadrivettore light-like

k̂ µ ≡ (1, ⃗η ) (2.789)

e quindi poniamo

k = B(p) k̂ (2.790)

p)−1 essendo B(p)−1 il boost definito dalla (2.785).


dove B(p) = B(p0 , p⃗) = B(p0 , −⃗
Evidentemente allora (si ricordi che, per definizione p · k = p̂ · k̂ = m )
( 2 )
1 m µ pµ
nµ = k − pµ = k µ − (2.791)
m (pk) m

individua la polarizzazione lungo ⃗η nel riferimento dove il quadrimpulso della particella è pµ .


Ma noi sappiamo anche che −nµ (segno negativo nella (2.783) ) individua la polarizzazizone
opposta, i.e.

⃗η ↔ kµ − (2.792)
m
µ
p
−⃗η ↔ − kµ (2.793)
m
Però il proiettore nella direzione −⃗η , secondo la definizione di cui sopra, dovrebbe essere costru-
ito a partire dal quadrivettore light-like (che ovviamente non è l’opposto del quadrivettore k̂
definito dalla (2.789 !)
µ
kˆ′ ≡ (1, −⃗η ) (2.794)

definendo poi, analogamente a quanto sopra,

k ′ = Λ(p) kˆ′ (2.795)

e quindi ponendo (segno positivo nella (2.783))


µ pµ
n′µ = kˆ′ − (2.796)
m
pµ µ pµ
Quale è dunque il legame fra i due quadrivettori m − k µ e kˆ′ − m ?

137
Un proiettore di spin molto interessante è certamente quello che proietta su
stati di elicità definita, ovvero nella direzione di moto della particella.
Per quanto abbiamo detto, evidentemente, fissato comunque il quadrimpulso della
particella pµ = (E, p⃗), occorrerà cercare un quadrivettore space-like di modulo
unitario nµ che, nel riferimento del CM , punti proprio nella direzione di p⃗.
Cerchiamolo del tipo (2.778), avendo posto
k µ ≡ (p, p⃗) (2.801)
Per quanto detto sopra, dalla (2.783), segue che la soluzione del tipo cercato sarà
( )
1 m2 µ
nµ = k − pµ (2.802)
m (pk)
Vediamo se fa al caso nostro !
Intanto osserviamo che
E+p m2 p
(kp) = Ep − p = p(E − p) = p(E − p)
2
= (2.803)
E+p E+p
e quindi risulta152
( )
1 E+p µ 1
µ
n = k − pµ = (p , E ⃗n) (2.805)
m p m
La risposta è che essi coincidono.
Possiamo vedere questo in vari modi, per esempio applicando loro il boost B(p)−1 , abbiamo
( µ )
p
B(p)−1 − kµ = (1, ⃗0) − (1, ⃗η ) = (0, −⃗η ) (2.797)
m
( )
µ pµ
B(p)−1 kˆ′ − = (1, −⃗η ) − (1, ⃗0) = (0, −⃗η ) (2.798)
m
µ µ µ
Siccome il boost è una trasformazione invertibile, è provato che pm − k µ = kˆ′ − pm .
Un altro modo per dimostrare la stessa cosa fa uso del fatto che, dalla loro definizione, risulta
2 2
k ′µ + k µ = Λ(p)(2, ⃗0) = Λp p̂ = pµ (2.799)
m m
e quindi abbiamo che
pµ pµ
nµ (−⃗η ) = k ′µ − = (k ′µ + k µ ) − k µ − =
m m
µ µ
2 µ p p
= p − kµ − = − k µ = −nµ (⃗η ) (2.800)
m m m
Concludendo, se è vero che nella (2.783) potremmo certamente limitarci ad un solo segno,
mantenendo il doppio segno questo, pur non ampliando le soluzioni possibili, facilita, per es-
empio, l’individuazione del quadrivettore nµ (−⃗η ) che proietta lo spin nella direzione opposta a
quello in cui lo proietta nµ (⃗η ), potendo porre, semplicemente nµ (−⃗η ) = −nµ (⃗η ) .
152
Infatti si ha
( )
1 E+p µ 1 E+p 1
nµ = k − pµ = (p, p⃗) − pµ =
m p m p m

138
dove
p⃗
⃗n ≡ (2.806)
p

Applichiamogli ora il boost di Lorentz (2.785) per vedere che forma esso assume
nel riferimento del CM in modo da determinare la direzione in cui agisce il
proiettore di spin: si ha153
1 µ
− p → (−1, 0, 0, 0)
m
E+p µ E+p E−p µ 1 p⃗
k → k = (p, p⃗) ≡ (1, ⃗n) dove ⃗n ≡
mp mp m p p
per cui

B(p)−1 nµ = (0, ⃗n) (2.809)

e dunque nµ è proprio il quadrivettore che cercavamo per individuare i proiettori


di elicità Σ± .

Ma vediamo adesso qual è l’azione di questi proiettori sugli spinori di Dirac.


Osserviamo che

k µ = pµ − (E − p, 0, 0, 0) (2.810)
1 1 1
= (E + p, (E + p)⃗n) − (E, p⃗) = (p, E ⃗n) (2.804)
m m m

153
Si dimostra infatti facilmente che, se k è dato dalla (2.801) e B(p)−1 dalla (2.785), allora
risulta
E−p
B(p)−1 k = k
m
Infatti, data la (2.810) e vista la prima colonna della (2.785), abbiamo che

1 E−p E−p
B(p)−1 k = p̂ − (E − p) (E, −⃗
p) = (m − E · , p⃗) (2.807)
m m m
ma
E(E − p) m2 − E 2 + Ep m2 − m2 − p2 + Ep E−p
m− = = = p
m m m m
per cui è cosı̀ dimostrato che effettivamente risulta
E−p E−p
B(p)−1 k = (p, p⃗) = k (2.808)
m m

139
e quindi risulta
[ ]
1 E+p µ E+p
n µ
= p − pµ − (E − p) (1, 0, 0, 0) =
m p mp
1 E+p−p µ m2 E µ m ⃗
= p − (1, 0, 0, 0) = p − (1, 0) (2.811)
m p mp mp p
Evidentemente si ha allora che
E m 0
̸ n ≡ nµ γ µ = ̸p − γ (2.812)
mp p
Ne segue quindi che, quando questo operatore viene applicato, per esempio, alla
soluzione u(⃗p) dell’equazione di Dirac, essendo
̸ p u(⃗p) = m u(⃗p) (2.813)
risulta
E m 0 E m 0
̸ n u(⃗p) = m u(⃗p) − γ u(⃗p) = u(⃗p) − γ u(⃗p) (2.814)
mp p p p
per cui abbiamo
[ ( )]
1 ± γ5 ̸ n 1 E m 0
Σ± u(⃗p) ≡ u(⃗p) = 1 ± γ5 − γ u(⃗p) (2.815)
2 2 p p
Come si vede, quindi, nel limite ultrarelativistico in cui E → +∞ (e con-
seguentemente E/p → 1), i.e. nel limite in cui la massa m diventa trascurabile
rispetto all’energia E della particella, si ha che i proiettori Σ± , sugli spinori u(⃗p),
diventano154 tale per cui
1 ± γ5
Σ± u(⃗p) → u(⃗p) (2.837)
2
Per quanto riguarda, invece, l’azione di Σ± sugli spinori v(⃗p), partendo dal fatto
che adesso l’equazione di Dirac fornisce
̸ p v(⃗p) = −m v(⃗p) (2.838)
154
E’ istruttivo vedere più da vicino le implicazioni della (2.837).
Supponiamo, infatti, di considerare uno stato u(p̂) = αs u(s) (p̂) con |α1 |2 + |α2 |2 = 1, ovvero il
generico stato di una particella di Dirac vista nel suo riferimento di quiete.
Usando i proiettori χ± definiti dalla (2.842), possiamo scomporre lo stato in questione nelle sue
componenti chirali, ponendo

u(p̂) = χ+ u(p̂) + χ− u(p̂) ≡ u+ (p̂) + u− (p̂) (2.816)

Data la struttura di γ5 , i due vettori u± (p̂) sono tali che


(s)
u± (p̂) = αs u± (p̂) (2.817)

140
dove
(s) 1 [ (s) ]
u± (p̂) ≡ χ± u(s) (p̂) = u (p̂) ± (iσ2 )rs v (r) (p̂) (2.818)
2
ed è poi immediato che i vettori u± (p̂) risultano avere entrambi la stessa norma, essendo

u†± (p̂) · u± (p̂) = u† (p̂) · χ†± · χ± · u(p̂) = u† (p̂) · χ2± · u(p̂) = u† (p̂) · χ± · u(p̂) =
1 † 1
= u (p̂) · u(p̂) = (2.819)
2 4m
essendo u† (p̂) γ5 u(p̂) = 0.
Immaginiamo ora di applicare ad u(p̂) un boost generico B(p): sappiamo che lo stato trasfor-
mato di quello in esame sarà adesso descritto dallo spinore

u(s) (⃗
p) = S(B(p)) u(s) (p̂) (2.820)

Quanto ai proiettori chirali, risulta evidentemente ancora che

u(⃗
p) = χ+ u(⃗ p) ≡ u+ (⃗
p) + χ− u(⃗ p) + u− (⃗
p) (2.821)

e siccome γ5 commuta con le S(Λ), ne segue che

p) ≡ χ± S(B(p)) u(p̂) = S(B(p))χ± u(p̂) = S(B(p)) u± (p̂)


χ± u(⃗ (2.822)

e dunque risulta

u(⃗
p) = S(B(p)) u+ (p̂) + S(B(p)) u− (p̂) (2.823)

Ammettiamo ora che lo stato u(p̂) rappresenti una particella di Dirac con lo spin allineato
nella direzione ⃗n e che il boost B(p) avvenga nella stessa direzione della polarizzazione, confer-
endo quindi alla particella un impulso spaziale p ⃗n. Abbiamo allora che, per qualunque valore
dell’energia, risulta comunque che

Σ+ u(⃗
p) = u(⃗
p) (2.824)

dove Σ+ è appunto, per definizione, il proiettore di elicità nel verso dell’impulso p⃗n.
Ma abbiamo detto che, per gli spinori di tipo u, quando E >> m, Σ+ → χ+ e dunque, nel
limite di alta energia, quanto sopra implica che

u(⃗ p) → χ+ u(⃗
p) = Σ+ u(⃗ p) = u+ (⃗
p) (2.825)

Vista però la (2.821), che ne è di u− (⃗p) ?


Il punto è che la rappresentazione del gruppo di Lorentz S(Λ) non è unitaria e quindi non
conserva la norma dei vettori a cui vengono applicati i suoi operatori. I vettori u± (p̂) hanno la
stessa norma, ma questo non resta vero per i vettori u± (⃗ p) !
Accade, in particolare, che, nel limite di alta energia, se l’impulso spaziale punta nella direzione
dello spin relativo allo stato u± (p̂), allora il vettore u− (⃗
p) tende a zero. Abbiamo infatti
[ ] 1 [ ]
(s)
u− (⃗
p) = S(B(p)) u− (p̂) = S(B(p)) αs u− (p̂) = αs S(B(p)) u(s) (p̂) − (iσ2 )rs v r (p̂) =
2
1 [ (s) ]
= αs u (⃗ p) − (iσ2 )rs v r (⃗
p) (2.826)
2

141
Ma essendo u− , per definizione, autostato di γ5 per l’autovalore −1, le sue grandi componenti
sono necessariamente uguali ed opposte alle sue piccole componenti: occupiamoci dunque delle
prime, che indicheremo, per semplicità, con w− (⃗ p). Avendo già definito con ⃗n la direzione
dell’impulso spaziale, dalle definizioni (2.686) e (2.689) degli spinori u e v, abbiamo che
1 [√ √ ]
w− (⃗
p) = αs E + m w(s) − (iσ2 )rs E − m (⃗n · ⃗σ ) w̃(r) (2.827)
2
ma, come osservato nella (2.707), risulta che (iσ2 )rs w̃(r) = w(s) e dunque
1 [√ √ ]
w− (⃗
p) = αs E + m w(s) − E − m (⃗n · ⃗σ ) w(s) (2.828)
2
D’altronde, per ipotesi lo spinore u(p̂) descrive uno stato di spin allineato proprio con la di-
rezione ⃗n, per cui, data la struttura di u(p̂) in termini dei vettori bidimensionali w(s) , deve
essere necessariamente che
( )
(⃗n · ⃗σ ) · αs w(s) = αs w(s) (2.829)

e dunque risulta
1 [√ √ ]( ) 1 [√ √ m √ √ m ]( )
w− (⃗
p) = E + m − E − m αs w(s) ≈ E+ E − E+ E αs w(s) =
2 2 2E 2E
m √ ( (s)
)
= E αs w (2.830)
2E
il quale, evidentemente, tende a zero nel limite in cui E → ∞.
Per completezza, vediamo adesso che cosa succede, invece, a u+ (⃗
p). Si ha
[ ] 1 [ ]
(s)
u+ (⃗
p) = S(B(p)) u+ (p̂) = S(B(p)) αs u+ (p̂) = αs S(B(p)) u(s) (p̂) + (iσ2 )rs v r (p̂) =
2
1 [ (s) ]
= αs u (⃗ p) + (iσ2 )rs v r (⃗
p) (2.831)
2
Stavolta u+ è autovettore di γ5 per l’autovalore +1 e dunque le sue grandi componenti coinci-
dono con le piccole: indichiamole con w+ (⃗p). Risulta
1 [√ √ ]
w+ (⃗
p) = αs E + m w(s) + (iσ2 )rs E − m (⃗n · ⃗σ ) w̃(r) (2.832)
2
e quindi, ripetendo le stesse considerazioni di cui sopra, possiamo concludere che
1 [√ √ ]( ) 1 [√ √ m √ √ m ]( )
w+ (⃗
p) = E + m + E − m αs w(s) ≈ E+ E + E− E αs w(s) =
2 2 2E 2E
√ ( (s)
)
= E αs w (2.833)

il cui confronto con la (2.830) mostra in particolare che


m
p) ≈
w− (⃗ w+ (⃗
p) (2.834)
2E
m
ovvero che la componente di elicita sbagliata si riduce, ad alta energia, proporzionalemte a 2E .
Concludiamo infine l’argomento, occupandoci di u(⃗ p) stesso: dalla definizione risulta che
( √ )
√ E + m w(r)
u(⃗
p) = αr (2.835)
E − m (⃗n · ⃗σ ) w(r)

142
ne risulta che
E m 0 E m 0
̸ n v(⃗p) = − m v(⃗p) − γ v(⃗p) = − v(⃗p) − γ v(⃗p) (2.839)
mp p p p
e dunque si ha
[ ( )]
1 ± γ5 ̸ n 1 E m 0
Σ± v(⃗p) ≡ v(⃗p) = 1 ∓ γ5 + γ v(⃗p) (2.840)
2 2 p p
ovvero, nel limite ultrarelativistico in cui E >> m, abbiamo che adesso risulta
1 ∓ γ5
Σ± v(⃗p) → v(⃗p) (2.841)
2
E’ opportuno ricordare a questo punto che, indipendentemente dai proiettori
di elicità, sono comunque definiti gli operatori155 scalari seguenti
1 ± γ5
χ± ≡ (2.842)
2
ovvero, vista la polarizzazione concorde con la direzione dell’impulso, per quanto già osservato
( √ ) ( ) ( )
E + m w(r) √ αr w(r) m αr w(r)
p) = αr √
u(⃗ ≈ E + √ (2.836)
E − m w(r) αr w(r) 2 E −αr w(r)

la quale mostra direttamente, in modo evidente, la separazione di u(⃗ p) nelle due componenti
u+ (⃗p) e u− (⃗
p), unitamente al fatto che, per E >> m, Σ+ u(⃗ p) → χ+ u(⃗
p).
155
Occorre mettere in evidenza una differenza importante che esiste fra i proiettori Λ± e Π±
con quelli di chiralità χ± , definiti dalla (2.842), almeno nel caso di massa non nulla.
Evidentemente, essendo infatti

[Λ± , p̸ ± m] = 0 = [Π± , p̸ ± m]

ne segue che se ψ(p) è soluzione dell’equazione di Dirac per energie positive/negative, allora
anche Λ± ψ e Π± ψ lo sono (essendo, eventualmente nulle ...).
Questo, se m ̸= 0, non è vero per χ± proprio perché

[χ± , p̸ ± m] ̸= 0

Supponiamo infatti, per esempio, che ψ(p) soddisfi l’equazione

(̸p − m) ψ(p) = 0

ovvero sia una soluzione dell’equazione di Dirac per energie positive e dunque uno spinore di
tipo u: siccome γ5 anticommuta con le γ µ , ecco che per γ5 ψ vale piuttosto l’equazione

(̸p + m) γ5 ψ(p) = 0

ovvero, si tratta di uno spinore di tipo v. Evidentemente, se la massa è nulla, l’argomento cade
perché in quel caso p̸ ± m ↛p; ma nel caso di massa non nulla possiamo concludere, per quanto
riguarda gli stati ψ± ≡ χ± ψ, che essi non sono soluzioni dell’hamiltoniana di Dirac.
In altre parole, mentre Λ± e Π± sono proiettori compatibili con la dinamica libera della par-
ticella di Dirac, il proiettore di chiralità non gode di questa proprietà: esso è un proiettore
cinematico, incompatibile con la dinamica (se la massa della particella è diversa da zero).

143
i quali proiettano su stati di chiralità 156 definita157 : l’operatore χ− entra diret-
tamente nella definizione della corrente debole carica ed è proprio a causa della
sua presenza che le interazioni deboli violano158 la parità !
Come abbiamo osservato sopra, il proiettore chirale è scalare per trasfor-
mazioni di Lorentz e dunque stati di chiralità definita restano tali anche al cam-
biare del sistema di riferimento.
Abbiamo invece visto che quanto al proiettore di spin, per selezionare la stessa
direzione al cambiare del riferimento, si deve modificare in modo ben preciso il
quadrivettore nµ (attraverso, appunto, la trasformazione di Lorentz (2.777) ).
Ma che dire del proiettore di elicità ? Potrebbe sembrare che, poichè i proiettori
Σ± sono definiti come degli opportuni proiettori di spin, anche questi mutino al
cambiare del riferimento nello stesso modo dei primi.
Questo però non è vero.
La ragione è che, fissato un sistema di riferimento, Σ± viene definito attraverso
il quadrivettore nµ dato dalla (2.805) e quest’ultima definizione non coincide con
quella che ha condotto alla trasformazione (2.777) nel caso di un proiettore di
spin, perché, mentre in questo caso vogliamo mantenere la stessa direzione nel
CM , nel caso dell’elicità vogliamo che la direzione nel CM sia allineata con la
direzione di moto della particella nel riferimento dato, e quindi, a meno di un
boost in questa stessa direzione, in generale avremo leggi di trasformazione dif-
ferenti.
Come abbiamo osservato, se in un dato sistema di riferimento è

pµ ≡ (E, p ⃗n) (2.843)


Per esempio, se ψ è il campo del neutrino e questo non ha massa nulla, allora non è corretto
dire che esso è descritto da 1−γ
2 ψ e quindi che lo stato di neutrino è autostato della chiralità per
5

l’autovalore −1. Ciò che è corretto è che la presenza del proiettore di chiralità nell’espressione
della corrente debole e quindi nel vertice dell’interazione favorisce lo stato di neutrino di elicità
negativa (dato che, usualmente, la massa del neutrino risulta molto minore della sua energia
nel sistema del laboratorio). Detto altrimenti, in un processo del tipo

e− + A → B + ν

con A e B anch’essi particelle di Dirac massive, il neutrino, nel sistema del CM del pro-
cesso, avrà prevalentemente elicità negativa, con una piccola contaminazione di elicità positiva
dell’ordine di m/E e, in ogni caso, sarà descritto da uno spinore di tipo u !
156
La parola chiralità deriva dal greco χϵιρ χϵιρoς che significa mano. Indica la proprietà di
avere un’immagine speculare non sovrapponibile a sé, come avviene, appunto, nel caso di una
mano. Come vedremo, per parità, abbiamo infatti che χ+ ←→ χ− .
157
Solo nel caso in cui E >> m, come abbiamo visto, questi stati possono essere identificati
con quelli di elicità definita !
158
Intuitivamente possiamo già rendercene conto fin da ora in quanto, per esempio, nel caso
ultrarelativistico, a causa di χ− verrà selezionato nella dinamica del processo, per la particella,
lo stato di elicità −1 e per l’antiparticella quello con l’elicità +1. Ed è proprio il fatto che i due
stati di elicità per particella e antiparticella non entrino nella dinamica nello stesso modo che
è all’origine della violazione della simmetria di parità ...

144
allora ne segue che, in questo riferimento, il quadrivettore che definisce il proiet-
tore di elicità è il seguente
1
nµ = (p, E ⃗n) (2.844)
m
Dunque, se il quadrimpulso della particella diventa

p′µ = (E ′ , p′ ⃗n ′ ) (2.845)

dovremo usare semplicemente il nuovo quadrivettore


1 ′ ′ ′
n′µ = (p , E ⃗n ) (2.846)
m

145
E veniamo infine alla quantizzazione del campo di Dirac.
Questo avviene, di nuovo, espandendo il campo in termini di operatori di creazione/distruzione
di particella/antiparticella ed il modo come ciò avviene è il seguente159
2 ∫
∑ d3 p
ψ(x) = 3
{a(r) (⃗p) u(r) (⃗p) e−ipx + b†(r) (⃗p) v (r) (⃗p) eipx } (2.847)
r=1 2Ep (2π)
∑2 ∫
d3 p
ψ̄(x) = 3
{b(r) (⃗p) v̄ (r) (⃗p) e−ipx + a†(r) (⃗p) ū(r) (⃗p) eipx } (2.848)
r=1 2Ep (2π)

dove, al solito160

• a(r) (⃗p) annichila la particella di quadrimpulso (Ep , p⃗) = ( m2 + |⃗p|2 , p⃗) e
di stato di spin r;

• a†(r) (⃗p) crea la particella di quadrimpulso (Ep , p⃗) e di stato di spin r;

• b(r) (⃗p) annichila l’antiparticella di quadrimpulso (Ep , p⃗) e di spin r;

• b†(r) (⃗p) crea l’antiparticella di quadrimpulso (Ep , p⃗) e di stato di spin r;

e questi operatori soddisfano le regole di anticommutazione (tutte le altre sono


nulle ...) seguenti

{a(r) (⃗p), a†(s) (p⃗′ )} = {b(r) (⃗p), b†(s) (p⃗′ )} = 2 Ep (2π)3 δrs δ 3 (⃗p − p⃗′ ) (2.849)

mentre, sotto il gruppo di Poincaré, essi si trasformano secondo la legge seguente161

U (a, Λ) a(s) (p) U −1 (a, Λ) = e−ia·Λp Rsr a(r) (Λp) (2.859)


U (a, Λ) b(s) (p) U −1 (a, Λ) = e−ia·Λp Rsr b(r) (Λp) (2.860)
159
Dato un quadrimpulso p qualsiasi, quando non c’è possibilità di confusione, useremo equiv-
alentemente i simboli a(r) (p) ed u(r) (p) al posto di a(r) (⃗
p) e u(r) (⃗
p).
160
Si osservi che, come nel caso del campo scalare e vettoriale, quelle che nel gergo della prima
quantizzazione abbiamo chiamato soluzioni ad energia negativa, cioe le soluzioni che, nel caso
in esame, sono associate agli spinori di tipo v, si riferiscono semplicemente alle antiparticelle !
161
Questa legge di trasformazione discende direttamente dalle leggi di trasformazione (2.706)
e (2.721) degli spinori u e v sotto il gruppo di Lorentz, assunto che vogliamo che, per il campo
ψ(x), valga appunto la legge di trasformazione (2.656).
Dimostriamo dunque che le leggi di trasformazione (2.859) e (2.860) conducono alla (2.656).
Per fare questo, partiamo dalla definizione della decomposizione spettrale del campo, i.e. dalla
relazione
2 ∫
∑ d3 p
ψ(x) = {a(r) (p) u(r) (p) e−ipx + b†(r) (p) v (r) (p) eipx } (2.850)
r=1
2Ep (2π)3

146
dove R è la matrice di SU (2) individuata dalla rotazione di Wigner R(Λ−1 , Λ p)
definita, come si ricorderà, nel modo seguente162

R(Γ, q) ≡ B(Γq)−1 Γ B(q) (2.863)

ne segue che
2 ∫
∑ d3 p
U (a, Λ) ψ(x) U −1 (a, Λ) = {U (a, Λ) a(r) (p) U −1 (a, Λ) u(r) (p) e−ipx +
r=1
2Ep (2π)3
+ U (a, Λ) b†(r) (p) U −1 (a, Λ) v (r) (p) eipx } (2.851)

e dunque, imponendo la (2.859) e la (2.860), ne segue che


2 ∫
∑ d3 p
U (a, Λ) ψ(x) U −1 (a, Λ) = {e−ia·Λp Rrs a(s) (Λp) u(r) (p) e−ipx +
r=1
2Ep (2π)3
∗ †(s)
+ ia·Λp
e Rrs b (Λp) v (r) (p) eipx } (2.852)

e ponendo Λp = q, essendo (px) = Λp · Λx = q · Λx, risulta


2 ∫
∑ d3 q
U (a, Λ) ψ(x) U −1 (a, Λ) = {e−iaq Rrs a(s) (q) u(r) (Λ−1 q) e−iq·Λx +
r=1
2Eq (2π)3
∗ †(s)
+ eiaq
Rrs b (q) v (r) (Λ−1 q) eiq·Λx } (2.853)

Ma abbiamo visto (cfr. (2.706) e (2.721)) che, in generale, risulta

S(Γ) u(s) (p) = R(Γ, p)ks u(k) (Γp) (2.854)


S(Γ) v (s)
(p) = R(Γ, p)∗ks v (k) (Γp) (2.855)

dove la matrice R che compare nella (2.854) e (2.855) è la matrice di SU (2) individuata dalla
rotazione di Wigner R(Γ, p). Facendo allora Γ = Λ−1 , si ha

S(Λ−1 ) u(s) (q) = Rks u(k) (Λ−1 q) (2.856)


S(Λ−1 ) v (s) (q) = ∗
Rks v (k) (Λ−1 q) (2.857)

da cui, sostituendo nella (2.853), si ottiene appunto che

U (a, Λ) ψ(x) U −1 (a, Λ) = S −1 (Λ) ψ(a + Λx) (2.858)

162
Si osservi che se partiamo dal sistema del CM, i.e. se il quadrimpulso di partenza è
p̂ ≡ (m, 0, 0, 0) mentre Γ = B(p), allora la rotazione di Wigner R(B(p), p̂) coincide sem-
plicemente con l’indentità, infatti essendo B(p̂) = I, B(p) p̂ ≡ p, B(Γp̂)−1 = B(p)−1 si ha
B(Γp)−1 Γ B(p) = B(Γp̂)−1 Γ I ≡ I e quindi risulta in particolare che

U (a, Λp ) a(r) (p̂) U −1 (a, Λp ) = e−iap a(r) (p) (2.861)


(r) −1 −iap (r)
U (a, Λp ) b (p̂) U (a, Λp ) = e b (p) (2.862)

147
Veniamo infine alla questione della normalizzazione dei campi ψ e ψ̄.
Anche in questo caso, evidentemente, abbiamo libertà di normalizzazione, essendo
anche l’equazione di Dirac una equazione differenziale lineare e omogenea.
(s)
La scelta è fatta, di nuovo, in modo che la funzione d’onda Ψq⃗ (x) associata
in rappresentazione delle coordinate allo stato di particella libera con impulso ⃗q
e stato di spin s, i.e. |⃗q, s >≡ a†(s) (⃗q)|Ω >, sia semplicemente163

Ψq⃗ (x) = u(s) (⃗q) e−iqx


(s)
(2.885)
La dimostrazione di quanto adesso asserito è del tutto analoga a quella vista nel
caso del campo scalare.
Infatti, cominciamo con l’osservare che dalla teoria dell’equazione di Dirac, già
sappiamo che la funzione d’onda di una particella con impulso definito ⃗q e spin
s, per la (2.670), è necessariamente del tipo

Ψq⃗ (x) = K u(s) (⃗q) e−iqx


(s)

La normalizzazione, al solito, si determina osservando che



< q⃗′ , s′ |⃗q, s > = < Ω| a(s ) (q⃗′ ) a†(s) (⃗q)|Ω >=

= < Ω| {a(s ) (q⃗′ ) , a†(s) (⃗q)}|Ω >=
= 2Ep (2π)3 δs s′ δ 3 (⃗q − q⃗′ ) (2.886)
D’altronde, il prodotto scalare fra due soluzioni dell’equazione di Dirac, in
rappresentazione delle coordinate, è data da

< Ψ1 |Ψ2 >= d3 xΨ†1 (⃗x, t)Ψ2 (⃗x, t)
163
Anche in questo caso la funzione d’onda si può determinare attraverso l’uso del campo
ψ(x), nel modo seguente

< Ω|ψ(x)a†(s) (⃗q)|Ω >=


(s)
Ψq⃗ (x) =
∑2 ∫
d3 p
= 3
< Ω|{a(r) (⃗ p) e−ipx + b†(r) (⃗
p) u(r) (⃗ p) eipx }a†(s) (⃗q)|Ω >=
p) v (r) (⃗
r=1
2E(2π)
∑2 ∫
d3 p
= 3
p) e−ipx < Ω|{a(r) (⃗
u(r) (⃗ p) , a†(s) (⃗q)}|Ω >= u(s) (⃗q) e−iqx (2.864)
r=1
2E(2π)

La stessa regola vale, pur con qualche precauzione, anche per la funzione d’onda
dell’antiparticella.
A questo proposito occorre ricordare che se Ψ(x) è soluzione dell’equazione di Dirac libera,
allora anche
 
0 0 0 +1
 0 0 −1 0 
ΨC (x) ≡ C −1 Ψ̄(x)t con C ≡ iγ 0 γ 2 = 

 = −C −1 (2.865)
0 +1 0 0 
−1 0 0 0
lo è, e ΨC è detta la soluzione coniugata di carica della Ψ.

148
per cui risulta

(s′ ) †(s′ )
< Ψq′ |Ψ(s)
q > = d3 x Ψq′ (⃗x, t) Ψ(s)
q (⃗x, t) =

La ragione di questa definizione sta nel fatto che, in presenza di interazione elettromagnetica,
usando l’accoppiamento minimale canonico, i.e.
e µ e
pµ → pµ − A ⇔ ih̄∂ µ → ih̄∂ µ − Aµ (2.866)
c c
allora se Ψ è soluzione dell’equazione di Dirac in presenza di un dato campo elettromagnetico
Aµ , i.e. ( h̄ = c = 1)

(iγ µ ∂µ − e Aµ γ µ ) Ψ − m Ψ = 0 (2.867)

ne segue che la ΨC definita sopra risolve l’equazione di Dirac nello stesso campo esterno ma
per una particella di carica opposta (e stessa massa), i.e. risulta

(iγ µ ∂µ + e Aµ γ µ ) ΨC − m ΨC = 0 (2.868)

Infatti, prendendo l’hermitiana coniugata dell’equazione di partenza (ricordiamo che Aµ è


reale), abbiamo

(iγ µ ∂µ − e Aµ γ µ ) Ψ − m Ψ = 0 ⇒ ∂µ Ψ† (−iγ µ† ) − e Aµ Ψ† (γ µ )† − m Ψ† = 0
⇒ −i∂µ Ψ† γ µ† γ 0 − e Aµ Ψ† 㵆 γ 0 − m Ψ† γ 0 = 0
⇒ −i∂µ Ψ† γ 0 γ 0 γ µ† γ 0 − e Aµ Ψ† γ 0 γ 0 㵆 γ 0 − m Ψ† γ 0 = 0 (2.869)

dove abbiamo usato il fatto che (γ 0 )2 = I.


D’altronde Ψ† γ 0 = Ψ̄ e γ 0 γ µ† γ 0 = γ µ , dunque otteniamo che vale quindi l’equazione

−i∂µ Ψ̄γ µ − eAµ Ψ̄γ µ − m Ψ̄ = 0 (2.870)

per cui trasponendo, si ha

−i∂µ (γ µ )t Ψ̄t − eAµ (γ µ )t Ψ̄t − m Ψ̄t = 0 (2.871)

e se moltiplichiamo a sinistra per la matrice C −1 sopra introdotta, che gode delle proprietà per
cui

C (γ µ )t = −γ µ C ; C −1 = −C = C t (2.872)

ecco che risulta

−i∂µ C −1 (γ µ )t Ψ̄t − eAµ C −1 (γ µ )t Ψ̄t − m C −1 Ψ̄t = 0


⇒ i∂µ γ µ C −1 Ψ̄t + eAµ γ µ C −1 Ψ̄t − m C −1 Ψ̄t = 0 (2.873)

per cui, ponendo appunto C −1 Ψ̄t ≡ ΨC , otteniamo infine l’equazione

i∂µ γ µ ΨC + eAµ γ µ ΨC − m ΨC = 0 (2.874)

che prova appunto la (2.868).


Osserviamo ancora che se Ψ è una soluzione ad energia positiva, allora ΨC è, evidentemente
(data la coniugazione complessa) ad energia negativa e viceversa.

149
L’associazione degli stati di antiparticella con le soluzioni ad energia negativa procede dunque
attraverso l’identificazione degli stati di antiparticella con le soluzioni coniugate di carica delle
soluzioni ad energia negativa; per cui, se prendiamo la generica soluzione piana ad energia
negativa v (s) (⃗
p) eipx , essa individua uno stato di antiparticella libera avente funzione d’onda

Ψ = C −1 v̄ (s) (⃗
p)t e−ipx = −C v̄ (s) (⃗
p)t e−ipx (2.875)

e questa è evidentemente una soluzione ad energia positiva: siccome risulta

p)t = C −1 v̄ (s) (⃗
−C v̄ (s) (⃗ p)t = u(s) (⃗
p) (2.876)

essa descrive lo stato di antiparticella di spin s.

Ritornando adesso, per esempio, alla determinazione della funzione d’onda del positrone
libero, essa si determina in maniera analoga a quella dell’elettrone, per il quale abbiamo visto
dalla (2.864) che risulta

elettrone : Ψq⃗ (x) =< Ω| ψ(x) a†(s) (⃗q) |Ω >= u(s) (⃗q) e−iqx
(s)
(2.877)

usando però, al posto del campo ψ, il campo coniugato di carica, ovvero (cfr. eq. (C.140)) il
campo ψC = C −1 ψ̄ t . Si ha infatti

Ψq⃗ (x) =< Ω| ψC (x) b†(s) (⃗q) |Ω >=


(s)
positrone :
∑∫ d3 p { (r) }
−1 −ipx †(r)
= < Ω|C 3
b (⃗p)v̄ (r)t
(⃗
p)e + a (⃗
p)ū (r)t
(⃗
p)eipx
b†(s) (⃗q) |Ω >=
r
2E(2π)
∑∫ d3 p
= C −1 3
p)e−ipx < Ω|b(r) (⃗
v̄ (r)t (⃗ p) b†(s) (⃗q) |Ω >=
r
2E(2π)
∑∫ d3 p { }
−1
= C 3
p)e−ipx < Ω| b(r) (⃗
v̄ (r)t (⃗ p) , b†(s) (⃗q) |Ω >=
r
2E(2π)
= C −1 v̄ (s)t (⃗q)e−iqx = u(s) (⃗q) e−iqx (2.878)

Come si vede, quindi, la funzione d’onda dell’elettrone e del positrone coincidono !


E’ ragionevole ?
Certo, visto che si tratta di particelle di Dirac aventi la stessa massa !
Però si potrebbe obiettare che, poiché la corrente elettromagnetica è J µ = e ψ̄γ µ ψ, se la fun-
zione d’onda dell’elettrone è la stessa di quella del positrone, allora anche la corrente sarà la
stessa nei due casi, invece che avere segno opposto ...
Qui la soluzione dell’apparente paradosso sta nel fatto che, per trattare correttamente la ques-
tione, occorre inquadrare il problema nell’ambito della QFT, uscendo quindi dallo schema della
prima quantizzazione.
In questo contesto (cfr. eq.(C.91) e seguenti), la densità della corrente elettromagnetica è il
prodotto n − ordinato dell’espressione già riportata, i.e.

J µ = e : ψ̄ γ µ ψ : (2.879)

ovvero
e[ ] e[ ]
Jµ = ψ̄, γ µ ψ ≡ ψ̄α (γ µ )αβ ψβ − (γ µ )αβ ψβ ψ̄α (2.880)
2 2

150

′ ′ ⃗′
= |K|2 u†(s ) (q⃗′ ) u(s) (⃗q) eiE t e−iEt d3 x ei⃗x·(⃗q−q ) =

= (2π)3 |K|2 δ 3 (⃗q − q⃗′ ) u†(s ) (q⃗′ ) u(s) (⃗q) =
= (2π)3 |K|2 δ 3 (⃗q − q⃗′ ) δs s′ 2E (2.887)

ed il confronto con la (2.886) mostra appunto che deve essere di nuovo, per gli
stessi argomenti già usati per il campo scalare, K = 1.

Osserviamo adesso che, dato lo stato di particella |⃗q, s >≡ a†(s) (⃗q)|Ω >, rap-
presentato dunque dalla funzione d’onda Ψq⃗ (x) = u(s) (⃗q) e−iqx , la densità di
(s)

corrente ad esso associata, come sappiamo, è

j µ (x) = Ψ̄q(s) (x) γ µ Ψq(s) (x) = ū(s) (⃗q) γ µ u(s) (⃗q)

Ne segue quindi che la sua componente temporale, la quale fornisce la densità di


particelle per unità di volume, data la (2.725 ), è, come nel caso scalare, di nuovo
pari a

ρ(x) = j 0 (x) = ū(s) (⃗q) γ 0 u(s) (⃗q) = u+(s) (⃗q) u(s) (⃗q) = 2E (2.888)

Per quanto riguarda, poi, le regole di anticommutazione dei campi ψ e ψ̄,


queste si possono ottenere a partire dalla decomposizione dei campi (2.847) e
Ricordando che ψ è una matrice colonna mentre ψ̄ è una matrice riga, in linguaggio matriciale
risulta
e[ µ ] e[ µ ]
Jµ = ψ̄γ ψ − (γ µ ψ)t ψ̄ t = ψ̄γ ψ − ψ t (γ µ )t ψ̄ t (2.881)
2 2
e dunque, visto che

ψC = C −1 ψ̄ t ↔ ψ̄C = ψ t C −1 (2.882)

ne segue che
e[ ] e [ t −1 µ −1 t ]
JCµ = ψ̄C γ µ ψC − ψC
t
(γ µ )t ψ̄C
t
= ψ C γ C ψ̄ − (C −1 ψ̄ t )t (γ µ )t (ψ t C −1 )t =
2 2
e [ t −1 µ −1 t ]
= ψ C γ C ψ̄ − ψ̄ (C ) (γ µ )t (C −1 )t ψ =
−1 t
2[
e t ( −1 µ −1 ) t ( )t ]
= ψ C γ C ψ̄ − ψ̄ C −1 γ µ C −1 ψ (2.883)
2
( )
D’altronde C −1 γ µ C −1 = (γ µ )t per cui risulta infine che
e[ t µ t ]
JCµ = ψ (γ ) ψ̄ − ψ̄ γ µ ψ = −J µ (2.884)
2
che è quanto volevamo appunto dimostrare.

151
(2.848) in termini di operatori di creazione e distruzione e dalle regole di anti-
commutazione (2.849) a cui questi ultimi obbediscono.
A tempi uguali, risulta
{ }
{ψα (x), ψβ (y)}x0 =y0 = 0 = ψα† (x), ψβ† (y) (2.889)
x0 =y 0

mentre è
{ }
ψα (x), ψβ† (y) = δαβ δ 3 (⃗x − ⃗y ) (2.890)
x0 =y 0

Dimostriamo quest’ultima relazione. Si ha


{∫
{ } d3 p ∑[ ]
ψα (x), ψβ† (y) 0 0 = a (r)
(⃗
p) u (r)
α (⃗
p) e−ipx
+ b †(r)
(⃗
p) v (r)
α (⃗
p ) e ipx
,
x =y 2Ep (2π)3 r
∫ }
d3 q ∑[ ]
(s) +(r) −iqy †(s) +(r) iqy
b (⃗q) vβ (⃗q) e + a (⃗q) uβ (⃗q) e =
2Eq (2π)3 s
∫ [
d3 p d3 q ∑ { }
(r) +(s) −ipx iqy (r) †(s)
= uα (⃗
p)u β (⃗
q ) e e a (⃗
p ), a (⃗
q ) +
2Ep (2π)3 2Eq (2π)3 r,s
]
∑ { }
vα(r) (⃗p)vβ (⃗q) eipx e−iqy †(r)
+(s) (s)
+ b (⃗p), b (⃗q) =
r,s

d3 p d3 q
= 2Eq (2π)3 δ 3 (⃗p − ⃗q)
2Ep (2π)3 2Eq (2π)3
[ ]
∑ ∑
p)uβ (⃗q) e−ipx eiqy vα(s) (⃗p)vβ (⃗q) eipx e−iqy
+(r) +(s)
u(r)
α (⃗ + (2.891)
r s

Integrando su ⃗q, otteniamo quindi


∫ [ ]
{ } d3 p ∑ ∑
ψβ† (y) 0 0 e−ip(x−y)
+(r) +(s)
ψα (x), = 3
u(r)
α (⃗p)uβ (⃗p) + eip(x−y) vα(s) (⃗p)vβ (⃗p)
x =y 2Ep (2π) r s

ma, per ipotesi, x0 = y 0 , quindi risulta

p(x − y) = −⃗p · (⃗x − ⃗y ) (2.892)

poi, quanto al prodotto fra gli spinori, essendo ū ≡ u+ γ 0 , si ha evidentemente


che
∑ +(r) ∑
u(r)
α (⃗p)uβ (⃗p) = u(r)
α (⃗p)ū(r)
τ (⃗p) γτ0β (2.893)
r r

ed usando la (2.736) e la (2.742), abbiamo quindi che


∑ [ ]
+(r)
u(r)
α (⃗p)uβ (⃗p) = 2m (Λ+ )ατ γτ0β = (̸ p + m)γ 0 (2.894)
αβ
r

152
Analogamente, per la (2.737) e (2.744), si ha
∑ +(s) ∑
vα(s) (⃗p)vβ (⃗p) = vα(s) (⃗p)v̄τ(s) (⃗p)γτ0β = −2m (Λ− )ατ γτ0β =
s s
[ ]
= (̸ p − m)γ 0 (2.895)
αβ

Sostituendo, si ha quindi
{ } ∫ [ ]
d3 p
ψα (x), ψβ† (y) = ei⃗ x−⃗
p(⃗ y)
(̸ p + m)γ 0
+
x0 =y 0 2Ep (2π)3 αβ
∫ [ ]
d3 p −i⃗ x−⃗
+ e p(⃗ y)
(̸ p − m)γ 0
(2.896)
2Ep (2π)3 αβ

D’altronde, il secondo integrale, se poniamo p⃗ → −⃗p, diventa


∫ [ ]
d3 p x−⃗
e i⃗
p(⃗ y)
(E p γ 0
+ p
⃗ · ⃗
γ − m)γ 0
(2.897)
2Ep (2π)3 αβ

da sommare al primo integrale che esplicitamente vale


∫ [ ]
d3 p x−⃗
e i⃗
p(⃗ y)
(E p γ 0
− p
⃗ · ⃗
γ + m)γ 0
(2.898)
2Ep (2π)3 αβ

per cui, in definitiva, essendo (γ 0 )2 = I, risulta appunto che


{ } ∫
d3 p
ψα (x), ψβ† (y) = ei⃗p(⃗x−⃗y) 2Ep δαβ = δαβ δ 3 (⃗x − ⃗y ) (2.899)
x0 =y 0 2Ep (2π)3

A tempi non uguali, procedendo in modo del tutto simile a quanto sopra,
troviamo che l’unico anticommutatore non nullo vale
{ }
ψα (x), ψ β (y) = i (m + iγ µ ∂µ )αβ ∆(x − y, m)
≡ −i Sαβ (x − y, m) (2.900)

dove la funzione ∆ è già stata definita attraverso la (2.372), i.e.


∫ [ ]
i
∆(x − y; m) ≡ − d4 q δ(q 2 − m2 ) e−iq(x−y) Θ(q 0 ) − Θ(−q 0 ) (2.901)
(2π)3

e si è posto

Sαβ (x − y, m) ≡ − (m + iγ µ ∂µ )αβ ∆(x − y, m) (2.902)

153
Infatti risulta
{∫
{ } d3 p ∑[ ]
(r) (r) −ipx †(r) (r) ipx
ψα (x), ψ β (y) = a (⃗p) u α (⃗
p) e + b (⃗
p ) v α (⃗
p ) e ,
2Ep (2π)3 r
∫ }
d3 q ∑[ ]
(s) (r) −iqy †(s) (r) iqy
b (⃗q) v β (⃗q) e + a (⃗q) uβ (⃗q) e =
2Eq (2π)3 s
∫ [
d3 p d3 q ∑ { }
(r) (s) −ipx iqy (r) †(s)
= u (⃗
p)u (⃗
q ) e e a (⃗
p ), a (⃗
q ) +
2Ep (2π)3 2Eq (2π)3 r,s α β
]
∑ { }
vα(r) (⃗p)v β (⃗q) eipx e−iqy †(r)
(s) (s)
+ b (⃗p), b (⃗q) =
r,s

d3 p d3 q
= 2Eq (2π)3 δ 3 (⃗p − ⃗q)
2Ep (2π)3 2Eq (2π)3
[ ]
∑ ∑
p)uβ (⃗q) e−ipx eiqy vα(s) (⃗p)v β (⃗q) eipx e−iqy
(r) (s)
u(r)
α (⃗ + (2.903)
r s

ed integrando su d3 q otteniamo dunque


∫ [ ]
{ } d3 p ∑ ∑
e−ip(x−y)
(r) (s)
ψα (x), ψ β (y) = 3
u(r)
α (⃗p) uβ (⃗p) + eip(x−y) vα(s) (⃗p) v β (⃗p) =
2Ep (2π) r s
∫ 3 [ ]
dp
= 3
e−ip(x−y) (m+ ̸ p) − eip(x−y) (m− ̸ p) =
2Ep (2π) αβ

d3 p [ −ip(x−y) ]
µ
= (m + iγ ∂µ )αβ e − eip(x−y)
(2.904)
2Ep (2π)3

Ma nell’integrale riconosciamo, evidentemente, la funzione ∆(z; m) di cui alla


(2.372), per cui in definitiva si ha
{ }
ψα (x), ψ β (y) = i (m + iγ µ ∂µ )αβ ∆(x − y; m)
≡ −i Sαβ (x − y; m) (2.905)

Questa conclusione mostra allora, per le note proprietà della funzione ∆(z; m),
che l’anticommutatore che stiamo considerando soddisfa la causalità, essendo
comunque nullo quando il quadrivettore z = x − y è space − like.

154
Venendo infine all’azione delle simmetrie discrete C, P e T , si dimostra che
risulta

C a(r) (⃗p) C −1 = e−iηc b(r) (⃗p) ←→ C a†(r) (⃗p) C −1 = eiηc b†(r) (⃗p) (2.906)
C b(r) (⃗p) C −1 = eiηc a(r) (⃗p) ←→ C b†(r) (⃗p) C −1 = e−iηc a†(r) (⃗p) (2.907)
C ψ(x) C −1 = e−iηc C −1 ψ̄ t (x) ←→ C ψ̄(x) C −1 = eiηc ψ t (x) C −1 (2.908)
C = iγ 0 γ 2 ; C t = −C = C −1 (2.909)

P a(r) (⃗p) P −1 = e−iηp a(r) (−⃗p) ←→ P a†(r) (⃗p) P −1 = eiηp a†(r) (−⃗p) (2.910)
P b(r) (⃗p) P −1 = −eiηp b(r) (−⃗p) ←→ P b†(r) (⃗p) P −1 = −e−iηp b†(r) (−⃗p) (2.911)
P ψ(x) P −1 = e−iηp γ 0 ψ(P x) ←→ P ψ̄(x) P −1 = eiηp ψ̄(P x)γ 0 (2.912)
eiηp = ±1 (2.913)

T a(r) (⃗p) T −1 = e−iηT fr a(r̄) (−⃗p) ←→ T a†(r) (⃗p) T −1 = eiηT fr a†(r̄) (−⃗p) (2.914)
T b(r) (⃗p) T −1 = eiηT fr b(r̄) (−⃗p) ←→ T b†(r) (⃗p) T −1 = e−iηT fr b†(r̄) (−⃗p) (2.915)
T ψ(x) T −1 = e−iηT γ 1 γ 3 ψ(T x) ←→ T ψ̄(x) T −1 = eiηT ψ̄(T x)γ 3 γ 1 (2.916)

e si è posto

r=1: fr = +1; r̄ ≡ 1̄ = 2 (2.917)


r=2: fr = −1; r̄ ≡ 2̄ = 1 (2.918)

Evidentemente, siccome T è antiunitario, indipendentemente dalla fase e−iηT ,


risulta comunque T 2 = −I.
Da queste leggi di trasformazione discendono in modo più o meno immediato,
per esempio, le proprietà di trasformazione sotto C, P e T della corrente elettro-
magnetica e debole.
Consideriamo, per esempio, la corrente debole carica
1 − γ5
(Jw )µ = ψ(x) γ µ ψ(x) (2.919)
2
Sotto parità, evidentemente, per quanto detto sopra, si ha
1 − γ5 0
(Jw )µ (x) → P J µ (x) P −1 = ψ(P x) γ 0 γ µ γ ψ(x) =
2
1 + γ5
= ψ(P x) γ 0 γ µ γ 0 ψ(P x) =
2
1 + γ5
= ψ(P x) γµ ψ(P x) ̸= (Jw )µ (P x) (2.920)
2
la quale mostra come la simmetria P non trasformi la corrente debole carica
nel modo che ci aspetteremmo per una corrente: infatti, come sappiamo, P è

155
violata nelle interazioni deboli e questo accade a causa della presenza in essa
del proiettore chirale χ− che, sotto parità, diventa χ+ . E’ altresı̀ evidente come,
invece, la corrente elettromagnetica e ψ̄γ µ ψ si trasformi per parità in modo
corretto, per cui P è invece conservata nelle interazioni elettromagnetiche.
Veniamo ora all’inversione temporale. Sempre per l’interazione debole carica,
risulta che (si ricordi che T è antiunitario e che γ5 è reale)
1 − γ5
(Jw )µ (x) → T (Jw )µ (x) T −1 = T ψ̄(x) γ µ ψ(x) T −1 =
2
1 − γ5 −1
= T ψ̄(x) T −1 T γ µ T T ψ(x) T −1 =
2
−1 ∗µ 1 − γ5
= T ψ̄(x) T γ T ψ(x) T −1 =
2
3 1 ∗µ 1 − γ5
= ψ̄(T x) γ γ γ γ 1 γ 3 ψ(T x) (2.921)
2
ma, come si può vedere direttamente (tutte le matrici γ sono reali, a parte la γ 2
che è immaginaria), risulta
1 − γ5 1 3 1 − γ5 1 − γ5
γ 3 γ 1 γ ∗µ γ γ = γ 3 γ 1 γ ∗µ γ 1 γ 3 = γµ (2.922)
2 2 2
e dunque
1 − γ5
T (Jw )µ (x) T −1 = ψ̄(T x) γµ ψ(T x) = (Jw )µ (T x) (2.923)
2
che mostra come, invece, T sia rispettata anche nell’interazione debole164 , oltre
che, evidentemente, in quella elettromagnetica.
E veniamo infine alla simmetria di coniugazione di carica.
In questo caso, per poter descrivere correttamente l’azione della simmetria di
coniugazione di carica è necessario usare la forma N-ordinata della corrente165 ,
164
Stiamo qui usando un’espressione semplificata della corrente debole, senza mixing ...
165
L’espressione (2.919) della corrente possiede un valore di aspettazione sul vuoto che non
è nullo, a causa del modo asimmetrico con cui vi compaiono i campi ψ e ψ̄. Se il loro ordine
non viene cambiato, come nel caso delle simmetrie P e T , si arriva al risultato corretto anche
usando la forma non N-ordinata, ma se, come nel caso della simmetria C, quest’ordine viene
effettivamente cambiato, allora occorre usare la forma corretta della densità di corrente che
è, appunto, quella N −ordinata, in cui gli operatori di distruzione sono a destra e quelli di
creazione a sinistra.
La procedura per arrivare alla forma N −ordinata della corrente è descritta di seguito.
Tralasciando, per comodità di notazione, di trascrivere sia gli spinori che gli esponenziali che
compaiono nello sviluppo dei campi, per la corrente abbiamo
1 − γ5
J µ = e ψ̄ γ µ ψ → (b + a† )(a + b† ) (2.924)
2
ed il termine b b† ha valor medio non nullo sul vuoto.

156
i.e. l’espressione
[ ]
1 − γ5 e 1 − γ5
(Jw )µ (x) = e : ψ̄(x)γ µ ψ(x) : = ψ̄(x), γ µ ψ(x) (2.929)
2 2 2
D’altronde, se G è una generica matrice 4 × 4, evidentemente risulta

[ψ̄, G ψ] ≡ ψ̄α Gαβ ψβ − (G ψ)α ψ̄α = ψ̄α Gαβ ψβ − Gαβ ψβ ψ̄α =


= ψ̄α Gαβ ψβ − ψβ Gtβα ψ̄α (2.930)

ovvero, trattando ψ e ψ̄ rispettivamente come matrici colonna e riga, risulta


{ [ ]t }
e 1 − γ5 1 − γ5
[ψ̄, G ψ] = ψ̄ G ψ − ψ G ψ̄ ⇒
t t t
Jwµ = ψ̄γ µ ψ − ψt γ µ ψ̄ t
(2.931)
2 2 2

e usando la (2.908) e la (2.909), è facile allora concludere che (Jw )µ (x) si trasforma
nel modo seguente
[ ]
−1 e 1 + γ5
(Jw ) (x) → C(Jw ) (x)C
µ µ
= − ψ̄(x), γ µ ψ(x) (2.932)
2 2
ovvero, mentre il termine vettoriale cambia segno, quello pseudovettoriale non lo
fa: anche C è massimamente violata nelle interazioni deboli, mentre non lo è in
quelle elettromagnetiche (corrente vettoriale ...). E’ facile poi rendersi conto da
quanto precede che il prodotto delle due simmetrie CP sono, invece, conservate,
come deve accadere vista la conclusione tratta su T ed il teorema CP T .
Il prodotto N −ordinato implica che in ogni addendo, gli operatori di creazione precedano quelli
di annichilazione, dunque

: (b + a† )(a + b† ) : ≡ : (b a + b b† + a† a + a† b† ) : = b a − b† b + a† a + a† b† (2.925)

dove, per giungere a questa espressione, si è usato il fatto che

b b† = −b† b + {b , b† } (2.926)

e l’anticommutatore, che è un c-numero, è stato quindi sottratto.


Usando gli stessi simboli di cui sopra, si ha
[ ]
e µ 1 − γ5 e[ ] e[ ]
ψ̄, γ ψ → b + a† , a + b† = (b + a† )(a + b† ) − (a + b† )(b + a† ) =
2 2 2 2
e[ ]
= b a + b b + a a + a b − a b − a a − b b − b† a† =
† † † † † †
2
e[ ]
= 2 b a + 2a† b† + a† a + a† a − {a† , a} − b† b − b† b + {b† , b} =
2[ ]
= e b a + a† b† + a† a − b† b (2.927)

dove si sono usate le relazioni

a a† = −a† a + {a† , a}; b b† = −b† b + {b† , b}; e {a† , a} = {b† , b} = 0 (2.928)

157
2.3.5 Il decadimento del positronio
Come applicazione di quanto abbiamo visto fin’ora, studiamo adesso i modi di
decadimento (annichilazione) del positronio. Questo è un sistema legato fatto da
un elettrone ed un positrone. Esso è del tutto analogo ad un atomo di idrogeno,
a parte la massa ridotta µ = m2e invece di µ = mmee+m mp
p
≈ me e quanto ad essa
−1
collegato (Rydberg ∝ µ, raggio di Bohr r ∝ µ ...).
Inoltre, siccome elettrone e positrone non hanno fattore di forma ed hanno mo-
menti magnetici uguali in modulo e opposti in segno, a differenza di quanto accade
nel caso dell’atomo di idrogeno, nel positronio non c’è effetto Zeeman166 .
Ma la differenza fondamentale naturalmente è che, essendo esso costituito da un
sistema particella/antiparticella, non è stabile, bensı̀ si annichila in fotoni.
Lo stato fondamentale del positronio, analogamente a quanto accade per
l’atomo di idrogeno, è lo stato n = 1, L = 0 ed il sistema dei due fermioni può
trovarsi in uno stato di tripletto di spin (S = 1) oppure in uno stato di singoletto
(S = 0). Nel primo caso si parla di ortopositronio (Ops), mentre nel secondo
caso, si parla di parapositronio (Pps). Questa distinzione è molto importante in
quanto Ops e P ps hanno vite medie e modi di decadimento (annichilazione) del
tutto diversi. Vediamo perché.
Occupiamoci per prima cosa della simmetria di Coniugazione di Carica C la quale,
poiché il processo di decadimento (annichilazione) è puramente elettromagnetico,
sappiamo essere una simmetria conservata dalla dinamica.
Lo stato di positronio sarà evidentemente descrivibile in termini di operatori
di creazione a† e b† sia dell’elettrone che del positrone, i.e. avremo

|ps >= a†1 b†2 |Ω > (2.933)

dove, per semplicità, non abbiamo indicato né le variabili spaziali né quelle di
spin, ma le abbiamo indicate globalmente con l’indice ”1” per l’elettrone e con
l’indice ”2” per il positrone.

166
La ragione dell’assenza dell’effetto Zeeman al primo ordine si può capire facilmente anche
ragionando in termini classici. Dato che le masse delle due particelle sono uguali ed esse hanno
cariche opposte, il moto orbitale non può mai determinare nessuna corrente, per cui il fattore
di Landé gL è necessariamente nullo e quindi il moto orbitale non può contribuire all’effetto
Zeeman. D’altronde, nemmeno gli stati di spin possono farlo, visto che
• se il sistema si trova in stato di singoletto, non esiste nessuna direzione definita dello
spin e quindi il valore di aspettazione sullo stato di singoletto del momento magnetico
non può che essere nullo;
• se il sistema è in stato di tripletto, allora gli spin delle due particelle sono allineati ma
poiché i loro momenti magnetici sono uguali ed opposti, si compensano uno con l’altro.
Per questi motivi, quindi, semplicemente l’effetto Zeeman non può manifestarsi nel positronio,
a meno di usare campi magnetici estremamente intensi, tali da provocare lo splitting dei livelli
al secondo ordine in B.

158
Sotto l’operatore di coniugazione di carica167 , si ha (ricordiamo che il vuoto è
C-invariante)

C |ps > = C a†1 b†2 |Ω >= C a†1 C −1 C b†2 C −1 C |Ω >= b†1 a†2 |Ω >=
= −a†2 b†1 |Ω > (2.934)

ovvero, a parte un segno meno che viene dalle regole di anticommutazione degli
operatori del campo spinoriale, l’operatore di coniugazione di carica si comporta
esattamente come l’operatore di scambio fra le due particelle, e dunque uno stato
con L ed S definiti sarà autostato di C per l’autovalore

C = −(−1)L (−1)S+1 ≡ (−1)L+S (2.935)

Il parapositronio, allora, il quale ha L = 0 ed S = 0, è pari sotto C, i.e.

C |P ps >= + |P ps > (2.936)

e questo implica, per quanto visto circa l’effetto della coniugazione di carica sul
fotone, che

(e+ e− )P ps → 2γ, 4γ, ... (2.937)

Poiché la sezione d’urto di annichilazione elettrone-positrone in due fotoni si può


dimostrare che, a momento trasferito nullo, essa è pari a
( )2 ( )2
e2 e2 h̄c
σ2γ = σT = 4π r02 = 4π = 4π =
mc2 h̄c mc2
= 4πα2 λ/2C (2.938)

la probabilità di decadimento dello stato di P ps per unità di tempo (all’ordine più


basso, ovvero trascurando i decadimenti con un numero pari di fotoni maggiore
di due) sarà data da

λ2γ = σT c |ψ(0)|2 s−1 (2.939)

dove |ψ(0)|2 fornisce la densità di probabilità di sovrapposizione dell’elettrone


con il positrone che, sullo stato fondamentale n = 1, L = 0, vale168
( )3 ( )3
1 1 1 µe2 1 mc e2 1 3 −3
|ψ(0)| =
2
= = = α λ/C (2.940)
π a3 π h̄2 8π h̄ h̄c 8π
167
Un eventuale fattore di fase eiηC non è rilevante, trattandosi di un sistema parti-
cella/antiparticella, per il quale ci sarebbe comunque compensazione fra quello che molti-
plicherebbe a† e quello, complesso coniugato, che moltiplicherebbe b† .
168
Con µ intendiamo qui la massa ridotta del sistema, mentre con m indichiamo la massa
dell’elettrone (positrone).

159
per cui risulta
1 3 −3 c 5 −1 1 5 mc2
λ2γ = 4π α2 λ/2C c α λ/C = α λ/C = α (2.941)
8π 2 2 h̄
e quindi, essendo la vita media τ2γ niente altro che l’inverso di λ2γ , abbiamo infine
che
−22
h̄ 5 6.582 × 10
τ2γ = 2 α−5 = 2 × (137) = 1.24 × 10−10 s (2.942)
mc2 0.511
Veniamo adesso allo stato dei due fotoni emessi. Visto che (e+ e− )P ps ha evi-
dentemente J = 0, possiamo dire senz’altro che, nel sistema dove esso è a riposo, i
due fotoni emessi in direzione necessariamente opposta (con la stessa energia, pari
alla massa dell’elettrone) dovranno avere la stessa elicità dato che la componente
del momento angolare totale in ogni direzione (e dunque anche in quella di volo
dei fotoni) deve comunque essere nulla. Questo, però, come abbiamo già visto nel
caso del decadimento del π 0 , non basta a definire completamente lo stato, visto
che questa prescrizione individua due stati indipendenti, i.e. (prescindendo dalla
simmetrizzazione dello stato ...)

|⃗k, + > | − ⃗k, + > e |⃗k, − > | − ⃗k, − > (2.943)

per cui, a priori, una qualunque loro combinazione lineare soddisferebbe ancora
la condizione di conservazione del momento angolare.
In realtà lo stato dei due fotoni è univocamente determinato perchè il P ps ha
anche parità definita ed questa simmetria è pure essa conservata dalla dinamica,
i.e. dall’interazione elettromagnetica.
Ma qual è la parità del positronio nel suo stato fondamentale ?
Evidentemente risulta

P = (−1)L Pe+ P e− (2.944)

dove Pe+ P e− è il prodotto delle parità intrinseche del positrone e dell’elettrone


che, per quanto visto, sarà comunque sempre pari a −1.
Dunque, essendo sul fondamentale L = 0, ne segue che la parità sia del para-
positronio che dell’ortopositronio è comunque P = −1.
Per il parapositronio ci troviamo quindi esattamente nella stessa situazione che
nel caso del decadimento del π 0 , avendo lo stato iniziale momento angolare nullo
e parità negativa: per quanto visto trattando il decadimento del π 0 , i due fotoni
avranno dunque polarizzazioni lineari ortogonali.
Non è un caso che si sia ritrovato questo risultato.
Il π 0 , infatti, è fatto proprio dalla combinazione particella/antiparticella, essendo
1 ( )
|π 0 >= √ |uū > −|dd¯ > (2.945)
2

160
Ogni coppia (q q̄) nel π 0 ha momento angolare orbitale relativo L = 0 e si
trova in uno stato di singoletto di spin, i.e. S = 0, per cui lo spin del π 0 , cioè
il momento angolare complessivo J del sistema, è nullo. La particella risulta
pseudoscalare169 proprio perché è costituita da coppie quark/antiquark che es-
sendo fermioni, hanno parità intrinseca opposta, ed essi si trovano in uno stato
che ha L = 0.

Quanto infine all’Ops, esso, avendo S = 1, pur continuando ad avere parità


negativa, è autostato della coniugazione di carica C per l’autovalore −1.
Esso non può decadere in un numero pari di fotoni e quindi, non potendo decadere
per ragioni cinematiche in un solo fotone, deve decadere in almeno tre. Questo
significa che questo processo di annichilazione avviene ad un ordine perturbativo
più alto di quello in due fotoni e dunque dobbiamo aspettarci che

λ3γ ≈ α λ2γ (2.946)


( )2
Per ragioni di spazio delle fasi, compare poi un fattore extra 1

4
3
(π 2 − 9) per
cui alla fine risulta
( )2
1 4 1 5 mc2
λ3γ = (π 2 − 9) α α
4π 3 2 h̄
( ( )2 )−1
−1 1 4
⇒ τ 3γ = τ2γ α (π − 9)
2
= 1.38 × 10−7 s (2.947)
4π 3

169
Sia chiaro che esistono anche mesoni neutri che hanno autovalori diversi da J P C = 0−+ ,
ma, generalmente, quelli di massa più bassa hanno L = S = 0 e dunque J = 0, P = −1 ,
ovvero sono dei mesoni pseudoscalari.

161
3 Scattering e decadimenti
I processi di scattering, insieme a quelli di decadimento (che, comunque, sono
molto simili a quelli d’urto quanto a trattazione formale), costituiscono la strada
naturale che fornisce accesso alla dinamica delle interazioni fra le particelle ele-
mentari.

3.1 La matrice S
L’operatore che descrive completamente il processo d’urto è la matrice S.
Nel seguito ne forniremo la definizione e quindi vedremo di inquadrarne bene il
significato, anche allo scopo di renderne possibile una valutazione perturbativa;
ma per far questo, è bene ripartire dai principi primi della Meccanica Quantistica !

E’ noto che se |ψ, t > è il ket che rappresenta, nello spazio di Hilbert H
associato al sistema considerato, un certo stato fisico al tempo t, allora esso
soddisfa l’equazione

i |ψ, t >= H |ψ, t > (3.948)
∂t
dove H è l’operatore hamiltoniano del sistema che, per ipotesi è autoaggiunto.
Quando H non dipende esplicitamente dal tempo (sistemi conservativi) l’equazione
precedente si integra facilmente nel modo seguente:

|ψ, t >= e−iHt |ψ, 0 > (3.949)

e l’operatore unitario

U (t) = e−iHt (3.950)

viene chiamato, con ovvio significato, operatore di evoluzione temporale.

Se adesso A è una qualsiasi osservabile del sistema, i.e. un qualsiasi operatore


autoaggiunto, allora, se indichiamo con Āψ (t) il valor medio di tale osservabile
sullo stato |ψ, t >, questo, che è un numero reale, risulta essere pari a

Āψ (t) = < ψ, t|A|ψ, t >=< ψ, 0|eiHt A e−iHt |ψ, 0 >=


= < ψ, 0| U −1 (t) A U (t) |ψ, 0 > (3.951)

Come si vede, e come, del resto, dovrebbe essere ben noto dalla Meccanica
Quantistica elementare, i due diversi punti di vista

162
• i) evolvono solo gli stati secondo la legge |ψ, t >= e−iHt |ψ, 0 >,

• ii) evolvono solo le osservabili del sistema, secondo la legge A(t) = eiHt A e−iHt
sono equivalenti ai fini della valutazione dei valori medi delle osservabili ad un
dato istante, peraltro arbitrario.
Come al punto di vista i) (Schrödinger Picture SP) corrisponde l’equazione di
moto per lo stato (equazione di Schrödinger)

i |ψ, t >= H |ψ, t > ⇒ |ψ, t >= e−iHt |ψ > (3.952)
∂t
cosı̀ al punto di vista ii) (Heisenberg Picture HP) corrisponde l’equazione di moto
per le osservabili (equazione di Heisenberg)

i A(t) = [A(t), H] ⇒ A(t) = eiHt A e−iHt (3.953)
∂t
Sia ora data U (α) una famiglia di operatori unitari, parametrizzata dalla variabile
reale α. Tanto nello schema di Heisenberg come in quello di Schrödinger è banale
rendersi conto che la seguente trasformazione simultanea su stati e osservabili

|ψ > ⇒ |ψ, α >= U −1 (α)|ψ > (3.954)


A ⇒ Aα = U −1 (α) A U (α) (3.955)

lascia invarianti tutti i valori di aspettazione, infatti

< ψ, α|Aα |ψ, α >=< ψ|U †−1 (α) U −1 (α) A U (α) U −1 (α)|ψ >=< ψ|A|ψ > (3.956)

Se poniamo adesso

U (α) ≡ U −1 (t) = eiHt (3.957)

ecco che questa trasformazione unitaria ci fa passare dallo schema di Heisenberg


a quello di Schrödinger, dato infatti che risulta

|ψ, t >S = U (t) |ψ >≡ U (t) |ψ >H


(3.958)
AS = U (t) AH U −1 (t)

Ponendo invece

U (α) ≡ U (t) = e−iHt (3.959)

ovviamente passiamo dallo schema di Schrödinger a quello di Heisenberg ...

Supponiamo adesso che l’hamiltoniana del sistema possa essere scritta come

H = H0 + H ′ (3.960)

163
dove, convenzionalmente, H0 rappresenta la parte ”libera”, i.e. quella che solita-
mente sappiamo trattare per ciò che riguarda l’evoluzione del sistema (autostati,

etc ...) ed H rappresenta la perturbazione, i.e. un’interazione.
Ammettiamo che sia H0 come H non dipendano esplicitamente dal tempo e poni-
amo
U0 (t) ≡ e−iH0 t , U (t) ≡ e−iHt (3.961)
Indichiamo con |ψ, t >S e AS , rispettivamente, gli stati e le osservabili nella SP
e con |ψ >H , AH (t) i medesimi nella HP.
Accanto a questi due schemi, se ne pone un altro, quello che è denominato in
letteratura rappresentazione di interazione (Interaction Picture, IP) che, come
vedremo, è una specie di via di mezzo fra i due ed è molto comodo per trattare,
appunto, il problema legato agli effetti dell’interazione stessa.
Facciamo per questo la seguente trasformazione simultanea su stati e osservabili
|ψ, t >S |ψ, t >I ≡ U0−1 (t) |ψ, t >S = eiH0 t e−iHt |ψ >H
→ (3.962)
AS AI (t) ≡ U0−1 (t) AS U0 (t)
Per quanto detto prima, evidentemente gli stati |ψ, t >I e le osservabili AI (t)
sono ”buoni” quanto gli stati |ψ, t >S e le osservabili AS , oppure gli stati |ψ >H e
le osservabili AH (t) per ciò che concerne lo studio dell’evoluzione del sistema, cioè
per quanto riguarda la valutazione dei valori medi delle osservabili, in funzione
del tempo. Questi valori medi170 saranno ovviamente dati infatti da171

I< ψ, t| AI (t)|ψ, t >I (3.963)


Determiniamo ora come evolvono gli stati nella IP: si ha
∂ ∂ ∂
i |ψ, t >= i U0−1 (t) U (t) |ψ >H = i eiH0 t e−iHt |ψ >H =
∂t ∂t ∂t
iH0 t −iHt −iHt
= −H0 e e |ψ >H + e iH0 t
He |ψ >H =
−iH0 t iH0 t −iHt
= −H0 |ψ, t > + e iH0 t
H e e e |ψ >H =
−iH0 t ′
= e iH0 t
(H − H0 ) e |ψ, t >≡ HI (t) |ψ, t >I (3.964)
mentre per le osservabili risulta
∂ ∂
i AI (t) = i U0 (−t) AS U0 (t) = [AI (t), H0 ] (3.965)
∂t ∂t

In sostanza, quindi, nella IP, mentre gli stati evolvono con l’hamiltoniana HI (t),
che, ricordiamolo ancora, è definita come
′ ′ ′ ′
HI (t) = U0 (−t) H U0 (t) = U0 (t)−1 H U0 (t) = eiH0 t H e−iH0 t (3.966)
170
Nel seguito, per comodità di notazione, ometteremo, quando questo non produrrà possibili
confusioni, l’indice I.
171
Questo schema, naturalmente, coincide con quello di Heisenberg quando l’interazione è
assente ... !

164
le osservabili evolvono secondo l’hamiltoniana libera H0 , esattamente come ac-
cade, in assenza di interazione, nella Heisenberg Picture.
Definiamo adesso l’operatore unitario U (t, t′ ) nel modo seguente

U (t, t′ ) |a, t′ >S ≡ |a, t >S (3.967)

Dalla definizione si ottiene immediatamente che

U (t, t′ ) U (t′ ) |a >H = U (t) |a >H ∀ |a >∈ H (3.968)

ovvero risulta

U (t, t′ ) = U (t) U −1 (t′ ) (3.969)

per cui è immediato dimostrare che

U (t, t′ ) U (t′ , t′′ ) = U (t, t′′ )


U (t, t′ )−1 = U (t′ , t)
U (t + τ, t′ + τ ) = U (t, t′ ) (3.970)
U (t, 0) = U (t)
U (0, t) = U −1 (t)

Accanto a questo operatore possiamo definire, in maniera del tutto analoga,


l’operatore UI (t, t′ ), ponendo appunto

UI (t, t′ ) |a, t′ >I ≡ |a, t >I (3.971)

e si ottiene ancora che risulta

UI (t, t′ ) = UI (t) UI−1 (t′ ) (3.972)

come pure che valgono, anche per questo operatore, le proprietà (3.970).
Poichè dalla definizione (3.962) è evidente che risulta

UI (t) ≡ U0−1 (t) U (t) = eiH0 t e−iHt

ne segue altresı̀ che

UI (t, t′ ) = UI (t) UI−1 (t′ ) = U0−1 (t) U (t) U −1 (t′ ) U0 (t′ )


= U0−1 (t) U (t, t′ ) U0 (t′ ) (3.973)

E veniamo adesso alla matrice S.


Sia α un set completo di osservabili che commutano, relative al sistema consider-
ato, comprendente l’hamiltoniana imperturbata. Indichiamo con |α > la base da
esso definita, vista nello schema di Heisenberg relativamente al caso imperturbato
(hamiltoniana H0 ).

165
Supponiamo adesso che uno stato |α > si sia evoluto liberamente fino al tempo
−t e quindi, fra −t e t′ , si sia evoluto secondo l’hamiltoniana completa (pertur-

bata dall’interazione H ).
Ci chiediamo qual è, al tempo t′ , l’ampiezza relativa alla transizione dallo stato
cosı̀ ottenuto ad un certo stato |β >, causata dall’interazione stessa.
In altre parole, ci facciamo la seguente domanda: assumendo di considerare il
sistema come libero sia prima di −t che dopo t′ , lo stato che si è ottenuto dopo
t′ a partire dallo stato |α > al tempo −t, come è connesso con gli stati che risul-
terebbero da un’evoluzione libera del sistema, regolata solo da H0 ?
Per quanto concerne l’ampiezza di transizione di cui sopra, evidentemente avremo

Aβα (t′ , −t) = S < β, t′ , lib| U (t′ , −t) |α, −t, lib >S (3.974)

dove |α, −t, lib >S è lo stato |α > che si evoluto liberamente fino al tempo −t
e, analogamente |β, t′ , lib >S è lo stato |β > che si è evoluto liberamente fino al
tempo t′ . Poichè, in generale, risulta

|α, −t, lib >S = U0 (−t) |α >H (3.975)

abbiamo evidentemente che

Aβα (t′ , −t) =H < β|U0−1 (t′ ) U (t′ , −t) U0 (−t) |α >H (3.976)

ovvero, per la (3.973),

Aβα (t′ , −t) = < β| U (t′ , −t)I |α > (3.977)

Passando al limite la (3.977) per t e t′ che vanno a +∞ otteniamo proprio, per


la sua stessa definizione, l’elemento di matrice S fra i due stati considerati, i.e.

Sβα ≡< β| S |α >= lim Aβα (t′ , −t) = lim < β|UI (t, −t)|α > (3.978)
t,t′ →+∞ t→+∞

ovvero

S = lim UI (t, −t) = UI (∞, −∞) (3.979)


t→+∞

La matrice S, evidentemente unitaria vista la definizione du cui sopra, viene


cosı̀ legata all’operatore di evoluzione temporale in rappresentazione di inter-
azione. Essa, per come l’abbiamo definita, descrive quindi l’azione determinata

dalla presenza dell’interazione H su un set completo di autostati dell’hamiltoniana
libera, definiti in rappresentazione di Heisenberg.
Chiaramente, per conoscere effettivamente gli elementi di matrice Sβα , occor-
rerà in qualche modo riuscire poi ad esplicitare l’operatore UI (t′ , −t) e quindi
passare al limite. D’altronde, per la (3.972), risulta

UI (t′ , −t) = UI (t′ ) UI−1 (−t)

166
dove, per la (3.962), è172

UI (t) = U0−1 (t) U (t) = eiH0 t e−iHt

Ne segue quindi che


[ ]
dUI (t′ , −t) dUI (t′ )
= UI−1 (−t) (3.980)
dt′ dt′

Ma, evidentemente l’operatore UI (t) soddisfa la seguente equazione differenziale

dUI
i = −H0 eiH0 t e−iHt + eiH0 t H e−iHt =
dt
= −eiH0 t H0 e−iH0 t eiH0 t e−iHt + eiH0 t H e−iH0 t eiH0 t e−iHt

= eiH0 t [H − H0 ] e−iH0 t eiH0 t e−iHt = HI (t) UI (t)
dUI ′
⇒ = −i HI (t) UI (t) (3.981)
dt
Quindi, sostituendo nella (3.980), si ha

dUI (t′ , −t) ′ ′ ′ −1 ′


= −i H (t ) UI (t ) U (−t) ≡ −i H (t′ ) UI (t′ , −t) (3.982)
dt′ I I I

D’altronde, evidentemente, UI (t′ , t′ ) = I e con questa condizione al contorno, si


dimostra che l’equazione (3.982) può essere formalmente integrata in serie nel
modo seguente:
∫ t′ ∫ t′ ∫ τ
′ ′ ′
UI (t′ , −t) = I + (−i) HI (τ ) dτ + (−i)2 HI (τ ) dτ HI (τ ′ ) dτ ′ + ...
−t −t −t

per cui, data la (3.979), risulta infine


∫ ∞ ∫ ∞ ∫ τ
′ ′ ′
S = I + (−i) HI (τ ) dτ + (−i) 2
HI (τ ) dτ HI (τ ′ ) dτ ′ + ...
−∞ −∞ −∞

∑ (−i)n ∫ ∞ ( ′ ′
)
= I+ dτ1 , ..., dτn T HI (τ1 ) ...HI (τn ) =
n=1 n! −∞
( ( ∫ +∞ ))

≡ T exp −i dt HI (t) (3.983)
−∞
( ′ ′
)
dove T HI (τ1 ) ...HI (τn ) è il prodotto cronologico (time-ordered) degli operatori
in parentesi, introdotto da Dyson, che coincide con il prodotto degli stessi oper-
atori, con il tempo che cresce andando da destra verso sinistra.

172
La seconda uguaglianza è valida solo se, come abbiamo sempre assunto fin’ora, sia H0 che

H, e quindi H , non dipendono esplicitamente dal tempo.

167
3.2 Proprietà di S sotto CPT
Consideriamo un sistema inizialmente libero, retto dall’hamiltoniana H0 , per il

quale venga accesa l’interazione descritta dall’hamiltoniana H
In QFT, sotto ipotesi molto generali, come la località e l’invarianza sotto il
gruppo di Lorentz, si dimostra che il sistema possiede certamente la simmetria173
CP T ≡ Θ: assumiamo dunque che l’operatore Θ commuti sia con l’hamiltoniana

imperturbata H0 che con quella di interazione H .
La matrice S che descrive, in rappresentazione di interazione, le transizioni fra
gli stati imperturbati, come abbiamo visto prima, è data da
( ( ∫ +∞ ))

S=T exp −i dt HI (t) (3.984)
−∞


dove HI (t) è l’hamiltoniana di interazione in rappresentazione di interazione, i.e.
′ ′
HI (t) = eiH0 t H e−iH0 t (3.985)

Osserviamo per prima cosa che l’operatore Θ, per via del suo carattere antiuni-

tario legato a T , non commuta con HI (t). Abbiamo, infatti, intanto che
[ ]
−1 (iH0 t) (iH0 t)2
Θe iH0 t
Θ = Θ I+ + + ... Θ−1 =
1! 2!
(−iH0 t) (−iH0 t)2
= I+ + + ... = e−iH0 t (3.986)
1! 2!
dove si è usato il fatto che Θ commuta con H0 . Ne segue allora che, poichè per

ipotesi Θ commuta anche con H , risulta
′ ′
Θ HI (t) Θ−1 = Θ eiH0 t Θ−1 Θ H Θ−1 Θ e−iH0 t Θ−1 =
′ ′
= e−iH0 t H eiH0 t = HI (−t) (3.987)

Torniamo adesso alla matrice S.


Vogliamo stabilire l’effetto che ha la trasformazione Θ su di essa.
Per fare questo, immaginiamo per prima cosa di ottenere, al solito, la matrice S
come limite per τ → ∞ di S(−τ, τ ), dove
( ( ∫ +τ ))

S(−τ, τ ) ≡ UI (τ, −τ ) = T exp −i dt HI (t) (3.988)
−τ

essendo l’operatore S(−τ, τ ) ≡ UI (τ, −τ ) niente altro che l’operatore di evoluzione


temporale, scritto in rappresentazione di interazione, fra −τ e +τ .
Dunque, se vogliamo conoscere questo operatore fra −τ e τ + δ, i.e. l’operatore
173
Quanto concluderemo adesso per Θ vale anche per l’inversione temporale T , se essa è una
simmetria conservata del sistema, poiché, come Θ, essa è antiunitaria, ed è proprio questo,
come vedremo, l’aspetto cruciale che ci consente di giungere al risultato.

168
S(−τ, τ + δ), questo di otterrà applicando al vettore di stato prima l’operatore
S(−τ, τ ) e quindi l’operatore S(τ, τ + δ), i.e. risulterà

S(−τ, τ + δ) = S(τ, τ + δ) S(−τ, τ ) (3.989)

Evidentemente, poi, vista la sua definizione, nel limite in cui δ → 0, l’operatore


S(τ, τ + δ) potrà essere scritto anche come (al primo ordine in δ)
′ ′
I − i HI (τ ) δ ≈ S(τ, τ + δ) ≈ I − i HI (τ + δ) δ (3.990)

Dalla (3.989) segue evidentemente che, fissato comunque un intero N e posto

δ = τ /N (3.991)

abbiamo

S(−τ, τ ) = lim [S(τ − δ, τ )S(τ − 2δ, τ − δ)...S(−τ, −τ + δ)] (3.992)


N →∞

il quale, per la (3.990), nel limite in cui N → ∞, a sua volta diviene

S(−τ, τ ) = lim (I − i HI ′ (τ1 ) δ) (I − i HI ′ (τ2 ) δ) ... (I − i HI ′ (τ2N ) δ) ≡


N →∞
≡ lim S(N, τ ) (3.993)
N →∞

dove il prodotto di cui sopra (il quale, nella forma in cui i vari fattori sono
linearizzati al primo ordine, definisce appunto la quantità S(N, τ )), è fatto da
2N fattori ed abbiamo posto, per comodità

τn = τ − n δ ≡ τ − nτ /N ; n = 1, ..., 2N (3.994)

Risulta allora che


( )
Θ S Θ−1 = lim Θ lim S(N, τ ) Θ−1 =
τ →∞ N →∞
= lim { lim Θ [I − i HI ′ (τ1 ) δ] Θ−1 Θ [I − i HI ′ (τ2 ) δ] Θ−1 ...
τ →∞ N →∞

Θ [I − i HI ′ (τ2N ) δ] Θ−1 } =
= lim { lim [I + i HI ′ (−τ1 ) δ] [I + i HI ′ (−τ2 ) δ] ...
τ →∞ N →∞
[I + i HI ′ (−τ2N ) δ]} =
= lim { lim [I + i HI ′ (−τ ) δ] [I + i HI ′ (−τ + δ) δ] ...
τ →∞ N →∞
[I + i HI ′ (τ − δ) δ]} (3.995)

Ma, essendo δ reale ed HI hermitiana, risulta

( ′
)†
I + i HI (t) δ = I − i HI (t) δ (3.996)

169
per cui l’espressione di sopra diviene
{ }†
Θ S Θ−1 = lim
τ →∞
lim [I − i HI ′ (τ − δ) δ] ... [I − i HI ′ (−τ ) δ] ≡
N →∞

≡ S† = S −1
(3.997)

Dunque possiamo concludere che, essendo Θ una simmetria antiunitaria conser-


vata, la matrice S, sotto Θ, è tale per cui

Θ S Θ−1 = S † (3.998)

Da questa conclusione segue allora che, dati comunque due stati imperturbati
| A > e | B >, poiché l’ampiezza di transizione fra uno e l’altro risulta data da

AB→A ≡< A |S | B > ≡ < A |S B >=< Θ−1 Θ A| Θ−1 Θ S Θ−1 Θ B >=


= < Θ−1 Θ A| Θ−1 S † Θ B > (3.999)

e poiché Θ−1 è antiunitario, si ha infine che

< A| S | B > = < Θ−1 Θ A| Θ−1 S † Θ B >=< Θ A| S † Θ B >∗ =


= < S † Θ B| Θ A > (3.1000)

D’altronde S è lineare e quindi

< S † ϕ| ψ >=< ϕ| S ψ > (3.1001)

per cui, in definitiva, in termini di ampiezze di transizione, abbiamo che

AB→A =< A |S | B >=< Θ B| S Θ A >≡< Θ B| S |Θ A > AΘA→ΘB (3.1002)

ovvero, se HI ed H0 sono Θ−invarianti, allora l’ampiezza di transizione indotta


dalla interazione HI dallo stato | B > allo stato | A > è uguale a quella che la
stessa interazione induce dallo stato Θ | A > allo stato Θ | B >.
Per esempio, se consideriamo un processo di scattering come il seguente

a(⃗p, sa ) + b(⃗q, sb ) → c(P⃗ , sc ) + d(Q,


⃗ sd ) (3.1003)

allora, per via della simmetria CP T ≡ Θ, ne segue che

| < c(P⃗ , sc ) , d(Q,


⃗ sd ) | S |a(⃗p, sa ) , b(⃗q, sb ) > | =
¯ Q,
= | < ā(⃗p, −sa ) , b̄(⃗q, −sb )| S |c̄(P⃗ , −sc ) , d( ⃗ −sd ) > | (3.1004)

visto che, dalle relative definizioni segue che la simmetria CP T ≡ Θ trasforma lo


stato di particella in quello di antiparticella, non cambia l’autovalore dell’impulso
ed inverte il segno dell’autovalore della componente di spin (la presenza del mod-
ulo è per ovviare alla presenza di possibili fattori di fase differenti nelle due
ampiezze ...).

170
3.3 Lo scattering in QFT
Abbiamo visto che, nell’ipotesi in cui un sistema fisico sia retto da un’hamiltoniana
′ ′
H = H0 + H , dove H0 è l’hamiltoniana del sistema imperturbato ed H è
l’hamiltoniana di interazione, allora, se |i > ed |f > rappresentano nella HP
due stati del sistema, autostati174 dell’hamiltoniana H0 per lo stesso autovalore

E, l’ampiezza di transizione da |i > ad |f > indotta dalla perturbazione H è
data da

Sf i =< f |S|i >≡< f |UI (∞, −∞)|i > (3.1005)

dove la forma esplicita della matrice S è data dalla espressione (3.983).


Questo risultato è stato dedotto, almeno implicitamente, nello schema della
prima quantizzazione, ma esso continua a valere anche quando il processo di inter-
azione è più complesso che, per esempio quello di un semplice scattering elastico
da potenziale, e addirittura, nell’interazione, possono prodursi nuove particelle ...

Per descrivere questo tipo di processi, in cui il numero delle particelle non
necessariamente si conserva, occorre però far uso della Teoria dei Campi (QFT.
In questo schema, adopereremo come spazio di Hilbert degli stati asintotici del
sistema, lo spazio di Fock di particella libera che, per definizione, ha per base i
vettori seguenti:

|Ω > vuoto
a† (⃗p)|Ω > una particella
a† (p)a† (⃗q)|Ω > due particelle
...

Finchè i campi restano liberi, non c’è molto di più da dire: questi stati sono
stazionari, per cui, fra di loro non è permessa alcuna transizione.

Ma supponiamo ora che sia presente una interazione H .
In questo caso, partendo da uno stato dei precedenti, esso non rimarrà più neces-
sariamente uguale a se stesso poiché l’interazione potrà consentire transizioni fra
stati diversi. Nel caso in cui l’energia totale del sistema sia positiva, queste tran-
sizioni sono niente altro che quelle legate ai processi che usualmente chiamiamo
di decadimento se lo stato inziale è fatto da una sola particella e di scattering se,
invece, è fatto da due175 .
174
Come abbiamo già detto, gli stati |i > e |f > sono chiamati stati asintotici e, come
rappresentativi del sistema completo, vanno pensati in rappresentazione di interazione, i.e. in
rappresentazione di Heisenberg riguardo ad H0 .
175
Si possono prevedere anche casi più complicati, ma noi ci limiteremo a trattare questi due
soli casi ...

171
Per analizzare questi processi, come abbiamo già detto, useremo stati stazionari176
dell’hamiltoniana libera e calcoleremo l’ampiezza di transizione indotta fra di loro
a causa dell’interazione. Considereremo quindi più precisamente
• uno stato |χa >, che chiameremo iniziale, comprendente vari frammenti
(uno, se si tratta di decadimento, due se è un processo di scattering) in un
canale177 definito, che abbiamo indicato con la lettera a;
• uno stato finale |χb > comprendente, in generale, altri frammenti in un
altro canale178 , che indicheremo con la lettera b.
Per t → −∞ lo stato |χa > sarà fatto dalle particelle non interagenti del canale
a: per esempio, nel caso di uno scattering fra due particelle ”1” e ”2” aventi,
rispettivamente, impulso p⃗ e ⃗q, avremo evidentemente
|χa >= a†1 (⃗p) a†2 (⃗q)|Ω > (3.1006)
dove gli operatori a†1,2 sono gli operatori di creazione dei frammenti liberi presenti
nel canale a di ingresso (per semplicità di notazione non stiamo considerando qui
la presenza dello spin).
Per t → +∞, analogamente, se assumiamo di essere finiti nel canale b fatto
ancora da due particelle ”3” e ”4”, non necessariamente coincidenti con quelle di
partenza e aventi, rispettivamente, impulso P⃗ e Q, ⃗ sarà
|χb >= a†3 (P⃗ ) a†4 (Q)|Ω
⃗ > (3.1007)
dove gli operatori a†3,4 si riferiscono ora ai frammenti nel canale b di uscita.
Evidentemente lo scopo della teoria sarà proprio quello di calcolare l’ampiezza di
transizione fra tali stati determinata dall’interazione, i.e. la quantità
Sba ≡< χb |S|χa > (3.1008)
Per la valutazione di Sba , rifacciamoci ancora al fatto che, almeno nello schema
di prima quantizzazione, è stato dimostrato che, lavorando in rappresentazione
di interazione, risulta
( ( ∫ +∞ ))

S = T exp −i dt HI (t) ≡
−∞
( ∞ ∫ )
∑ (−i)n ′ ′
≡ T dt1 ... dtn HI (t1 )...HI (tn ) (3.1009)
n=0 n!
176
Non avrebbe senso, ovviamente, trattare con stati stazionari dell’hamiltoniana completa,
dato che, come è ovvio, fra questi, per definizione di stazionarietà, non potrebbero avvenire mai
transizioni !
177
Un canale è definito come uno specifico insieme di frammenti separati, ognuno in uno stato
quantico ben definito, non interagenti fra di loro quando la loro distanza di separazione è molto
grande (con la sola possibile eccezione dell’interazione coulombiana che, essendo a lungo range,
non è lecito considerare mai spenta...).
178
Se indichiamo dunque con Ha l’hamiltoniana libera di cui è autostato lo stato iniziale,
e con Hb l’hamiltoniana libera di cui è autostato lo stato finale, in generale sarà Ha ̸= Hb .
L’uguaglianza equivale, evidentemente, a dire che lo scattering è elastico !

172

dove HI (t) è appunto l’hamiltoniana di interazione nella Interaction Picture
′ ′
HI (t) ≡ eiH0 t H e−iH0 t (3.1010)

ed il simbolo T indica, come abbiamo già detto, l’operatore di ordinamento crono-


logico, definito in modo tale che
( ′ ′
) ′ ′
T HI (t1 )...HI (tn ) ≡ HI (ti1 )...HI (tin ) con ti1 ≥ ti2 ≥ ...tin (3.1011)

In M Q di prima quantizzazione, avevamo identificato in generale l’hamiltoniana



di perturbazione H con il potenziale di scattering V .
Che accade in QF T ?

In questo caso H è espressa usando gli stessi campi che definiscono la teoria. Ab-

biamo visto che HI (t) evolve nel tempo esattamente come in rappresentazione di

Heisenberg libera, ovvero HI (t) deve semplicemente essere scritta usando i campi
liberi, cioè dipendenti dal tempo come se l’interazione non fosse presente !
Dunque

′ ′
HI (t) = d3 x H (t, x) (3.1012)


dove H (x) è appunto la densità di energia di interazione

H (x) = Htot (x) − H0 (x) (3.1013)

e Htot (x) e H0 (x) sono, rispettivamente, l’operatore di densità hamiltoniana totale


e quello relativo all’evoluzione libera.
Quanto alla matrice di scattering S, risulta quindi che
( ( ∫ ))

S ≡ T exp −i d4 x H (x) (3.1014)

dove adesso179
( ′ ′
) ′ ′
T H (x1 )...H (xn ) ≡ H (xi1 )...H (xin ) con x0i1 ≥ x0i2 ≥ ...x0in (3.1015)
179
L’ambiguità che consegue nella (3.1015) quando due coordinate temporali sono uguali è
irrilevante poiché ′ ′
[H (x), H (y)] = 0 se (x − y)2 < 0
e questo, a sua volta, è conseguenza della microcausalità, i.e. delle relazioni di
(anti)commutazione dei campi (fermionici)bosonici e del fatto che il numero di campi fermionici

che entrano nella lagrangiana di interazione e quindi nella H deve essere pari, se vogliamo che
l’interazione possa essere relativisticamente invariante.

173
Dal punto di vista dell’invarianza sotto il gruppo di Lorentz180 della matrice
S, occorre osservare che, essendo H = T 00 , dove T µν è il tensore (densità di)
energia-impulso, definito in termini della lagrangiana dalla ben nota relazione
∂L
T µν = ∂ ν ϕρ − g µν L ⇒
∂(∂µ ϕρ )
∂L ˙ρ
⇒ T 00 ≡ H = ϕ − L (3.1017)
∂ ϕ˙ρ
ne segue che la densità hamiltoniana non è, in generale, scalare sotto il gruppo
di Lorentz per cui nemmeno S, definita in termini di H, lo sarebbe...
C’è però un’importante eccezione che è quella dell’accoppiamento diretto dei
campi, cioè senza termini che coinvolgono le loro derivate181 . In questo caso,
infatti, per quanto riguarda il contributo dovuto alla sola interazione, risulta

T µν (x) = −L(x) δ µν

e quindi (stiamo indicando con L(x) solo il termine di interazione ...!)



H (x) = −L(x) (3.1018)

che è scalare. Questa identità (3.1018) viene assunta comunque valita in ogni
circostanza, per cui risulta, in definitiva, che
( ∫ )
L(x) d4 x
S ≡ T ei (3.1019)
180
Come abbiamo visto, fissato un riferimento inerziale, l’ampiezza di decadimento da uno
stato iniziale |χα > e uno stato finale |χβ > vale

Sαβ =< χα |S|χβ >

Se andiamo in un altro sistema di riferimento, legato al precedente da una trasformazione del


Gruppo di Poincaré U (a, Λ), allora se |χ′α >= U (a, Λ)|χα > e |χ′β >= U (a, Λ)|χβ > sono gli
stessi stati |χα > e |χβ visti nel nuovo riferimento, essendo il sistema fisico rimasto il solito e
cosı̀ pure la dinamica dell’interazione, deve evidentemente essere che

Sαβ =< χα |S|χβ >=< χ′α |S|χ′β >

ovvero

S = U −1 (a, Λ) S U (a, Λ) (3.1016)

i.e., la matrice S deve commutare con tutti gli operatori che, nello spazio di Hilbert degli
stati, rappresentano il gruppo di Poincaré (occorre e basta che accada per i generatori della
rappresentazione ...) e, in questo senso, deve quindi essere un operatore scalare e invariante
per traslazioni.
181
In realtà, già nel caso dell’interazione elettromagnetica con un campo scalare carico, c’è un
acoppiamento derivativo. Si dimostra comunque che, anche in questi casi, l’espressione corretta
da usare per la matrice S è la (3.1019).

174
Molto spesso la matrice S viene riscritta nella forma seguente

S =I +R (3.1020)

separando cioè il termine che descrive l’assenza di interazione dagli altri.


Evidentemente, dalla definizione, risulta
( ∞ n ∫
)
∑ i
R = T d x1 ... d xn L(x1 )...L(xn ) =
4 4

n=1 n!
∞ n ∫
∑ i
= d4 x1 ... d4 xn T (L(x1 )...L(xn )) (3.1021)
n=1 n!

Consideriamo adesso lo sviluppo della matrice S al primo ordine perturbativo.


Si ha
∫ ∫
S =I +i d x L(x)
4
⇒ R=i d4 x L(x) (3.1022)

Supponiamo, come al solito, che gli stati182 iniziali e finali |χa > e |χb > siano
anche autostati dell’impulso spaziale e indichiamo con pa e pb gli autovalori del
quadrimpulso ad essi corrispondenti. Risulta

Rba =< χb | S − I |χa >= i < χb | d4 x L(x) |χa > (3.1023)

D’altronde sappiamo che l’operatore di quadrimpulso P µ è il generatore delle


traslazioni spazio-temporali, ovvero
µ
U (a) = eiaP = eiaµ P (3.1024)

per cui

eiP y L(x) e−iP y = L(x + y) (3.1025)

e dunque

L(x) = eiP x L(0) e−iP x (3.1026)

per cui, in definitiva, si ha


∫ ∫
Rba = i < χb | d4 x eiP x L(0) e−iP x |χa >= i d4 x eix(pb −pa ) < χb | L(0) |χa >=
= i(2π)4 δ 4 (pb − pa ) < χb | L(0) |χa > (3.1027)

Questa struttura del risultato

Rba = i(2π)4 δ 4 (pb − pa ) Mba (3.1028)


182
Si ricordi che per questi stati, essendo liberi, la rappresentazione di interazione coincide
con quella di Heisenberg e dunque essi non evolvono nel tempo.

175
si può dimostrare183 che resta sempre valida, indipendentemente dall’ordine dello
sviluppo perturbativo.
La quantità Mba viene chiamata elemento di matrice (invariante) della tran-
sizione.
Osserviamo che l’espressione di cui alla (3.1028), da un punto di vista stret-
tamente fisico, discende unicamente dalla conservazione del quadrimpulso184 , i.e.
dal fatto che gli stati iniziali e finali devono comunque avere pa = pb .
Nel caso, poi, in cui il processo di interazione possa essere rappresentato tron-
cando lo sviluppo al primo ordine, da quanto precede risulta evidentemente che

Mba =< χb | L(0) |χa > (3.1029)

In ogni caso, se Pa e Pb sono gli autovalori dello stato iniziale e finale, da quanto
precede possiamo concludere, comunque, che risulta185

Sba = δba + i (2π)4 δ 4 (Pa − Pb ) Mba (3.1030)

Supponiamo, per il momento, di sapere186 come fare per determinare l’elemento


di matrice invariante Mba : il nostro scopo è comunque quello di arrivare a fare
183
Consideriamo infatti un generico termine dello sviluppo perturbativo

< b| dx dy ...dz L(x)L(y)...L(z) |a >

Vogliamo dimostrare che esso contiene in modo intrinseco il fattore δ 4 (pb − pa ).


Effettuiamo, infatti, sull’operatore la seguente trasformazione

dx dy ...dz L(x)L(y)...L(z) =

= dx dy ...dz U (x)L(0)U −1 (x) U (x)L(y − x)U −1 (x)...U (x)L(z − x)U −1 (x) =

= dX dY ...dZ U (x) [L(0)L(y − x)...L(z − x) ] U −1 (x)

per cui, sostituendo (si noti che questo non interferisce con l’ordinamento temporale e quindi
con il prodotto T-ordinato) si ha

< b| dx dy ...dz L(x)L(y)...L(z) |a >=

= (2π)4 δ 4 (pb − pa ) < b| dY ...dZ < b| L(0)L(Y )...L(Z) |a >

dove abbiamo posto Y = y − x; ...Z = z − x.


Risulta cosı̀ provato quanto volevamo dimostrare.
184
Nel caso dello scattering da potenziale, avevamo trovato una delta di conservazione solo
dell’energia. Questo era dovuto al fatto che, in quel processo, solo l’energia era conservata e
non l’impulso spaziale, per via proprio del potenziale esterno ...
185
Abbiamo indicato formalmente il prodotto scalare < χb |χa > con il simbolo δ ba ; ma la sua
forma esplicita dipende, naturalmente, dalla normalizzazione degli stati...
186
Il calcolo di Mba è, in genere, un’impresa piuttosto laboriosa. Esso viene usualmente

176
confronti con dati sperimentali ovvero, tipicamente, determinare sezioni d’urto
di processi di scattering, vite medie di particelle instabili, etc ...
Come è legata Mba con queste grandezze ?
Evidentemente, per quanto detto sopra, la probabilità che dallo stato a si sia
passati allo stato b, quando b ̸= a, sarà

Wba = |Sba |2 = (2π)4 δ 4 (Pa − Pb ) · (2π)4 δ 4 (Pa − Pb ) · |Mba |2 (3.1031)

e qui abbiamo una espressione che richiede di essere trattata, dal punto di vista
matematico, con una qualche cautela ... Abbiamo infatti ottenuto il quadrato di
una δ di Dirac che non è un operatore ben definito !
Ma vediamo come è nato. La delta si origina dall’integrale

ei(Pa −Pb )x d4 x → (2π)4 δ 4 (Pa − Pb )

Il quadrato della delta, dunque, significa


∫ ∫
ei(Pa −Pb )x d4 x · ei(Pa −Pb )y d4 y →

→ (2π) δ (Pa − Pb ) ·
4 4
ei0 d4 y = (2π)4 δ 4 (Pa − Pb ) · V T (3.1032)

dove il prodotto V T è il quadri-volume di integrazione, che, a stretto rigore, è


appunto ∞4 , ma che noi tratteremo inizialmente come se fosse finito, per poi
passare al limite solo alla fine...
Dunque, al prezzo di questi ”maltrattamenti” della matematica, abbiamo

Wba = (2π)4 δ 4 (Pa − Pb ) · V T · |Mba |2 (3.1033)

Va detto comunque che, siccome in generale lo stato b appartiene al continuo,


noi in realtà saremo interessati più che alla probabilità di transizione verso un
particolare stato b, a quella verso un gruppo di stati vicini allo stato b.

La Regola d’oro di Fermi ci dice allora che dovremo moltiplicare Wba per il numero
di stati finali permessi, ovvero per il numero di cellette dello spazio delle fasi
disponibile, i.e. per la quantità
( ) ( )

n
d3 pi V ∏
n
d3 pi V
dN = = (3.1034)
i=1 h3 i=1 (2π)3

dove n è il numero di frammenti nello stato finale ed abbiamo usato il fatto che,
per il principio di indeterminazione, una cella dello spazio delle fasi ha dimensione
effettuato con l’ausilio del metodo dei grafici di Feynman, che, fissato l’ordine perturbativo
desiderato, consente, attraverso regole abbastanza semplici, caratteristiche dell’interazione stu-
diata, di poter tener conto di tutti i vari contributi all’ampiezza di scattering.

177
h = 2π h̄ e noi abbiamo convenuto di porre h̄ = 1.
Quindi, con questa precisazione, risulta piuttosto che
( )

n
d3 pi V
dWba = (2π) δ (Pa − Pb ) · V T · |Mba |
4 4 2
(3.1035)
i=1 (2π)3

ovvero otteniamo una probabilità di transizione per unità di tempo pari a


( )
d ∏n
d3 pi V
(dWba ) = (2π)4 δ 4 (Pa − Pb ) · V · |Mba |2 (3.1036)
dt i=1 (2π)3

L’espressione (3.1036) vale nel caso che gli stati siano normalizzati all’unità
in tutto lo spazio; ma in generale non è questo il caso, non foss’altro per il motivo
che gli stati a e b sono autostati dell’energia e dell’impulso corrispondenti ad
autovalori nel continuo e quindi non hanno né possono norma finita !
Per questo, ciò che potremo fare in generale sarà, in realtà, solo di poter
scegliere il valore delle densità spaziali ρi di particelle descritte dalle funzioni
d’onda associate agli stati asintotici e quindi occorrerà dividere la (3.1036) per
gli opportuni coefficienti di normalizzazione ρi V che ne conseguono, i.e. avremo
piuttosto
∏n ( )
d3 pi V
d (2π) δ (Pa − Pb ) · V
4 4
i=1 (2π)3
(dWba ) = ∏k in
· |Mba |2 ∏n out
(3.1037)
dt j=1 (ρj V ) i=1 (ρi V )

dove abbiamo indicato con k il numero di frammenti nello stato iniziale.


Ma la scelta187 che abbiamo fatto fin’ora è stata sempre quella di avere ρ = 2E
e dunque la probabilità differenziale per unità di tempo dtd (dWba ) diviene
( )

n
d3 pi V
(2π) δ (Pa − Pb )
4 4
· ∏k |Mba |2 (3.1038)
i=1 (2π)3 (2Ei ) j=1 (2E j V )
187
Come abbiamo visto, questo corrisponde a prendere, per esempio, nel caso del campo
scalare semplicemente le onde piane, i.e.

p, t >= e−ipx
< x|⃗

senza alcun coefficiente davanti.


Nel caso del campo di Dirac, invece, questo corrisponde a normalizzare gli spinori secondo le
(2.681) e (2.682), i.e. a porre

p̸ + m (r) m− p̸ (r)
u(r) (p) = √ u0 ; v (r) (p) = √ v0
m+E m+E
per cui, per esempio, per la particella, risulta che (cfr.(2.885))

< x|p, s >= u(s) (p)e−ipx

178
La quantità (2π)4 δ 4 (Pa − Pb ), che descrive semplicemente la conservazione del
quadrimpulso nel processo, moltiplicata per la produttoria che la segue nella
(3.1038), i.e. la quantità
( )

n
d3 pi
dΦ ≡ (2π) δ (Pa − Pb )
4 4
(3.1039)
i=1 (2π)3 (2Ei )

viene chiamata188 elemento invariante dello spazio delle fasi (o anche dLips: dif-
ferential Lorentz invariant phase space) ed ha a che fare con la cinematica dello
stato finale del processo considerato, fissate le condizioni iniziali, descritte ap-
punto attraverso la delta di conservazione.
La cinematica dello stato iniziale si trova, invece, nel termine F, definito dalla
relazione
1 V
≡ ∏k (3.1040)
F j=1 (2Ej V )

mentre la dinamica del processo resta, invece, tutta dentro il modulo quadro
dell’elemento di matrice |Mba |2 , legato direttamente all’interazione.
In termini di queste quantità, risulta allora che
d 1
(dWba ) = |Mba |2 dΦ (3.1041)
dt F
A proposito poi della cinematica dello stato iniziale, come già detto, dis-
tingueremo sostanzialmente due casi, ovvero quello in cui partiamo da una sola
o da due particelle.
Nel caso in cui lo stato iniziale sia fatto da una sola particella, i.e. nel caso di un
decadimento, la probabilità (differenziale) per unità di tempo è il rate (differen-
ziale) del decadimento, il quale vale quindi, in generale

d V 1
dΓ = (dWba ) = |Mba |2 · dΦ = |Mba |2 · dΦ (3.1042)
dt 2E V 2E
Nel caso particolare, poi, in cui il decadimento avvenga nel sistema di riferimento
dove la particella a (di massa Ma ) che decade si trova a riposo (riferimento del
188
L.B. Okun: Leptons and quarks, North-Holland 1982

179
CM), il rate differenziale assume evidentemente la forma seguente189
1
dΓCM = |Mba |2 · dΦ (3.1043)
2Ma
Se invece lo stato iniziale è fatto da due particelle, ovvero si tratta di un processo
di scattering, allora il processo stesso sarà caratterizzato da una sezione d’urto
differenziale, definita come
d
(dWba ) = dσ · j (3.1044)
dt
dove j è la densità di flusso incidente (cm−2 sec−1 ).
Siccome, con la normalizzazione adottata, ci siamo riportati comunque al caso di
una sola particella proiettile nel volume V , la quale urta contro una sola particella
bersaglio, ecco che il flusso incidente sarà pari alla densità di particelle proiettile
per il modulo della velocità relativa proiettile-bersaglio (valutata nel riferimento
del bersaglio fermo), i.e.
1
j = vrel · (densita′ della seconda particella) = vrel ×
V
e dunque
( )
dWba
d dt V V 1
dσ = = 2
|Mba |2 dΦ = |Mba |2 dΦ (3.1045)
j 2M1 2E2 V v 2M1 2E2 v
dove il termine 2M1 2E2 v è detto termine di flusso.
L’espressione ottenuta puo essere generalizzata ad ogni sistema di riferimento
osservando che risulta190

M1 E2 v = (P1 · P2 )2 − M12 M22 (3.1046)
189
Si osservi che, poiché tanto |Mba |2 che dΦ sono invarianti, integrando la (3.1042) e la
(3.1043) se ne conclude che
M 1
Γ= ΓCM = ΓCM
E γ
ovvero, essendo Γ τ = h̄, esse affermano il fatto ben noto secondo cui la vita media di una
particella vista in un riferimento in cui essa è in moto risulta γ volte maggiore di quella osservata
nel riferimento di quiete della particella

τ = γ τCM

190
Valutiamo infatti, nel sistema di riferimento in cui M1 è ferma, la quantità

(P1 P2 )2 − M12 M22

Evidentemente, in questo riferimento, risulta

P1 = (M1 , ⃗0), P2 = (E2 , p⃗2 )

180
ottenendo cosı̀ la seguente espressione invariante a vista di dσ
1
dσ = √ |Mba |2 dΦ (3.1047)
4 (P1 · P2 ) − M1 M2
2 2 2

Questo risultato è corretto per particelle senza spin.


Se le particelle che partecipano al processo hanno anche spin, allora, nel caso in
cui lo stato iniziale non abbia spin def inito e quello degli stati finali non sia
osservato, risulta, rispettivamente
1 1
dΓ = · · |Mba |2 dΦ (3.1048)
2Sa + 1 2Ea
1 1
dσ = · √ |Mba |2 dΦ(3.1049)
(2S1 + 1)(2S2 + 1) 4 (P1 · P2 )2 − M12 M22

dove Sa è lo spin della particella che decade, S1 , S2 quello delle due particelle che
collidono e |M|2 indica la somma su tutti gli stati di spin iniziali e finali.
1
I fattori 2S+1 servono appunto a tener conto che, in effetti, sugli stati iniziali
occorre mediare e non sommare, come invece si deve fare su quelli finali ...

dunque
(P1 P2 )2 − M12 M22 = (M1 E2 )2 − M12 M22 = M12 (E22 − M22 ) = M12 |⃗
p2 |2
e dunque √
(P1 P2 )2 − M12 M22 = M1 p2
D’altronde, in generale, sappiamo che

p/E = β ≡ v

e dunque risulta provato quanto asserito, i.e. che nel riferimento in cui la prima particella è in
quiete, si ha √
(P1 P2 )2 − M12 M22 = M1 E2 v

181
3.4 Lo spazio delle fasi
3.4.1 Lo spazio delle fasi di due particelle
Nel caso di due particelle nello stato finale, l’elemento di spazio delle fasi invari-
ante, secondo la definizione (3.1039), è

d3 p d3 q
dΦ = dLips(p, q; P ) = (2π)4 δ 4 (p + q − P ) (3.1050)
(2π)3 2Ep (2π)3 2Eq

dove p, q sono i loro quadrimpulsi, mentre P è quello di tutto il sistema ed


abbiamo posto √ √
Ep ≡ M12 + |⃗p|2 , Eq = M22 + |⃗q|2 (3.1051)
L’elemento di spazio delle fasi (3.1050) può essere riscritto come dunque anche
come
1 d3 p d3 q
dΦ = dLips = δ(Ep + E q − E)δ 3
(⃗
p + ⃗
q − ⃗
P ) (3.1052)
16π 2 Ep Eq

dove E ≡ P 0 è l’energia totale del sistema (valutata nel particolare sistema di


riferimento dove stiamo studiando il processo) mentre P⃗ è il suo impulso totale.

Supponiamo, come di solito accade, di essere interessati ad una particella


particolare, per esempio a quella di quadrimpulso p e di guardarla a prescindere
dall’altra particella. Il contributo alla distribuzione che si riferisce alla particella
considerata, proveniente dallo spazio delle fasi (sia che si tratti di scattering, come
di un decadimento) si ottiene, evidentemente, integrando l’espressione precedente
nell’altra variabile, cioè in d3 q. Otteniamo cosı̀

1 d3 p
dΦ = δ(Ep + Ê − E) (3.1053)
16π 2 Ep Ê

dove abbiamo posto Ê ≡ M22 + |P⃗ − p⃗|2 a rappresentare l’energia della parti-
cella che non guardiamo, avente massa M2 e momento lineare

⃗q = P⃗ − p⃗

Passando in coordinate polari, risulta

d3 p = p2 dp dΩ

e quindi, più esplicitamente

1 ( ) p2 dp dΩ
dΦ = δ E p + Ê(⃗
p) − E (3.1054)
16π 2 Ep Ê(⃗p)

182
D’altronde

Ep2 = M12 + p2 ⇒ Ep dEp = p dp

per cui si ha

d3 p = p Ep dEp dΩ

e dunque, finalmente
1 p Ep dEp dΩ
dLips = 2
δ(Ep + Ê − E)
16π Ep Ê
1 dEp
= 2
δ(Ep + Ê − E) p dΩ (3.1055)
16π Ê
Questo risultato è corretto in ogni sistema di riferimento.
Esso può essere ulteriormente semplificato se studiamo il processo di scattering
nel sistema del CM, dove p⃗ + ⃗q = P⃗ ≡ ⃗0.
Indichiamo con b il modulo del momento lineare delle due particelle uscenti
nel sistema del CM. Poichè

Ep2 = M12 + b2 Eq2 = M22 + b2

abbiamo, evidentemente, che

b db = Ep dEp = Eq dEq

Introduciamo allora la variabile w = Ep + Eq . Otteniamo


b db b db Ep + Eq
dw = dEp + dEq = + = b db
Ep Eq Ep Eq
w w w
= b db = dEp = dEq
Ep Eq Eq Ep
i.e.
dw dEq dEp
= =
w Ep Eq

Sostituendo allora nella espressione (3.1055), otteniamo (Eq = Ê; w = Ep + Ê)


1 dw
dLips = 2
δ(w − ECM ) b dΩCM (3.1056)
16π w
che può essere facilmente integrata e fornisce
1 b
dLips = dΩCM (3.1057)
16π ECM
2

183
Ma, per definizione, l’energia totale del sistema nel centro di massa è niente altro
che

ECM = s (3.1058)

mentre, per quanto riguarda il modulo dell’impulso b191 , risulta



(s − M12 − M22 )2 − 4M12 M22
b= √ (3.1059)
2 s

Perciò, dalle (3.1057), (3.1058) e (3.1059) otteniamo finalmente l’espressione


seguente, scritta, per quanto possibile, in termini di invarianti di Lorentz192

1 (s − M12 − M22 )2 − 4M12 M22
dLips = dΩCM (3.1060)
16π 2 2s

Nel caso si voglia determinare l’espressione dello spazio delle fasi nel sis-
tema del Laboratorio invece che nel sistema del centro di massa, si può ripartire
dall’espressione (3.1054)

1 ( ) p2 dp dΩ
dΦ ≡ dLips = δ Ep + Ê(⃗
p) − E (3.1061)
16π 2 Ep Ê(⃗p)
191
Ricordiamo infatti che
√ √
ECM ≡ M12 + b2 + M22 + b2 ⇒
√ √
ECM
2
= M12 + b2 + M22 + b2 + 2 M12 + b2 M22 + b2 ⇒
√ √
2 M12 + b2 M22 + b2 = s − M12 − M22 − 2b2 ⇒
4(M12 + b2 )(M22 + b2 ) = (s − M12 − M22 − 2b2 )2 ⇒
4M12 M22 + 4M12 b2 + 4M22 b2 + 4b = (s −
4
− + 4b4 − 4b2 (s − M12 − M22 )
M12 M22 )2

(s − M12 − M22 )2 − 4M12 M22
⇒ 4b2 s = (s − M12 − M22 )2 − 4M12 M22 ⇒ b = √
2 s

192
E’ forse utile, a questo punto, ricordare che, per la (3.1059), b esiste se e solo se

(s − M12 − M22 )2 − 4M12 M22 ≥ 0


⇒ (s − M12 − M22 )2 ≥ 4M12 M22
⇒ s − M12 − M22 ≥ 2M1 M2

⇒ s ≥ (M1 + M2 )2 ⇒ M1 + M2 ≤ s

ovvero se e solo se siamo sopra soglia di produzione ...

184
dove abbiamo voluto mettere chiaramente in evidenza il fatto che non solo Ep ,
ma anche Ê dipende da p⃗, essendo, come si è visto

Ê ≡ Ê(⃗p) = M22 + |P⃗ − p⃗|2

Per poter aver l’espressione della dipendenza angolare della distribuzione, occorre
prima fare l’integrale in dp, eliminando cosı̀ la delta.
Ma l’argomento della δ di Dirac è una funzione di p⃗, che vale
√ √
F (⃗p) = M12 + p2 + M22 + |P⃗ − p⃗|2 − E (3.1062)

D’altronde la condizione F (⃗p) = 0 altri non è che la


√ formalizzazione della con-
servazione dell’energia nel processo, mentre Êq = M22 + |P⃗ − p⃗|2 contiene la
conservazione dell’impulso lineare (integrazione in d3 q...), quindi la soluzione

p̂ = p̂ (cosθ)

dell’equazione F (⃗p) = 0 è niente altro che la soluzione193 che esprime l’impulso


193
L’equazione F (⃗
p) = 0, come si è detto, esprime la conservazione dell’energia nel sistema di
riferimento del Laboratorio e contiene implicitamente quella dell’impulso.
In questo riferimento, infatti, il sistema delle due particelle ha, per ipotesi, energia totale
E ed impulso spaziale P⃗ che, senza perdita di generalità, potremo assumere sia diretto come
l’asse z. Il quadrimpulso del sistema è dunque dato da
µ
(PLab ) = (E, P⃗ ) = (E, 0, 0, P ) ⇒ s = E 2 + P 2 (3.1063)

⃗ del sistema del CM visto dal Laboratorio è diretta lungo


Questo significa che la velocità β
l’asse z e vale, in modulo
P E E
β= ⇔ γ=√ =√ (3.1064)
E E2 − P 2 s

D’altronde, visto che la massa invariante del sistema delle due particelle è appunto s mentre
le loro masse sono, rispettivamente, M1 ≡ m e M2 ≡ M , ecco che, nel sistema del CM , il
modulo dell’impulso spaziale di entrambe le particelle vale, come è noto

(s − m2 − M 2 )2 − 4m2 M 2
b= √ (3.1065)
2 s
Dunque, nel sistema del CM , l’impulso spaziale della particella M1 ≡ m sarà dato, in generale,
senza perdita di generalità, dalla relazione

p⃗ = b (sinΘ, 0, cosΘ) (3.1066)

dove Θ è proprio l’angolo di scattering nel sistema del CM . Trasformando dunque all’indietro,
avremo che, nel sistema del Laboratorio, sarà

p̂x = b sinΘ; (3.1067)


p̂y = 0; (3.1068)

p̂z = γ b cosΘ + γβ m2 + b 2 (3.1069)

185
uscente della particella urtante in funzione dell’angolo di scattering, date le con-
dizioni iniziali del processo, definite da E e da P⃗ .

dove m2 + b2 è l’energia della particella considerata nel sistema del CM , tale che

(s − m2 − M 2 )2 − 4m2 M 2 (s − m2 − M 2 )2 − 4m2 M 2 + 4m2 s


m2 + b2 = m2 + = =
4s 4s
(s − m2 + M 2 )2 √ s + m2 − M 2
= ⇒ m2 + b 2 = √ (3.1070)
4s 2 s

Dunque, in termini dell’angolo di scattering Θ, abbiamo

p̂x = b sinΘ (3.1071)


p s+m −M 2
p2
p̂z = γ b cosΘ + √ √ = γ b cosΘ + (s + m2 − M 2 ) (3.1072)
s 2 s 2s

Ritroviamo cosı̀ il fatto ben noto che l’impulso della particella nel sistema del Laboratorio sta
su un’ellisse [J. Blaton: On a geometrical interpretation of energy and momentum conservation
in atomic collisions and disintegration processes; Mat.-Fys Medd. vol 24, nr 20, 1 (1950)]
avente semiasse minore pari a b , semiasse maggiore pari a γ b e centro spostato di
2s (s + m − M ) lungo l’asse z.
p 2 2

Questo significa, come sappiamo, che se


p
γb> (s + m2 − M 2 ) (3.1073)
2s
allora l’ellisse contiene l’origine e ad ogni angolo di scattering Θ nel sistema del CM (0 ≤ Θ ≤ π)
corrisponde uno ed un solo angolo di scattering θ nel sistema del Laboratorio (0 ≤ θ ≤ π).
Invece, nel caso in cui sia
p
γb< (s + m2 − M 2 ) (3.1074)
2s
allora l’ellisse non contiene l’origine e dunque non tutti gli angoli θ sono possibili nel sistema
del Laboratorio, ma solo quelli che non eccedono un opportuno θmax ; inoltre, ad ogni angolo
0 ≤ θ ≤ θmax corrispondono, in generale, due valori di Θ e dunque per ogni angolo di scattering
nel sistema del Laboratorio sono possibili due valori di p̂.
L’angolo θmax sta nel primo quadrante: esso si può determinare in base a semplici considerazioni
geometriche. Infatti, data in generale l’ellisse di equazione
( )2 ( y )2
z−a
y = b sinϕ ; z = a + b cosϕ ⇔ + =1 (3.1075)
γb b

allora la tangente dell’angolo θmax è la pendenza k della retta y = kz che intercetta l’ellisse in
due punti coincidenti. Sostituendo nell’equazione dell’ellisse, si ha

(z − a)2 + k 2 γ 2 z 2 = γ 2 b2 ⇔ z 2 (1 + k 2 γ 2 ) − 2za + a2 − γ 2 b2 = 0 (3.1076)

La condizione di due soluzioni coincidenti è, ovviamente, quella di discriminante nullo, i.e.

= 0 = a2 − (1 + k 2 γ 2 )(a2 − γ 2 b2 ) ⇔ a2 − a2 + γ 2 b2 − k 2 γ 2 (a2 − γ 2 b2 ) = 0
4
b2 b
⇔ k2 = ⇒ k=√ (3.1077)
a −γ b
2 2 2
a − γ 2 b2
2

186
( )
Dunque, nel nostro caso a = P
2s (s + m2 − M 2 ) è

b
tgθmax = √ (3.1078)
P
[ 2s (s + m2 − M 2 )]2 − γ 2 b2

D’altronde
[ ]2
P P2 E 2 (s − m2 − M 2 )2 − 4m2 M 2
(s + m2 − M 2 ) − γ 2 b2 = 2 (s + m2 − M 2 )2 − =
2s 4s s 4s
[ ]
P 2 (s + m2 − M 2 )2 − (s + P 2 ) (s − m2 − M 2 )2 − 4m2 M 2
= =
[ 2 4s2 ]
P s + m + M + 2sm − 2sM − 2m M − (s − 2sm − 2sM 2 + m4 + M 4 + 2m2 M 2 − 4m2 M 2 )
2 4 4 2 2 2 2 2 2
=
[ ] [ 4s2 ]
s (s − m − M ) − 4m M
2 2 2 2 2 2
P 4sm 2 (s − m2 − M 2 )2 − 4m2 M 2
− = − =
4s2 4s2 4s
4m2 P 2 − (s − m2 − M 2 )2 + 4m2 M 2 4m2 (M 2 + P 2 ) − (s − m2 − M 2 )2
= = (3.1079)
4s 4s
dunque, ricordando la definizione di b, abbiamo infine

(s − m2 − M 2 )2 − 4m2 M 2
tgθmax = √ (3.1080)
4m2 (M 2 + P 2 ) − (s − m2 − M 2 )2

Torniamo ora alla condizione che discrimina il caso in cui c’è corrispondenza uno a uno fra
Θ e θ e quello in cui questo non accade. Riscriviamo, per questo, la condizione in questione:
abbiamo visto che c’è corrispondenza uno a uno se e solo se
P
γb > (s + m2 − M 2 ) (3.1081)
2s √
E (s − m2 − M 2 )2 − 4m2 M 2 P
⇒ √ √ > (s + m2 − M 2 )
s 2 s 2s

P (s − m2 − M 2 )2 − 4m2 M 2 b
⇒ < ≡√ (3.1082)
E s + m2 − M 2 b + m2
2

E questo risultato mostra che, come era ovvio che dovesse essere, affinché ( la condizione
) (3.1081)
sia soddisfatta occorre e basta che la velocità βCM del sistema del CM βCM ≡ PE sia inferiore
al
( modulo della velocità
) della particella considerata (di massa M1 = m nel sistema del CM
β1CM = √b2 b+m2 .
Ma riveniamo adesso alla questione da cui eravamo partiti, cioè a quella di esplicitare la
funzione p̂ = p̂ (cosθ).
L’espressione trovata in funzione dell’angolo di scattering Θ nel sistema del CM non è la
più adatta per questo scopo: ci è servita solo per capire se e quando ci dobbiamo aspettare
limitazioni dalla cinematica del processo sul valore stesso dell’angolo di scattering θ nel sistema
del Laboratorio.
Ripartiamo dunque dall’equazione F (⃗ p) = 0, dove la funzione F è data dalla (3.1062), i.e.
√ √
p) = M12 + p2 + M22 + |P⃗ − p⃗|2 − E = 0
F (⃗ (3.1083)

187
la quale fornisce, evidentemente, la relazione
√ √
E = M1 + p + M22 + |P⃗ − p⃗|2
2 2 (3.1084)

dalla quale si ha
√ √
M 2 + |P⃗ − p⃗|2 = E − m2 + p2 (3.1085)

ovvero, elevando al quadrato



M 2 + P 2 − 2P pcosθ + p2 = E 2 + m2 + p2 − 2E m2 + p 2 (3.1086)

dove θ è proprio l’angolo di scattering nel sistema del Laboratorio, i.e. l’angolo fra l’impulso
complessivo del sistema P⃗ e l’impulso p⃗ della particella in esame, dopo il processo d’urto.
Semplificando, ricordando che s ≡ E 2 − P 2 otteniamo

2E m2 + p2 = s + 2P pcosθ − M 2 + m2 (3.1087)

da cui, quadrando ancora, si ricava

4E 2 (m2 + p2 ) = (s + m2 − M 2 )2 + 4pP cpsθ(s + m2 − M 2 ) + 4p2 P 2 cos2 θ


⇒ 4p2 (E 2 − P 2 cos2 θ) − 4pP (s2 + m2 − M 2 )cosθ + 4m2 E 2 − (s + m2 − M 2 )2 = 0(3.1088)

D’altronde E 2 − P 2 cos2 θ = E 2 − P 2 + P 2 sin2 θ = s + P 2 sin2 θ quindi l’equazione a cui arriviamo


infine è la seguente

4p2 (s + P 2 sin2 θ) − 4pP (s + m2 − M 2 )cosθ + 4m2 E 2 − (s + m2 − M 2 )2 = 0 (3.1089)

la quale è un’equazione di secondo grado nell’impulso incognito p della particella di massa m,


parametrica in θ (tutte le altre quantità sono fissate dalle condizioni iniziali).
Il discriminante ridotto dell’equazione vale
∆ [ ]
= 4P 2 (s + m2 − M 2 )2 cos2 θ − 4(s + P 2 sin2 θ) 4m2 E 2 − (s + m2 − M 2 )2 =
4 [ ]
= (s + m2 − M 2 )2 4P 2 cos2 θ + 4(s + P 2 sin2 θ) − 4(s + P 2 sin2 θ) 4m2 E 2 =
= (s + m2 − M 2 )2 (4s + 4P 2 ) − 4m2 4E 2 (s + P 2 sin2 θ) =
= 4E 2 (s + m2 − M 2 )2 − 4E 2 4m2 (s + P 2 sin2 θ) =
[ ]
= 4E 2 (s + m2 − M 2 )2 − 4m2 (s + P 2 sin2 θ) (3.1090)

Evidentemente questo è sempre positivo, qualunque sia l’angolo θ, se e solo se

(s + m2 − M 2 )2 > 4m2 (s + P 2 ) ≡ 4m2 E 2 (3.1091)

ovvero se e solo se
√ √
(s + m2 − M 2 ) > 2m E ⇔ m2 + b2 · 2 s > 2m E

m2 + b 2 E (CM )
⇔ > √ ⇔ γ1 > γCM (3.1092)
m s

188
(CM )
in accordo con quanto avevamo già ottenuto con la relazione (3.1082) (γ1 è il γ delle
particelle di massa m = M1 nel sistema del CM , mentre γCM è il γ del sistema del CM visto
dal sistema del Laboratorio).
Supponendo adesso, per semplicità, che valga la condizione
(CM ) (CM )
γ1 > γCM ⇔ β1 > βCM (3.1093)

allora, poiché il termine noto dell’equazione di secondo grado è evidentemente negativo, essendo
il coefficiente di p2 positivo, l’equazione ha due radici di segno opposto. Siccome la soluzione
che cerchiamo deve essere positiva, essendo il modulo di un vettore, essa sarà la maggiore delle
due, ovvero coinciderà necessariamente con

2P (s + m2 − M 2 ) + ∆/4
p̂(θ) ≡ p+ = =
4(s + P 2 sin2 θ)

2P (s + m2 − M 2 ) + 2E (s + m2 − M 2 )2 − 4m2 (s + P 2 sin2 θ)
= =
4(s + P 2 sin2 θ)

P (s + m2 − M 2 ) + E (s + m2 − M 2 )2 − 4m2 M 2 − 4m2 P 2 sin2 θ
= (3.1094)
2(s + P 2 sin2 θ)
(CM ) (CM )
Nel caso che sia γ1 < γCM ⇔ β1 < βCM allora, come già sappiamo, non tutti gli angoli
di scattering θ nel sistema Laboratorio sono possibili, ma solo quelli per i quali ∆/4 ≥ 0, i.e.

(s + m2 − M 2 )2 > 4m2 (s + P 2 sin2 θ) ⇔ (s + m2 − M 2 )2 − 4m2 s > 4m2 P 2 sin2 θ


⇔ (s − m2 − M 2 )2 − 4m2 M 2 > 4m2 P 2 sin2 θ
(s − m2 − M 2 )2 − 4m2 M 2
⇔ sin2 θ ≤ sin2 θmax ≡ (3.1095)
4m2 P 2
da cui, appunto,

4m2 P 2 + 4m2 M 2 − (s − m2 − M 2 )2
cos2 θmax = 1 − sin2 θmax = (3.1096)
4m2 P 2
e dunque, come avevamo già trovato,

(s − m2 − M 2 )2 − 4m2 M 2
tgθmax = (3.1097)
4m2 P 2 + 4m2 M 2 − (s − m2 − M 2 )2

essendo θmax nel primo quadrante.


Nel caso, comunque, in cui 0 ≤ θ ≤ θmax , cioè quando l’equazione di secondo grado in p ha
soluzioni reali, allora, visto che il termine noto dell’equazione è positivo come il coefficiente di
p2 , entrambe le soluzioni devono essere dello stesso segno.
Siccome p+ è positivo poiché P (s+m2 −M 2 ) > 0, allora anche p− è positiva e dunque entrambe
le soluzioni sono accettabili. Risultano cosı̀ due diversi valori di p̂ per uno stesso valore di θ ed
essi sono tali che

P (s + m2 − M 2 ) ± E (s + m2 − M 2 )2 − 4m2 M 2 − 4m2 P 2 sin2 θ
p̂± (θ) = (3.1098)
2(s + P 2 sin2 θ)

189
Quanto poi alla delta, sappiamo che, in generale, avremo (assumiamo per
semplicità una sola soluzione p̂ = p̂(θ))
1
δ(F (⃗p)) = δ(p − p̂)
dF

dp p=p̂

per cui, data la (3.1062), risulta



dF p̂ p̂ − P cosθ Êp̂ p̂ + Ep̂ p̂ − Ep̂ P cosθ
= + =

dp p=p̂ Ep̂ Êp̂ Ep̂ Êp̂

e quindi, sostituendo nella (3.1061), si ha

1 p2 dp dΩ
dΦ = δ(E p + Ê(p) − E) =
16π 2 Ep Ê(p)
1 Ep̂ Êp̂ p2 dp dΩ
= δ(p − p̂) =
16π 2 Êp̂ p̂ + Ep̂ p̂ − Ep̂ P cosθ Ep Ê(p)
1 Ep̂ Êp̂ p̂2 dΩ
= =
16π 2 Êp̂ p̂ + Ep̂ p̂ − Ep̂ P cosθ Ep̂ Êp̂
1 p̂2 d (− cos θ) 1 p̂ d (−cosθ)
= = (3.1099)
8π Êp̂ p̂ + Ep̂ p̂ − Ep̂ P cosθ 8π Êp̂ + Ep̂ − Ep̂ Pp̂ cosθ

Chiaramente, però
Êp̂ + Ep̂ = E
per cui, finalmente, si può scrivere che, per un sistema di due particelle aventi
quadriimpulso totale (E, P⃗ ), l’elemento invariante di spazio delle fasi nel sistema
del Laboratorio (integrato nell’angolo azimutale), relativo ad una qualunque delle
due particelle, è espresso dalla relazione194

1 p̂ d (−cosθ)
dΦ = (3.1100)
8π E − Ep̂ Pp̂ cosθ

dove (Ep̂ , p̂) è il suo quadriimpulso dopo il processo d’urto, mentre θ è l’angolo
polare (di scattering), entrambi misurati nel laboratorio.

194
J.D. Bjorkeen and S.D. Drell: Relativistic Quantum Fields, Ch.16 McGraw Hill, 1965

190
3.4.2 Lo spazio delle fasi di tre particelle: il plot di Dalitz
Consideriamo per concretezza un processo di decadimento195 a tre corpi

X →A+B+C

dove X abbia massa M , mentre A, B, C abbiano, rispettivamente, masse mA , mB


ed mC , con, ovviamente
M ≥ mA + mB + mC
Abbiamo visto dalla (3.1048) che, mediando sullo spin iniziale e sommando su
quelli finali, quanto al rate di decadimento, risulta
1 1
dΓ = |M|2 dΦ (3.1101)
2J + 1 2E
dove J è lo spin della particella X, E è la sua energia nel sistema di riferimento
scelto, |M|2 è la somma dei moduli quadri degli elementi di matrice per i vari
stati di spin iniziali e finali.
L’elemento di spazio delle fasi per tre particelle nello stato finale, data la
(3.1039), si scrive, evidentemente, come

d3 p d3 q d3 k
dΦ = (2π)4 δ 4 (p + q + k − P ) (3.1102)
(2π)3 2Ep (2π)3 2Eq (2π)3 2Ek

dove p, q, k sono, rispettivamente, i quadrimpulsi delle particelle A, B, C mentre


P è quello della particella X. Come si vede, l’elemento dΦ e quindi dΓ (attraverso
dΦ e |M|2 ) dipendono formalmente da 9 variabili, i.e. p⃗, ⃗q e ⃗k. L’integrazione
della δ 4 ne elimina 4, per cui si resta cosı̀ con 5 variabili effettive.
Cerchiamo adesso di capire meglio la natura cinematica di queste variabili restanti
e di determinare quali sono quelle su cui si può integrare ulteriormente, certi che
dΓ non potrà comunque essere da loro dipendente (attraverso |M|2 ).
Per far questo, mettiamoci nel sistema del CM, ovvero nel sistema di riferimento
in cui X è in quiete. L’impulso lineare p⃗ della particella A, per esempio, potrà,
a priori, essere orientato in una direzione qualsiasi, e questo comporta 2 angoli
di Eulero ! Gli altri due impulsi, ⃗q e ⃗k, dovranno essere coplanari con p⃗, dato
che la somma dei tre impulsi è nulla: ma il piano potrà essere qualsiasi e dunque
esiste ancora un angolo di rotazione azimutale intorno a p⃗, che fissa la posizione
di questo piano.
In conclusione, dei 5 parametri liberi da cui dipende dΦ, 3 sono angoli che
fissano nello spazio la terna p⃗, ⃗q, ⃗k ma da cui |M|2 non può dipendere, almeno
195
Nel caso di un processo di scattering con tre corpi nello stato finale, le considerazioni sullo
spazio delle fasi sono del tutto analoghe, solo che, invece di rate di decadimento dΓ parleremo
1
di sezione d’urto differenziale dσ ed al posto del fattore 2S+1 · 2E
1
ci sarà, come abbiamo visto,
il termine di flusso, ovvero il fattore (2S1 +1)(2S2 +1) · √
1 1
4 (P1 ·P2 ) −M1 M2
2 2 2

191
nell’ipotesi di isotropia dello spazio (stiamo, comunque, qui assumendo implici-
tamente che la particella che decade non sia polarizzata)...
Potremo quindi integrare su di essi, per arrivare infine ad un elemento dello spazio
delle fasi del sistema che, come pure |M|2 , potrà dipendere solo da due parametri
cinematici del processo.
Vediamo qual è la forma che dΦ finisce dunque per assumere.
Essendo dΦ un invariante di Lorentz, operiamo nel sistema del CM, dove appunto
P⃗ = 0. Ripartiamo dalla (3.1102) ed integriamo in d3 k. Si ha
(2π 4 ) 1 1 1
dΦ = δ(Ep + Eq + Ê − M ) d3 p d3 q (3.1103)
(2π)9 2Ep 2Eq 2Ê
dove, per tener conto che p⃗ + ⃗q + ⃗k = 0, abbiamo definito

Ê ≡ m2C + |⃗p + ⃗q|2 (3.1104)
Passando in coordinate polari per quanto riguarda p⃗, abbiamo
1 1
dΦ = 5
δ(Ep + Eq + Ê − M ) p2 dp dΩp d3 q (3.1105)
(2π) 2Ep 2Eq 2Ê
Possiamo integrare su dΩp , e questo corrisponde a sommare sulle direzioni di
p⃗ nello spazio, originate dalla arbitrarietà di scelta dell’orientamento del sistema
di riferimento del CM : otteniamo
4π 1
dΦ = 5
δ(Ep + Eq + Ê − M ) p2 dp d3 q (3.1106)
(2π) 2Ep 2Eq 2Ê
Avendo integrato in dΩp , abbiamo ”assorbito” i due gradi di libertà relativi
all’orientazione del vettore p⃗ nello spazio (il vettore ⃗q qui è pensato ”rigida-
mente legato” al vettore p⃗), per cui, da ora in poi, dobbiamo ritenere p⃗ f isso
nello spazio, per esempio orientato secondo l’asse z.
Usando ancora le coordinate polari per ⃗q, ma riferite stavolta a p⃗ come asse polare
(per quanto riguarda l’integrazione precedente in d3 p, l’asse polare di riferimento
era arbitrario !), abbiamo, evidentemente
d3 q = q 2 dq sinθ dθ dϕ
ma l’argomento della δ dipende solo dall’angolo θ fra i vettori p⃗ e ⃗q e non
dall’angolo azimutale ϕ, attraverso la quantità
|⃗p + ⃗q|2 = p2 + q 2 + 2pq cosθ
quindi di può integrare in dϕ (e questo corrisponde appunto alla arbitrarietà di
scelta del piano su cui giacciono i tre vettori p⃗, ⃗q, ⃗k, ... ), ottenendo cosı̀
4π 1
dΦ = 5
2π δ(Ep + Eq + Ê − M ) p2 dp q 2 dq sinθ dθ
(2π) 2Ep 2Eq 2Ê
2 1
= 3
δ(Ep + Eq + Ê − M ) p2 dp q 2 dq d(−cosθ) (3.1107)
(2π) 2Ep 2Eq 2Ê

192
Possiamo ora integrare in cosθ per eliminare la δ di Dirac. Il solo termine nel suo
argomento che dipende da cosθ è

Ê = m2C + p2 + q 2 + 2pq cosθ
e si ha

∂(E + E + Ê − M ) ∂ Ê 2pq pq
p q
= = = (3.1108)
∂(−cosθ) ∂(−cosθ) 2Ê Ê
quindi196
2 1 1
dΦ = 3
δ(−cosθ + cosθ̄) pq p2 dp q 2 dq d(cosθ) (3.1109)
(2π) 2Ep 2Eq 2Ê Ê

dove abbiamo indicato con cosθ̄ la soluzione in cos θ dell’equazione


Ep + Eq + Ê − M = 0
i.e. dell’equazione
√ √ √
m2A + p2 + m2B + q2 + m2C + p2 + q 2 + 2pq cosθ = M
Integrando, risulta
2 1 Ê 2
dΦ = 3
p dp q 2 dq
(2π) 2Ep 2Eq 2Ê p q
1 1
= 3
p dp q dq (3.1110)
(2π) 2Ep 2Eq
D’altronde, essendo
√ √
Ep ≡ m2A + p2 ; Eq ≡ m2B + q 2
risulta
p dp = Ep dEp ; q dq = Eq dEq
per cui, in conclusione, per l’elemento di spazio delle fasi invariante di un sistema
di tre particelle, nel CM si ha semplicemente
1
dΦ = dEp dEq (3.1111)
4(2π)3
196
Ricordiamo a questo proposito che se f (x) è una funzione derivabile, allora, se indichiamo
∂x |x=xi ̸= 0, risulta
con xi i suoi zeri, i.e. i punti per i quali f (xi ) = 0, se accade che ∂f
∑ δ(x − xi )
δ (f (x)) dx = dx
∂f
i ∂x |x=xi

193
Poniamo adesso, per comodità di notazione

p1 ≡ p p2 ≡ q p3 ≡ k

m1 ≡ mA m2 ≡ mB m3 ≡ mC
e definiamo i seguenti invarianti di Lorentz (masse invarianti quadre delle tre
possibili coppie di particelle)

s1 ≡ (p2 + p3 )2 = m22 + m23 + 2(p2 p3 ) (3.1112)


s2 ≡ (p1 + p3 )2 = m21 + m23 + 2(p1 p3 ) (3.1113)
s3 ≡ (p1 + p2 )2 = m21 + m22 + 2(p1 p2 ) (3.1114)

Evidentemente, dalla conservazione del quadrimpulso, risulta anche

s1 ≡ (P − p1 )2 = M 2 + m21 − 2(P p1 ) (3.1115)


s2 ≡ (P − p2 )2 = M 2 + m22 − 2(P p2 ) (3.1116)
s3 ≡ (P − p3 )2 = M 2 + m23 − 2(P p3 ) (3.1117)

che, nel sistema del CM, diventano197

s1 = M 2 + m21 − 2M E1 (3.1119)
s2 = M 2 + m22 − 2M E2 (3.1120)
s3 = M 2 + m23 − 2M E3 (3.1121)

Il loro significato fisico è proprio quello descritto nel riferimento del CM dalle
relazioni (3.1119)-(3.1121): descrivono, a parte costanti, l’energia nel CM delle
tre particelle. Risulta

ds1 = −2M dE1 ≡ −2M dEp (3.1122)


ds2 = −2M dE2 ≡ −2M dEq (3.1123)

e quindi, poichè dΦ è invariante di Lorentz e nel CM assume la forma


1 1 ds1 ds2
dΦ = 3
dEp dEq = (3.1124)
4(2π) 4(2π)3 (2M )2
197
I tre invarianti non sono indipendenti fra loro, infatti sommando le (3.1119)-(3.1121) e
ricordando che nel CM

E1 + E2 + E3 ≡ EA + EB + EC ≡ Ep + Eq + Ek = M

si ottiene

s1 + s2 + s3 = 3M 2 + m21 + m22 + m23 − 2M (E1 + E2 + E3 ) =


= M 2 + m21 + m22 + m23 (3.1118)

194
essendo s1 ed s2 invarianti, l’espressione (3.1124) deve essere valida in ogni sis-
tema di riferimento198 .
In conclusione, per tre particelle, abbiamo, in generale, che, in qualunque riferi-
mento, risulta
ds1 ds2
dΦ = (3.1125)
16M 2 (2π)3
e. se sostituiamo questa espressione di dLips nell’espressione completa del rate di
decadimento e della sezione d’urto differenziale, abbiamo finalmente le espressioni
1 1 ds1 ds2
dΓ = |M|2 (3.1126)
2J + 1 2E 16 M 2 (2π)3
1 1 1 ds1 ds2
dσ = √ |M|2 (3.1127)
2J1 + 1 2J2 + 1 4 (Pin1 Pin2 )2 − Min1 Min2
2 2 16 s (2π)3

L’importanza del risultato ottenuto sta nel fatto che, se si fa uno scatter plot
degli eventi nelle variabili s1 ed s2 , lo spazio delle fasi fornisce un contributo
uniforme in tutta la zona cinematicamente accessibile, quindi ogni addensamento
di punti che si osservi in essa è dovuto alla dinamica del processo199 .
Lo scatter plot in questione si chiama200 plot di Dalitz-Fabri.
Per esempio, se le particelle B e C formano uno stato risonante di massa M ∗ ,
allora, nel plot di Dalitz, si osserverà un addensamento di eventi per s1 = (M ∗ )2 !

Veniamo infine alla determinazione della zona cinematicamente accessibile del


Dalitz plot. Abbiamo visto che
si = M 2 + m2i − 2M Ei (3.1128)
dunque, essendo Ei ≥ mi , risulterà
si ≤ M 2 + m2i − 2M mi = (M − mi )2 (3.1129)
D’altronde201 , posto che (i, j, k) sia una permutazione pari di (1, 2, 3), risulta
si = mjk = (P − pi )2 = (pj + pk )2 ≥ (mj + mk )2 (3.1130)
198
Naturalmente, dato che i tre invarianti sono linearmente dipendenti fra loro secondo la
(3.1118) una qualunque coppia (si , sj ) dei tre va altrettanto bene ...
199
Naturalmente stiamo qui assumendo una accettanza del rivelatore perfettamente uniforme:
se questo non accade, allora anche l’accettanza può, ovviamente, provocare disuniformità nel
plot in questione: occorre quindi tenerne opportunamente conto attraverso, per esempio, una
simulazione Montecarlo, e correggere.
200
E. Fabri: A study of tau-meson decay Il Nuovo Cimento 11, 480 (1954)
R.H. Dalitz: Decay of τ mesons of known charge Phys. Rev 94, 1046 (1954)
201
Ricordiamo che la massa invariante del sistema di due particelle è definita come
m2AB ≡ (pA + pB )2

195
quindi abbiamo da soddisfare simultaneamente le tre disuguaglianze seguenti

(m2 + m3 )2 ≤ s1 ≤ (M − m1 )2 (3.1131)
(m1 + m3 )2 ≤ s2 ≤ (M − m2 )2 (3.1132)
(m1 + m2 )2 ≤ s3 ≤ (M − m3 )2 (3.1133)

ed inoltre deve valere l’uguaglianza

s1 + s2 + s3 = M 2 + m21 + m22 + m23 ≡ 3s0 (3.1134)

Ne segue che, fissando arbitrariamente, per esempio, s1 ed s2 in modo che sod-


disfino, rispettivamente, la (3.1131) e la (3.1132), allora, ponendo

s3 = 3s0 − s1 − s2

se questa quantità soddisfa la disuguaglianza (3.1133), la terna (s1 , s2 , s3 ) cosı̀


individuata verifica le condizioni (3.1131)-(3.1134) e questo equivale a dire che,
nel CM, la terna delle energie E1 , E2 , E3 soddisfa le condizioni

3
E i ≥ mi ; Ei = M (3.1135)
i=1

Ma questo non significa ancora che la cinematica del decadimento sia rispettata,
infatti, se è vero che, dalla (3.1135) si possono definire i moduli degli impulsi
spaziali delle tre particelle, attraverso le relazioni

p2i = Ei2 − m2i

e questi risulteranno sicuramente reali essendo Ei ≥ mi , non è affatto detto


che questi valori di pi possano essere tali che la loro somma vettoriale sia nulla.
Affinchè questo accada, occorre e basta che i moduli p1 , p2 e p3 soddisfino la
disuguaglianza triangolare, i.e., per esempio, siano tali che202

p1 + p2 ≥ p3 ; |p1 − p2 | ≤ p3 (3.1136)
e nel sistema del CM, dove

pA = (EA , p⃗); pB = (EB , −⃗


p)

si ha
m2AB = (EA + EB )2
e siccome EA ≥ mA , EB ≥ mB , segue che

m2ab ≥ (mA + mB )2

202
E’ un risultato di geometria che se la disuguaglianza triangolare vale nella forma della
(3.1136), allora vale per qualunque altra permutazione degli indici ...

196
e dunque
(p1 + p2 )2 ≥ p23 ⇔ p21 + p22 + 2p1 p2 ≥ p23 (3.1137)
|p1 − p2 |2 ≤ p23 ⇔ p21 + p22 − 2p1 p2 ≤ p23 (3.1138)
ovvero
−2p1 p2 ≤ p21 + p22 − p23 ≤ 2p1 p2 ⇔ |p21 + p22 − p23 | ≤ 2p1 p2(3.1139)
da cui, quadrando ancora, si ottiene
( )
p41 + p42 + p43 ≤ 2 p21 p22 + p21 p23 + p22 p23 (3.1140)

D’altronde, per la (3.1128), si ha


( )2
M 2 + m2i − si
p2i = Ei2 − m2i = − m2i (3.1141)
2M
per cui, sostituendo la (3.1141) nella (3.1140), in termini solo di s1 , s2 e delle
masse delle particelle, si ottiene, dopo aver moltiplicato per M 2 , che deve essere
( )
s1 s22 + s21 s2 − s1 s2 m21 + m22 + m23 + M 2 +
( )
+s1 m22 m23 − M 2 m23 − m21 m22 + M 2 m21 +
( )
+s2 m21 m23 − M 2 m23 − m21 m22 + M 2 m21 +
+M 2 m43 − m21 m22 m23 − M 2 m22 m23 − M 2 m21 m23 +
+M 4 m23 + m1 m42 + m41 m42 − m21 m22 M 2 ≤ 0 (3.1142)
Imponendo allora la condizione in questione, insieme a quella sui limiti per s1 ed
s2 dati dalle (3.1131) e (3.1132), si ha infine la zona cinematicamente accessibile
del plot di Dalitz.
Spesso poi, al posto delle variabili s1 ed s2 si usano variabili adimensionali203 ,
come, per esempio,
s1 + s2
u = s1 = M 2 (u + v)
2M 2
⇔ (3.1143)
s1 − s2
v = s2 = M 2 (u − v)
2M 2
203
Si osservi che nelle variabili u, v definite dalla (3.1143), l’elemento di spazio delle fasi,
essendo
ds1 ds2 = 2M 4 du dv
risulta espresso da
2M 4 du dv M2
dΦ = = du dv
16M 2 (2π)3 8(2π)3

197
V
0.1

0.075

0.05

0.025

U
0.3 0.325 0.35 0.375 0.4 0.425 0.45 0.475 0.5

-0.025

-0.05

-0.075

-0.1

Figure 10: Regione permessa nel Dalitz plot relativo al decadimento


K ± → π±π+π− .

In questo caso, ponendo µi ≡ mi /M , la disuguaglianza (3.1142) diviene


( )
2u3 + v 2 − u2 − 2uv 2 + u µ21 + µ22 − 2µ21 µ22 − 2µ23 + µ21 µ23 + µ22 µ23 +
( ) ( ) ( )
+u2 −µ21 − µ22 − µ23 + v µ21 − µ22 − µ21 µ23 + µ22 µ23 + v 2 µ21 + µ22 + µ23
−µ21 µ22 + µ41 µ22 + µ21 µ42 + µ23 − µ21 µ23 − µ22 µ23 − µ21 µ22 µ23 + µ43 ≤ 0 (3.1144)

La figura 10 mostra la regione accessibile nel Dalitz plot nelle variabili u, v so-
pradefinite, nel caso particolare in cui µi = 139.57018
493.677
= 0.2827, che corrisponde al
decadimento
K ± → π±π+π−

198
3.4.3 Lo spazio delle fasi di n particelle
Abbiamo visto che, nel caso di n particelle, risulta

n ∏
n
d3 pi
dΦ(n) = (2π)4 δ 4 ( pi − P ) (3.1145)
i=1 i=1 (2π)3 2Ei
Questo elemento invariante dello spazio delle fasi può essere riscritto come prodotto
di quello relativo a (n − 1) particelle per quello di due particelle, in modo da per-
mettere una sua valutazione ricorsiva per qualunque n.
L’idea è che le n particelle dello stato finale considerato potranno essere rag-
guppate in un insieme di (n − 1) particelle, a cui aggiungere poi la n-esima. Con-
siderando l’insieme di (n − 1) particelle come un unico soggetto (di quadrimpulso
e massa invariante variabili ...), ecco che il sistema iniziale risulterà composto
da due ”particelle”: una vera, mentre l’altra è fittizia e descrive l’insieme delle
restanti (n − 1) particelle, la cui struttura interna sarà poi precisata da Φ(n−1) .
Vediamo formalmente come questo accada.
Poniamo, per comodità di notazione

n ∏
n
d3 pi
dΦ(n) = (2π)4 δ 4 ( pi − P ) ≡ dΦ(n) (P ; p1 , ..., pn )(3.1146)
i=1 i=1 (2π)3 2Ei
e riscriviamolo, intanto, come segue
d3 pn ∏
n−1
d3 pi
dΦ(n) (P ; p1 , ..., pn ) = (2π)4 δ 4 (p1 + ... + pn − P ) (3.1147)
(2π)3 2En i=1 (2π)3 2Ei
Osserviamo quindi che, qualunque sia m ≥ 0, vale la seguente identità
∫ ∞ dµ2 ∫ d4 q
1= 4
2π θ(q 0 ) δ(q 2 − µ2 ) (2π)4 δ(p1 + ... + pm − q) (3.1148)
0 2π (2π)
Facendo m = n − 1 e sostituendo questa espressione nella (3.1147), otteniamo
dΦ(n) (P ; p1 , ..., pn ) =

dµ2 ∫ d4 q
= 2π θ(q 0 ) δ(q 2 − µ2 ) (2π)4 δ 4 (p1 + ... + pn−1 − q)
2π (2π)4
d3 pn ∏
n−1
d3 pi
(2π)4 δ 4 (p1 + ... + pn−1 + pn − P ) =
(2π)3 2En i=1 (2π)3 2Ei

dµ2 ∫ d4 q
= 2π θ(q 0 ) δ(q 2 − µ2 )
2π (2π)4

n−1
d3 pi
(2π)4 δ 4 (p1 + ... + pn−1 − q)
i=1 (2π)3 2Ei
3
d pn
(2π)4 δ 4 (q + pn − P )
(2π)3 2En

199
ma, come sappiamo, risulta

d4 q 1 d3 q
2π θ(q 0
) δ(q 2
− µ2
) =
(2π)4 (2π)3 2q 0

e quindi, in definitiva, abbiamo


∫ ∏
n−1
dµ2 d3 pi
dΦ (n)
(P ; p1 , ..., pn ) = (2π) δ (p1 + ... + pn−1 − q)
4 4
3
2π i=1 (2π) 2Ei
d3 pn 1 d3 q
(2π)4 δ 4 (q + pn − P ) =
(2π)3 2En (2π)3 2q 0

dµ2
= dΦ(2) (P ; pn , q)dΦ(n−1) (q; p1 , ..., pn−1 ) (3.1149)

che è la formula di ricorrenza cercata.
Per quanto riguarda infine i limiti di integrazione in dµ2 , si osservi che, essendo

q = p1 + ... + pn−1

ne segue che
q 2 ≡ µ2 ≥ m21 + ... + m2n−1

200
3.5 Applicazione allo scattering (quasi-)elastico
Consideriamo adesso in dettaglio il processo di scattering fra due particelle A e
B (aventi masse MA e MB , quadrimpulsi k e p, negli stati di spin α e β, rispetti-
vamente) che dà luogo a due particelle C e D (di masse MC e MD , quadrimpulsi
k ′ e p′ , negli stati di spin α′ e β ′ , rispettivamente), che non coincidono, necessari-
amente, con quelle incidenti:

A(k; α) + B(p ; β) → C(k ′ ; α′ ) + D(p′ ; β ′ ) (3.1150)


Abbiamo già visto che questo processo è descritto dalla sezione d’urto dif-
ferenziale invariante
1
dσ = |M|2 dΦ (3.1151)
F
dove, ricordiamolo ancora una volta
• F è il termine di flusso incidente, associato alla cinematica delle particelle
A e B, dato da √
F = 4 (kp)2 − MA2 MB2 (3.1152)
• dΦ è, per un assegnato impulso totale Ptot ≡ k + p, l’elemento di spazio
delle fasi invariante di Lorentz, associato alle due particelle C e D, uscenti
dall’interazione
d3 k ′ d3 p′
dΦ(k ′ , p′ ; Ptot ) = (2π)4 δ 4 (k ′ + p′ − Ptot ) (3.1153)
(2π)3 2EC (2π)3 2ED
√ √
con EC = MC2 + |k⃗′ |2 , ED = MD2 + |p⃗′ |2 le energie delle particelle C e
D, rispettivamente.
• |M|2 è il modulo quadro dell’ampiezza di scattering invariante, relativa al
processo in esame.
Se le due particelle incidenti non sono polarizzate, allora occorre evidentemente
mediare sugli stati di spin iniziali, i.e. operare nella (3.1151) la sostituzione
1 1 ∑
|M|2 → |M(α, β; α′ , β ′ )|2 (3.1154)
2SA + 1 2SB + 1 α,β

mentre, se non osserviamo lo spin delle particelle emergenti, dobbiamo sommare


sui possibili stati di spin finali, i.e. porre

|M|2 → |M(α, β; α′ , β ′ )|2 (3.1155)
α′ ,β ′

Perciò, se le particelle incidenti sono non polarizzate e non ci curiamo degli stati
di spin finali, allora
1 1
|M|2 → |M|2 (3.1156)
2SA + 1 2SB + 1

201
dove ∑∑
|M|2 ≡ |M(α, β; α′ , β ′ )|2 (3.1157)
α,β α′ ,β ′

Poiché |M|2 è un invariante relativistico, esso potrà essere funzione solo di


invarianti costruiti, evidentemente, a partire dai quadrimpulsi delle particelle che
partecipano al processo.
Insieme alla massa invariante quadra s del sistema che già conosciamo, defini-
amo ora anche gli altri due invarianti di Mandelstam t ed u , associati processo
di scattering considerato, ponendo

s = (k + p)2 = MA2 + MB2 + 2(kp) = (k ′ + p′ )2 = MC2 + MD2 + 2(k ′ p′ ) (3.1158)


t = (k − k ′ )2 = MA2 + MC2 − 2(kk ′ ) = (p′ − p)2 = MD2 + MB2 − 2(pp′ ) (3.1159)
u = (k − p′ )2 = MA2 + MD2 − 2(kp′ ) = (k ′ − p)2 = MC2 + MB2 − 2(k ′ p) (3.1160)

Questo è quanto ci basta e gli invarianti cosı̀ definiti sono, addirittura ”troppi”,
infatti essi non sono fra loro indipendenti204 e soddisfano l’equazione205

s + t + u = MA2 + MB2 + MC2 + MD2 (3.1169)


204
Il processo d’urto coinvolge quattro particelle, ma a causa della conservazione del quadrim-
pulso totale, solo tre quadrimpulsi sono indipendenti tra loro. Con tre quadrivettori possiamo
costruire sei invarianti, ma quattro combinazioni di questi dovranno coincidere con le masse
delle particelle date, per cui non potranno che esistere solo due scalari indipendenti (a parte le
masse) costruiti con i quadrimpulsi delle particelle coinvolte nel processo.
205
Osserviamo che dalle definizioni (3.1158)-(3.1160) segue che, sommando membro a membro
le sei equazioni, risulta
(∑ )
2s + 2t + 2u = 3 M2 + 2 A (3.1161)

dove abbiamo posto


(∑ )
M2 ≡ MA2 + MB2 + MC2 + MD
2
(3.1162)
A ≡ (kp) + (k ′ p′ ) − (kk ′ ) − (pp′ ) − (kp′ ) − (k ′ p) (3.1163)

D’altronde

A = (kp) + (k ′ p′ ) − (kk ′ ) − (pp′ ) − (kp′ ) − (k ′ p) =


= (kp) + (k ′ p′ ) − k(k ′ + p′ ) − p(k ′ + p′ ) = (kp) + (k ′ p′ ) − (k + p)(k ′ + p′ ) =
= (kp) + (k ′ p′ ) − s (3.1164)
A = (kp) + (k ′ p′ ) − (kk ′ ) − (pp′ ) − (kp′ ) − (k ′ p) =
= −(kk ′ ) − (pp′ ) + p(k − k ′ ) − p′ (k − k ′ ) = −(kk ′ ) − (pp′ ) − (k − k ′ )(p′ − p) =
= −(kk ′ ) − (pp′ ) − t (3.1165)
A = (kp) + (k ′ p′ ) − (kk ′ ) − (pp′ ) − (kp′ ) − (k ′ p) =
= −(kp′ ) − (k ′ p) + p(k − p′ ) − k ′ (k − p′ ) = −(kp′ ) − (k ′ p) − (k − p′ )(k ′ − p) =
= −(kp′ ) − (k ′ p) − u (3.1166)

202
per cui, fissate le masse delle quattro particelle, in generale, sarà
|M|2 = |M|2 (s, t, u) (3.1170)
dove solo due invarianti sono realmente necessari.
Quanto poi al termine di flusso (3.1152), ricavando (kp) dalla (3.1158) in
termini della variabile s, possiamo riscriverlo nel modo seguente

F = 2 (s − MA2 − MB2 )2 − 4MA2 MB2 (3.1171)
ovvero, usando la (3.1181) e quindi facendo intervenire il modulo a dell’impulso
spaziale delle particelle iniziali nel CM

F = 4a s (3.1172)
Per quanto riguarda poi l’elemento di spazio delle fasi invariante dΦ, integrando
la (3.1153) in d3 p′ e quindi in dk, come sappiamo dalla (3.1060), si ottiene
1 4 ′ ′ d3 k ′ d3 p′
dΦ = δ (k + p − p tot ) =
16π 2 EC ED

1 (s − MC2 − MD2 )2 − 4MC2 MD2
= dΩCM (3.1173)
16π 2 2s
1 b
= 2
√ dΩCM (3.1174)
16π s
dove
• dΩCM è l’elemento di angolo solido associato nel CM ad una qualsiasi delle
due particelle uscenti;
• la quantità206

(s − MC2 − MD2 )2 − 4MC2 MD2
b≡ √ = |p⃗′ CM | = |k⃗′ CM | (3.1176)
2 s
è il modulo dell’impulso spaziale sia della particella C che D, cosı̀ come
appare nel riferimento del CM.
Dunque, sommando, otteniamo
3 A = A − (s + t + u) ⇒ 2 A = − (s + t + u) (3.1167)
e quindi, sostituendo nella (3.1161), si ha appunto che
(∑ )
(s + t + u) = M 2 ≡ MA2 + MB2 + MC2 + MD
2
(3.1168)

206
Osserviamo ancora una volta che quest’ultima quantità è definita solo se
(s − MC2 − MD ) − 4MC2 MD
2 2 2
≥ 0 ⇔ s ≥ (MC + MD )2 (3.1175)
i.e., se ci troviamo sopra soglia di produzione ...!

203
x
C 6

*

A -  B - z
  

 
+

 y
D

Se il sistema207 del CM è scelto in accordo con la figura sopra riportata e


lo scattering è simmetrico attorno all’asse z, (per esempio, perchè le particelle
incidenti A e B sono non polarizzate...), allora

1 (s − MC2 − MD2 )2 − 4MC2 MD2
dΦ = d(−cosθCM ) (3.1184)
16π s
207
Allorchè trattammo la cinematica dell’urto anelastico fra due particelle A e B, di massa
MA ed MB , che danno luogo a due particelle C e D, di massa MC ed MD , vedemmo che, nel
sistema del CM , se allineiamo gli assi in modo che A si propaghi lungo la direzione dell’asse
polare z, abbiamo

A: k = ( MA2 + a2 , 0, 0, a) (3.1177)

B: p = ( MB2 + a2 , 0, 0, −a) (3.1178)

C: k ′ = ( MC2 + b2 , b sinθ, 0, b cosθ) (3.1179)

D: p ′ = ( MD 2 + b2 , −b sinθ, 0, −b cosθ) (3.1180)

dove a, b sono, rispettivamente, i moduli degli impulsi lineari delle due coppie (A,B) e (C,D),
legati alla variabile di Mandelstam s (massa invariante quadra del sistema) dalle relazioni
√ √
(s − MA2 − MB2 )2 − 4MA2 MB2 (s − MC2 − MD 2 )2 − 4M 2 M 2
a= √ ; b= √ C D
(3.1181)
2 s 2 s

per cui possiamo anche scrivere


√ √
s + MA2 − MB2 s + MB2 − MA2
EA = MA2 + a2 = √ ; EB = MB2 + a2 = √ (3.1182)
2 s 2 s
√ √
s + MC2 − MD2
2 + b2 = s + MD
2
− MC2
EC = MC2 + b2 = √ ; ED = MD √ (3.1183)
2 s 2 s

204
Perciò, usando questo risultato nella equazione (3.1151), insieme con l’espressione
del flusso incidente dato dalla equazione (3.1171), otteniamo infine

1 1 (s − MC2 − MD2 )2 − 4MC2 MD2
dσ = √ |M|2 d(−cosθCM )
(2SA + 1)(2SB + 1) 32πs (s − M 2 − M 2 )2 − 4M 2 M 2
A B A B
(3.1185)
i.e.
1 1 b
dσ = |M|2 d(−cosθCM ) (3.1186)
(2SA + 1)(2SB + 1) 32πs a
la quale, nel caso di scattering elastico (le particelle nello stato finale coincidono
con quelle nello stato iniziale) si semplifica, evidentemente, in

1 |M|2
dσ|el = d(−cosθCM ) (3.1187)
(2SA + 1)(2SB + 1) 32πs

Invece dell’angolo di scattering cosθCM , talvolta è più conveniente usare altre


variabili, come, per esempio, la variabile adimensionale208 y definita nella nota
riportata sotto, attraverso l’equazione (3.1189), in termini del momento trasferito

q ≡ k − k ′ = p − p′ (3.1198)

Abbiamo dimostrato [cfr. (3.1193)] che la variabile y può essere scritta come

y = A − B cosθCM (3.1199)
208
Definiamo la variabile adimensionale y in termini del quadrimpulso trasferito

q ≡ k − k′ (3.1188)

dalla particella A a B, nel modo seguente

pq pk ′ 2 pk ′
y≡ =1− =1− (3.1189)
pk pk 2 pk

Ma, dalle equazioni (3.1178), (3.1179) e dalle equazioni (3.1182), (3.1183), si ha


√ √
2 pk ′ = 2 MC2 + b2 MB2 + a2 + 2ab cosθCM (3.1190)
s + MC2 − MD
2
s + MB2 − MA2
=2 √ √ + 2ab cosθCM (3.1191)
2 s 2 s

mentre, dalla definizione stessa di s in termini dei quadrimpulsi di A e B, risulta

2 pk = s − MA2 − MB2 (3.1192)

205
dove [cfr.(3.1194), (3.1195)]

(s + MC2 − MD2 )(s + MB2 − MA2 )


A=1− (3.1200)
2s(s − MA2 − MB2 )
(3.1201)
2ab
B= = (3.1202)
s − MA2 − MB2
√ √
(s − MC2 − MD2 )2 − 4MC2 MD2 (s − MA2 − MB2 )2 − 4MA2 MB2
= (3.1203)
2s(s − MA2 − MB2 )

Perciò, per una energia totale fissata nel CM s = ECM , abbiamo

dy = B d(−cosθCM ) (3.1204)

e dunque, ripartendo dalla relazione (3.1186)


1 1 b
dσ = |M|2 d(−cosθCM ) (3.1205)
(2SA + 1)(2SB + 1) 32 π s a
otteniamo
1 1 b dy
dσ = |M|2 =
(2SA + 1)(2SB + 1) 32 π s a B
1 1 b s − MA2 − MB2
= |M|2 dy
(2SA + 1)(2SB + 1) 32 π s a 2ab
Perciò, sostituendo nella equazione (3.1189), otteniamo infine

y = A − B cosθCM (3.1193)

dove
(s + MC2 − MD2
)(s + MB2 − MA2 )
A=1− (3.1194)
2s(s − MA2 − MB2 )
2ab
B= =
2 pk
√ √
(s − MC2 − MD
2 )2 − 4M 2 M 2
C D (s − MA2 − MB2 )2 − 4MA2 MB2
= (3.1195)
2s(s − MA − MB2 )
2

da cui, evidentemente, per s fissato, risulta


dy
d(−cosθCM ) = (3.1196)
B
e quindi, in termini della variabile y,

1 s − MA2 − MB2
dΦ = √ dy (3.1197)
8π (s − MA2 − MB2 )2 − 4MA2 MB2

206
dσ 1 1 s − MA2 − MB2
⇒ = |M|2 (3.1206)
dy (2SA + 1)(2SB + 1) 32 π s 2a2

ovvero, finalmente

dσ 1 1 s − MA2 − MB2
= |M|2 (3.1207)
dy (2SA + 1)(2SB + 1) 16π (s − MA2 − MB2 )2 − 4MA2 MB2

con209
A−B ≤y ≤A+B (3.1216)

209
Si osservi che nel limite di alta energia, i.e. quando s >> M 2 , risulta comunque che
1 1
A→ ; B→ (3.1208)
2 2
per cui i limiti di integrazione in dy diventano, rispettivamente, 0 ed 1.
Se accade che MA = 0 , ci sono poi alcune semplificazioni.
Quanto alla sezione d’urto differenziale, risulta evidentemente
dσ 1 1 1
= |M|2 (3.1209)
dy (2SA + 1)(2SB + 1) 16π (s − MB2 )
con
(s + MC2 − MD 2
)(s + MB2 )
A = 1− (3.1210)
2s(s − MB2 )

(s − MC2 − MD 2 )2 − 4M 2 M 2
B = C D
(3.1211)
2s
le quali, nel caso in cui possa essere trascurata anche la massa MC , diventano

(s − MD2
)(s + MB2 )
A → 1− (3.1212)
2s(s − MB2 )
s − MD2
B → (3.1213)
2s
per cui ne risulta che, quanto agli estremi di integrazione, è

s − MD2
A−B → 1− (3.1214)
s − MB2
s − MD
2
MB2
A+B → 1+ (3.1215)
s − MB s
2

207
Un’altra variabile talvolta utile per esprimere la sezione d’urto differenziale
fra due particelle, è l’invariante Q2 , definito210 come

Q2 ≡ −(q q) ≡ −(k − k ′ )2 = −t (3.1224)

Dalla equazione (3.1221), abbiamo

Q2 = Q20 − (s − MA2 − MB2 ) B cosθCM (3.1225)

dove Q20 è dato dalla (cfr (3.1220))

(s + MA2 − MB2 )(s + MC2 − MD2 ) − 2s(MA2 + MC2 )


Q20 = (3.1226)
2s
210
Questa variabile è definita come

Q2 ≡ −q 2 ≡ −t = −(k − k ′ )µ (k − k ′ )µ = −MA2 − MC2 + 2(kk ′ ) (3.1217)

Dalla (3.1177) e (3.1179), abbiamo


√ √
2(kk ′ ) = 2 MA2 + a2 MC2 + b2 − 2ab cosθCM (3.1218)

i.e.
(s + MA2 − MB2 ) (s + MC2 − MD 2
)
Q2 = −MA2 − MC2 + 2 √ √ − 2ab cosθCM
2 s 2 s
(s + MA2 − MB2 )(s + MC2 − MD 2
) − 2s(MA2 + MC2 )
= − 2ab cosθCM (3.1219)
2s
Se definiamo allora la quantità costante (fissato s)

(s + MA2 − MB2 )(s + MC2 − MD


2
) − 2s(MA2 + MC2 )
Q20 ≡ (3.1220)
2s
ed esprimiamo 2ab in termini di B, usando l’equazione (3.1195) e l’espressione di 2(pk) come
data dalla (3.1192), otteniamo

2ab = 2(pk) B = (s − MA2 − MB2 ) B

per cui, finalmente, otteniamo

Q2 = Q2o − (s − MA2 − MB2 ) B cosθCM (3.1221)

e dunque, di nuovo, ad s fissato

dQ2 = (s − MA2 − MB2 ) B d(−cosθCM ) ≡ (s − MA2 − MB2 ) dy (3.1222)

per cui, dalla (3.1197), risulta


1 1
dΦ = √ dQ2 (3.1223)
8π (s − MA2 − MB2 )2 − 4MA2 MB2

208
e B è dato dalla (3.1203).

Se l’energia E = s nel CM è fissata, allora

dQ2 = −B (s − MA2 − MB2 ) d(cosθCM ) = (s − MA2 − MB2 )dy (3.1227)

e perciò, dalla (3.1206), finalmente si ha

dσ |M|2
= (3.1228)
dQ2 16π [(s − MA2 − MB2 )2 − 4MA2 MB2 ]

dove

Q20 − B (s − MA2 − MB2 ) ≤ Q2 ≤ Q20 + B (s − MA2 − MB2 ) (3.1229)

Di nuovo, nel caso poi in cui le particelle incidenti siano non polarizzate e non
si osservi lo stato di spin delle particelle prodotte, risulta
dσ 1 1 1
= |M|2 (3.1230)
dQ 2 (2SA + 1)(2SB + 1) 16π [(s − MA − MB2 )2 − 4MA2 MB2 ]
2

209
3.5.1 Lo spin del pione π +
Oggi sappiamo che i tre pioni sono costituiti da una coppia quark/antiquark della
prima generazione (i.e. up e down), ed in particolare che risulta
1 ( )
|π + >= |ud¯ >, |π 0 >= √ |uū > −|dd¯ > , |π − >= |dū > (3.1231)
2
Il quark e l’antiquark, che hanno entrambi spin S = 1/2, sono legati in uno stato
di singoletto di spin ed hanno momento angolare orbitale relativo L = 0, per cui
i pioni hanno, a loro volta, spin nullo211 .
Questo era un fatto messo in evidenza sperimentalmente ben prima che si
arrivasse a capire la loro struttura in termini di quarks. Per questo, si era usato
il metodo212 del confronto fra la sezione d’urto del processo

p + p → π+ + d (3.1232)

con quella del processo inverso

π+ + d → p + p (3.1233)

In entrambi i casi si tratta di un processo di scattering quasi-elastico e, come


abbiamo visto, la sezione d’urto differenziale di un generico processo di questo
tipo, nel caso in cui lo stato iniziale non abbia spin definito e lo spin delle particelle
nello stato finale non venga osservato, in base alla (3.1049), tenendo conto della
(3.1172), può essere scritta nel modo seguente
1 1
dσ→ = √ |M→ |2 dΦ (3.1234)
(2Sa + 1)(2Sb + 1) 4 s a

dove

• s è la massa invariante del sistema delle due particelle;

• a indica, nel sistema del CM , il modulo dell’impulso di entrambe le parti-


celle incidenti;

• Sa e Sb sono gli spin delle due particelle che collidono;


211
Chiaramente lo spin nullo dei pioni, dalla legge di composizione del momento angolare,
potrebbe ottenersi anche se i due costituenti fossero legati in uno stato di tripletto di spin ed
in onda P , cioè con momento angolare relativo L = 1.
Questa possibilità è esclusa, però, dalla parità intrinseca del pione, che, come abbiamo visto
almeno nel caso del π 0 , risulta essere negativa (il pione è una particella pseudoscalare ...):
poiché esso è costituito da una coppia particella/antiparticella di Dirac, esso ha comunque
parità intrinseca pari a (−1) · (−1)L e quindi L deve essere pari.
212
Cfr., per esempio, H. Muirhead: The Physics of elementary Particles , Pergamon Press
1965, pag. 26.

210
• |M→ |2 è la somma dei moduli quadri delle ampiezze invarianti di scattering,
relative al processo (3.1232 ), che chiameremo diretto213 , sommate su tutti
gli stati di spin iniziali e finali;

• dΦ sta per l’elemento di spazio delle fasi Lorentz-invariante, relativo allo


stato finale considerato.

Nel centro di massa, per due particelle, l’elemento dello spazio delle fasi, abbiamo
visto che può essere scritto come

1 (s − m2 − M 2 )2 − 4m2 M 2 1 b
dΦ = dΩCM ≡ √ dΩCM (3.1237)
16π 2 2s 16π 2 s

dove m ed M sono le masse delle due particelle prodotte nello stato finale e b
indica, al solito, il modulo del loro impulso spaziale. Abbiamo quindi
1 1 1 b
dσ→ = √ |M→ |2 2
√ dΩCM =
(2Sa + 1)(2Sb + 1) 4 s a 16π s
1 1 b
= 2
|M→ |2 dΩCM (3.1238)
(2Sa + 1)(2Sb + 1) 64π s a

Poiché le interazioni forti sono invarianti per time reversal, nel caso del processo
considerato, che avviene, appunto, via interazione forte, poiché la matrice S
soddisfa quindi la relazione T S T −1 = S † , il modulo quadro degli elementi di
matrice per i due decadimenti, diretto e inverso, sono uguali, per cui abbiamo

|M→ |2 = |M← |2 (3.1239)

quindi, ponendo adesso, per maggior chiarezza

a ≡ pp ; b ≡ pπ (3.1240)

dal confronto delle due sezioni d’urto differenziali √


valutate per lo stesso valore di
energia totale nel CM (i.e., per lo stesso valore di s), usando il fatto che lo spin
213
Una espressione del tutto analoga vale, evidentemente, per il processo inverso, cioè per la
reazione

π+ + d → p + p (3.1235)

per la quale, con ovvio significato di simboli, avremo


1 1
dσ← = √ |M← |2 dΦ (3.1236)
(2Sc + 1)(2Sd + 1) 4 s b

avendo adesso indicato con b il modulo dell’impulso nel CM delle particelle incidenti nel pro-
cesso inverso e con dΦ, analogamente, l’elemento di spazio delle fasi associato alle particelle
nello stato finale del processo inverso.

211
del protone vale 1/2, mentre quello del deutone, come è noto, vale 1 e tenendo
conto infine che lo stato finale, nel caso della reazione ”inversa”, è fatto da due
particelle identiche, che dimezza lo spazio delle fasi (l’integrazione avviene su 2π
e non su 4π ...), risulta
1 pπ
dσ→ 2·2 pp 3(2S + 1) p2π σ→
= 1 1 pp = 2
= (3.1241)
dσ← 2 3·(2S+1) pπ
2 pp σ←

dove S è appunto lo spin ignoto del π + .


La misura della sezione d’urto del processo diretto fu effettuata da Cartwright214
e collaboratori nel 1953, ottenendo, per un protone incidente su un bersaglio di
idrogeno con energia215 , nel laboratorio, pari a 341 M eV , il valore di

σ→ = (1.8 ± 0.6) × 10−28 cm2

Da questo conclusero che il processo inverso, valutato per lo stesso valore di massa
invariante del sistema, avrebbe dovuto avere una sezione d’urto di

σ← = (3.0 ± 1.0) × 10−27 cm2


214
W.F. Cartwright, C. Richman, M.N. Whitehead, H.A. Wilson: The production of positive
pions by 341-MeV protons on protons Phys. Rev. 91, 677, (1953)
215
Si osservi che, essendo la massa del deutone pari a Md = 1875.6 M eV , quella del protone
è Mp = 938.3 M eV e quella del pione carico pari a mπ = 139.6 M eV , la soglia della reazione
p + p → π + + d si raggiunge per un’energia del protone incidente su bersaglio fisso, pari a

(Md + mπ )2 − 2Mp2
2Mp2 + 2Mp E = (Md + mπ )2 ⇒ E = = 1225.7 M eV
2Mp

ovvero per un’energia cinetica del protone pari a Ts = 287.4 M eV .


L’esperimento di Cartwright operava quindi a poco più di 50 M eV sopra la soglia, ad una
energia cinetica dei protoni pari a T0 = 341 M eV , ovvero ad una massa invariante pari a
√ √ √
s = 2Mp (Mp + E) = 2Mp (2Mp + T0 ) = 2040.0 M eV

a cui corrisponde un impulso del protone nel sistema del CM che è pari a
√ √
(s − 2Mp2 )2 − 4Mp4 ( √ )2
s
pp = √ = − Mp2 = 400 M eV /c
2 s 2

Circa la reazione inversa d + π + → p + p , allo stesso valore di massa invariante, corrisponde


un’energia del pione carico su deutone fermo che è pari a

s − m2π − Md2
s = m2π + Md2 + 2Eπ Md ⇒ Eπ = = 166.4 M eV
2Md

212
se lo spin del pione fosse stato nullo216 , oppure 1/3 di quel valore, in accordo con
la (3.1241), nel caso fosse stato pari a 1, etc ...
Il confronto con le misure di assorbimento di pioni positivi in deuterio217 già
effettuate, propendeva decisamente verso un valore nullo dello spin del π + .

Questo risultato fu definitivamente stabilito nel 1957 da Cohen218 e collab-


oratori, i quali, sulla base dei risultati sperimentali sin lı́ accumulati, poterono
concludere che

(2Sπ + 1) = 1 ± 0.1 (3.1242)

corrispondente ad una energia cinetica nel sistema del laboratorio pari a


Tπ = Eπ − mπ = 26.8 M eV ed ad un impulso nel sistema del CM di

(s − m2π − Md2 )2 − 4m2π Md2
pπ = √ = 83.3 M eV /c
2 s

per cui il fattore cinematico (per Sπ = 0) fra le due sezioni d’urto valeva
( )2
σ← 2 pp
= = 15.4
σ→ 3 pπ

Al tempo dell’esperimento, le masse non erano note con tutta la precisione con cui le conosciamo
oggi, e questo fattore fu valutato essere pari a 16.7, da cui fu estrapolato il valore di
σ← = (3.0 ± 1.0) × 10−27 cm2 a partire dalla misura di σ→ = (1.8 ± 0.6) × 10−28 cm2 .
216
L’esistenza stessa della reazione implicava, evidentemente, che lo spin del pione fosse co-
munque intero ...
217
D.L. Clark, A. Roberts, R. Wilson: Cross section for the reaction π + + d → p + p and the
spin of the π + meson Phys. Rev. 83, 649 (1951)
D.L. Clark, A. Roberts, R. Wilson: Disintegration of the deuteron by π + mesons and the
spin of the π + meson Phys. Rev. 85, 523 (1952); i quali avevano misurato
σ = (4.5 ± 0.8) × 10−27 cm2 .
R. Durbin, H. Loar, J. Steinberger: The absorption of pions by deuterons
Phys. Rev. 84, 581 (1951); i quali avevano misurato σ = (3.1 ± 0.3) × 10−27 cm2 .
218
E.R. Cohen, K.M. Crowe, J.M. Dumond: Fundamental costants of physics Interscience
Publisher, New York, 1957

213
3.5.2 Lo scattering quasi-elastico ν̄ + p → n + e+
In questo paragrafo ci occuperemo dello scattering quasi-elastico di antineutrino
perché, come è noto, fu attraverso questo processo che fu rivelata per la prima

Figure 11: Apparato sperimentale usato da Cowan e Reines

volta, l’esistenza di questa particella.


L’esperimento che portò alla prima osservazione sperimentale diretta del neutrino
(in realtà, dell’antineutrino ...) fu, come è noto, quello di Cowan e Reines, che
si concluse219 nel 1953. La difficoltà della misura richiese ben 7 anni per il suo
compimento. Cowan e Reines osservarono la reazione beta-inversa220

ν̄ + p → n + e+ (3.1243)
219
F. Reines, C.L. Cowan jr: A proposed experiment to detect the free neutrino,
Phys. Rev. 90, 492 (1953)
F. Reines, C.L. Cowan jr: Detection of free neutrino, Phys. Rev. 92, 830 (1953)
F. Reines, C.L. Cowan jr, F.B. Harrison, A.D.McGuire, H.W. Kruse:
Detection of free antineutrino, Phys. Rev. 117, 159 (1960)
220
Quanto vale l’energia di soglia che deva avere il neutrino affinché la reazione possa avvenire?

214
Figure 12: Principio di funzionamento dell’esperimento di Cowan e Reines

presso la centrale nucleare di Savannah River, negli USA, in grado di fornire un


flusso221 di ben 1013 ν̄/cm2 · s sul bersaglio, costituito da 200 litri di acqua in
cui erano disciolti 40 Kg di cloruro di cadmio (Cd Cl2 ). Il segnale era costituito
dall’osservazione dei due gamma da 0.511 M eV di annichilazione del positrone,
221
In un processo di fissione neutronica del nucleo 235 U , si ottengono tipicamente due nuclei
ricchi di neutroni ed un paio di neutroni che consentono la prosecuzione della reazione a catena
(per es. 235 U + n → 140 94
54 Xe + 38 Sr + 2 n). I prodotti di fissione danno luogo a decadimenti
β di corta vita media (ms), a cascata. In media si hanno circa 6 ν̄e di varia energia per ogni
fissione, ed un totale di circa 200 M eV di energia prodotta. Dunque, il numero di antineutrini
emessi dal reattore, per secondo, vale
6 Pth
Nν̄ ≈ 6 Nf is =
2 · 108 × 1.6 · 10−19
dove Pth è la sua potenza termica. Assumendo Pth ≈ 3 GW , ne segue che, nell’intero angolo
6×3·109
−11 = 5.6 · 10
20
solido, vengono emessi dell’ordine di 3.2·10 antineutrini per secondo.
Ad una distanza di 20 m dal reattore, il loro flusso Fν vale quindi

5.6 · 1020
Fν = ≈ 1.1 · 1013 ν̄/(cm2 · s)
4π(2000)2

215
osservati in coincidenza ritardata (circa 30 µsec ) con i gamma emessi dal nucleo
di Cadmio che cattura il neutrone.
Il rivelatore era costituito da 1400 litri di scintillatore liquido disposto intorno
al bersaglio, visto da circa un centinaio di fotomoltiplicatori.
Reines e Cowan osservarono che la differenza di conteggi ”reattore on” - ”reattore
off” era di 3 ± 0.2 conteggi all’ora.
Da questo numero di conteggi essi estrassero222 una sezione d’urto totale pari a
−44
−4 · 10
σ(ν̄ + p → e+ + n)exp = 12+7 cm2 (3.1245)

da confrontare con un valore atteso (ricavato a partire dalla teoria originale di


Fermi, prima della scoperta della violazione di parità) di

σ(ν̄ + p → e+ + n)th = (5 ± 1) · 10−44 cm2 (3.1246)

222
Il modo per estrarre il valore della sezione d’urto totale del processo si basa sul fatto che il
rate di eventi di scattering che si producono è dato, in generale, dall’espressione

n = IσN

dove I misura il flusso delle particelle incidenti (gli antineutrini, nel nostro caso) ed N rappre-
senta il numero di particelle bersaglio (protoni, nel caso studiato).
Abbiamo detto che venivano osservati sperimentalmente n ≈ 3 eventi/ora = 0.8 × 10−3 ev/s
mentre abbiamo prima valutato che il flusso degli antineutrini valeva I = 1.1 × 1013 ν̄/(cm2 s).
Quanto al numero di protoni bersaglio, essendo esso costituito da 200 l di acqua, esso valeva
2
N = 200 × 1000 × × 6.0 · 1023 ≈ 1.3 · 1028
18
per cui ne segue che

n 0.8 · 10−3
σ= = ≈ 0.5 · 10−44 cm2 (3.1244)
I ×N 1.1 · 1013 × 1.3 · 1028
Questo risultato non coincide con il valore di sezione d’urto a cui giunsero Cowan e Reines
perchè non abbiamo tenuto conto né dell’accettanza effettiva dell’esperimento né dell’efficienza
di rivelare l’evento stesso. Queste due quantità hanno entrambe l’effetto di aumentare il valore
della sezione d’urto calcolato in quanto l’accettanza A diminuisce il numero di centri bersaglio
mentre l’efficienza ϵ stabilisce che il numero di eventi effettivamente realizzati è maggiore di
quello osservato, i.e.
n/ϵ
σ=
I × N ·A
L’effetto combinato delle due quantità conduce dal valore (3.1244) a quanto essi valutarono,
i.e. alla (3.1245) ...

216
Procediamo adesso al calcolo esplicito di questa sezione d’urto.
Tratteremo per questo la reazione di scattering quasi-elastico

ν̄ + p → e+ + n (3.1247)

nell’assunzione che sia il protone come il neutrone possano essere considerati come
particelle di Dirac senza struttura interna.
Data la bassa energia223 del neutrino e quindi il basso momento trasferito, la
teoria di Fermi è ampiamente sufficiente per descrivere il processo in questione.
Nell’ambito della Teoria di Fermi (corretta per la violazione di parità), il termine
della Lagrangiana di interazione che descrive il processo di scattering (3.1247) è
il seguente
GF µ
− √ J(had) (x) Jµ†(lept) (x) (3.1248)
2
dove, con ovvio significato di simboli, si è posto

Jµ(lept) (x) = ψ l (x) γµ (1 − γ5 ) ψν (x) (3.1249)

mentre per la parte adronica, nell’assunzione che si possano appunto trattare sia
il protone che il neutrone come particelle di Dirac senza struttura, analogamente
abbiamo
µ
J(had) (x) = ψ n (x) γ µ (1 − γ5 ) ψp (x) (3.1250)

La sezione d’urto in un generico processo quasi-elastico, come si è visto prece-


dentemente, nell’ipotesi di non osservare gli stati di spin, è data dalla relazione
1 1
dσ = |M|2 dϕ (3.1251)
(2S1 + 1)(2S2 + 1) F
dove
• Si sono gli spin delle particelle presenti nello stato iniziale;

• F è il termine di flusso, legato alla massa invariante s del sistema ed alle
due masse delle particelle nello stato iniziale MA ≡ mν e MB ≡ Mp dalla
ben nota relazione

F = 2 (s − MA2 − MB )2 − 4MA2 MB2 (3.1252)

che, nel nostro caso in cui la massa dell’anti-neutrino sia considerata nulla,
diviene

F → 2(s − Mp2 ) (3.1253)


223
Il limite di applicabilità della Teoria di Fermi, come è noto, si raggiunge quando il momento
trasferito della reazione diventa confrontabile con la massa del bosone W .

217
• |M|2 è la somma sugli stati di spin iniziali e finali dei moduli quadri degli
elementi di matrice invarianti della reazione;

• dΦ è lo spazio delle fasi invariante che, come ben sappiamo, nel sistema del
CM , è dato da

1 (s − MC2 − MD2 )2 − 4MC2 MD2
dΦ = 2
dΩCM =
16π√ 2s
1 (s − Mn2 − m2e )2 − 4Mn2 m2e
= (−d cosθ) (3.1254)
8π 2s
essendo θ ≡ θCM l’angolo (nel CM ) fra la direzione dell’antineutrino inci-
dente e quella del positrone uscente.
Tenendo quindi conto che di stati di spin per l’antineutrino ne esiste uno solo,
abbiamo

1 1 1 (s − Mn2 − m2e )2 − 4Mn2 m2e
dσ = |M| 2 (−d cosθ) =
2 2(s − Mp2 ) 8π 2s
1 1 √
= |M| 2 (s − Mn2 − m2e )2 − 4Mn2 m2e (−d cosθ) (3.1255)
64π s(s − Mp2 )

Passiamo dunque a valutare |M|2 , i.e. la somma dei moduli quadri degli
elementi di matrice invarianti, effettuata su tutti gli stati di spin delle particelle
presenti nello stato iniziale e finale.
Nella stessa convenzione usata per trattare in generale l’urto anelastico, scriviamo

ν̄(Q, b) + p(P, r) → e+ (q, a) + n(p, s) (3.1256)

ovvero indichiamo, rispettivamente, con (p, s), (P, r) l’impulso e lo spin per il
neutrone ed il protone, e con (q, a), (Q, b) quelli del positrone e dell’antineutrino.
Al primo ordine perturbativo, abbiamo

M = < out|L(0)|in >=


µ
= < n(p, s)|J(had) (0)|p(P, r) >< e+ (q, a)|Jµ†(lept) (0)|ν̄(Q, b) > (3.1257)

ovvero, poiché l’unico termine della Lagrangiana in grado di fornire un contributo


non nullo alla (3.1257) è il termine (3.1248), risulta
GF
M = − √ < n(p, s)|ψ̄n (0) γ µ (1 − γ5 )ψp (0)|p(P, r) > ·
2
· < e+ (q, a)|ψ̄ν (0) γµ (1 − γ5 )ψe (0)|ν̄(Q, b) >=

218
GF
= − √ < n(p, s)|ψ̄n (0)|Ω > γ µ (1 − γ5 ) < Ω|ψp (0)|p(P, r) > ·
2
· < Ω|ψ̄ν (0)|ν̄(Q, b) > γµ (1 − γ5 ) < e+ (q, a)|ψe (0)|Ω >=
GF ( ) ( )
= − √ ū(s) n (p) γ µ
(1 − γ 5 ) u(r)
p (P ) · v̄ν
(b)
(Q) γµ (1 − γ5 ) v (a)
e (q)(3.1258)
2
da cui, evidentemente, ricaviamo

G2F ∑ [ ] [ ]
|M|2 = p (P ) · v̄ν (Q) γα (1 − γ5 ) ve (q)
ūn(s) (p) γ α (1 − γ5 ) u(r) (b) (a)
2 a, b ,r ,s
[ ]∗ [ ]∗
× ū(s) β
n (p) γ (1 − γ5 ) u(r)
p (P ) · v̄ν(b) (Q) γβ (1 − γ5 ) ve(a) (q) ≡
G2F
≡ Lαβ W αβ (3.1259)
2
dove abbiamo definito i due tensori leptonico Lαβ e adronico W αβ nel modo
seguente224
∑[ ] [ ]∗
Lαβ ≡ v̄ν(b) (Q) γα (1 − γ5 ) ve(a) (q) · v̄ν(b) (Q) γβ (1 − γ5 ) ve(a) (q)(3.1260)
a, b
∑[ ][ ]∗
W αβ
≡ n (p) γ (1 − γ5 ) up (P ) ūn (p) γ (1 − γ5 ) up (P ) (3.1261)
ū(s) α (r) (s) β (r)
r ,s

Iniziamo calcolando il tensore leptonico Lαβ .


Siccome, come si è già osservato, ogni elemento del tensore è un numero com-
plesso e cosı̀ pure ogni quantità entro parentesi quadra nella (3.1260), ne segue
che ciascuna di queste quantità complesse può essere vista anche come l’unico
elemento di una matrice 1 × 1, ovvero essa coincide con la traccia della matrice
stessa.
Quanto poi alla coniugazione complessa di una tale quantità, essa può anche es-
sere vista come la coniugazione hermitiana della matrice 1 × 1 corrispondente,
per cui possiamo scrivere, in definitiva, che
 
∑ [ ] [ ]† 
Lαβ ≡ T r v̄ν(b) (Q) γα (1 − γ5 ) ve(a) (q) · v̄ν(b) (Q) γβ (1 − γ5 ) ve(a) (q) =
 
a, b
 
∑ 
= Tr  v̄ν(b) (Q) γα (1 − γ5 ) ve(a) (q) · ve†(a) (q) (1 − γ5† ) γβ† v̄ν†(b) (Q) (3.1262)
a, b

ma, come ben sappiamo

v̄ = v † γ 0 ; (γ 0 )2 = I; γ 0 㵆 γ 0 = γµ ; γ 0 = (γ 0 )† ; (v̄)† = γ 0 v
γ 0 γ5 = −γ5 γ 0 ; γ5† = γ5
224
Si osservi che ciascun termine entro parentesi quadra è un numero complesso!

219
per cui, sostituendo, si ha
 
∑ 
Lαβ = T r v̄ν(b) (Q) γα (1 − γ5 ) ve(a) (q) · v̄e(a) (q) (1 + γ5 ) γβ vν(b) (Q) (3.1263)
 
a, b

e quindi, usando la proprietà della traccia per cui T r(AB..CD) = T r(DAB...C),


otteniamo
{( ) ( ) }
∑ ∑
Lαβ = T r vν(b) (Q)v̄ν(b) (Q) γα (1 − γ5 ) ve(a) (q)v̄e(a) (q) (1 + γ5 ) γβ =
b a
= T r {(̸ Q − mν ) γα (1 − γ5 ) (̸ q − me ) (1 + γ5 ) γβ } =
= T r {̸ Q γα (1 − γ5 ) ̸ q (1 + γ5 ) γβ − mν γα (1 − γ5 ) ̸ q (1 + γ5 ) γβ −
− me ̸ Q γα (1 − γ5 ) (1 + γ5 ) γβ + mν me γα (1 − γ5 ) (1 + γ5 ) γβ } (3.1264)

Gli ultimi due contributi sono evidentemente nulli, dato che (1 + γ5 )(1 − γ5 ) = 0.
Anche il secondo termine della somma, proporzionale a mν , è nullo e non solo
perché abbiamo assunto mν = 0, infatti risulta

T r {γα (1 − γ5 ) ̸ q (1 + γ5 ) γβ } = T r {γα (1 − γ5 ) (1 − γ5 ) ̸ q γβ } =
= 2 T r {γα (1 − γ5 ) ̸ q γβ } = 2 T r {γα ̸ q γβ − γα γ5 ̸ q γβ } (3.1265)

e la traccia del prodotto di un numero dispari di γ µ è nulla.


Dunque, in definiva, abbiamo

Lαβ = T r {̸ Q γα (1 − γ5 ) ̸ q (1 + γ5 ) γβ } =
= T r {̸ Q γα (1 − γ5 ) (1 − γ5 ) ̸ q γβ } =
= 2 T r {̸ Q γα (1 − γ5 ) ̸ q γβ } =
= 2 T r {̸ Q γα ̸ q γβ } − 2 T r {̸ Q γα γ5 ̸ q γβ } =
= 2 Qσ q τ T r {γσ γα γτ γβ } − 2 Qσ q τ T r {γσ γα γ5 γτ γβ } (3.1266)

ma, come è dimostrato in Appendice, risulta

T r {γσ γα γτ γβ } = 4 [δ σα δ τ β + δσβ δατ − δστ δαβ ] (3.1267)


T r {γσ γα γ5 γτ γβ } = T r {γσ γα γτ γβ γ5 } = 4i ϵσατ β (3.1268)

per cui, in definitiva, abbiamo (ϵσατ β = − ϵαβστ )

Lαβ = 8 [Qα qβ + Qβ qα − (Q · q)δαβ + i ϵαβστ Qσ q τ ] (3.1269)

dove Q è il quadrimpulso dell’antineutrino mentre q è quello del positrone.

Veniamo adesso al tensore adronico e procediamo nel solito modo: si ha


∑[ ] [ ]∗
W αβ = n (p) γ (1 − γ5 ) up (P ) · ūn (p) γ (1 − γ5 ) up (P )
ū(s) α (r) (s) β (r)
=
r ,s

220
∑ {[ ] [ ]}
n (p) γ (1 − γ5 ) up (P ) · ūp (P ) (1 + γ5 ) γ un (p)
ū(s) α (r) (r) β (s)
= Tr =
r ,s
{( ) ( ) }
∑ ∑
= Tr u(s) (s)
n (p)ūn (p) γ (1 − γ5 )
α
u(r) (r)
p (P ) ūp (P ) (1 + γ5 ) γ β
=
s r
{ }
= T r (̸ p + Mn )γ α (1 − γ5 ) (̸ P + Mp )(1 + γ5 ) γ β (3.1270)

da cui, confrontando con quanto ottenuto per il tensore leptonico, si ottiene


immediatamente225
[ ]
W αβ = 8 pα P β + pβ P α − (p · P )δ αβ + i ϵαβηρ pη Pρ (3.1273)

dove P è il quadrimpulso del protone e p quello del neutrone.


Sia nel caso del tensore leptonico che in quello del tensore adronico, abbiamo la
parte reale che è simmetrica mentre la parte immaginaria risulta antisimmetrica:
evidentemente, nella contrazione dei due tensori, le due parte reali si contrar-
ranno fra loro e cosı̀ pure le due parte immaginarie, ma non ci saranno226 termini
misti.
Osserviamo altresı̀ che i tensori cosı̀ ottenuti non contengono termini proporzion-
ali alle masse delle particelle coinvolte, ma dipendono solo dai loro quadrimpulsi.
Risulta
G2F G2
|M|2 = Lαβ W αβ = F 64 [Qα qβ + Qβ qα − (Q · q)δαβ + i ϵαβστ Qσ q τ ] ·
[2 2 ]
· p P + p P − (p · P )δ αβ + i ϵαβηρ pη Pρ =
α β β α

= 32 G2F [(Qp)(qP ) + (QP )(qp) − (pP )(qQ) +


+ (QP )(qp) + (Qp)(qP ) − (pP )(qQ) −
]
− (Qq)(pP ) − (Qq)(pP ) + 4(pP )(qQ) − ϵαβστ ϵαβηρ pη Pρ Qσ q τ (3.1274)

Tenendo conto che

ϵαβστ ϵαβηρ = −2 ( δση δτρ − δτη δσρ ) (3.1275)

abbiamo quindi

|M|2 = 32 G2F [2(Qp)(qP ) + 2(QP )(qp) + 2 pη Pρ Qσ q τ (δση δτρ − δτη δσρ )] =


= 32 G2F [2(Qp)(qP ) + 2(QP )(qp) + 2(Qp)(qP ) − 2(QP )(qp)] =
= 128 G2F (pQ)(qP ) (3.1276)
225
Forse non è inutile ricordare che risulta altresı̀
{ } [ ]
T r γσ γα γτ γβ = 4 δ σα δ τ β + δ σβ δ ατ − δ στ δ αβ (3.1271)
{ }
T r γ σ γ α γ τ γ β γ5 = 4i ϵσατ β (3.1272)

e che ϵ0123 = +1 = −ϵ0123 .


226
Termini misti sarebbero immaginari e si vede male come questi potrebbero esistere in un
modulo quadro ... !

221
Sostituendo dunque la (3.1276) nell’espressione della sezione d’urto differenziale227

1 (s − Mn2 − m2e )2 − 4Mn2 m2e
dσ = |M|2 (−d cosθ) (3.1280)
64π s s − Mp2

abbiamo quindi

G2F (s − Mn2 − m2e )2 − 4Mn2 m2e
dσ = (2pQ)(2P q) (−d cosθ) (3.1281)
2π s s − Mp2

Per questo tipo di processo, però, è più utile usare, al posto della variabile
cosθ ≡ cosθCM , la variabile228 y che abbiamo introdotto attraverso la (3.1189) e
per la quale abbiamo dimostrato che, ad s fissato, risulta
1
d(−cosθ) = dy; A−B ≤ y ≤A+B (3.1284)
B
essendo, nel caso presente
(s + m2e − Mn2 )(s + Mp2 − m2ν )
A=1− =
2s(s − Mp2 − m2ν )
(s + m2e − Mn2 )(s + Mp2 )
=1− (3.1285)
2s(s − Mp2 )
227
Si osservi che se con a e b indichiamo, rispettivamente, i moduli degli impulsi nel CM
delle due particelle nello stato iniziale e finale, allora, essendo come è noto,

(s − MA2 − MB2 )2 − 4MA2 MB2 s − Mp2
a = √ = √ (3.1277)
2 s 2 s
√ √
(s − MC2 − MD 2 )2 − 4M 2 M 2 (s − Mn2 − m2e )2 − 4Mn2 m2e
b = √ C D
= √ (3.1278)
2 s 2 s
risulta che
1 b
dσ = |M|2 (−d cosθ) (3.1279)
64π s a

228
Secondo la definizione, la variabile y, che è scalare sotto il gruppo di Lorentz, come si è già
visto, essa risulta espressa dalla equazione
P (Q − q)
y= (3.1282)
PQ
Nel riferimento del Laboratorio, dove il protone può essere considerato fermo, essa vale dunque
Mp (Eν − Ee ) Eν − Ee
y= = (3.1283)
Mp Eν Eν
ovvero essa rappresenta proprio la frazione di energia leptonica che viene trasferita al sistema
adronico, calcolata nel riferimento in cui l’adrone che subisce l’urto è inizialmente in quiete.

222
√ √
(s − Mn2 − m2e )2 − 4Mn2 m2e (s − Mp2 − m2ν )2 − 4Mp2 m2ν
B= =
2s(s − Mp2 − m2ν )

(s − Mn2 − m2e )2 − 4Mn2 m2e 2ab
= = (3.1286)
2s s − Mp2

dove a e b sono dati dalle (3.1277) e (3.1278) e le semplificazioni dipendono dal


fatto che abbiamo assunto mν = 0 .
In termini di questa variabile, abbiamo dunque
dσ 2G2F (pQ)(P q) √ 1
= (s − Mn2 − m2e )2 − 4Mn2 m2e =
dy π s(s − Mp )2 B
4G2F (pQ)(P q) G2F (2pQ)(2P q)
= = (3.1287)
π (s − Mp2 ) π (s − Mp2 )

D’altronde
2(P Q) − 2(P q) 2(P q)
y= =1− ⇒ 2(P q) = 2(P Q)(1 − y) (3.1288)
2(P Q) 2(P Q)
ma

s = (P + Q)2 = 2(P Q) + Mp2 (3.1289)

e dunque

2(P q) = (s − Mp2 )(1 − y) (3.1290)

per cui abbiamo infine


dσ G2
= F (1 − y) (2pQ) (3.1291)
dy π
Fino a questo punto non abbiamo fatto approssimazioni, se non quella di consid-
erare neutrone e protone come particelle di Dirac senza struttura interna.
D’altronde

P +Q=p+q ⇒ P −q =p−Q ⇒
⇒ Mp2 + m2e − 2(P q) = Mn2 − 2(pQ) ⇒
⇒ 2(pQ) = Mn2 − Mp2 − m2e + 2(P q) (3.1292)

per cui, se confondiamo adesso la massa del protone con quella del neutrone e
trascuriamo del tutto la massa dell’elettrone, ecco che (P q) = (Qp) e dunque
risulta
dσ G2
= F (1 − y)2 (s − M 2 ) (3.1293)
dy π

223
dove M è appunto la massa del nucleone.
Volendo adesso determinare la sezione d’urto totale relativa al processo di scatter-
ing in esame, occorre evidentemente integrare la (3.1293) fra gli estremi definiti
nella (3.1284). D’altronde, nella stessa approssimazione sopra citata in cui si
trascurano le masse leptoniche e si confondono fra loro quelle adroniche, risulta
(s + m2e − Mn2 )(s + Mp2 − m2ν ) s + M2 s − M2
A=1− → 1− = (3.1294)
2s(s − Mp2 − m2ν ) 2s 2s

(s − Mn2 − m2e )2 − 4Mn2 m2e s − M2
B= → (3.1295)
2s 2s
M2
e dunque l’integrazione in y va fatta fra A − B = 0 ed A + B = 1 − s
.
Ma
 ( )3 
∫ 1− Ms
2 ∫ 1 1 M2
(1 − y) dy =
2
M2
t dt = 1 −
2 =
0 s
3 s
( ) ( ) ( )2 
2 2 2
1 M 1 +
M M 
= 1− +
3 s s s
 ( ) ( ) 
2 2
s − M2  M2 M 
= 1+ + (3.1296)
3s s s
per cui risulta evidentemente che
 ( ) ( )2 
G2 (s − M 2 )2  M2 M2 
σ(ν̄ p → n e+ ) = F 1+ + (3.1297)
π 3s s s
Nel caso del processo studiato da Cowan e Reines, l’energia Eν del neutrino (nel
sistema del laboratorio) era dell’ordine di alcuni M eV , quindi certamente grande
rispetto alla massa dell’elettrone ma molto minore di quella del nucleone.
In questo caso (limite di bassa energia), essendo
s = 2Eν M + M 2 ⇒ s − M 2 = 2Eν M (3.1298)
risulta
 ( ) ( )2 
G2 4Eν 2 M 2  M2 M2 G2
 ≈ F 4 E 2 (3.1299)
σ(ν̄ p → n e+ ) = F 1+ + ν
π 3s s s π
dove abbiamo usato il fatto che, in questa approsssimazione M 2 /s ≈ 1.
Numericamente abbiamo
G2F
σ(ν̄ p → n e+ ) ≈ 4 Eν2
π
( )2
(1.166 × 10−5 )2 Eν
= · 4 × 10−6 GeV −2 =
π 1 M eV
( )2

= 1.73 × 10−16 GeV −2 (3.1300)
1 M eV

224
Volendo esprimere la sezione d’urto totale σ in cm2 , occorre moltiplicare l’espressione
precedente per (h̄c)2 : ricordando che

h̄c = 197.327 M eV · f m = 0.197 × 10−13 GeV · cm

otteniamo infine
( )2

σ(ν̄ p → n e+ ) = 1.73 × 10−16 · (0.197 × 10−13 )2 =
1 M eV
( )2
−44 Eν
= 6.72 × 10 cm2 (3.1301)
1 M eV
in buon accordo con il valore (3.1245) trovato da Cowan e Reines, i.e.
−44
σ(ν̄ + p → e+ + n)exp = 12+7
−4 · 10 cm2 (3.1302)

Va comunque detto che, in realtà, nemmeno nel caso dell’urto anelastico a bassa
energia, quando la lunghezza d’onda di De Broglie del neutrino è comunque an-
cora molto maggiore delle dimensioni del nucleone, è lecito trascurarne la strut-
tura interna. L’espressione del tensore W αβ ha altri contributi oltre a quelli visti
in precedenza, ed anche quelli legati alla parte vettoriale ed assiale della cor-
rente dipendono poi da fattori di forma che sono funzione del momento trasferito
(dell’invariante (Q − q)2 ...).
Poi, nel limite di alta energia (s >> M 2 ), dove l’espressione della sezione
d’urto da noi calcolata fornirebbe
G2F G2F
σ(ν̄ p → n e ) ≈
+
s= 2EM (3.1303)
3π 3π
occorre tenere conto che l’urto avviene sui quarks costituenti (di valenza e su
quelli virtuali (del mare): si parla, in questo caso, di Deep Inelastic Scattering
(DIS) e la sua trattazione va oltre gli scopi di questo Corso.

225
3.5.3 Lo scattering QE non polarizzato di CC di ν e ν̄
Nel paragrafo precedente abbiamo studiato lo scattering quasi-elastico (QE)
ν̄ +p → n+e+ nell’ambito della teoria V −A di Fermi, nell’ipotesi in cui protone e
neutrone possano essere considerati come particelle di Dirac e quindi non abbiano
alcuna struttura interna e nel caso non polarizzato.
Vogliamo adesso valutare la sezione d’urto differenziale non polarizzata nel caso
generale dei processi229

a) ν + A → l− + B (3.1304)
b) ν̄ + B → l+ + A (3.1305)

e di tutti quelli ad essi associati per crossing, i.e.

a) ν + A → l− + B
ν + B̄ → l− + Ā
l+ + A → ν̄ + B
l+ + B̄ → ν̄ + Ā

b) ν̄ + B → l+ + A
ν̄ + Ā → l+ + B̄
l− + B → ν + A
l− + Ā → ν + B̄

Come sappiamo, nell’ambito della teoria di Fermi, la densità lagrangiana che


descrive i processi di cui sopra è la seguente
GF [ †
]
LW (x) = − √ Jµ(lept) (x)J µ† (x) + J µ (x)Jµ(lept) (3.1306)
2
dove

Jµ(lept) (x) = ψ̄l (x)γµ (1 − γ5 )ψν (x); Jµ(lept) = ψ̄ν (x)γµ (1 − γ5 )ψl (x)
J µ (x) = ψ̄A (x)γ µ (1 − γ5 )ψB (x); J µ† (x) = ψ̄B (x)γ µ (1 − γ5 )ψA (x)

229
Le particelle A, B sono, per ipotesi, ancora particelle di Dirac senza struttura interna, aventi
masse non nulle MA ed MB , rispettivamente, mentre assumeremo che la massa del leptone l±
sia m e quella del neutrino (antineutrino) sia nulla.

226
3.6 Applicazione a processi di decadimento
Vediamo adesso come possiamo applicare quanto abbiamo appreso a processi
di decadimento che, con quelli di scattering, completano le nostre possibilità di
indagine della dinamica delle interazioni fra particelle.

3.6.1 Il decadimento del pione


Vogliamo studiare la reazione di decadimento230
π − → l− + ν̄l (3.1307)
dove l− sta per un generico leptone negativo (può trattarsi solo di e− o µ− ...
visto che mτ >> mπ !).
Come abbiamo già avuto modo di osservare, esso avviene via interazione debole e
precisamente via l’annichilazione dello stato (d ū) in un W − virtuale che decade
quindi in un sistema puramente leptonico, come è mostrato in fig.13.

Figure 13: Decadimento del pione negativo in muone e antineutrino muonico

Poiché il processo avviene su una scala di energie ( mπ ≈ 139 M eV ) molto minore


della massa231 del W , la teoria di Fermi (corretta per la violazione di parità) è
perfettamente adeguata a descriverlo. Essa afferma che
GF
LW (x) = − √ J µ (x) Jµ† (x) (3.1308)
2
dove J µ (x) è la somma della corrente adronica e leptonica e, quanto a quest’ultima,
come abbiamo già osservato in precedenza, essa risulta data da
µ
Jlept (x) = ψ̄l (x) γ µ (1 − γ5 ) ψν (x) (3.1309)
230
Per il decadimento coniugato di carica π + → l+ νl valgono considerazioni del tutto simili.
231
MW ≈ 81 GeV

227
Ricordiamo che, per quanto visto precedentemente, se prescindiamo dallo stato di
spin delle particelle nello stato finale, il rate differenziale di decadimento risulta
essere dato dall’espressione generale (3.1048)
1 1
dΓ = |M|2 dΦ (3.1310)
2S + 1 2E
dove S è lo spin della particella che decade (S = 0 per il pione ...), E è la sua
energia nel sistema di riferimento dove stiamo operando, |M|2 è la somma sugli
stati di spin iniziali e finali dei moduli quadri degli elementi di matrice invarianti
del decadimento e dΦ è l’elemento di spazio delle fasi invariante associato allo
stato finale, che, nel nostro caso, come si è già visto, nel sistema del CM è dato
da

1 (s − m21 − m22 )2 − 4m21 m22
dΦ = dΩCM (3.1311)
16π 2 2s
essendo dΩCM l’elemento di angolo solido relativo ad una delle due particelle nello
stato finale (la direzione di moto dell’altra è, ovviamente, opposta ...) ed s la
massa invariante quadra del sistema, pari, ovviamente a s = M 2 .
Nel sistema del CM , ovvero nel riferimento in cui il pione è fermo, se assum-
iamo al solito che sia nulla la massa del neutrino, detta m la massa del leptone
carico, risulta dunque
1 1 1 (M 2 − m2 )
dΓ = |M|2 dΩCM =
1 2M 16π 2 2M 2
1 M 2 − m2
= |M|2 d(−cosθCM ) (3.1312)
32π M3
dove M è la massa del pione e dΩCM si riferisce alla direzione di volo del leptone
carico nel sistema del CM orientato, comunque, in modo arbitrario.
Veniamo adesso al calcolo esplicito di M.
Per quanto già visto (cfr. eq.(3.1029)), risulta
M =< out| LW (0) |in > (3.1313)
dove si è usato il fatto che la densità lagrangiana debole non contiene accoppia-
menti derivativi e dunque è opposto alla densità hamiltoniana.
Poiché gli stati adronici e leptonici hanno in comune solo lo stato di vuoto,
deve essere
GF
M = − √ < l− ν̄|Jµlept (0)|Ω > · < Ω|Jhadr
µ†
(0)|π − > (3.1314)
2
Ma allora, se indichiamo con P µ il quadrimpulso del pione, essendo esso una
µ†
particella senza spin, quanto alla quantità < Ω|Jhadr (0)|π − > essa non può che
essere semplicemente proporzionale a P µ , i.e.
µ†
< Ω|Jhadr (0)|π − >= f P µ (3.1315)

228
dove la costante f , nell’ottica di descrivere con lo stesso formalismo anche i
decadimenti degli altri mesoni pseudoscalari, dovendo essere una funzione scalare
di Lorentz, potrà dipendere, in questo caso, solo dalla massa stessa del pione, i.e.

f = f (mπ ) = fπ cosθC (3.1316)

dove il fattore cosθC nasce dal fatto che oggi sappiamo che la reazione di annichi-
lazione (dū) → W − procede attraverso la corrente ūγ µ (1−γ5 ) dC e il campo del
quark dC è sostanzialmente pari a dC = d cosθC + s sinθC essendo s il campo
del quark strano e θC l’angolo di Cabibbo.

Veniamo ora all’altra quantità che compare nella (3.1314), i.e. consideriamo
l’espressione < l− , ν̄|Jµlept (0)|Ω > .
Più esplicitamente, se q e k con s , r sono, rispettivamente, gli impulsi e gli stati
di spin del leptone carico e dell’antineutrino, dobbiamo valutare l’espressione

< l− (q, s) , ν̄(k, r)|ψ̄l (0) γµ (1 − γ5 ) ψν (0)|Ω > (3.1317)

la quale, evidentemente, risulta pari a

< l− (q, s) ν̄(k, r)|ψ̄l (0) γµ (1 − γ5 ) ψν (0)|Ω >=


= < l− (q, s)|ψ̄l (0) |Ω > γµ (1 − γ5 ) < ν̄(k, r)|ψν (0)|Ω >=
(s)
= ūl (q) γµ (1 − γ5 ) vν(r) (k) (3.1318)

per cui, essendo

P µ = kµ + qµ (3.1319)

abbiamo
GF
M = − √ fπ cosθC (k µ + q µ ) ūl (q) γµ (1 − γ5 ) vν(r) (k) =
(s)
2
GF
= − √ fπ cosθC ūl (q) ̸ q (1 − γ5 ) vν(r) (k) −
(s)
2
GF
− √ fπ cosθC ūl (q) (1 + γ5 ) ̸ k vν(r) (k)
(s)
(3.1320)
2
dove abbiamo usato il fatto che γ5 anticommuta con tutte le γµ .
D’altronde, se come abbiamo fin’ora ammesso, possiamo considerare il neutrino
come avente massa nulla, allora, per l’equazione di Dirac, si ha che

̸ k vν(r) (k) = 0 (3.1321)

mentre, per lo stesso motivo, risulta


(s) (s)
ūl (q) ̸ q = m ūl (q) (3.1322)

229
dove m è la massa del leptone carico. Dunque abbiamo infine
GF
M = −m √ fπ cosθC ūl (q) (1 − γ5 ) vν(r) (k)
(s)
(3.1323)
2

A noi, comunque, per calcolare dΓ , serve di valutare |M|2 , ovvero serve la


quantità
{ }
G2F ∑ (s)
|M|2 = |fπ |2 cos2 θC m 2
|ūl (q) (1 − γ5 ) vν(r) (k)|2 (3.1324)
2 r,s

ma
∑ (s)
|ūl (q) (1 − γ5 ) vν(r) (k)|2 =
r,s
∑[ (s)
][
(s)
]∗
= ūl (q) (1 − γ5 ) vν(r) (k) ūl (q) (1 − γ5 ) vν(r) (k) =
r,s
∑[ (s)
][
(s)
]†
= ūl (q) (1 − γ5 ) vν(r) (k) ūl (q) (1 − γ5 ) vν(r) (k) =
r,s
{ }
∑[ (s)
][
(s)
]†
= Tr ūl (q) (1 − γ5 ) vν(r) (k) ūl (q) (1 − γ5 ) vν(r) (k) (3.1325)
r,s

[ ]
(s)
dove abbiamo usato il fatto che ūl (q) (1 − γ5 ) vν(r) (k) è un numero complesso e
come tale può anche essere visto come una matrice 1×1 e quindi come coincidente
con la sua stessa traccia.
Dunque, ricordando che v † = v̄ γ 0 , γ5† = γ5 , ū† = γ 0 u, (A · B)† = B † A† , abbiamo
{ }
∑[ (s)
][
(s)
]†
Tr ūl (q) (1 − γ5 ) vν(r) (k) ūl (q) (1 − γ5 ) vν(r) (k) =
r,s
∑ (s) (s)
= Tr ūl (q) (1 − γ5 ) vν(r) (k) v̄ν(r) (k) γ 0 (1 − γ5 ) γ 0 ul (q) (3.1326)
r,s

Ma T r(A · B · C) = T r(B · C · A) , dunque


∑ (s)
|ūl (q) (1 − γ5 ) vν(r) (k)|2 =
r,s
{[ ] [ ] }
∑ (s) (s) ∑
= Tr ul (q)ūl (q) (1 − γ5 ) vν(r) (b)v̄ν(r) (k) (1 + γ5 ) (3.1327)
s r

dove si è usato il fatto che γ 0 e γ5 anticommutano, mentre γ02 = I.


D’altronde, come sappiamo (si ricordi che il neutrino ha massa nulla ...)
∑ (s) (s) ∑
ul (q)ūl (q) ≠ q + m; vν(r) (b)v̄ν(r) (k) ≠ k (3.1328)
s r

230
e quindi
∑ (s)
|ūl (q) (1 − γ5 ) vν(r) (k)|2 = T r [(̸ q + m)(1 − γ5 ) ̸ k (1 + γ5 )] =
r,s
[ ]
= T r (̸ q + m) ̸ k (1 + γ5 )2 = 2 T r [̸ q + m) ̸ k (1 + γ5 ] =
= 2 T r [̸ q ̸ k + ̸ q ̸ k γ5 + m ̸ k + m ̸ k γ5 ] (3.1329)

ma

T r(γµ γν ) = 4 δµν (3.1330)


T r(γµ γν γ5 ) = 0 (3.1331)
T r(γµ ) = 0 (3.1332)
T r(γµ γ5 ) = 0 (3.1333)

per cui, in definitiva, risulta


∑ (s)
m2 |ūl (q) (1 − γ5 ) vν(r) (k)|2 = 8 m2 (k · q) (3.1334)
r,s

e dunque, nel caso in cui non interessa lo stato di spin del leptone carico l− ,
abbiamo
{ }
G2F ∑ (s)
|M|2 = |fπ |2 cos2 θC m 2
|ūl (q) (1 − γ5 ) vν(r) (k)|2 =
2 r,s

= 4 m2 G2F |fπ |2 cos2 θC (k · q) (3.1335)

per cui abbiamo

1 1 M 2 − m2
dΓ = 4 m2 G2F |fπ |2 cos2 θC (k · q) dΩCM (3.1336)
2M 32π 2 M2
ma

(k + q)2 = M 2 ⇒ M 2 = 0 + 2 (k · q) + m2 ⇒
⇒ 2 (k · q) = M 2 − m2 = 2M Eν (3.1337)

dove Eν e l’energia del neutrino nel sistema del CM .


Sostituendo nella (3.1335), otteniamo quindi

|M|2 = 4M G2F |fπ |2 cos2 θC m2 Eν = 2m2 G2F |fπ |2 cos2 θC (M 2 − m2 ) (3.1338)

e dunque

1 1 M 2 − m2
dΓ = 2 m2 G2F |fπ |2 cos2 θC (M 2 − m2 ) dΩCM (3.1339)
2M 32π 2 M2

231
da cui, integrando sull’angolo solido (il decadimento, come è ovvio che debba
essere, è isotropo nel CM ), si ha finalmente che

1 1 M 2 − m2
Γ = 2 m2 G2F |fπ |2 cos2 θC (M 2 − m2 ) 4π =
2M 32π 2 M2
( )2
1 M 2 − m2
= M m2 G2F |fπ |2 cos2 θC (3.1340)
8π M2

Questa relazione consente, in particolare, di determinare il rapporto fra i BR dei


due decadimenti in elettrone-neutrino e muone-neutrino. Abbiamo
( )2 ( )2
Γ(π − → e− ν̄e ) me Mπ2 − m2e
Rπ ≡ = =
Γ(π − → µ− ν̄µ ) mµ Mπ2 − m2µ
( ) ( )2
0.511 2 139.62 − 0.5112
= ≈ 2.337 · 10−5 × 5.492 ≈
105.7 139.62 − 105.72
≈ 1.283 · 10−4 (3.1341)

che, per gli anologhi decadimenti del K, diventa232


( )2 ( )2
Γ(K − → e− ν̄e ) me MK2 − m2e
RK ≡ = ≈ 2.337 · 10−5 × 1.098 ≈
Γ(K − → µ− ν̄µ ) mµ MK2 − m2µ
≈ 2.567 · 10−5 (3.1343)

Questi risultati mostrano come il decadimento in elettrone-neutrino sia es-


tremamente sfavorito rispetto a quello in muone-neutrino, nonostante il vantag-
gio del maggior spazio delle fasi a disposizione.
La ragione sta nella conservazione del momento angolare, unitamente al fatto che
la struttura vettoriale della corrente debole carica implica che, nel limite di massa
nulla, l’elicità della particella e della antiparticella debbano essere opposte.
E’ soltanto per via che i leptoni carichi hanno massa che essi possono essere
prodotti in uno stato di elicità opposto a quanto stabilirebbe, per massa nulla, il
proiettore di chiralità χ− = 1−γ 2
5
caratteristico delle interazioni deboli, ma questa
possibilità è pesata, nell’ampiezza del processo, con la massa stessa del leptone
carico.
E’ bene, però, a questo punto chiarire bene che la soppressione di elicità, descritta,
per esempio, dal fattore (3.1343) nasce sia dal fatto che il mesone che decade ha
spin nullo come dal carattere vettoriale della corrente e non tanto dalla presenza
stessa del proiettore chirale χ− .
232
Lo SM , tenendo conto di correzioni di ordine superiore, fornisce, rispettivamente

Rπ = 1.235 · 10−4 ; RK = 2.47 · 10−5 (3.1342)

232
Siccome questo può sembrare in contrasto con quanto detto prima, per fissare le
idee consideriamo una generica corrente vettoriale233

J µ (x) = ψ̄a (x) γ µ ψb (x) (3.1347)

e supponiamo che, nel processo in cui essa è coinvolta, questa corrente sia respon-
sabile della creazione della particella a e della antiparticella b (ricordiamo che ψ
possiede l’operatore di creazione di antiparticelle, mentre ψ̄ quello di creazione
delle particelle), potendo essere, beninteso, anche che a e b siano la stessa parti-
cella (come accade in QED).
Ricordando che χ+ + χ− = I e che (χ± )2 = χ± , abbiamo intanto che

J µ = ψ̄a γ µ (χ+ ψb ) + ψ̄a γ µ (χ− ψb ) = ψ̄a γ µ [(χ+ )2 ψb ] + ψ̄a γ µ [(χ− )2 ψb ] =


= (ψ̄a χ− ) γ µ (χ+ ψb ) + (ψ̄a χ+ ) γ µ (χ− ψb ) (3.1348)

dove si è usato il fatto che γ µ χ± = χ∓ γ µ .


Poniamo adesso234

ψR ≡ χ+ ψ ⇔ ψ̄R = ψ̄ χ− ; ψL ≡ χ− ψ ⇔ ψ̄L = ψ̄ χ+ (3.1350)

per cui risulta

J µ = ψ̄R,a γ µ ψR,b + ψ̄L,a γ µ ψL,b (3.1351)


233
Se l’interazione responsabile del decadimento del pione fosse, per esempio, scalare allora,
essendo
( ) ( )
1 − γ5 1 + γ5
ψ̄ψ = ψ̄ ψ + ψ̄ ψ = ψ̄L ψR + ψ̄R ψL (3.1344)
2 2

particella e antiparticella prodotte avrebbero chiralità opposte e dunque, nel limite di alta
energia, elicità uguali, per cui lo stato finale tenderebbe ad essere compatibile con uno stato di
spin zero ...
In questo caso avremmo
(s)
M = cost · ūl (q) vν(r) (k) ⇒ |M|2 = |cost|2 8(k · q) = 4 |cost|2 (M 2 − m2 ) (3.1345)

ovvero
( )2
Γ(π − → e− ν̄e ) Mπ2 − m2e
Rπ ≡ = ≈ 5.492 (3.1346)
Γ(π − → µ− ν̄µ ) Mπ2 − m2µ

Il fatto che sperimentalmente sia Rπ = (1.24±) · 10−4 costituı̀, ovviamente, un argomento


fortissimo a favore di quella vettoriale.
234
Si ricordi che, visto che γ5 è reale e simmetrica ed anticommuta con γ 0 , risulta

(χ± ψ) = ψ̄ χ∓ (3.1349)

233
Figure 14: Ampiezze di elicità associate alla corrente vettoriale

I due termini ψR e ψL , detti rispettivamente termine di corrente right (R) e


termine di corrente left (L), nel caso considerato (creazione della particella a e
della antiparticella b) generano, per quanto abbiamo già visto circa il legame fra
chiralità ed elicità, ampiezze con i pesi relativi di cui alla Fig. 14 che, nel caso
particolare in cui, per esempio, la massa della particella b sia nulla, si riducono
come in Fig. 15.

Figure 15: Ampiezze di elicità associate alla corrente vettoriale, nel caso in cui
una massa sia nulla

Come si vede chiaramente, se il sistema delle due particelle considerate trae orig-
ine da una particella di spin nullo, la conservazione del momento angolare impone
che possano contribuire comunque solo le ampiezze relative a processi con parti-
celle/antiparticelle di elicità uguale, che sono però soppresse del fattore m/E ...
Nel caso poi delle interazioni deboli, per via della struttura V − A, accade poi
che sia presente solo il termine lef t ... ma questo fatto non ha rilevanza diretta

234
sulla questione della soppressione di elicità, ma si limita soltanto a dimezzare i
casi possibili !

Vediamo adesso come si modificano i risultati ottenuti in precedenza, nel caso


̸ 0 e sia una particella di Dirac.
in cui il neutrino abbia una massa µ =
Iniziamo occupandoci di |M| : il punto di partenza è ancora l’elemento di matrice
2

(3.1320), i.e.
GF [ ]
M = − √ fπ cosθC ūl (q) ̸ q (1 − γ5 ) vν(r) (k) + ūl (q) (1 + γ5 ) ̸ k vν(r) (k) =
(s) (s)
2
GF [ ]
= − √ fπ cosθC m ūl (q)(1 − γ5 ) vν(r) (k) − µ ūl (q) (1 + γ5 )vν(r) (k) (3.1352)
(s) (s)
2
(s) (s)
dove abbiamo usato il fatto che ūl (q) ̸ q = m ūl (q) e che ̸ k vν(r) (k) = −µ vν(r) (k).
Poniamo allora

R = m(1 − γ5 ) − µ(1 + γ5 ) = (m − µ) − γ5 (m + µ) = R† (3.1353)

risulta cosı̀
GF [ ]
M = − √ fπ cosθC ūl (q) R vν(r) (k)
(s)
(3.1354)
2
da cui ricaviamo
G2F ∑ (s)
|M|2 = |fπ |2 cos2 θC |ūl (q) R vν(r) (k)|2 (3.1355)
2 r,s

ma, al solito, possiamo scrivere


∑ ∑ ∑
|ū R v|2 = (ū R v) · (ū R v)∗ = (ū R v) · (ū R v)† =
r,s r,s r,s
[ ] [ ]
∑ ∑
= Tr ū R v v † R† ū† = T r ū R v v̄γ 0 R γ 0 u =
r,s r,s
{( ) ( ) }
∑ (s) (s) ∑
= Tr ul (q) ūl (q) R vν(r) (k) v̄ν(r) (k) 0
γ Rγ 0
=
s r
{ }
= T r (̸ q + m) R (̸ k − µ) R̂ (3.1356)

dove abbiamo definito

R̂ ≡ γ 0 R γ 0 = (m − µ) + γ5 (m + µ) (3.1357)

Siccome sia R che R̂ hanno un numero pari di matrici γ, gli unici termini che
possono contribuire alla traccia (3.1356) sono

−m µ T r(R R̂) + T r(̸ q R ̸ k R̂) (3.1358)

235
Risulta (si ricordi che T r(γ5 ) = 0 )

−m µ T r(R R̂) = −m µ T r {[(m − µ) − γ5 (m + µ)][(m − µ) + γ5 (m + µ)]} =


= −m µ[4(m − µ)2 − 4(m + µ)2 ] = 16 m2 µ2 (3.1359)

mentre è (si ricordi che T r(γ5 γ α γ β ) = 0 )

T r(̸ q R ̸ k R̂) = T r {̸ q [(m − µ) − γ5 (m + µ)] ̸ k [(m − µ) + γ5 (m + µ)]} =


{ }
= T r (m − µ)2 ̸ q ̸ k − (m + µ)2 ̸ q γ5 ̸ k γ5 =
= 4(m − µ)2 (qk) + 4(m + µ)2 (qk) = 8(m2 + µ2 )(qk) (3.1360)

per cui, in definitiva, risulta


∑ (s)
|ūl (q) R vν(r) (k)|2 = 8(m2 + µ2 )(qk) + 16 m2 µ2 (3.1361)
r,s

e dunque, finalmente235

G2F [ ]
|M|2 = |fπ |2 cos2 θC · 8 (m2 + µ2 )(qk) + 2 m2 µ2 =
2 [ ]
= 4 G2F |fπ |2 cos2 θC · (m2 + µ2 )(qk) + 2 m2 µ2 =
{ }
= 4 G2F |fπ |2 cos2 θC · m2 [µ2 + (qk)] + µ2 [m2 + (qk)] =
{ }
= 2 G2F |fπ |2 cos2 θC · m2 (2µ2 + M 2 − m2 − µ2 ) + µ2 (2m2 + M 2 − m2 − µ2 ) =
{ }
= 2 G2F |fπ |2 cos2 θC · m2 2M Eν + µ2 2M El =
{ }
= 4M G2F |fπ |2 cos2 θC · m2 Eν + µ2 El (3.1362)

dove Eν ed El sono, rispettivamente, le energie nel centro di massa del neutrino


e del leptone (da confrontare con la (3.1338), ottenuta direttamente nel caso in
cui µ = 0).
235
In generale, per la conservazione del quadriimpulso espressa dalla (3.1319), abbiamo

P =k+q

e dunque

P − k = q ⇒ M 2 + µ2 − 2(P · k) = m2 ⇒ M 2 − m2 + µ2 = 2(P · k)

che, nel sistema del CM , diviene

2M Eν = M 2 − m2 + µ2

e, analogamente
2M El = M 2 − µ2 + m2

236
Per quanto riguarda infine dΓ, occorre tenere conto della massa del neutrino
anche nell’elemento di angolo solido dΦ: si ha

1 M −m 2 2
1 (M 2 − m2 − µ2 )2 − 4m2 µ2
dΦ = 2 2
dΩCM → dΩCM
16π 2M 16π 2 2M 2
1 bl
= √ dΩCM (3.1363)
16π 2 s

dove bl è il modulo dell’impulso spaziale del leptone carico e dell’antineutrino,


visti nel sistema del CM . Risulta quindi
1
dΓ = |M|2 dΦ =
2M
1 { } 1 bl
= · 4M G2F |fπ |2 cos2 θC · m2 Eν + µ2 El · dΩCM
2M 16π 2 M
ovvero, integrando sull’angolo solido, abbiamo infine
1 2 { } b
l
Γ = GF |fπ |2 cos2 θC m2 Eν + µ2 El =
2π M
1 2 (M 2 − m2 − µ2 )(m2 + µ2 ) + 4 m2 µ2
= GF |fπ |2 cos2 θC bl =
4π M2
1 2 m2 (M 2 − m2 ) + µ2 (M 2 + 2m2 − µ2 )
= GF |fπ |2 cos2 θC ·

√ M2
(M 2 − m2 − µ2 )2 − 4m2 µ2
· (3.1364)
2M
che, nel limite di massa nulla del neutrino riproduce la (3.1340), risultando infatti

1 2 m2 (M 2 − m2 ) + µ2 (M 2 + 2m2 − µ2 )
Γ = GF |fπ |2 cos2 θC 2
·

√ M
(M 2 − m2 − µ2 )2 − 4m2 µ2
·
2M
1 2 m2 (M 2 − m2 ) (M 2 − m2 )
→ G |fπ | cos θC
2 2
· =
4π F M2 2M
( )2
M m2 2 M 2 − m2
= GF |fπ | cos θC
2 2
(3.1365)
8π M2

Fin qui abbiamo sempre ignorato lo stato di spin delle particelle prodotte.
E’ però molto istruttivo vedere che cosa accade ad |M|2 quando, per esempio, si
fissi lo stato di spin del leptone carico l− .
Inizieremo assumendo di nuovo che la massa del neutrino sia nulla.

237
Occorre ripartire dalla (3.1320), inserendo adesso nell’espressione dell’elemento
di matrice, il proiettore di spin del leptone236
1 + γ5 ̸ N
Π= (3.1367)
2
descritto dal quadrivettore N µ , le cui proprietà generali, lo ricordiamo, sono che

(N q) = 0; N 2 = −1 (3.1368)

Si ha
GF [
M = − √ fπ cosθC ūl (q)Π ̸ q (1 − γ5 ) vν(r) (k)+
(s)
2
]
(s)
+ ūl (q) Π (1 + γ5 ) ̸ k vν(r) (k) (3.1369)

ovvero, essendo la massa del neutrino nulla (↛ k vν(r) (k) = 0), risulta

GF [ ]
M = − √ fπ cosθC ūl (q)Π ̸ q (1 − γ5 ) vν(r) (k)
(s)
(3.1370)
2

Ma i proiettori di spin commutano con i proiettori Λ± e dunque237

Π(̸ q + m) = (̸ q + m)Π ⇒ Π ̸ q ≠ q Π (3.1371)


(s) (s)
per cui, essendo ūl (q) ̸ q = m ūl (q), abbiamo

GF [ ]
M = − √ fπ cosθC m ūl (q) Π (1 − γ5 ) vν(r) (k)
(s)
(3.1372)
2
e dunque

G2F ∑ (s)
|M|2 = m2 |fπ |2 cos2 θC |ūl (q) Π (1 − γ5 ) vν(r) (k)|2 (3.1373)
2 r,s

236
Si ricordi che (idem per lo spinore v ...)

̸ † γ5 0
1+ N ̸ † γ 0 γ5
1 − γ0 N
(Π u) = (Π u)† γ 0 = u† Π† γ 0 = ūγ 0 Π† γ 0 = ūγ 0 γ = ū =
2 2
̸ γ5
1− N ̸
1 + γ5 N
= ū = ū = ū Π (3.1366)
2 2

237
Come è noto, infatti, essendo (N q) = 0, si ha

̸ · q̸ = γ5 Nα qβ γ α γ β = γ5 Nα qβ [−γ β γ α + 2δ αβ ] = −γ5 q̸ · N
γ5 N ̸ + 2γ5 (N q) ≠q · γ5 N
̸

238
∑ (s)
Procediamo dunque al calcolo di r,s |ūl (q) Π (1 − γ5 ) vν(r) (k)|2 . Si ha
∑ (s)
|ūl (q) Π (1 − γ5 ) vν(r) (k)|2 =
r,s
∑ ∑
= [ū Π (1 − γ5 ) v] [ū Π (1 − γ5 ) v]∗ = [ū Π (1 − γ5 ) v] [ū Π (1 − γ5 ) v]† =
r,s r,s
{ }
∑ †
= Tr [ū Π (1 − γ5 ) v] [ū Π (1 − γ5 ) v] =
r,s
{ }

† † †
= Tr ū Π (1 − γ5 ) v v (1 − γ5 ) Π ū =
r,s
{ }

= Tr ū Π (1 − γ5 ) v v̄ γ 0 (1 − γ5 ) γ 0 Πγ 0 γ 0 u =
r,s
{( ) ( ) }
∑ (s) (s) ∑
= Tr ul (q) ūl (q) Π (1 − γ5 ) vν(r) (k) v̄ν(r) (k) (1 + γ5 ) Π =
s r
{ }
= T r {(m+ ̸ q) Π (1 − γ5 ) (̸ k) (1 + γ5 ) Π } = T r Π(m+ ̸ q) Π (1 − γ5 )2 ̸ k =
{ }
= 2T r (m+ ̸ q) Π2 (1 − γ5 ) ̸ k = 2T r {(m+ ̸ q) Π (1 − γ5 ) ̸ k} (3.1374)
dove si è usato il fatto che
ū† = γ 0 u, Π† = γ 0 Πγ 0 , (1 − γ5 )2 = 2(1 − γ5 ), Π2 = Π, Π ̸ q ≠ q Π
∑ ∑
u(s) (q) ū(s) (q) ≠ q + m, v (r) (k) v̄ (r) (k) ≠ k
s r
Risulta quindi dalla (3.1374), ricordando la definizione di Π, che
∑ (s)
|ūl (q) Π (1 − γ5 ) vν(r) (k)|2 = T r {(m+ ̸ q) (1 + γ5 ̸ N ) (1 − γ5 ) ̸ k } =
r,s
= T r {m(1 + γ5 ̸ N ) (1 − γ5 ) ̸ k + ̸ q (1 + γ5 ̸ N ) (1 − γ5 ) ̸ k } =
= T r {m(1 − γ5 ) ̸ k + m γ5 ̸ N (1 − γ5 ) ̸ k + ̸ q γ5 ̸ N (1 − γ5 ) ̸ k + ̸ q (1 − γ5 ) ̸ k }
ma i termini con un numero dispari di γ hanno traccia nulla, per cui il primo ed
il terzo addendo dell’espressione di sopra danno contributo nullo alla traccia, e
quindi risulta che
∑ (s)
|ūl (q) Π (1 − γ5 ) vν(r) (k)|2 = T r {m γ5 ̸ N (1 − γ5 ) ̸ k+ ̸ q (1 − γ5 ) ̸ k} (3.1375)
r,s

ma
γ5 ̸ N (1 − γ5 ) = − ̸ N γ5 (1 − γ5 ) ≠ N (1 − γ5 ) (3.1376)
e ricordando che la traccia del prodotto di due γ per la γ5 è nulla, ecco che si ha
∑ (s)
|ūl (q) Π (1 − γ5 ) vν(r) (k)|2 = T r {m ̸ N (1 − γ5 ) ̸ k+ ̸ q (1 − γ5 ) ̸ k} =
r,s
= T r {m ̸ N ̸ k + ̸ q ̸ k} = 4m(N · k) + 4(q · k) ≡ 4(r+ · k) (3.1377)

239
dove si è posto, per definizione,
µ
r+ ≡ qµ + m N µ (3.1378)

Sostituendo nella (3.1373), si ottiene238 dunque

G2F ∑ (s) (r
|M|2 = m2 |fπ |2 cos2 θC |ūl (q) Π (1 − γ5 ) vν ) (k)|2 =
2 r,s

G2F
= m2 |fπ |2 cos2 θC (4r+ · k) = 2m2 G2F |fπ |2 cos2 θC (r+ · k) (3.1379)
2
E’ immediato adesso dimostrare che il fattore (r+ ·k) è nullo quando si scelga come
direzione e verso di polarizzazione del leptone quella corrispondente ad elicità
negativa nel riferimento del CM (pione fermo). Infatti, in questo riferimento,
quanto agli impulsi, usando le formula consuete, abbiamo che

l− : q = (E, b ⃗n); ν̄ : k = (b, −b ⃗n) (3.1380)

con
M 2 − m2 M 2 + m2
b= ; E= (3.1381)
2M 2M
dove M è la massa del pione (o del kappa ...) ed m è quella del leptone carico.
Il quadrivettore che descrive l’elicità positiva del leptone nel riferimento del CM
è allora, come sappiamo, il seguente
1
N= (b, E ⃗n) (3.1382)
m
per cui, per l’elicità negativa, si ha

r+ = q + m(−N ) = (E, b ⃗n) − (b, E ⃗n) = (E − b, (b − E) ⃗n) =


= (E − b)(1, −⃗n) (3.1383)

il quale ha prodotto scalare nullo con il quadrivettore k = b(1, −⃗n) essendo239


light-like e ad esso proporzionale.
Questo dimostra che il leptone negativo originato dal decadimento è in uno
stato di elicità definita ed essa è positiva, ovvero ”opposta” a quella che, per una
238
Chiaramente, se sommiamo le due ampiezze quadre, ottenute per la polarizzazione N µ e
per la sua opposta −N µ , essendo che (r+ · k) + (r− · k) = 2(qk) ritroviamo la (3.1335)...
239
Si ricordi che, se q µ è il quadrimpulso di una particella di Dirac di massa m in un certo
riferimento inerziale, allora i quadrivettori che ne descrivono la polarizzazione in una data
direzione (nei due versi ...) in quel riferimento sono della forma
( 2 )
1 m µ
nµ = ± q̂ − q µ (3.1384)
m q̂ · q

240
particella di massa nulla, stabilirebbe il proiettore chirale χ− che compare nella
lagrangiana che descrive le interazioni deboli
Questa conclusione è esatta nell’ipotesi in cui la massa del neutrino è nulla.
Ma vediamo che succede nel caso in cui µ ̸= 0. Il punto di partenza è sempre
l’elemento di matrice (3.1320) che, nel caso in cui µ ̸= 0, ha condotto alla (3.1354),
i.e.
GF [ ]
M = − √ fπ cosθC ūl (q) R vν(r) (k)
(s)
(3.1387)
2
1+γ5 ̸N
Quando si imponga al leptone carico una polarizzazione Π = 2
, questo,
avendo posto

R ≡ (m − µ) − γ5 (m + µ) (3.1388)

diventa
GF [ ]
M = − √ fπ cosθC ūl (q) Π R vν(r) (k)
(s)
(3.1389)
2
da cui
G2F ∑ (s)
|M|2 = |fπ |2 cos2 θC |ūl (q) Π R vν(r) (k)|2 (3.1390)
2 r,s

e la sommatoria, stavolta, diventa


∑ ∑ ∑
|ū Π R v|2 = (ū Π R v) · (ū Π R v)∗ = (ū Π R v) · (ū Π R v)† =
r,s r,s r,s
[ ] [ ]
∑ ∑
† † † † 0 † 0
= Tr ū Π R v v R Π ū = Tr ū Π R v v̄γ R Π γ u =
r,s r,s
{( ) ( ) }
∑ (s) (s) ∑
= Tr ul (q) ūl (q) ΠR vν(r) (k) v̄ν(r) (k) 0
γ Rγ Π =0
s r
{ } { }
= T r (̸ q + m) Π R (̸ k − µ) R̂ Π = T r Π (̸ q + m) Π R (̸ k − µ) R̂ =
{ } ∑
= T r (̸ q + m) Π R (̸ k − µ) R̂ ≡ |ū Π R v|2 (3.1391)
r,s

dove q̂ è un quadrivettore light-like. Ne segue che


m2 µ
±m nµ = q̂ − q µ (3.1385)
q̂ · q
e quindi anche i quadrivettori

µ m2 µ
r± = q µ ± m nµ = q̂ (3.1386)
q̂ · q
sono comunque light-like con parte temporale positiva visto che, come segue immediatamente
dalla (3.1386), nel sistema di quiete della particella la loro parte temporale vale proprio +m.

241
dove abbiamo usato il fatto che Π (̸ q + m) = (̸ q + m) Π e che Π2 = Π.
Questa traccia è fatta da quattro termini, che sono i seguenti:
{ } { }
1) : T r ̸ q Π R ̸ k R̂ = T r ̸ q Π R2 ̸ k (3.1392)
{ } { }
2) : m T r Π R ̸ k R̂ = m T r Π R2 ̸ k (3.1393)
{ }
3) : −µ T r ̸ q Π R R̂ (3.1394)
{ }
4) : −m µ T r Π R R̂ (3.1395)

dove

R2 = (m − µ)2 + (m + µ)2 − 2γ5 (m2 − µ2 ) =


= 2(m2 + µ2 ) − 2γ5 (m2 − µ2 ) (3.1396)
R R̂ = (m − µ)2 − (m + µ)2 = −4 m µ (3.1397)

Quindi, quanto al primo termine, abbiamo


{ } { [ ] }
T r ̸ q Π R2 ̸ k = T r ̸ q (1 + γ5 ̸ N ) (m2 + µ2 ) − γ5 (m2 − µ2 ) ̸ k =
{ }
= T r ̸ q (m2 + µ2 ) ̸ k = 4 (m2 + µ2 )(q · k) (3.1398)

mentre dal secondo termine otteniamo


{ } { [ ] }
m T r Π R2 ̸ k = m T r (1 + γ5 ̸ N ) (m2 + µ2 ) − γ5 (m2 − µ2 ) ̸ k =
{ }
= m T r γ5 ̸ N (−γ5 (m2 − µ2 )) ̸ k =
= 4 m (m2 − µ2 )(N · k) (3.1399)

Quanto al terzo termine esso non contribuisce, infatti


{ } −µ
−µ T r ̸ q Π R R̂ = T r {̸ q (1 + γ5 ̸ N ) (−4mµ)} = 0 (3.1400)
2
mentre il quarto termine fornisce
{ } mµ
−m µ T r Π R R̂ = − T r {(1 + γ5 ̸ N ) (−4mµ)} = 8 m µ2 (3.1401)
2
Quindi risulta infine che

|ū Π R v|2 = 4 (m2 + µ2 )(q · k) + 4 m (m2 − µ2 )(N · k) + 8 m2 µ2 (3.1402)
r,s

= 4 (m2 (q · k + m N · k) + 4 µ2 (q · k − m N · k) + 8 m2 µ2 =
= 4 m2 (r+ · k) + 4 µ2 (r− · k) + 8 m2 µ2 (3.1403)

242
ovvero abbiamo240
G2F ∑ (s)
|M|2 = |fπ |2 cos2 θC |ūl (q) Π R vν(r) (k)|2
2 r,s
[ ]
= G2F |fπ |2 cos2 θC 2 m2 (r+ · k) + 2 µ2 (r− · k) + 4 m2 µ2 (3.1406)

Siccome r± sono quadrivettori light-like con parte temporale positiva, le quantità


(r± · k) sono sempre strettamente positive241 .
Questo significa che il leptone uscente, adesso, non è in uno stato puro (di spin)
e quindi non è completamente polarizzato.
Lo stato finale è uno stato entangled e, visto che il pione ha spin nullo e che
il decadimento avviene in onda S essendo l’interazione ”di contatto”, la con-
servazione del momento angolare impone che ci sia completa correlazione fra
le elicità242 dei due leptoni le quali, però, risultano adesso possibili entrambe:
evidentemente, quindi, se prescindiamo dallo stato di spin dell’antineutrino, il
leptone carico può essere descritto solo come una miscela statistica di stati per
cui non appare completamente polarizzato non essendo in uno stato puro.
Verifichiamo adesso la correlazione menzionata sopra fra le elicità.
Per questo, ripartiamo dall’elemento di matrice (3.1320) che, nel caso in cui µ ̸= 0,
ha condotto alla (3.1354), i.e.
GF [ ]
M = − √ fπ cosθC ūl (q) R vν(r) (k)
(s)
(3.1407)
2
240
Si osservi che
• sommando sui due stati di polarizzazione descritti dai quadrivettori N e −N otteniamo
di nuovo la (3.1361)
∑ (s)
|ūl (q) R vν(r) (k)|2 = 8(m2 + µ2 )(qk) + 16 m2 µ2 (3.1404)
r,s

• ponendo µ = 0 otteniamo nuovamente la (3.1377), (si ricordi che, per µ → 0, abbiamo


che R → m χ− ...)
∑ (s)
|ūl (q) Π m (1 − γ5 ) vν(r) (k)|2 = 4 m2 (r+ · k) (3.1405)
r,s

241 0
Evidentemente, se indichiamo con r̂± le componenti temporali (positive !) dei quadrivettori
r± nel riferimento di quiete dell’antineutrino, la quantità scalare che stiamo considerando vale

2 m2 (r+ · k) + 2 µ2 (r− · k) + 4 m2 µ2 = 2 m2 µ r̂+


0
+ 2 µ2 µ r̂−
0
+ 4 m2 µ2 > 0

242
Rispetto al caso del neutrino con massa nulla in cui lo stato finale era rappresentato da
un unico vettore di stato, adesso lo stato finale può essere descritto in termini di due vettori
di stato in cui, alternativamente, un leptone ha l’elicità ”sbagliata”. I due stati si realizzano
con le proprie opportune probabilità e quindi si sommano in modo incoerente (si sommano le
probabilità e non le ampiezze ...).

243
dove R ≡ (m − µ) − γ5 (m + µ) = R† .
Imponendo che lo stato di spin del leptone carico sia quello che è definito at-
traverso il proiettore Π = 1+γ25 ̸N e che lo stato di spin del leptone neutro sia
quello definito attraverso il proiettore Ξ = 1+γ2 5 ̸n , l’elemento di matrice che de-
scrive il processo diventa
GF [ ]
M = − √ fπ cosθC ūl (q) Π R Ξ vν(r) (k)
(s)
(3.1408)
2
da cui otteniamo
G2F ∑ (s)
|M|2 = |fπ |2 cos2 θC |ūl (q) Π R Ξ vν(r) (k)|2 (3.1409)
2 r,s

e la sommatoria diventa ora243


∑ ∑
|ū Π R Ξ v|2 = (ū Π R Ξ v) · (ū Π R Ξ v)† =
r,s r,s
[ ] [ ]
∑ ∑
† † † † † 0 † † 0
= Tr ū Π R Ξ v v Ξ R Π ū = Tr ū Π R Ξ v v̄γ Ξ R Π γ u =
r,s r,s
{( ) ( ) }
∑ (s) (s) ∑
= Tr ul (q) ūl (q) ΠRΞ vν(r) (k) v̄ν(r) (k) Ξ γ 0 Rγ 0 Π =
s r
{ } { }
= T r (̸ q + m) Π R Ξ (̸ k − µ) Ξ R̂ Π = T r Π (̸ q + m) Π R Ξ (̸ k − µ) Ξ R̂ =
{ } ∑
= T r (̸ q + m) Π R (̸ k − µ) Ξ R̂ ≡ |ū Π R Ξ v|2 (3.1410)
r,s

Questa traccia è fatta dei quattro termini seguenti


{ }
1) : T r ̸ q Π R ̸ k Ξ R̂ (3.1411)
{ }
2) : m T r Π R ̸ k Ξ R̂ (3.1412)
{ }
3) : −µ T r ̸ q Π R Ξ R̂ (3.1413)
{ }
4) : −m µ T r Π R Ξ R̂ (3.1414)

e risulta
1
ΠR = (1 + γ5 ̸N )[(m − µ) − γ5 (m + µ)] =
2
243
Si ricordi che

R ≡ (m − µ) − γ5 (m + µ) = R† ; R̂ ≡ (m − µ) + γ5 (m + µ)
γ 0 Ξ† γ 0 = Ξ; Ξ2 = Ξ γ 0 Π† γ 0 = Π; Π2 = Π
Π(̸q + m) = (̸q + m)Π; Ξ(̸k − µ) = (̸k − µ)Ξ

244
1
= [(m − µ)I − (m + µ)γ5 + (m − µ)γ5 ̸N + (m + µ) ̸N ](3.1415)
2
1
Ξ R̂ = (1 + γ5 ̸n)[(m − µ) + γ5 (m + µ)] =
2
1
= [(m − µ)I + (m + µ)γ5 + (m − µ)γ5 ̸n − (m + µ) ̸n] (3.1416)
2
I contributi non nulli al primo termine sono solo i seguenti (per ogni termine
in Π R esiste un solo termine in Ξ R̂ che consente un contributo non nullo alla
traccia ...)
{ } 1
T r ̸ q Π R ̸ k Ξ R̂ = T r {̸ q (m − µ) ̸ k (m − µ)− ̸ q (m + µ)γ5 ̸ k (m + µ)γ5 +
4
+ ̸ q (m − µ)γ5 ̸ N ̸ k (m + µ)γ5 ̸ n− ̸ q (m + µ) ̸ N ̸ k (m + µ) ̸ n} =
4{ }
= (m − µ)2 + (m + µ)2 (q · k) +
4
1
+ [(m − µ)2 − (m + µ)2 ] T r {̸ q ̸ N ̸ k ̸ n}
4
ma
{ }
T r {̸ q ̸ N ̸ k ̸ n} = qα Nβ kν nρ T r γ α γ β γ ν γ ρ =
= 4 qα Nβ kν nρ (δ αβ δ νρ + δ αρ δ βν − δ αν δ βρ ) =
= 4[(q · N )(k · n) + (q · n)(k · N ) − (q · k)(n · N )] (3.1417)
e siccome (q · N ) = (k · n) = 0, abbiamo infine che
{ }
T r ̸ q Π R ̸ k Ξ R̂ =
= 2(m2 + µ2 )(q · k) − 4mµ(q · n)(k · N ) + 4mµ(q · k)(n · N ) (3.1418)
Veniamo ora al secondo termine: abbiamo
{ } m
m T r Π R ̸ k Ξ R̂ = T r {−(m − µ) ̸ k (m + µ) ̸ n − (m + µ)γ5 ̸ k (m − µ)γ5 ̸ n+
4
+ (m − µ)γ5 ̸ N ̸ k (m + µ)γ5 + (m + µ) ̸ N ̸ k (m − µ)} =
4m {
= −(m2 − µ2 )(k · n) + (m2 − µ2 )(k · n)+
4 }
+ (m2 − µ2 )(k · N ) + (m2 − µ2 )(k · N ) =
= 2 m (m2 − µ2 )(k · N ) (3.1419)
Quanto al terzo termine, analogamente risulta
{ } µ
−µ T r ̸ q Π R Ξ R̂ = − T r {− ̸ q (m − µ)(m + µ) ̸ n− ̸ q (m + µ)γ5 (m − µ)γ5 ̸ n+
4
+ ̸ q (m − µ)γ5 ̸ N (m + µ)γ5 + ̸ q (m + µ) ̸ N (m − µ)} =
4µ {
= − −(m2 − µ2 )(n · q) − (m2 − µ2 )(n · q) +
4 }
− (m2 − µ2 )(N · q) + (m2 − µ2 )(N · q) =
= 2 µ (m2 − µ2 )(n · q) (3.1420)

245
Ed infine, circa l’ultimo termine, abbiamo
{ } mµ
−m µ T r Π R Ξ R̂ = − T r {(m − µ)(m − µ) − (m + µ)γ5 (m + µ)γ5 +
4
+ (m − µ)γ5 ̸ N (m − µ)γ5 ̸ n − (m + µ) ̸ N (m + µ) ̸ n} =
4mµ { }
=− (m − µ)2 − (m + µ)2 − (m − µ)2 (n · N ) − (m + µ)2 (n · N ) =
4{ }
= mµ 4mµ + 2(m2 + µ2 )(n · N ) = 4m2 µ2 + 2mµ(m2 + µ2 )(n · N ) (3.1421)

per cui, combinando insieme i quattro risultati, otteniamo244 dunque che


∑ (s)
|ūl (q) Π R Ξ vν(r) (k)|2 = 2(m2 + µ2 )(q · k) − 4mµ(q · n)(k · N ) +
r,s

+ 4mµ(q · k)(n · N ) + 2m(m2 − µ2 )(k · N ) + 2µ(m2 − µ2 )(n · q)


+4m2 µ2 + 2mµ(m2 + µ2 )(n · N ) (3.1423)

da cui, finalmente, si ha
G2F ∑ (s)
|M|2 = |fπ |2 cos2 θC |ūl (q) Π R Ξ vν(r) (k)|2 = G2F |fπ |2 cos2 θC ·
2 r,s
{
· (m2 + µ2 )(q · k) − 2mµ(q · n)(k · N ) + 2mµ(q · k)(n · N )+
+ m(m2 − µ2 )(k · N ) + µ(m2 − µ2 )(n · q) +
}
+ 2m2 µ2 + mµ(m2 + µ2 )(n · N ) (3.1424)

Questo risultato, fornendo |M|2 in funzione sia dello stato di polarizzazione del
leptone carico e che di quello neutro, ci permette di verificare la correlazione
diretta che esiste fra le elicità dei due leptoni nel sistema245 del CM .
Poniamoci dunque nel CM del decadimento, dove abbiamo

k = (E, b ⃗n); q = (E, −b ⃗n) (3.1425)


M +µ −m
2 2 2
M 2 + m2 − µ 2
E = ; E= (3.1426)
√ 2M 2M
(M − m − µ ) − 4m µ
2 2 2 2 2 2
b = (3.1427)
2M
244
Come verifica del risultato ottenuto, osserviamo che se sommiamo il risultato per la polar-
izzazione dell’antineutrino descritta dal quadrivettore n con quello relativo alla polarizzazione
ad essa opposta, descritta dal quadrivettore −n, otteniamo la (3.1402), i.e.

|ū Π R v|2 = 4 (m2 + µ2 )(q · k) + 4 m (m2 − µ2 )(N · k) + 8 m2 µ2 (3.1422)
r,s

245
Si ricordi che mentre il risultato (3.1424) è invariante di Lorentz, ma la descrizione degli
stati di elicità non lo è e necessita quindi di definire il riferimento in cui viene compiuta.

246
essendo ⃗n la direzione di volo dell’antineutrino.
Iniziamo fissando l’elicità dell’antineutrino in modo che essa sia positiva (λ = +1):
come è noto, questo implica che il quadrivettore che individua questo stato di spin
sia
1
n= (b, E ⃗n) (3.1428)
µ

Determiniamo il valore di |M|2 dalla (3.1424) imponendo che, per quanto riguarda
invece il leptone carico, la sua elicità sia negativa (λ = −1), i.e.
1
N =− (b, −E ⃗n) (3.1429)
m
In queste ipotesi, quanto ai prodotti scalari che entrano nella (3.1424), risulta

M 2 − m2 − µ2
(q · k) = E E + b2 = (3.1430)
2
1 b bM
(q · n) = (E b + b E) = (E + E) = (3.1431)
µ µ µ
1 b bM
(k · N ) = − (E b + E b) = − (E + E) = − (3.1432)
m m m
1 2 1
(n · N ) = − (b + E E) = − (M − m − µ2 )
2 2
(3.1433)
mµ 2mµ

per cui, sostituendo nella (3.1424), abbiamo


{
|M|2 = G2F |fπ |2 cos2 θC (m2 + µ2 )(q · k) − 2mµ(q · n)(k · N )+
+ 2mµ(q · k)(n · N ) + m(m2 − µ2 )(k · N ) + µ(m2 − µ2 )(n · q) +
}
+ 2m2 µ2 + mµ(m2 + µ2 )(n · N ) =
{
M 2 − m2 − µ2 bM bM
= G2F |fπ | cos θC (m2 + µ2 )
2 2
+ 2mµ −
2 µ m
M 2 − m2 − µ2 1 bM
− 2mµ (M 2 − m2 − µ2 ) − m(m2 − µ2 ) +
2 2mµ m
}
2 bM 1
+ µ(m − µ )
2
+ 2m µ − mµ(m + µ )
2 2 2 2
(M − m − µ ) =
2 2 2
µ 2mµ
{ }
(M 2 − m2 − µ2 )2
= GF |fπ | cos θC 2M b −
2 2 2 2 2 2 2
+ 2m µ =
2
{
(M 2 − m2 − µ2 )2
= G2F |fπ |2 cos2 θC − 2m2 µ2
2
}
(M 2 − m2 − µ2 )2
− 2 2
+ 2m µ = 0 (3.1434)
2

247
La configurazione di spin richiesta è dunque impossibile.
Altrettanto impossibile è la configurazione opposta, in cui entrambe le elicità sono
cambiate di segno: la dimostrazione formale di questo segue immediatamente da
quanto sopra, visto che gli unici termini lineari in n ed N presenti nella (3.1434)
si elidono l’un l’altro (gli altri termini sono funzioni pari dei quadrivettori di spin
e dunque non cambiano).
Possono esistere, quindi, solo le configurazioni in cui le elicità λ dei due leptoni
sono entrambe positive o entrambe negative.
Iniziamo dal caso in cui siano entrambe positive. Rispetto al caso precedente
occorre solo cambiare il segno ad N , ovvero prendere adesso
1
N= (b, −E ⃗n) (3.1435)
m
cambiando, nella (3.1434), i segni a tutti i prodotti scalari che coinvolgono il solo
quadrivettore N . Si ha
{
M 2 − m2 − µ2 bM bM

|M|2 = G2F |fπ | cos θC (m2 + µ2 )
2 2
− 2mµ +
λ=+1 2 µ m
M 2 − m2 − µ2 1 bM
+ 2mµ (M 2 − m2 − µ2 ) + m(m2 − µ2 ) +
2 2mµ m
}
2 bM 1
+ µ(m − µ )
2 2 2 2
+ 2m µ + mµ(m + µ ) 2
(M − m − µ ) =
2 2 2
µ 2mµ
{
= G2F |fπ |2 cos2 θC (m2 + µ2 )(M 2 − m2 − µ2 ) − 2M 2 b2 +
(M 2 − m2 − µ2 )2 }
+ + 2bM (m2 − µ2 ) + 2m2 µ2 =
2 {
(M 2 − m2 − µ2 )2
= GF |fπ | cos θC (m2 + µ2 )(M 2 − m2 − µ2 ) −
2 2 2
+
2
}
(M 2 − m2 − µ2 )2
2 2
+ 2m µ + + 2bM (m − µ ) + 2m µ =
2 2 2 2
2
= G2F |fπ |2 cos2 θC ·
{ }
· (m2 + µ2 )(M 2 − m2 − µ2 ) + 2bM (m2 − µ2 ) + 2m2 µ2 (3.1436)

che, nel caso in cui entrambe le elicità siano invece negative, diventa246


|M|2 = G2F |fπ |2 cos2 θC ·
λ=−1
{ }
· (m2 + µ2 )(M 2 − m2 − µ2 ) − 2bM (m2 − µ2 ) + 2m2 µ2 (3.1437)

Le due espressioni differiscono per il termine 2bM (m2 − µ2 ) che ha il segno del
valore comune delle due elicità λ.
246
Solo i termini lineari in n o N cambiano segno ...

248
Nell’ipotesi in cui M >> m, µ possiamo approssimare questo termine nel modo
seguente

2bM (m2 − µ2 ) = (m2 − µ2 ) (M 2 − m2 − µ2 )2 − 4m2 µ2 ≈
 ( )2 
1 2mµ
≈ (m2 − µ2 )(M 2 − m2 − µ2 ) 1 − =
2 M − m2 − µ2
2

2m2 µ2 (m2 − µ2 )
= (m2 − µ2 )(M 2 − m2 − µ2 ) − (3.1438)
M 2 − m2 − µ2
per cui, sostituendo, si ha
{ [ ]

|M|2 = G2F |fπ | cos θC
2 2
(M 2 − m2 − µ2 ) (m2 + µ2 ) ± (m2 − µ2 ) +
λ=±1
[ ]}
m2 − µ2
+ 2m µ 2 2
1∓ 2 (3.1439)
M − m2 − µ2

dalla quale si ricava in particolare che, sempre se M >> m, µ allora, con buona
approssimazione, risulta

( )2
|M|2 m
λ=+1
≈ (3.1440)
|M|2 µ
λ=−1

249
3.6.2 Il decadimento del muone
Il decadimento del muone247

µ− → e− + ν̄e + νµ (3.1441)

è un tipico processo debole, descritto nell’ambito del M S dal grafico di fig.16.

Figure 16: Diagramma di Feynman relativo al decadimento del muone

Nell’ambito della Teoria di Fermi, la quale è in grado di descrivere perfettamente,


al primo ordine perturbativo, il processo in questione, il termine di densità la-
grangiana responsabile del decadimento è il seguente
GF †α GF †α
Lw (x) = − √ J(muon) (x) Jα(elet) (x) ≡ − √ J(µ) (x) Jα(e) (x) (3.1442)
2 2
dove risulta248
†α
J(µ) (x) = ψ̄(νµ ) (x) γ α (1 − γ5 ) ψ(µ) (x) ≡ ν̄µ γ α (1 − γ5 ) µ (3.1443)
Jα(e) (x) = ψ̄(e) (x) γα (1 − γ5 ) ψ(νe ) (x) ≡ ē γα (1 − γ5 ) νe (3.1444)

La larghezza di decadimento dΓ, in generale, è data, come sappiamo, dalla re-


lazione
1 1
dΓ = |M|2 dΦ (3.1445)
2S + 1 2E
247
Prenderemo come esempio concreto quello del muone negativo ... ma le conclusioni tratte
sono, come ovvio, facilmente estendibili al decadimento del muone positivo.
248
Per semplicità di notazione, indichiamo nel seguito il campo di Dirac delle varie particelle
direttamente con il nome delle particelle stesse.

250
dove S è lo spin della particella che decade (quindi S = 1/2, nel caso del muone),
E è l’energia della stessa nel riferimento inerziale in cui viene studiato il processo,
mentre |M|2 è la somma sugli stati di spin iniziali e finali dei moduli quadri degli
elementi di matrice invarianti che contribuiscono al decadimento ed infine dΦ
fornisce l’elemento di spazio delle fasi invariante associato allo stato finale.
Considereremo il processo di decadimento nel riferimento del sistema del centro
di massa (CM ), dove E coincide quindi con la stessa massa M del muone, per
cui possiamo scrivere
1
dΓ = |M|2 dΦ (3.1446)
4M
Iniziamo calcolando il generico elemento di matrice invariante M relativo al pro-
cesso di decadimento in esame. Al primo ordine perturbativo, è

M = < out|L(0)|in >=


GF †α
= − √ < e− (p, r); ν̄e (k, b)|Jα(e) (0)|Ω > · < νµ (K, a)|J(µ) (0)|µ− (P, s) >=
2
GF [
= − √ < e− (p, r)|ē(0)|Ω > γα (1 − γ5 ) < ν̄e (k, b)|νe (0)|Ω > ·
2
]
< νµ (K, a)|ν̄µ (0)|Ω > γ α (1 − γ5 ) < Ω|µ(0)|µ− (P, s) > =
GF [( (r) ) ( )]
= −√
(b) (a) (s)
ū(e) (p) γα (1 − γ5 ) v(νe ) (k) · ū(νµ ) (K) γ α (1 − γ5 ) u(µ) (P ) (3.1447)
2
dove u e v indicano i consueti spinori di Dirac riferiti alle varie particelle coinvolte
nel processo, corrispondenti all’impulso ed allo stato di spin indicato.
Per quanto riguarda dunque |M|2 , ecco che risulta

G2F (e) αβ
|M|2 = Lαβ · L(µ) (3.1448)
2
dove abbiamo posto
(e) ∑( (r) (b)
)(
(r) (b)
)∗
Lαβ ≡ ū(e) (p) γα (1 − γ5 ) v(νe ) (k) ū(e) (p) γβ (1 − γ5 ) v(νe ) (k) (3.1449)
r,b
∑( (a) (s)
)(
(a) (s)
)∗
(µ) ≡
Lαβ ū(νµ ) (K) γ α (1 − γ5 ) u(µ) (P ) ū(νµ ) (K) γ β (1 − γ5 ) u(µ) (P ) (3.1450)
s,a

251
Iniziamo dal tensore legato all’elettrone ed al suo neutrino: risulta249
(e) ∑( (r) (b)
)(
(r) (b)
)∗
Lαβ = ū(e) (p) γα (1 − γ5 ) v(νe ) (k) ū(e) (p) γβ (1 − γ5 ) v(νe ) (k) =
r,b
 
∑ ( )( )† 
(r) (b) (r) (b)
= Tr ū(e) (p) γα (1 − γ5 ) v(νe ) (k) ū(e) (p) γβ (1 − γ5 ) v(νe ) (k) =
 
r,b
 
∑ ( )( )
†(b)
v(νe ) (k) (1 − γ5† ) γβ† (ū(e) (p))†
(r) (b) (r)
= Tr ū(e) (p) γα (1 − γ5 ) v(νe ) (k) =
 
r,b
 
∑ 
ū (p) γα (1 − γ5 ) v(νe ) (k) v̄(νe ) (k)γ 0 (1 − γ5 ) γβ† γ 0 u(e) (p)
(r) (b) (b) (r)
= Tr =
 (e) 
r,b
{( ) ( ) }
∑ (r) (r) ∑ (b) (b)
= Tr u(e) (p) ū(e) (p) γα (1 − γ5 ) v(νe ) (k) v̄(νe ) (k) (1 + γ5 )γβ (3.1451)
r b

Ricordiamo adesso che, in generale, per gli spinori u e v soluzioni dell’equazione


di Dirac per una particella di massa m, risulta

u(r) (p) ū(r) (p) = ̸ p + m (3.1452)
r

v (r) (p) v̄ (r) (p) = ̸ p − m (3.1453)
r

per cui, sostituendo, si ha


{( ) ( ) }
(e) ∑ (r) (r) ∑ (b) (b)
Lαβ = Tr u(e) (p) ū(e) (p) γα (1 − γ5 ) v(νe ) (k) v̄(νe ) (k) (1 + γ5 )γβ =
r b
= T r {(̸ p + me ) γα (1 − γ5 )(̸ k − mνe )(1 + γ5 )γβ } (3.1454)
Osserviamo adesso che
(1 − γ5 )(̸ k − mνe )(1 + γ5 ) = (1 − γ5 ) ̸ k (1 + γ5 ) − mνe (1 − γ5 )(1 + γ5 ) =
≠ k (1 + γ5 )2 = 2 ̸ k (1 + γ5 ) (3.1455)
per cui risulta
(e)
Lαβ = T r {(̸ p + me ) γα 2 ̸ k (1 + γ5 )γβ } =
= 2T r {̸ p γα ̸ k (1 + γ5 )γβ + me γα ̸ k (1 + γ5 )γβ } =
= 2T r {̸ p γα ̸ k γβ + ̸ p γα ̸ k γ5 γβ + me γα ̸ k γβ + me γα ̸ k γ5 γβ } =
= 2T r {̸ p γα ̸ k γβ + ̸ p γα ̸ k γ5 γβ } (3.1456)
249
Si ricordi che
• c−numero può essere visto anche come una matrice 1 × 1 per cui esso coincide con la
traccia della matrice stessa;
• T r(A · B · ... · X · Z) = T r(Z · A · B... · X);
• risulta γ5 = γ5† , γ 0 γ5 = −γ5 γ 0 e γ 0 γβ† γ 0 = γβ .

252
dove si è usato il fatto che la traccia di un numero dispari di matrici γ α è comunque
nulla. D’altronde

T r {̸ p γα ̸ k γβ } = pσ k τ T r {γσ γα γτ γβ } = pσ k τ 4(δσα δτ β + δ σβ δ ατ − δστ δαβ ) =


= 4 [pα kβ + pβ kα − (p · k)δ αβ ] (3.1457)
T r {̸ p γα ̸ k γ5 γβ } = p k T r {γσ γα γτ γ5 γβ } = −p k T r {γσ γα γτ γβ γ5 } =
σ τ σ τ

= −4i pσ k τ ϵσατ β = 4i pσ k τ ϵαβστ (3.1458)

e quindi risulta infine


(e)
Lαβ = 2 T r {̸ p γα ̸ k γβ + ̸ p γα ̸ k γ5 γβ } =
= 8 [pα kβ + pβ kα − (p · k)δ αβ + ipσ k τ ϵαβστ ] (3.1459)

dove p è il quadriimpulso dell’elettrone e k quello del suo antineutrino.


Venendo adesso all’analogo tensore per il sistema del muone e del suo neutrino,
risulta
∑( (a) (s)
)(
(a) (s)
)∗
(µ) ≡
Lαβ ū(νµ ) (K) γ α (1 − γ5 ) u(µ) (P ) ū(νµ ) (K) γ β (1 − γ5 ) u(µ) (P ) =
a,s
{( )( )† }
(a) (s) (a) (s)
= Tr ū(νµ ) (K) γ α (1 − γ5 ) u(µ) (P ) ū(νµ ) (K) γ β (1 − γ5 ) u(µ) (P ) (3.1460)

(e)
ovvero, in completa analogia250 con quanto già visto in precedenza per Lαβ , risulta
{ }
(µ) = T r (̸ K + mνµ ) γ 2 ̸ P (1 + γ5 )γ
Lαβ α β
=
[ ]
= 8 K α P β + K β P α − (K · P )δ αβ + iKσ Pτ ϵαβστ (3.1461)

dove, lo ricordiamo, K sta per il quadriimpulso del neutrino muonico e P per


quello del muone stesso.
Contraendo i due tensori, si ottiene251 dunque
(e)
(µ) = 64 [pα kβ + pβ kα − (p · k)δαβ + ip k ϵαβστ ]
Lαβ Lαβ σ τ

[K α P β + K β P α − (K · P )δ αβ + iKγ Pδ ϵαβγδ ] =
[
= 64 (pK)(kP ) + (pP )(kK) − (kp)(KP ) + iϵαβγδ pα kβ Kγ Pδ
250
L’unica differenza formale è che, al posto di un sistema di spinori u e v, adesso, per l’assenza
di antiparticelle nel sistema muonico, sono presenti due sistemi di spinori u. La differenza che
ne consegue è il segno del termine di massa corrispondente che, però è inessenziale visto che,
come si è visto nel caso elettronico, né la massa dell’elettrone né quella del suo (anti)neutrino
compaiono nell’espressione finale (3.1459) del tensore.
251
Ricordiamo che, per definizione, ϵ0123 = 1 e quindi ϵ0123 = −1 per cui si ha

ϵαβστ ϵαβγδ = −2(δσγ δτδ − δτγ δσδ )

253
+(pP )(kK) + (pK)(kP ) − (kp)(KP ) + iϵαβγδ pβ kα Kγ Pδ
−(kp)(KP ) − (kp)(KP ) + 4(kp)(KP ) − i(kp)δαβ ϵαβγδ Kγ Pδ
+iϵαβστ pσ k τ K α P β + iϵαβστ pσ k τ K β P α − iϵαβστ pσ k τ δ αβ
]
−ϵαβστ ϵαβγδ pσ k τ Kγ Pδ =
[ ]
= 64 2(pK)(kP ) + 2(pP )(kK) + 2(δσγ δτδ − δτγ δσδ )pσ k τ Kγ Pδ =
= 64 [2(pK)(kP ) + 2(pP )(kK) + 2(pK)(kP ) − 2(pP )(kK)] =
= 256 (pK)(kP ) ≡ 64 (2pK)(2kP ) (3.1462)

da cui, evidentemente, per la (3.1448), otteniamo che

G2F (e) αβ
|M|2 = Lαβ · L(µ) = 128 G2F (pK)(kP ) = 32 G2F (2pK)(2kP ) (3.1463)
2
Questo risultato è molto più generale di quanto non possa apparire a prima
vista. Infatti, per un qualunque decadimento debole

A → B + c + d¯ (3.1464)

descritto quindi dal seguente termine nella densità lagrangiana del processo
GF ( )( )
L(x) = √ ψ̄B γ α (1 − γ5 )ψA ψ̄c γ α (1 − γ5 )ψd (3.1465)
2
si arriva comunque all’espressione

|M|2 = 128 G2F (PA Pd )(Pc PB ) (3.1466)

la quale resta della stessa forma anche per i processi ottenuti dalla (3.1464) per
crossing, dato che anche questi sono descritti dalla stessa densità lagrangiana
(3.1465) ed i tensori L descritti sopra restano formalmente identici (l’unica dif-
ferenza essendo che l’impulso della particella x nella (3.1466) può diventare, in
un processo coniugato per crossing, quello di x̄).
Veniamo adesso allo spazio delle fasi invariante dΦ per il decadimento (3.1441).
Dalla definizione abbiamo che
d3 K d3 k d3 p
dΦ = (2π)4 δ 4 (P − p − k − K) =
(2π)3 2EK (2π)3 2Ek (2π)3 2Ep
1 d3 K d3 k d3 p
= δ 4
(P − p − k − K) (3.1467)
(2π)5 2EK 2Ek 2Ep

dove P , K, p, k sono, rispettivamente, i quadrimpulsi del muone, del suo neu-


trino, dell’elettrone e del suo (anti)neutrino.

254
Riguardo adesso alla larghezza di decadimento dΓ di cui alla (3.1446), siccome
i due neutrini non sono osservati, possiamo integrare sui loro impulsi, ottenendo
1
dΓ = |M|2 dΦ →
4M
1 d3 p ∫ d3 K d3 k 1
→ 5
δ 4 (P − p − k − K) 128 G2F pα Pβ K α k β =
4M 2Ep 2EK 2Ek (2π)
∫ 3
32 GF 1 d3 p
2
d K d3 k α β 4
= pα P β K k δ (P − p − k − K) (3.1468)
M (2π)5 2Ep 2EK 2Ek

Definiamo adesso il momento trasferito dal muone all’elettrone, i.e. il quadrivet-


tore

q ≡P −p (3.1469)

il quale, per la presenza della delta di conservazione corrisponde, evidentemente,


al quadrimpulso totale252 associato al sistema dei due neutrini, i.e.

q =P −p=k+K (3.1470)

Poniamo quindi

d3 K d3 k α β 4
I αβ
≡ K k δ (q − k − K) (3.1471)
2EK 2Ek
Questo tensore, che ha le dimensioni del quadrato di un’energia, può dipendere
solo dal quadrivettore q, dunque soltanto dalle quantità q 2 δ αβ e q α q β .
Queste due quantità non sono ortogonali fra loro nella metrica di Minkowski,
per cui, per l’analisi del tensore I αβ , è preferibile usare le due quantità seguenti,
linearmente dipendenti dalle precedenti ma tra loro ortogonali253

q 2 δ αβ + 2 q α q β ; q 2 δ αβ − 2 q α q β (3.1472)

Da quanto sopra segue dunque che possiamo scrivere

I αβ = A(q 2 δ αβ + 2 q α q β ) + B(q 2 δ αβ − 2 q α q β ) (3.1473)

dove A e B devono essere quantità scalari e anche adimensionali, dunque sem-


plicemente degli opportuni coefficienti numerici.
252
Essendo k e K quadrivettori time-like con parte temporale positiva, ne segue sia che
q 0 = Ek + EK > 0 come pure che q 2 ≥ 0.
253
Infatti
( 2 αβ )( )
q δ + 2 q α q β q 2 δαβ − 2 qα qβ = 4 (q 2 )2 − 2 (q 2 )2 + 2 (q 2 )2 − 4 (q 2 )2 = 0

255
Per esplicitare questi coefficienti, cominciamo moltiplicando la (3.1473) per la
quantità q 2 δαβ − 2 qα qβ . Si ha
( )
I αβ (q 2 δαβ − 2 qα qβ ) = (q 2 δαβ − 2 qα qβ ) A(q 2 δ αβ + 2 q α q β ) + B(q 2 δ αβ − 2 q α q β ) =
( )
= B 4(q 2 )2 + 4(q 2 )2 − 4(q 2 )2 = 4B (q 2 )2 (3.1474)

D’altronde

d3 K d3 k α β 2
I αβ (q 2 δαβ − 2 qα qβ ) = K k (q δαβ − 2 qα qβ ) δ 4 (q − k − K) (3.1475)
2EK 2Ek
ma

K α k β (q 2 δαβ − 2 qα qβ ) = q 2 (kK) − 2(qK)(qk) (3.1476)

Assumiamo senz’altro che i neutrini abbiano entrambi massa nulla: si ha dunque


che

q 2 = (k + K)2 = K 2 + k 2 + 2(kK) = 2(kK) (3.1477)

mentre

qK = (k + K) · K = (kK) + K 2 = (kK) (3.1478)


qk = (k + K) · k = k 2 + (kK) = (kK) (3.1479)

per cui, in definitiva, risulta

K α k β (q 2 δαβ − 2 qα qβ ) = q 2 (kK) − 2(qK)(qk) = 2(kK)2 − 2(kK)2 = 0 (3.1480)

e quindi se ne conclude che il coefficiente B nella (3.1473) è nullo.


Se la massa dei neutrini è nulla, il tensore I αβ è dunque del tipo

I αβ = A(q 2 δ αβ + 2 q α q β ) (3.1481)

e, per conoscere il valore della costante numerica A possiamo procedere di nuovo


moltiplicando il tensore stesso per (q 2 δαβ + 2 qα qβ ) e ricordando che

(q 2 δ αβ + 2 q α q β )(q 2 δαβ + 2 qα qβ ) = 4 (q 2 )2 + 2 q 2 q 2 + 2 q 2 q 2 + 4 q 2 q 2 = 12(q 2 )2 (3.1482)

Si ha allora

12A(q 2 )2 = I αβ (q 2 δαβ + 2 qα qβ ) =
∫ 3
d K d3 k α β 2
= K k (q δαβ + 2 qα qβ ) δ 4 (q − k − K) (3.1483)
2EK 2Ek

256
Ma per quanto visto prima, sempre nell’ipotesi che i neutrini abbiano massa nulla,
risulta
K α k β (q 2 δαβ + 2 qα qβ ) = q 2 (kK) + 2(qK)(qk) = 2(kK)2 + 2(kK)2 =
= 4 (kK)2 = (q 2 )2 (3.1484)
D’altronde q = P − p non dipende dalle variabili di integrazione k e K, quindi

d3 K d3 k 4
2 2
12 A (q ) = (q ) 2 2
δ (q − k − K)
2EK 2Ek
∫ 3
d K d3 k 4
⇒ 12 A = δ (q − k − K) (3.1485)
2EK 2Ek
Integrando sull’impulso spaziale dell’antineutrino elettronico d3 k, otteniamo al-
lora

d3 K 1
12 A = δ(q 0 − EK − Ê) =
2EK 2Ê
∫ 3
dK 1
= δ(q 0 − |K|
⃗ − |⃗q − K|)
⃗ (3.1486)
2|K| 2|⃗q − K|
⃗ ⃗

dove abbiamo tenuto conto che l’energia del neutrino muonico (masse dei neu-
trini nulle) è pari a EK = |K|,⃗ mentre quella dell’antineutrino elettronico Ê,
anch’essa pari al modulo del suo impulso spaziale, per via dell’integrazione in
d3 k in presenza della delta di conservazione degli impulsi spaziali, ha condotto
all’identificazione ⃗k = ⃗q − K⃗ e dunque ad Ê ≡ |⃗q − K|.

L’integrale (3.1486) è uno scalare di Lorentz (un numero reale ...) e dunque
può essere valutato indifferentemente in qualsiasi sistema di riferimento. Scegliamo
quello del CM del sistema dei due neutrini, nel quale, evidentemente ⃗q = 0 e
dunque K ⃗ = −⃗k ⇒ |K| ⃗ = |⃗k|.
In questo riferimento allora la (3.1486) diviene

d3 K
12 A = δ(q 0 − 2|K|)
⃗ (3.1487)

4|K| 2

Passando adesso in coordinate polari e ponendo x = |K|,


⃗ abbiamo254,255
∫ ∞ 1 ∫ 4π ∫ ∞ π
12 A = x2 dx 2
dΩ δ(q 0
− 2x) = dx δ(q 0 − 2x) = ⇒
0 4x 4 0 2
π
⇒A= (3.1495)
24
254
Si ricordi che q 0 , in quanto somma delle energie dei due neutrini, è certamente positivo.
255
Se non avessimo fatto l’ipotesi di lavorare nel sistema di riferimento dove i due neutrini
hanno impulsi uguali ed opposti, allora l’integrale da fare sarebbe comunque stato il seguente
∫ 3
d K 1
12 A = δ(q 0 − |K|
⃗ − |⃗q − K|)
⃗ (3.1488)
2|K| 2|⃗q − K|
⃗ ⃗

257
e dunque, finalmente, risulta

d3 K d3 k α β 4
I αβ
= K k δ (q − k − K) = A(q 2 δ αβ + 2 q α q β ) =
2EK 2Ek
π 2 αβ
= (q δ + 2 q α q β ) (3.1496)
24
che, in coordinate polari, prendendo ⃗q come asse polare e ponendo x ≡ |K|
⃗ ed y = |⃗q|, diviene
∫ ∞ 2 ∫ ( √ )
x dx 1
12 A = dΩ √ δ q 0 − x − x2 + y 2 − 2xy cosθ (3.1489)
0 2x 2 x2 + y 2 − 2xy cosθ

Consideriamo adesso l’argomento della delta, fissato l’angolo polare θ, come funzione di x.
Come sappiamo, nel caso in cui la funzione f (x) abbia un unico zero per x = x̄, allora risulta

dx
δ(f (x) dx = dz δ(z) (3.1490)
df f (x̄)=0

per cui serve di conoscere dove la funzione f si annulla, i.e. risolvere l’equazione

f (x̄) = 0 ⇒ q 0 − x = x2 + y 2 − 2xy cosθ ⇒
⇒ (q 0 )2 + x2 − 2q 0 x = x2 + y 2 − 2xy cosθ ⇒
(q 0 )2 − y 2
⇒ (q 0 )2 − y 2 = 2x(q 0 − y cosθ) ⇒ x̄ = (3.1491)
2(q 0 − y cosθ)

Quanto poi alla derivata, evidentemente è



f (x) = q 0 − x − x2 + y 2 − 2xy cosθ ⇒
df y cosθ − x
= −1 + √ (3.1492)
dx x2 + y 2 − 2xy cosθ

la quale, calcolata per x = x̄, diviene



df y cosθ − x y cosθ − q 0
= −1 + = (3.1493)
dx x=x̄ q −x
0 q0 − x

e dunque
∫ ∞ ∫ ( √ )
x2 dx 1
12 A = dΩ √ δ q 0 − x − x2 + y 2 − 2xy cosθ =
0 2x 2 x2 + y 2 − 2xy cosθ
∫ ∫
1 1 1 1 q 0 − x̄
= dΩ x dx √ δ(f (x)) = dΩ x̄ 0 =
4 x2 + y 2 − 2xy cosθ 4 q − x̄ y cosθ − q 0
∫ ∫ −1
1 (q 0 )2 − y 2 2π 0 2 1
= − dΩ = − ((q ) − y ) 2
d(−cosθ) 0 =
4 2(q − y cosθ)
0 2 8 1 (q − y cosθ)2
∫ ( )[ ]
2π ( 0 2 ) 1 1 2π ( 0 2 ) 1 1 1
= (q ) − y 2 dz 0 = (q ) − y 2
− − =
8 −1 (q + yz)2 8 y q0 + y q0 − y
( )
2π ( 0 2 ) 1 −2y 4π π π
= (q ) − y 2 − = = ⇒ A= (3.1494)
8 y (q 0 )2 − y 2 8 2 24

in accordo con la (3.1495).

258
Sostituendo allora nella espressione (3.1468) della larghezza di decadimento l’espressione
di cui sopra, abbiamo

32 G2F 1 d3 p d3 K d3 k α β 4
dΓ = p P
α β K k δ (P − p − k − K) =
M (2π)5 2Ep 2EK 2Ek
32 G2F 1 d3 p π
= 5
pα Pβ (q 2 δ αβ + 2 q α q β ) =
M (2π) 2Ep 24
2 3 ( )
GF 1 π d p 2
= q (pP ) + 2(qp)(qP ) =
M π 5 24 2Ep
G2F d3 p ( 2 )
= q (pP ) + 2(qp)(qP ) (3.1497)
24π 4 M 2Ep
D’altronde, nel riferimento del CM del muone dove stiamo valutando dΓ, detta
E ≡ Ep l’energia dell’elettrone, possiamo scrivere

(pq) = p(P − p) = (pP ) − m2 = EM − m2 ≈ EM (3.1498)


(pP ) = EM (3.1499)
q2 = (P − p)(P − p) = M 2 + m2 − 2(pP ) ≈ M 2 − 2EM (3.1500)
(qP ) = (P − p)P = M 2 − pP = M 2 − EM (3.1501)

e quindi, sostituendo, risulta


G2F d3 p [( 2 ) ( )]
dΓ = M − 2EM EM + 2EM M 2 − EM =
24π 4 M 2E
G2F d3 p [ ]
= 3EM 3 − 4(EM )2 (3.1502)
24π 4 M 2E
da cui, semplificando, passando in coordinate polari ed integrando sulle variabili
angolari, ricaviamo
G2F d3 p [ ] G2F [ ]
dΓ = 3EM 3
− 4(EM ) 2
= p 2
dp dΩ 3M 2
− 4EM =
24π 4 M 2E 48π 4
G2F 2 [ ] G2F [ ]
= p dp 3M 2
− 4EM ≈ 3M 2
− 4EM E 2 dE (3.1503)
12π 3 12π 3
dove l’ultimo passaggio è fatto nell’ipotesi, di nuovo, di poter confondere l’impulso
p con l’energia E dell’elettrone.
Definiamo adesso il parametro adimensionale ϵ nel modo seguente
2E Mϵ 2 M
ϵ≡ ⇔E= → dϵ = dE ⇔ dE = dϵ (3.1504)
M 2 M 2
Esso puo variare solo fra 0 ed 1, essendo l’energia massima dell’elettrone nel CM
quella per cui i due neutrini sono colineari e dunque tali da possedere, insieme, una
energia pari al modulo del loro impulso, uguale peraltro a quello dell’elettrone,

259
i.e. a p = E = M/2.
Sostituendo ϵ nell’espressione della larghezza di decadimento (3.1503), si ha infine
[ ]( )
G2F [ ] G2F Mϵ Mϵ 2 M
dΓ = 3M − 4EM E dE =
2 2
3M − 4M
2
dϵ =
12π 3 12π 3 2 2 2
G2F 3 1 2 G2F
= 3
M 2
[3 − 2ϵ]M ϵ dϵ = 3
M 5 [3 − 2ϵ] ϵ2 dϵ (3.1505)
12π 8 96π
D’altronde, posto f (ϵ) ≡ (3 − 2ϵ) ϵ2 , abbiamo che
∫ ∫ 1
ϵ3 ϵ4 1 1
1
f (ϵ) dϵ = [3 − 2ϵ] ϵ dϵ = 3 ·
2
0 − 2 · = 1 − =

(3.1506)
3 4 0 2 2

quindi, quanto alla larghezza complessiva Γ del decadimento, possiamo concludere


che essa vale

G2F 1
Γ= M 5 [3 − 2ϵ] ϵ2 dϵ = G2 M 5 (3.1507)
96π 3 192π 3 F
Nel sistema di riferimento in cui il muone decade a riposo, lo spettro dell’energia

Figure 17: Distribuzione dell’energia dell’elettrone di decadimento del mu

dell’elettrone emesso è descritto in fig.17 dalla funzione f (ϵ) ≡ f (2E/M ), in


ottimo accordo con i risultati sperimentali256 ottenuti originariamente dal gruppo
di M.Bardon et al. al sincrociclotrone di Nevis (NY Columbia University), per
quanto concerne il decadimento del muone positivo.

256
M. Bardon, P. Norton, J. Peoples, A.M. Sachs, J. Lee Franzini: Measurement of the mo-
mentum spectrum of positrions from muon decay; Phys. Rev. Lett. 14, 449 (1965)

260
A Appendix: Generalità
A.1 Le unità di misura
Il sistema di unità di misura di cui faremo uso, se non altrimenti specificato, è il
sistema cgs es (di Gauss) ed esso fornisce i seguenti valori delle costanti universali
1
più comuni (1 ues = 2997924580 coulomb, 1 erg = 10−7 J)

carica dell′ elettrone e = 4.8032 × 10−10 ues


massa dell′ elettrone m = 9.1095 × 10−28 g
h
costante di P lanck h̄ = = 1.05457266 × 10−27 erg · s

velocita′ della luce c = 2.99792458 × 1010 cm/s

Comunque, siccome questo sistema di unità di misura non è sempre di pratica


applicazione in fisica nucleare e subnucleare, in quanto le sue unità di misura
sono spesso troppo grandi per la descrizione di sistemi di particelle,
• per quel che riguarda le distanze, useremo spesso il f ermi (equivalente al
f emtometro, definito quindi come

1 f ermi = 1 f m = 10−13 cm = 10−15 m = 10−5 Ångstrom;

• per l’energia, useremo l’elettronvolt (ed i suoi multipli), legato al sistema


cgs ed SI dalla equivalenza

1 eV = 1.60219 · 10−12 erg = 1.60219 · 10−19 J;

• per le masse delle particelle, invece dei grammi, useremo gli eV


c2
e relativi
multipli, per cui la massa dell’elettrone, per esempio, è
erg −7 erg M eV
me = 9.1095 · 10−28 · (2.99792458 · 1010 )2 = 8.187 · 10 = 0.511
c2 c2 c2
poi, siccome molto spesso, sarà più comodo porre c = 1, scriveremo anche

me = 0.511 M eV ;

• per l’impulso, coerentemente con quanto sopra, useremo spesso le unità eVc
e relativi multipli. In questo modo, un elettrone che abbia una velocità v,
possiede un impulso257
M eV
p = mv = mc β = 0.511 β .
c
257
Se β ≡ v/c ≈ 1, allora, in realtà, come è dimostrato nel testo, p = mc γ β, dove
γ = (1 − β 2 )−1/2 , comunque, è un numero puro e quindi senza dimensioni.

261
Nel sistema cgs es (di Gauss), le equazioni di Maxwell nel vuoto si scrivono
nel modo seguente

⃗ = 4π ρ;
div E ⃗ =
rotE − 1c ∂∂tB
⃗ = 0; ⃗ (A.1)
div B ⃗ =
rotB 4π ⃗
J + 1c ∂∂tE
c

e la costante di struttura fina α è data da


e2
α= (A.2)
h̄ c
Per confronto, invece, nel Sistema Internazionale (SI) ed in quello di Heaviside-
Lorentz (HL) risulta258
( ) ( ) ( )
e2 e2 e2 1
α= = = = (A.4)
4πϵ0 h̄c SI
4π h̄c HL
h̄c Gauss
137.035 099 76

Ricordiamo infine che, sempre nel SI, i prefissi relativi ai multipli e sottomul-
tipli delle unita di misura sono i seguenti:

Figure 18: Prefissi nel Sistema Internazionale

258
Ricordiamo√ che nel sistema HL i campi e le cariche sono quelli del sistema cgs di Gauss,
ma divisi per 4π, e dunque le equazioni di Maxwell si scrivono nel modo seguente


div E = ρ; ⃗
rotE− 1c ∂∂tB=
⃗ ⃗ (A.3)
div B = 0; 1 ⃗

rotB 1 ∂E
=
c J + c ∂t

√ ( 2)
Siccome qHL ≡ 4π qcgs , se h̄ = c = 1, ne segue appunto che α = 4π e
.
HL

262
A.2 Le notazioni
La convenzione sugli indici che seguiremo è quella usata nel libro Relativistic
Quantum Mechanics di Bjorken e Drell. Gli indici greci (α, β, ..) vanno da 0 a
3, mentre gli indici italici (i, j, ..) vanno da 1 a 3.

Il tensore metrico gµν ≡ δµν = δ µν ≡ g µν è tale che


δ 00 = +1 δ 11 = δ 22 = δ 33 = −1 (A.5)
ed il prodotto scalare di due quadrivettori p e q è indicato semplicemente con il
simbolo pq, oppure (pq), se il simbolo senza parentesi può dar luogo ad errori di
interpretazione
pq ≡ pµ qµ ≡ pµ δµν q ν (A.6)
Dato un quadrivettore p, rappresenteremo poi con p2 la sua lunghezza invariante
p2 ≡ (p p) = pµ pµ (A.7)
che, come è noto, può essere sia positiva che negativa o nulla.

L’operatore di D’Alembert è definito come


∂2 ∂ ∂
2 ≡ ∂µ ∂ µ = ∂02 − ∇2 = 2
− (A.8)
∂t ∂xi ∂xi
Per quanto riguarda, poi, le matrici γ µ di Dirac, ricordiamo che esse soddisfano
le seguenti condizioni generali:
2
(γ 0 ) = I (A.9)
0 †
(γ ) = γ 0 (A.10)
(γ µ )† = γ 0 γ µ γ 0 (A.11)
{γ µ , γ ν } = 2δ µν (A.12)

Per definizione poi, se p è un quadrivettore, allora


pµ γµ = pµ γ µ ≢ p (A.13)
La matrice γ5 è definita dal prodotto
γ5 = iγ 0 γ 1 γ 2 γ 3 (A.14)
e risulta
{γ5 , γ µ } = 0 (A.15)
(γ5 )† = γ5 (A.16)
(γ5 )2 = I (A.17)

263
mentre
1 µ ν
σ µν ≡ [γ , γ ] (A.18)
2i
Dove necessario, adotteremo la rappresentazione di Pauli-Dirac delle matrici γ,
i.e.
( ) ( )
I 0 0 σi
γ0 = γi = (A.19)
0 −I −σi 0
dove σi sono le usuali matrici di Pauli, i.e.
( ) ( ) ( )
0 1 0 −i 1 0
σ1 = , σ2 = , σ3 = (A.20)
1 0 i 0 0 −1
In questa rappresentazione, γ5 è data da
( )
0 I
γ5 = (A.21)
I 0
Per quanto concerne, poi, le tracce delle matrici γ, risulta

a) T r{γ µ } = 0 = T r{γ5 } (A.22)


b) T r{γ µ γ ν } = 4 δ µν (A.23)
c) T r{γ µ1 ...γ µ2n+1 } = 0 (A.24)
d) T r{γ µ1 ...γ µ2n } =
δ µ1 µ2 T r{γ µ3 ...γ µ2n } − δ µ1 µ3 T r{γ µ2 γ µ4 ...γ µ2n }
+...δ µ1 µ2n T r{γ µ2 ...γ µ2n−1 } (A.25)

da cui si ha

e) T r{γ α γ β γ µ γ ν } = 4(δ αβ δ µν + δ αν δ βµ − δ αµ δ βν ) (A.26)

Se, fra le γ c’è anche γ5 , allora

f ) T r{γ µ1 ...γ µ2n+1 γ5 } = 0 (A.27)

ed inoltre si ha

g) T r{γ µ γ ν γ5 } = 0 (A.28)
h) T r{γα γβ γµ γν γ5 } = 4i ϵαβµν (A.29)

dove il tensore completamente antisimmetrico ϵαβµν è cosı̀ definito:

ϵαβµν = +1 se α, β, µ, ν sono una permutazione pari di 0, 1, 2, 3


ϵαβµν = −1 se α, β, µ, ν sono una permutazione dispari di 0, 1, 2, 3
ϵαβµν = 0 negli altri casi

264
e perciò, data la definizione di sopra, abbiamo259

ϵ0123 = 1 (A.30)

Passiamo adesso alla dimostrazione di quanto sopra affermato.


La (A.22) è del tutto evidente dalle definizioni (A.19) e (A.21).
Passiamo quindi alla (A.23). Per la proprietà della ciclicità della traccia per cui

T r{A B} = T r{B A}

e per la (A.12), si ha
1 1
T r{γ µ γ ν } = T r{γ µ γ ν + γ ν γ µ } = 2 δ µν T r{I} = 4 δ µν
2 2
Veniamo quindi alla (A.24).
Ricordiamo a questo proposito che γ52 = I, per cui, sempre per la proprietà ciclica
della traccia, si ha

T ≡ T r{γ µ1 ...γ µ2n+1 } = T r{γ µ1 ...γ µ2n+1 γ5 γ5 } = T r{γ5 γ µ1 ...γ µ2n+1 γ5 }

Usando adesso la (A.15), si ha appunto che

T = (−1)T r{γ5 γ µ1 ...γ5 γ µ2n+1 } = (−1)2n+1 T r{γ5 γ5 γ µ1 ...γ µ2n+1 } = −T


⇒ T =0

Passiamo ora a dimostrare la (A.25).


Premettiamo a questo riguardo una osservazione. Sia Γ il prodotto di varie ma-
trici γ, allora, visto che dalla (A.12) sappiamo che

γ µ γ ν Γ = −γ ν γ µ Γ + 2 δ µν IΓ = −γ ν γ µ Γ + 2 δ µν Γ

ne segue che risulta

T r{γ µ γ ν Γ} = −T r{γ ν γ µ Γ} + 2δ µν T r{Γ}


259
Si osservi che, per la regola consueta relativa all’innalzamento/abbassamento degli indici
quadrivettoriali operato dal tensore metrico, data la (A.5), la (A.30) implica che ϵ0123 = −1 .
Si osservi altresı̀ che, a differenza del tensore a tre indici ϵijk , una permutazione ciclica non
mantiene la parità iniziale. Per esempio, mentre (0123) è ovviamente pari, (1230) è dispari,
come ci si può convincere facilmente visto che si può passare da (1230) a (0123) solo con tre
permutazioni successive, i.e.

(1230) → (1203) → (1023) → (0123)

265
Veniamo allora alla (A.25): si ha
T ≡ T r{γ µ1 γ µ2 ...γ µ2n } = −T r{γ µ2 γ µ1 ...γ µ2n } + 2δ µ1 µ2 T r{γ µ3 ...γ µ2n } =
= (−1)2 T r{γ µ2 γ µ3 γ µ1 ...γ µ2n } − 2δ µ1 µ3 T r{γ µ2 γ µ4 ...γ µ2n } + 2δ µ1 µ2 T r{γ µ3 ...γ µ2n } =
= (−1)2n−1 T r{γ µ2 γ µ3 ...γ µ2n γ µ1 } + 2δ µ1 µ2 T r{γ µ3 ...γ µ2n } −
−2δ µ1 µ3 T r{γ µ2 γ µ4 ...γ µ2n } + ... + 2δ µ1 µ2n T r{γ µ2 γ µ3 ...γ µ2n−1 }
ovvero, usando la proprietà ciclica della traccia sul primo termine del secondo
membro, si ottiene, finalmente, il risultato (A.25), i.e. appunto che
T r{γ µ1 γ µ2 ...γ µ2n } = δ µ1 µ2 T r{γ µ3 ...γ µ2n } − δ µ1 µ3 T r{γ µ2 γ µ4 ...γ µ2n } +
+... + δ µ1 µ2n T r{γ µ2 γ µ3 ...γ µ2n−1 }
Evidentemente la (A.26) è un caso particolare della (A.25).
Veniamo ora alla (A.27).
Essa discende direttamente dalla proprietà ciclica della traccia, unita alla (A.15).
Infatti si ha
T ≡ T r{γ µ1 ...γ µ2n γ µ2n+1 γ5 } = (−1)T r{γ µ1 ...γ µ2n γ5 γ 2n+1 } =
= (−1)2n+1 T r{γ5 γ µ1 ...γ µ2n+1 } = −T
⇒ T r{γ µ1 ...γ µ2n γ µ2n+1 γ5 } = 0
Quanto alla (A.28), essa non è cosı̀ ovvia.
Per dimostrarla occorre ripartire dalla definizione della matrice γ5 , i.e.
γ5 ≡ iγ 0 γ 1 γ 2 γ 3
ed osservare che da questa discende che
i
γ5 == ϵµνρσ γ µ γ ν γ ρ γ σ (A.31)
4!
infatti, per la definizione del tensore completamente antisimmetrico ϵµνρσ solo
prodotti di quattro matrici γ con indici differenti fra loro potranno comparire
al secondo membro della (A.31). Ne segue allora che gli indici delle stesse cos-
tituiranno necessariamente una permutazione degli indici (0, 1, 2, 3). Siccome
matrici γ con indici differenti anticommutano, il prodotto delle quattro matrici
potrà sempre essere ricondotto al prodotto γ 0 γ 1 γ 2 γ 3 (−1)S con un numero di
scambi S che sarà pari se la permutazione di partenza era pari, mentre sarà dis-
pari nell’altro caso.
Dunque, ciascun addendo della somma ϵµνρσ γ µ γ ν γ ρ γ σ è esattamente uguale
a γ 0 γ 1 γ 2 γ 3 . Siccome le permutazioni possibili sono, ovviamente, 4!, la (A.31)
risulta cosı̀ dimostrata.
Usando un argomento analogo, si prova anche che
i
γ5 γτ = ϵµνρτ γ µ γ ν γ ρ (A.32)
3!

266
Infatti, per quanto detto sopra in relazione alla (A.31), segue evidentemente che
i ∑
γ5 = ϵµνρx γ µ γ ν γ ρ γ x (A.33)
3! µνρ

dove, x è un indice generico su cui, però, non si somma...


Identificando dunque l’indice x con l’indice τ e moltiplicando ambo i membri
della (A.33) per γτ , senza sommare su questo indice, si ha
i ∑
γ5 γτ = ϵµνρτ γ µ γ ν γ ρ (γ τ γτ ) (A.34)
3! µνρ

Però risulta
γ 0 γ0 = γ 1 γ1 = γ 2 γ2 = γ 3 γ3 = I
quindi dalla (A.34) segue immediatamente la (A.32).
Veniamo cosı̀ a dimostrare la (A.28). Si ha
i
T r{γµ γν γ5 } = T r{γν γ5 γµ } = T r{γν · ϵαβρµ γ α γ β γ ρ } =
3!
i
= ϵαβρµ T r{γν γ α γ β γ ρ }
3!
ovvero, per la (A.26)
i
T r{γµ γν γ5 } = ϵαβρµ {δνα δ βρ − δνβ δ αρ + δνρ δ αβ } (A.35)
3!
per cui, data la completa antisimmetria del tensore ϵαβρµ , la quantità al secondo
membro della (A.35) è evidentemente nulla e dunque la (A.28) è provata.
Dimostriamo infine la (A.29). Occorre dimostrare che

T r{γα γβ γµ γν γ5 } = 4i ϵαβµν

Consideriamo la matrice Γ = γα γβ γµ γν . Se fra gli indici α, β, µ, ν ci sono


almeno due indici uguali, usando le proprietà di anticommutazione fra matrici γ
diverse ed il fatto che, qualunque sia l’indice x, γ x γx = I (non si somma sull’indice
x ...) ecco che la matrice Γ si semplifica nel prodotto di solo due matrici gamma
(di indice diverso) o, addirittura, nell’identità. Ma siccome

T r{γµ γν γ5 } = 0 = T r{γ5 }

la (A.29), in questo caso, risulta soddisfatta.


Supponiamo allora che i quattro indici siano tutti differenti. Evidentemente, in
questo caso essi costituiscono una permutazione opportuna di (0, 1, 2, 3).
Indichiamo questi indici differenti con µ0 , µ1 , µ2 , µ3 invece che con α, β, µ, ν :
per quanto detto precedentemente, risulta

γ5 = i ϵµ0 µ1 µ2 µ3 γ µ0 γ µ1 γ µ2 γ µ3

267
dove è inteso che non si somma su alcun indice. Ne segue allora che

γα γβ γµ γν · γ5 = i ϵµ0 µ1 µ2 µ3 γα γβ γµ γν · γ µ0 γ µ1 γ µ2 γ µ3
≡ i ϵµ0 µ1 µ2 µ3 γµ0 γµ1 γµ2 γµ3 · γ µ0 γ µ1 γ µ2 γ µ3

Ma siccome, per ipotesi, µ0 ̸= µ1 , µ0 ̸= µ2 , µ0 = ̸ µ3 , e, come abbiamo già


x
osservato, qualunque sia l’indice x risulta che γx γ = I, si ha

Γ = γµ0 γµ1 γµ2 γµ3 · γ µ0 γ µ1 γ µ2 γ µ3 = −γµ0 γµ1 γµ2 γ µ0 γµ3 γ µ1 γ µ2 γ µ3 =


= γµ0 γµ1 γ µ0 γµ2 γµ3 γ µ1 γ µ2 γ µ3 = −γµ0 γ µ0 γµ1 γµ2 γµ3 γ µ1 γ µ2 γ µ3 =
= −γµ1 γµ2 γµ3 γ µ1 γ µ2 γ µ3

e, continuando, siccome µ1 ̸= µ2 , µ1 ̸= µ3 , ne segue che

Γ = −γµ1 γµ2 γµ3 γ µ1 γ µ2 γ µ3 = −γµ1 γ µ1 γµ2 γµ3 γ µ2 γ µ3 = −γµ2 γµ3 γ µ2 γ µ3 =


= γµ2 γ µ2 γµ3 γ µ3 = I

e dunque

γµ0 γµ1 γµ2 γµ3 · γ5 = i ϵµ0 µ1 µ2 µ3 I

per cui, finalmente, ricordando che (µ0 , µ1 , µ2 , µ3 ) ≡ (α, β, µ, ν), risulta di-
mostrato che

T r{γα γβ γµ γν · γ5 } = 4i ϵαβµν

268
A.3 Su alcune rappresentazioni finite di SO(n) ed SO(n,m)
Il gruppo delle rotazioni in tre dimensioni è il gruppo SO(3), mentre il gruppo di
Lorentz ortocrono proprio L↑+ ha la struttura di SO(1, 3): da qui l’interesse per
le rappresentazioni dei gruppi SO(n) ed SO(n, 1) per le quali risulta particolar-
mente rilevante la struttura di algebra di Clifford260 .

SO(n)
Iniziamo intanto dalla definizione stessa del gruppo SO(n): si tratta del
gruppo ortogonale speciale delle matrici reali n × n, i.e.
{ }
A ∈ SO(n) ⇔ (A · At = I) ∧ (det A = +1)
⇒ At = A−1 (A.37)
Queste matrici costituiscono la falda connessa con l’identità delle rotazioni in
n−dimensioni e si possono rappresentare in forma esponenziale nel modo seguente
A = e−iH (A.38)
dove H è una opportuna matrice n × n immaginaria pura, tale che
T r(H) = 0 (det(A) = 1 ⇔ T r(H) = 0)
H = −H i.e. H = H
t +
(At = A−1 ⇔ H t = −H)
E’ del tutto evidente, allora, che una possibile base per le matrici H può
essere senz’altro la seguente (qui e nel seguito, fino a diverso avviso, la δ è quella
di Kronecker e la posizione degli indici in alto o in basso è quindi irrilevante)
( ) ( )
H ij = i δai δbj − δbi δaj (A.39)
ab

dove, evidentemente, H ij = −H ji e la dimensione della base è n(n − 1)/2.


In questo modo possiamo parametrizzare gli elementi A ∈ SO(n) nel modo
seguente
A = e− 2 ωij H
i ij
(A.40)
dove ωij è una opportuna matrice reale antisimmetrica in cui sono, appunto,
”organizzati” i parametri del gruppo.
Venendo adesso[ all’algebra
] di Lie di SO(n), essa è evidentemente definita dai
ij kl
commutatori H , H .
260
Senza entrare nei dettagli specifici della teoria delle algebre di Clifford, ricordiamo solo
che, dato uno spazio vettoriale V sul corpo complesso fatto di operatori, allora se accade che,
essendo {Γi } una base dello spazio, risulta
{Γi , Γj } = gij I (A.36)
dove gij è una opportuna matrice simmetrica, a valori in generale complessi, ecco che lo spazio
di operatori in questione acquista la struttura di algebra di Clifford.

269
Si ha
[ ] ( ) ( ) ( ) ( )
H ij , H kl = H ij H kl − H kl H ij =
ab
{( )ac( cb
) ( ac cb
)( )}
= i2 δai δcj − δci δaj δck δbl − δbk δcl − δak δcl − δc δa δci δbj
k l
− δbi δcj =
{ ( )}
= i2 δai δbl δjk − δai δbk δjl − δaj δbl δik + δaj δbk δil − δak δbj δil − δak δbi δ jl − δal δbj δik + δal δbi δkj =
{ ( ) ( ) ( ) ( )}
= i2 δjk δai δbl − δal δbi − δjl δai δbk − δak δbi − δik δaj δbl − δal δbj + δil δaj δbk − δak δbj =
{ ( ) ( ) ( ) ( ) }
= i δjk H il − δjl H ik − δik H jl + δil H jk =
ab ab ab ab
{ }
= −i δjk H li + δjl H ik + δik H jl + δil H kj
ab

[ ] { }
⇒ H ij , H kl = −i δik H jl + δjl H ik − δil H jk − δjk H il (A.41)

Supponiamo adesso che sia dato uno spazio lineare sul corpo complesso gen-
erato da n operatori indipendenti Γi , che ne costituiscono quindi una base. Sup-
poniamo inoltre che questi operatori definiscano un’algebra di Clifford attraverso
la relazione

{Γi , Γj } = 2 δij I i, j = 1, ...., n (A.42)

dove I è l’identità nell’algebra definita dagli operatori Γ mentre la δ è, di nuovo,


la delta di Kronecker.
Possiamo dimostrare che, in questo caso
• è definita in modo naturale una rappresentazione S = S(G) del gruppo
SO(n) i cui generatori sono gli n × (n − 1)/2 operatori cosı̀ definiti
i
M ij ≡ Mij = [Γi , Γj ] ≡ −M ji (A.43)
4

• gli operatori Γi si trasformano sotto S(G) secondo la rappresentazione vet-


toriale, i.e., qualunque sia G ∈ SO(n), risulta

S(G) Γi S −1 (G) = Gji Γj (A.44)

Allo scopo di provare queste due affermazioni, iniziamo dimostrando che

[Mij , Γk ] = i (Γi δjk − Γj δik ) (A.45)

Risulta infatti
i i
[Mij , Γk ] = [[Γi , Γj ] , Γk ] ≡ {[Γi Γj , Γk ] − [Γj Γi , Γk ] } (A.46)
4 4
D’altronde ricordiamo che, in generale, risulta

[A B, C] = A [B, C] + [A, C] B (A.47)

270
e dunque
i
{Γi [Γj , Γk ] + [Γi , Γk ] Γj − Γj [Γi , Γk ] − [Γj , Γk ] Γi }
[Mij , Γk ] = (A.48)
4
D’altronde, sempre in generale, è
[A, B] ≡ A B − B A = A B + B A − 2 B A = {A, B} − 2 B A (A.49)
≡ A B − B A = 2 A B − A B − B A = 2 A B − {A, B} (A.50)
per cui abbiamo
i
[Mij , Γk ] = {Γi ({Γj , Γk } − 2Γk Γj ) + (−{Γi , Γk } + 2Γi Γk ) Γj +
4
− Γj ({Γi , Γk } − 2Γk Γi ) − (−{Γj , Γk } + 2Γj Γk ) Γi } =
i
= {Γi {Γj , Γk } − 2Γi Γk Γj − {Γi , Γk }Γj + 2Γi Γk Γj +
4
− Γj {Γi , Γk } + 2Γj Γk Γi + {Γj , Γk }Γi − 2Γj Γk Γi } =
i
= {Γi {Γj , Γk } + {Γj , Γk }Γi − {Γi , Γk }Γj − Γj {Γi , Γk }} (A.51)
4
Usando ora il fatto che {Γi , Γj } = 2 δij I, otteniamo infine che
i i
[Mij , Γk ] = {Γi 2 δjk + 2 δjk Γi − 2 δik Γj − Γj 2 δik } = {4 Γi δjk − 4 Γj δik } =
4 4
= i (Γi δjk − Γj δik ) (A.52)
i.e. appunto la (A.45).
Questo risultato ci consente adesso di ricavare il commutatore fra gli operatori
Mij e quindi di verificare se essi soddisfano o meno l’algebra di Lie di SO(n) di
cui alla (A.41). Abbiamo
i i
[Mij , Mkl ] = [Mij , [Γk , Γl ]] = {[Mij , Γk Γl ] − [Mij , Γl Γk ]} (A.53)
4 4
ma di nuovo possiamo usare l’identità [A, BC] = B[A, C] + [A, B]C e quindi si
ha
i
[Mij , Mkl ] = {[Mij , Γk Γl ] − [Mij , Γl Γk ]} =
4
i
= {Γk [Mij , Γl ] + [Mij , Γk ]Γl − Γl [Mij , Γk ] − [Mij , Γl ]Γk } =
4
i2
= {Γk (Γi δjl − Γj δil ) + (Γi δjk − Γj δik )Γl − Γl (Γi δjk − Γj δik ) − (Γi δjl − Γj δil )Γk } =
4
i2
= {δjl Γk Γi − δil Γk Γj + δjk Γi Γl − δik Γj Γl − δjk Γl Γi + δik Γl Γj − δjl Γi Γk + δil Γj Γk } =
4
i2
= {−δik (Γj Γl − Γl Γj ) − δjl (Γi Γk − Γk Γi ) + δil (Γj Γk − Γk Γj ) + δjk (Γi Γl − Γl Γi )} =
4
= i {−δik Mjl − δjl Mik + δil Mjk + δjk Mil } =
= −i {δik Mjl + δjl Mik − δil Mjk − δjk Mil } (A.54)

271
la quale dimostra appunto che le matrici n−dimensionali Mij di cui alla (A.43)
soddisfano le regole di commutazione (A.41) dei generatori canonici di SO(n) e
dunque, effettivamente, ne definiscono una rappresentazione n−dimensionale.
Vediamo adesso come questa rappresentazione induca effettivamente, sulle Γi
stesse, la rappresentazione vettoriale di SO(n), i.e. sia tale per cui

S(G) Γi S −1 (G) = (G−1 )ij Γj (A.55)

Dimostriamo questo punto per una trasformazione G infinitesima, in cui quindi


risulti
i
S(G) ≈ I − ωab Mab (A.56)
2
i
S −1 (G) ≈ I + ωcd Mcd (A.57)
2
i
G−1 ≈ I + ωef H ef (A.58)
2
Evidentemente, in questa approssimazione al primo ordine nella matrice dei
parametri ωab , il primo membro della (A.55) diviene
i i
S(G) Γi S −1 (G) ≈ Γi − ωab Mab Γi + ωcd Γi Mcd =
2 2
i i
= Γi − ωab [Mab , Γi ] = Γi − ωab · i (Γa δib − Γb δ ia ) =
2 2
1
= Γi + (ωab Γa δib − ωab Γb δia ) = Γi − ωib Γb (A.59)
2
Quanto al secondo membro della (A.55), abbiamo261
( ) ( )
−1 i i
(G )ij Γj = δij + ωab (H ab )ij Γj = Γi + ωab · i δia δjb − δja δib Γj =
2 2
( )
1 1
= Γi − ω ij − ω ji Γj = Γi − ωij Γj (A.60)
2 2
la quale, per trasformazioni infinitesime, prova appunto, insieme alla (A.59), la
(A.55): questo risultato, data la struttura analitica di gruppo, è poi estendibile
direttamente anche alle trasformazioni finite.

261
Si ricordi che, salvo diverso avviso, la posizione degli indici nella delta di Knonecker è
irrilevante !

272
SO(n, m)
Consideriamo adesso il caso in cui l’algebra di Clifford abbia invece la struttura
seguente:

{Γi , Γj } = 2 gij I i, j = 1, ...., N = n + m (A.61)

dove g è una matrice hermitiana opportuna che, senza perdita di generalità,


possiamo assumere sia diagonale e dunque sia reale e nulla fuori della diagonale
principale.
Possiamo, evidentemente, definire ancora gli operatori
i
Mij = [Γi , Γj ] ≡ −Mji (A.62)
4
ed è facile rendersi conto che, ripetendo i calcoli già fatti, questi operatori sono
tali per cui262

[Mij , Γk ] = i (Γi gjk − Γj gik ) (A.65)

e dunque abbiamo altresı̀ che263

[Mij , Mkl ] = −i {gik Mjl + gjl Mik − gil Mjk − gjk Mil } (A.67)
262
Infatti
i i
[Mij , Γk ] = [[Γi , Γj ] , Γk ] = {[Γi Γj , Γk ] − [Γj Γi , Γk ] } =
4 4
i
= {Γi [Γj , Γk ] + [Γi , Γk ] Γj − Γj [Γi , Γk ] − [Γj , Γk ] Γi } =
4
i
= {Γi ({Γj , Γk } − 2Γk Γj ) + (−{Γi , Γk } + 2Γi Γk ) Γj +
4
− Γj ({Γi , Γk } − 2Γk Γi ) − (−{Γj , Γk } + 2Γj Γk ) Γi } =
i
= {Γi {Γj , Γk } − 2Γi Γk Γj − {Γi , Γk }Γj + 2Γi Γk Γj +
4
− Γj {Γi , Γk } + 2Γj Γk Γi + {Γj , Γk }Γi − 2Γj Γk Γi } =
i
= {Γi {Γj , Γk } + {Γj , Γk }Γi − {Γi , Γk }Γj − Γj {Γi , Γk }} (A.63)
4
ed usando la relazione {Γi , Γj } = 2 gij I, otteniamo infine appunto che
i i
[Mij , Γk ] = {Γi 2 gjk + 2 gjk Γi − 2 gik Γj − Γj 2 gik } = {4 Γi gjk − 4 Γj gik } =
4 4
= i (Γi gjk − Γj gik ) (A.64)

263
Infatti, essendo [Mij , Mkl ] = i
4 [Mij , [Γk , Γl ]] = i
4 {[Mij , Γk Γl ] − [Mij , Γl Γk ]} ,
evidentemente si ha
i
[Mij , Mkl ] = {[Mij , Γk Γl ] − [Mij , Γl Γk ]} =
4
i
= {Γk [Mij , Γl ] + [Mij , Γk ]Γl − Γl [Mij , Γk ] − [Mij , Γl ]Γk } =
4

273
Assumeremo che det(g) ̸= 0 e quindi che tutti i termini (diagonali) che definis-
cono g siano non nulli. In questo caso, rinormalizzando le Γi nel modo seguente
1
Γ̂i ≡ Γi √ (A.68)
|gii |

abbiamo che i termini (diagonali) della nuova matrice ĝ valgono tutti ±1, i.e.
ĝ 2 = I: assumeremo altresı̀ che i primi n < N termini diagonali di g valgano +1
mentre i successivi m ≡ N − n > 0 termini valgano −1.
Siccome effettuando questa rinormalizzazione e questo riordino non introduciamo
alcuna perdita di generalità, da ora in avanti ci porremo sempre in questa ipotesi:
però, per non appesantire le notazioni, nel seguito continueremo ad usare i simboli
Γi e g al posto, rispettivamente, di Γ̂i e ĝ ...

Ci chiediamo adesso se esiste, in queste ipotesi, un gruppo di Lie tale per


cui gli operatori Mij di cui sopra costituiscono una rappresentazione dei suoi
generatori?
Consideriamo per questo il gruppo SO(n, m): esso, per definizione, è fatto
dalla falda264 connessa con l’identità del gruppo delle matrici reali (n+m)×(n+m)
le quali lasciano invariante la forma quadratica

xi gij xj (A.69)

dove g è appunto il tensore diagonale che ha i primi n elementi pari a +1 ed i


seguenti m elementi uguali a −1.
Se indichiamo con G il generico elemento (matrice) del gruppo e poniamo

Ga.b ≡ (G)ab (A.70)

allora la condizione (A.69), evidentemente, richiede che

xi gij xj = Gi.a xa gij Gj.b xb ⇔ Gt g G = g ⇔ G−1 = g Gt g (A.71)


i2
= {Γk (Γi gjl − Γj gil ) + (Γi gjk − Γj gik )Γl − Γl (Γi gjk − Γj gik ) − (Γi gjl − Γj gil )Γk } =
4
i2
= {gjl Γk Γi − gil Γk Γj + gjk Γi Γl − gik Γj Γl − gjk Γl Γi + gik Γl Γj − gjl Γi Γk + gil Γj Γk } =
4
i2
= {−gik (Γj Γl − Γl Γj ) − gjl (Γi Γk − Γk Γi ) + gil (Γj Γk − Γk Γj ) + gjk (Γi Γl − Γl Γi )} =
4
= −i {gik Mjl + gjl Mik − gil Mjk − gjk Mil } (A.66)

264
Dal punto di vista topologico, in generale il gruppo G delle matrici reali (n + m) × (n + m)
che soddisfano la condizione (A.69) è fatto da quattro falde, ciascuna connessa ma tra loro
sconnesse, due con determinante +1 e due con determinante −1. Per definizione, SO(n, m) è
il sottogruppo di G che coincide con la sua falda connessa che contiene l’identità (le altre falde,
ovviamente, non possedendo l’identità, non hanno la struttura gruppale ...).

274
da cui segue, in generale, che gli elementi del gruppo definito dalla (A.69) hanno
det(G) = ±1: quelli, però, della falda connessa con l’identità e quindi di SO(n, m),
non possono ovviamente che avere det(G) = 1 !
Proprio per come sono definite, le matrici di SO(n, m) possono essere sempre
poste in forma esponenziale, i.e. possono essere sempre scritte come

G = e−iJ (A.72)

dove la generica matrice J è immaginaria pura (dovendo G essere reale ...) e,


data la (A.71), deve altresı̀ essere tale che (usiamo il fatto che g 2 = I ...)

G−1 = g Gt g ⇔ eiJ = g e−i J g = e−i g J


t t g
⇔ g J t g = −J (A.73)

ovvero

(g J g)+ = J (A.74)

essendo g simmetrica reale e J immaginaria pura.


Una base265 per le matrici J di cui alla (A.74) è la seguente
( )a ( ) ( )
J ij = i g ia δbj − g ja δbi ≡ i δ ia δbj − δ ja δbi (A.79)
.b

dove δki è il consueto simbolo266 di Knonecker mentre δ ia ≡ g ia .


265
Osserviamo infatti che la condizione g J t g = −J implica che la matrice g J, immaginaria
pura, sia anche antisimmetrica, infatti
t
g J t g = −J ⇔ g J g = −J t ⇔ g J = −J t g ⇔ g J = − (g J) (A.75)

Ma noi sappiamo già che una base per le matrici immaginarie antisimmetriche di ordine N è
fatta dalle matrici H cosı̀ definite
( ij ) ( )
H ab = i δai δbj − δbi δaj (A.76)

dove gli indici a, b, i ̸= j vanno da 1 ad N . E’ allora immediato che, posto


( ij ) ( )
J ≡ g H ij (A.77)
( )
le matrici J ij cosı̀ definite costituiscono certamente una base per le matrici J stesse, ed esse
coincidono, evidentemente, con quelle definite attraverso la (A.79), infatti abbiamo
( ij )a ( ) ( ) ( )
J .b = g ak H ij kb = i g ak δki δbj − δbi δkj = i g ia δbj − g ja δbi (A.78)

266
In quanto segue, la posizione degli indici è rilevante.
Usando la regola secondo cui il tensore metrico g alza o abbassa gli indici matriciali/tensoriali,
il tensore metrico viene anche scritto infatti come

g ji ≡ g ij = g ik δkj = δ ij = δ ji ; gij ≡ gji = δik gkj = δij = δji (A.80)

275
Poiché la base (J ij ) è evidentemente antisimmetrica267 negli indici (i, j), la gener-
ica matrice del gruppo SO(n, m) può essere scritta come

G = e−iJ = e− 2 ωij J
i ij
(A.81)

dove, posto N ≡ n + m, la matrice reale e antisimmetrica ω definisce gli


N (N − 1)/2 parametri reali che individuano il generico elemento G del gruppo.
La struttura di algebra di Lie di SO(n, m) è quindi definita univocamente
dalle regole di commutazione delle matrici J ij definite dalla (A.79), che rivestono,
evidentemente, anche il ruolo di generatori della rappresentazione ”base” del
gruppo stesso. Risulta
[ ] ( ) ( ) ( )a ( )c ( )a ( )c
J ij , J kl ab = J ij J kl − J kl J ij = J ij J kl − J kl J ij =
ab ab .c .b .c .b
{( )( ) ( )( )}
= i2 g δc −
ia j
g ja δci kc l
g δb − g lc δbk − ka l
g δc − g δc g δb −
la k ic j
g jc δbi =
{
= i2 g ia g kj δbl − g ia g lj δbk − g ja g ik δbl + g ja g li δbk −
( )}
g ka g il δbj − g ka g jl δbi − g la g ik δbj + g la g kj δbi =
{ ( ) ( )
= i2 g ik −g ja δbl + g la δbj + g jl −g ia δbk + g ka δbi
( ) ( )}
−g il −g ja δbk + g ka δbj − g jk −g ia δbl + g la δbi =
{ ( )a ( )a ( )a ( )a }
= i2 g ik i J jl + g jl i J ik − g il i J jk − g jk i J il =
.b .b .b .b
( )a
= −i g ik J jl + g J ik − g il J jl jk
− g jk J il (A.82)
.b

la quale mostra come l’algebra di Lie di SO(n, m) definita attraverso gli operatori
J ij sia in effetti la stessa268 di cui alla (A.67).
267
Non si confonda l’antisimmetria insita nella descrizione degli elementi della base attraverso
la parametrizzazione con gli indici (ij) con le proprietà delle matrici J stesse, per le quali
abbiamo visto che solo gJ è antisimmetrica (ma non J) !
268
A stretto rigore, nella (A.67)

[Mij , Mkl ] = −i {gik Mjl + gjl Mik − gil Mjk − gjk Mil } (A.83)

gli indici che individuano i generatori sono tutti covarianti (in basso...) mentre nella (A.82) sono
controvarianti (in alto). Questo, però, non è una reale differenza, infatti, facendo semplicemente
uso del tensore metrico, abbiamo che il primo membro della (A.83) diventa
[ ]
g ai g bj g ck g dl [Mij , M kl ] ≡ M ab , M cd (A.84)

e, quanto al secondo membro, abbiamo che

−i {gik Mjl + gjl Mik − gil Mjk − gjk Mil } g ai g bj g ck g dl =


{
= −i gik Mjl g ai g bj g ck g dl + gjl Mik g ai g bj g ck g dl
}
−gil Mjk g ai g bj g ck g dl − gjk Mil g ai g bj g ck g dl =
{ }
= −i M bd δka g ck + M ac δlb g dl − M bc δla g dl − M ad δkb g ck =
{ }
= −i g ac M bd + g bd M ac − g ad M bc − g bc M ad (A.85)

276
Possiamo quindi concludere affermando senz’altro che gli operatori Mij , definiti
attraverso le Γi mediante la (A.62), definiscono una rappresentazione reale di
SO(n, m) a valori nello spazio vettoriale di dimensione N ≡ n + m dove operano
le Γi stesse, le quali definiscono il tensore metrico g attraverso la struttura di
algebra di Clifford (A.61).
Formalmente la rappresentazione in questione è cosı̀ definita
S(G) = e− 2 ωij M
i ij
(A.87)
essendo, per definizione
i i [ i j]
[Γa , Γb ] ≡
M ij = g ai g bj Mab = g ai g bj Γ,Γ (A.88)
4 4
Questa rappresentazione, definita dalla (A.87), induce in modo canonico, nello
spazio operatoriale generato dalle Γ, una rappresentazione vettoriale, i.e. risulta
S(G) Γi S −1 (G) = (G−1 )i.j Γj ⇔ S −1 (G) Γi S(G) = Gi.j Γj (A.89)
La dimostrazione di questo risultato ricalca esattamente quanto visto nel caso di
SO(n). Si considerano trasformazioni infinitesime e si sviluppa al primo ordine
nella matrice dei parametri ω: risulta che, quanto al primo membro della (A.89),
abbiamo
i i
S(G) Γi S −1 (G) ≈ Γi − ωab M ab Γi + ωcd Γi M cd =
2 2
i [ ] i ( )
= Γ − ωab M , Γ = Γi − ωab · i Γa g bi − Γb g ai =
i ab i
2 2
1( )
= Γ +i
ωab Γ g − ωab Γ g =
a bi b ai
2
1( )
= Γi + −ωba Γa g bi − ωab Γb g ai =
2
1( i a )
= Γ −i
ω.a Γ + ω.bi Γb = Γi − ω.a i a
Γ (A.90)
2
dove si è usato il fatto che la matrice ωij è antisimmetrica.
Circa il secondo membro della (A.89), abbiamo altresı̀ che risulta
( ) ( )
i i
(G−1 )i.j
Γ = j
+ ωab (J ab )i.j Γj = Γi + ωab · i g ai δjb − g bi δja Γj =
δji
2 2
1 1
= Γi − ω ab g ai δjb Γj − ω ba g bi δja Γj = Γi − ω.a
i
Γa (A.91)
2 2
la quale, insieme alla (A.90), prova appunto la (A.89) almeno per trasformazioni
infinitesime: la struttura analitica del gruppo ne consente poi l’estensione anche
alle trasformazioni finite.
e dunque, in definitiva
[ ab ] { }
M , M cd = −i g ac M bd + g bd M ac − g ad M bc − g bc M ad (A.86)

277
A.4 Parametrizzazione del gruppo di Lorentz
In questo paragrafo considereremo in maggior dettaglio la questione della parametriz-
zazione del gruppo di Lorentz come gruppo di Lie.
Iniziamo per questo dal fatto che una trasformazione infinitesima del gruppo di
Lorentz avrà, in generale, la struttura seguente

Λµ.ν ≈ δ.µν + ϵµ.ν (A.92)

dove il primo termine descrive appunto la trasformazione identica e la matrice


reale ϵ sarà fatta da elementi infinitesimi. La condizione per cui

Λt g Λ = g (A.93)

che garantisce alla trasformazione (A.92) di conservare il ds2 , implica che269

δµν = (Λt )µα gαβ (Λ)βν = (Λ)αµ gαβ (Λ)βν ≈


≈ (δ.αµ + ϵα.µ ) gαβ (δ.βν + ϵβ.ν ) = (δβµ + ϵβµ )(δ.βν + ϵβ.ν ) =
= δµν + ϵµν + ϵνµ + O(ϵ2 ) (A.94)

ovvero la matrice ϵµν deve essere reale e antisimmetrica negli indici di Lorentz,
per cui essa deve necessariamente possedere la struttura seguente
   
0 − η1 − η2 − η3 0 − η1 − η2 − η3
 η1 0 − ϕ3 ϕ2   −η 0 ϕ3 − ϕ2 
   
 ⇔ ϵµ
1
ϵµν =  =  (A.95)
 η2 ϕ3 0 − ϕ1  .ν  −η2 − ϕ3 0 ϕ1 
η 3 − ϕ2 ϕ1 0 −η3 ϕ2 − ϕ1 0

Il fatto che essa sia reale 4 × 4 e antisimmetrica implica che essa sia individuabile
attraverso i sei parametri reali indipendenti che abbiamo sopra indicato, rispetti-
vamente, con (ηi ) ed (ϕi ). Questi parametri possono venire descritti, a loro volta,
attraverso una matrice antisimmetrica 4 × 4, che indicheremo con ωαβ , in modo
che risulti270
i ( )µ
ϵµ.ν ≡ − ωαβ J αβ (A.96)
2 .ν
( ) ( )
dove la matrice J αβ ≡ − J βα , fissati α e β, risulta essere una matrice 4 × 4
( )
immaginaria pura, tale che J αβ è antisimmetrica sia negli indici (α, β) che
µν

269
Indicheremo al solito gli elementi del tensore metrico sia con il simbolo g µν che anche con
il simbolo δ µν , riservando il simbolo δνµ per gli elementi dell’identità.
Quando poi vorremo prescindere dalla convenzione controvariante/covariante sugli indici per
usare semplicemente la convenzione matriciale consueta, scriveremo il simbolo che rappresenta
la matrice in questione fra parentesi tonda, i.e. (Λ)µν ≡ Λµ.ν .
270
Si noti la distinzione, a priori, fra gli indici di Lorentz che indichiamo con (µ, ν) e gli indici
che servono invece a descrivere lo spazio del parametri, che indichiamo con (α, β).

278
negli indici di Lorentz (µ, ν).
Volendo, per semplicità, identificare la matrice infinitesima ω con la matrice ϵ,
questo richiede di porre semplicemente
( )µ ( )
J αβ ≡ i δ αµ δνβ − δ βµ δνα (A.97)

ed infatti271
i ( )µ i2 µ
ϵµ.ν = −
ωαβ J αβ = − (ω.ν − ων.µ ) = ω.ν
µ
(A.98)
2 .ν 2
Quanto, poi, alla forma ”finita” delle trasformazioni di Lorentz, dalla teoria dei
gruppi di Lie e da quanto precede possiamo concludere che la loro parametriz-
zazione deve272 essere la seguente
αβ )µ
Λµ.ν = e− 2 ωαβ (J
i

(A.99)
dove, adesso, la matrice ωαβ è fatta da elementi (reali) f initi.
Venendo ora alle regole [ di commutazione
] dei generatori J αβ del gruppo di
Lorentz, cioè alle quantità J αβ , J ρσ , esse sono facilmente determinabili a partire
dalla definizione (A.97). Abbiamo infatti
[ ]µ
J αβ , J ρσ = (J αβ )µ.τ (J ρσ )τ.ν − (J ρσ )µ.τ (J αβ )τ.ν =

{ }
= i2 (δ αµ δτβ − δ βµ δτα )(δ ρτ δνσ − δ στ δνρ ) − (δ ρµ δτσ − δ σµ δτρ )(δ ατ δνβ − δ βτ δνα )
{[ ]
= i2 δ αµ δ βρ δνσ − δ αµ δ βσ δνρ − δ βµ δ αρ δνσ + δ βµ δ ασ δνρ
[ ]}
− δ ρµ δ σα δνβ − δ ρµ δ σβ δνα − δ σµ δ ρα δνβ + δ σµ δ ρβ δνα =
{ ( )
= i2 δ αρ −δ βµ δνσ + δ σµ δνβ + δ βσ (−δ αµ δνρ + δ ρµ δνα )
( ) }
−δ ασ −δ βµ δνρ + δ ρµ δνβ − δ βρ (−δ αµ δνσ + δ σµ δνα ) =
{ }
= −i δ αρ (J βσ )µ.ν + δ βσ (J αρ )µ.ν − δ ασ (J βρ )µ.ν − δ βρ (J ασ )µ.ν (A.100)
da cui ne segue che l’algebra di Lie del gruppo di Lorentz è, dunque, la seguente
[ ] { }
J αβ , J ρσ = −i δ αρ J βσ + δ βσ J αρ − δ ασ J βρ − δ βρ J ασ (A.101)
271
Si ricordi che, per ipotesi
ωµν = −ωνµ
e quindi, moltiplicando entrambi i membri per δ ρµ , abbiamo
ρ
ω.ν ≡ δ ρµ ωµν = −δ ρµ ωνµ ≡ −ων.ρ

272
Ricordiamo che stiamo parlando del gruppo di Lorentz ortocrono proprio, cioè del gruppo
delle matrici Λ che, oltre a soddisfare la condizione (A.93), hanno anche determinante +1
e Λ0.0 ≥ +1. Questa è la parte del gruppo connessa con l’identità: la forma analitica della
(A.99) garantisce che le matrici cosı̀ rappresentate non possono che soddisfare anche le altre
due condizioni aggiuntive sopra descritte.

279
Passiamo adesso ad esplicitare la forma delle sei matrici J indipendenti.
Per ragioni che saranno chiare in seguito, è opportuno dividere queste sei matrici
⃗ ≡ (K1 , K2 , K3 ) e L
in due insiemi di tre, i.e. in K ⃗ ≡ (J1 , J2 , J3 ), secondo le
definizioni seguenti

(K1 , K2 , K3 ) ≡ (J 01 , J 02 , J 03 ) ⇔ Ki ≡ J 0i = −J i0 = Ji0 (A.102)


1 1
(L1 , L2 , L3 ) ≡ (J 23 , J 31 , J 12 ) ⇔ Li ≡ ϵijk J jk = ϵijk Jjk(A.103)
2 2
In base alle regole di commutazione (A.101), risulta273 allora che

[Li , Lj ] = i ϵijk Lk (A.109)


273
Abbiamo infatti che (si ricordi che δ 00 = 1 mentre per a, b = 1, 2, 3 si ha δ ab = −δba ...)
1 [ ] 1 { [ ]}
[Li , Lj ] = ϵiab ϵjcd J ab , J cd = ϵiab ϵjcd −i δ ac J bd + δ bd J ac − δ ad J bc − δ bc J ad =
4 4
i[ ]
= ϵicb ϵjcd J + ϵiad ϵjcb J ac − ϵidb ϵjcd J bc − ϵiac ϵjcd J ad
bd
(A.104)
4
dove abbiamo appunto usato il fatto che, trattandosi di indici spaziali, risulta che
δ ab ≡ g ab = −δba . Nell’espressione precedente (A.104), i due tensori antisimmetrici a tre indici
che vengono moltiplicati fra loro hanno sempre un indice comune che, essendo un indice di
somma e quindi muto, chiameremo nel seguito con lo stesso nome, i.e. lo indicheremo con k;
inoltre useremo le proprietà di antisimmetria dei tensori per dare ai vari addendi una struttura
simile. In questo modo, si ha (nell’espressione che segue, le delta sono quelle di Kronecker;
inoltre si ricordi che le J ab sono antisimmetriche anche negli indici (a, b) ...)
i[ ]
[Li , Lj ] = ϵikb ϵjkd J bd + ϵika ϵjkc J ac + ϵikb ϵjkc J bc + ϵika ϵjkd J ad = iϵika ϵjkb J ab =
4
1
= i (δij δ ab − δib δaj ) J ab = −i J ji = i J ij = i ϵijk ϵkab J ab ≡ i ϵijk Lk (A.105)
2
che dimostra appunto la (A.109).
Passiamo adesso alla dimostrazione della (A.110): si ha (si ricordi che δ a0 = 0; δ ab = −δba )
1 [ ] −i { }
[Li , Kj ] = ϵiab J ab , J 0j = ϵiab δ a0 J bj + δ bj J a0 − δ aj J b0 − δ b0 J aj
2 2
−i { b a0 } i i
= ϵiab −δj J + δj J a b0
= ϵiaj J a0 − ϵijb J b0 =
2 2 2
i 0a i 0b 0k
= ϵija J + ϵijb J = i ϵijk J = i ϵijk Kk (A.106)
2 2
Infine, quanto alla (A.111), la dimostrazione esplicita è la seguente
[ ] { }
[Ki , Kj ] = J 0i , J 0j = −i δ 00 J ij + δ ij J 00 − δ 0j J i0 − δ i0 J 0j =
= −i δ 00 J ij = −i J ij = −i ϵijk Lk (A.107)

dove abbiamo usato sia il fatto che δ 00 = 1, come pure che


1
Lk ≡ ϵkab J ab ⇔ J ab = Jab = ϵabi Li (A.108)
2

280
[Li , Kj ] = i ϵijk Kk (A.110)
[Ki , Kj ] = −i ϵijk Lk (A.111)
Vediamo adesso, esplicitamente, la forma di queste matrici: quanto alle matrici
Kj , abbiamo
 
0 1 0 0
( )µ ( )  1 0 0 0 
 
K1 ≡ J 01 ≡ i δ 0µ δν1 − δ 1µ δν0 = i   (A.112)
.ν  0 0 0 0 
0 0 0 0
e similmente
   
0 0 1 0 0 0 0 1
 0 0 0 0   0 0 0 0 
   
K2 = i  ; K3 = i   (A.113)
 1 0 0 0   0 0 0 0 
0 0 0 0 1 0 0 0
mentre, quanto alle matrici Lk , esse hanno la forma seguente:
 
0 0 0 0
( )α ( )  0 0 0 0 
 
L1 ≡ J 23 ≡ i δ 2α δβ3 − δ 3α δβ2 = i   (A.114)
.β  0 0 0 −1 
0 0 1 0
 
0 0 0 0
( )α ( )  0 0 0 1 
 
L2 ≡ − J 13 ≡ −i δ 1α δβ3 − δ 3α δβ1 = i  (A.115)
.β  0 0 0 0 
0 −1 0 0
 
0 0 0 0
( )α ( )  0 0 −1 0 
 
L3 ≡ J 12 ≡ i δ 1α δβ2 − δ 2α δβ1 = i   (A.116)
.β  0 1 0 0 
0 0 0 0
Le matrici K⃗ sono i generatori dei boost, ovvero delle matrici di Lorentz che,
senza rotazione degli assi, descrivono la legge di trasformazione delle coordinate
spazio-temporali fra due sistemi di riferimento in moto relativo.
Come esempio, iniziamo considerando un boost274 lungo l’asse z con velocità v.
Risulta
   
γ 0 0 − βγ ch η 0 0 − sh η
 0 1 0 0   0 1 0 0 
Bz (v) ≡= 

=
 
 (A.117)
 0 0 1 0   0 0 1 0 
−βγ 0 0 γ −sh η 0 0 ch η
274
Stiamo assumendo che si tratti, comunque, di una trasformazione passiva. Secondo questa
ipotesi, il secondo riferimento, nel quale siamo trasformati dal boost, si muove rispetto al primo
nel verso positivo dell’asse z. Quindi, un punto che sia fermo nel primo sistema di riferimento,
è visto muoversi, nel secondo riferimento, nel verso opposto a quello dell’asse z ...

281
dove abbiamo posto
sh η
η ≡ th−1 (β) ⇒ β = th η = ⇒ γ = ch η (A.118)
ch η
E’ facile verificare allora che risulta

Bz (v) = ei η K3 (A.119)

Infatti, se definiamo la matrice reale A ≡ iK3 , abbiamo


   
0 0 0 −1 1 0 0 0
 0 0 0 
0   
  0 0 0 0 
A =   ⇒ A2 =  
 0 0 0 0   0 0 0 0 
−1 0 0 0 0 0 0 1
⇒ (A)2n = A2 ; (A)2n+1 = A (A.120)

e dunque
1 2 2 1 3 3 1 4 4
ei η K3 = eηA = I + η A + η A + η A + η A + ... =
( 2! ) 3!( 4 )
3 2 4
η η η η
= I +A + + ... + A2 + + ... =
1! 3! 2! 4!
= I + A sh η + A2 (ch η − 1) ≡ Bz (v) (A.121)

Nel caso di un boost che descrive, senza rotazione degli assi, la legge di trasfor-
mazione fra due riferimenti in moto relativo con velocità qualsiasi ⃗v , ecco che
posto ⃗n ≡ |⃗⃗vv| ed η ≡ th−1 (|⃗v |), risulta

B(⃗v ) = eiη ⃗n·K



(A.122)

ovvero

B(⃗v ) = eiη ⃗n·K = eiη ni Ki ≡ eiηi Ki = e 2 ηi (J


⃗ i 0i −J i0 )
(A.123)

da cui ne segue che la matrice dei parametri ω di cui alla (A.99), per un generico
boost ha la forma seguente
 
0 − η1 − η2 − η3
 η1 0 0 0 
 
ω µν =   (A.124)
 η2 0 0 0 
η3 0 0 0

Infatti, data la (A.124), risulta immediato che


i
− ωµν J µν = −i ω0i J 0i = −i (−ηi ) Ki = i ηi Ki (A.125)
2

282
A differenza dei generatori dei boost Ki che, per la (A.111), non formano
un’algebra di Lie chiusa275 , gli operatori Li , data la (A.109 ), generano un’algebra
di Lie chiusa che è quella, appunto, del gruppo delle rotazioni, sottogruppo del
gruppo di Lorentz.
Essi, insieme alle trasformazioni finite da loro generate, agiscono evidentemente
solo sugli indici spaziali: poiché queste ultime devono conservare il ds2 , non mu-
tando la coordinata temporale, devono evidentemente lasciare invariante il dr2
ovvero deve trattarsi di rotazioni.
Restringendo allora il sottogruppo delle trasformazioni ΛR generate dagli Li alla
sola parte spaziale 3 × 3, otteniamo il gruppo SO(3) delle rotazioni in tre di-
mensioni, i cui generatori L̂i , ottenuti anch’essi restringendo gli Li ai soli indici
spaziali, hanno la ben nota forma
( )
L̂i = −i ϵijk (A.127)
jk

Le matrici L̂j definite dalla (A.127) soddisfano la relazione

R L̂j R−1 = Rkj L̂k ≡ (R−1 )jk L̂k ⇒ R−1 L̂j R = Rjk L̂k (A.128)

qualunque sia la rotazione R di SO(3).


Questo significa che, attraverso la (A.128), è definita sugli L̂j la rappresentazione
vettoriale (s = 1) di SO(3). Passiamo alla sua dimostrazione: si ha
( )
R L̂j R−1 −1
= Rmk (L̂j )ks Rsn = Rmk (L̂j )ks Rns = −i Rmk ϵjks Rns
mn

D’altronde, il tensore completamente antisimmetrico di Ricci soddisfa la con-


dizione

ϵkmn Rik Rjm Rln = ϵijl (A.129)


275
Una conseguenza di questo fatto è che un loop di boosts che riporti al riferimento di partenza
produce una rotazione del riferimento finale rispetto a quello iniziale. Per rendersene conto,
consideriamo due trasformazioni infinitesime secondo l’asse x ed y, rispettivamente. Risulta

eiaK1 eibK2 e−iaK1 e−ibK2 ≈ (I + iaK1 )(I + ibK2 )(I − iaK1 )(I − ibK2 ) =
= (I + iaK1 )(I − iaK1 )(I + ibK2 )(I − ibK2 ) + (I + iaK1 ) [(I + ibK2 ), (I − iaK1 )] (I − ibK2 )

Il primo addendo è effettivamente la trasformazione identica, ma il secondo non è nullo e,


sempre al primo ordine in a e b, esso vale

(I + iaK1 ) [(I + ibK2 ), (I − iaK1 )] (I − ibK2 ) ≈ [(I + ibK2 ), (I − iaK1 )] =


= ab [(K2 , K1 ] = i ab L3 (A.126)

cioè descrive una rotazione infinitesima intorno all’asse z.


I boost, infatti, non formano un sottogruppo del gruppo di Lorentz !

283
per cui abbiamo che

−i Rmk ϵjks Rns = −i δjt ϵtks Rns Rmk = −i Rvt Rvj ϵtks Rns Rmk =
= −i Rvj ϵtks Rvt Rmk Rns = −i Rvj ϵvmn = Rvj (L̂v )mn

che dimostra appunto la (A.128).


Dalla teoria del gruppo delle rotazioni sappiamo inoltre che una generica ma-
trice 3 × 3 di rotazione R si può sempre scrivere come276

R = eiϕ ⃗n·L̂ (A.138)

dove ϕ⃗ ≡ ϕ ⃗n e la quantità positiva ϕ (compresa fra 0 e 2π ...) individua l’ampiezza


della rotazione effettuata intorno all’asse individuato dal versore ⃗n, in senso an-
tiorario.
Ne segue quindi immediatamente che

R = eiϕ ⃗n·L̂ ΛR = eiϕ ⃗n·L

⇔ (A.139)
276
Osserviamo che, dalla definizione, risulta

R = eiϕ ⃗n·L̂ = cosϕ δjk + sinϕ ϵjkl nl + (1 − cosϕ) nj nk (A.130)

Definiamo infatti la matrice A nel modo seguente:



A ≡ i⃗n · L̂ ⇒ Ajk = ni ϵijk (A.131)

Ne segue dunque che

(A2 )jk = Ajc Ack = na ϵajc nb ϵbck = na nb ϵajc ϵkbc = na nb [δ ak δjb − δab δjk ] =
= nj nk − δjk (A.132)
(A3 )jk = (A )jc Ack = (nj nc − δjc )na ϵack = nj nc na ϵack − na ϵajk = −na ϵajk = (−A)jk
2

⇒ A3 = −A (A.133)
(A4 )jk = (A )jc (A )ck = (nj nc − δjc )(nc nk − δck ) = nj nc nc nk − nj nk − nj nk + δjk =
2 2

= −nj nk + δjk = −(A2 )jk


⇒ A4 = −A2 (A.134)
⇒ A5 = A4 A = −A2 A = −A3 = A (A.135)
⇒ A6 = A4 A2 = −A2 A2 = −A4 = A2 (A.136)
...

per cui risulta infine che


⃗ 1 2 2 1 1 1 1
R = eiϕ ⃗n·L̂ = eϕA = I + ϕA + ϕ A + ϕ3 A3 + ϕ4 A4 + ϕ5 A5 ϕ6 A6 + ...
2! 3! 4! 5! 6!
1 3 1 5 2 1 2 1 4 1 6
= I + A(ϕ − ϕ + ϕ + ...) + A ( ϕ − ϕ + ϕ + ...) = I + A sinϕ + A2 (cosϕ − 1)
3! 5! 2! 4! 6!
⇒ Rjk = δjk + ni ϵijk sinϕ + (nj nk − δjk )(1 − cosϕ) =
= δjk cosϕ + ϵjkl nl sinϕ + nj nk (1 − cosϕ) (A.137)

284
e dunque che, posto per comodità di notazione ϕ nk ≡ ϕk

iϕ ⃗ = iϕk 1 ϵkij J ij = i (ϵijk ϕk ) J ij


⃗·L (A.140)
2 2
per cui ecco che, per una generica rotazione nello spazio-tempo ΛR , la matrice
dei parametri ω di cui alla (A.99), deve essere tale che

ωij = −ϵijk ϕk (A.141)

ovvero277
 
0 0 0 0
 0 0 − ϕ3 ϕ2 
 
ω αβ =   (A.145)
 0 ϕ3 0 − ϕ1 
0 − ϕ2 ϕ1 0

277
Come esempio, esplicitiamo la rotazione ΛR definita dall’angolo ϕ intorno all’asse z, i.e.
⃗ = (0, 0, ϕ). Per la (A.137), risulta che gli unici termini non nulli della
tale che ⃗n = (0, 0, 1) ⇔ ϕ
matrice R di SO(3) corrispondente sono i seguenti

R11 = R22 = cosϕ; R33 = cosϕ + (1 − cosϕ) = 1 (A.142)


R12 = −R21 = ϵ12k nk sinϕ = ϵ123 sinϕ = sinϕ (A.143)

per cui
 
1 0 0 0
 0 cosϕ sinϕ 0 
= 
α
(ΛR ).β  0 (A.144)
− sinϕ cosϕ 0 
0 0 0 1

ed essa, correttamente, trasforma, per esempio, il quadrivettore pµ = (t, x, 0, 0) nel quadrivet-


tore p ′µ = (t, x cosϕ, −x sinϕ, 0), come deve appunto accadere nel caso di una trasformazione
(passiva) di riferimento che consiste in una sua rotazione di un angolo ϕ intorno all’asse z.

285
A.5 La rappresentazione spinoriale
Una importante rappresentazione del gruppo di Lorentz è quella spinoriale S(Λ),
la quale descrive le proprietà di trasformazione sotto il gruppo di Lorentz delle
soluzioni dell’equazioni di Dirac.
Ricordiamo che l’equazione di Dirac nasce dall’idea di avere una equazione del
primo ordine nelle derivate parziali spazio-temporali ∂µ , la quale garantisca co-
munque alle soluzioni di soddisfare anche l’equazione di Klein-Gordon, che è
l’equazione relativistica ”necessaria” per una qualsiasi particella di massa m.
Occorre quindi che l’operatore di Dirac D ̸ ≡ i γ µ ∂µ sia tale per cui
(̸D)2 = −2 ≡ −∂ µ ∂µ (A.146)
in modo che, se ψ soddisfa l’equazione (̸D − m)ψ = 0 e quindi anche l’equazione
(̸D + m)(̸D − m)ψ = 0, se vale la (A.146), essa soddisfi appunto anche l’equazione
di Klein-Gordon (2 + m2 )ψ = 0.
Ma affinché possa essere soddisfatta la (A.146) occorre e basta che soddisfi la
condizione
{γ µ , γ ν } = 2 δ µν · I (A.147)
la quale, come sappiamo, definisce una struttura di algebra di Clifford278,279 .
Per quanto visto precedentemente (cfr.(A.62) e (A.87)), siamo dunque in
grado di definire una rappresentazione S del gruppo di Lorentz ortocrono proprio
L↑+ (ovvero di SO(1, 3)) attraverso i generatori
i µ ν
[γ , γ ] ⇔ S(Λ) = e− 2 ωµν M
i µν
M µν = (A.149)
4
Questa rappresentazione viene talvolta indicata, equivalentemente, anche come
S(Λ) = e− 2 ωµν M
i µν 1 µ ,γ ν ] 1 µν [γ ,γ ] i µν σ
= e 8 ωµν [γ = e8 ω µ ν
≡ e4 ω µν
(A.150)
dove il tensore σµν è definito come
1
σµν ≡ [γµ , γν ] (A.151)
2i
La rappresentazione S(Λ) definita dalla (A.150) è la rappresentazione spinoriale,
la quale caratterizza la legge di trasformazione sotto il gruppo di Lorentz del
campo di Dirac, tale appunto per cui risulta
U −1 (a, Λ) ψ(x) U (a, Λ) ≡ ψ ′ (x) = S(Λ) ψ(Λ−1 (x − a)) (A.152)
278
H. Giorgi: Lie algebras in particle physics, Westview Press, Boulder, Colorado 1999.
279
La rappresentazione delle matrici γ µ che useremo à quella di Pauli-Dirac (cfr. (A.19)), i.e.
( ) ( )
0 I 0 i 0 σi
γ = γ = (A.148)
0 −I −σi 0

286
Sempre per quanto già visto (cfr.(A.89)), la S(Λ) agisce sulle matrici γ µ attraverso
la rappresentazione vettoriale del gruppo, i.e. risulta che

S(Λ) γ µ S −1 (Λ) = (Λ−1 )µ.ν γ ν ⇔ S −1 (Λ) γ µ S(Λ) = (Λ)µ.ν γ ν (A.153)

Vediamo adesso alcune altre proprietà interessanti della rappresentazione spino-


riale:
• essa non è una rappresentazione unitaria (non potrebbe mai esserlo trattan-
dosi di una rappresentazione non banale di dimensione finita di un gruppo
non compatto), infatti essa280 è tale per cui

S(Λ)† = γ 0 S −1 (Λ) γ 0 ⇔ S(Λ)† = γ 0 S(Λ−1 ) γ 0


⇔ γ 0 S(Λ)† γ 0 = S(Λ−1 ) = S −1 (Λ) (A.157)

⃗L
⃗ = eiθ· ⃗
• per una rotazione281 R(θ) definita dal vettore θ⃗ ≡ θ ⃗n, risulta
⃗Σ
⃗ = e 2i θ· ⃗
S(θ) = cos(θ/2) I + i(⃗n · Σ)
⃗ sin(θ/2) (A.158)

dove
( )
⃗ = ⃗σ 0
Σ (A.159)
0 ⃗σ
280
Dalla definizione (A.150) della S(Λ) abbiamo infatti che
µν †
⇒ S(Λ)† = e( 8 ω
µν
1 1
[γµ ,γν ])
S(Λ) = e 8 ω [γµ ,γν ]
(A.154)

ma ω µν è la matrice dei coefficienti che, essendo reale, non è alterata dall’aggiunzione (si osservi
a questo proposito che l’aggiunzione è fatta rispetto agli indici spinoriali, i quali non hanno nulla
a che vedere con gli indici della matrice dei coefficienti ...); mentre risulta

([γµ , γν ]) = [γν† , 㵆 ] (A.155)

per cui, ricordando che 㵆 = γ 0 γµ γ 0 , ne segue che

S(Λ)† e 8 ω γ [γν ,γµ ]γ = γ 0 e 8 ω [γν ,γµ ] γ 0 = γ 0 e− 8 ω


1 µν 0 0 1 µν 1 µν
[γµ ,γν ]
= γ0 =
= γ 0 S(Λ−1 ) γ 0 = γ 0 S −1 (Λ) γ 0 (A.156)

281
Dalla definizione (A.103) abbiamo infatti che i generatori delle rotazioni sono definiti, in
termini dei generatori del gruppo di Lorentz, come
⃗ = (M 23 , M 31 , M 12 )
L

Usando allora la definizione (A.150) di M µν relativa alla rappresentazione spinoriale, è imme-


diato dimostrare che
⃗ = 1Σ
L ⃗
2
⃗ è data appunto dalla (A.159).
dove Σ

287
• per un boost B(⃗v ) = eiη ⃗n·K , definito dalla velocità ⃗v = v ⃗n = th(η) ⃗n dove

0 ≤ v ≤ 1 ed η è la rapidità del boost (0 ≤ η ≡ th−1 (v) ≤ +∞), risulta282

S(⃗v ) = e− 2 η ⃗n·⃗α = ch(η/2) I − (⃗n · α


1
⃗ ) sh(η/2) (A.160)

dove, per definizione, abbiamo posto


( )
0 ⃗σ
α
⃗= (A.161)
⃗σ 0

• siccome la matrice γ5 anticommuta con tutte del γ µ , essa commuta con σµν
ed è quindi scalare per trasformazioni di Lorentz, i.e. risulta

S −1 (Λ) γ5 S(Λ) = γ5 (A.162)

282
Dalla definizione (A.102) abbiamo infatti che i generatori dei boost sono definiti, in termini
dei generatori M µν del gruppo di Lorentz, come
⃗ = (M 01 , M 02 , M 03 )
K

Usando allora, di nuovo, la definizione (A.150) di M µν relativa alla rappresentazione spinoriale,


è immediato dimostrare che risulta
⃗ = iα
K ⃗
2
dove α⃗ è data appunto dalla (A.161).
Siccome (⃗n · α
⃗ )2 = I, la (A.160) segue immediatamente.

288
B Appendix: Cenni di Teoria Classica dei Campi
La teoria dei campi classica nasce come naturale generalizzazione del metodo
lagrangiano al caso di infiniti gradi di libertà.

Figure 19: Joseph Louis de Lagrange (1736-1813)

Il metodo lagrangiano in Meccanica Classica è un metodo elegante e conciso


che si basa su una funzione, la lagrangiana L appunto, (o l’hamiltoniana H:
si passa dall’una all’altra attraverso una trasformazione di Legendre), funzione
delle variabili dinamiche del sistema e delle loro derivate prime. Mediante la
lagrangiana viene espressa l’azione S, da cui poi, attraverso il principio di minima
azione, si possono ottenere le equazioni del moto e, via il teorema di Noëther, le
grandezze fisiche conservate che sono associate a eventuali simmetrie analitiche
della lagrangiana.
Ricordiamo che l’azione S è espressa, classicamente, dalla relazione

S= dt L(q(t), q̇(t)) (B.1)

dove q(t) sono appunto le variabili lagrangiane del sistema.


In una teoria di campo relativistica la coordinata temporale e quelle spaziali
dovranno essere trattate alla stessa stregua, per cui l’azione S sarà piuttosto

289
espressa dalla relazione

S= d4 x L(ϕ(x), ∂µ ϕ(x)) (B.2)

e la funzione L(ϕ(x), ∂µ ϕ(x)) viene chiamata, con ovvio significato, densità la-
grangiana. Essa è costruita a partire dai campi e dalle loro derivate, ma, se
vogliamo che la teoria risultante sia coerente con la relatività ristretta, essa dovrà
essere locale poichè, siccome in Relatività è esclusa l’azione a distanza, i campi
possono interagire l’un l’altro solo nello stesso punto. Non è quindi accettabile
che nella densità lagrangiana compaia un campo (o una sua derivata) in un punto
x che interagisce con un altro ma in un punto y diverso dal precedente.
Considerazioni generali limitano poi la forma della densità lagrangiana e
spesso ne consentono una individuazione pressochè completa283 , a meno di un
fattore di scala arbitrario, che il principio di minima azione non può, ovviamente,
fissare in alcun modo, né, come vedremo, della somma con una quadridivergenza.
Ricordiamo infine che l’approccio lagrangiano mette in evidenza in modo nat-
urale la profonda connessione esistente fra simmetrie e leggi di conservazione.
Chiaramente le simmetrie potranno dipendere dalla particolare teoria consider-
ata, ma una simmetria che dovrà comunque essere posseduta da ogni teoria di
campo è quella che discende dal principio di relatività.
Il gruppo di simmetria di base, in questo caso, è il gruppo di Poincarè P, fatto
dalle traslazioni nello spazio tempo (non esiste un punto privilegiato...) e dal
gruppo di Lorentz (non esistono riferimenti inerziali privilegiati). I suoi elementi
sono solitamente indicati con (a, Λ), (b, Γ), ... e soddisfano la legge moltiplicativa

(a, Λ)(b, Γ) = (a + Λb, ΛΓ)

dove a e b sono quadrivettori qualsiasi che descrivono la traslazione dell’origine


del sistema di riferimento, mentre Λ, Γ indicano generici elementi del gruppo di
Lorentz.
Come vedremo in seguito, l’invarianza in forma della Lagrangiana per trasfor-
mazioni di Lorentz comporta la conservazione della somma del momento ango-
lare orbitale e di spin insieme alla conservazione del moto del baricentro, mentre
l’invarianza per traslazioni comporta la conservazione del quadrimpulso.
283
Per esempio, se vogliamo una teoria di campo relativisticamente invariante, e quindi delle
equazioni di moto per i campi che siano covarianti, allora la densità lagrangiana dovrà essere
scalare per trasformazioni di Lorentz, etc... .
Ricordiamo che la densità hamiltoniana, invece, essendo, come vedremo, la componente 00 del
tensore energia-impulso, non è scalare per trasformazioni di Lorentz, anche se in molti casi
di interesse, almeno per quanto riguarda il termine di interazione, essa risulta semplicemente
l’opposto della densità lagrangiana moltiplicata per δ 00 . Questo accade, per esempio, nel caso
di interazioni descritte attraverso accoppiamenti non derivativi dei campi.

290
B.1 Le equazioni di Eulero-Lagrange per campi classici
Supponiamo che la dinamica dei campi classici ϕα (x) sia descritta dalla densità
lagrangiana
L(x) = L(ϕα (x), ∂µ ϕα (x), x) (B.3)
Questo significa che i campi ϕα (x) soddisfano le equazioni di Eulero-Lagrange
∂L ∂L
α
− ∂µ =0 (B.4)
∂ϕ ∂(∂µ ϕα )
Esse, infatti, seguono direttamente dal principio di minima azione, che afferma
che le equazioni del moto sono tali per cui l’integrale di azione

L(ϕα , ∂µ ϕα , x) d4 x (B.5)
D

valutato partendo da una soluzione compatibile con la dinamica dei campi, è


minimo (estremale) per variazioni dei campi δϕα che si annullano sul bordo Σ del
dominio di integrazione D, peraltro arbitrario (aperto in R4 ), i.e.

δ L(ϕα , ∂µ ϕα , x) d4 x ≡ 0 ≡ (B.6)
D
∫ ∫
≡ L(ϕα + δϕα , ∂µ (ϕα + δϕα ), x) d4 x − L(ϕα , ∂µ ϕα , x) d4 x
D D

con δϕα (x) = 0, ∀x ∈ Σ ≡ D̂ − D, essendo D̂ la chiusura284 dell’aperto D.


Dalla (B.6) si ha infatti
∫ [ ]
∂L α ∂L
0 = δϕ α
+ ∂µ (δϕα ) d4 x (B.7)
D ∂ϕ ∂(∂µ ϕα )
ma il secondo termine può essere scritto anche come
[ ]
∂L ∂L ∂L
∂µ (δϕ ) α
= ∂ µ δϕ α
− δϕ α
∂ µ (B.8)
∂(∂µ ϕα ) ∂(∂µ ϕα ) ∂(∂µ ϕα )
Il primo addendo è una quadridivergenza e quindi non fornisce alcun contributo
al secondo membro della eq.(B.7) perchè, via il teorema di Gauss285 , esso può
284
Un sottoinsieme I di uno spazio topologico T è aperto se ogni suo punto x è tale per cui
esiste almeno un suo intorno tutto contenuto in I.
Un sottoinsieme I di uno spazio topologico T è detto chiuso se il suo complementare in T è
aperto: esistono sottoinsiemi né aperti né chiusi ...
285
Il teorema di Gauss generalizzato in quattro dimensioni afferma che
∫ ∫
∂µ F µ d4 x ≡ F µ nµ dσ (B.9)
D Σ

dove nµ è il versore di R4 ortogonale (nella metrica euclidea di R4 ) all’elemento di superficie


dσ ∈ Σ. Si osservi, in particolare, che esso non richiede che le quattro funzioni F µ si
trasformino come un campo quadrivettoriale. In effetti, il teorema viene dimostrato semplice-
mente richiedendo a Rn la sua struttura ordinaria di spazio lineare.

291
essere riscritto come

∂L
δϕα nµ dσ
Σ ∂(∂µ ϕα )

e, per ipotesi, δϕα è nullo su Σ !


Perciò il principio di minima azione implica che
∫ [ ]
∂L ∂L
0 = δϕ α
− δϕα ∂µ
α
d4 x =
D ∂ϕ ∂(∂µ ϕα )
∫ [ ]
∂L ∂L
= δϕ α
α
− ∂µ α
d4 x (B.10)
D ∂ϕ ∂(∂µ ϕ )

e per l’arbitrarietà del dominio di integrazione D e delle variazioni dei campi δϕα
all’interno di D, questo implica la validità delle equazioni di Eulero-Lagrange
∂L ∂L
− ∂ µ ≡ 0 (B.11)
∂ϕα ∂(∂µ ϕα )

In questo modo abbiamo dimostrato che il principio di minima azione implica


le equazioni di Eulero-Lagrange (B.11) per i campi.
Assumendo la validità delle equazioni di Eulero-Lagrange e andando indietro
dalla eq.(B.10) alla eq.(B.7), possiamo facilmente dimostrare che anche l’altro
verso dell’implicazione è vero, i.e. che le equazioni di Eulero-Lagrange implicano
la validità del principio di minima azione286 .

B.2 Invarianza in valore


Sia L(ϕα (x), ∂µ ϕα (x), x) una densità lagrangiana che descrive la dinamica dei
campi ϕα , α = 1, ..., n. Consideriamo adesso una trasformazione locale dei campi
e delle coordinate, che ammette inversa, i.e. tale che

x ↔ x′ : x′ = X ′ (x); (B.12)
: x = X(x′ ) (B.13)
α ′
ϕ (x) ↔ ψ (x ) :
α
ψ α (x′ ) = Ψα (ϕ(x)) (B.14)
: ϕα (x) = Φα (ψ(x′ )) (B.15)

Assumiamo altresı̀ che in una trasformazione locale lo Jacobiano J della trasfor-


mazione di coordinate J = ||∂µ X ′ν || sia costante e che le funzioni X, X ′ , Φα , Ψα
siano derivabili.
286
Si osservi che, da quanto sopra detto, discende la conclusione secondo cui se due La-
grangiane differiscono solo per una quadridivergenza, esse sono equivalenti nel senso che de-
scrivono la stessa dinamica, come pure che, essendo le equazioni di Eulero-Lagrange omogeneee,
due Lagrangiane che differiscono solo per un fattore moltiplicativo sono, di nuovo, equivalenti.

292
Vogliamo vedere se la dinamica dei campi trasformati ψ α può ancora essere ot-
tenuta dal principio di minima azione, i.e. da una opportuna densità lagrangiana.

Iniziamo con il definire la funzione L seguente

L′ (ψ β , ∂ν ψ β , x′ ) ≡ L(Φα (ψ), ∂µ Φα (ψ), X(x′ )) (B.16)

Per definizione, la funzione L′ prende ovunque, nelle variabili trasformate, lo


stesso valore assunto dalla densità lagrangiana originale L, per i campi e le
coordinate non trasformate.
D’altronde, date le relazioni biunivoche (B.14), (B.15) fra i campi ϕ e ψ,
ψ̂ costituirà una possibile descrizione della dinamica dei campi ψ se e solo se
potremo scrivere ψ̂ = Ψ(ϕ̂), con ϕ̂ una opportuna soluzione delle equazioni di
Eulero-Lagrange per i campi ϕ !
Se dimostriamo che, per qualunque ψ̂ che descrive la dinamica del sistema in un
dato (arbitrario) dominio D′ , la variazione attorno a questa soluzione dell’integrale
di azione, costruito usando L′ come densità lagrangiana, è effettivamente nulla
quando i campi vengono cambiati di un qualsiasi δψ, purchè esso risulti nullo sulla
frontiera del dominio di integrazione D′ , allora avremo dimostrato che anche la
dinamica dei campi ψ può essere derivata dal principio di minima azione e che
L′ è una possibile densità lagrangiana che ne descrive la dinamica.
Questo teorema implica dunque l’invarianza in valore della densità lagrangiana
sotto trasformazioni locali.

Dimostrazione
Sia ϕ̂ una qualunque soluzione in un opportuno dominio D, e sia ψ̂ = Ψ(ϕ̂): i
campi ψ̂ sono, evidentemente, definiti nel dominio D′ = X ′ (D).
Valutiamo quanto vale la variazione


δ L′ (ψ β , ∂ν ψ β , x′ ) d4 x′ (B.17)
D′

quando i campi ψ β vengono variati intorno a ψ̂ β di un qualsiasi δψ β tale che δψ β


sia nullo sulla frontiera Σ′ del dominio di integrazione D′ . Evidentemente si ha
∫ ∫ [ ]
′ 4 ′ ∂L′ β ∂L′ ′
δ L dx = β
δψ + ′ β
∂ν (δψ β ) d4 x′
D′ D′ ∂ψ ∂(∂ν ψ )

Comunque, data la definizione di L′ , risulta


∂L′ ∂L ∂Φα ∂L ∂(∂µ Φα )
= +
∂ψ β ∂ϕα ∂ψ β ∂(∂µ ϕα ) ∂ψ β

293
mentre
∂L′ ∂L ∂(∂µ Φα )
=
∂(∂ν′ ψ β ) ∂(∂µ ϕα ) ∂(∂ν′ ψ β )
perciò
∫ ∫ {[ ] }
′ 4 ′ ∂L ∂Φα ∂L ∂(∂µ Φα ) ∂L ∂(∂µ Φα ) ′
δ L dx = + δψ β
+ ∂ (δψ β ) d4 x′
D′ D′ ∂ϕα ∂ψ β ∂(∂µ ϕα ) ∂ψ β ∂(∂µ ϕα ) ∂(∂ν′ ψ β ) ν
ma
∂Φα ′ β ′ν ∂(∂µ Φα ) ∂Φα ′
∂µ Φ α = β
∂ ν ψ ∂ µ X ⇒ ′ β
= β
∂µ X ν
∂ψ ∂(∂ν ψ ) ∂ψ
e perciò
∫ ∫ {[ ] }
′ 4 ′ ∂L ∂Φα ∂L ∂(∂µ Φα ) ∂L ∂Φα ′ ′
δ L dx = α β
+ α β
δψ β
+ α β
∂µ X ν ∂ν (δψ β ) d4 x′
D′ D′ ∂ϕ ∂ψ ∂(∂µ ϕ ) ∂ψ ∂(∂µ ϕ ) ∂ψ
Ma per la definizione stessa di X, risulta che
′ν ′
∂µ X ∂ν ≡ ∂µ
si ha
∫ ∫ {[ ] }
′ 4 ′ ∂L ∂Φα ∂L ∂(∂µ Φα ) ∂L ∂Φα
δ L dx = α β
+ α β
β
δψ + α β
∂µ (δψ β ) d4 x′
D′ D′ ∂ϕ ∂ψ ∂(∂µ ϕ ) ∂ψ ∂(∂µ ϕ ) ∂ψ
Consideriamo adesso il secondo termine dell’integrale di sopra:
[ ] [ ]
∂L ∂Φα ∂L ∂Φα ∂L ∂Φα
∂ µ (δψ β
) = ∂ µ δψ β − δψ ∂µ
β
∂(∂µ ϕα ) ∂ψ β ∂(∂µ ϕα ) ∂ψ β ∂(∂µ ϕα ) ∂ψ β
L’integrale del primo termine può essere riscritto come
∫ [ ] ∫ [ ]
∂L ∂Φα ′ ∂L ∂Φα
∂µ δψ β dx =4
∂µ δψ β J(x) d4 x
D′ ∂(∂µ ϕα ) ∂ψ β D ∂(∂µ ϕα ) ∂ψ β
ma dato che abbiamo assunto che lo Jacobiano J(x) è costante, l’integrando
risulta essere una quadridivergenza e dunque, via il teorema di Gauss, può essere
trasformata in un integrale di superficie sulla frontiera Σ del dominio D. Co-
munque, poichè le funzioni X e X ′ sono analitiche, la frontiera di D è mandata
nella frontiera di D′ e viceversa, i.e. x ∈ Σ ↔ x′ ∈ Σ′ . Quindi, le variazioni δψ
che per ipotesi si annullano su Σ′ , sono nulle quando x ∈ Σ e, di conseguenza,
l’integrale di sopra è nullo. In conclusione, risulta
∫ ∫ {[ ]
′ 4 ′ ∂L ∂Φα ∂L ∂(∂µ Φα )
δ L dx = + δψ β −
D′ D′ ∂ϕα ∂ψ β ∂(∂µ ϕα ) ∂ψ β
[ ]}
∂L ∂Φα
− δψ ∂µ
β
d4 x′ (B.18)
∂(∂µ ϕα ) ∂ψ β

294
Inoltre
[ ]
∂L ∂Φα ∂L ∂Φα ∂L ∂Φα
∂µ = ∂µ + ∂ µ (B.19)
∂(∂µ ϕα ) ∂ψ β ∂(∂µ ϕα ) ∂ψ β ∂(∂µ ϕα ) ∂ψ β

e poichè

∂Φα ∂(∂µ Φα )
∂µ =
∂ψ β ∂ψ β

ecco che il secondo addendo dell’espressione (B.19) cancella il secondo addendo


nella prima parentesi quadra della (B.18), per cui finalmente otteniamo
∫ ∫ { }
′ 4 ′ ∂L ∂Φα ∂L ∂Φα
δ L dx = J − ∂ µ δψ β d4 x
D′ D ∂ϕα ∂ψ β ∂(∂µ ϕα ) ∂ψ β
∫ { }
∂L ∂L ∂Φα
= J α
− ∂µ α β
δψ β d4 x (B.20)
D ∂ϕ ∂(∂µ ϕ ) ∂ψ

D’altronde la quantità in parentesi graffa è nulla, dato che i campi ϕ verificano


per ipotesi le equazioni di Eulero-Lagrange; dunque risulta cosı̀ dimostrato che
il principio di minima azione è valido anche per i campi ψ quando si prenda L′
come loro Lagrangiana.

Esempio

Supponiamo che ϕ sia un campo scalare e consideriamo la trasformazione di


coordinate lineare e locale, descritta da una generica matrice non degenere M .
Per definizione, si ha

x ↔ x′ : x′ = M x ⇒ x′α = M.αβ xβ ;
: x = M −1 x′ ⇒ xα = (M −1 )α.β x′β ;
ϕ(x) ↔ ψ(x′ ) : ψ(x′ ) ≡ Ψ(ϕ(x)) = ϕ(x)
: ϕ(x) ≡ Φ(ψ(x′ )) = ψ(x′ )

Chiaramente lo Jacobiano J della trasformazione di coordinate è costante (risul-


tando J = ||M ||) e le funzioni Φ, Ψ sono le funzioni identiche.
Partiamo dalla seguente densità lagrangiana che, come vedremo, descrive ap-
punto la dinamica libera del campo scalare di massa m

L = (∂µ ϕ)(∂ µ ϕ) − m2 ϕ2 ⇔ 2ϕ + m2 ϕ = 0 (B.21)

295
A causa dell’invarianza in valore della Lagrangiana sotto trasformazioni locali,
secondo la equazione (B.16), la dinamica del campo trasformato ψ è descritta
dalla nuova densità lagrangiana

L′ (ψ, ∂ν ψ) = L(Φ(ψ), ∂µ Φ(ψ)) (B.22)

Ma

Φ(ψ) = ψ ;
′ ′
∂µ Φ(ψ) = ∂µ ψ(x′ ) = ∂ν ψ ∂µ X ′ν = M.νµ ∂ν ψ

e quindi, sostituendo nella (B.22), otteniamo


′ ′ ′
L′ (ψ, ∂ν ψ) = (M.νµ ∂ν ψ)(M.σρ ∂σ ψ) δ ρµ − m2 ψ 2 (B.23)

dove δ νµ = g νµ = gνµ = δ νµ è l’elemento (νµ) del tensore metrico di Minkowski.


Con un poco di semplice algebra e definendo

Mτ. µ ≡ M.σρ δ ρµ δστ (B.24)

abbiamo allora
′ ′ ′
L′ (ψ, ∂ν ψ) = M.νµ M.σρ δ ρµ (∂ν ψ) (∂σ ψ) − m2 ψ 2
′ ′
= M.νµ M.σρ δ ρµ δστ (∂ν ψ) (∂ τ ψ) − m2 ψ 2
′ ′
≡ M.νµ Mτ. µ (∂ν ψ) (∂ τ ψ) − m2 ψ 2 (B.25)

Da quanto precede, concludiamo dunque che, in questo caso particolare, la densità


lagrangiana L′ , che descrive la dinamica del campo trasformato ψ, determinata287
dall’invarianza in valore a partire dalla densità lagrangiana L di cui alla (B.22),
è espressa appunto dalla funzione (B.25).

B.3 Invarianza in forma


Se, nell’esempio precedente, la matrice M è una matrice di Lorentz e dunque,
come sappiamo, descrive una trasformazione omogenea di coordinate che lega
due riferimenti inerziali fra loro, allora, poichè

(M )µα ≡ M.µα (M −1 )βµ ≡ Mµ. β ⇒ M.µα Mµ. β = δαβ

la densità lagrangiana L′ diventa dunque, come abbiamo visto


′ ′ ′
L′ (ψ, ∂ν ψ) = (∂ν ψ) (∂ ν ψ) − m2 ψ 2 (B.26)
287
Essa, per quanto già visto, non è l’unica densità lagrangiana possibile per il campo trasfor-
mato ψ, bensı̀ è quella determinata univocamente dall’invarianza in valore, a partire dalla
densità lagrangiana L .

296
i.e., la densità lagrangiana L′ dipende da ψ con la stessa dipendenza funzionale
con cui la densità lagrangiana L dipende da ϕ.
In questo caso, diciamo che la Lagrangiana è invariante in forma sotto la trasfor-
mazione locale considerata. Chiaramente, se questo accade, la dinamica del
campo ψ è formalmente la stessa di quella del campo ϕ, i.e. le equazioni di
moto per ψ sono formalmente identiche a quelle per ϕ.

Si noti, comunque, che, mentre l’invarianza in forma della densità lagrangiana


implica che le equazioni di moto restino formalmente le stesse, l’inverso non è a
priori vero. Per rendercene conto, consideriamo la seguente densità lagrangiana
che descrive la dinamica di un campo scalare, libero ma di massa nulla, i.e.

L = (∂µ ϕ)(∂ µ ϕ) ⇔ 2ϕ = 0 (B.27)

ed effettuiamo una trasformazione locale che sia una dilatazione uniforme delle
coordinate (trasformazione di scala),

x ↔ x′ : x′ = X ′ (x) = λx ⇒ x′α = λxα ;


: x = X(x′ ) = λ−1 x′ ⇒ xα = λ−1 x′α ;

ϕ(x) ↔ ψ(x ) : ψ(x′ ) ≡ Ψ(ϕ(x)) = ϕ(x)
: ϕ(x) ≡ Φ(ψ(x′ )) = ψ(x′ )

Chiaramente lo Jacobiano J della trasformazione di coordinate è costante, es-


sendo J = ||λ4 ||, cosı̀ come le funzioni Φ, Ψ sono, di nuovo, le funzioni identiche.
Si ha

Φ(ψ) = ψ ;
′ ′
∂µ Φ(ψ) = ∂µ ψ(x′ ) = ∂ν ψ ∂µ X ′ν = λ ∂ν ψ

perciò la densità lagrangiana L′ per il campo trasformato ψ che si determina a


partire dall’invarianza in valore, è
′ ′ ′
L′ (ψ, ∂ν ψ) = L(Φ(ψ), ∂µ Φ(ψ)) = λ2 (∂ν ψ)(∂ ν ψ) (B.28)

Poichè le equazioni di Eulero-Lagrange sono omogenee in L, il fattore λ2 in (B.28)


è irrilevante, per cui la dinamica del campo ψ è ancora descritta dall’equazione di
Klein-Gordon per massa nulla 2ψ = 0, cosı̀ come per il campo ϕ; ma la densità
lagrangiana (B.27) non risulta invariante in forma sotto la trasformazione locale
di cui sopra288

288
Come conseguenza, il teorema di Noëther che discuteremo in un prossimo paragrafo, non
associa al gruppo di dilatazione di cui sopra alcuna corrente conservata !

297
B.3.1 Alcuni esempi di lagrangiane
• Equazione di Schrödinger
Anche l’equazione di Schrödinger può essere ottenuta, via il principio di
minima azione, da una opportuna densità lagrangiana, funzione289 di ψ e
ψ ∗ e delle loro derivate.
Prendiamo infatti la seguente densità lagrangiana290
ih̄ ∗ ∗ h̄2
L = (ψ ∂0 ψ − ψ∂0 ψ ) + (∂i ψ ∗ )(∂ i ψ) − ψ ∗ V ψ (B.29)
2 2m
Dalla equazione del moto per ψ ∗
∂L ∂L
− ∂ µ =0 (B.30)
∂ψ ∗ ∂(∂µ ψ ∗ )
essendo
∂L ih̄

= ∂0 ψ − V ψ
∂ψ 2
∂L ih̄

= − ψ
∂(∂0 ψ ) 2
2
∂L h̄ i

= ∂ψ
∂(∂i ψ ) 2m
ne segue l’equazione291
ih̄ ih̄ h̄2 i
∂0 ψ − V ψ − ∂0 (− ψ) − ∂i ( ∂ ψ) = 0
2 2 2m
∂ h̄2 2
⇒ ih̄ ψ = − ∇ ψ+Vψ (B.31)
∂t 2m
che è appunto l’equazione di Schrödinger per il campo ψ.
Procedendo poi a partire dalla equazione analoga alla (B.30) relativa al
campo ψ, otteniamo l’equazione di moto per ψ ∗ , che risulta naturalmente
essere semplicemente la complessa coniugata della (B.31).
289
La densità lagrangiana deve essere reale e quindi deve dipendere dalla funzione d’onda ψ,
dalla sua complessa coniugata ψ ∗ (e loro derivate) in modo bilineare. Questo garantisce che le
equazioni del moto per ψ e ψ ∗ , dedotte a partire da essa, risultano effettivamente una complessa
coniugata dell’altra.
D’altronde ψ è costituita a partire da due funzioni reali fr ed fi indipendenti, che ne cos-
tituiscono rispettivamente la parte reale e la parte immaginaria. Queste stesse due funzioni
definiscono anche ψ ∗ e possono essere viste, in ultima analisi, come i campi basilari della teoria.
La struttura reale della lagrangiana garantisce però che questi due gradi di libertà, associati ai
due campi reali indipendenti fr ed fi , possono essere equivalentemente tenuti in conto trattando
direttamente ψ e ψ ∗ come fossero indipendenti tra loro ...
290
Per il potenziale V si è assunto che esso sia reale e funzione solo della posizione.
291
Si ricordi che ∂i = −∂ i e quindi che ∂i ∂ i = −∇2 .

298
• Campo scalare di massa m
La densità lagrangiana292 che descrive l’evoluzione libera del campo scalare,
reale, di massa m, come abbiamo già avuto modo di anticipare, è

L = (∂µ ϕ)(∂ µ ϕ) − m2 ϕ2 (B.32)

Sostituendo infatti la (B.32) nella (B.11), l’equazione di moto293 che si


ottiene è

−2 m2 ϕ − 2 ∂µ (∂ µ ϕ) = 0 ⇔ 2ϕ + m2 ϕ = 0 (B.33)

i.e. appunto l’equazione di Klein-Gordon per il campo scalare di massa m.


Questo campo può descrivere solo particelle neutre perché, essendo reale,
la densità lagrangiana che ne descrive l’evoluzione non può essere invari-
ante in forma per trasformazioni di gauge di prima specie, cioè sotto il
gruppo U (1) per cui ϕ → eiα ϕ. Nel caso di particelle cariche, infatti, come
vedremo, il campo ϕ deve essere intrinsecamente complesso. La densità
lagrangiana, che, per quanto detto, sarà comunque ancora necessariamente
reale, in questo caso, è semplicemente data da (chiaramente invariante in
forma sotto la trasformazione ϕ → eiα ϕ; ϕ∗ → e−iα ϕ∗ )

L = (∂µ ϕ)(∂ µ ϕ∗ ) − m2 ϕ ϕ∗ (B.34)

la quale, via il principio di minima azione, implica che sia il campo ϕ, come
il suo complesso coniugato ϕ∗ , soddisfino entrambi l’equazione di Klein-
Gordon per la massa m.

• Campo vettoriale di massa m


Una densità lagrangiana che descrive la dinamica libera del campo vettoriale
neutro di massa m è la seguente:

L = (∂µ ϕν )(∂ µ ϕν ) − m2 ϕν ϕν (B.35)

Usando questa densità lagrangiana nella (B.11), otteniamo infatti

−2 m2 ϕν − 2 ∂µ (∂ µ ϕν ) = 0 ⇔ 2ϕν + m2 ϕν = 0 (B.36)
292
Come abbiamo già avuto modo di osservare, la lagrangiana non è mai unica, essendo definita
a meno di una quadridivergenza e di una costante moltiplicativa non nulla. In questo senso
sarebbe più corretto parlare di ”una densità lagrangiana che descrive ...”.
Resta il fatto che la lagrangiana (B.32) è quella più semplice ed in questo senso risulta appunto
”la densità lagrangiana ...”
293
Ricordiamo che l’operatore di D’Alembert 2 è definito come

2 ≡ ∂µ ∂ µ ≡ ∂02 − ∇2

299
Se il campo è carico, analogamente al caso scalare, una densità lagrangiana
che ne descrive la dinamica è certamente la seguente

L = (∂µ ϕν )(∂ µ ϕ∗ν ) − m2 ϕν ϕ∗ν (B.37)

La densità lagrangiana (B.37) non è, comunque, l’unica possibile per il


campo vettoriale massivo (a parte la somma con una quadridivergenza).
Definiamo infatti il seguente tensore antisimmetrico a due indici

F µν ≡ ∂ µ ϕν − ∂ ν ϕµ ⇔ Fµν ≡ ∂µ ϕ∗ν − ∂ν ϕ∗µ (B.38)

e quindi poniamo294
1 µν ∗
L = F Fµν − m2 ϕν ϕ∗ν (B.40)
2
E’ facile ora concludere che le equazioni del moto per ϕν , che discendono
dalla densità lagrangiana precedente, sono le seguenti (per ϕ∗ν otteniamo,
naturalmente, le complesse coniugate !)

∂ µ Fµν + m2 ϕν = 0 (B.41)

ovvero, più esplicitamente

2ϕν + m2 ϕν − ∂ν ∂ µ ϕµ = 0 (B.42)

Queste equazioni risultano apparentemente diverse dall’equazione di Klein-


Gordon, ma, in realtà, la implicano in modo diretto, infatti, derivando la
(B.41) rispetto ad xν ed usando la proprietà di antisimmetria del tensore
Fµν ed il fatto che, per ipotesi, m ̸= 0, abbiamo che

∂ ν ∂ µ Fµν + m2 ∂ ν ϕν = 0 ⇒ m2 ∂ ν ϕν = 0 ⇒ ∂ ν ϕν = 0 (B.43)

dove, evidentemente, l’ultima equazione che seleziona le tre componenti del


campo che formano un sistema di spin S = 1, è conseguenza dell’equazione
294
Qui stiamo trattando il caso del campo carico, ma quanto stiamo dicendo resta vero anche
nel caso neutro.
Si osservi che la differenza fra le due densità lagrangiane (B.37) e (B.40) non è, a priori, una
quadridivergenza, infatti risulta
[ ]
[ µ ∗ 2 ν ∗
] 1 µ ν ( ∗ ∗
) 2 ν ∗
∆L = (∂µ ϕ )(∂ ϕν ) − m ϕ ϕν −
ν
(∂ ϕ − ∂ ϕ ) ∂µ ϕν − ∂ν ϕµ − m ϕ ϕν
ν µ
2
[ ]
= (∂ µ ϕν )(∂ν ϕ∗µ ) = ∂ν (∂ µ ϕν )ϕ∗µ − (∂ µ ∂ν ϕν )ϕ∗µ (B.39)

la quale coincide effettivamente con una quadridivergenza (primo termine della (B.39)) se il
campo soddisfa anche la condizione ∂ν ϕν = 0, la quale, però, non è garantita dalla densità
lagrangiana (B.37) ma solo dalla (B.40) e comunque solo nel caso di massa non nulla.

300
del moto (B.42) solo nel caso di m ̸= 0.
Dunque, nel caso in cui m ̸= 0, la densità lagrangiana (B.40) fornisce sia la
condizione di Lorentz ∂µ ϕµ = 0 che le equazioni di moto di Klein-Gordon
per le quattro componenti del campo (di cui, data la condizione di Lorentz,
solo tre sono indipendenti, coerentemente con il fatto che il campo descrive
entità di spin uno).
Nel caso del campo elettromagnetico Aµ , la densità lagrangiana295 che si
può usare per descriverne l’evoluzione è ancora la (B.40), la quale però
adesso, per il fatto che la massa è nulla ed il campo è reale, diventa
1 µν
L = F Fµν (B.46)
4
In questo caso, come ben noto, la condizione di Lorentz deve essere imposta
”ad hoc”, restando poi ancora libero un grado di libertà di gauge, per cui

Aµ → Aµ ≡ Aµ + ∂ µ Γ con 2Γ = 0.

La condizione di Lorentz ∂ µ Aµ = 0 esclude la possibilità del fotone scalare,


mentre l’arbitrarietà di gauge descrive il fatto che il fotone non ha polariz-
zazione longitudinale.

295
In realtà, volendo che la densità lagrangiana L sia tale per cui consenta di definire in
modo canonico la densità hamiltoniana (i.e. la densità d’energia) nel sistema di Gauss o di
Lorentz-Heaviside, occorrerebbe piuttosto usare, rispettivamente
1 1 ( 2 )
LG = − F µν Fµν ⇒ HG = E + B2 (B.44)
16π 8π
1 1( 2 )
LLH = − F µν Fµν ⇒ HLH = E + B2 (B.45)
4 2
Poiché la differenza con la (B.46) è sempre soltanto una costante moltiplicativa, evidentemente,
nulla cambia riguardo alle conclusioni circa le equazioni di moto.

301
• Campo di Dirac
Una densità lagrangiana che descrive l’evoluzione libera del campo classico
di Dirac è la seguente:
i
L = [ψγ µ (∂µ ψ) − (∂µ ψ)γ µ ψ] − m ψψ (B.47)
2
Usando questa Lagrangiana, derivando rispetto a ψ, dalla (B.11) otteniamo
l’equazione di Dirac per il campo ψ, infatti si ha

−m ψ − ∂µ (−i γ µ ψ) = 0 ⇔ (i γ µ ∂µ − m) ψ = 0 (B.48)

mentre, derivando rispetto a ψ, otteniamo l’equazione di Dirac per ψ

−m ψ − ∂µ (i ψ γ µ ) = 0 ⇔ i ∂µ ψ γ µ + m ψ = 0 (B.49)

Talvolta però si preferisce usare la densità lagrangiana seguente

L = i ψγ µ (∂µ ψ) − m ψψ (B.50)

la quale conduce alle stesse equazioni di moto e differisce dalla precedente


per la seguente quadridivergenza
i
∆L = ∂µ [ ψγ µ ψ ] (B.51)
2
la quale, come sappiamo è nulla sulle soluzioni dell’equazioni di Dirac.

302
B.4 Il teorema di Noëther
Abbiamo visto che, sotto ipotesi molto generali, una trasformazione locale lascia
la densità lagrangiana invariante in valore, i.e.

L′ (ψ, ∂ν ψ) = L(Φ(ψ), ∂µ Φ(ψ)) (B.52)

In alcuni casi, può anche risultare invariante in forma, i.e.


′ ′
L′ (ψ, ∂ν ψ) = L(Φ(ψ), ∂µ Φ(ψ)) = L(ψ, ∂ν ψ) (B.53)

In questo caso diciamo che la trasformazione locale agisce come una simmetria
per il sistema fisico che stiamo considerando. Una delle conseguenze, come ab-
biamo già messo in evidenza, è che le equazioni di Eulero-Lagrange per i campi
trasformati ψ coincidono formalmente con le equazioni del moto per i campi ϕ.
Se la densità lagrangiana è invariante in f orma sotto un gruppo di Lie di
trasformazioni ad m parametri, allora il teorema di Noëther afferma che ci sono
m quadricorrenti conservate.

Figure 20: Emmy Amalie Noether (1882-1935)

Prima di dimostrare il teorema, ricordiamo che un gruppo di Lie G ad m


parametri è un gruppo topologico in cui, almeno in un opportuno intorno aperto

303
dell’identità e, i suoi elementi g possono essere descritti analiticamente in termini
di m parametri reali296 , i.e. g = g(ω1 , ..., ωm ).
Senza perdita alcuna di generalità, si può assumere che i parametri (ω) siano
tali per cui

g(0) = e (B.54)

Assumeremo altresı̀ che esista una rappresentazione fedele (cioè biunivoca) del
gruppo G in un’algebra di operatori lineari opportuna A.
Indichiamo allora con A(ω) l’operatore corrispondente all’elemento g(ω) del gruppo
astratto: la (B.54) implica immediatamente che

A(0) = I (B.55)

dove I è l’operatore identico. Usando adesso l’analiticità della descrizione del


gruppo e quindi della sua rappresentazione fedele, ecco che potremo scrivere in
generale297

A(dω) = I − i dωk X k (B.56)

dove gli operatori X k sono, a loro volta, definiti dall’equazione



∂A(ω)
X ≡i
k
(B.57)
∂ωk ω=0

e costituiscono i generatori della rappresentazione data.


Poiché, fissato (ω), esiste uno ed un solo elemento del gruppo G che viene individ-
uato da quel set di parametri, per definizione di rappresentazione fedele, anche la
funzione A(ω) dovrà essere iniettiva, per cui gli m generatori definiti dalla (B.57)
risultano necessariamente indipendenti.
Sophus Lie ha dimostrato come i generatori possono essere definiti anche per
il gruppo astratto senza far ricorso alle sue rappresentazioni: i gruppi per cui
questo accade sono appunto i gruppi di Lie; ma non è questo il luogo per trattare
questi aspetti formali, anche perché l’interesse fisico per i gruppi passa sempre,
in ultima analisi, attraverso loro rappresentazioni ...
Torniamo dunque alla rappresentazione fedele A(g) di cui sopra.
Abbiamo visto che, in prossimità dell’identità essa è completamente definita dagli
m generatori indipendenti X k ; ma che accade se ci allontaniamo dall’identità in
296
C’è, evidentemente, una enorme libertà di scelta riguardo al modo di effettuare la
parametrizzazione degli elementi del gruppo, l’unico vincolo restando quello per cui, dati co-
munque ω1 ed ω2 nello spazio dei parametri, allora dovrà essere che se g(ω) = g(ω1 ) g(ω2 ) allora
la funzione ω = Ω(ω1 , ω2 ) deve essere analitica.
297
Si osservi che un’analoga relazione per il gruppo astratto non sarebbe stata possibile in
quanto nel gruppo non è definita l’operazione di somma, mentre, ovviamente, essa è definita
nell’algebra operatoriale ...

304
modo significativo ?
Data l’ampia libertà di scelta riguardo alla parametrizzazione del gruppo già
messa in evidenza, possiamo cercare di definire una maniera di ”allontanarci”
dall’origine tale da condurre a risultati particolarmente semplici quanto alla forma
analitica della parametrizzazione stessa.
Consideriamo per questo una generica trasformazione infinitesima
A(dω) = I − i dωk X k (B.58)
ed immaginiamo di innalzarla ad una potenza opportuna, peraltro qualsiasi: evi-
dentemente, per la proprietà della legge di moltiplicazione all’interno del gruppo,
questa operazione conduce comunque ad un opportuno elemento del gruppo
stesso! Questo fatto suggerisce allora un possibile modo di parametrizzazione
degli elementi del gruppo, tale che
( )n
ωk k
A(ω) = n→∞
lim 1−i X ≡ e−i ω·X (B.59)
n
che è appunto la cosiddetta rappresentazione esponenziale, la quale, per quanto
detto a proposito dello spazio dei parametri, deve essere senz’altro possibile, al-
meno in tutto un intorno dell’identità aperto e connesso.
Questo risultato è importante in quanto riduce la descrizione completa della
generica rappresentazione298 del gruppo su un’algebra operatoriale alla semplice
conoscenza dei suoi generatori, i quali costituiscono in modo naturale, uno spazio
vettoriale299 sul corpo complesso.
Se adesso consideriamo una ”direzione” fissata nello spazio dei parametri da
un qualsiasi versore300 ω̂, possiamo allora considerare la famiglia degli operatori
Â(λ) ≡ e−i λ ω̂k X . In questa famiglia la legge di moltiplicazione è particolarmente
k

semplice, risultando301
Â(λ1 ) Â(λ2 ) = Â(λ1 + λ2 ) (B.61)
298
A rigore quanto stiamo dicendo vale per le rappresentazioni su algebre operatoriali della
rappresentazione fedele; ma siccome questa è isomorfa al gruppo, vale anche per le rappresen-
tazioni su algebre operatoriali del gruppo astratto.
299
Come vedremo, questo spazio lineare dei generatori, con l’operazione di composizione in-
terna rappresentata dal∑commutatore, assume la struttura detta di algebra di Lie.
300
E dunque tale che k ω̂k ω̂k = 1.
301
Infatti, definito l’operatore X ≡ ω̂k X k , risulta evidentemente che
∑ (λ1 X)r ∑ (λ2 X)s
Â(λ1 ) Â(λ2 ) = e−i λ1 X e−i λ2 X = (−i)r · (−i)s = e−i(λ1 −λ2 ) X (B.60)
r! s!
r≥0 s≥0

dove l’ultima eguaglianza discende direttamente dal fatto che risulta evidentemente che

n
n!
(λ1 X + λ2 X)n = (λ1 X)k (λ2 X)(n−k)
k!(n − k)!
k=0

305
Ma se moltiplichiamo, invece, elementi della rappresentazione fedele del gruppo
relativi a ”direzioni” differenti nello spazio dei parametri, il parametro che indi-
vidua l’elemento prodotto risultante, in generale, non è espresso in modo altret-
tanto semplice in termini dei parametri che individuano i suoi ”fattori”.
Possiamo comunque dire di nuovo che, almeno in un intorno opportuno dell’identità,
dovrà essere

e−i αk X · e−i βs X = e−i δj X e−i α·X · e−i β·X = e−i δ·X


k s j
i.e. (B.62)

per una opportuna direzione δ ≡ (δj ), funzione solo delle due direzioni iniziali
α ≡ (αk ) e β ≡ (βs ). La teoria dei gruppi di Lie mostra che questo può ac-
cadere se e solo se lo spazio vettoriale dei generatori è chiuso sotto l’operazione
di commutazione, ovvero se e solo se accade che
[ ]
X k , X s = i f ksj X j (B.63)

dove gli f ksj sono coefficienti in generale complessi, detti costanti di struttura del
gruppo, proprio perché essi non dipendono dalla particolare rappresentazione con-
siderata e sono quindi gli stessi per tutte. Come abbiamo già in parte anticipato,
l’operazione di composizione interna302 nello spazio dei generatori rappresentata
dal commutatore, nel caso in cui valga la (B.63), conferisce per definizione allo
spazio in questione la struttura di algebra di Lie.
Ma veniamo adesso alla dimostrazione dell’asserzione precedente.
Se vale la (B.62) allora risulta che
[ ]
−i δ · X = ln I + e−i α·X e−i β·X − I ≡ ln [I + K] (B.64)

dove si è definito

K ≡ e−i α·X e−i β·X − I =


[ ] [ ]
1 1
= I + (−iαX) + (−iαX)2 + ... · I + (−iβX) + (−iβX)2 + ... − I =
2 2
1 1
= −iαX − iβX − (αX)(βX) − (αX)2 − (βX)2 + ... (B.65)
2 2
e dunque, dallo sviluppo della funzione ln(1 + x)
1 1 1
−i δX = K − K 2 + K 3 − K 4 + ... (B.66)
2 3 4
Si osservi che il ”prodotto” rappresentato dal commutatore che indicheremo anche con ∧
302

ponendo [A, B] ≡ A ∧ B , non è associativo, ma vale l’identità di Jacobi per cui

A ∧ (B ∧ C) + B ∧ (C ∧ A) + C ∧ (A ∧ B) = 0

306
ricaviamo che, al secondo ordine, risulta
1 1
−i δ · X = −iαX − iβX − (αX)(βX) − (αX)2 − (βX)2 + ...
2 2
1[ ]
− 2 2
(−iαX) + (−iβX) + (−iαX)(−iβX) + (−iβX)(−iαX) + ... =
2
1
= −iαX − iβX − [αX, βX] (B.67)
2
ovvero, più esplicitamente

[αX, βX] = 2i (δX − αX − βX)


[ ]
⇔ αk βs X k , X s = 2i(δj − αj − βj ) X j (B.68)

la quale evidentemente
[ ] richiede, per poter essere verificata in generale, che il
commutatore X k , X s sia un elemento dello spazio lineare dei generatori, ovvero
appunto che valga la (B.63).
In questa ipotesi, e dunque nel caso che i generatori formino un’algebra di Lie,
per quanto visto sopra, al secondo ordine perturbativo risulta evidentemente che
1
−i δ · X = −iαX − iβX − [αX, βX] ⇒
2
1
⇒ −i δj · X j = −iαj X j − iβj X j − αr βs (i f rsj X j ) ⇒
2
1
⇒ δj = αj + βj + αr βs f rsj (B.69)
2
dove l’ultima eguaglianza discende dalla indipendenza lineare dei generatori X k .
Il punto importante è che, procedendo agli ordini successivi, non è necessario
imporre alcuna altra condizione ai generatori, bensı̀ bastano le costanti di strut-
tura del gruppo per poter esprimere, a qualunque ordine perturbativo, i parametri
(δ) in funzione dei parametri (α) e (β).
Le costanti di struttura303 in un gruppo di Lie riassumono, in buona sostanza, la
legge di moltiplicazione nel gruppo.

Ma torniamo adesso al punto da cui siamo partiti, cioè dalla dimostrazione del
teorema di Noëther.
Supponiamo allora che sia dato un gruppo di Lie G ad m parametri reali
G = {g(ω)} e supponiamo altresı̀ che siano assegnati opportuni campi ϕα (x)
dove α = 1, ..., n. Ammettiamo quindi che il gruppo G descriva trasformazioni
303
Come abbiamo detto, fissata la parametrizzazione, le costanti di struttura non dipendono
dalla rappresentazione ma solo dal gruppo. Però, cambiando parametrizzazione, ovvero, in altri
termini, cambiando base nello spazio dei generatori, queste, evidentemente, possono cambiare!

307
locali sui campi assegnati, tali che, per trasformazioni infinitesime, risulti
x → x′ : x′µ = xµ + Ξµa (x) dωa ≡ xµ + δxµ (B.70)
ϕα (x) → ψ α (x′ ) : ψ α (x′ ) = (δβα + Γαaβ dωa ) ϕβ (x) ≡ ϕα (x) + δϕα (x) (B.71)
Supponiamo ora che la dinamica dei campi sia descritta dalla densità lagrangiana
L = L(ϕα , ∂µ ϕα , x) ed assumiamo che essa sia invariante in forma sotto il gruppo
di Lie delle trasformazioni di cui sopra. Questo significa che essa lo sarà, in
particolare, per trasformazioni infinitesime.
Consideriamo allora l’integrale di azione


L′ (ψ, ∂ν ψ, x′ ) d4 x′ (B.72)
D′

A causa dell’invarianza in valore della densità lagrangiana, questo integrale coin-


cide con l’integrale di azione per i campi non trasformati, calcolato nel dominio
non trasformato D, usando la densità lagrangiana originale, i.e.
∫ ∫

L′ (ψ, ∂ν ψ, x′ ) d4 x′ = L(ϕ, ∂µ ϕ, x) d4 x (B.73)
D′ D

Comunque, essendo L invariante in forma, L′ = L, per cui si ha


∫ ∫ ∫
′ ′ ′ 4 ′ ′
L (ψ, ∂ν ψ, x ) d x = L(ϕ, ∂µ ϕ, x) d x = 4
L(ψ, ∂ν ψ, x′ ) d4 x′
D′ D D′

dove l’uguaglianza fra il primo ed il secondo membro vale a causa dell’invarianza


in valore, mentre quella fra il primo ed il terzo vale a causa dell’invarianza in
forma della densità lagrangiana.
Siccome la trasformazione è infinitesima, possiamo scrivere
∫ ∫ ∫

L(ψ, ∂ν ψ, x′ ) d4 x′ = L(ψ, ∂ν ψ, x) d4 x + L(ϕ, ∂ν ϕ, x)δxρ dσρ
D′ D Σ

dove Σ è la frontiera del dominio D e nel secondo integrale abbiamo sostituito ψ


con ϕ, approssimando cosı̀ la densità lagrangiana all’ordine zero, dato il fatto che
l’integrando contiene già il fattore δxρ , che è già infinitesimo del primo ordine.
Allo stesso ordine di approssimazione, si ha anche che
ψ α (x) = ψ α (x′ ) − ∂µ ϕα δxµ = ϕα (x) + δϕα (x) − ∂µ ϕα (x) δxµ
( )
≡ ϕα (x) + Γαaβ ϕβ (x) − ∂µ ϕα (x) Ξµa (x) dωa ≡ ϕα (x) + δϕα (x) (B.74)
e perciò
∫ ∫

0 = L(ψ α , ∂ν ψ α , x′ ) d4 x′ − L(ϕα , ∂ν ϕα , x) d4 x =

∫D ∫ D ∫
= L(ψ , ∂ν ψ , x) d x +
α α 4
L(ϕ , ∂ν ϕ , x)δx dσρ −
α α ρ
L(ϕα , ∂ν ϕα , x) d4 x =
D Σ D
∫ ∫
= L(ϕ + δϕ , ∂ν (ϕ + δϕ ), x) d x +
α α α α 4
L(ϕα , ∂ν ϕα , x)δxρ dσρ −
∫D Σ

− L(ϕ , ∂ν ϕ , x) d x
α α 4
D

308
da cui, prendendo la differenza fra il primo ed il terzo addendo e ritrasformando
all’indietro, via il teorema di Gauss, l’integrale di superficie su Σ in un integrale
di volume su D, si ottiene
∫ { }
α∂L ∂L
0 = δϕ α
+ ∂µ (δϕα ) + ∂µ (L δxµ ) d4 x (B.75)
D ∂ϕ ∂(∂µ ϕα )
Comunque, dalle equazioni di Eulero-Lagrange per i campi ϕ, sappiamo che
∂L L
= ∂ µ
∂ϕα ∂(∂µ ϕα )
perciò
[ ]
α∂L ∂L ∂L ∂L ∂L
δϕ α
+ ∂µ (δϕα ) α
= δϕα ∂µ α
+ ∂µ (δϕα ) α
= ∂µ δϕα
∂ϕ ∂(∂µ ϕ ) ∂(∂µ ϕ ) ∂(∂µ ϕ ) ∂(∂µ ϕα )

Usando questo risultato nella equazione (B.75), finalmente otteniamo


∫ { }
∂L
0 = ∂µ δϕ α
α
+ L δxµ d4 x (B.76)
D ∂(∂µ ϕ )
Poichè il dominio D è qualsiasi, questo risultato implica che
{ }
∂L
∂µ δϕ α
+ L δxµ = 0 (B.77)
∂(∂µ ϕα )
Ma siccome
( )
δϕα ≡ Γαaβ ϕβ (x) − ∂ν ϕα (x) Ξνa (x) dωa (B.78)
δx µ
≡ Λµa (x) dωa (B.79)

abbiamo
{ }
[ ] ∂L
∂µ Γαaβ ϕ (x) − ∂ν ϕ (x)
β α
Ξνa (x) + L Ξµa (x) dωa = 0 (B.80)
∂(∂µ ϕα )
Poiché i parametri del gruppo di Lie dωa sono tra loro indipendenti, questo risul-
tato significa che, se definiamo (abbiamo cambiato di segno ...) le m quadricor-
renti seguenti
[ ] ∂L
Θµa (x) ≡ −Γαaβ ϕβ (x) + ∂ν ϕα (x) Ξνa (x) α
− L Ξµa (x) (B.81)
∂(∂µ ϕ )
allora ognuna di esse è separatamente conservata, i.e. soddisfa l’equazione di
continuità

∂µ Θµa (x) = 0 (B.82)

309
e questo è appunto quanto afferma il teorema di Emmy Noëther !
Ricordiamo adesso che
( )
∂ ∂ ⃗
∂µ ≡ ⇒ ∂µ ≡ , ∇ (B.83)
∂xµ ∂t
( )
quindi, definendo analogamente Θµa ≡ Θ0a , Θ
⃗ a abbiamo

∂ 0 ⃗ ⃗
∂µ Θµa = 0 ⇐⇒ Θ + ∇ · Θa = 0 (B.84)
∂t a
Integrando adesso in tutto lo spazio, risulta quindi
∂ ∫ 3 ∫
d x Θ0a (x) + d3 x ∇
⃗ ·Θ
⃗ a (x) = 0 (B.85)
∂t
Ma il secondo integrale, via il teorema della divergenza di Gauss, può essere
trasformato in un integrale di superficie all’infinito e se assumiamo che i campi
si annullino propriamente, esso è nullo, per cui, posto

Q(t) ≡ d3 x Θ0a (x) (B.86)

la grandezza fisica Q(t) è conservata dalla dinamica.

B.4.1 L’invarianza sotto il gruppo di Poincaré


Iniziamo supponendo che la densità lagrangiana L = L(ϕα , ∂µ ϕα ) sia invariante in
forma per traslazioni spazio-temporali (e per questo è sufficiente che non dipenda
esplicitamente dalle coordinate).
Il gruppo di Lie di simmetria è dunque il gruppo delle traslazioni e le trasfor-
mazioni da considerare sono quindi le seguenti

x → x′ : x µ = xµ + aµ (B.87)
ϕα (x) → ψ α (x′ ) = ϕα (x) (B.88)

che, riscritte per trasformazioni infinitesime nel linguaggio usato in precedenza,


diventano

x → x′ : x µ = xµ + δaµ dω a (B.89)
ϕα (x) → ψ α (x′ ) = ϕα (x) (B.90)

Nelle notazioni usate per dimostrare il teorema di Noëther, abbiamo quindi

Γαaβ = 0; Ξµa (x) = δaµ (B.91)

310
dove a è un indice che va da 0 a 3 e descrive appunto i quattro gradi di libertà
di traslazione. Dalla (B.81) abbiamo allora che le quadricorrenti conservate,
individuate dall’indice a ≡ ν, sono le seguenti
∂L ∂L
Θµν (x) = ∂ρ ϕα δνρ α
− L δνµ = ∂ν ϕα α
− L δνµ (B.92)
∂(∂µ ϕ ) ∂(∂µ ϕ )
da cui segue, per quanto detto prima, la conservazione delle quattro quantità
∫ ∫ ( )
∂L
Pν (t) ≡ 3
dx Θ0ν (x) = 3
d x ∂ν ϕ α
− L δν0 (B.93)
∂(∂0 ϕα )
Non è difficile, adesso, riconoscere nel tensore Θµν definito dalla (B.92) il consueto
tensore energia-impulso304 , ovvero il tensore canonico degli sforzi
∂L ∂L
Tµν (x) ≡ µ α
∂ν ϕα − L δµν ⇔ T.µν (x) ≡ α
∂ν ϕα − L δνµ (B.94)
∂(∂ ϕ ) ∂(∂µ ϕ )
per cui il teorema di Noëther mostra come la conservazione del quadrimpulso305
in un sistema isolato sia la conseguenza dell’invarianza (simmetria) per traslazioni
della densità lagrangiana del sistema considerato.
Prima di continuare, osserviamo che, usando il tensore (B.92) e la definizione
(B.94), possiamo riscrivere in modo più semplice anche la (B.81), mettendo in
evidenza, nella corrente conservata, il contributo legato all’effetto della trasfor-
mazione sulle coordinate e quello sui campi stessi.
Si ha infatti, in generale, che
[ ] ∂L
Θµa (x) ≡ −Γαaβ ϕβ (x) + ∂ν ϕα (x) Ξνa (x) − L Ξµa (x) =
∂(∂µ ϕα )
∂L
= −Γαaβ ϕβ (x) + T.µρ (x) Ξρa (x) (B.97)
∂(∂µ ϕα )
304
cfr. J.D. Bjorken, S.D. Drell: Relativistic Quantum Fields, pag. 18
Si osservi come, per come è stato definito, il tensore degli sforzi canonico Tµν ≡ δµρ Θρν non è
necessariamente simmetrico.
305
La componente temporale del quadrimpulso è naturalmente l’energia e dunque la sua den-
sità, ovvero la densità hamiltoniana, è data dunque da
∂L
H = Θ00 = ∂0 ϕα − δ00 L (B.95)
∂(∂0 ϕα )
Come si vede, H è la somma di due termini: il primo, che è il termine cinetico è, in gen-
erale, intrinsecamente tensoriale (ovvero non diagonale), mentre il secondo è semplicemente
proporzionale al tensore metrico (componente (00)) attraverso lo scalare di Lorentz rappresen-
tato dalla densità lagrangiana L.
Nel caso in cui sia presente una interazione, se la densità lagrangiana che la descrive non contiene
accoppiamenti derivativi e quindi non ci sono ulteriori contributi al termine cinetico ”libero”,
ecco dunque, come abbiamo già avuto modo di osservare, che risulta
HI (x) = −LI (x) (B.96)

311
Veniamo adesso alle conseguenze che derivano, via il Teorema di Noëther,
dall’invarianza in forma della densità lagrangiana sotto il gruppo di Lorentz.
Per ipotesi, la legge di trasformazione locale che lascia invariante in forma la
densità lagrangiana è adesso la seguente

x → x′ : x µ = Λµ.ν xν (B.98)
ϕα (x) → ψ α (x′ ) = S(Λ)α.β ϕβ (x) (B.99)

dove S sta ad indicare l’opportuna rappresentazione del gruppo di Lorentz che


agisce nello spazio n−dimensionale delle componenti del campo ϕα assegnato.
Ma il gruppo di Lorentz (ortocrono proprio) è parametrizzato come gruppo di
Lie nel modo seguente

Λ = e− 2 ωαβ J ;
i αβ
(J αβ )µ.ν = i(δ αµ δνβ − δ βµ δνα ) (B.100)
− 2i Σαβ
⇒ S(Λ) = e ωαβ
; (B.101)

dove ωαβ sta per la matrice reale antisimmetrica dei parametri, mentre J αβ e Σαβ
sono i generatori, rispettivamente, della rappresentazione del gruppo di Lorentz
sull’algebra operatoriale che agisce sui quadrivettori e su quella che opera sulle
componenti del campo assegnato.
In termini di trasformazioni infinitesime, risulta allora
′ 1 ( )µ
x → x′ : x µ = xµ + ωρτ Jˆρτ xν (B.102)
2 . ν
1 ( )α
α ′
ϕ (x) → ψ (x ) = ϕ (x) + ωρτ Σ̂ρτ
α α
ϕβ (B.103)
2 . β

dove abbiamo posto306


( )µ
Jˆρτ ≡ −i J ρτ ⇒ Jˆρτ = (δ ρµ δντ − δ τ µ δνρ ) (B.104)

Σ̂ρτ ≡ −i Σρτ (B.105)

Nelle notazioni (B.70) e (B.71), le (B.102) e (B.103) implicano307 , evidentemente,


che
( )µ
(Ξρτ )µ = Jˆρτ xν ; (Γρτ )αβ = (Σ̂ρτ )α.β (B.106)

306
Per la rappresentazione S = S(Λ) non abbiamo, a priori, niente di simile al tensore metrico
per agire sugli indici. Comunque, per semplice similitudine con il caso quadrivettoriale, abbiamo
posto per definizione
S(Λ)αβ ≡ S(Λ)α . β ⇒ (Σ̂)αβ ≡ (Σ̂). β
α

Gli indici α e β sono quindi, rispettivamente, gli indici di riga e di colonna e vanno da 1 ad n,
dove n è il numero di componenti del campo.
307
Si ricordi ancora una volta che ωρτ e dunque Jˆρτ e Σ̂ρτ sono entità antisimmetriche negli
indici (ρ, τ ), e dunque il fattore 1/2 serve semplicemente a compensare questo fatto ...

312
per cui, usando la (B.97), possiamo concludere che sono conservate le seguenti
sei correnti
∂L ( )
(Θρτ )µ (x) = −(Σ̂ρτ )α.β ϕβ (x) + T.
µ
σ (x) ˆρτ σ xν
J (B.107)
∂(∂µ ϕα ) .ν

ovvero, cambiando di segno, abbiamo infine


∂L
(Θρτ )µ (x) = (Σ̂ρτ )α.β ϕβ (x) α
− T.µσ (x) [δ ρσ δντ − δ τ σ δνρ ] xν =
∂(∂µ ϕ )
∂L
= α
(Σ̂ρτ )α.β ϕβ (x) − T µρ (x) xτ + T µτ (x) xρ (B.108)
∂(∂µ ϕ )

Il teorema di Noëther, come sappiamo, assicura che le sei quantità seguenti



Q ρτ
= d3 x (Θρτ )0 (x)

sono conservate dalla dinamica.


Vediamo adesso quale è il loro significato fisico. Poniamo dunque
( )
rµ ≡ (t, ⃗r) = (t, x, y, z); P µ (x) ≡ (P 0 (x), P⃗ (x)) = T 00 (x), T 01 (x), T 02 (x), T 03 (x)

dove P µ (x), per quanto detto sopra, rappresenta la densità di quadrimpulso.


Definiamo quindi
( )0 ∂L
J1 (x) ≡ Θ23 (x) = α
(Σ̂23 )α.β ϕβ (x) + T 03 (x) y − T 02 (x) x =
∂(∂0 ϕ )
( )
= S1 + ⃗r × P⃗ (x) (B.109)
1
( )0 ∂L
J2 (x) ≡ Θ31 (x) = (Σ̂31 )α.β ϕβ (x) + T 01 (x) z − T 03 (x) x =
∂(∂0 ϕα )
( )
= S2 + ⃗r × P⃗ (x) (B.110)
2
( )0 ∂L
J3 (x) ≡ Θ12 (x) = α
(Σ̂12 )α.β ϕβ (x) + T 02 (x) x − T 01 (x) y =
∂(∂0 ϕ )
( )
= S3 + ⃗r × P⃗ (x) (B.111)
3

ovvero (le componenti P⃗k (x) stanno, nella formula che segue, per le densità delle
componenti spaziali di P µ (x) ≡ T 0µ (x) ...)
{ }
1 ( )0 1 ∂L
Ji (x) ≡ ϵijk Θjk (x) = ϵijk (Σ̂jk )α.β ϕβ (x) + P⃗k (x) rj − P⃗j (x) rk (B.112)
2 2 ∂(∂0 ϕα )

in cui riconosciamo la densità


( di momento
) angolare totale associato al campo,
fatto sia dalla parte orbitale ⃗r × P (x) che da un termine di spin S
⃗ ⃗ del campo,

313
legato alle Σ̂, cioè alla rappresentazione del gruppo delle rotazioni nello spazio
delle componenti del campo stesso.
La conservazione della quantità integrale

d3 x Ji (x)

esprime dunque la conservazione del momento angolare totale (orbitale e di spin)


come conseguenza dell’invarianza in forma della densità lagrangiana del sistema
sotto il gruppo di Lorentz (e quindi sotto il gruppo delle rotazioni).

Le altre tre quantità conservate a causa dell’invarianza sotto il gruppo di


Lorentz provengono dalle seguenti densità
( )0 ∂L
K1 (x) ≡ Θ01 (x) = (Σ̂01 )α.β ϕβ (x) + T 01 (x) t − T 00 (x) x (B.113)
∂(∂0 ϕα )
( )0 ∂L
K2 (x) ≡ Θ02 (x) = α
(Σ̂02 )α.β ϕβ (x) + T 02 (x) t − T 00 (x) y (B.114)
∂(∂0 ϕ )
( )0 ∂L
K3 (x) ≡ Θ03 (x) = α
(Σ̂03 )α.β ϕβ (x) + T 03 (x) t − T 00 (x) z (B.115)
∂(∂0 ϕ )
i.e.
∂L
Ki (x) = (Σ̂0i )α.β ϕβ (x) + P⃗i (x) t − P 0 (x) ⃗ri (B.116)
∂(∂0 ϕα )
Se definiamo allora

∂L
σi (t) ≡ d3 x (Σ̂0i )α.β ϕβ (x) (B.117)
∂(∂0 ϕα )

P⃗i (t) ≡ d3 x P⃗i (x) (B.118)
∫ ∫
d3 x P 0 (x) ⃗ri
r̄i ≡ ∫ ⇒ d3 x P 0 (x) ⃗ri = r̄i (t) P 0 (t) (B.119)
d3 x P 0 (x)
ecco che, da quanto sopra, segue che, qualunque sia i = 1, 2, 3, la somma delle
tre quantità
Bi ≡ σi (t) + t P⃗i (t) − r̄i (t) P 0 (t) (B.120)
è indipendente dal tempo e dunque le tre Bi sono separatamente costanti del
moto.
Nel caso particolare di un campo scalare, per il quale il termine σi è assente
essendo nulle le Σ̂, abbiamo che
Bi = t P⃗i (t) − r̄i (t) P 0 (t) (B.121)
la quale, quando ci sia anche invarianza per traslazioni spazio-temporali e quindi
P⃗ e P 0 siano anch’esse costanti del moto, finisce per esprimere semplicemente
la costanza della velocità del moto del centro di massa del sistema dei campi
considerato.

314
• Il campo elettromagnetico libero

Vediamo adesso, nel caso del campo elettromagnetico (libero), la forma as-
sunta dalle correnti conservate legate all’invarianza in forma sotto il gruppo di
Poincaré della densità lagrangiana che descrive la dinamica del campo stesso.
Poniamoci nel sistema di unità di misura di Gauss, nel quale la densità la-
grangiana del campo elettromagnetico da cui partiremo assume la forma seguente308
1
L(x) = − Fµν (x) F µν (x) (B.122)
16π
invariante in forma, evidentemente, sia per traslazioni spazio-temporali che per
trasformazioni di Lorentz.
Dall’invarianza per traslazioni spazio-temporali, secondo la (B.92) e la (B.94),
ne discende la conservazioni di quattro correnti legate al tensore degli sforzi nel
modo seguente
∂L
∂ µ Tµν (x) = 0; Tµν = µ α
∂ν Aα − δµν L (B.123)
∂(∂ A )

il cui significato fisico, come noto, è che le quattro quantità conservate



Pν ≡ d3 x T0ν (x) (B.124)

costituiscono il quadrimpulso (componenti covarianti) associato al campo elet-


tromagnetico.
Quanto alla sua forma esplicita, abbiamo che, essendo
[ ]
∂L ∂ 1
ρ α
= ρ α
− (∂µ Aν − ∂ν Aµ ) (∂ µ Aν − ∂ ν Aµ ) =
∂(∂ A ) ∂(∂ A ) 16π
1 1
= − 4Fρα = − Fρα (B.125)
16π 4π
risulta evidentemente che
1
Tµν = − Fµα ∂ν Aα − δµν L (B.126)

Ma

Fµα ∂ν Aα = Fµα (∂ν Aα − ∂ α Aν ) + Fµα ∂ α Aν =


= Fµα Fν. α + ∂ α (Fµα Aν ) − (∂ α Fµα ) Aν (B.127)
308
Come abbiamo già osservato, questa densità lagrangiana non è comunque sufficiente a
definire completamente le equazioni di moto: occorre imporre separatamente sia la condizione
di Lorentz (∂µ Aµ = 0) che quella di arbitrarietà di gauge (Aµ → Aµ + ∂ µ Γ con 2Γ = 0).

315
D’altronde, usando sia le equazioni di moto (i.e. 2Aµ = 0) che la condizione di
Lorentz (i.e. ∂ µ Aµ = 0), risulta

∂ α Fµα = ∂ α (∂µ Aα − ∂α Aµ ) = ∂µ ∂ α Aα − 2Aµ = 0 (B.128)

quindi abbiamo infine che


1
Tµν = − {Fµα Fν. α + ∂ α (Fµα Aν ) + 4π δµν L} (B.129)

Osserviamo che il tensore degli sforzi Tµν di cui alla (B.129) non è simmetrico a
causa della presenza del termine tensoriale Πµν definito come

1 α
Πµν = − ∂ (Fµα Aν ) (B.130)

Questo termine ha le seguenti caratteristiche

• non è gauge-invariante (nessuna meraviglia: la condizione di invarianza di


gauge, come sappiamo, deve essere imposta ”ad hoc” e non è una con-
seguenza delle equazioni di moto determinate dalla densità lagrangiana);

• soddisfa esso stesso la condizione di conservazione ∂ µ Πµν = 0, come è ovvio


dal fatto che
1
∂ µ Πµν = − ∂ µ ∂ α (Fµα Aν )

ed il tensore di Maxwell Fµα è antisimmetrico;

• il contributo al quadrimpulso Pν ci cui alla (B.124) proveniente da questo


termine è comunque nullo, infatti

1 ∫ 3 α 1 ∫ 3 i
d x Π0ν (x) = −
3
d x ∂ (F0α Aν ) = − d x ∂ (F0i Aν ) ≡ 0 (B.131)
4π 4π
dove abbiamo usato il fatto che F00 = 0 e che l’integrando ∂ i (F0i Aν ) è una
divergenza per cui il suo integrale è nullo per via del teorema di Gauss,
almeno se i campi si annullano propriamente all’infinito.

Possiamo quindi, limitatamente al calcolo del quadriimpulso del campo, usare, al


posto del tensore Tµν di cui alla (B.129), il tensore simmetrico T̂µν cosı̀ definito

1
T̂µν = − {Fµα Fν. α + 4π δµν L} (B.132)

Vediamone la forma esplicita.

316
⃗ e del campo mag-
Iniziamo ricordando che, in termini del campo elettrico E
⃗ abbiamo
netico B,
 
0 − E1 − E2 − E3
 E1 0 − B3 B2 
 
F µν ≡ ∂ µ Aν − ∂ ν Aµ =   (B.133)
 E2 B3 0 − B1 
E3 − B2 B1 0

per cui ne segue che


1 1 ( ) 1 ( 2 )
L(x) = − Fµν (x) F µν (x) = − −2E 2 + 2B 2 = E − B 2 (B.134)
16π 16π 8π
mentre risulta

Fµα Fν. α = Fµα Fνρ δ ρα = Fµ. ρ Fνρ = −Fµ. ρ Fρν =


  
0 − E1 − E2 − E3 0 E1 E2 E3
 −E1 0 B3 − B2  −E1 0 − B3 B2 
  
= −  =
 −E2 − B3 0 B1  −E2 B3 0 − B1 
−E3 B2 − B1 0 −E3 − B2 B1 0
 
E12 + E22 + E32 E3 B2 − E2 B3 E1 B3 − E3 B1 E2 B1 − E1 B2
 E3 B2 − E2 B3 − E12 + B22 + B32 − E1 E2 − B1 B2 − E1 E3 − B1 B3 
 
= − 
 E1 B3 − E3 B1 − E1 E2 − B1 B2 B12 − E22 + B32 − E2 E3 − B2 B3 
E2 B1 − E1 B2 − E1 E3 − B1 B3 − E2 E3 − B2 B3 B12 + B22 − E32

per cui abbiamo


( )
1 1 E2 − B2 1 ( 2 )
T̂00 = − (F0α F0. α + 4πL) = − −E 2 + = E + B2 (B.135)
4π 4π 2 8π
1 1 1 ( )
T̂01 = − [F0α F1. α ] = − [− (E3 B2 − E2 B3 )] = − ⃗ ×B
E ⃗ (B.136)
4π 4π 4π 1
1 1 1 ( )
T̂02 = − [F0α F2. α ] = − [− (E1 B3 − E3 B1 )] = − ⃗ ×B
E ⃗ (B.137)
4π 4π 4π 2
1 1 1 ( )
T̂01 = − [F0α F1. α ] = − [− (E2 B1 − E1 B2 )] = − ⃗ ×B
E ⃗ (B.138)
4π 4π 4π 3

ovvero, passando alle componenti controvarianti P ν del quadriimpulso conservato,


ritroviamo il risultato ben noto dalla teoria di Maxwell, secondo cui
( )
1 ∫ 3 E2 + B2 ⃗ ∫ ∫ ∫
P ≡
ν
dx ,E × B
⃗ = d3 x T 0ν (x) = d3 x T . ν (x) = d3 x T̂ . ν (x) (B.139)
0 0
4π 2

317
Veniamo adesso alle quantità conservate in conseguenza dell’invarianza sotto
il gruppo di Lorentz (ortocrono proprio) ed iniziamo dal momento angolare.
Poiché la trasformazione che lascia invariante in forma la densità lagrangiana
(B.122) è, evidentemente, la seguente

x → x µ = Λµ.ν xν (B.140)

Aα (x) → A α (x′ ) = Λα.β Aβ (x) (B.141)

ovvero, in termini di trasformazioni infinitesime, abbiamo


′1 ( )µ
x → x µ = xµ + ωρτ Jˆρτ xν (B.142)
2 .ν
1 ( )α
ϕα (x) → ψ α (x′ ) = ϕα (x) + ωρτ Σ̂ρτ ϕβ (B.143)
2 .β

dove, ricordando la (B.104), risulta


( )µ ( )µ
Jˆρτ = Σ̂ρτ = (δ ρµ δντ − δ τ µ δνρ ) (B.144)
.ν .ν

Quanto alla densità di momento angolare, per la (B.112), essa è evidentemente


data dall’espressione
{ }
1 ∂L
Ji (x) = ϵijk (Σ̂jk )α.β Aβ (x) + T 0k (x) rj − T 0j (x) rk =
2 ∂(∂0 Aα )
{ }
1 1 0 ( jα k )
= ϵijk − F. α δ δβ − δ δβ A + T (x) rj − T (x) rk =
kα j β 0k 0j
2 4π
{ }
1 1 ( 0j k )
= ϵijk − F A − F 0k Aj + T 0k (x) rj − T 0j (x) rk =
2 4π
{ }
1 1 ( )
= ϵijk − −E j Ak + E k Aj + rj T 0k (x) − rk T 0j (x) =
2 4π
{ }
1 1 ( j k )
= ϵijk E A − E A + rj T (x) − rk T (x)
k j 0k 0j
(B.145)
2 4π
Si osservi che, nell’espressione precedente, è di nuovo presente un termine lineare
nei potenziali e dunque a priori non manifestamente gauge-invariante.
Inoltre, per come si arriva all’espressione precedente via il teorema di Noëther,
le densità di quadriimpulso T 0i (x) sono quelle relative all’espressione completa
(B.129) e non a quella simmetrizzata (B.132).
Ma, sempre per le relazioni (B.129), (B.130) e (B.132), risulta che
1
T µν (x) = T̂ µν (x) + Πµν (x) con Πµν (x) ≡ − ∂α (F µα Aν ) (B.146)

dunque

rj T 0k (x) − rk T 0j (x) = rj T̂ 0k (x) − rk T̂ 0j (x) + rj Π0k (x) − rk Π0j (x) (B.147)

318
ma, ricordando che il tensore di Maxwell F µν è antisimmetrico e che F 0i = −E i ,
abbiamo che
[ ] ( ) ( )
−4π rj Π0k (x) − rk Π0j (x) = rj ∂α F 0α Ak − rk ∂α F 0α Aj =
( ) ( ) ( ) ( )
= rj ∂i F 0i Ak − rk ∂i F 0i Aj = ∂i rj F 0i Ak − rk F 0i Aj − δji F 0i Ak − δik F 0i Aj =
( ) ( )
= ∂i rj F 0i Ak − rk F 0i Aj − −E j Ak + E k Aj =
( ) ( )
= ∂i rj F 0i Ak − rk F 0i Aj + E j Ak − E k Aj (B.148)

ovvero risulta
1 [ j k ] 1 [ ]
rj Π0k (x) − rk Π0j (x) = − E A − E k Aj − ∂l rj F 0l Ak − rk F 0l Aj (B.149)
4π 4π
Tornando adesso alla densità di momento angolare (B.145), si ha
{ }
1 1 ( j k )
Ji (x) = ϵijk E A − E k Aj + rj T 0k (x) − rk T 0j (x) =
2 4π
{ ]}
1 1 ( j k ) [
= ϵijk E A − E A + rj T̂ (x) − rk T̂ (x) + rj Π (x) − rk Π (x) =
k j 0k 0j 0k 0j
2 4π
{
1 1 ( j k ) 1 [ j k ]
= ϵijk E A − E k Aj + rj T̂ 0k (x) − rk T̂ 0j (x) − E A − E k Aj
2 4π 4π
1 [ ]}
− ∂l rj F 0l Ak − rk F 0l Aj =

{ ]}
1 1 [
= ϵijk rj T̂ 0k (x) − rk T̂ 0j (x) − ∂l rj F 0l Ak − rk F 0l Aj (B.150)
2 4π
Di nuovo, questa densità è fatta di due parti di cui la seconda è una pura di-
vergenza che, se i campi di annullano propriamente all’infinito, non darà con-
tributo all’integrale esteso a tutto lo spazio. Possiamo quindi, ai fini del calcolo
del momento angolare complessivo, cioè della quantità che è conservata in virtù
dell’invarianza per rotazioni, effettuare la sostituzione seguente
{ }
1 1 [ ]
Ji (x) = ϵijk rj T̂ 0k (x) − rk T̂ 0j (x) − ∂l rj F 0l Ak − rk F 0l Aj →
2 4π
1 { }
→ Jˆi (x) = ϵijk rj T̂ 0k (x) − rk T̂ 0j (x) (B.151)
2
e ritroviamo cosı̀, anche per questa strada, l’espressione canonica del momento
angolare del campo elettromagnetico, costruito nel modo consueto attraverso il
solo contributo del tensore degli sforzi simmetrico T̂ .

319
Veniamo adesso alle altre tre ”correnti” conservate legate all’invarianza in
forma della densità lagrangiana del campo elettromagnetico per trasformazioni
di Lorentz, e precisamente quelle legate ai boost. Le tre densità (B.116) il cui
integrale esteso su tutto lo spazio risulta essere una costante del moto, sono
∂L
Ki (x) = (Σ̂0i )α.β Aβ (x) + T 0i (x) t − T 00 (x) ⃗ri (B.152)
∂(∂0 Aα )
ovvero
1 0 ( )
Ki (x) = − F.α (x) δ 0α δβi − δβ0 δ iα Aβ (x) + T 0i (x) t − T 00 (x) ⃗ri =

1 ( 00 )
= − F (x)Ai (x) − F 0i (x)A0 (x) + T 0i (x) t − T 00 (x) ⃗ri =

1 0i
= F (x)A0 + T̂ 0i (x) t − T̂ 00 (x) ⃗ri + Π0i (x) t − Π00 (x) ⃗ri (B.153)

ma
[ ] ( ) ( )
−4π t Π0i (x) − ri Π00 (x) = t ∂α F 0α Ai − ri ∂α F 0α A0 =
( ) ( ) ( )
= t ∂j F 0j Ai − ri ∂j F 0j A0 = ∂j tF 0j Ai − ri F 0j A0 + δji F 0j A0 (B.154)
e dunque
1 0i
Ki (x) = F (x)A0 + T̂ 0i (x) t − T̂ 00 (x) ⃗ri + Π0i (x) t − Π00 (x) ⃗ri =

1 0i 0 1 ( 0j i ) 1 0i 0
= F A + T̂ 0i (x) t − T̂ 00 (x) ⃗ri − ∂j tF A − ri F 0j A0 − F A =
4π 4π 4π
1 ( 0j i )
= T̂ 0i (x) t − T̂ 00 (x) ⃗ri − ∂j tF A − ri F 0j A0 (B.155)

Di nuovo abbiamo che uno dei due contributi è una pura divergenza, per cui,
sulla base degli argomenti già considerati a proposito del momento angolare, ai
fini del calcolo delle costanti del moto, possiamo di nuovo operare la sostituzione
1 ( 0j i )
Ki (x) = T̂ 0i (x) t − T̂ 00 (x) ⃗ri − ∂j tF A − ri F 0j A0 →

→ K̂i (x) = T̂ (x) t − T̂ (x) ⃗ri
0i 00
(B.156)
da cui, definendo al solito il baricentro dell’energia elettromagnetica come
∫ ∫
d3 x T̂ 00 (x) ⃗ri
r̄i ≡ ∫ ⇒ d3 x T̂ 00 (x) ⃗ri = r̄i (t) P 0 (B.157)
d3 x T̂ 00 (x)
si ricava che possiamo scrivere le costanti del moto Bi , definite a partire dalle
densità K̂i (x) integrate in tutto lo spazio, in termini delle componenti conservate
dell’impulso spaziale P⃗i e dell’energia P 0 , ottenendo

dr̄i P⃗i
Bi ≡ d3 x K̂i (x) = t P⃗i − r̄i P 0 ⇒ vi ≡ = 0 (B.158)
dt P
i.e. otteniamo per questa strada la costanza della velocità di spostamento del
baricentro dell’energia elettromagnetica.

320
B.4.2 L’invarianza di gauge di prima specie
Un’invarianza che si incontra spesso in Meccanica Quantistica è l’invarianza per
trasformazione di fase della funzione d’onda, i.e.

ψ(x) → eiα ψ(x); ψ ∗ (x) → e−iα ψ ∗ (x) (B.159)

Nel linguaggio lagrangiano, questo corrisponde evidentemente a dire che la den-


sità lagrangiana L da cui sono poi ricavate le equazioni del moto, è invariante in
forma sotto le trasformazioni precedenti, le quali costituiscono, evidentemente,
un gruppo di Lie abeliano ad una dimensione.
Consideriamo allora una trasformazione di fase infinitesima: nel linguaggio gen-
erale della (B.70), sviluppato per dimostrare il teorema di Noëther, i.e.

x → x′ : x′µ = xµ + Ξµa (x) dωa ≡ xµ + δxµ (B.160)


ϕα (x) → ψ α (x′ ) : ψ α (x′ ) = (δβα + Γαaβ dωa ) ϕβ (x) (B.161)

questo significa, evidentemente309

x′µ → xµ Ξµ = 0 ;
ψ → ψ + iα ψ ⇒ Γ11 = i ; Γ12 = 0 (B.162)
ψ∗ → ψ ∗ − iα ψ ∗ Γ21 = 0 ; Γ22 = −i

per cui, sostituendo nella espressione generale della corrente conservata di cui alla
(B.81), riscritta nel caso particolare in cui il gruppo di simmetria sia ad un solo
parametro,
[ ] ∂L
Θµa (x) → J µ (x) ≡ −Γαβ ϕβ (x) + ∂µ ϕα (x) Ξµ − L Ξµ (B.163)
∂(∂µ ϕα )
otteniamo infine
[ ]
∂L ∂L
J µ (x) = i − ψ + ψ∗ (B.164)
∂(∂µ ψ) ∂(∂µ ψ ∗ )

che, per quanto precede, è quindi una quadricorrente310 conservata dalla dinam-
ica.
Il fatto che la corrente (B.164) sia conservata, implica, come sappiamo, che
∫ ∫
∂0 3 0
d x J (⃗x, t) = 0 ⇒ Q≡ d3 x J 0 (⃗x, t) = cost (B.165)
309
Per semplicità ed uniformità di notazioni assumiamo qui che l’indice con cui sono label-
lati i campi assuma i valori 1 e 2, e risulti ϕ1 ≡ ϕ; ϕ2 ≡ ϕ∗ . Inoltre, essendo il gruppo di
trasformazioni ad un solo parametro, omettiamo l’indice a.
310
Si noti che, cosı̀ come la densità lagrangiana è determinata a meno di una costante molti-
plicativa, anche la quadricorrente, omogenea nella lagrangiana, è anch’essa determinata a meno
di un fattore di scala arbitrario.

321
La quantità Q definita dalla (B.165) è, in generale, proporzionale, come vedremo,
al numero di particelle descritte dal campo, che, nello schema di prima quantiz-
zazione della M Q, sostanzialmente coincide con la norma stessa della funzione
d’onda.

• Equazione di Schrödinger
Abbiamo visto come la densità lagrangiana da cui si deriva l’equazione di
Schrödinger, sia

ih̄ ∗ h̄2
L= (ψ ∂0 ψ − ψ∂0 ψ ∗ ) + (∂i ψ ∗ )(∂ i ψ) − ψ ∗ V ψ (B.166)
2 2m
Palesemente essa è invariante in forma sotto la trasformazione di fase (B.162):
la corrente conservata che ne discende secondo la (B.164) risulta allora data
da
[ ]
∂L ∂L
J µ = i −ϕ + ϕ∗ (B.167)
∂(∂µ ϕ) ∂(∂µ ϕ∗ )

da cui segue che


[ ( ) ( )]
ih̄ ∗ ih̄
J 0
= i −ϕ ϕ + ϕ∗ − ϕ = h̄ ϕ ϕ∗ (B.168)
2 2
[ ( ) ( )]
h̄2 i ∗ h̄2 i
J i
= i −ϕ ∂ ϕ + ϕ∗ ∂ϕ
2m 2m
[ ]
h̄2 [ ] ih̄ ( ⃗ ∗ )
= −i ϕ(∂ i ϕ∗ ) − ϕ∗ (∂ i ϕ) = h̄ ϕ∇ϕ − ϕ∗ ∇ϕ
⃗ (B.169)
2m 2m

dove abbiamo usato il fatto che

⃗ i ≡ ∂ ≡ ∂i ≡ −∂ i

∂xi
Dunque, la quadricorrente conservata311 è
( )
ih̄ ¯ ∗
J ≡ (J , J ) ≡ h̄ |ϕ| ,
µ 0 i
ϕ∇ϕ
2
(B.171)
2m

A parte il fattore globale h̄, dunque, ne risulta che la parte temporale della
quadricorrente J 0 altri non è che la densità di probabilità |ϕ|2 , per cui la
311
Per motivi di maggior concisione, introduciamo qui il simbolo


¯ : f ∇g
¯ ≡ f (∇g)
⃗ − (∇f
⃗ )g (B.170)

322
parte spaziale J i = 2mih̄ ¯ ∗ necessariamente individua la densità di cor-
ϕ∇ϕ
rente di probabilità.
Ricordiamo infine, prima di concludere l’argomento, che in prima quantiz-
zazione, la conservazione della probabilità significa semplicemente la con-
servazione dell’esistenza della particella descritta dalla funzione d’onda ϕ,
non essendo permesso alcun meccanismo di creazione e distruzione della
stessa.
• Campo scalare carico
Nel caso del campo scalare carico, abbiamo visto che una densità lagrangiana
che ne descrive la dinamica è
L = (∂µ ϕ)(∂ µ ϕ∗ ) − m2 ϕ ϕ∗ (B.172)
Chiaramente anche questa densità lagrangiana è invariante in forma per
trasformazioni di fase (B.162) ed è immediato dimostrare che la corrente
conservata (B.164) che ne risulta è la seguente
J µ = i [−(∂ µ ϕ∗ ) ϕ + ϕ∗ (∂ µ ϕ)] ≡ iϕ∗ ∂¯µ ϕ (B.173)
per cui risulta
( )
∂ϕ∗ ∗ ∂ϕ
0
J =i ϕ − ϕ (B.174)
∂t ∂t
la quale è definita positiva soltanto se nello sviluppo di Fourier della fun-
zione ϕ compaiono solo frequenze positive, i.e. andamenti temporali del
tipo e−iEt con E > 0.
• Campo di Dirac
Nel caso del campo di Dirac, abbiamo visto che una densità lagrangiana
che possiamo utilizzare per descriverne la dinamica è
i
L = [ψγ µ (∂µ ψ) − (∂µ ψ)γ µ ψ] − m ψψ (B.175)
2
Di nuovo, essendo ψ̄ ≡ (ψ ∗ )t γ 0 , essa è evidentemente invariante in forma
sotto la trasformazione di fase (B.162).
La corrente conservata che ne discende in base alla (B.164) è
[ ]
i ∂L ∂L
J =µ
− ψ + ψ̄
2 ∂(∂µ ψ) ∂(∂µ ψ̄)
i [ ]
= −iψ̄γ µ ψ − iψ̄γ µ ψ = ψ̄γ µ ψ (B.176)
2
Quanto poi alla componente temporale della quadricorrente, essa risulta
evidentemente pari a
J 0 = ψ̄γ 0 ψ = ψ † ψ (B.177)

323
C Appendix: Le simmetrie C, P e T in Teoria
Quantistica dei Campi
C.1 Generalità
Anche per introdurre la nozione di simmetria in teoria quantistica dei campi
(QF T ), assumeremo in generale che, in stretta analogia con quanto fatto nello
schema di prima quantizzazione, esistano operatori O capaci di trasformare gli
stati in modo da lasciare invariata la struttura probabilistica dello spazio da essi
costituito. Visto come isomorfismo dell’algebra degli operatori in sé, quello in-
dotto dall’operatore O dovrà necessariamente essere compatibile con le condizioni
di quantizzazione, cioè dovrà rispettare l’algebra dei campi. Al solito, questa con-
dizione sarà automaticamente soddisfatta se definiremo l’operatore su una base
dello spazio di Hilbert, mentre dovrà essere imposta se l’isomorfismo dell’algebra
in sé verrà costruito in base a qualche ragione a priori.
Un operatore che soddisfi le condizioni precedenti è detto essere una simmetria.
Se poi accade anche che
• lo stato di minima energia (vuoto) è non degenere e O-invariante;
• la lagrangiana L(⃗x, t) è invariante in forma sotto l’operatore O,
allora essa è detta conservata o esatta o anche invarianza.
Si osservi che il rispetto della seconda condizione di cui sopra implica che la
trasformazione O rispetti la dinamica, ovvero che le equazioni di moto siano
O-invarianti, i.e. che, al solito

[O, H] = 0 (C.1)

La simmetria è rotta se la lagrangiana L non è O-invariante, mentre viene


detta rotta spontaneamente se, pur essendo la lagrangiana O-invariante, è lo stato
di minima energia ad essere degenere e non O-invariante.
Detto questo in generale, passerermo adesso a definire le trasformazioni di co-
niugazione di carica C, di parità P e di inversione temporale T mostrando come,
in base a quanto visto precedentemente nello schema di prima quantizzazione
ed al concetto classico che abbiamo di loro, queste trasformazioni agiscono nello
spazio312 di Fock di particella libera, ovvero sugli operatori di creazione e dis-
truzione.
312
Ricordiamo a questo proposito che lo spazio di Fock è lo spazio di Hilbert che ha per base
lo stato di vuoto | Ω > che, per ipotesi, è unico, e gli stati di multiparticella/antiparticella in
autostati dell’impulso, i.e.

|Ω >
a† (⃗
p1 )...a† (⃗
pn )b† (⃗q1 )b† (⃗qm ) | Ω >; n, m ≥ 1

324
Per quanto detto, volendo che C, P, T siano simmetrie, richiederemo altresı̀ che
il vuoto sia non degenere e C, P, T invariante313 , i.e.

C |Ω >= P |Ω >= T |Ω >= |Ω > (C.3)

C.2 La Coniugazione di Carica


Classicamente, la simmetria di coniugazione di carica C comporta il cambia-
⃗ e magnetici B.
mento di segno della carica elettrica e dei campi elettrici E ⃗ In
questo modo, la lagrangiana314 del campo elettromagnetico in interazione con
una quadricorrente J µ
1
L(x) = − F µν (x) Fµν (x) − J µ (x)Aµ (x) (C.4)
4
risulta evidentemente invariante, in quanto, sotto l’azione di C, si ha

Aµ → −Aµ ⇒ F µν → −F µν
J µ → −J µ (C.5)

Quindi, in elettrodinamica classica, C è una simmetria conservata.


In QF T , manterremo ancora, senz’altro, la richiesta caratterizzante di questa
simmetria, ovvero che sia

C Aµ C −1 = −Aµ (C.6)

e quindi, affinché C possa essere una simmetria conservata non solo per il campo
libero, ma anche nel caso di interazione elettromagnetica, sarà necessario, quanto
alla densità di corrente elettrica, che risulti

C Jµ C −1 = −Jµ (C.7)
313
A priori basterebbe imporre l’invarianza dello stato di vuoto e non necessariamente del vet-
tore che lo rappresenta. Questo significa che, se indichiamo con Θ una qualsiasi delle simmetrie
C, P, T , l’invarianza del vuoto impone solo che

Θ | Ω >= eiθ | Ω > (C.2)

L’ipotesi che facciamo è quella di riassorbire comunque questa fase nella definizione stessa della
simmetria, in modo che valga comunque la (C.3).
314
Cfr. J.D. Bjorkeen, S.D. Drell: Relativistic Quantum Fields , McGraw-Hill, 1965, pag. 70
e pag. 86

325
Ma naturalmente la densità di quadricorrente elettrica è costruita a partire dai
campi che descrivono le particelle, quindi, se vogliamo che C sia una simmetria
conservata anche in QF T , occorrerà definirla sui campi stessi in modo che
• garantisca la validità della (C.7);

• garantisca che anche la lagrangiana libera del campo sia C-invariante;

• garantisca il rispetto della struttura algebrica costruita con i campi, ovvero


il rispetto delle regole di commutazione/anticommutazione che li riguardano.
Richiederemo inoltre, cosı̀ come abbiamo visto accadere in prima quantizzazione,
che questa simmetria sia unitaria.
Inizieremo trattando il caso del campo scalare carico ϕ.
Come ben sappiamo, la sua lagrangiana libera315 è

L(x) = (∂µ ϕ)(∂ µ ϕ† ) + m2 ϕ ϕ† (C.9)

da cui seguono le equazioni per i campi liberi

(2 + m2 )ϕ = 0 = (2 + m2 )ϕ† (C.10)

i quali sono dati, in termini degli operatori di creazione e distruzione di parti-


cella/antiparticella, dagli sviluppi seguenti316
1 ∫ d3 p { −ipx † ipx
}
ϕ(x) = a(⃗
p ) e + b (⃗
p) e (C.11)
(2π)3 2Ep
† 1 ∫ d3 p { −ipx † ipx
}
ϕ (x) = b(⃗
p) e + a (⃗
p) e (C.12)
(2π)3 2Ep
con le regole di commutazione (le sole non nulle ...)
[ ] [ ]
a(⃗p), a† (⃗q) = b(⃗p), b† (⃗q) = (2π)3 2Ep δ 3 (⃗p − ⃗q) (C.13)

equivalenti, come abbiamo visto, alle regole di commutazione canoniche (2.355)


e (2.371), i.e.
[ ]
[ϕ(x), ϕ(y)] = 0 = ϕ† (x), ϕ† (y) (C.14)
[ ]
ϕ(x), ϕ† (y) = i ∆(x − y, m) (C.15)
315
Più propriamente dovremmo usare la sua forma simmetrizzata nei due campi ϕ e ϕ† , i.e.
1{ } 1 { }
L(x) = ∂µ ϕ, ∂ µ ϕ† + m2 ϕ, ϕ† (C.8)
2 2

316 µ
Come
√ al solito, con px intendiamo il prodotto scalare di Lorentz p xµ , mentre
Ep ≡ |⃗
p|2 + m2 .

326
dove, per definizione, risulta
∫ [ ]
i
∆(x − y, m) ≡ − d4 q δ(q 2 − m2 ) e−iq(x−y) Θ(q 0 ) − Θ(−q 0 ) (C.16)
(2π)3
Definiremo allora la simmetria di coniugazione di carica C in modo che essa
scambi lo stato di particella con quello di antiparticella e viceversa, rispettando il
loro stato di impulso ed eventuali gradi di libertà interni, i.e., nel caso considerato
del campo scalare, porremo

C | a(⃗p) >≡ | b(⃗p) >; C | b(⃗p) >≡ | a(⃗p) > (C.17)

da cui risulta chiaramente, in particolare, che C 2 = I.


Un altro modo equivalente di definire la simmetria è quello di vederne l’effetto
direttamente sugli operatori di creazione e distruzione: essendo

| a(⃗p) >≡ a† (⃗p) | Ω >; | b(⃗p) >≡ b† (⃗p) | Ω > (C.18)

ed essendo, per ipotesi, il vuoto C−invariante, la relazione (C.17) può essere


tradotta nelle condizioni

C a† (⃗p) C −1 ≡ b† (⃗p); C b† (⃗p) C −1 ≡ a† (⃗p) (C.19)

da cui, siccome si è assunto che C sia unitaria, prendendo l’aggiunto di entrambi


i membri, si ottiene altresı̀ che, per gli operatori di annichilazione, deve essere

C a(⃗p) C −1 = b(⃗p); C b(⃗p) C −1 = a(⃗p) (C.20)

Prima di continuare, vogliamo osservare che la richiesta che la simmetria di


coniugazione di carica C mandi uno stato di particella in uno di antiparticella e
viceversa, non la fissa univocamente. Infatti questa richiesta è rispettata anche
se definiamo

C | a(⃗p) >= eiηc | b(⃗p) >; C | b(⃗p) >= e−iηc | a(⃗p) > (C.21)

In questo caso, si ha ancora che C 2 = I e ne consegue che

C a† (⃗p) C −1 = eiηc b† (⃗p) ⇔ C a(⃗p) C −1 = e−iηc b(⃗p) (C.22)


C b† (⃗p) C −1 = e−iηc a† (⃗p) ⇔ C b(⃗p) C −1 = eiηc a(⃗p) (C.23)

L’unica richiesta che dobbiamo ragionevolmente mantenere è che il fattore di fase


eiη sia indipendente dall’impulso p⃗. Questo per non violare l’ulteriore richiesta
che facciamo a C, cioè quella per cui vogliamo che lo stato coniugato di carica,
per esempio, dello stato rappresentato dal vettore

α | a(⃗p) > +β | a(⃗q) > (C.24)

327
sia comunque rappresentato dal vettore317
α | b(⃗p) > +β | b(⃗q) > (C.26)
a meno di un eventuale fattore di fase globale, inessenziale.

Ritorniamo ora al punto principale, che è quello di giungere infine alla definizione
di una simmetria la quale descriva lo scambio particella-antiparticella e che sia
conservata, ovvero
• sia esatta anche per il campo libero;
• sia tale per cui la densità di corrente elettromagnetica soddisfa la condizione
(C.7).
Partiamo dunque dalla definizione (C.21) che, evidentemente, contiene la
(C.17) come caso particolare in cui ηc = 0, e vediamo se questa trasformazione
gode delle proprietà suddette.
Per prima cosa, determiniamo quale è l’azione di C sui campi ϕ e ϕ† .
Ricordiamo che, per ipotesi, C è stata supposta essere lineare (e non antilineare),
per cui, usando la (C.22) e la (C.23), otteniamo

d3 p { }
C ϕ(x) C −1 = C 3
a(⃗
p) e−ipx
+ b †
(⃗
p) e ipx
C −1 =
2Ep (2π)

d3 p { −iηc −ipx −iηc † ipx
}
= e b(⃗
p) e + e a (⃗
p) e =
2Ep (2π)3
= e−iηc ϕ† (x) (C.27)
mentre risulta ovviamente che

† −1 d3 p { −ipx †
}
C ϕ (x) C = C b(⃗
p) e + a (⃗
p ) eipx
C −1 =
2Ep (2π)3

d3 p { iηc −ipx iηc † ipx
}
= e a(⃗
p ) e + e b (⃗
p) e =
2Ep (2π)3
= eiηc ϕ(x) (C.28)
317
Si osservi a questo proposito che, usando la definizione (C.21), per una combinazione lineare
di stati di particella e antiparticella, la presenza del fattore di fase eiηc nella definizione di C
f a, in effetti differenza, infatti risulta
C (α | a(⃗ p) > +β e−iηc | a(⃗q) >
p) > +β | b(⃗q) >) = α eiηc | b(⃗ (C.25)
e questo vettore certamente non rappresenta, in generale, lo stesso stato del vettore α | b(⃗
p) >
+β | a(⃗q) > ...
Lo stesso accade se consideriamo una sovrapposizione lineare di un vettore che rappresenta
una particella/antiparticella ed il vuoto, oppure uno stato di n particelle con quello di m
antiparticelle, in cui n ̸= m.
E’ un fatto questo che avremo modo di riprendere.

328
Passiamo adesso a verificare che la dinamica del campo libero è rispettata
dalla simmetria C. Come abbiamo avuto modo di dire precedentemente, questo
significa che dobbiamo verificare l’invarianza delle equazioni del moto sotto C.
Se vogliamo partire dalla densità lagrangiana, questo significa verificare che essa
è invariante in forma sotto C. D’altronde, nel nostro caso, date la (C.27) e la
(C.28), abbiamo
C: x→x (C.29)
ϕ(x) → ϕC (x) = e−iηC ϕ† (x) ⇔ ϕ† (x) = eiηC ϕC (x) (C.30)
ϕ† (x) → ϕ†C (x) = eiηC ϕ(x) ⇔ ϕ(x) = e−iηC ϕ†C (x) (C.31)
L’invarianza in valore della lagrangiana
L(x) = (∂µ ϕ)(∂ µ ϕ† ) − m2 ϕ ϕ† (C.32)
garantisce che i campi ϕC e ϕ†C soddisfano le equazioni del moto dedotte dalla
densità lagrangiana seguente (ottenuta dalla precedente per sostituzione ...)
( )( )
LC (x) = ∂µ e−iηC ϕ†C (x) ∂ µ eiηC ϕ† (x) − m2 e−iηC ϕ† (x) eiηC ϕ(x) =
= (∂µ ϕ†C )(∂ µ ϕC ) − m2 ϕ†C ϕC (C.33)
che, apparentemente, siccome ϕC e ϕ†C non commutano, non coincide in forma con
L(x) ...! A parte che si potrebbe facilmente vedere che, comunque, la lagrangiana
LC dà luogo alle stesse equazioni del moto che la lagrangiana L, in realtà il punto
sta nel fatto che, proprio allo scopo di trattare allo stesso modo i campi ϕ e ϕ† ,
avremmo dovuto piuttosto partire dalla lagrangiana (C.8)
1{ } 1 { }
L(x) =∂µ ϕ, ∂ µ ϕ† + m2 ϕ, ϕ† (C.34)
2 2
la quale, invece, è ovviamente C−invariante dato che è simmetrica nello scambio
ϕ ↔ ϕ† .
Un altro modo per verificare che la dinamica del campo libero è rispettata
dalla simmetria è quello di verificare che C, qualunque sia ηc , commuta con
l’hamiltoniana libera H0 . Ricordiamo per questo che, in termini degli operatori
di creazione e distruzione, risulta318
1 ∫ d3 p [ † †
]
H0 = E p a (⃗
p) a(⃗
p) + E p b (⃗
p) b(⃗
p) (C.37)
(2π)3 2Ep
318
Abbiamo, infatti, per esempio, che
∫ 3
1 d p [ ]
H0 | a(⃗q) >≡ H0 a† (⃗q)|Ω >= 3
Ep a† (⃗ p) + Ep b† (⃗
p) a(⃗ p) a† (⃗q)|Ω > (C.35)
p) b(⃗
(2π) 2Ep
e poiché [b, a† ] = 0 e b|Ω >= 0 , il secondo termine nell’espressione precedente non contribuisce.
Quanto al primo, usando il fatto che
a a† = [a , a† ] + a† a

329
D’altronde, evidentemente, risulta
C a† a C −1 = C a† C −1 C a C −1 = eiηc b† e−iηc b = b† b (C.38)
ed analogamente si ha
C b† b C −1 = C b† C −1 C b C −1 = e−iηc a† eiηc a = a† a (C.39)
per cui è banale che risulti
C H0 C −1 = H0 ⇔ [C, H0 ] = 0 (C.40)
Appurato che C rispetta la dinamica del campo scalare libero, verifichiamo
per completezza che essa rispetta anche le regole di commutazione.
Risulta che sotto C si ha
[ ] [ ]
a(⃗p), a† (⃗q) ←→ b(⃗p), b† (⃗q) = (2π)3 2Ep δ(⃗p − ⃗q) (C.41)
[a(⃗p), a(⃗q)] ←→ [b(⃗p), b(⃗q)] e−2i ηc = 0 (C.42)
[a(⃗p), b(⃗q)] ←→ [b(⃗p), a(⃗q)] = 0 (C.43)
[ ] [ ]
a† (⃗p), a† (⃗q) ←→ b† (⃗p), b† (⃗q) e2i ηc = 0 (C.44)

ovvero abbiamo (gli altri commutatori restano identicamente nulli ...)


C [ϕ(x), ϕ† (y)] C −1 = [ϕ† (x), ϕ(y)] = −[ϕ(y), ϕ† (x)] = [ϕ(x), ϕ† (y)] (C.45)
dove la seconda uguaglianza discende dal carattere antisimmetrico del commu-
tatore, mentre la terza uguaglianza discende dal carattere dispari della funzione
∆(x) di cui alla sua definizione (C.16).
Resta cosı̀ provato319 che C è effettivamente una simmetria conservata per il
campo scalare libero che è conservata indipendentemente dal valore della fase ηc .
e che, di nuovo, a|Ω >= 0 , esso diventa
∫ 3
1 d p [ ]
H0 | a(⃗q) > = Ep a† (⃗
p) a(⃗p), a† (⃗q) |Ω >
(2π)3 2Ep
∫ 3
1 d p
= 3
Ep a† (⃗
p) (2π)3 2Ep δ(⃗ p − ⃗q)|Ω >=
(2π) 2Ep
= Eq a† (⃗q)|Ω >≡ Eq | a(⃗q) > (C.36)

Questo prova che, sulla base degli autostati di singola particella, l’operatore H0 definito dalla
(C.37) è diagonale ed ha come autovalore l’energia complessiva dello stato. Questo stesso
risultato può essere facilmente dimostrato anche per gli stati di antiparticella e di multiparti-
cella/antiparticella, per cui ne segue che l’operatore H0 dato dalla (C.37) coincide effettivamente
con l’hamiltoniana libera. Evidentemente, infatti, l’operatore a† (⃗ p) a(⃗
p) fornisce il numero di
particelle con impulso p⃗ presenti nello stato considerato, mentre b† (⃗ p) b(⃗
p) fornisce quello di
antiparticelle !
319
Osserviamo che, per quanto riguarda la compatibilità con le regole di commutazione, non
poteva essere altrimenti visto che, attraverso la (C.21), abbiamo definito C su una base dello
spazio di Hilbert ...

330
Quanto poi all’osservazione che abbiamo anticipato, per cui, se la fase ηc non
è nulla, allora, in generale, per esempio
α | a(⃗p) > +β | b(⃗q) >→ eiηc α | b(⃗p) > +e−iηc β | a(⃗q) ≯=
̸= (α | b(⃗p) > +β | a(⃗q) >) × f ase opportuna (C.46)
al momento limitiamoci ad osservare solo che, almeno se particella e antiparti-
cella differiscono320 nella carica elettrica, allora, per la regola di superselezione
sulla carica che impedisce la possibilità di realizzare stati fisici che siano sovrap-
posizione di stati con carica diversa, il problema non si pone.
Riprenderemo comunque l’argomento quando si tratterà di considerare il sistema
dei mesoni K, dove K 0 ̸= K̄ 0 , ma entrambi sono elettricamente scarichi ...

Passiamo adesso a studiare l’azione di C sulla quadricorrente.


Come abbiamo già detto, per mantenere a C il carattere di simmetria conservata
anche in presenza di interazione elettromagnetica, richiediamo che la densità di
corrente elettrica soddisfi la (C.7), cioè che, sotto C, risulti J µ (x) → −J µ (x).
D’altronde, la densità di quadricorrente elettromagnetica associata ad un campo
scalare carico è pari alla densità di quadricorrente di probabilità, moltiplicata per
la carica elettrica assoluta e della particella (quindi e ha un segno univocamente
definito una volta stabilito chi è la particella e chi è l’antiparticella). Come sappi-
amo, questa corrente di probabilità è quella che si ottiene dal teorema di Noëther,
applicato all’invarianza in forma della densità lagrangiana per trasformazioni di
gauge di prima specie dei campi. Abbiamo321
[ ]
J µ (x) = i e ϕ† (x)(∂ µ ϕ)(x) − (∂ µ ϕ† )(x) ϕ(x) = (J † )µ (x) (C.48)
e visto che
C: ϕ → e−iηc ϕ† ; ϕ† → eiηc ϕ (C.49)
è evidente allora che, indipendentemente dalla fase ηc , risulta322
C: J µ (x) → −J µ (x) (C.53)
320
Non è sempre questo il caso ...
321
Più propriamente occorre qui prendere il prodotto normal − ordinato dei campi, in cui,
per definizione, gli operatori di annichilazione sono a destra di quelli di creazione, per cui, nel
caso considerato, per esempio risulta
< Ω | J µ | Ω >= 0 (C.47)

322
Sempre basandoci sul fatto che l’operatore a† (⃗p) a(⃗
p) fornisce il numero di particelle con
impulso p⃗ presenti nello stato considerato, mentre b† (⃗p) b(⃗
p) fornisce quello di antiparticelle,
risulta evidentemente che l’operatore di Carica è dato da

d3 p [ † ]
Q=e 3
a (⃗ p) − b† (⃗
p) a(⃗ p) b(⃗
p) (C.50)
(2π) 2Ep

331
la quale dimostra quindi che l’operatore di coniugazione di carica C è una simmetria
conservata non solo per il campo scalare libero, ma anche quando si consideri la
sua interazione con il campo elettromagnetico.

Come abbiamo evidenziato esplicitamente nella (C.48), la densità di corrente


elettromagnetica deve essere un operatore hermitiano. Questo deve accadere in
quanto

−J µ (x) Aµ (x) (C.54)

è la lagrangiana di interazione con il campo elettromagnetico ed il campo Aµ è


autoaggiunto, risultando
∫ ∑{ }
d3 p −ipx † ∗µ
Aµ (x) = a(⃗
p , s) ϵ µ
s (⃗
p) e + a (⃗
p , s) ϵ s (⃗
p) e ipx
(C.55)
2Ep (2π)3 s=±

dove, essendo la massa del fotone nulla, Ep ≡ |⃗p| e l’unico commutatore non nullo
è il seguente
[ ]
a(⃗p, s), a† (⃗q, r) = 2Ep (2π)3 δ(⃗p − ⃗q) δsr (C.56)

mentre ϵµs (⃗p) è il vettore di polarizzazione associato ad un fotone di impulso p⃗ ed


elicità s, i.e., per esempio nel caso di un fotone avente quadrimpulso (p, 0, 0, p), è
∓1
ϵµ± = √ (0, 1, ±i, 0) (C.57)
2
Sotto coniugazione di carica, il campo Aµ non è invariante, come potrebbe a
prima vista sembrare naturale, visto che il fotone è elettricamente scarico, bensı̀
esso deve cambiare di segno, se vogliamo mantenere l’analogia classica, i.e.

C: Aµ (x) → −Aµ (x) (C.58)


dove e è la carica elettrica della particella. Da quanto si è detto, è evidente allora che risulta

C Q C −1 = −Q (C.51)

visto che

C : a† (⃗ p) ↔ b† (⃗
p) a(⃗ p) b(⃗
p) (C.52)

332
Questo si realizza323 richiedendo che
C a(⃗p, s)C −1 = −a(⃗p, s); C a† (⃗p, s)C −1 = −a† (⃗p, s) (C.60)
in analogia (a parte il segno meno ...) con la definizione precedentemente data
nel caso del campo scalare, se ricordiamo che, essendo Aµ autoaggiunto, fotone
e antifotone sono la stessa particella. Come si vede, però, il fatto che particella
e antiparticella in questo caso coincidano, non implica che C non abbia alcun
effetto sullo stato di fotone, infatti dalla (C.60) segue immediatamente che
C | a(⃗k, s) >= − | a(⃗k, s) > (C.61)
ovvero che su uno stato di n fotoni, risulta
C | n f otoni >= (−1)n | n f otoni > (C.62)
e poiché l’elettrodinamica (QED) è invariante sotto C, da questo segue in parti-
colare che non possono esistere elementi di matrice, dovuti all’interazione elettro-
magnetica, fra stati con un numero di fotoni pari e stati con un numero di fotoni
dispari: è il teorema di Furry.

Parlando di QED e di interazione elettromagnetica, non possiamo non discutere,


a questo punto, l’effetto della coniugazione di carica C sul campo spinoriale
(ovvero sul campo di Dirac), che ben descrive particelle cariche come, per es-
empio, l’elettrone ... In questo caso, come già sappiamo, è
2 ∫
∑ d3 p
ψ(x) = {a(r) (⃗p) u(r) (⃗p) e−ipx + b†(r) (⃗p) v (r) (⃗p) eipx } (C.63)
r=1 2Ep (2π)3
∑2 ∫
d3 p
ψ̄(x) = {b(r) (⃗p) v̄ (r) (⃗p) e−ipx + a†(r) (⃗p) ū(r) (⃗p) eipx } (C.64)
r=1 2Ep (2π)3
e valgono le regole di anticommutazione (tutte le altre sono nulle ...)
{a(r) (⃗p), a†(s) (p⃗′ )} = {b(r) (⃗p), b†(s) (p⃗′ )} = 2 Ep (2π)3 δrs δ 3 (⃗p − p⃗′ ) (C.65)
mentre gli spinori u e v sono normalizzati nel modo seguente
m+ ̸ p (r) (r) m+ ̸ p
u(r) (⃗p) = √ u0 ; ū(r) (⃗p) = ū0 √ (C.66)
m+E m+E
m− ̸ p m− ̸p
v (r) (⃗p) = √ v0 ; v̄ (r) (⃗p) = v̄0 √
(r) (r)
(C.67)
m+E m+E
323
Si noti che la (C.60) definisce una simmetria conservata per il campo libero, in quanto la
densità lagrangiana
1 1
L(x) = − Fµν F µν ≡ − (∂ µ Aν − ∂ ν Aµ )(∂µ Aν − ∂ν Aµ ) (C.59)
4 4
è ovviamente invariante sotto C, ovvero sotto un cambiamento di segno di Aµ , e cosı̀
pure le regole di commutazione, coinvolgendo esse sempre il prodotto di due operatori di
creazione/distruzione. Inoltre risulta evidentemente ancora che C 2 = I.

333
essendo
       
1 0 0 0
 0   1   0   0 
u0 =    
v0 =    
(1) (2) (1) (2)
  ; u0 =   ;   ; v0 = −   (C.68)
 0   0   0   1 
0 0 1 0
per cui, definendo per comodità
( ) ( )
(1) 1 (2) 0
w = ; w = (C.69)
0 1
( ) ( )
0 1
w̃ (1)
=w (2)
= ; w̃ (2)
= −w (1)
=− (C.70)
1 0
si ha che, posto ⃗n ≡ p⃗/p, risulta
( )  √ 
1 (m + Ep ) w (r) Ep + m w(r)
u(r) (⃗p) = √ =  √  (C.71)
m + Ep (⃗p · ⃗σ ) w(r) Ep − m (⃗n · ⃗σ ) w(r)

( )  √ 
1 (⃗p · ⃗σ ) w̃ (r) Ep − m (⃗n · ⃗σ ) w̃(r)
v (r) (⃗p) = √ =  √  (C.72)
m + Ep (m + Ep ) w̃(r) Ep + m w̃(r)

Come sappiamo, l’evoluzione del campo libero di Dirac è retta dalla densità
lagrangiana
i
L = [ψγ µ (∂µ ψ) − (∂µ ψ)γ µ ψ] − m ψψ (C.73)
2
la quale gode anch’essa, evidentemente, dell’invarianza di gauge di prima specie,
che stabilisce, appunto, la conservazione della densità di corrente324 elettromag-
netica
J µ (x) ≡ e ψ̄(x) γ µ ψ(x) (C.78)
324
Osserviamo di nuovo che, almeno se ψ e ψ̄ si riferiscono alla stessa particella, risulta
(J † )µ = J µ (C.74)
Infatti
(J † )µ = e ψ † (γ µ )+ (ψ̄)† (C.75)
ma
ψ̄ = ψ † γ 0 ⇒ (J † )µ = e ψ † (γ µ )+ (γ 0 )† ψ (C.76)
e siccome γ 0 = (γ 0 )+ , (γ 0 )2 = I e (γ µ )+ = γ 0 γ µ γ 0 , risulta
(J † )µ = e ψ † γ 0 γ µ (γ 0 )2 ψ ≡ J µ (C.77)

334
Veniamo adesso all’azione sul campo spinoriale della simmetria di coniugazione
di carica C.
Proviamo a definirla325 , in completa analogia con quanto fatto nel caso del campo
scalare carico, ponendo di nuovo, semplicemente
C a†(r) (⃗p) C −1 = eiηc b†(r) (⃗p) ⇔ C a(r) (⃗p) C −1 = e−iηc b(r) (⃗p) (C.80)
C b†(r) (⃗p) C −1 = e−iηc a†(r) (⃗p) ⇔ C b(r) (⃗p) C −1 = eiηc a(r) (⃗p) (C.81)
Vogliamo capire come si trasformeranno i campi ψ e ψ̄ sotto questa trasfor-
mazione, ovvero se, come nel caso scalare, vanno uno nell’altro ... ed in partico-
lare che succede poi alla corrente J µ (x).
Consideriamo quindi, per esempio, l’integrando dello sviluppo in operatori di
creazione e distruzione del campo ψ, i.e. il termine
a(r) (⃗p) u(r) (⃗p) e−ipx + b†(r) (⃗p) v (r) (⃗p) eipx (C.82)
Sotto la simmetria di coniugazione di carica definita dalle (C.80) e (C.81), esso
diviene evidentemente
e−iηc {b(r) (⃗p) u(r) (⃗p) e−ipx + b†(r) (⃗p) v (r) (⃗p) eipx } (C.83)
il quale rassomiglia effettivamente all’integrando dello sviluppo della ψ̄, con la
differenza, però che, a parte il fattore di fase, in quest’ultimo laddove compare
lo spinore u vi compare v̄ e laddove compare lo spinore v c’è ū. Inoltre ψ (come
del resto gli spinori u e v) è una matrice colonna, mentre ψ̄ (come pure ū e v̄)
è una matrice riga ... quindi, se mai, la simmetria C potrà legare ψ con ψ̄ t e,
analogamente, ψ̄ con ψ t ... ma non potrà accadere, come nel caso del campo
scalare, che mandi direttamente ψ in ψ̄ e viceversa !

Ricordiamoci comunque che, dopo tutto, il nostro scopo è quello di giungere ad


una definizione di C sul campo spinoriale tale per cui, per la corrente (C.78),
risulti
C: J µ (x) → −J µ (x) (C.84)
Partiamo dunque, piuttosto, da questo punto fermo per cercare di capire la
forma che dovrà assumere C sui campi ψ e ψ̄. Riprendiamo dunque l’espressione
della corrente
J µ (x) = e ψ̄(x) γ µ ψ(x) (C.85)
325
Osserviamo che, con questa definizione, C 2 commuta con gli operatori di creazione e dis-
truzione e dunque con ψ e ψ̄, ovvero con qualunque operatore dell’algebra dei campi. Questo
significa che possiamo, senza perdita di generalità alcuna, assumere che

C2 = I (C.79)

335
Questa espressione ha, però, un problema: il suo valore di aspettazione sul vuoto
non è nullo, a causa del modo asimmetrico con cui vi compaiono i campi ψ e ψ̄.
In realtà, la forma corretta della densità di corrente è piuttosto il prodotto
normal-ordinato 326 dell’espressione precedente, i.e.
J µ = e : ψ̄ γ µ ψ : (C.91)
ovvero327
e[ ]
Jµ = ψ̄, γ µ ψ (C.92)
2
dove questa espressione va intesa esplicitamente nel modo seguente
e[ ]
Jµ = ψ̄α (γ µ )αβ ψβ − (γ µ )αβ ψβ ψ̄α (C.93)
2
per cui, ricordando che ψ è una matrice colonna mentre ψ̄ è una matrice riga, in
linguaggio matriciale si ha
e[ µ ] e[ µ ]
Jµ = ψ̄γ ψ − (γ µ ψ)t ψ̄ t = ψ̄γ ψ − ψ t (γ µ )t ψ̄ t (C.94)
2 2
326
Tralasciando, per comodità di notazione, di trascrivere sia gli spinori che gli esponenziali
che compaiono nello sviluppo dei campi, per la corrente abbiamo
J µ = e ψ̄ γ µ ψ → (b + a† )(a + b† ) (C.86)
ed il termine b b† ha valor medio non nullo sul vuoto.
Il prodotto N −ordinato implica che in ogni addendo, gli operatori di creazione precedano quelli
di annichilazione, dunque
: (b + a† )(a + b† ) : ≡ : (b a + b b† + a† a + a† b† ) : = b a − b† b + a† a + a† b† (C.87)
dove, per giungere a questa espressione, si è usato il fatto che
b b† = −b† b + {b , b† } (C.88)
e l’anticommutatore, che è un c-numero, è stato quindi sottratto.
A questa stessa espressione (C.87) si può giungere se prendiamo l’espressione della corrente
data dalla (C.92). Usando gli stessi simboli di cui sopra, si ha infatti
e[ ] e[ ] e[ ]
ψ̄, γ µ ψ → b + a† , a + b† = (b + a† )(a + b† ) − (a + b† )(b + a† ) =
2 2 2
e[ ]
= b a + b b† + a† a + a† b† − a b − a a† − b† b − b† a† =
2
e[ ]
= 2 b a + 2a† b† + a† a + a† a − {a† , a} − b† b − b† b + {b† , b} =
2[ ]
= e b a + a† b† + a† a + −b† b (C.89)
dove si sono usate le relazioni
a a† = −a† a + {a† , a}; b b† = −b† b + {b† , b}; e {a† , a} = {b† , b} (C.90)

327
cfr. J.D. Bjorkeen and S.D. Drell: Relativistic Quantum Fields, Mc Graw-Hill 1965, pag.
91

336
Se adesso ricordiamo le osservazioni precedenti secondo le quali, ragionevolmente,
la trasformazione di coniugazione di carica C deve legare ψ con ψ̄ t e ψ̄ con ψ t ,
unitamente alla esigenza già ricordata per cui vogliamo che risulti

C: J µ (x) → −J µ (x) (C.95)

tutto questo ci suggerisce di cercare C in modo che scambi semplicemente i due


addendi nella (C.94), i.e.328

C: ψ → C −1 ψ̄ t e−iηC (C.98)
ψ̄ → −ψ t C eiηC (C.99)

dove C dovrà essere una matrice 4 × 4 tale che

C γ µ C −1 = −(γ µ )t ⇔ (C −1 )t (γ µ )t C t = −γ µ (C.100)

In questo caso, infatti, avremo evidentemente che


{ [ ]t [ ]t }
e
C:J µ
→ −ψ t C eiηC γ µ C −1 ψ̄ t e−iηC − C −1 ψ̄ t e−iηC (γ µ )t −ψ t C eiηC =
2
e{ t }
= −ψ C γ µ C −1 ψ̄ t + ψ̄(C −1 )t (γ µ )t C t ψ =
2{ }
e
= ψ t (γ µ )t ψ̄ t − ψ̄ γ µ ψ = −J µ (C.101)
2
Ma vediamo ora se una matrice C che soddisfi la condizione (C.100) esiste !
Per esplicitarla ci porremo, al solito, nella rappresentazione di Pauli-Dirac delle
matrici γ µ , dove
( ) ( )
0 I 0 i 0 σi
γ = γ = (C.102)
0 −I −σi 0
328
Siccome, evidentemente, i campi ψ e ψ̄ non sono indipendenti, le due leggi di trasformazione
(C.98) e (C.99) devono essere compatibili. Assumendo che valga, per esempio, la prima, ne segue
allora che, avendo assunto C unitario, risulta

C ψ C −1 = e−iηC C −1 ψ̄ t ⇒ C ψ̄ C −1 = C ψ + γ 0 C −1 = C ψ + C −1 γ 0 C −1 =
= (C ψ C −1 )+ γ 0 = (e−iηC C −1 ψ̄ t )+ γ 0 = eiηC (ψ̄ t )+ (C −1 )+ γ 0 =
= eiηC [(ψ + γ 0 )t ]+ (C −1 )+ γ 0 = eiηC [γ 0 (ψ + )t ]+ (C −1 )+ γ 0 =
= eiηC ψ t γ 0 (C −1 )+ γ 0 (C.96)

dove abbiamo usato il fatto che γ 0 è simmetrica e reale (quindi anche hermitiana). Affinché
valga la (C.99), occorre e basta, dunque, che valga la (C.98) e che la matrice C sia tale per cui

γ 0 (C −1 )+ γ 0 = −C (C.97)

337
essendo σi le usuali matrici di Pauli, i.e.
( ) ( ) ( )
0 1 0 −i 1 0
σ1 = , σ2 = , σ3 = (C.103)
1 0 i 0 0 −1

Dalla loro definizione segue immediatamente che, essendo evidentemente

(σ1 )t = σ1 ; (σ2 )t = −σ2 ; (σ3 )t = σ3 (C.104)

risulta

(γ 0 )t = γ0 (C.105)
(γ 1 )t = −γ 1 (C.106)
(γ 2 )t = γ2 (C.107)
(γ 3 )t = −γ 3 (C.108)

per cui la condizione (C.100) diviene quindi

C γ 0 C −1 = −(γ 0 )t = −γ 0 (C.109)
C γ 1 C −1 = −(γ 1 )t = γ1 (C.110)
C γ 2 C −1 = −(γ 2 )t = −γ 2 (C.111)
C γ 0 C −1 = −(γ 3 )t = γ3 (C.112)

D’altronde ricordiamo che

{γ µ , γ ν } = 2δ µν (C.113)

ovvero che le γ con indice diverso anticommutano, mentre

(γ 0 )2 = I = −(γ 1 )2 = −(γ 2 )2 = −(γ 3 )2 (C.114)

Proviamo dunque a porre


 
0 0 0 1
 0 0 −1 0 
 
C = i γ0 γ2 =   (C.115)
 0 1 0 0 
−1 0 0 0

Risulta intanto evidente che C è reale e tale da soddisfare la (C.97), infatti

C −1 = −i (γ 2 )−1 (γ 0 )−1 = i γ 2 γ 0 = −i γ 0 γ 2 = −C (C.116)


C t = i (γ 2 )t (γ 0 )t = i γ 2 γ 0 = −i γ 0 γ 2 = −C (C.117)
⇒ C −1 = C + = −C ; C 2 = −I (C.118)
⇒ γ 0 (C −1 )+ γ 0 = γ 0 Cγ 0 = −C (C.119)

338
Quanto poi alle sue proprietà di commutazione con le matrici γ µ , si ha

C γ 0 C −1 = γ 0 γ 2 γ 0 γ 0 γ 2 = γ 0 γ 2 Iγ 2 = γ 0 (γ 2 )2 = −γ 0 (C.120)
C γ 1 C −1 = γ 0 γ 2 γ 1 γ 0 γ 2 = −γ 0 γ 2 γ 0 γ 1 γ 2 = (γ 0 )2 γ 2 γ 1 γ 2 =
= γ 2 γ 1 γ 2 = −(γ 2 )2 γ 1 = γ 1 (C.121)
C γ 2 C −1 = γ 0 γ 2 γ 2 γ 0 γ 2 = γ 0 (γ 2 )2 γ 0 γ 2 = −(γ 0 )2 γ 2 = −γ 2 (C.122)
C γ 3 C −1 = γ 0 γ 2 γ 3 γ 0 γ 2 = −γ 0 γ 2 γ 0 γ 3 γ 2 = (γ 0 )2 γ 2 γ 3 γ 2 =
= γ 2 γ 3 γ 2 = −(γ 2 )2 γ 3 = γ 3 (C.123)

Resta cosı̀ dimostrato che la matrice C definita dalla (C.115) soddisfa effetti-
vamente le condizioni (C.100) e (C.97) e quindi può essere usata per definire
l’operatore C sui campi spinoriali ψ e ψ̄, in accordo con la (C.98) e la (C.99), in
modo che la corrente J µ soddisfi329 la (C.95).
Evidentemente però, se ψ e ψ̄ si trasformano sotto C secondo la (C.98) e (C.99),
queste stesse leggi di trasformazione definiscono univocamente anche l’azione di
C sugli operatori di creazione e distruzione di particella e antiparticella.
Qual è dunque il modo di agire di C su questi operatori ?
E’ facile convincersi che, effettivamente, cosı̀ come avevamo ipotizzato, risulta
semplicemente che

C a†(r) (⃗p) C −1 = eiηc b†(r) (⃗p) (C.124)


C a(r) (⃗p) C −1 = e−iηc b(r) (⃗p) (C.125)
C b†(r) (⃗p) C −1 = e−iηc a†(r) (⃗p) (C.126)
C b(r) (⃗p) C −1 = eiηc a(r) (⃗p) (C.127)

Consideriamo infatti, come esempio, il caso del campo ψ.


Usando le (C.124)-(C.127), otteniamo (si ricordi che, per ipotesi, C è lineare e
329
Si osservi che, volendo usare la definzione consueta di J µ (x) avremmo potuto giungere al
risultato corretto ma al prezzo di qualche forzatura ... Vediamo come. Partiamo dunque da

J µ (x) = ψ̄(x)γ µ ψ(x) → JCµ ≡ C J µ C −1 = ψ̄C γ µ ψC = ψ t C −1 γ µ C −1 ψ̄ t = ψ t (γ µ )t ψ̄ t

Potrebbe ora sembrare che, essendo ψ̄γ µ ψ una matrice 1 × 1, sia

ψ t (γ µ )t ψ̄ t = (ψ̄γ µ ψ)t = ψ̄γ µ ψ

ma questo è errato nel primo passaggio poiché stiamo scambiando fra loro di posto operatori
di creazione/distruzione che anticommutano, senza tenerne conto ! Se ne teniamo conto ed
ignoriamo il valore non nullo degli anticommutatori fra operatori di creazione e distruzione che
si riferiscono entrambi alla particella o alla antiparticella, allora otteniamo il risultato corretto

JCµ = ψ t (γ µ )t ψ̄ t = −(ψ̄γ µ ψ)t = −ψ̄γ µ ψ = −J µ

ma è del tutto evidente che la strada seguita non è corretta proprio perché ci forza ad ignorare
i contributi degli anticommutatori di cui sopra che, invece, non entrano in gioco quando si
assuma la forma N-ordinata di J µ ...

339
non antilineare ...)
{ 2 ∫
}
−1
∑ d3 p [ (r) −ipx †(r)
]
C ψ(x) C = C a (⃗
p) u(r)
(⃗
p) e + b (⃗
p) v (r)
(⃗
p) e ipx
C −1 =
r=1 2Ep (2π)3
{ 2 ∫
}
−iηc
∑ d3 p [ (r) (r) −ipx †(r) (r) ipx
]
=e b (⃗p) u (⃗p) e + a (⃗p) v (⃗p) e (C.128)
r=1 2Ep (2π)3
Osserviamo adesso che, dalla definizione segue che
m+ ̸ p m+ ̸ p
C −1 C u0 =
(r) (r)
C u(r) (⃗p) = C √ u0 = C √
m + Ep m + Ep
1 ( ) 1 ( )
pµ C γ µ C −1 + m C u0 = √
(r) (r)
= √ −pµ (γ µ )t + m C u0 =
m + Ep m + Ep
1 (r)
= √ (m− ̸ p)t C u0 (C.129)
m + Ep
(r)
D’altronde, dalla definizione (C.115) della matrice C e da quella degli spinori u0
(r)
e v0 (C.68), risulta
    
0 0 0 1 1 0
 0 0 −1 0  0   0 
(1)      (1)
C u0 =    = −  = −v0 (C.130)
 0 1 0 0  0   0 
−1 0 0 0 0 1

    
0 0 0 1 0 0
 0 0 −1 0  1   0 
(2)      (2)
C u0 =   =  = −v0 (C.131)
 0 1 0 0  0   1 
−1 0 0 0 0 0
quindi possiamo scrivere che
−1 (r)
C u(r) (⃗p) = √ (m− ̸ p)t v0 (C.132)
m + Ep
(r)
D’altronde, essendo v0 reale e γ 0 simmetrica, si ha
( )t ( )t ( )t
(r) (r) (r)t +(r) (r)
v0 = −γ 0 v0 = − v0 (γ 0 )t = − v0 γ0 = − v̄0 (C.133)
e dunque risulta
 t
1 ( )t m− ̸ p 
= v̄o(r)
(r)
C u(r) (⃗p) = √ (m− ̸ p)t v̄0 √ =
m + Ep m + Ep
( )t
= v̄ (r) (⃗p) (C.134)

340
Analogamente abbiamo
m− ̸ p m− ̸ p
C −1 C v0 =
(r) (r)
C v (r) (⃗p) = C √ v0 = C √
m + Ep m + Ep
1 ( ) 1 ( )
m − pµ C γ µ C −1 C v0 = √
(r) (r)
= √ m + pµ (γ µ )t C v0 =
m + Ep m + Ep
1 (r)
= √ (m+ ̸ p)t C v0 (C.135)
m + Ep

D’altronde, siccome C 2 = −1, ecco che


(r) (r) (r) (r)
Cu0 = −v0 ⇒ Cv0 = u0 (C.136)

dunque
1 (r)
C v (r) (⃗p) = √ (m+ ̸ p)t u0 (C.137)
m + Ep

(r)
ma, al solito, essendo u0 reale e γ 0 simmetrica, si ha
( )t ( )t ( )t
(r) (r) (r)t +(r) (r)
u0 = γ 0 u0 = u0 (γ 0 )t = u0 γ0 = ū0 (C.138)

e dunque risulta ancora che


 t
1 ( )t m+ ̸ p 
= ū(r)
(r)
C v (r) (⃗p) = √ (m+ ̸ p)t ū0 o √ =
m + Ep m + Ep
( )t
= ū(r) (⃗p) (C.139)

Usiamo adesso questi due risultati (C.134) e (C.139) nella (C.128): si ha


{ 2 ∫
}
−1 −iηc
∑ d3 p [ (r) (r) −ipx †(r) (r) ipx
]
C ψ(x) C = e b (⃗
p) u (⃗
p) e + a (⃗
p) v (⃗
p) e =
r=1 2Ep (2π)3
{ 2 ∫
}
−iηc
∑ d3 p [ (r) −1 −ipx †(r) −1
]
= e b (⃗p) C C u (⃗p) e
(r)
+ a (⃗p) C C v (⃗p) e
(r) ipx
=
r=1 2Ep (2π)3
{ 2 ∫ [ ] }
∑ d3 p ( )t ( )t
−1 −iηc −ipx †(r)
= C e (r) (r)
b (⃗p) v̄ (⃗p) e (r)
+ a (⃗p) ū (⃗p) e ipx
=
r=1 2Ep (2π)3
= e−iηc C −1 ψ̄ t (x)

ovvero

C ψ(x) C −1 = e−iηc C −1 ψ̄ t (x) (C.140)

341
In modo del tutto analogo si può dimostrare poi che risulta altresı̀

C ψ̄(x) C −1 = −eiηc ψ t (x) C (C.141)

In realtà non è necessario ripetere la dimostrazione330 in quanto, come abbiamo


già osservato, se C soddisfa la (C.97), ovvero la condizione γ 0 (C)+ γ 0 = −C
allora, nell’ipotesi che C sia unitario, risulta che

C ψ(x) C −1 = e−iηC C −1 ψ̄ t (x) (C.145)


⇔ C ψ̄ C −1 = −eiηC ψ t C (C.146)

Le (C.124)-(C.127) definiscono dunque una trasformazione C che scambia


particella ed antiparticella e soddisfa le condizioni (C.98) e (C.99), ovvero che è
tale per cui

C: J µ (x) → −J µ (x) (C.147)

Ma è una simmetria ?
Proprio perché è tale per cui vale la (C.147), possiamo senz’altro dire fin d’ora
che se lo è per il campo libero, lo è anche per quanto riguarda l’interazione del
campo elettromagnetico con la corrente prodotta dal campo spinoriale.
Per il campo libero dobbiamo verificare ancora sia l’invarianza della densità la-
grangiana che la coerenza della trasformazione con l’algebra dei campi, ovvero
con le loro regole di anticommutazione.
Iniziamo da queste ultime. Per gli unici anticommutatori non nulli si ha
{ } { }
C: a(r) (⃗p), a†(s) (⃗q) ←→ b(r) (⃗p), b†(s) (⃗q) (C.148)

e siccome le regole di anticommutazione canoniche (C.65) ci dicono che esse coin-


cidono per gli operatori di particella e di antiparticella, possiamo concludere che,
330
Formalmente risulta infatti che se

C ψ(x) C −1 = e−iηC C −1 ψ̄ t (x) (C.142)

allora, essendo C, per ipotesi, unitaria, risulta


( )†
C ψ̄C −1 = Cψ † γ 0 C −1 = Cψ † C −1 γ 0 = Cψ † C † γ 0 = CψC −1 γ 0 =
( )†
= e−iηC C −1 ψ̄ t γ 0 = eiηC (ψ̄ t )† (C −1 )+ γ 0 (C.143)

ma, per quanto visto precedentemente, essendo (C −1 )+ = C, e γ 0 = (γ 0 )t = (γ 0 )+ , risulta


infine
[( )t ]† 0 [ ]†
C ψ̄C −1 = eiηC ψ † γ 0 Cγ = eiηC (γ 0 )t (ψ t )† Cγ 0 =
= eiηC ψ t γ 0 C γ 0 = −eiηC ψ t C (C.144)

342
effettivamente, la trasformazione C definita dalle (C.124) - (C.127) è senz’altro
compatibile con l’algebra del campo di Dirac.
Veniamo ora alla dimostrazione della sua compatibilità con la dinamica.
Partiamo al solito dalla densità lagrangiana del campo di Dirac
i[ µ ]
L(x) = ψ̄ γ (∂µ ψ) − (∂µ ψ̄)γ µ ψ − m ψ̄ ψ (C.149)
2
ed osserviamo che la trasformazione C sui campi ψ e ψ̄ è tale che331

C: x→x (C.152)
ψ(x) → ψC (x) = e−iηC C −1 ψ̄ t (x) ⇔ ψ̄ = eiηC ψCt C −1 (C.153)
ψ̄(x) → ψ̄C (x) = −eiηC ψ t (x) C ⇔ ψ = −e−iηC C ψ̄Ct (C.154)

L’invarianza in valore della lagrangiana garantisce che l’evoluzione dei campi


trasformati ψC e ψ̄C è retta dalla densità lagrangiana seguente:
i [( iηC t −1 ) µ ( ) ( ) ( )]
LC (x) = e ψC C γ −∂µ e−iηC C ψ̄Ct − ∂µ eiηC ψCt C −1 γ µ −e−iηC C ψ̄Ct +
2
+ m eiηC ψCt C −1 e−iηC C ψ̄Ct (C.155)

Iniziamo allora con il considerare il termine di massa. Si ha

m eiηC ψCt C −1 e−iηC C ψ̄Ct = m ψCt ψ̄Ct = m (ψC )α (ψ̄C )α (C.156)

dove la somma sulle componenti dei campi, individuate dall’indice α, si estende,


ovviamente, da 1 a 4.
Questo termine, apparentemente, è opposto a quello che compare nella densità
lagrangiana originaria del campo di Dirac, dove il termine di massa è appunto
espresso dal termine

−m ψ̄ ψ = −m ψ̄α ψα (C.157)

In realtà occorre ricordare, di nuovo, che i prodotti che compaiono nella densità
lagrangiana vanno sempre intesi come normal-ordinati e siccome ψ e ψ̄ anticom-
mutano, evidentemente è

: ψ ψ̄ : = − : ψ̄ ψ : (C.158)
331
Abbiamo infatti che (si ricordi che C t = C −1 = −C)

ψC = e−iηC C −1 ψ̄ t ⇒ ψC
t
= e−iηC ψ̄ (C −1 )t = e−iηC ψ̄C ⇒ ψ̄ = eiηC ψC
t
C −1 (C.150)

e cosı̀ pure risulta

ψ̄C = −eiηC ψ t C ⇒ ψ̄C


t
= −eiηC C t ψ ⇒ ψ = −e−iηC (C t )−1 ψ̄C
t
= −e−iηC C ψ̄C
t
(C.151)

343
per cui, in definitiva, il termine di massa (C.156) coincide effettivamente con
quello canonico, presente nella densità lagrangiana di Dirac.
Veniamo ora agli altri due termini, i.e. alle quantità
( ) ( ) ( ) ( )
eiηC ψCt C −1 γ µ −∂µ e−iηC C ψ̄Ct − ∂µ eiηC ψCt C −1 γ µ −e−iηC C ψ̄Ct =
( )( ) ( )( )
= −ψCt C −1 γ µ C ∂µ ψ̄Ct + ∂µ ψCt C −1 γ µ C ψ̄Ct (C.159)

D’altronde, essendo C −1 = −C, evidentemente si ha

Cγ µ C −1 = −(γ µ )t ⇔ C −1 γ µ C = −(γ µ )t (C.160)

e dunque i due termini di cui sopra diventano


( ) ( )
ψCt (γ µ )t ∂µ ψ̄Ct − ∂µ ψCt (γ µ )t ψ̄Ct (C.161)

ovvero, esplicitamente
µ
(ψC )α γβα (∂µ ψ̄C )β − (∂µ ψC )α γβα
µ
(ψ̄C )β =
[ ]
µ
= γβα (ψC )α (∂µ ψ̄C )β − (∂µ ψC )α (ψ̄C )β (C.162)

da confrontare con gli analoghi termini della densità lagrangiana di Dirac origi-
naria
[ ]
ψ̄β (γ µ )βα (∂µ ψ)α − (∂µ ψ̄)β (γ µ )βα ψα = γβα
µ
ψ̄β (∂µ ψ)α − (∂µ ψ̄)β ψα (C.163)

ed è allora evidente che, tenendo conto, di nuovo del normal-ordering e le regole


di anticommutazione dei campi, i due termini hanno la stessa forma.
Ricordiamo di nuovo che un metodo equivalente per verificare che i campi ψ e
ψC (e dunque anche ψ̄ e ψ̄C ...) hanno la stessa dinamica è, naturalmente, quello
di dimostrare che l’hamiltoniana libera H0 del campo di Dirac risulta essere C-
invariante.
Richiamiamo, a questo scopo, l’espressione di H0 in termini degli operatori di
creazione e distruzione. Risulta
∑∫ d3 p [ ]
(r)† (r) (r)† (r)
H0 = E p a (⃗
p) a (⃗
p) + Ep b (⃗
p) b (⃗
p) (C.164)
r (2π)3 2Ep
ed è evidente, allora, che, siccome risulta

C a† a C −1 = b† b; C b† b C −1 = a† a

l’operatore C commuta effettivamente con H0 .


Dato che l’operatore C rispetta anche l’algebra dei campi essa è dunque una
simmetria conservata anche per il campo di Dirac, la quale rimane tale anche
in presenza di interazione elettromagnetica, per il fatto che inverte il segno della
densità di corrente ...

344
Prima di concludere l’argomento, veniamo ad un’ultima osservazione concer-
nente il fattore di fase eiηC , detto anche parità di carica intrinseca della particella.
Come si è visto, almeno nei casi esaminati, essa è, a priori, arbitraria, con la sola
eccezione del caso delle particelle che coincidono con le loro antiparticelle, per le
quali può solo essere

eiηC = ±1 (C.165)

dovendo essere C 2 = 1.
Il fotone è una di queste e, come sappiamo, ha parità di carica intrinseca pari a
−1, i.e.

C | γ >= − | γ > (C.166)

La conoscenza della parità di carica intrinseca del fotone (e, eventualmente,


di altre particelle) viene usata per fissare quella di altre particelle, sulla base
dell’esistenza di un decadimento di queste ultime che sappiamo avvenire at-
traverso una imterazione che conserva C (come l’interazione elettromagnetica o
l’interazione forte) e coinvolge fotoni e/o altri autostati di C di autovalore noto.
Naturalmente, la bontà della conclusione deve essere poi verificata attravero altri
decadimenti che non contraddicano la conclusione cosı̀ tratta !

345
C.3 La Parità
Classicamente la simmetria di parità P è la simmetria legata all’inversione degli
assi spaziali, i.e.

P : ⃗x → −⃗x ; t→t (C.167)

Secondo questa simmetria, quindi, ci aspettiamo che le grandezze vettoriali cam-


bino di segno, mentre quelle pseudovettoriali non lo facciano. Per esempio, ci
aspettiamo che

P : p⃗ → −⃗p ; J⃗ → J⃗ (C.168)
⃗ x, t) → −E(−⃗
E(⃗ ⃗ x, t) ; ⃗ x, t) → B(−⃗
B(⃗ ⃗ x, t) (C.169)
A (⃗x, t) → Aµ (−⃗x, t) ;
µ
(C.170)

E per quanto riguarda gli stati ?


Abbiamo già visto, nello schema di prima quantizzazione, che l’operatore P , che
descrive la trasformazione di parità, può essere definito in modo che sia una
simmetria unitaria tale che

P2 = I (C.171)

Se prendiamo allora, per esempio, una base di autostati simultanei dell’impulso


e della componente z dello spin, questa simmetria dovrà agire in modo che

P | p⃗, s >≡ eiηP | − p⃗, s > (C.172)

e la fase ηP dovrà essere la stessa su tutti i vettori con cui si possono fare sovrap-
posizioni lineari, se vogliamo che

P [α | p⃗, s1 > +β | ⃗q, s2 >] ∝ α | − p⃗, s1 > +β | − ⃗q, s2 > (C.173)

Questo implica che, limitandoci per esempio solo allo spazio degli stati di parti-
cella singola, ηP sia unica su tutto lo spazio. D’altronde

P 2 = I ⇒ e2iηP = 1 (C.174)

e dunque

eiηP = ±1 = e−iηP (C.175)

Passiamo adesso a vedere quale può essere l’azione di P sul campo scalare carico.
Da quanto abbiamo detto, segue che ci aspettiamo che risulti

P | a(⃗p) > = eiηP | a(−⃗p) > (C.176)


P | b(⃗p) > = eiχP | b(−⃗p) > (C.177)

346
ovvero, assunto di nuovo che il vuoto |Ω > sia P −invariante, possiamo richiedere
agli operatori di creazione di particella e antiparticella di essere tali per cui

P a† (⃗p) P −1 = eiηP a† (−⃗p) (C.178)


P b† (⃗p) P −1 = eiχP b† (−⃗p) (C.179)

e quindi, essendo P per ipotesi unitaria, sarà altresı̀

P a(⃗p) P −1 = e−iηP a(−⃗p) (C.180)


P b(⃗p) P −1 = e−iχP b(−⃗p) (C.181)

A priori le fasi ηP e χP possono essere considerate come indipendenti, visto che


riguardano una la particella e l’altra l’antiparticella. Comunque, poiché i campi
ϕ e ϕ† contengono entrambi operatori sia di particella che di antiparticella, solo
un legame fra le due fasi consentirà di giungere a leggi di trasformazione semplici
per i campi stessi.
Usando questo ulteriore vincolo, possiamo facilmente convincersi che deve
essere332

χP = −ηP (C.183)

e dunque

P a† (⃗p) P −1 = eiηP a† (−⃗p) (C.184)


P a(⃗p) P −1 = e−iηP a(−⃗p) (C.185)
P b† (⃗p) P −1 = e−iηP b† (−⃗p) (C.186)
P b(⃗p) P −1 = eiηP b(−⃗p) (C.187)

Quanto ai campi, definendo per comodità

P x = P (x0 , ⃗x) ≡ (x0 , −⃗x) (C.188)


ϕP (x) ≡ ϕP (x0 , ⃗x) = P ϕ(x) P −1 ≡ P ϕ(x0 , ⃗x) P −1 (C.189)

risulta allora che



−1 −iηP d3 p { −ipx † ipx
}
ϕP (x) = P ϕ(x) P = e a(−⃗p) e + b (−⃗
p) e =
2Ep (2π)3
= e−iηP ϕ(x0 , −⃗x) ≡ e−iηP ϕ(P x) (C.190)
332
Ricordando comunque che

eiηp = ±1 = e−iηP (C.182)

347
e, analogamente (si ricordi comunque che eiηP = e−iηp )

d3 p { }
ϕ†P (x) †
= P ϕ (x) P −1
= e iηP
b(−⃗p ) e−ipx
+ a†
(−⃗
p) eipx
=
2Ep (2π)3
= eiηP ϕ† (x0 , −⃗x) ≡ eiηP ϕ† (P x) (C.191)

in perfetto accordo con quanto potevamo attenderci in base all’analogia classica.

E’ banale dimostrare adesso che questa legge di trasformazione è compatibile con


le regole di commutazione del campo.
Come sappiamo, infatti, l’algebra del campo scalare è definita univocamente dalle
regole di commutazione degli operatori di creazione e distruzione e gli unici com-
mutatori non nulli sono
[ ] [ ]
a(⃗p), a† (⃗q) = b(⃗p), b† (⃗q) = 2Ep δ 3 (⃗p − ⃗q) (C.192)

D’altronde, sotto parità, gli operatori di creazione e distruzione di particella e


antiparticella restano tali, solo che si invertono i segni degli impulsi, i.e.

p⃗ → −⃗p ; ⃗q → −⃗q (C.193)

Siccome però la funzione δ è una funzione pari, evidentemente la simmetria di


parità P conserva la struttura canonica dell’algebra del campo scalare.
Quanto poi alle equazioni del moto, evidentemente se i campi ϕ(x0 , ⃗x) e ϕ† (x0 , ⃗x)
soddisfano l’equazione di Klein-Gordon, allora anche i campi

ϕP (x′ ) ≡ ϕP (x0 , −⃗x) = e−iηP ϕ(x) (C.194)


ϕ†P (x′ ) ≡ ϕ†P (x0 , −⃗x) = eiηP ϕ† (x) (C.195)

lo fanno, poiché

P : ∂ µ → ∂µ (C.196)

e dunque il D’Alembertiano non cambia per parità.


Questo stesso risultato può essere altresı̀ ottenuto formalmente a partire dalla
densità lagrangiana, dimostrandone, al solito, l’invarianza in forma sotto P .
Infatti, come ben sappiamo, per il campo scalare abbiamo

L(x) = (∂µ ϕ)(∂ µ ϕ† ) − m2 ϕϕ† (C.197)

D’altronde, secondo la trasformazione in questione risulta

P : x → x′ = P x ⇔ x = P x′ (C.198)
ϕ(x) → ϕP (x′ ) = e−iηP ϕ(x) ⇔ ϕ(x) = eiηP ϕP (x′ ) (C.199)
ϕ† (x) → ϕ†P (x′ ) = eiηP ϕ† (x) ⇔ ϕ† (x) = e−iηP ϕ†P (x′ ) (C.200)

348
Ma l’invarianza in valore della lagrangiana ci garantisce che ϕP (x′ ) e ϕ†P (x′ ) verifi-
cano le equazioni di Eulero-Lagrange ottenute a partire dalla densità lagrangiana
(si noti che i due fattori di fase in ϕ e ϕ† si compensano l’un l’altro)

LP (x′ ) = (∂µ ϕP (x′ ))(∂ µ ϕ†P (x′ )) − m2 ϕP (x′ )ϕ†P (x′ ) (C.201)

e siccome
′ ′ ′ ′
∂ µ ϕP (x′ ) = ∂µ ϕP (x′ ) ≡ ∂µ ϕP ; ∂ µ ϕ†P (x′ ) = ∂µ ϕ†P (x′ ) ≡ ∂µ ϕ†P (C.202)

ecco che risulta finalmente che


′ ′
LP (x′ ) = (∂ µ ϕP )(∂µ ϕ†P ) − m2 ϕP ϕ†P (C.203)

ovvero che L è invariante in forma sotto P e dunque ϕ e ϕP hanno la stessa


dinamica !
Da tutto questo, segue quindi che P è una simmetria conservata per il campo
scalare libero.

Campi per cui eiηP = +1 sono detti campi scalari, mentre campi per cui
eiηP = −1 sono detti campi pseudoscalari e la quantità eiηP = ±1 è chiamata
anche parità intrinseca del campo o della particella considerata.
Si noti infine che, per campi scalari, la parità intrinseca della particella è la stessa
di quella dell’antiparticella.

Consideriamo adesso, di nuovo, l’interazione elettromagnetica. Classicamente


essa è invariante per parità perché

P : Jµ (x) → J µ (P x) (C.204)
Aµ (x) → Aµ (P x) (C.205)

e dunque

Lint (x) = −Jµ (x)Aµ (x) → −J µ (P x)Aµ (P x) = Lint (P x) (C.206)

Volendo mantenere l’analogia, richiederemo senz’altro che sia

P : Aµ (x) → Aµ (P x) (C.207)

e ne vedremo fra breve le conseguenze.


Ma per quanto riguarda la densità di corrente associata al campo scalare carico?
Come sappiamo, essa è data da
[ ( ) ]
J µ (x) = i ϕ† (x) (∂ µ ϕ(x)) − ∂ µ ϕ† (x) ϕ(x) (C.208)

349
Come si trasforma per parità ? Si ha
[ ]
P J 0 (x0 , ⃗x) P −1 = i P ϕ† (x) P −1 P ∂ 0 ϕ(x) P −1 − P ∂ 0 ϕ† (x) P −1 P ϕ(x) P −1 =
[ ′ ′
]
= i eiηP e−iηP ϕ† (x′ ) ∂ 0 ϕ(x′ ) − ∂ 0 ϕ† (x′ ) ϕ(x′ ) =
= J 0 (x′ ) ≡ J 0 (x0 , −⃗x) ≡ J 0 (P x) (C.209)
′0
dove abbiamo usato il fatto che, ovviamente, ∂ 0 = ∂ .
Per quanto riguarda invece le componenti spaziali, proprio perché ∇ ⃗ ′,
⃗ = −∇
ripetendo la dimostrazione di cui sopra, si conclude che
⃗ P −1 = −J(x
P J(x) ⃗ ′ ) ≡ −J(x
⃗ 0 , −⃗x) ≡ −J(P
⃗ x) (C.210)
ovvero risulta dimostrato che effettivamente si ha
P J µ (x) P −1 = Jµ (x′ ) ≡ Jµ (x0 , −⃗x) ≡ Jµ (P x) (C.211)
e questo indipendentemente dal fatto che il campo sia scalare o pseudoscalare.

Per quanto riguarda poi il campo elettromagnetico, abbiamo già detto che, in
base al suo significato classico ed alle proprietà note del campo stesso, richiediamo
che, anche per il campo quantizzato, accada che
P Aµ (x) P −1 = Aµ (x′ ) ≡ Aµ (P x) (C.212)
Abbiamo già visto che lo sviluppo del campo elettromagnetico in termini di op-
eratori di creazione e distruzione è dato da
∑∫ d3 p [ ]
−ipx † ∗µ
Aµ (x) = a(⃗
p , s) ϵ µ
s (⃗
p) e + a (⃗
p , s) ϵ s (⃗
p) e ipx
(C.213)
s 2Ep (2π)3
dove ϵµs (⃗p) descrive lo stato di polarizzazione333 del fotone generato dall’operatore
di creazione a† (⃗p, s), quando esso viene applicato al vuoto.
Abbiamo detto che vogliamo che risulti
P Aµ (x0 , ⃗x) P −1 = Aµ (x0 , −⃗x) (C.215)
333
Infatti la funzione d’onda del fotone individuato dallo stato a† (⃗
p, s) |Ω > è data da
ψsµ (x) = < Ω| Aµ (x) a† (⃗
p, s) |Ω >=
∑∫ 3
d q [ ]
= < Ω| a(⃗q, λ) ϵµ (⃗q, λ) e−iqx + a† (⃗q, λ) ϵ∗µ (⃗q, λ) eiqx a† (⃗
p, s) |Ω >=
(2π)3 2Eq
λ
∑∫ d3 q
= ϵµ (⃗q, λ) e−iqx (2π)3 δsλ δ(⃗q − p⃗) 2Eq = ϵµ (⃗q, s) e−ipx (C.214)
(2π)3 2Eq
λ

dove si è usato il fatto che < Ω| a a† |Ω >=< Ω|[a , a† ] |Ω > e che < Ω|a† a† |Ω >= 0, nonché
l’espressione canonica del commutatore, per cui risulta
p) , a† (⃗q)] = 2Ep (2π)3 δ(⃗q − p⃗)
[a(⃗

350
ovvero, visto che nella gauge di radiazione A0 = 0, questo significa che
⃗ 0 , ⃗x) P −1 = −A(x
P A(x ⃗ 0 , −⃗x) (C.216)
Cerchiamo allora di vedere che cosa questo implichi sugli operatori di creazione e
distruzione del fotone e riprendiamo per questo lo sviluppo consueto del campo
Aµ , usando per descrivere lo stato di polarizzazione dei fotoni gli stati con elicità
definita. Risulta
∑ ∫ d3 p [ ]
−ipx † ∗µ
Aµ (x0 , ⃗x) = a(⃗
p , λ) ϵ µ
(⃗
p , λ) e + a (⃗
p , λ) ϵ (⃗
p , λ) eipx

λ=±1 2Ep (2π)3


dove gli stati di polarizzazione sono quelli di elicità, i.e. λ = ±1, il cui significato,
lo ricordiamo, è quello della proiezione del momento angolare nella direzione del
moto. Ci aspettiamo dunque che, per parità, visto che il moto si inverte di senso
ma il momento angolare no, sia
P : λ → −λ (C.217)
Proviamo dunque a definire
P a(⃗p, λ) P −1 = −a(−⃗p, −λ) (C.218)
P a† (⃗p, λ) P −1 = −a† (−⃗p, −λ) (C.219)
Risulta allora, usando le relazioni334 sulle polarizzazioni (2.546) e (2.547), che
∑ ∫ d3 p [
⃗ 0 , ⃗x) P −1 = −
P A(x a(−⃗p, −λ)⃗ϵ(⃗p, λ) e−ip x +i⃗p·⃗x +
0 0

2Ep (2π) 3
λ=±1
]
+ a (−⃗p, −λ)⃗ϵ∗ (⃗p, λ) eip
† 0 x0 −i⃗
p·⃗
x
=
∑ ∫ d3 p [
a(−⃗p, −λ)⃗ϵ(−⃗p, −λ) e−ip x +i⃗p·⃗x +
0 0
= − 3
λ=±1 2Ep (2π)
]
+ a (−⃗p, −λ)⃗ϵ∗ (−⃗p, −λ) eip
† 0 x0 −i⃗
p·⃗
x

334
Nella gauge di radiazione, detta anche gauge di Coulomb (nella quale il potenziale scalare
soddisfa l’equazione dell’elettrostatica e dunque, in assenza di densità di carica, è nullo) per
un’onda che viaggia nella direzione ⃗k dell’asse z, possiamo scegliere
⃗ϵ(⃗k, 1) = (1, 0, 0) (C.220)
⃗ϵ(⃗k, 2) = (0, 1, 0) (C.221)
e questo corrisponde a scegliere polarizzazioni lineari: per ipotesi, i vettori ⃗ϵ(⃗k, 1), ⃗ϵ(⃗k, 2) e
⃗k/|⃗k| formano una terna destrorsa, rispettivamente come gli assi cartesiani x, y, z. Seguendo
la convenzione consueta (usata, p.es. anche da Bjorken e Drell), per un’onda che viaggia in
verso opposto alla direzione ⃗k dell’asse z assumeremo altresı̀ che sia
⃗ϵ(−⃗k, 1) = −⃗ϵ(⃗k, 1) (C.222)
⃗ϵ(−⃗k, 2) = ⃗ϵ(⃗k, 2) (C.223)
Un’altra scelta equivalente e molto spesso più comoda è quella di usare polarizzazioni circolari,
i.e., sempre per un fotone che viaggia lungo l’asse z

351
Scambiando allora λ → −µ e p⃗ → −⃗q, si ha
∑ ∫ d3 q [
⃗ 0 , ⃗x) P −1 = −
P A(x a(⃗q, µ)⃗ϵ(⃗q, µ) e−iq x +i⃗q·(−⃗x) +
0 0

2Eq (2π)3
µ=±1
]
+ a† (⃗q, µ)⃗ϵ∗ (⃗q, µ) eiq
0 x0 −i⃗
q ·(−⃗
x)
=
= −A(x
⃗ 0 , −⃗x) (C.228)
che dimostra la (C.216) e quindi la (C.215).
E’ facile poi verificare che la legge di trasformazione (C.218)-(C.219)
• rispetta con l’algebra del campo elettromagnetico;
• lascia, evidentemente, invarianti le equazioni del moto
2Aµ = 0; ∂µ Aµ = 0 (C.229)
in quanto

P : ∂µ → ∂ µ ; Aµ (x) → Aµ (P x) (C.230)

Quindi P definisce una simmetria conservata per il campo elettromagnetico libero.


Osserviamo, prima di lasciare questo argomento, che, per quanto detto sopra,
lo stato di fotone è tale per cui
P | p⃗, λ >= P a† (⃗p, λ) P −1 P | Ω >= −a† (−⃗p, −λ) | Ω >= − | − p⃗, −λ > (C.231)
ovvero che il fotone ha parità intrinseca negativa.

E veniamo, infine, all’azione della trasformazione di parità sul campo di Dirac.


Evidentemente, cosı̀ come nel caso del campo scalare, affinchè P possa continuare
ad essere una simmetria conservata in presenza di interazione elettromagnetica,
vogliamo che accada che
P : J µ (x) → Jµ (P x) (C.232)

1 ( ) 1
⃗ϵ(⃗k, +) = √ −⃗ϵ(⃗k, 1) − i⃗ϵ(⃗k, 2) = − √ (1, i, 0) elicita′ λ = +1 (C.224)
2 2
1 ( ) 1
⃗ϵ(⃗k, −) = √ ⃗ϵ(⃗k, 1) − i⃗ϵ(⃗k, 2) = √ (1, −i, 0) elicita′ λ = −1 (C.225)
2 2
In questo caso, date le (C.222) e (C.223), risulta
1 ( )
⃗ϵ(−⃗k, +) = √ ⃗ϵ(⃗k, 1) − i⃗ϵ(⃗k, 2) = ⃗ϵ(⃗k, −) (C.226)
2
1 ( )
⃗ϵ(−⃗k, −) = √ −⃗ϵ(⃗k, 1) − i⃗ϵ(⃗k, 2) = ⃗ϵ(⃗k, +) (C.227)
2

352
Ma procediamo, di nuovo, a partire dallo sviluppo del campo in termini di oper-
atori di creazione e distruzione, tenendo conto dell’analogia classica.
Dovendo, la parità invertire il segno dell’impulso ma non alterare lo stato di spin
della particella/antiparticella, possiamo provare a scrivere
P a†(r) (⃗p) P −1 = eiηP a†(r) (−⃗p) (C.233)
P a(r) (⃗p) P −1 = e−iηP a(r) (−⃗p) (C.234)
dove la (C.234) discende direttamente dalla (C.233) visto che abbiamo assunto
che P sia unitaria.
Per quanto riguarda poi l’azione di P sugli operatori di creazione e distruzione
dell’antiparticella, in analogia con quanto accadeva nel caso del campo scalare335 ,
possiamo provare a porre
P b†(r) (⃗p) P −1 = e−iηP b†(r) (−⃗p) (C.235)
P b(r) (⃗p) P −1 = eiηP b(r) (−⃗p) (C.236)
con eiηP = ±1 = e−iηP , per il fatto che deve comunque essere P 2 = I.
Vediamo l’effetto della trasformazione P sopra definita sui campi ψ e ψ̄. Si ha
{
∑∫ d3 p [ (r)
−1
0
P ψ(x , ⃗x) P = P a (⃗p)u(r) (⃗p) e−ipx +
r 2Ep (2π)3
]}
†(r)
+ b (⃗p)v (r) (⃗p) eipx + P −1 =
∑∫ d3 p [ (r)
−iηP
a (−⃗p)u(r) (⃗p) e−ip x +i⃗p·⃗x +
0 0
= e 3
r 2Ep (2π)
]
†(r) 0 x0 −i⃗
p·⃗
+ b (−⃗p)v (r) (⃗p) eip x
=
∑∫ d3 q [
= e−iηP a(r) (⃗q)u(r) (−⃗q) e−iq x +i⃗q·(−⃗x) +
0 0

2Eq (2π)3
r
]
†(r) 0 x0 −i⃗
q ·(−⃗
+ b (⃗q)v (r) (−⃗q) eiq x)
(C.237)
Ma essendo
m+ ̸ p (r) p0 γ 0 − p⃗ · ⃗γ + m (r)
u(r) (⃗p) = √ u0 = √ u0 (C.238)
m + Ep m + Ep

chiaramente risulta
p0 γ 0 + p⃗ · ⃗γ + m (r) (p0 γ 0 + p⃗ · ⃗γ + m)γ 0 (r)
u(r) (−⃗p) = √ u0 = √ γ 0 u0 =
m + Ep m + Ep
335
Ricordiamo a questo proposito che la ragione per cui il fattore di fase che compare nella legge
di trasformazione sotto P di b† sia il complesso coniugato di quello relativo ad a† , discendeva
solo dall’esigenza di avere, alla fine, una legge di trasformazione semplice per il campo ϕ. Come
vedremo, questa stessa esigenza ci costringerà, nel caso del campo ψ, a giungere ad una diversa
conclusione.

353
(p0 γ 0 − p⃗ · ⃗γ + m) (r) p0 γ 0 − p⃗ · ⃗γ + m (r)
= γ0 √ γ 0 u0 = γ 0 √ u0 (C.239)
m + Ep m + Ep
(r) (r)
visto che γ 0 γ k = −γ k γ 0 e γ 0 u0 = u0 . Dunque si ha
u(r) (−⃗p) = γ 0 u(r) (⃗p) (C.240)
Per quanto riguarda lo spinore v r (⃗p), a sua volta, si ha che, essendo
m− ̸ p (r)
v (r) (⃗p) = √ v0 (C.241)
m+E
risulta che
m − p0 γ 0 − p⃗ · ⃗γ (r) (m − p0 γ 0 − p⃗ · ⃗γ )γ 0 (r)
v (r) (−⃗p) = √ v0 = √ γ 0 v0 =
m + Ep m + Ep
(m − p0 γ 0 + p⃗ · ⃗γ ) (r)
= γ0 √ (−v0 ) (C.242)
m + Ep
(r) (r)
essendo stavolta γ 0 v0 = −v0 . Quindi abbiamo
v (r) (−⃗p) = −γ 0 v (r) (⃗p) (C.243)
Questo diverso comportamento degli spinori u dagli spinori v richiede un ripen-
samento delle (C.233)-(C.236).
Se vogliamo, infatti, che il campo ψ si trasformi sotto parità in modo ragionevole,
i.e.
P ψ(x0 , ⃗x) P −1 ∝ ψ(x0 , −⃗x) (C.244)
allora, mantenendo per gli operatori a e a† che agiscono sulla particella, le
relazioni (C.233) e (C.234) occorre, quanto agli operatori b e b† che agiscono
sull’antiparticella, imporre che soddisfino piuttosto le relazioni seguenti
P b† (⃗p) P −1 = −e−iηP b† (−⃗p) (C.245)
P b(⃗p) P −1 = −eiηP b(−⃗p) (C.246)
Infatti, in questo caso, per la (C.233) e la (C.245), avremo
∑∫ d3 q [
−1 −iηP
a(r) (⃗q) u(r) (−⃗q) e−iq x +i⃗q·(−⃗x) −
0 0 0
P ψ(x , ⃗x) P = e 3
r 2Eq (2π)
]
†(r) 0 x0 −i⃗
q ·(−⃗
−b (⃗q) v (r) (−⃗q) eiq x)
=
∑∫ d3 q [
= e−iηP γ 0 a(r)
(⃗
q ) u(r)
(⃗
q ) e −iq 0 x0 +i⃗
q ·(−⃗
x)
+
r 2Eq (2π)3
]
†(r) 0 x0 −i⃗
q ·(−⃗
= +b (⃗q) v (r) (⃗q) eiq x)
=
= e−iηP γ 0 ψ(x0 , −⃗x) (C.247)

354
Ovvero, posto al solito
ψP (x) ≡ P ψ(x) P −1 (C.248)
risulta
ψP (x) = e−iηP γ 0 ψ(P x) (C.249)
Per il campo ψ̄, nelle stesse ipotesi, otteniamo evidentemente che336
P ψ̄(x0 , ⃗x) P −1 = eiηP ψ̄(x0 , −⃗x) γ 0 ⇒ ψ̄P (x) = eiηP ψ̄(P x) γ 0 (C.251)
Quindi, nel caso spinoriale, particella e antiparticella hanno parità intrinseche
opposte: se poniamo eiηP ≡ 1, la particella ha parità +1 e l’antiparticella ha
parità −1, mentre vale l’opposto se eiηP = −1.

Cerchiamo ora di vedere se la trasformazione P cosı̀ definita è una simmetria


conservata nel caso del campo spinoriale libero.
E’ facile convincersi che P è coerente con l’algebra dei campi in quanto rispetta
le regole di anticommutazione. Infatti, per le uniche non nulle, si ha
{ }
a(r) (⃗p) , a†(s) (⃗q) = 2Ep δrs δ(⃗p − ⃗q)
{ }
P : ⇒ e−iηP a(r) (−⃗p) , eiηP a†(s) (−⃗q) = 2Ep δrs δ(−⃗p + ⃗q) ≡ 2Ep δrs δ(⃗p − ⃗q)
{ }
b(r) (⃗p) , b†(s) (⃗q) = 2Ep δrs δ(⃗p − ⃗q)
{ }
P : ⇒ −eiηP b(r) (−⃗p) , −e−iηP b†(s) (−⃗q) = 2Ep δrs δ(−⃗p + ⃗q) ≡ 2Ep δrs δ(⃗p − ⃗q)
Veniamo ora alla dinamica. La densità lagrangiana del campo spinoriale, come
ben sappiamo, è
i[ µ ]
L(x) = ψ̄ γ (∂µ ψ) − (∂µ ψ̄) γ µ ψ − m ψ̄ ψ (C.252)
2
La legge di trasformazione descritta da P è tale per cui
P : x → x′ ≡ P x ⇔ x = P x′ (C.253)
ψ(x) → ψP (x′ ) ≡ e−iηP γ 0 ψ(x) ⇔ ψ(x) = eiηP γ 0 ψP (x′ ) (C.254)
ψ̄(x) → ψ̄P (x′ ) ≡ eiηP ψ̄(x) γ 0 ⇔ ψ̄(x) = e−iηP ψ̄P (x′ ) γ 0 (C.255)
336
Si può procedere formalmente come abbiamo fatto nel caso del campo ψ(x), a partire dalle
leggi di trasformazione degli operatori di creazione e distruzione, oppure si può semplicemente
osservare che, dalla legge di trasformazione di ψ(x), segue che
( )+ 0
P ψ̄(x0 , ⃗x) P −1 = P ψ + (x)γ 0 P −1 = P ψ + (x) P −1 γ 0 = P ψ(x) P −1 γ =
( −iηP 0 )+ 0 iηP
( 0 )+ 0 iηP + 0 0
= e γ ψ(P x) γ = e γ ψ(P x) γ = e ψ(P x) γ γ =
= eiηP ψ̄(P x) γ 0 (C.250)

355
dunque l’evoluzione dei campi ψP e ψ̄P è retta dalla densità lagrangiana (invari-
anza in valore ...)
i { −iηP
LP (x′ ) = e ψ̄P (x′ )γ 0 γ µ ∂µ [eiηP γ 0 ψP (x′ )]−
2 }
− ∂µ [e−iηP ψ̄P (x′ )γ 0 ] γ µ eiηP γ 0 ψP (x′ ) −
− m e−iηP ψ̄P (x′ )γ 0 eiηP γ 0 ψP (x′ ) =
i{ ′ ′
}
= ψ̄P γ 0 γ µ γ 0 (∂ µ ψP ) − (∂ µ ψ̄P ) γ 0 γ µ γ 0 ψP − m ψ̄P ψP (C.256)
2

dove abbiamo usato il fatto che ∂µ = ∂ µ e che (γ 0 )2 = I.
Poichè γ 0 γ µ γ 0 = γµ , abbiamo immediatamente che
i{ ′ ′
}
LP (x′ ) = ψ̄P γµ (∂ µ ψP ) − (∂ µ ψ̄P ) γµ ψP − m ψ̄P ψP (C.257)
2
la quale prova che la densità lagrangiana del campo di Dirac risulta invariante in
forma per parità e quindi i campi ψ e ψP hanno la stessa dinamica.
Resta cosı̀ dimostrato che la trasformazione P definita da
P a†(r) (⃗p) P −1 = eiηP a†(r) (−⃗p) (C.258)
P a(r) (⃗p) P −1 = e−iηP a(r) (−⃗p) (C.259)
P b†(r) (⃗p) P −1 = −eiηP b†(r) (−⃗p) (C.260)
P b(r) (⃗p) P −1 = −e−iηP b(r) (−⃗p) (C.261)
è una simmetria conservatata per il campo di Dirac libero.

Vediamo ora che succede, di nuovo, nel caso dell’interazione elettromagnetica.


Evidentemente P sarà ancora una simmetria conservata se e solo se
P : J µ (x) → Jµ (P x) (C.262)
Dalle leggi di trasformazione di ψ e ψ̄, essendo337
J µ (x) = e ψ̄(x) γ µ ψ(x) (C.263)
abbiamo effettivamente che
P J µ (x) P −1 = e P ψ̄ P −1 γ µ P ψ P −1 =
= e eiηP ψ̄(P x)γ 0 γ µ e−iηP γ 0 ψ(P x) =
= e ψ̄(P x) γµ ψ(P x) ≡ Jµ (P x) (C.264)
dunque risulta cosı̀ provato che P è una simmetria conservata anche nel caso
dell’interazione elettromagnetica, quando la densità di corrente elettrica sia quella
associata ad una particella di Dirac.
337
Siccome P manda ψ e ψ̄ in sé, ovvero non le scambia come fa invece C, non è strettamente
necessario usare per J µ la forma N − ordinata. Va da sé comunque che, se la usiamo, continua
a valere la (C.262), come il lettore può verificare direttamente.

356
C.4 L’inversione temporale
Come abbiamo avuto modo di concludere già nell’ambito dello schema di prima
quantizzazione della Meccanica Quantistica, l’operatore T di inversione temporale
è antiunitario. In quel contesto, ma in tutta generalità, abbiamo altresı̀ osservato
che questo operatore è una simmetria conservata del sistema se, dato uno stato
| A > al tempo t e lasciato evolvere per un intervallo di tempo ∆t in modo da
ottenere lo stato | B >, allora, preso il suo rif lesso338 nel tempo | B >T e lasciato
evolvere con la stessa dinamica per lo stesso intervallo di tempo ∆t, otteniamo
di nuovo il rif lesso nel tempo | A >T dello stato | A > di partenza.
Classicamente abbiamo già discusso come questa simmetria abbia a che fare
con la reversibilità di un processo fisico, associata alla trasformazione

t → t′ = −t (C.266)

per quanto concerne il suo effetto sulle variabili cinematiche che definiscono lo
stato.
Sotto l’operatore T , dunque, se vogliamo garantire la validità dell’analogia
classica, deve accadere, per esempio, che

TX ⃗ T −1 = X
⃗ (C.267)
T P⃗ T −1 = −P⃗ (C.268)
T J⃗ T −1 = −J⃗ (C.269)

ed inoltre, assunto che la densità di carica sia scalare sotto inversione temporale,
338
Per esempio, per uno stato che sia autostato simultaneo dell’impulso, di J 2 e di Jz ,
il rif lesso nel tempo si ottiene dallo stato di partenza, invertendo il segno dell’autovalore
dell’impulso e della componente z del momento angolare, i.e.

T : | p⃗, J, m > → ∝ | − p⃗, J, −m > (C.265)

357
dovrà essere altresı̀ che339
⃗ x, t) T −1 = E(⃗
T E(⃗ ⃗ x, t) T −1 = −B(⃗
⃗ x, −t); T B(⃗ ⃗ x, −t) (C.275)
−1
⇒ T A (⃗x, t) T = Aµ (⃗x, −t)
µ
(C.276)

Siccome, però, evidentemente, sempre sulla base dell’analogia classica, deve essere

T J µ (⃗x, t) T −1 = Jµ (⃗x, −t) (C.277)

ecco che, l’interazione elettromagnetica, descritta classicamente nella lagrangiana


dal termine Jµ Aµ , risulta essere T −invariante.
Naturalmente vogliamo che questa medesima conclusione rimanga valida an-
che nell’ambito della teoria quantistica dei campi, per cui T sarà costruita in
questo ambito usando l’analogia classica ed avendo in mente di mantenerla come
simmetria conservata.
Vediamo che cosa implica questa richiesta ed iniziamo dal campo scalare.
Ricordiamo a questo proposito che, quando abbiamo studiato T in prima quan-
tizzazione, abbiamo concluso che, nel caso di una particella scalare, i.e. nel caso
in cui l’impulso costituisce un insieme completo di osservabili che commutano,
allora risulta che

T | p⃗ >= eiηT | − p⃗ > (C.278)


339
Il campo elettrico ha origine nelle cariche, che sono assunte scalari sotto T , quindi non
cambia di segno, a differenza del campo magnetico che ha come sorgenti le correnti, le quali,
essendo legate al moto delle cariche, invece, cambiano di segno sotto T . Dunque, ricordando
che
   
0 − Ex − Ey − Ez 0 Ex Ey Ez
 Ex 0 − Bz By   By 
F µν =   ⇔ Fµν =  −Ex 0 − Bz  (C.270)
 Ey Bz 0 − Bx   −Ey Bz 0 − Bx 
Ez − By Bx 0 −Ez − By Bx 0

ecco che

T : F µν → −Fµν (C.271)

ma poiché chiaramente risulta



T : ∂µ → −∂ µ
(C.272)

visto che, per definizione

F µν ≡ ∂ µ Aν − ∂ ν Aµ (C.273)

ecco che deve valere appunto la relazione

T : Aµ → Aµ (C.274)

358
e questo può essere tradotto, per quanto riguarda l’azione di T sugli operatori di
creazione di particella ed antiparticella, nella relazione340

T a† (⃗p) T −1 = eiηT a† (−⃗p) (C.279)


T b† (⃗p) T −1 = e−iηT b† (−⃗p) (C.280)

e quindi341 per gli operatori di distruzione avremo altresı̀

T a(⃗p) T −1 = e−iηT a(−⃗p) (C.287)


T b(⃗p) T −1 = eiηT b(−⃗p) (C.288)

Si osservi che le leggi di trasformazione (C.279)-(C.280) e (C.287)-(C.288) sono


formalmente le stesse che nel caso della parità P , quindi342 l’operatore T è com-
patibile con l’algebra del campo scalare, cosı̀ come sappiamo che lo è l’operatore
di parità P .
Vuol dire questo che T e P coincidono nel caso del campo scalare ? No !
La ragione è che la trasformazione P è unitaria mentre T è antiunitaria.
Vediamo dunque che cosa consegue da questo fatto, per esempio, per quanto
340
Il fatto che per particella ed antiparticella la fase sia opposta discende, di nuovo, dal fatto
che, solo in questo modo si può dedurre una legge di trasformazione semplice per il campo
scalare ϕ (dato che nella sua decomposizione spettrale compaiono a e b† ) e per il suo aggiunto
ϕ† .
341
Se prendiamo, infatti, l’aggiunto di entrambi i membri delle (C.279) e (C.280), otteniamo

(T −1 )† a(⃗
p) T † = e−iηT a(−⃗
p) (C.281)
−1 † † iηT
(T ) b(⃗
p) T = e b(−⃗
p) (C.282)

e se T fosse unitario, non avremmo esitazioni ... ma è antiunitario: quanto vale, allora (T −1 )† ?
Ricordiamo che, per un operatore antiunitario A, dati comunque i vettori | ϕ > e | ψ > risulta

< A ϕ| ψ >≡< ϕ| A† ψ >∗ (C.283)

quindi, nel caso di T −1 , si ha

< T −1 ϕ| ψ >=< ϕ| (T −1 )† ψ >∗ (C.284)

ma

< T −1 ϕ| ψ >=< T −1 ϕ| T −1 T ψ >=< ϕ| T ψ >∗ (C.285)

e dunque, per l’arbitrarietà di | ϕ > e | ψ >, confrontando la (C.284) con la (C.285). si conclude
che è ancora

(T −1 )† = T (C.286)

342
In realtà questa conclusione è meno ovvia di quanto possa sembrare ... come vedremo tra
breve.

359
riguarda la legge di trasformazione del campo stesso.
Ripartendo dal ben noto sviluppo

d3 p { −ip0 x0 +i⃗
p·⃗ † ip0 x0 −i⃗
p·⃗
}
ϕ(x0 , ⃗x) = a(⃗
p) e x
+ b (⃗
p) e x
(C.289)
2Ep (2π)3
ed usando la (C.287) e la (C.280), nonché tenendo conto del carattere antiunitario
di T , abbiamo

0 −1 −iηT d3 p { ip0 x0 −i⃗
p·⃗
x † −ip0 x0 +i⃗
p·⃗
x
}
T ϕ(x , ⃗x) T =e a(−⃗
p) e + b (−⃗
p) e (C.290)
2Ep (2π)3
Cambiando variabile di integrazione, i.e. ponendo ⃗q = −⃗p , si ha allora che
(p0 = q 0 !)
∫ { }
0 −1 −iηT d3 q −iq 0 (−x0 )+i⃗
q ·⃗
x † q ·⃗
iq 0 (−x0 )−i⃗ x
T ϕ(x , ⃗x) T = e a(⃗
q ) e + b (⃗
q ) e =
2Eq (2π)3
= e−iηT ϕ(−x0 , ⃗x) ≡ e−iηT ϕ(T x) (C.291)
dove si è posto343 , per comodità di notazione ed in analogia con quanto già fatto
per la parità,
T x ≡ T (x0 , ⃗x) = (−x0 , ⃗x) (C.292)
Analogamente poi per ϕ† risulta
T ϕ† (x0 , ⃗x) T −1 = eiηT ϕ† (−x0 , ⃗x) ≡ eiηT ϕ† (T x) (C.293)
e questi risultati, evidentemente, sono in perfetto accordo con quanto potevamo
attenderci sulla base dell’analogia classica !
A questo punto, è opportuno tornare sulla questione della compatibilità della
trasformazione con le regole di commutazione, che abbiamo prima accertato sulla
base dell’identità formale con quelle per la parità.
Bisogna ricordare che T , a differenza di P , è antiunitario: la conclusione tratta
sulla base dell’analogia con P risulta corretta solo perché i commutatori344 fra gli
operatori di creazione e distruzione sono comunque reali !

Veniamo adesso al problema di vedere se T è una simmetria conservata nel caso


del campo scalare libero.
343
E’ evidente che la matrice T che descrive l’azione della trasformazione sul quadrivettore x
è semplicemente l’opposto del tensore metrico g.
344
Abbiamo visto che, per il campo scalare, le regole di commutazione canoniche si traducono
nella relazione
[ ]
ϕ(x), ϕ† y = i ∆(x − y; m) (C.294)
dove

1 [ ]
i ∆(x) ≡ d4 q δ(q 2 − m2 ) eiqx Θ(q 0 ) − Θ(−q 0 ) (C.295)
(2π 3 )

360
La trasformazione è tale per cui

T : x → x′ = T x ⇔ x = T x′ (C.304)
ϕ(x) → ϕT (x′ ) = e−iηT ϕ(x) ⇔ ϕ(x) = eiηT ϕT (x′ ) (C.305)
ϕ† (x) → ϕ†T (x′ ) = eiηT ϕ† (x) ⇔ ϕ† (x) = e−iηT ϕ†T (x′ ) (C.306)
Sotto T , per quanto visto sopra, abbiamo
[ ] [ ]
T ϕ(x), ϕ† (y) T −1 = ϕ(T x), ϕ† (T y) (C.296)

quindi, la compatibilità di T con le regole di commutazione del campo si traduce nel fatto che
deve risultare

T i∆(x; m) T −1 = i ∆(T x; m) (C.297)

ovvero che la quantità (si ricordi che T è antiunitario)



1 [ ]
3
d4 q δ(q 2 − m2 ) e−iqx Θ(q 0 ) − Θ(−q 0 ) (C.298)
(2π )

deve essere uguale alla quantità



1 [ ]
d4 q δ(q 2 − m2 ) eiq(T x) Θ(q 0 ) − Θ(−q 0 ) (C.299)
(2π 3 )

Quanto alla prima quantità (C.298), si ha



1 [ ]
3
d4 q δ(q 2 − m2 ) e−iqx Θ(q 0 ) − Θ(−q 0 ) = i ∆(−x; m) (C.300)
(2π )

e poiché la funzione ∆ è dispari, abbiamo



1 [ ]
3
d4 q δ(q 2 − m2 ) e−iqx Θ(q 0 ) − Θ(−q 0 ) = i ∆(−x; m) =
(2π )

1 [ ]
= −i ∆(x; m) = − 3
d4 q δ(q 2 − m2 ) eiqx Θ(q 0 ) − Θ(−q 0 ) (C.301)
(2π )

Veniamo ora alla seconda quantità (C.299). Poiché risulta evidentemente che

q(T x) = (T q)x (C.302)

ecco che, ponendo p = T q ⇒ p0 = −q 0 , abbiamo



1 [ ]
3
d4 q δ(q 2 − m2 ) eiq(T x) Θ(q 0 ) − Θ(−q 0 ) =
(2π )

1 [ ]
3
d4 q δ(q 2 − m2 ) ei(T q)x Θ(q 0 ) − Θ(−q 0 ) =
(2π )

1 [ ]
d4 p δ(p2 − m2 ) eipx Θ(−p0 ) − Θ(p0 ) = −i ∆(x; m) (C.303)
(2π 3 )

per cui resta dimostrato che la (C.298) e la (C.299) coincidono e dunque è cosı̀ dimostrato in
modo diretto che la trasformazione di inversione temporale T è compatibile con l’algebra del
campo. Si osservi ancora una volta che, per giungere a questa conclusione, è stato necessario
usare il fatto che T è antiunitario.

361
Quanto alla densità lagrangiana, l’invarianza in valore ci garantisce che, essendo
quella del campo scalare libero data da
( )
L(x) = (∂µ ϕ(x)) ∂ µ ϕ† (x) − m2 ϕ(x) ϕ† (x) (C.307)

risulta (i fattori di fase, evidentemente, si compensano ...)


( )
LT (x′ ) = (∂µ ϕT (x′ )) ∂ µ ϕ†T (x′ ) − m2 ϕT (x′ ) ϕ†T (x′ ) (C.308)

D’altronde, evidentemente è

T : ∂µ → −∂ µ (C.309)

per cui abbiamo infine che


( ′
)( ′
)
LT (x′ ) = ∂ µ ϕT (x′ ) ∂µ ϕ†T (x′ ) − m2 ϕT (x′ ) ϕ†T (x′ ) (C.310)

ovvero la densità lagrangiana è invariante in forma sotto T e dunque ϕ e ϕT


hanno la stessa dinamica, per cui T , che abbiamo già visto essere compatibile
con l’algebra del campo, risulta essere una simmetria esatta per il campo scalare
libero.
Che succede, ora, nel caso in cui la corrente associata al campo scalare inter-
agisca con il campo elettromagnetico ?
Abbiamo già detto che T resterà una simmetria conservata se e solo se

T J µ (x) T −1 = Jµ (T x) ≡ Jµ (x′ ) (C.311)

Ma la densità di corrente associata al campo scalare carico è dato da


[ ( ) ]
J µ (x) = i e ϕ† (x) (∂ µ ϕ(x)) − ∂ µ ϕ† (x) ϕ(x) (C.312)

e in base a quanto detto sopra, abbiamo (di nuovo, i fattori di fase si compensano)
[ ( ) ]
T J µ (x) T −1 = −i e T ϕ† (x) (∂ µ ϕ(x)) − ∂ µ ϕ† (x) ϕ(x) T −1 =
[ ( ) ( ) ]
= −i e T ϕ† (x)T −1 ∂ µ T ϕ(x) T −1 − ∂ µ T ϕ† (x)T −1 T ϕ(x) T −1 =
[ ( ) ]
= −i e ϕ† (T x) (∂ µ ϕ(T x)) − ∂ µ ϕ† (T x) ϕ(T x) =
[ ( ′
) ( ′
) ]
= i e ϕ† (x′ ) ∂µ ϕ(x′ ) − ∂µ ϕ† (x′ ) ϕ(x′ ) =
= Jµ (x′ ) (C.313)

dove, nell’ultimo passaggio, abbiamo fatto uso della (C.309).


Il risultato (C.313) cosı̀ ottenuto prova quindi che T rimane una simmetria con-
servata anche nel caso di interazione fra il campo elettromagnetico e una corrente
prodotta da un campo scalare carico.
Mostriamo adesso, prima di concludere l’argomento, una differenza interessante

362
relativa al comportamento sotto inversione temporale della funzione d’onda di
una particella scalare e del campo scalare stesso.
Per la funzione d’onda, vedemmo a suo tempo che risulta

T : ψ(⃗x, t) → ψT (⃗x, t) = ψ ∗ (⃗x, −t) (C.314)

mentre per il campo scalare abbiamo visto adesso che risulta, a parte un fattore
di fase inessenziale, che

T ϕ(⃗x, t) T −1 = ϕT (⃗x, t) = ϕ(⃗x, −t) (C.315)

mentre avremmo potuto aspettarci, per analogia, che al secondo membro della
(C.315) ci comparisse piuttosto ϕ† ...
Non c’è, naturalmente, nessuna contraddizione.
Per rendersene conto, consideriamo uno stato di singola particella di impulso
definito p⃗. Esso sarà individuato dal vettore

| p⃗ >= a† (⃗p) | Ω >≡ | a(⃗p) > (C.316)

Ma qual è la sua funzione d’onda ?


Essa, come sappiamo, è data semplicemente da

ψ(⃗x, t) =< Ω| ϕ(⃗x, t) | a(⃗p) > (C.317)

Consideriamo allora la funzione d’onda dello stato T | a(⃗p) >: evidentemente


avremo

ψT (⃗x, t) =< Ω| ϕ(⃗x, t) T | a(⃗p) >=< Ω| T T −1 ϕ(⃗x, t) T a(⃗p) > (C.318)

D’altronde, essendo il vuoto T −invariante, abbiamo evidentemente che

ψT (⃗x, t) =< T Ω| T T −1 ϕ(⃗x, t) T a(⃗p) > (C.319)

ma T è antiunitario, quindi

ψT (⃗x, t) =< T Ω| T T −1 ϕ(⃗x, t) T a(⃗p) >=< Ω| T −1 ϕ(⃗x, t) T a(⃗p) >∗ (C.320)

D’altronde si è visto che, a parte una fase inessenziale, risulta

T ϕ(⃗x, t) T −1 = ϕ(⃗x, −t) (C.321)

e dunque

T −1 ϕ(⃗x, −t) T = ϕ(⃗x, t) (C.322)

ovvero345

T −1 ϕ(⃗x, t) T = ϕ(⃗x, −t) (C.323)


345
Si ricordi, infatti, che, nel caso scalare T 2 = 1 e dunque T = T −1 .

363
per cui, sostituendo, ecco che risulta
ψT (⃗x, t) =< Ω| ϕ(⃗x, −t) a(⃗p) >∗ =< Ω| ϕ(⃗x, −t) | p⃗ >∗ = ψ ∗ (⃗x, −t) (C.324)
in accordo con il risultato ben noto ottenuto nello schema della prima quantiz-
zazione.

Veniamo ora al campo elettromagnetico.


Abbiamo già detto che, in base all’analogia classica, ci aspettiamo che debba
essere
T : Aµ (x) → Aµ (T x) (C.325)
Cerchiamo adesso di vedere come questo risultato può essere dimostrato, de-
finendo l’azione di T , al solito, sugli operatori di creazione e distruzione del
fotone. Per arrivare a questo, chiediamoci: come potrà agire T , in base al signi-
ficato che gli diamo, su uno stato di fotone di impulso p⃗ ed elicità λ ?
Se vogliamo mantenere l’analogia classica, poiché sia l’impulso che il momento
angolare si invertono di segno per inversione temporale, dobbiamo concludere
che sotto T , l’autovalore dell’impulso spaziale p⃗ dovrà cambiare di segno, mentre
quello dell’elicità λ non dovrà farlo, i.e. dovrà essere
T |⃗p, λ >= eiηT | − p⃗, λ > (C.326)
Osserviamo intanto che, per il carattere antiunitario di T , qualunque sia la fase
ηT , valendo la (C.326), ne segue che T 2 = I, come ci aspettiamo che accada visto
che il fotone ha spin intero.
Ma torniamo al nostro problema di definire l’azione di T sul campo elettromag-
netico Aµ e proviamo a porre semplicemente
T a† (⃗p, λ) T −1 = eiηT a† (−⃗p, λ) (C.327)
e dunque, per quanto detto precedentemente, anche
T a(⃗p, λ) T −1 = e−iηT a(−⃗p, λ) (C.328)
Risulta allora che, essendo lo sviluppo del campo Aµ dato da
∑∫ d3 p { }
−ipx † ∗µ
Aµ (x) = a(⃗
p , λ) ϵ µ
(⃗
p , λ) e + a (⃗
p , λ) ϵ (⃗
p , λ) eipx
(C.329)
λ 2Ep (2π)3
per quanto assunto e per il carattere antiunitario di T , avremo
∑∫ d3 p {
T Aµ (x) T −1 = 3
T a(⃗p, λ) T −1 ϵ∗µ (⃗p, λ) eipx +
λ 2Ep (2π)
}
+T a† (⃗p, λ) T −1 ϵµ (⃗p, λ) e−ipx =
∑∫ d3 p { −iηT
= 3
e a(−⃗p, λ) ϵ∗µ (⃗p, λ) eipx +
λ 2Ep (2π)
}
+eiηT a† (−⃗p, λ) ϵµ (⃗p, λ) e−ipx

364
Già da questo risultato si vede che, per mantenere il carattere autoaggiunto del
campo, in realtà la fase ηT non può che essere nulla346 .
Abbiamo quindi, effettuando la sostituzione di variabile ⃗q → −⃗p , che risulta
∑∫ d3 p {
T Aµ (x) T −1 = a(−⃗p, λ) ϵ∗µ (⃗p, λ) eipx +
λ 2Ep (2π)3
}
+ a† (−⃗p, λ) ϵµ (⃗p, λ) e−ipx =
∑∫ d3 q {
∗µ −iq 0 (−x0 )+i⃗
q ·⃗
x
= a(⃗
q , λ) ϵ (−⃗
q , λ) e +
λ 2Eq (2π)3
}
+ a† (⃗q, λ) ϵµ (−⃗q, λ) eiq q ·⃗
0 (−x0 )−i⃗ x

Ricordiamo adesso che, per le (C.226) e (C.227), risulta


⃗ϵ(−⃗k, ±) = ⃗ϵ(⃗k, ∓) (C.330)
e per la (C.224) e (C.225), che
⃗ϵ ∗ (⃗k, ±) = −⃗ϵ(⃗k, ∓) (C.331)
per cui
⃗ϵ ∗ (−⃗k, ±) = ⃗ϵ ∗ (⃗k, ∓) = −⃗ϵ(⃗k, ±) (C.332)
Poiché ϵ0 ≡ 0 , possiamo allora scrivere che
∑∫ d3 q {
⃗ 0 , ⃗x) T −1 = −
T A(x a(⃗q, λ)⃗ϵ(⃗q, λ) e−iq (−x )+i⃗q·⃗x +
0 0

2Eq (2π) 3
λ
}
+ a† (⃗q, λ)⃗ϵ ∗ (⃗q, λ) eiq (−x )−i⃗q·⃗x = −A(−x
0 0
⃗ 0
, ⃗x) (C.333)
e siccome siamo nella gauge di radiazione, questo implica proprio che
T Aµ (x) T −1 = Aµ (T x) (C.334)
E’ evidente adesso che questa legge di trasformazione la quale, ripetiamolo,
sugli operatori di creazione e distruzione del fotone assume la forma seguente
T a† (⃗p, λ) T −1 = a† (−⃗p, λ) (C.335)
T a(⃗p, λ) T −1 = a(−⃗p, λ) (C.336)
è compatibile con le regole di commutazione del campo elettromagnetico.
Questo segue infatti dal fatto che l’unico commutatore non nullo è quello fra gli
operatori di distruzione e di creazione e vale
[ ]
a(⃗p, λ), a† (⃗q, µ) = 2Ep (2π)3 δλµ δ(⃗p − ⃗q) (C.337)
346
In realtà dal solo carattere autoaggiunto del campo possiamo concludere solo che eiηT = ±1.
Il segno negativo viene escluso proprio dalla richiesta che il campo si trasformi sotto T come
quello classico, i.e. che valga la (C.325).

365
il quale è reale (dunque il carattere antiunitario di T non comporta conseguenze)
ed è pari in p⃗ − ⃗q .
E’ altresı̀ semplice capire che le equazioni del moto del campo T −trasformato
coincidono con quelle del campo di partenza Aµ , infatti esse sono

2Aµ ≡ ∂ν ∂ ν Aµ = 0; ∂ µ Aµ = 0 (C.338)

ma sotto T abbiamo visto che accade semplicemente che



∂ µ → −∂µ ; Aµ (x) → Aµ (T x) ≡ Aµ (x′ ) (C.339)

per cui, evidentemente, entrambe le equazioni (C.338) restano della stessa forma347 ,
ovvero l’operatore T che abbiamo definito sopra risulta essere una simmetria con-
servata per il campo elettromagnetico libero.

Veniamo infine all’ultimo campo interessante da considerare per quanto riguarda


la simmetria di inversione temporale T , cioè al campo di Dirac.
A questo proposito, vale ancora una volta l’osservazione già fatta precedente-
mente per le simmetrie P e C, cioè che se vogliamo che T possa essere una sim-
metria conservata anche nel caso dell’interazione elettromagnetica, visto il modo
di trasformarsi sotto T del campo Aµ , poiché la corrente elettrica associata al
campo di Dirac carico è data da

J µ (x) = e ψ̄(x) γ µ ψ(x) (C.340)

occorre che i campi ψ e ψ̄ si trasformino sotto T in modo tale per cui accada che

T J µ (x) T −1 = Jµ (T x) (C.341)

Questa è una esigenza imprescindibile, se vogliamo che l’elettrodinamica quan-


tistica, cosı̀ come nel caso classico, risulti T invariante.
Al solito, per arrivare a vedere come T agisce sui campi ψ e ψ̄ , partiamo dagli
operatori di creazione e distruzione di particella e antiparticella.
La prima osservazione che dobbiamo fare è che, sempre affinchè l’analogia
classica sia rispettata, sotto T ci attendiamo che l’impulso p⃗ e la componente z
dello spin s si invertano di segno, sia che si tratti di particella o che si tratti di
antiparticella, i.e.

T | a(⃗p, s) > ∝ | a(−⃗p, −s) > (C.342)


T | b(⃗p, s) > ∝ | b(−⃗p, −s) > (C.343)

Più precisamente, per le considerazioni già fatte sull’operatore T quando lo ab-


biamo studiato nello schema di prima quantizzazione, sappiamo che, per quanto
347
Si poteva, naturalmente, procedere di nuovo dalla densità lagrangiana ...

366
riguarda la variabile di spin, oltre al suo rovesciamento è coinvolta una rotazione
di π intorno all’asse Jy , i.e.

T | p⃗, s >= R−ss eiηT | − p⃗, −s > (C.344)

dove il fattore di fase eiηT è a priori qualsiasi e

R ≡ eiπ Jy (C.345)

Dunque, se usiamo la base consueta degli autovettori di σz , risulta (h̄ = 1)


( ) ( )
1 1 0 −i π 0 1 π
Jy = σz = ⇒ iπ Jy = ≡ U (C.346)
2 2 i 0 2 −1 0 2
e quindi
( ) ( ) ( )4
iπ Jy π
Uπ 1 π 2 2 1 π 3 3 1 π
R = e =e =I+ U+2 U + U + U 4 + ... =
2 2! 2 3! 2 4! 2
( ) ( ) ( )
π 1 π 2 1 π 3 1 π 4
= I+ U− I− U+ I + ... =
2 2! 2 3! 2 4! 2
π π
= I cos( ) + U sin = U (C.347)
2 2
Dunque abbiamo348

T | p⃗ , + > = eiηT | − p⃗ , − > (C.348)


T | p⃗ , − > = −eiηT | − p⃗ , + > (C.349)

Proviamo adesso, in analogia con quanto già fatto per gli operatori C e P ,
a tradurre tutto questo nel linguaggio degli operatori di creazione e distruzione.
Tentativamente poniamo dunque

T a† (⃗p, s) T −1 = eiηT R−ss a† (−⃗p, −s) ≡ eiηT fs a† (−⃗p, −s) (C.350)


T b† (⃗p, s) T −1 = e−iηT R−ss b† (−⃗p, −s) ≡ e−iηT fs b† (−⃗p, −s) (C.351)

dove, in base a quanto visto precedentemente349 , è

f+ ≡ R−+ = +1; f− ≡ R+− = −1 (C.352)

e si è posto, per comodità di notazioni,

a† (⃗p, +1) ≡ a†(1) (⃗p); a† (⃗p, −1) ≡ a†(2) (⃗p) (C.353)


b† (⃗p, +1) ≡ b†(1) (⃗p); b† (⃗p, −1) ≡ b†(2) (⃗p) (C.354)
348
Si noti che R2 = U 2 = −I , in accordo con il fatto che per particelle di spin 1/2, come
abbiamo già visto, T 2 = −I ...
349
Usiamo qui il simbolo s per indicare l’autovalore della componente z dello spin della par-
ticella/antiparticella modulo h̄/2, per cui s = ±1.

367
Prendendo adesso l’aggiunto delle (C.350)-(C.351), poiché R è reale, abbiamo
che, per gli operatori di annichilazione, dovrà essere quindi

T a(⃗p, s) T −1 = e−iηT R−ss a(−⃗p, −s) ≡ e−iηT fs a(−⃗p, −s) (C.355)


T b(⃗p, s) T −1 = eiηT R−ss b(−⃗p, −s) ≡ eiηT fs b(−⃗p, −s) (C.356)

A questo punto, domandiamoci: queste leggi di trasformazione sono o no com-


patibili con l’algebra dei campi ?
Ricordiamo a questo proposito che gli unici anticommutatori non nulli sono
{ } { }
a(⃗p, s), a† (⃗q, s′ ) = b(⃗p, s), b† (⃗q, s′ ) = 2Ep (2π)3 δ 3 (⃗p − ⃗q) δss′ (C.357)

Visto che T agisce allo stesso modo sugli operatori di particella e antiparticella,
limitiamoci a vedere se T rispetta l’algebra costruita con gli operatori di creazione
e annichilazione della particella.
Evidentemente l’algebra sarà rispettata se e solo se
{ }
T a(⃗p, s), a† (⃗q, s′ ) T −1 = T 2Ep (2π)3 δ 3 (⃗p − ⃗q) δss′ T −1 (C.358)

ovvero, essendo il secondo membro della (C.358) reale, se accade che


{ }
T a(⃗p, s), a† (⃗q, s′ ) T −1 = 2Ep (2π)3 δ 3 (⃗p − ⃗q) δss′ (C.359)

D’altronde
{ } { }
T a(⃗p, s), a† (⃗q, s′ ) T −1 = T a(⃗p, s) T −1 , T a† (⃗q, s′ ) T −1 =
{ }
= e−iηT R−ss a(−⃗p, −s), eiηT R−s′ s′ a† (−⃗q, −s′ ) =
= R−ss R−s′ s′ 2Ep (2π)3 δ 3 (⃗p − ⃗q) δss′ (C.360)

dove si è usato il fatto che

δ−s−s′ = δss′ e che δ 3 (−⃗v ) = δ 3 (⃗v )

Rispetto al secondo membro della (C.359), abbiamo formalmente in più il fattore


R−ss R−s′ s′ che, però, vista la presenza della δss′ , vale comunque sempre e soltanto
+1, nei casi in cui l’anticommutatore è non nullo.
Resta cosı̀ dimostrato che c’è, effettivamente, compatibilità fra la definizione data
di T e l’algebra delle osservabili del campo di Dirac.
Veniamo ora all’azione esplicita della trasformazione di inversione temporale
T sui campi ψ e ψ̄. Siccome T si limita ad agire sugli autovalori degli au-
tostati di impulso e spin (componente z), ma non tocca le condizioni di par-
ticella/antiparticella, allora cosı̀ come nel caso della parità, ci attendiamo che
mandi ψ in sé, i.e. che risulti

T : ψ(x) → e−iηT M γ 0 ψ(T x) (C.361)

368
e dunque che350 sia

T : ψ̄(x) → eiηT ψ̄(T x) M + γ 0 (C.364)

dove M è una matrice 4 × 4 la quale, se vogliamo che valga la relazione per noi
imprescindibile che

T J µ (x) T −1 = Jµ (T x) (C.365)

deve essere tale per cui

M + γ 0 γ ∗µ M γ 0 = γµ (C.366)

Infatti (ricordiamoci che T è antilineare ...)

T ψ̄(x) γ µ ψ(x) T −1 = T ψ̄(x) T −1 T γ µ T −1 T ψ(x) T −1 =


= eiηT ψ̄(T x) M + γ 0 γ ∗µ M γ 0 ψ(T x) e−iηT (C.367)

ed affinché valga la (C.365) è necessario, appunto, che sia

M + γ 0 γ ∗µ M γ 0 = γµ (C.368)

Vediamo allora se una tale matrice esiste.


Iniziamo facendo µ = 0: poiché γ 0 = γ ∗0 = γ0 e (γ 0 )2 = (γ0 )2 = I, ne segue che,
affinché possa valere la (C.368), è necessario che

M+ M = I (C.369)

ovvero che M sia unitaria. Usando allora questo fatto nella (C.368) unitamente
al fatto che (γ 0 )2 = I, abbiamo

γ 0 γ ∗µ M = M γµ γ 0 (C.370)

Il caso µ = 0, ovviamente, è automaticamente soddisfatto, essendo quello che ci


ha condotto alla condizione di unitarietà di M , usata appunto per passare dalla
(C.368) alla (C.370). Nel caso in cui µ = 1, essendo γ 1 reale ed essendo γ 1 = −γ1 ,
abbiamo

µ=1: γ 0 γ 1 M = −M γ 1 γ 0 (C.371)
350
Infatti se vale la (C.361) allora, essendo γ 0 = γ 0+ , segue che

T : ψ + (x) → ψ + (T x) γ 0 M + = ψ̄(T x) M + (C.362)

e dunque

T : ψ̄(x) ≡ ψ + (x) γ 0 → ψ̄(T x) M + γ 0 (C.363)

369
mentre nel caso in cui µ = 2, siccome γ 2 è immaginaria pura, risulta
µ=2: −γ 0 γ 2 M = −M γ 2 γ 0 (C.372)
Infine, nel caso in cui µ = 3, poiché siamo di nuovo nella stessa situazione che
nel caso in cui µ = 1, abbiamo
µ=3: γ 0 γ 3 M = −M γ 3 γ 0 (C.373)
Siccome γ 0 anticommuta con tutte le γ i , le relazioni di sopra divengono le seguenti
γ0 γ1 M = M γ0 γ1 (C.374)
γ 0 γ 2 M = −M γ 0 γ 2 (C.375)
γ0 γ3 M = M γ0 γ3 (C.376)
cioè M commuta con γ 0 γ 1 e γ 0 γ 3 mentre anticommuta con γ 0 γ 2 .
La soluzione è la matrice seguente
M = γ1 γ3 γ0 (C.377)
infatti (ricordiamo che γ i γ i = −I, qualunque sia i)
µ=1 :
I : γ 0 γ 1 γ 1 γ 3 γ 0 = −γ 0 γ 3 γ 0 = γ 3
II : γ 1 γ 3 γ 0 γ 0 γ 1 = γ 1 γ 3 γ 1 = −(γ 1 )2 γ 3 = γ 3 (C.378)
µ=2 :
I : γ 0 γ 2 γ 1 γ 3 γ 0 = − γ 2 γ 1 γ 3 (γ 0 )2 = γ 1 γ 2 γ 3
II : − γ 1 γ 3 γ 0 γ 0 γ 2 = −γ 1 γ 3 γ 2 = γ 1 γ 2 γ 3 (C.379)
µ=3 :
I : γ 0 γ 3 γ 1 γ 3 γ 0 = −γ 0 γ 1 (γ 3 )2 γ 0 = γ 0 γ 1 γ 0 = −γ 1
II : γ 1 γ 3 γ 0 γ 0 γ 3 = γ 1 (γ 3 )2 = −γ 1 (C.380)
Verifichiamo adesso che M è effettivamente unitaria. Osserviamo a questo propos-
ito che
( )+
M + = γ1 γ3 γ0 = (γ 0 )+ (γ 3 )+ (γ 1 )+ = γ 0 γ 3 γ 1 (C.381)

dove si è usato il fatto che γ 0 è hermitiana mentre le γ i sono antiermitiane.


Risulta quindi
M M + = γ 1 γ 3 γ 0 γ 0 γ 3 γ 1 = γ 1 (γ 3 )2 γ 1 = −(γ 1 )2 = I (C.382)
Infine, poiché nelle (C.361) e (C.364) compaiono, rispettivamente, le combinazioni
M γ 0 e M + γ 0 , calcoliamo direttamente queste matrici: si ha
M γ0 = γ1 γ3 γ0 γ0 = γ1 γ3 (C.383)
M + γ0 = γ0 γ3 γ1 γ0 = γ3 γ1 (C.384)

370
Tornando quindi all’azione di T sui campi ψ e ψ̄, abbiamo dunque trovato che
se essa è tale per cui

T : ψ(x) → e−iηT γ 1 γ 3 ψ(T x) (C.385)


ψ̄(x) → eiηT ψ̄(T x) γ 3 γ 1 (C.386)

allora vale la condizione (C.341) e dunque è possibile che T risulti una simmetria
conservata anche nel caso dell’interazione elettromagnetica in cui la corrente è
quella associata ad un campo di Dirac carico.
D’altronde, noi l’azione di T però l’abbiamo tentativamente già definita sugli
operatori di creazione e distruzione attraverso le (C.350)-(C.351) e (C.355)-(C.356).
Queste definizioni portano o no alle (C.385)-(C.386) ? Vediamo.
Iniziando dal campo ψ, abbiamo
2 ∫
∑ d3 p { (r) (r) −ipx †(r) (r) ipx
}
ψ(x) = a (⃗
p) u (⃗
p) e + b (⃗
p) v (⃗
p) e (C.387)
r=1 2Ep (2π)3

dunque, tenendo conto che T è un operatore antilineare, è

T ψ(x) T −1 =
2 ∫
∑ d3 p { (r) −1 ∗(r) ipx †(r) −1 ∗(r) −ipx
}
= T a (⃗
p) T u (⃗
p) e + T b (⃗
p) T v (⃗
p) e (C.388)
r=1 2Ep (2π)3

Ovvero, usando la (C.355) e la (C.351) e definendo, per quanto riguarda gli indici
di spin, r̄ nel modo seguente

1̄ = 2; 2̄ = 1 (C.389)

abbiamo
∑∫ d3 p { (r̄)
−1
T ψ(x) T = a (−⃗p) e−iηT fr u∗(r) (⃗p) eipx +
r 2Ep (2π)3
}
+b†(r̄) (−⃗p) e−iηT fr v ∗(r) (⃗p) e−ipx (C.390)

Cambiando ora variabili, i.e. ponendo

⃗q = −⃗p; s = r̄ ⇔ r = s̄ (C.391)

otteniamo
∑∫ d3 q {
T ψ(x) T −1 = e−iηT a(s) (⃗q) fs̄ u∗(s̄) (−⃗q) e−iq (−x )+i⃗q·⃗x +
0 0

2Eq (2π)3
s
}
†(s)
(⃗q) fs̄ v ∗(s̄) (−⃗q) eiq q ·⃗
0 (−x0 )−i⃗ x
+ b (C.392)

371
Consideriamo dunque la quantità351

fs̄ u∗(s̄) (−⃗q) (C.398)

vogliamo dimostrare che risulta

fs̄ u∗(s̄) (−⃗q) = γ 1 γ 3 u(s) (⃗q) (C.399)

Infatti, dalla definizione, si ha


m + qµ γ µ (r)
u(r) (⃗q) = √ u0 (C.400)
m + Eq

D’altronde, per la (C.370) e la (C.377), risulta

γ 0 γ ∗µ γ 1 γ 3 γ 0 = γ 1 γ 3 γ 0 γµ γ 0 (C.401)

quindi, moltiplicando a sinistra la (C.400) per γ 1 γ 3 , si ha


m + qµ γ µ (r) γ 0 (m + qµ γ µ ) (r)
γ 1 γ 3 u(r) (⃗q) = γ 1 γ 3 √ u0 = γ 1 γ 3 γ 0 √ u0 (C.402)
m + Eq m + Eq

ma γ 0 γ µ γ 0 = γµ , dunque risulta
m + qµ γµ 0 (r)
γ 1 γ 3 u(r) (⃗q) = γ 1 γ 3 γ 0 √ γ u0 =
m + Eq
1 ( )
γ 1 γ 3 m + qµ γ 0 γ ∗µ γ 1 γ 3 γ 0 u0 =
(r)
= √
m + Eq
1 ( )
γ 1 γ 3 m + qµ γµ∗ γ 0 γ 1 γ 3 γ 0 u0 =
(r)
= √
m + Eq
1 ( )
m + qµ γµ∗ γ 1 γ 3 u0
(r)
= √ (C.403)
m + Eq
351
Come sappiamo, le polarizzazioni individuate da r = 1, 2 si riferiscono, rispettivamente,
agli autostati di sz per gli autovalori +1/2 e −1/2, per cui, da quanto precede, risulta che,
essendo

f2̄ = f1 = f+ = +1; f1̄ = f2 = f− = −1 (C.393)

si ha

s = 1 ⇔ s̄ = 2 : f1̄ u∗(1̄) (−⃗q) = −u∗(2) (−⃗q) (C.394)


∗(1̄) ∗(2)
f1̄ v (−⃗q) = −v (−⃗q) (C.395)
∗(2̄) ∗(1)
s = 2 ⇔ s̄ = 1 : f2̄ u (−⃗q) = +u (−⃗q) (C.396)
∗(2̄) ∗(1)
f2̄ v (−⃗q) = +v (−⃗q) (C.397)

372
dove si è usato il fatto che γ 0 γ 1 γ 3 γ 0 = γ 1 γ 3 .
Osserviamo adesso che la matrice γ 1 γ 3 è tale per cui
( )( ) ( )
1 3 0 σ1 0 σ3 −σ1 σ3 0
γ γ = = =
−σ1 0 −σ3 0 0 − σ1 σ3
 
0 1 0 0
 −1 0 0 0 
= 


 (C.404)
 0 0 0 1 
0 0 −1 0
Quindi
(1) (2)
γ 1 γ 3 u0 = −u0 (C.405)
1 3 (2) (1)
γ γ u0 = u0 (C.406)
e dunque
1 ( )
m + q0 γ ∗0 + ⃗q · ⃗γ ∗ (−) u0 =
(2)
γ 1 γ 3 u(1) (⃗q) = √
m + Eq
= −u∗(2) (−⃗q) = f1̄ u∗(1̄) (−⃗q) (C.407)
mentre
γ 1 γ 3 u(2) (⃗q) = u∗(1) (−⃗q) = f2̄ u∗(2̄) (−⃗q) (C.408)
che provano appunto la (C.399).
Per quanto, poi, riguarda gli spinori v, anche per essi risulta
fr̄ v ∗(r̄) (−⃗q) = γ 1 γ 3 v (r) (⃗q) (C.409)
Per dimostrarlo, partiamo di nuovo dalla definizione, i.e. dalla equazione
(r) m − qµ γ µ (r)
v (⃗q) = v (C.410)
m + Eq 0
Ripetendo la dimostrazione già fatta per gli spinori u, concludiamo che
1 ( )
m − qµ γµ∗ γ 1 γ 3 v0
(r)
γ 1 γ 3 v (r) (⃗q) = √ (C.411)
m + Eq
ed anche stavolta accade che352
(1) (2)
γ 1 γ 3 v0 = −v0 (C.413)
(2) (1)
γ 1 γ 3 v0 = v0 (C.414)
352
Si ricordi che
      
1 0 0 0
 0   1   0   0 
=    =   
(1) (2) (1) (2)
u0  0  ; u0 =  0  ; v0  0  ; v0 = −  1 
(C.412)
0 0 1 0

373
per cui risulta
1 ( )
m − q0 γ ∗0 − ⃗q · ⃗γ ∗ (−)v0 =
(2)
γ 1 γ 3 v (1) (⃗q) = √
m + Eq
= −v ∗(2) (−⃗q) = f1̄ v ∗(1̄) (−⃗q) (C.415)
γ 1 γ 3 v (2) (⃗q) = v ∗(1) (−⃗q) = f2̄ v ∗(2̄) (−⃗q) (C.416)

che provano la (C.409). Sostituendo allora la (C.399) e la (C.409) nella (C.390),


si ha finalmente che
∑∫ d3 q {
−1 −iηT
a(r) (⃗q) γ 1 γ 3 u(r) (⃗q) e−iq (−x )+i⃗q·⃗x +
0 0 0
T ψ(x , ⃗x) T = e 3
r 2Eq (2π)
}
†(r)
(⃗q) γ 1 γ 3 v (r) (⃗q) e−iq q ·⃗
0 (x0 )−i⃗ x
+ b =
= e−iηT γ 1 γ 3 ψ(−x0 , ⃗x) (C.417)

e dunque, per quanto già visto, che

T ψ̄(x0 , ⃗x) T −1 = eiηT ψ̄(−x0 , ⃗x) γ 3 γ 1 (C.418)

Resta cosı̀ dimostrato che l’operatore di inversione temporale T , definito sugli


operatori di creazione secondo le (C.350)-(C.351) e su quelli di distruzione at-
traverso le (C.355)-(C.356), è tale per cui la corrente J µ (x) si trasforma sotto T
in accordo con la (C.365).

Passiamo infine a dimostrare che T lascia invarianti le equazioni del moto del
campo di Dirac libero.
Questo, dato che abbiamo già dimostrato che T è compatibile con l’algebra del
campo, garantirà che T è una simmetria conservata per il campo libero.
La regola fin qui usata era quella di riscrivere la densità lagrangiana per i
campi trasformati e verificare che essa aveva la stessa forma di quella di partenza.
C’è però ora una novità, rappresentata dal carattere antiunitario di T : essa agisce
non solo sui campi, ma anche sui coefficienti complessi che possono comparire
nella densità lagrangiana !
Ricordiamo che la densità lagrangiana di partenza è
i[ µ ]
L(x) = ψ̄ γ (∂µ ψ) − (∂µ ψ̄)γ µ ψ − m ψ̄ψ (C.419)
2
La trasformazione T , per quanto visto e detto precedentemente, è dunque tale
che

T : x ≡ (x0 , ⃗x) → T x ≡ (−x0 , ⃗x) ⇔ ∂µ = −∂ µ (C.420)
ψ(x) → ψT (x) = γ 1 γ 3 ψ(T x) ⇔ ψ(x) = γ 3 γ 1 ψT (T x) (C.421)
ψ̄(x) → ψ̄T (x) = ψ̄(T x)γ 3 γ 1 ⇔ ψ̄(x) = ψ̄T (T x)γ 1 γ 3 (C.422)

374
i → −i (C.423)
γ µ → γ ∗µ (C.424)
m→m (C.425)

L’invarianza in valore della densità lagrangiana ci dice quindi che i campi ψT e


ψ̄T soddisfano le equazioni del moto che si ottengono dalla densità lagrangiana
L(x), sostituendovi alle quantità non T −trasformate quelle T −trasformate, i.e.
i{ ′ ′
}
LT (x′ ) = − ψ̄T (x′ )γ 1 γ 3 γ ∗µ [−∂ µ γ 3 γ 1 ψT (x′ )] − [−∂ µ ψ̄T (x′ )]γ 1 γ 3 γ ∗µ γ 3 γ 1 ψT (x′ ) −
2
− m ψ̄T (x′ )γ 1 γ 3 γ 3 γ 1 ψT (x′ ) (C.426)

Ricordiamo adesso che (γ 0 )2 = −(γ 1 )2 = −(γ 3 )2 = I e che γ 0 anticommuta con


γ 1 e γ 3 , per cui, dalla (C.370) e (C.377) abbiamo

γ 0 γ ∗µ γ 1 γ 3 γ 0 = γ 1 γ 3 γ 0 γµ γ 0 ⇒ γ 0 γ ∗µ γ 1 γ 3 = γ 1 γ 3 γ 0 γµ
⇒ γ ∗µ γ 1 γ 3 = γ 0 γ 1 γ 3 γ 0 γµ = γ 1 γ 3 γµ ⇒ γ ∗µ γ 3 γ 1 = γ 3 γ 1 γµ
⇒ γ 1 γ 3 γ ∗µ γ 3 γ 1 = γµ (C.427)

e quindi
i{ ( ′ ) ( ′ ) }
L(x′ ) = ψ̄T (x′ ) γµ ∂ µ ψT (x′ ) − ∂ µ ψ̄T (x′ ) γµ ψT (x′ ) −
2
− m ψ̄T (x′ ) ψT (x′ ) (C.428)

che prova l’invarianza in forma della densità lagrangiana di Dirac sotto T e quindi,
finalmente, che T è effettivamente una simmetria conservata per il campo di Dirac
libero. Siccome si è visto che, sotto T , la corrente si trasforma in modo che il
termine che descrive l’interazione con il campo elettromagnetico sia invariante,
i.e.

T : Jµ (x) Aµ (x) → J µ (x′ ) Aµ (x′ ) (C.429)

essa è anche una simmetria conservata nel caso di interazione elettromagnetica


con la corrente prodotta da un campo spinoriale.

375
C.5 Riassumendo ...
• La simmetria di coniugazione di carica C è unitaria e soddisfa la condizione

C2 = I (C.430)

Essa è tale per cui risulta

spin 0 :
C a(⃗p) C −1 = e−iηc b(⃗p) ←→ C a† (⃗p) C −1 = eiηc b† (⃗p) (C.431)
C b(⃗p) C −1 = eiηc a(⃗p) ←→ C b† (⃗p) C −1 = e−iηc a† (⃗p) (C.432)

C ϕ(x) C −1 = e−iηc ϕ† (x) ←→ C ϕ† (x) C −1 = eiηc ϕ(x) (C.433)

spin 1/2 :
C a(r) (⃗p) C −1 = e−iηc b(r) (⃗p) ←→ C a†(r) (⃗p) C −1 = eiηc b†(r) (⃗p) (C.434)
C b(r) (⃗p) C −1 = eiηc a(r) (⃗p) ←→ C b†(r) (⃗p) C −1 = e−iηc a†(r) (⃗p) (C.435)

C ψ(x) C −1 = e−iηc C −1 ψ̄ t (x) ←→ C ψ̄(x) C −1 = −eiηc ψ t (x) C (C.436)


C = iγ 0 γ 2 (C.437)

campo e.m. :
C a(⃗k, λ) C −1 = − a(⃗k, λ) ←→ C a† (⃗k, λ) C −1 = − a† (⃗k, λ) (C.438)

C Aµ (x) C −1 = − Aµ (x) (C.439)

376
• La simmetria di parità P è anch’essa unitaria e soddisfa la condizione

P2 = I (C.440)

Essa è tale per cui risulta

spin 0 :
P a(⃗p) P −1 = e−iηp a(−⃗p) ←→ P a† (⃗p) P −1 = eiηp a† (−⃗p) (C.441)
P b(⃗p) P −1 = eiηp b(−⃗p) ←→ P b† (⃗p) P −1 = e−iηp b† (−⃗p) (C.442)

P ϕ(x) P −1 = e−iηp ϕ(P x) ←→ P ϕ† (x) P −1 = eiηp ϕ† (P x) (C.443)


eiηp = ±1 (C.444)

spin 1/2 :
P a(r) (⃗p) P −1 = e−iηp a(r) (−⃗p) ←→ P a†(r) (⃗p) P −1 = eiηp a†(r) (−⃗p) (C.445)
P b(r) (⃗p) P −1 = −eiηp b(r) (−⃗p) ←→ P b†(r) (⃗p) P −1 = −e−iηp b†(r) (−⃗p)(C.446)

P ψ(x) P −1 = e−iηp γ 0 ψ(P x) ←→ P ψ̄(x) P −1 = eiηp ψ(P x) γ 0 (C.447)


eiηp = ±1 (C.448)

campo e.m. :
P a(⃗k, λ) P −1 = − a(−⃗k, −λ) ←→ P a† (⃗k, λ) P −1 = − a† (−⃗k, −λ) (C.449)

P Aµ (x) P −1 = Aµ (P x) (C.450)

377
• La simmetria di inversione temporale T è antiunitaria e soddisfa la con-
dizione

T 2 = ±I (C.451)

a seconda che il sistema abbia spin intero (T 2 = 1) oppure semidispari


(T 2 = −1). Essa è tale per cui risulta

spin 0 :
T a(⃗p) T −1 = e−iηT a(−⃗p) ←→ T a† (⃗p) T −1 = eiηT a† (−⃗p) (C.452)
T b(⃗p) T −1 = eiηp b(−⃗p) ←→ T b† (⃗p) T −1 = e−iηT b† (−⃗p) (C.453)

T ϕ(x) T −1 = e−iηT ϕ(T x) ←→ T ϕ† (x) T −1 = eiηT ϕ† (T x) (C.454)

spin 1/2 :
T a(r) (⃗p) T −1 = e−iηT fr a(r̄) (−⃗p) ←→ T a†(r) (⃗p) T −1 = eiηT fr a†(r̄) (−⃗p)(C.455)
T b(r) (⃗p) T −1 = eiηT fr b(r̄) (−⃗p) ←→ T b†(r) (⃗p) T −1 = e−iηT fr b†(r̄) (−⃗p) (C.456)

T ψ(x) T −1 = e−iηT γ 1 γ 3 ψ(T x) ←→ T ψ̄(x) T −1 = eiηT ψ(T x) γ 3 γ 1 (C.457)

campo e.m. :
T a(⃗k, λ) T −1 = a(−⃗k, λ) ←→ T a† (⃗k, λ) T −1 = a† (−⃗k, λ) (C.458)

T Aµ (x) T −1 = Aµ (T x) (C.459)

378
D Appendix: Cenni di Teoria formale dello Scat-
tering
Nella Teoria formale dello Scattering, dato un sistema fisico retto dall’hamiltoniana

H = H0 + H (D.1)

dove H0 è l’hamiltoniana imperturbata mentre H descrive appunto l’interazione,
gli autostati | Ψ > dell’hamiltoniana completa H possono essere espressi in ter-
mini degli autostati | Φ > di H0 corrispondenti allo stesso autovalore E, at-
traverso l’equazione di Lippmann-Schwinger, nel modo seguente
1 ′
|Ψ± >= |Φ > + H |Ψ± > (D.2)
E − H0 ± iϵ
Gli stati |Ψ± >, definiti dall’equazione di LS (D.2), vengono anche chiamati353
stati stazionari ingoing ed outgoing, rispettivamente secondo l’associazione354

|Ψ+ >→ ingoing |Ψ− >→ outgoing

Nel caso in cui questi si riferiscano ad uno stato imperturbato355 |Φ >≡ |⃗k >,
autostato dell’impulso, essi vengono indicati con i simboli |⃗k± > e si dimostra
che, per una qualsiasi energia E > 0, essi costituiscono un insieme completo (una
base normalizzata come gli stati |⃗k >) nello spazio degli stati del continuo, cioè
nello spazio degli stati di scattering propriamente detti.
Gli stati imperturbati |⃗k > e gli stati |⃗k± > sono legati fra loro dagli operatori
di Møller Ω± , cosı̀ definiti sulla base |⃗k >

Ω± |⃗k >= |⃗k± > (D.3)

da cui, in generale, nelle notazioni consuete, abbiamo

Ω± |Φ >= |Ψ± > (D.4)


353
M.L. Goldberger, K.M. Watson: Collision theory, J. Wiley and Sons, 1964, pag. 192
354
Questa terminologia vuole riflettere il fatto che |Ψ+ > è fatto dall’onda imperturbata
entrante ed onde uscenti legate, appunto, al processo di scattering, mentre |Ψ− > è fatto
dall’onda imperturbata uscente ed onde entranti. Se pensiamo in termini di pacchetti d’onda
su cui poi passare al limite, la prima soluzione, |Ψ+ >, si sviluppa, attraverso l’hamiltoniana
completa, a partire da una precisa configurazione iniziale |Φ >, autostato dell’hamiltoniana
libera nel remoto passato mentre la seconda soluzione, |Ψ− >, è tale che, nel lontano futuro,
evolvendo secondo l’hamiltoniana completa, coinciderà con una precisa configurazione finale
|Φ >, di nuovo autostato dell’hamiltoniana libera.
355
In queste considerazioni si assume che esista una base dello spazio di Hilbert fatta da auto-
stati simultanei dell’hamiltoniana libera e dell’impulso |⃗k >, ovvero assumiamo implicitamente
che per il sistema fisico considerato, non esistano gradi di libertà interni. Se esistessero, co-
munque, essi fattorizzerebbero con l’impulso e non cambierebbero i termini del problema, solo
ci costringerebbero ad appesantire le notazioni...

379
Evidentemente, poichè per l’equazione di LS risulta
1 ′
|Ψ± > = |Φ > + H |Ψ± >=
E − H0 ± iϵ
1 ′
= |Φ > + H Ω± |Φ > (D.5)
E − H0 ± iϵ
gli operatori di Møller, nella base degli autostati dell’impulso, sono tali che
1 ′
Ω± |⃗k >= |⃗k > + H Ω± |⃗k > (D.6)
E − H0 ± iϵ
i.e., vale l’equazione operatoriale
1 ′
Ω± = 1 + H Ω± (D.7)
E − H0 ± iϵ
da cui si ottiene formalmente che
1
Ω± = (D.8)
1− 1
E−H0 ±iϵ
H′
ovvero la rappresentazione in serie
∞ (
∑ )n
1 ′
Ω± = H (D.9)
n=0 E − H0 ± iϵ
che è niente altro che la serie di Born.
Ricordiamo ora, ancora una volta, il significato fisico degli stati |⃗k± >.
Essi sono autostati dell’hamiltoniana completa H (valutati per t = 0, o, detto
altrimenti, nella Heisenberg Picture), relativi allo stesso autovalore E per cui |⃗k >
è l’autostato dell’hamiltoniana imperturbata H0 ed entrambi gli stati |⃗k± > , che
corrispondono a due diverse condizioni al contorno (uno contiene onde uscenti,
l’altro onde entranti), convergono su |⃗k > se l’interazione viene spenta.
Pensando in termini di pacchetti d’onda356 , lo stato |⃗k+ > origina dallo stato
356
In quanto autostati, gli stati |Ψ± > evolvono nel tempo (h̄ = 1) attraverso il semplice
fattore di fase e−iEt , per cui, per esempio, la densità di probabilità spaziale non dipende dal
tempo. Per poter parlare di ”prima” e ”dopo”, è necessario pensare questi stati come rappre-
sentazioni limite di pacchetti d’onda i quali, pur non essendo quindi autostati dell’hamiltoniana
H, potranno avere l’energia E definita con tutta la precisione che vogliamo (purchè finita ...).
Per esempio, nel caso degli stati |⃗k+ >, già lo stesso stato imperturbato |⃗k > dovrà essere visto,
invece che come un’onda piana, piuttosto come un pacchetto d’onde di impulso quasi definito
e pari a ⃗k, il quale, per t → −∞, è localizzato lontanissimo dal centro di scattering e si muove
verso di esso con velocità media ⃗v = ⃗k/m. Evidentemente, per t → +∞, lo stato sarà localiz-
zato, di nuovo, lontano dal centro di scattering, ma avendo subı̀to l’effetto del potenziale, sarà
fatto anche dall’onda sferica uscente originatasi appunto durante il tempo in cui è avvenuta
l’interazione con il potenziale di scattering. Nel caso degli stati |⃗k− >, invece, abbiamo che nel
lontano passato lo stato è fatto sia dal pacchetto d’onda di impulso quasi definito che dall’onda
sferica entrante, in modo che, nel lontano futuro, esso finisce per coincidere con un pacchetto
d’onde quasi-autostato dell’impulso...

380
|⃗k >, che, quindi, ne rappresenta il limite nel lontano passato; mentre lo stato
|⃗k− > converge verso |⃗k > nel lontano futuro.
Il processo di scattering è allora descritto completamente dalla matrice S fra gli
stati imperturbati, definita come

< k⃗′ |S|⃗k >≡< k⃗′ − |⃗k+ > (D.10)

ed è evidente da quanto precede che i suoi elementi di matrice nella base degli
autostati imperturbati dell’impulso forniscono semplicemente l’overlap fra lo stato
|⃗k+ > (originatosi, nel senso spiegato sopra, a partire da |⃗k > a t = −∞ che
quindi, in questo senso, descrive lo stato iniziale) e lo stato |k⃗′ − > (che, per
t = +∞ , darà luogo a |k⃗′ > e dunque, in questo senso, descrive lo stato finale).
Per quanto visto sopra, essendo

|⃗k+ > = Ω+ |⃗k >


|k⃗′ − > = Ω− |k⃗′ > ⇒ < k⃗′ − | =< k⃗′ | Ω†−

si ha

< k⃗′ |S|⃗k >=< k⃗′ − |⃗k+ >=< k⃗′ |Ω†− Ω+ |⃗k >
⇒ S = Ω†− Ω+ (D.11)

che fornisce l’espressione della matrice di scattering S in termini dei due operatori
di Møller.
Tornando adesso all’equazione di LS per gli stati ingoing
1 ′
|⃗k+ >= |⃗k > + H |⃗k+ >
E − H0 + iϵ
osserviamo che essa può anche essere scritta come
1 ′
|⃗k+ >= |⃗k > + H Ω+ |⃗k > (D.12)
E − H0 + iϵ
cioè in modo tale che, formalmente, al secondo membro compaia soltanto lo stato
imperturbato.

L’operatore H Ω+ solitamente viene indicato in letteratura con il simbolo T :

T ≡ H Ω+ (D.13)

e quindi, in termini di questo operatore, risulta


1
|⃗k+ >= |⃗k > + T |⃗k >
E − H0 + iϵ
1
⇐⇒ |Ψ+ >= |Φ > + T |Φ > (D.14)
E − H0 + iϵ

381

ma |Ψ+ >= Ω+ |Φ > per cui, moltiplicando ambo i membri della (D.14) per H ,
otteniamo
′ ′ ′ 1
H Ω+ |Φ >= H |Φ > +H T |Φ > (D.15)
E − H0 + iϵ
ovvero, data la definizione (D.13), otteniamo l’equazione
′ ′ 1
T =H +H T (D.16)
E − H0 + iϵ
da cui si ottiene la soluzione formale seguente
( )
′ 1 ′ 1 ′
1−H T =H ⇒ T = H
E − H0 + iϵ 1−H ′ 1
E−H0 +iϵ
{ ∞ ( )n }
∑ ′ 1 ′
⇒ T = H H = (D.17)
n=0 E − H0 + iϵ
′ ′ 1 ′ ′ 1 ′ 1 ′
=H +H H +H H H + ... (D.18)
E − H0 + iϵ E − H0 + iϵ E − H0 + iϵ
in accordo, di nuovo, con quanto ottenuto considerando la serie di Born357 .

Quanto agli elementi di matrice dell’operatore T fra stati di impulso definito,


essi sono direttamente legati all’ampiezza di scattering f (⃗k, k⃗′ ), infatti, per un’onda
piana incidente di impulso ⃗k, abbiamo
( )
ikr
1 i⃗k·⃗
r ⃗k, ⃗k ′ ) e
Ψ+ (⃗r) = e + f ( (D.20)
(2π)3/2 r
dove si è definita l’ampiezza di scattering, al solito, come
2
(2π) m ′
f (⃗k, ⃗k ′ ) ≡ − 2 < ⃗k ′ | H |⃗k+ > (D.21)

357
Infatti, per la (D.14), risulta chiaramente che
(E − H0 + iϵ) |Ψ >= T |Φ >
mentre dalla (D.5) si ha altresı̀ che
∞ (
∑ )n
′ 1 ′
(E − H0 + iϵ)|Ψ >= H H |Φ >
n=0
E − H0 + iϵ

e dunque deve essere


∞ (
∑ )n
′ 1 ′
T =H H (D.19)
n=0
E − H0 + iϵ

come mostra, appunto, la (D.18).



Si noti che nella (D.17) l’operatore H è a destra, mentre nella (D.19) agisce a sinistra.
E’ evidente, però che, data la (D.18), le due espansioni in serie coincidono ! ...

382
e quindi risulta
(2π)2 m 2
⃗′ | H ′ |⃗k+ >= − (2π) m < k⃗′ | H ′ Ω+ |⃗k >
f (⃗k, k⃗′ ) = − < k
h̄2 h̄2
(2π)2 m
= − < k⃗′ |T |⃗k > (D.22)
h̄2
h̄2
⇔ < k⃗′ |T |⃗k >= − f (⃗k, k⃗′ ) (D.23)
m(2π)2
Siccome l’ampiezza di scattering descrive appunto il risultato dell’effetto della
presenza del potenziale di scattering sull’onda imperturbata, non è certo stupe-
facente che l’operatore T sia altresı̀ direttamente legato proprio alla matrice di
scattering S del processo.
Per dimostrarlo formalmente occorre osservare che gli stati |Ψ± >, che abbiamo
scritto, seguendo la teoria già sviluppata da Lippmann e Schwinger, come
1
|Ψ± > = |Φ > + (H − H0 ) |Ψ± > (D.24)
E − H0 ± iϵ
possono essere scritti anche, equivalentemente, nella forma di Low358 seguente359
1
|Ψ± > = |Φ > + (H − H0 ) |Φ > (D.25)
E − H ± iϵ
358
F.E. Low : Boson-fermion scattering in the Heisenberg representation
Phys. Rev. 97,1392 (1955)
359
Partiamo dall’identità operatoriale seguente
1 1 1 1 1 1
− = (B − A) = (B − A)
A B A B B A
da cui discende l’identità
1 1 1 1
− = (H − H0 )
E − H ± iϵ E − H0 ± iϵ E − H ± iϵ E − H0 ± iϵ
ovvero
1 1 1 1
= − (H − H0 )
E − H0 ± iϵ E − H ± iϵ E − H ± iϵ E − H0 ± iϵ
Sostituiamo allora l’espressione trovata nella (D.24)
1
|Ψ± >= |Φ > + (H − H0 ) |Ψ± >
E − H0 ± iϵ
Si ha
[ ]
1 1 1
|Ψ± > = |Φ > + − (H − H0 ) (H − H0 ) |Ψ± >=
E − H ± iϵ E − H ± iϵ E − H0 ± iϵ
1 1
= |Φ > + (H − H0 ) |Ψ± > − (H − H0 ) [|Ψ± > −|Φ >]
E − H ± iϵ E − H ± iϵ
dove si è usato il fatto che, per la (D.24), risulta evidentemente
1
(H − H0 ) |Ψ± >= [|Ψ± > −|Φ >]
E − H0 ± iϵ

383
dove, in entrambi i casi, ricordiamolo, E rappresenta l’energia dello stato imper-
turbato |Φ >360 .
Secondo quanto definito precedentemente, si ha
< k⃗′ |S|⃗k > = < k⃗′ − |⃗k+ > (D.26)
ma, per la (D.25), risulta
1 ′
|k⃗′ − > = |k⃗′ > + H |k⃗′ > (D.27)
E′ − H − iϵ
avendo qui indicato con E ′ , in generale, l’energia dello stato libero |k⃗′ >.
Ne segue che361
′ 1
< k⃗′ − | = < k⃗′ | + < k⃗′ | H (D.28)
E′ − H + iϵ
per cui abbiamo
′ 1
< k⃗′ |S|⃗k >≡< k⃗′ − |⃗k+ >=< k⃗′ |⃗k+ > + < k⃗′ | H |⃗k+ > (D.29)
E ′ − H + iϵ
D’altronde, per la (D.24), abbiamo
1 ′
|⃗k+ >= |⃗k > + H |⃗k+ > (D.30)
E − H0 + iϵ
dove E è l’energia dello stato libero |⃗k >. Sostituendo questo risultato al primo
vettore |⃗k+ > presente al secondo membro dell’equazione (D.29), si ha dunque
1 ′
< k⃗′ |S|⃗k > = < k⃗′ |⃗k > + < k⃗′ | H |⃗k+ > +
E − H0 + iϵ
′ 1
+ < k⃗′ | H |⃗k+ > (D.31)
E′ − H + iϵ
per cui, semplificando, si ottiene infine l’espressione cercata, i.e.
1
|Ψ± >= |Φ > + (H − H0 ) |Φ >
E − H ± iϵ

360
Nel caso della equazione di LS (D.24), occorre determinare la funzione di Green libera,
mentre nel caso della equazione di Low (D.25) occorre determinare, invece, la funzione di
Green dell’hamiltoniana completa: dal punto di vista del calcolo esplicito, questo di solito non
aiuta, perchè sposta semplicemente la difficoltà di determinare la funzione d’onda Ψ a quella di
trovare il kernel dell’equazione ... però può risultare utile in alcune considerazioni di carattere
formale come quelle che ci accingiamo a fare adesso.

361
Abbiamo qui usato il fatto che H ed H sono operatori autoaggiunti, per cui risulta
( )†
1 ′ ′ 1
H =H
E − H − iϵ E − H + iϵ

384
Ma
1 1
< k⃗′ | = < k⃗′ |
E − H0 + iϵ E − E ′ + iϵ
1 1
|⃗k+ >= ′ |⃗k+ >
E − H + iϵ
′ E − E + iϵ
dunque
1 ′ 1 ′
< k⃗′ |S|⃗k > = < k⃗′ |⃗k > + < k⃗′ | H |⃗k+ > + ′ < k⃗′ | H |⃗k+ >=
E − E + iϵ′ E − E + iϵ
( )
′ 1 1
= < k⃗′ |⃗k > + < k⃗′ | H Ω+ |⃗k > − (D.32)
E − E ′ + iϵ E − E ′ − iϵ
Veniamo ora alla quantità entro parentesi tonda: essa vale
( )
1 1 −2i ϵ
− =
E − E + iϵ E − E − iϵ
′ ′ (E − E ′ )2 + ϵ2
D’altronde, se consideriamo la funzione
ϵ
f (x, ϵ) =
x2 + ϵ2
è immediato renderci conto che essa gode delle seguenti proprietà

1) ∀x ̸= 0 : lim f (x, ϵ) = 0
ϵ→0

2) lim f (0, ϵ) = +∞
ϵ→0+
∫ +∞
2) ∀ϵ > 0 : f (x, ϵ) dx = π
−∞

dunque

lim f (x, ϵ) = π δ(x)


ϵ→0+

per cui, ricordando la definizione dell’operatore T , si ha infine che


( )
′ 1 1
< k⃗′ |S|⃗k > = < k⃗′ |⃗k > + < k⃗′ | H Ω+ |⃗k > − =
E − E + iϵ E − E ′ − iϵ

= < k⃗′ |⃗k > + [−2i π δ(E − E ′ )] < k⃗′ | T |⃗k > (D.33)
ovvero
⇒ S = I − 2i π δ(E − E ′ ) T (D.34)

385

You might also like