Professional Documents
Culture Documents
La formulazione matematica della meccanica quantistica e da attribuirsi a John Von Neumann, che
nei primi anni 30 (la pubblicazione del suo libro e del 32) dimostro come le precedenti formulazioni,
quella matriciale di Heisenberg/Jordan e quella ondulatoria di Schrodinger fossero equivalenti in
quanto rappresentazioni differenti dello spazio di Hilbert. Per definizione uno spazio di Hilbert e
uno spazio metrico (e quindi normato) e completo. Nellaccezione utilizzata in meccanica quan-
tistica tuttavia due ulteriori proprieta vengono richieste: la separabilita e lessere di dimensione
infinita. Siccome la proprieta di separabilita e equivalente allesistenza di una base ortonormale
numerabile, e facile dimostrare come tutti questi spazi di Hilbert possano esser messi in corrispon-
denza, attraverso unopportuna isometria, a `2 (C): in effetti, la differenza fra le due formulazioni
originariamente si poteva trovare nel fatto che Schrodinger utilizzasse la rappresentazione L2 (R3 )
delle funzioni a quadrato integrabili, mentre Heisenberg nella sua meccanica matriciale utilizzasse
una base ortonormale delle autofunzioni di una qualche osservabile, utilizzando quindi una rapp-
resentazione analoga a `2 (C), lo spazio di Hilbert delle successioni di numeri complessi a quadrato
sommabile. Volendo fare unanalogia, nella formulazione di Schrodinger si esprime la funzione
donda utilizzando un base impropria di distribuzioni, quella delle delta di Dirac, mentre nella for-
mulazione matriciale la base utilizzata e una base ortonormale dello spazio. Alcune caratteristiche
della teoria, come il principio di indeterminazione, saranno evidenziate come dirette conseguenze del
formalismo utilizzato. Successivamente, introducendo il prodotto tensoriale di Spazi di Hilbert (che
a sua volta e uno spazio di Hilbert) per rappresentare sistemi a piu particelle, sara cosi possibile
evidenziare alcuni problemi della Meccanica Quantistica, in particolare associati al collasso istanta-
neo di una funzione donda dato dal Postulato di Riduzione Pacchetto di Von Neumann. Rispetto
alla formulazione originale utilizzante posizione e momento (con le conseguenti difficolta dovute
allutilizzo di operatori a spettro continuo) si potra analizzare il cosidetto paradosso EPR nella
formulazione di Bohm, che prevede lutilizzo di un ulteriore grado di liberta della teoria, quello di
spin. Tale grado di liberta risulta particolarmente artificioso nella formulazione non-relativistica:
questo e tuttavia un problema con il quale dovremo convivere. Dopo una breve analisi delle teorie
cosidette a variabili nascoste, con lenunciazione di un paio di teoremi di impossibilita (quello
di Von Neumann e quello di Kochen-Specker) che chiariranno immediatamente le limitazioni in-
trinseche di tali teorie, soprattutto in merito alla descrizione di proprieta oggettive possedute
da un sistema, ci dedicheremo allo studio della celebre Diseguaglianza di Bell: questa viene spesso
interpretata come negante la proprieta di localita che si e sempre ritenuta associata alla realta
fisica. Tuttavia, sebbene non saremo in grado di dimostrare che il mondo microscopico risulta in
realta locale, saremo in grado di mostrare come sia ragionevole pensare che la diseguaglianza venga
rotta non da una qualche influenza superluminale ma bensi da una errata assunzione, la cosidetta
Joint Measurability Assumption, utilizzata per ricavare tale risultato.
1
Chapter 1
(d) f (x, x) 0 x H
(e) f (x, x) = 0 x = 0
f (x, y) = hx| yi
Osservazione:. Dato un prodotto scalare su di uno spazio, e immediato come esso possa essere
utilizzato per definire una norma (che a sua volta induce una metrica). E sufficiente infatti porre
kxk2 = hx| xi
per ottenere una norma. La metrica indotta dalla norma, come e noto, e
p
d(x, y) = kx yk2
Il fatto che tale funzione sia una distanza, in particolare che soddisfi la diseguaglianza triangolare,
si puo dimostrare facilmente utilizzando la Diseguaglianza di Schwarz.
2
Theorem 1.1.1. Per ogni coppia di elementi appartenenti ad uno spazio vettoriale di su cui e
definito un prodotto scalare, si ha la seguente diseguaglianza
| hx| yi | kxkkyk
hx| yi
z := x y
hy| yi
hx| yi hy| yi
hz| yi = hx| yi =0
hy| yi
Ora e facile vedere come, grazie al fatto che y e z risultano essere quindi ortogonali, che
hx| yi 2
hx| yi 2 hx| yi hx| yi
x= y + z kxk = y + z y + z = y + kzk2
hy| yi hy| yi hy| yi hy| yi
Dalla dimostrazione e facile notare che la diseguaglianza diventa uneguaglianza se e solo se kzk = 0,
quindi in particolare z = 0.
In seguito considereremo solo gli spazi di Hilbert che possiedono due ulteriori proprieta, quella
di essere separabili e infinito dimensionali. Nel caso di L2 (R) il prodotto scalare richiesto e dato da
Z
hx| yi = (x(u)) y(u) du.
Osservazione:. Perche questo sia un prodotto scalare dovremo limitarci a trattare non L2 (R) ma
bensi un suo quoziente, rispetto alla relazione di equivalenza cosi definita
x R y x y = 0 quasi ovunque
k N Nk N : kn m k < 2k n, m > Nk
Scegliamo gli Nk in modo che soddisfino la condizione Nk+1 > Nk e definiamo una nuova successione
di elementi di X {zk }kN in questo modo:
z0 = N1
zk = Nk+1 Nk k > 1
Evidentemente kk0 =0 zk0 = Nk , e inoltre kzk k < 2k . zk e quindi una serie assolutamente conver-
P
gente, e per lipotesi del teorema risulta quindi convergere ad un elemento di X, che chiameremo
per evidenti motivi
X k
= lim zk0 = lim Nk
k k
k0 =0
Ora non rimane che dimostrare che la successione {n }nN converge a nella sua interezza. Cio e
banale, siccome ogni norma soddisfa la diseguaglianza triangolare per definizione si ha che
kn k kn vNk k + kvNk k
(b) , 0 hu | u0 i = 0
(c) Linsieme considerato e massimale, nel senso che non e possibile aggiungere ad esso un altro
elemento di H e ottenere un altro insieme che soddisfi ancora le prime due proprieta.
Noi tratteremo solamente di spazi di Hilbert separabili, cioe che ammettono basi ortonormali
numerabili. Enunciamo ora un semplice lemma:
Lemma: 1.2.1. Per ogni sottoinsieme finito F di elementi di una base, si ha
X
| hui | xi |2 kxk2
F
In questo caso e facile chiarire perche un tale insieme venga chiamato base: abbiamo infatti
che x H
Xn
xn = hui | xi ui
i=1
Ma n
X
N : n, m > N | hui | xi |2 <
i=m
Poiche la serie a destra e una successione di numeri reali non-decrescente e limitata per il lemma
enunciato sopra, essa converge. Ma per ora abbiamo solo dimostrato che la serie converge ad un
qualche elemento y H. Tuttavia, se y 6= x si ha subito un assurdo, poiche hx y| u i = 0, e
aggiungendo lelemento
1
x
hx| xi
alla base si otterrebbe un insieme che soddisfa le prime due proprieta, contraddicendo lipotesi di
massimalita di {u } .
Osservazione:. Nella rappresentazione L2 (R) spesso i fisici utilizzano il termine base impropria
per indicare insiemi di distribuzioni, parametrizzate con un parametro reale , non appartenenti
allo spazio di Hilbert ma tali che ogni elemento di L2 (R) sia esprimibile come un integrale
Z
c() d
R
Un esempio di tali basi improprie sono le distribuzioni a delta di Dirac e gli esponenziali immag-
inari. Una teoria piu raffinata basata su questi concetti esiste: e nota come teoria degli spazi
di Hilbert attrezzati ed e dovuta a Gelfand. La necessita di utilizzare simili entita e dovuta al
fatto che molti operatori di interesse fisico risultano avere queste distribuzioni come autofunzioni:
tuttavia, il nostro interesse si concentra principalmente sul grado di liberta di spin, per i quali
operatori hanno solo autofunzioni proprie.
x y x = y + r
dove r e un qualche elemento del sottospazio R del prodotto Cartesiano generato dagli elementi
esprimibili come
(x1 , y2 ) + (x2 , y2 ) (x1 + x2 , y)
(x1 , y1 ) + (x1 , y2 ) (x1 , y1 + y2 )
(x1 , cy1 ) (cx1 , cy1 )
(cx1 , y1 ) (cx1 , cy1 )
dove x1 , x2 V1 , y1 , y2 V2 , c C . Il prodotto tensoriale di due spazi di Hilbert H = H1 H2
e il completamento del prodotto tensoriale ordinario fra i due spazi originali rispetto alla metrica
indotta dal prodotto scalare
dove i pedici stanno ad indicare che i due prodotti scalari sono quelli definiti rispettivamente su H1
e H2 Lo spazio ottenuto e evidentemente uno spazio di Hilbert a sua volta, separabile e infinito
dimensionale. Piu avanti nel testo saremo soliti utilizzare operatori definiti su uno dei due spazi
sul prodotto tensoriale dei due, ovviamente questo ha da intendersi come segue, nellesempio che
loperatore A1 sia definito sullo spazio di Hilbert H1
A1 (x y) := (Ax) y
Essenzialmente, si associa alloperatore A1 del primo spazio loperatore A1 12 definito sul prodotto.
Osservazione:. Se un operatore lineare e continuo (o limitato, le due proprieta coincidono per gli
operatori lineari) allora lessere definito su un dominio denso risulta essere equivalente, nella prat-
ica, ad essere definito ovunque: lo si puo infatti estendere in maniera estremamente naturale. Un
operatore lineare Hermitiano e quindi, essenzialmente, autoaggiunto. Se invece non e limitato il
problema e piu complicato: gli operatori non limitati sono inoltre ovunque nella teoria. Un qual-
siasi operatore differenziale e per esempio non limitato. In questo caso una differente definizione
di aggiunto puo venire utilizzata: tuttavia, considerando che in questo lavoro tratteremo prin-
cipalmente di problemi legati allo spin che e rappresentato da operatori limitati, non ci porremo
questi problemi.
Osservazione:. Dallipotesi di autoaggiuntezza segue il fatto che ogni punto dello spettro di un tale
operatore appartiene in realta allasse reale, infatti per qualsiasi autostato
a h| i = hA| i = h| Ai = a h| i
n H : An = an n
Osservazione:. I fisici usano definire anche uno spettro continuo, formato dai valori per cui es-
istono degli elementi delle cosidette basi improprie per cui una simile relazione viene soddisfatta.
Come si e gia commentato, noi tratteremo in dettaglio solo casi in cui lo spettro e esclusivamente
discreto.
h| Ai = hA| i
per ogni coppia di stati , che appartengono al suo dominio allora risulta evidente, per lantilinearita
del prodotto scalare e lortonormalita della base su cui la successione e definita, che amn = anm
[A, B] := AB BA = 0
Ovviamente, con 0 si intende loperatore lineare nullo che associa la funzione identicamente nulla
ad ogni elemento del suo dominio, in questo caso coincidente con lintersezione del dominio di A e
di B.
Osservazione:. Se due operatori con spettro discreto risultano essere compatibili, allora esiste una
base ortonormale costituita da autofunzioni in comune ai due.
Definizione: 8. Si dice media di un operatore A la seguente espressione
hAi = h| Ai
Osservazione:. Si consideri un insieme di n stati (con n molto grande) rappresentati dalla stessa
H, e si immagini di misurare il valore di una certa quantita fisica su di essi. La ragione
del perche la media di tali misure (media sperimentale) tenda, per n sufficientemente grande, alla
media delloperatore autoaggiunto associato alla quantita fisica (media teorica) e da cercarsi nel
postulato di Von Neumann, il quale da anche la probabilita che un elemento di H si trasformi
in uno degli autostati di A in seguito ad una misura. Vedere cio nel caso di spettro discreto e
particolarmente semplice, considerando n,i una base ortonormale di autostati di A (il secondo
indice come al solito tiene conto di una possible degenerazione) si ha che
* +
X X X
bn,i n,i A bn,i n,i = an |bn,i |2
n,i n,i n,i
dove evidentemente
bn,i = hn,i | i
Theorem 1.5.1. Siano A, B due operatori lineari autoaggiunti, operanti su un qualche stato
.Allora si ha che
1
AB h[A, B]i
2
Dimostrazione: 3. La dimostrazione e molto diretta, e fa utilizzo della diseguaglianza di Schwarz
AB = k A hAi kk B hBi k
D E
AB | A hAi B hBi |
Ora, il modulo del membro a sinistra e certamente maggiore o uguale al modulo della sua sola
parte immaginaria, la quale puo venire espressa come la meta della differenza fra il numero stesso
e il suo complesso coniugato. Ricordando che hx| yi = hy| xi per la nostra definizione di prodotto
scalare nella rappresentazione L2 (R) abbiamo quindi che
D E
1 E D
AB A hAi B hBi B hBi A hAi
2
1
= | h| [A, B] i |
2
1.6 Proiettori e caratterizzazione degli stati fisici tramite
essi
Definizione: 10. Si dica proiettore associato ad una varieta lineare dello spazio di Hilbert M
loperatore PM tale che X
H PM = hi | i i
i
Dimostrazione: 4. Il fatto che i proiettori risultino Hermitiani e evidente, infatti, considerando che
i proiettori sono evidentemente limitati
* +
X X X
hPM | i = hi | i i = h| i i hi | i = h| hi | i i i = h| PM i
i i i
Ora, e evidente che loperatore e definito su tutto lo spazio di Hilbert siccome il prodotto scalare
lo e, e quindi lautoaggiuntezza risulta banalmente provata.
Proprieta dei proiettori:
Siano E, F due varieta dello spazio di Hilbert, e PE , PF i proiettori a loro associati. Allora
E E , F F hE | F i = 0
Rispetto alla terza proprieta considerata, si puo dunque stabilire una relazione dordine parziale
fra i proiettori, tale che
PE PF E F
dove {i }i rappresenta come al solito una qualche base ortonormale dello spazio di Hilbert.
Questa definizione pare quindi contenere una qualche ambiguita, ma vedremo immediatamente
che non e cosi. Infatti e facile vedere come il valore della traccia di un operatore non dipenda
dalla base sulla quale la si calcola. Siano quindi {i }i , {j }j due basi ortonormali, si ha che
X X X
Tr A = hi | Ai i = hhj | i i j | A hk | i i k i = hi | j i hj | Ak i hk | i i
i i,j,k i,j,k
X X X X
= hhi | k i i | j i hj | Ak i = hk | j i hj | Ak i = k,j hj | Ak i = hj | Aj i
i,j,k k,j k,j j
Dove si sono utilizzate, in ordine, lespressione dellidentita come proiettore, la linearita e antilin-
earita del prodotto scalare, la proprieta commutativa per la moltiplicazione di numeri complessi,
e infine lortogonalita della seconda base scelta. Ovviamente dalla linearita del prodotto scalare
segue la linearita del funzionale traccia.
Definizione: 13. Operatore di classe traccia - Si dice operatore di classe traccia un operatore A
tale che 2
Tr |A| < dove |A| = A
2
Dove lespressione |A| = A e da intendersi nella modalita seguente: |A| ha come autofunzioni
le stesse autofunzioni di A, ma ha come autovalori associati a tali funzioni la radice del quadrato
dellautovalore rispettivo, i.e. il valore assoluto.
Osservazione:. Notiamo inoltre che, sia AB a sua volta di classe traccia allora
Tr AB = Tr BA
Questo si puo dimostrare facilmente che, per due operatori definiti su tutto H
X X X
Tr AB = hi | ABi i = hi | A hj | Bi i j i = hi | Aj i hj | Bi i
i i,j i,j
X X
= hj | B hi | Aj i i i = hj | BAj i = Tr BA
i,j j
Da questa proprieta risulta evidente la traccia risulta invariante per permutazioni cicliche, i.e.
Tr ABC = Tr (AB)(C) = Tr CAB e via dicendo. Tuttavia in generale Tr ABC 6= Tr CBA .
Osserviamo ora che, per ogni operatore autoaggiunto A e stato
X X X
h| Ai = h| A hi | i i i = hi | i h| Ai i = hi | h| Ai i i
i i i
X
= hi | P Ai i = Tr P A
i
1.8 Spin
In Meccanica Quantistica una nuova proprieta, senza alcun analogo classico, si presenta. Essa
e il momento magnetico intrinseco, cioe lo spin. Per trattare tale quantita, che trove le sue
motivazioni di esistere solamente in una teoria relativistica che noi non tratteremo, nella Meccanica
Quantistica non-relativistica si introduce un nuovo spazio di Hilbert, che e il prodotto tensoriale
del nostro spazio di Hilbert con uno spazio di Hilbert indicato con Hs , questa volta di dimensione
finita e uguale a (2s + 1) , dove ~2 s e lo spin associato alla particella trattata. Si ottiene cosi
quello che viene comunemente chiamato spazio di Hilbert totale. Nella trattazione che segue ci
interesseranno solo particelle fermioniche con spin = ~2 , cioe s = 12 . Essendo lo spazio associato al
grado di liberta di spin bidimensionale, ogni operatore agente solo su questo spazio potra essere
rappresentato da una matrice bidimensionale, mentre gli stati potranno venire rappresentati da
vettori colonna. Tale rappresentazione risulta evidentemente dipendenti dalla base scelta di Hs . In
particolare le proiezioni dello spin sui tre assi, nel caso in cui si voglia utilizzare come base di tale
spazio i due autovettori della proiezione sullasse z, sono date da, a meno di un fattore moltiplicativo
(che ometteremo in futuro in quanto presenta poco interesse) di ~2
0 1
Sx =
1 0
0 i
Sy =
i 0
1 0
Sz =
0 1
E facile verificare che queste matrici soddisfano le condizioni canoniche di commutazione per le
componenti di un momento angolare. Loperatore di spin e definito naturalmente come S =
Sx + Sy + Sz
Ora, la proiezione dello spin su di unarbitraria direzione normalizzata risulta essere Sn = nx Sx +
ny Sy + nz Sz
Sempre lavorando con la base delle autofunzioni di Sz , non risulta difficile verificare, utilizzando
sempre il formalismo matriciale che la dimensione finita dello spazio ci permette, che gli stati
1 1 + nz
n :=
1 + nz nx + iny
1 nx iny
n :=
1 + nz 1 + nz
risultano essere i suoi due autostati relativi, rispettivamente, agli autovalori +1 e -1 (si ricorda che
si sta omettendo il fattore moltiplicativo). Ora vedremo come utilizzare questo risultato in maniera
interessante.
Si consideri un sistema di due particelle, e si ignori i loro gradi di liberta spaziali. Tale sistema e
rappresentato da un elemento del prodotto tensoriale dei due spazi di Hilbert rispettivi alle singole
particelle: ignorare i gradi di liberta spaziali equivale a lavorare nel prodotto tensoriale dei due
spazi bidimensionali di spin. Sia definito come stato di singoletto rispetto alla direzione n il
seguente stato
(S) 1 (1) (2) (1) (2)
n = n n n n
2
Ora, sostituendo e utilizzando la proprieta di linearita del prodotto tensoriale, e scrivendo il tutto
(1),(2)
nelle componenti della base data dalle autofunzioni di Sz , si vede che lo stato di singoletto non
dipende da n e risulta sempre uguale a
(S) 1 1 0 0 1
=
2 0 1 1 0
Risulta immediato come una misura (quindi applicando loperatore associato e poi utilizzando il
Postulato di Riduzione Pacchetto) della proiezione sullasse z della prima particella, per esempio,
risultera essere +1 con probabilita pari a 12 o -1 con probabilita analoga. Inoltre, lo stato di
singoletto risulta essere invariante per rotazioni. Infatti abbiamo appena dimostrato che lo stato di
singoletto, che risulta essere unico, puo essere scritto come la stessa combinazione dei due autostati
rispetto ad una qualsiasi direzione. Questo in altre parole significa che tutte le proprieta dello stato
di singoletto risultano invarianti rispetto ad una rotazione dello spazio tridimensionale.
Chapter 2
16
2.2 Variabili nascoste
Durante la storia della meccanica quantistica molti hanno ritenuto che la teoria fosse incompleta.
Cio e da essere inteso come la considerazione che la funzione donda possa non risultare la de-
scrizione piu completa possibile dello stato di un sistema, e che quindi potessero essere presenti
altri parametri, delle variabili per lappunto nascoste, che determinino, in maniera a loro volta sto-
castica o meno, levoluzione dello stato considerato. Lo studio di tali teorie e stato particolarmente
inibito dal cosidetto Teorema di Impossibilita di Von Neumann, esposto dallo stesso nel suo libro
del 32, il cui enunciato fu per molto tempo creduto essere limpossibilita di una tale teoria. Non
e chiaro se Von Neumann stesso fosse a conoscenza dei limiti del suo teorema e fosse quindi stato
frainteso, o se il matematico ungherese avesse effettivamente commesso un errore e adottato ipotesi
troppo forti. In ogni caso, pochi furono coloro che ebbero il coraggio di andare contro la parola di
Von Neumann, e le loro critiche non furono prese troppo sul serio fino allintervento rivoluzionario
di Bohm, che non solo provo che teorie a variabili nascoste sono possibili, ma anzi sviluppo un
chiaro controesempio. Il teorema di Von Neumann vale solo per variabili nascoste dispersionless,
cioe deterministiche e non aleatorie. Inoltre Von Neumann, come vedremo poi, fece unipotesi che
puo essere ritenuta restrittiva.
(a) Il valore medio di una quantita intrinsecamente positiva (come per esempio il quadrato di
unaltra quantita) e 0 , e il valore medio dellidentita e pari a 1 .
(b) Sia f una funzione polinomiale e R una quantita legata alloperatore autoaggiunto R. Allora
la quantita f (R) e legata nello stesso modo alloperatore f (R).
(c) Siano R, G due quantita fisiche, rappresentate dagli operatori R e G. Allora la quantita
R + G e rappresentata dalloperatore R + G, e inoltre il valore medio di tale quantita e pari
alla somma dei valori medi delle due.
Osservazione:. Non si richiede in nessun modo che le due quantita siano legate a due operatori
fra di loro commutanti e quindi, in senso quantistico, compatibili. Nel caso in cui gli
operatori non siano commutanti, la somma non e la somma ordinaria ma viene definita in
maniera implicita: in altre parole, non e sufficiente misurare le due quantita e sommarne i
risultati, ma bisogna descrivere un terzo processo di misura. Un esempio triviale e lenergia
di un sistema stazionario. Questo, in particolare, e la cosidetta ipotesi ingiustificata.
Theorem 2.3.1. Assumendo che queste ipotesi risultino vere, allora per una qualsiasi quantita
fisica T rappresentata dalloperatore T il suo valore medio e dato da
< T >= Tr U T
dove U e un operatore statistico indipendente dalloperatore T che caratterizza il sistema consider-
ato.
Dimostrazione: 5. Sia, come solito, { } una base ortonormale di H , e sia la successione a, la
successione che caratterizza loperatore lineare A, legato alla quantita fisica A. Possiamo definire
tre successioni di operatori autoaggiunti (hermitiani e definiti ovunque) tramite tre successioni di
successioni. Per facilitare la lettura, utilizzeremo gli indici n, m per indicare gli operatori allinterno
di una successione, e indici greci per le successioni caratterizzanti gli operatori:
(n)
E (n) e, = n
1 per = m, = n
(mn)
F (mn) f, = 1 per = n, = m
0 negli altri casi
i per = m, = n
(mn)
G(mn) g, = i per = n, = m
0 negli altri casi
Siano E (n) , F (mn) , G (mn) le tre quantita che corrispondono a questi operatori (i quali, ripetiamo,
risultano evidentemente hermitiani e, giacche definiti ovunque, anche autoaggiunti), allora per una
delle assunzioni iniziali si ha che
X X X
A= an,n E (n) + Re(am,n )F (mn) + Im(am,n )G (mn)
n m<n m<n
e quindi
X X X
< A >= an,n < E (n) > + Re(am,n ) < F (mn) > + Im(am,n ) < G (mn) >
n m<n m<n
Ma i valori medi di tali quantita sono dei numeri reali, e quindi e possibile definire un operatore
autoaggiunto U in questa maniera
per m = n um,n =< E >
per m < n um,n = 21 < F (mn) > + 2i < G (mn) >
per m > n um,n = 12 < F (nm) > 12 < G (nm) >
Ora vediamo come X
< A >= un,m am,n
m,n
Ma siccome
a, = h | A i
si ha che questa relazione puo essere scritta come
X X
< A >= hm | An i hn | U m i = hn | U hm | An i m i = Tr U A
m,n m,n
E qui si ha il primo risultato. Ora non resta che dimostrare che U e effettivamente un operatore
di classe traccia: il fatto che sia indipendente da A risulta evidente dalla dimostrazione. Per
dimostrare che sia un operatore positivo e sufficiente pensare ad un proiettore generico associato
ad un elemento H : abbiamo che
Tr U P = h| U i
ma questa e una quantita 0 per una delle assunzioni iniziali, considerando che al proiettore viene
associata la quantita 1 se lo stato su cui si e calcolato il valore medio appartiene alla varieta
generata da e 0 altrimenti. Per dimostrare che Tr U = 1 e banale: laltra parte della stessa
assunzione ce lo garantisce.
In che modo il Teorema di Von Neumann si imposta come un teorema di impossibilita ? Questo e
dato dalla seconda assunzione, in particolare considerando il caso A = P , f (a) = a2 per un qualsiasi
elemento . Infatti nel caso di una teoria deterministica si avrebbe una dispersione statistica pari
a 0, cioe
hP i2 = P2 = hP i
Ma questo si puo avere solo nel caso in cui hP i = h| U i = 0, 1 . Tuttavia e semplice vedere
come tale richiesta, considerata per ogni , risulti in una funzione costante per ogni e quindi a
contraddizioni in merito alla traccia di U .
Theorem 2.4.1. Sia H uno spazio di Hilbert separabile e di dimensione superiore a 3. Allora
esiste un insieme {A } di operatori lineari autoaggiunti tale che le seguenti due assunzioni sono
contradditorie:
(a) (KS1) A tutti gli elementi di {A } , per un certo elemento di H, viene assegnato un singolo
valore reale v(A ) , compatibile con il valore di uneventuale misura della quantita fisica
associata alloperatore.
E facilmente verificabile come gli argomenti di g in ogni riga formano una base ortogonale (non
ortonormale, ma cio non e importante in quanto stiamo considerando i proiettori associati) dello
spazio, e quindi i termini a destra sono giustificati. Tuttavia, sommando le 9 righe del sistema, si
ottiene un numero dispari a destra, mentre si puo notare come ogni argomento di g viene ripetuto
esattamente due volte allinterno del sistema, e quindi una somma sugli elementi di sinistra darebbe
un numero pari. Questo, evidentemente, e un assurdo.
2.5 Il controesempio di Bohm
Nel 1952 Bohm espose un chiaro controesempio al teorema di Von Neumann. Tale teoria, detta
Teoria dellOnda Pilota, fu in passato gia sviluppata da De Broglie, che pero la abbandono
ben presto per via di alcune inconsistenze che non fu in grado di conciliare. In particolare e
da notare come, mentre De Broglie la tratto nel caso di una singola particella, la versione di
Bohm viene enunciata direttamente nel caso pluri-particellare. Il nome deriva dal fatto che, in
questo caso, le posizioni delle singole particelle vengono prese come variabili nascoste, e quindi
risultano ben definite: fenomeni come linterferenza di una singola particella nellesperimento di
Young vengono invece spiegati attraverso lutilizzo di una cosidetta onda pilota, per lappunto,
che nella formulazione originaria di Bohm era un potenziale quantistico, il quale si propaga
istantaneamente nello spazio ma non trasmette energia, evitando cosi la trasmissione di segnali.
La teoria risulta, in una sua esposizione piu semplice di quella originale data da Bohm, poter essere
descritta in questo modo: si consideri un sistema di N particelle, descritto da un elemento dello
spazio di Hilbert L2 (R3N ) . Ora, in questa teoria ogni particella risulta perfettamente localizzata:
linsieme delle loro posizioni risulta essere le cosidette variabili nascoste della teoria. Inoltre
definiamo gli N campi di velocita relativi ad ogni particella nel modo seguente:
~ji (~r1 , , ~rN , t)
~vi (~r1 , , ~rN , t) =
k(~r1 , , ~rN , t)k2
dove ~j e la cosidetta corrente quantistica, definita come (le dipendenze dalle variabili spaziali e
temporali ora sono implicite)
~j = i~ (i i )
2Mi
dove Mi e la massa della particella i-esima e i e il gradiente nelle variabili della i-esima particella.
Ora, similmente al caso classico, le particelle si muovono secondo le velocita date da tali campi,
cioe
d~ri
= ~vi (~r1 , , ~rN , t)
dt
In che modo questa descrizione riproduce linterpretazione probabilistica di Born? Consideriamo
per semplicita il caso di una singola particella. Se la distribuzione di probabilita associata alla
posizione di questa particella (in questo caso la particella risulta perfettamente localizzata: la
necessita di una trattazione statistica e dovuta al fatto che la posizione risulta determinata ma a
noi sconosciuta) ad un certo t0 (che possiamo, senza mancare di generalita, assumere essere t0 = 0
) e il modulo quadro della funzione (~r) , allora possiamo visualizzare il problema rifacendoci ad
unanalogia con il caso di un fluido, che segue la nota legge di conservazione
(~r, t)
+ ~j(~r, t) = 0
t
dove (~r, t) e la densita del fluido e ~j(~r, t) = (~r, t)~v (~r, t) Nel nostro caso la densita di prob-
abilita si comporta esattamente come la densita di un fluido, e risponde alla stessa equazione:
siccome la soluzione di essa risulta univocamente determinata e la norma quadrata di una soluzione
dellequazione di Schrodinger della teoria quantistica classica la rispetta, allora si ha automatica-
mente che, sia (~r, t) una funzione la cui norma quadrata genera la distribuzione associata alla
teoria Bohmica e (~r, t) una funzione donda tale che (~r, 0) = (~r, 0) allora le due funzioni de-
scrivono la stessa distribuzione di probabilita t > t0
2.5.1 Contestualita delle osservabili e non-localita nella Meccanica
Bohmica
Ladottare questa interpretazione presenta, come il Teorema di Kochen-Specker ci assicura, dei costi.
Per chiarire come la contestualita dei risultati di misura in un modello Bohmico si presenta, faremo
un esempio esplicitativo. Si consideri un neutrone, la cui funzione donda, per semplicita espositiva,
presenti una simmetria rispetto al piano formato dalla traiettoria classica della particella libera, che
chiameremo asse x e un altro asse, che chiameremo z. Sia lo spin ben determinato lungo la direzione
y (che insieme a x, z forma una terna ortonormale) e supponiamo vi sia un magnete di Stern-
Garlach orientato nella direzione z. Consideriamo prima linterpretazione ortodossa: il magnete si
configura come un processo di misura che fa collassare la funzione donda in due autostati con eguale
probabilita: e possibile discriminare fra i due stati osservando il punto di impatto della particella,
supponendo di avere posto uno schermo oltre il magnete. Supponendo che la disomogeneita del
campo magnetico sia crescente verso lalto ad un punto di impatto piu alto si associera lautovalore
positivo e analogamente ad un punto di impatto piu basso si associera lautovalore negativo : il
risultato della misura di spin e dunque determinato dalla traiettoria del neutrone. Consideriamo
ora lo stesso sistema dal punto di vista Bohmico: una prima considerazione da fare e che essendo
la velocita determinata dalla posizione e dalla funzione donda, vista la simmetria del problema e
immediato vedere come ad una particella con coordinata z = 0 corrispondera una velocita lungo
lo stesso asse nulla. In altre parole non e possibile che la particella attraversi il piano z = 0 .
Quindi se la particella, la cui posizione iniziale e distribuita con probabilita k(~r)k2 in ogni punto
dello spazio, parte con uno z positivo andra ad impattare nella parte alta e ad essa verra associato
lautovalore di z pari a +1 , e viceversa. Supponiamo ora che, lasciando tutto il resto invariato, si
inverta il verso in cui il magnete e posizionato. Ora, per la stessa posizione iniziale della particella, si
dovra attribuire, per essere in accordo con le predizioni dellinterpretazione ortodossa, spin inverso
rispetto alla direzione z. Questo e un chiaro esempio di come la proiezione di spin lungo lasse z
sia una variabile contestuale.
Chapter 3
e similmente per la funzione b . Cio significa che la misura della componente di spin sulla prima
particella non viene influenzata da quale direzione venga scelta per la seconda particella.
Osservazione:. Lesperimento di Aspect che confermo linvalidita di tale diseguaglianza contiene
una sottigliezza che vale la pena di precisare. Infatti si potrebbe supporre che la disposizione
dellapparato sperimentale possa influire sui risultati della misura: tuttavia Aspect allineo i due
magneti utilizzati per la misurazione in maniera quasi randomica durante il tempo di volo delle
due particelle, in modo che levento di decisione, per esempio, della direzione in cui misurare
la seconda particella fosse separato da un intervallo del genere spazio rispetto alleffettiva misura
sulla prima particella. In questo modo, la prima particella non ha alcun modo per conoscere la
direzione .
Ora, dalle seguenti supposizioni risulta quindi che, considerando linvarianza rotazionale del
23
sistema considerato (stato di singoletto) e i possibili valori di a, cioe a(, ) = 1 , si ha
Z
< a >= a(, )d() = 0
Z
< a2 >= a2 (, )d() = 1
dove evidente rappresenta linsieme dei possibili valori assunti dallinsieme di variabili nascoste
.
Con questi risultati, risulta banale calcolarsi il rispetto coefficiente di correlazione
< ab > < a >< b >
Z
, = = a(, )b(, )d()
a b
dove evidentemente in questo caso non indica un qualche operatore di spin ma lo scarto quadratico
della rispettiva variabile casuale. Ora, se noi adottiamo la seguente notazione semplificata
a(, ) = a , a(0 , ) = a0
max(|V+ |, |V |) = |, 0 , | + |0 , + 0 , 0 |
Questa e la cosidetta Diseguaglianza di Bell: la sua importanza deriva dal fatto che la Meccanica
Quantistica prevede, per lo stesso stato, un risultato che, per alcuni valori di , 0 , e 0 la viola in
maniera significativa. E quindi possibile discriminare sperimentalmente in una direzione o nellaltra.
Osservazione:. In effetti la Meccanica Quantistica offre per lo stesso stato la seguente previsione:
hs| (1 )2 si = cos( )
Dove |si e evidentemente lo stato di singoletto, e e da intendersi come langolo fra le due
rispettive direzioni. Dimostrare tale risultato risulta un esercizio semplicissimo di calcolo matriciale,
sebbene un po tedioso. Per semplicita, visto che il problema presenta uninvarianza rotazionale,
assumiamo che = 0, cioe che 1 = z e quindi cos() = cos() risulta essere semplicemente
la componente bz del vettore normalizzato che individua la direzione. Abbiamo dunque
1 1 0 0 1
( )(b + by y,2 + bz z,2 )
2 0 1 1 0 z,1 x x,2
1 0 0 1
0 1 1 0
Ora tuttavia efacile
vedere
come gli operatori x,2 , y,2 vista la loro rappresentazione matriciale
1 0
mandano , in stati a loro ortogonali pur mantenendo la parte H1 invariata. Inoltre,
0 1
loperatore z,1 al contrario opera gia sui propri autostati: il risultato e che bx (z,1 x,2 )s risulta
ortogonale a s, e analogamente per y . Utilizzando la linearita rispetto alladdizione del prodotto
scalare, si ha quindi che
1 1 0 0 1 1
0 0 1
hs| (z,1 )2 si = bx +
2 0 1 1 0 0 1 1 0
1
= bz (2) = bz
2
e da questo, per linvarianza rispetto rotazioni, segue il risultato generale.
Tale distribuzione e naturalmente frutto di finzione, poiche non e possibile associare una dis-
tribuzione di probabilita congiunta per due osservabili non compatibili. Vedremo come questo
risultera importante piu avanti, ma per ora stiamo al gioco. Se supponiamo che tale distribuzione
di probabilita abbia media e varianza, rispetto ad ognuna delle quattro direzioni, che riflettano
gli effetivi valori medi e scarti quadratici, allora evidentemente per , si ha che il coefficiente di
correlazione risulta pari a X
, = abpa,a0 ,b,b0
a,a0 ,b,b0
e similmente per gli altri coefficienti di correlazione. Ora se noi definiamo, come fatto in precedenza
X
V = , 0 , (, 0 + 0 , 0 ) = (ab a0 b) (ab0 a0 b0 )pa,a0 ,b,b0
a,a0 ,b,b0
Ora e sufficiente fare, analogamente alla derivazione di Bell, un paio di raccoglimenti, in particolare
(a a0 ) per il primo membro e (a + a0 ) per il secondo, ricordarsi che b, b0 = 1 e che
X
pa,a0 ,b,b0 = 1
a,a0 ,b,b0
e la diseguaglianza di Bell si ripresenta. E da notare che non si e fatta nessuna richiesta di localita:
non e stato necessario, grazie alla nostra finzione. La teoria potrebbe essere locale, o potrebbe non
esserlo: la semplice esistenza di una tale distribuzione di probabilita ci porta ad un sistema che
rispetta la diseguaglianza di Bell. Forse dunque non e la localita la proprieta che viene falsificata
quando il nostro sistema non rispetta la diseguaglianza?
3.3 Derivazione di Suppes-Zanotti
La derivazione dovuta a P. Suppes e M. Zanotti risulta forse quella piu generale dal punto di vista
probabilistico. Tuttavia, prima di affrontarla, e necessario dimostrare un utile teorema, dovuto a
loro.
Lemma: 3.3.1. Siano x, y, z tre variabili casuali con possibili valori pari a 1 , e siano dati i
loro coefficienti di correlazione (x, y), (y, z), (x, z) . Condizione necessaria allorche esista una
distribuzione congiunta p(x, y, z) e la seguente
(a, b, c) = p(x = a, y = b, z = c)
Ora si puo osservare ogni elemento delle somme a sinistra appaia una volta con segno positivo e
due con segno negativo, fatta leccezione di (+, +, +) e (, , ) che appaiono sempre con segno
positivo. Quindi
(x, y) + (y, z) + (x, z) = 4 ((+, +, +) + (, , )) 1
dove evidentemente si e utilizzata la supposizione che sommatoria su tutte le otto le possibilita
risulti uguale a 1 . Ora, la probabilita di ogni singolo evento e di certo 0 , e quindi anche la
somma (+, +, +) + (, , ) e banalmente positiva. Ora, se si calcola la somma 1 + (x, y) si avra
che essa e pari a 2 ((+, +, +) + (, , )) piu altri termini tutti positivi, in quanto quelli negativi
vengono cancellati esprimendo 1 come la somma delle probabilita legate ai singoli eventi. Potendo
fare lo stesso discorso anche per (x, z), (y, z) ne deduciamo banalmente che
2 ((+, +, +) + (, , )) 1 + (x, y)
2 ((+, +, +) + (, , )) 1 + (y, z) 4 ((+, +, +) + (, , )) 2 + 2 min ((x, y), (y, z), (x, z))
2 ((+, +, +) + (, , )) 1 + (x, z)
La diseguaglianza inferiore puo essere sostituita, sempre applicando il lemma, con una diseguaglianza
analoga ma dove i termini (a, b), (a0 , b) appaiono con segno scambiato. Si ottiene cosi la dis-
eguaglianza
((a, b) (a0 , b)) ((a, b0 ) + (a0 , b0 )) 2
Similmente, applicando il lemma invece alle terne (a, b, b0 ), (a0 , b, b0 ) si puo ottenere
E immediato vedere come si e assunto che, per un determinato valore di , sia stato possibile de-
terminare simultaneamente a e a0 . Ora, si potrebbe pensare che i quattro coefficienti di correlazione
possano essere determinati sperimentalmente attraverso quattro serie di esperimenti indipendenti:
infatti ci si aspetta che, per un numero n di misure sufficientemente grande, si abbia
n
1X
, = ai b i
n i=1
E quindi
n
1X
, 0 , (, 0 + 0 , 0 ) = ai bi a0i bi (ai b0i + a0i b0i )
n i=1
Tuttavia, una tale espressione risulta essere estremamente ambigua. Infatti si e calcolata una
somma utilizzando un indice comune per quattro serie di esperimenti indipendenti. I due termini
a1 b1 e a1 b01 , per esempio, sono risultati sperimentali in cui i due a1 , che noi abbiamo erroneamente
indicato con lo stesso simbolo, potrebbero essere differenti. Ci si puo tuttavia chiedere se sia
possibile riordinare i risultati sperimentali in modo da eliminare questa ambiguita: la risposta a
tale domanda e che, sebbene esistano insiemi in cui un tale riordinamento e possibile e dunque si
puo ottenere la diseguaglianza di Bell, la percentuale di tali insiemi risulta essere negligibile.
Per vedere cio, risulta utile descrivere il processo di ordinamento in maniera esplicita. Supponendo
di avere 4 serie di misure rispetto alle direzioni (, ), (, 0 ), (0 , ), (0 , 0 ), si procede come segue
(a) In ogni serie, si pongano gli elementi con il risultato della misura a positivo in cima, e si
ordinino similmente le due parti ottenute rispetto al risultato di b.
(b) Supponendo che, per n sufficientemente grande, si abbia
n n
1X 1X
ai (, ) = ai (, 0 )
n i=1 n i=1
allora i valori di a della prima e della seconda serie sono concordanti, cosi come quelli della
terza e della quarta serie.
(c) Definiti i coefficienti mi come il numero di elementi della serie i-esima con valori a e b con-
cordanti e pari a 1. Si noti come i valori di b fra le due coppie di serie risultino concordanti,
dopo tale riordinamento, se e solo se
|m1 m2 | = |m3 m4 |
Ora lultima condizione implica la Diseguaglianza di Bell: e facile dimostrarlo se si suppone che,
considerando linvarianza rotazionale dello stato di singoletto, in ogni serie ci siano un numero di
valori positivi di a pari a p n2 e un numero di valori positivi di b pari a q n2 Allora i coefficiente
di correlazione statistici rispetto alla prima serie e, per esempio
Ora, considerando che i termini p, q sono supposti uguali per ogni serie, e considerando la condizione
posta sopra, si ha evidentemente che
|, , 0 | = |0 , 0 , 0 |
e quindi
|, , 0 | + |0 , + 0 , 0 | = |, , 0 | + |, + , 0 | 2
Tuttavia, e evidente come la maggior parte delle serie non risultino riordinabili: infatti supponendo,
per semplicita, n pari e p, q = n2 , si ha che il numero degli insiemi di risultati sperimentali non
riordinabili Nt ot e 8
1 n
Ntot = n
n! 2
Osservazione:. Il fattoriale di n appare nellequazione sopra poiche nel conteggio non distinguiamo
fra i vari riordinamenti di uno stesso insieme
La formula e giustificata dal fatto che, nel caso di insiemi riordinabili e sufficiente specificare
le prime quattro colonne (due per serie, una per i risultati di a e una per quelli di b ) mentre nel
caso in cui tale proprieta non venga richiesta si possono costruire indipendentemente tutte e otto
le colonne.