You are on page 1of 92

Applicazioni di meccanica quantistica: appunti per le lezioni

E. Bodo 21 novembre 2008

Indice
1 Istituzioni di meccanica quantistica 1.1 Stati, operatori e osservabili 1.1.1 1.1.2 1.1.3 1.1.4 1.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 5 6 6 7 8 8 9 10 10 11 12 13 15 15 16 18 21 22 25 26 27 28 29 32 35

Stati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Operatori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Autovalori, autovettori, autostati . . . . . . . . . . . . . . . . . . . . . . . . . . . Basi ortonormali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Postulati interpretativi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 1.2.2 1.2.3 1.2.4 1.2.5 Misure e valore medio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Riduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sovrapposizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Evoluzione temporale e costanti del moto . . . . . . . . . . . . . . . . . . . . . . Osservabili compatibili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.3

Rappresentazione matriciale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.1 Il cambio di base di rappresentazione . . . . . . . . . . . . . . . . . . . . . . . .

1.4 1.5 1.6 1.7 1.8 1.9

Sistemi a due stati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lo spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Momenti angolari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sistemi a due particelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Funzione donda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Simmetria in meccanica quantistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.10 Lequazione di Schrdinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.10.1 Autofunzioni ed energie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.11 Principio e metodo variazionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.11.1 Principio variazionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.11.2 Metodo variazionale lineare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.12 Energie e strutture molecolari: problema elettronico (ab-initio) e problema nucleare (dinamica) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.13 La dinamica delle molecole: lapprossimazione di Born-Oppenheimer, la vibrazione e rotazione delle molecole biatomiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

INDICE 1.13.1 Lapprossimazione di Born-Oppenheimer . . . . . . . . . . . . . . . . . . . . . . 1.13.2 Il moto delle molecole biatomiche: rotazione e vibrazione . . . . . . . . . . . . . 1.13.3 Lapprossimazione armonica alle energie molecolari . . . . . . . . . . . . . . . . 1.13.4 LHamiltoniano ro-vibrazionale esatto: la rotazione molecolare e le barriere centrifughe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.14 Lottimizzazione delle geometrie molecolari usando lenergia elettronica (cenni). . . . . . 1.15 Teoria delle perturbazioni indipendente dal tempo . . . . . . . . . . . . . . . . . . . . . . 2 Energie elettroniche: Hartree Fock 2.1 2.2 2.3 Introduzione di una base atomica nel caso closed-shell: le equazioni di Roothaan. . . . . . Un-restricted Harteee-Fock . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I Basis Set . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 2.3.2 2.3.3 2.3.4 Slater e Gaussian type functions (GTO) . . . . . . . . . . . . . . . . . . . . . . . Classicazione dei set di base . . . . . . . . . . . . . . . . . . . . . . . . . . . . Basis set contratti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Basi comuni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Basi di Pople . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Basi correlation consistent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 3 Orbitali molecolari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2 35 37 39 40 41 42 45 49 53 54 54 56 57 58 58 58 60 64 65 66 66 68 69 71 72 73 75 75 76 76 77 78 79 79

Energie elettroniche: metodi post Hartee-Fock 3.1 3.2 Energia di correlazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Metodi Variazionali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 3.2.2 Determinanti eccitati e autofunzioni di S2 (Conguration State Functions, CSF) . . CI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Cenni matematici della procedura Full-CI . . . . . . . . . . . . . . . . . . . . . . 3.2.3 3.2.4 3.2.5 Singole e doppie CI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Come Full-CI risolve il problema della correlazione e il problema della dissociazione. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . MCSCF (CAS-SCF) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . CAS-SCF 3.2.6 3.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Il problema della size-consistency . . . . . . . . . . . . . . . . . . . . . . . . . .

Metodi non variazionali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 3.3.2 Metodi perturbativi MP2 e MP4 . . . . . . . . . . . . . . . . . . . . . . . . . . . I metodi Coupled Cluster (cenni) . . . . . . . . . . . . . . . . . . . . . . . . . . .

3.4

Simboli di termine, congurazioni elettroniche (atomi e molecole lineari) . . . . . . . . . 3.4.1 3.4.2 Accoppiare gli spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Accoppiamento dei momenti angolari orbitali . . . . . . . . . . . . . . . . . . . .

INDICE 4 Descrizione Born Oppenheimer delle molecole 4.1 Calcolo degli stati legati delle curve Born Oppenheimer . . . . . . . . . . . . . . . . . . . 4.1.1 4.1.2 4.1.3

3 81 81

Il metodo di integrazione di Numerov per le equazioni differenziali al secondo ordine 82 Condizioni al contorno e divergenza della funzione donda . . . . . . . . . . . . . Il metodo dello Shooting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 84 86 86 87 89 89 90

A Gli spazi di Hilbert A.1 Spazi metrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.2 Spazi vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.3 Spazio duale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.3.1 Basi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B Il programma LEVEL

INDICE

Lo scopo di questo corso (4 CFU, 40 ore) quello di fornire agli studenti unintroduzione di alcuni concetti di base della chimica quantistica computazionale utilizzando anche esercitazioni pratiche. Si intende presentare agli studenti un quadro il pi generale possibile di alcune applicazioni che esistono nella ricerca moderna sulle propriet nanoscopiche dei sistemi molecolari in fase gassosa. Lo scopo sar quello di discutere in dettaglio alcune tra le pi semplici metodologie di calcolo oggi impiegate per costruire dei modelli realistici descriventi il comportamento elementare dei processi chimici. La prima parte del corso riguarda lo studio delle propriet elettroniche delle molecole. Verr esaminato il metodo di Hartree-Fock per il calcolo delle energie molecolari e la questione della scelta del set di base. A queste lezioni verr afancata unesercitazione pratica in cui si utilizza il programma GAMESS. Verranno poi accennati i metodi di calcolo pi avanzati con particolare attenzione alla loro applicazione nei vari problemi di calcolo. Una seconda esercitazione pratica verr svolta utilizzando i metod post-HartreeFock per la costruzione di curve di energia potenziale molecolari. La seconda parte del corso riguarda invece il moto dei nuclei nel loro caso pi semplice (una molecola biatomica). Verr descritto uno dei possibili metodi di integrazione comunemente utilizzato per calcolare gli stati legati vibrazionali di una molecola biatomica. Una terza esercitazione verr utilizzata per il calcolo pratico degli stati legati di due molecole. Il materiale contenuto in questi appunti proviene in parte da diverse sorgenti: gli appunti di meccanica quantistica di Elio Fabri (docente allUniversit di Pisa), il libro Advanced quantum chemistry di A. Szabo e Meccanica quantistica moderna di J. J. Sakurai.

Capitolo 1

Istituzioni di meccanica quantistica


1.1
1.1.1

Stati, operatori e osservabili


Stati

La struttura matematica e concettuale della meccanica quantistica abbastanza semplice: occorre introdurre due concetti fondamentali, quello di stato di un sistema sico e quello di osservabile. Linsieme degli stati possibili di un sistema sico viene descritto in meccanica quantistica da uno spazio vettoriale sui complessi dotato di prodotto scalare. Lo spazio vettoriale pu essere a dimensione nita o innita. In molti casi sar sufciente considerare uno spazio con numero nito di dimensioni ed in questo caso esso si riduce al familiare spazio Cn ( o anche Rn ). Quando invece necessario lavorare con uninnit numerabile di dimensioni, si richiede una struttura topologica e lo spazio diviene uno spazio di Hilbert. Indipendentemente dalle dimensioni, lo spazio verr sempre indicato con H . Ci premesso, il concetto di stato ha una precisa traduzione matematica: quella di raggio unitario dello spazio H . Il termine "raggio" designa un sottospazio (s.s.) unidimensionale di H (lequivalente di una retta passante per lorigine in R3 ), ossia linsieme dei vettori che differiscono tra loro solo per un moltiplicatore scalare (un numero complesso). Il termine "unitario" restringe linsieme ai vettori di norma 1 (che non formano quindi pi un s.s. lineare). Due vettori di uno stesso raggio unitario possono differire solo per un moltiplicatore scalare di modulo 1, ossia per un fattore di fase ei ( reale). Indicheremo uno stato per mezzo di uno dei vettori appartenenti al raggio unitario corrispondente. Occorrer per non dimenticare mai larbitrariet del fattore di fase. Qui adotteremo il pi possibile, per vettori, operatori, e per altri enti che incontreremo, la notazione di Dirac, che differisce da quella in uso in matematica. E apparentemente pi pesante, ma presenta sostanziali vantaggi per lapplicazione sica. Il generico elemento di H (un vettore anche non unitario) sar indicato con un ket, ossia con la scrittura: |. . . ove al posto dei ". . . " scriveremo qualsiasi simbolo o insieme di simboli che risulti conveniente per individuare il vettore. Per esempio, gli stati legati di un atomo didrogeno potranno essere descritti da |n, l , m ; uno stato di polarizzazione di un fotone potr essere indicato con |+ , etc. E noto che ad ogni spazio vettoriale si pu associare il suo duale (vedi appendice A a pagina 86). Per uno spazio dotato di prodotto scalare, c un anti-isomorsmo naturale fra lo spazio e il suo duale, che fa corrispondere a un vettore u il funzionale prodotto scalare (u, v) (qui siamo temporaneamente tornati allusuale notazione matematica). E importante tener presente che il prodotto scalare (u, v) lineare in v, ma antilineare in u: se u = ax + by, vale (u, v) = a (x, v) + b (y, v)). Per ricordare questo, Dirac adotta per gli elementi del duale la notazione bra: u| il vettore duale di 5 |u

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

Coerentemente, il prodotto scalare fra u| e |v indicato con u|v . In particolare importante il prodotto v|v che per un vettore unitario (o normalizzato ) v|v = |v|2 = 1.

1.1.2

Operatori

Il concetto di osservabile sica si traduce in quello di operatore lineare autoaggiunto (a.a.) su H . Se H nito, invece di a.a. basta dire hermitiano. Gli operatori e le corrispondenti osservabili verranno di solito indicati con lettere latine maiuscole: pertanto lazione di un operatore su un vettore potr essere scritta come M |m, n, l Se A un operatore, si chiama elemento di matrice e fra i vettori u e v lespressione u|A|v . Si dice che A loperatore aggiunto di A se: v|A |u = u|A|v (1.1) La denizione di operatore a.a. o hermitiano ovvia ed la seguente1 : A a.a. se A = A, ossia se v|A|u = u|A|v . Gli operatori che rappresentano osservabili siche sono operatori lineari ed a.a. Se lo spazio vettoriale degli stati possibili nito, loperatore pu essere rappresentato come una matrice di numeri complessi e, in particolare, un operatore hermitiano verr rappresentato da una matrice che ha numeri complessi nel triangolo superiore, i loro complessi coniugati nel triangolo inferiore e reali sulla diagonale. Se la matrice fosse reale sarebbe invece semplicemente simmetrica. Il prodotto di due operatori AB rappresenta leffetto combinato di agire con B su un vettore e quindi agire con A sul vettore risultante. Leffetto di BA su uno stato arbitrario non sempre uguale a AB: in questo caso si dice che gli operatori A e B non commutano. La differenza AB BA detta commutatore e si scrive in maniera compatta [A, B]. In pratica, la maggior parte delle informazioni che abbiamo sugli operatori viene proprio dallo studio dei loro commutatori.

1.1.3

Autovalori, autovettori, autostati

Richiamiamo la denizione di autovettore e autovalore di un operatore A: si dice che |a autovettore di A con autovalore a = 0 e a C se A |a = a |a (1.2) Si dimostra che gli autovalori di un operatore a.a. sono reali e che gli autovettori appartenenti ad autovalori diversi sono ortogonali.
Dimostrazione: Dato un operatore autoaggiunto A e due suoi autovalori a1 e a2 abbiamo A |1 A |2
1 In

= =

a1 |1 a2 |2 (1.3)

notazione matematica le denizioni date sono pi semplici da ricordare e da capire: il prodotto scalare (vedi appendice A a pagina 86) si scrive (u, v) e il prodotto nellordine inverso ne il complesso coniugato (u, v) = (v, u) . Questo nella notazione di Dirac sarebbe u|v = v|u . Laggiunto di un operatore A detto A e soddisfa la relazione u, v (u, Av) = (A u, v) che si pu anche scrivere come (u, Av) = (v, A u) che viene tradotta nella notazione di Dirac come u|A|v = v|A |u

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA


premoltiplicando la prima per 2| e la seconda per 1| otteniamo 2|A|1 1|A|2 = = a1 2|1 a2 1|2

(1.4)

sottraendo la coniugata della seconda dalla prima si ottiene 2|A|1 1|A|2

= 0 = (a1 a 2 ) 2|1

(1.5)

se i due autovettori sono uguali allora a1 = a 2 che signica che i lautovalore reale. Se i due autovettori sono diversi allora risulta ncessariamente che 2|1 = 0 cio che siano ortogonali.

Linsieme degli autovalori di un operatore in generale viene detto spettro. Va osservato che se |a autovettore di A per lautovalore a, lo stesso vero per qualsiasi suo multiplo scalare: quindi ad ogni autovalore associato lintero sottospazio unidimensionale cos generato. E perci naturale parlare di autostato. Pu per accadere che gli autovettori associati a un dato autovalore formino un sottospazio di H di dimensione n > 1. In questo caso si dice che lautovalore degenere, con degenerazione n (o n volte degenere). Quindi ad autovettori distinti corrisponde uno stesso autovalore. In generale non detto che autovettori di questo tipo siano ortogonali (in eq. (1.5) davamo per scontato che non ci fosse degenerazione). E sempre possibile comunque derivare una serie di autovettori ortogonali da un insieme di autovettori degeneri.

1.1.4

Basi ortonormali

Si chiama base ortonormale di H un insieme (nito o numerabile) di vettori |k unitari e tra loro ortogonali, tale che ogni vettore |v di H sia esprimibile come combinazione lineare dei |k : v = ck |k
k

(1.6)

Ancora una volta, la (1.6) semplice solo se H nito ( una somma nita). Altrimenti si tratta di una serie, e luguaglianza va intesa nel senso di convergenza in norma (vedi lappendice A). Si ricordi che dalla (1.6) segue v|v = |ck |2 = 1 (1.7)
k

se |v unitario. Se H nito si dimostra che ogni op. hermitiano possiede una base ortonormale costituita dai suoi autovettori. Non detto che tale base sia unica, come dimostrato dal caso limite dellop. I (identit), per il quale ogni base va bene. Se e solo se gli autovalori sono tutti non degeneri, ossia se esistono tanti autovalori distinti quanta la dimensione di H , allora la base unica. Concludiamo questo argomento enunciando un problema: abbiamo visto che alcune osservabili hanno una base di autovettori. Se abbiamo due diverse osservabili, ciascuna avr la sua base di autovettori; ma possono essere la stessa? Sotto quali condizioni? La risposta sta nel seguente teorema: condizione nec. e suff. perch due oss. A, B abbiano una base comune di autovettori che esse commutino.
Dimostrazione: Se abbiamo due operatori che agiscono su s.s. di H differenti2 , questi ovviamente commutano e i loro autostati in comune sono dati dal prodotto diretto dei loro autostati. Se invece i due operatori agiscono sullo stesso spazio hanno una base di autovettori in comune solo se commutano: supponiamo di avere due operatori A e B che commutano e di conoscere gli autovettori |a del primo A |a = a |a dato che i due operatori commutano potremo scrivere AB |a = BA |a = Ba |a = aB |a
2 In

termini di coordinate si direbbe che i due operatori agiscono su coordinate differenti.

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

il che signica che il vettore B |a a sua volta unautofunzione di A con autovalore a e quindi deve essere proporzionale a |a . Questo implica che |a sia un autovettore di A che di B. Questo vero nellimplicita assunzione che a non fosse degenere, nel qual caso tutto quello che si pu dire che B |a una qualche combinazione degli autovettori |k del s.s. inviduato dallautovalore a:
s.s.(a)

B |a =

cak |k

1.2
1.2.1

Postulati interpretativi
Misure e valore medio

Sul sistema possibile eseguire misure del genere pi diverso. Poich una misura fornisce sempre un risultato (un numero reale), assumeremo che si tratti sempre della misura di una qualche osservabile e che tutte le osservabili possano essere sottoposte a misura. Un primo postulato interpretativo della meccanica quantistica asserisce: I possibili risultati della misura di unosservabile sono i suoi autovalori. Un secondo postulato il seguente: Se il sistema si trova nello stato |a , autostato dellosservabile A con autovalore a, la misura di A fornir con certezza il risultato a. In questo genere di trattazione trascuriamo del tutto lesistenza di errori di misura, ovvero assumiamo che possano essere ridotti piccoli a piacere. La questione non affatto banale nel caso di osservabili con autovalori continui, che almeno per ora non vogliamo prendere in esame. Che cosa accade se il sistema in uno stato che non autostato di A, ed eseguiamo una misura di A? Risponde un ulteriore postulato: Se il sistema si trova nello stato |x che non autostato di A, una misura di A pu fornire come risultato uno qualsiasi degli autovalori di A. Il risultato della misura intrinsecamente indeterminato, nel senso che se si ripete la misura pi volte sul sistema preparato sempre nello stesso stato, si ottengono in generale risultati diversi. E evidente che siamo di fronte al pi caratteristico postulato della meccanica quantistica: quello che afferma lindeterminismo intrinseco della teoria. Si tratta di un indeterminismo non derivante solo da insufciente informazione dello sperimentatore. Lasserzione dellultimo postulato precisata dal seguente (teorema del valor medio): Sia |k una base di autovettori di A, per gli autovalori ak . Sia poi |x = ck |k
k

(1.8)

lo sviluppo di |x nella base |k . Allora la misura di A sullo stato |x , ripetuta piu volte, fornir il valore ak con probabilita |ck |2 .

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

Non escluso che A abbia autovalori degeneri, ossia che alcuni degli ak coincidano. In tal caso la probabilita del risultato la somma dei corrispondenti |ck |2 . Si puo dare, come conseguenza di questi postulati, uninteressante interpretazione dellespressione x|A|x . Calcoliamo infatti x|A|x = ck x|A|k = ck ak x|k = |ck |2 ak
k k k

(1.9)

Otteniamo quindi che se si ripete la misura di A sullo stato |x , la media dei risultati vale x|A|x . Per questa ragione useremo sempre il nome valore medio di A sullo stato |x . Nota: Abbiamo scritto "sullo stato," e non "sul vettore," perch x|A|x rimane invariato se si moltiplica |x per un fattore di fase. E quindi determinato dallo stato.

1.2.2

Riduzione

Per esaurire la lista dei postulati interpretativi ne manca ancora uno, che risponde alla domanda: che cosa accade allo stato quando si esegue una misura? Nella sica classica un problema del genere non si pone, perch si da per scontato che unoperazione di misura non alteri apprezzabilmente lo stato del sistema; o meglio, che si possa organizzare la misura in modo da rendere tale alterazione piccola quanto si vuole. Il comportamento dei sistemi quantistici mostra per che questo non possibile: unoperazione di misura perturba necessariamente il sistema e ne altera lo stato. Ecco il postulato: Se si esegue sullo stato |x una misura dellosservabile A, che porta al risultato ak , immediatamente dopo la misura il sistema si trova nellautostato |k di A. Nota: Si deve dire "immediatamente dopo" perch in genere lo stato cambier nel tempo. In realt il postulato di riduzione, nella formulazione appena scritta, non sufcientemente generale, in quanto non dice che cosa accade quando un autovalore degenere. Infatti in tal caso lautostato di cui parla il postulato non unico. Occorre quindi precisarlo come segue: Se lautovalore ak degenere, lo stato dopo la misura la proiezione ortogonale normalizzata di |x nel s.s. appartenente ad ak . E importante un caso particolare: se |x autostato di A, non solo la misura fornisce con certezza il corrispondente autovalore, ma lo stato non viene inuenzato dalla misura.
Esempio: Consideriamo una f.d.o. di un atomo didrogeno data dalla seguente espressione = a[2 p0 + 2 p1 2 p1 ] + b[3 p0 3 p1 ] dove abbiamo indicato le funzioni degli orbitali idrogenoidi con la notazione nlm .

1. Se venisse misurato il valore del momento angolare L2 , essendo tutte funzioni di tipo p con l = 1 si otterrebbe
sicuramente lautovalore 2 h2 . La f.d.o infatti unautofunzione di L2 e quindi rimane inalterata dopo lazione delloperatore e quindi dopo la misura.

2. Se si misura Lz si potrebbero ottenere invece i valori 0 h, 1 h e 1 h con probabilit rispettivamente date da


|a|2 + |b|2 , |a|2 e |a|2 + |b|2 .

3. Dopo una misura di Lz , se fosse stato ottenuto il valore 1 h, la f.d.o sarebbe data da (rinormalizzando)
= che risulta ancora una autofunzione di L2 . 1 |a|2 + |b|2 (a 2 p1 b 3 p1 )

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

10

1.2.3

Sovrapposizione

La connessione tra gli stati sici di un sistema e i raggi unitari di uno spazio di Hilbert differenzia profondamente la meccanica quantistica dalla sica classica. Dati due stati |u , |v ha senso eseguire una loro combinazione lineare, con coefcienti complessi qualsiasi: |w = |u + |v (1.10)

Il nuovo stato |w diverso da ciascuno dei due di partenza, e si dice che ne sovrapposizione. Il concetto di sovrapposizione la novit della meccanica quantistica: non ha infatti alcun corrispettivo in sica classica. Per rendersene conto, consideriamo un caso particolare: quello in cui |u , |v sono autostati di una stessa oss. A, con autovalori diversi au e av . E allora facile vericare che |w non autostato di A, e che una misura di A potr fornire i due valori au , av con certe probabilit. In questo senso |w appare essere una specie di "miscela" dei due autostati. Si noti per che solo i valori au , av sono possibili risultati di una misura di A, e nessun altro: neppure un qualche valore intermedio fra i due. Lesistenza di una sovrapposizione si manifesta solo col fatto che il risultato non piu certo, ma si distribuisce fra due possibili, con date probabilit. Ma pu anche accadere lopposto: che n |u n |v siano autostati di A, mentre |w lo . Pu dunque capitare che la misura non dia risultato certo n su |u n su |v , mentre ci accade se si fa la misura sullo stato |w . Quindi una sovrapposizione non agisce sempre nel senso di accrescere lincertezza del risultato di una misura, e questo di nuovo esce da qualsiasi schema classico.

1.2.4

Evoluzione temporale e costanti del moto

Per concludere questo veloce sommario sugli elementi di base della meccanica quantistica, dobbiamo parlare del modo in cui evolve nel tempo lo stato di un sistema. Finora il tempo non intervenuto nel discorso; ora dovremo tener presente e che in generale lo stato di un sistema cambia nel tempo, e converr mostrare esplicitamente questo fatto, introducendo la variabile t fra i simboli che caratterizzano lo stato. Cos |t indicher un generico stato con la sua variazione nel tempo: potremo supporre, ad esempio, che esso sia stato preparato al tempo t0 come |t0 e poi lasciato evolvere indisturbato. La forma piu semplice per la legge di evoluzione temporale di uno stato lequazione di Schrdinger ih |t = H |t t (1.11)

che uneq. differenziale di primo ordine; quindi la soluzione sar determinata assegnando la condizione iniziale |t0 . A secondo membro compare loperatore a.a. H , lhamiltoniana del sistema. Come si vede, la conoscenza di H tutto ci che occorre per determinare levoluzione temporale. Si noti che la (1.11) omogenea nella funzione incognita |t : ci signica che una sovrapposizione si conserva nel tempo: se |t0 = |a, t0 + |b, t0 anche, per ogni t : |t = |a, t + |b, t (1.13) Una seconda propriet si trova facendo lipotesi che lo stato iniziale sia un autostato |E di H . Allora la (1.11) ha lintegrale iEt (1.14) |E , t = e h |E , 0 come si verica direttamente. La (1.14) mostra che un autostato di H rimane inalterato nel tempo: infatti il corrispondente vettore viene moltiplicato solo per un fattore di fase. Per questa ragione gli autostati di H si chiamano stati stazionari. Invece, uno stato che sia sovrapposizione di due (o pi) autostati di H con autovalori diversi cambia nel tempo perch il fattore di fase nella (1.14) diverso per i vari autovettori. Dato che H a.a., ed ha quindi una base di autovettori, ogni vettore pu essere sviluppato come combinazione lineare di autovettori di H : (1.15) |x, 0 = ck |Ek
k

(1.12)

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA e perci, usando la (1.14) per ciascun termine a secondo membro: |x, t = ck e
k
iEk t h

11

|Ek

(1.16)

che mostra come si risolve in generale leq. di Schrdinger se si conoscono gli stati stazionari. Conseguenza ovvia, ma importante in s, dellesistenza degli stati stazionari la seguente: il valor medio di qualsiasi osservabile su uno stato stazionario non cambia e nel tempo. Va da s che se lo stato non stazionario, le probabilit e i valori medi per una generica osservabile cambiano nel tempo. Ci si pu chiedere se non esistano particolari osservabili per cui questo non accade; pi esattamente, se vi siano osservabili tali che le probabilit (e quindi il valor medio) su qualunque stato non dipendono dal tempo. Tale osservabile si dice costante del moto. Si pu dimostrare che le costanti del moto sono tutte e sole le osservabili che commutano con H .
Problema: dato un sistema in uno stato non-stazionario descritto in generale da |x = C j ei
j
E jt h

|j

mostrare che il valore medio dellenergia non varia con il tempo, mentre quello di altre osservabili varia. Soluzione: Il valore medio dellenergia si scrive x | H |x = Ci ei
ij
Ei t h

i|H | j C j ei

E jt h

dal momento che i | j sono autostati di H e quindi i|H | j = i j E j abbiamo x | H |x = Ci ei


ij
Ei t h

i j E jC j ei

E jt h

= = CiC j i j E j ei(E j Ei ) h |C j |2 E j

ij

che non dipende dal tempo. Per altre osservabili avremmo invece x | A|x = Ci ei
ij
E jt h

i|A| j C j ei

E jt h

che non si pu ridurre perch, in generale, i|A| j = A j i j e quindi dipendente dal tempo. Le uniche osservabili per le quali il valor medio indipendente dal tempo su stati non stazionari, cio le cosidette costanti del moto sono quelle per cui x|A|x = A j i j cio quelle per le quali [A, H ] = 0.

1.2.5

Osservabili compatibili

I postulati interpretativi ci dicono che cosa aspettarsi quando si esegue la misura di unoss. In sica classica per possibile misurare insieme due o pi grandezze, ed perci naturale chiedersi come si presenta la situazione secondo la meccanica quantistica. Cominciamo col rispondere a una domanda connessa: dato uno stato |x e due oss. A, B, in quali casi la probabilit congiunta delle misure di A e di B non dipende dallordine? Si dimostra che condizione nec. e suff. perch la probabilit congiunta dei risultati delle misure di due oss. sia indipendente dal lordine, che le oss. commutino. Se questo accade, lordine in cui si eseguono le misure non conta; il che vuol dire che loperazione di misura delluna non inuenza la misura dellaltra (come accade sempre in sica classica). Si dice allora che le oss. sono compatibili. Dunque: due osservabili sono compatibili se e solo se commutano.

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

12

1.3

Rappresentazione matriciale

Come abbiamo visto nella sezione precedente (e nellappendice A), negli spazi di Hilbert a dimensione nita H cio nei familiari spazi vettoriali Rn o Cn , esistono basi complete di vettori ortonormali {|i }n i=1 con cui si possono esprimere tutti gli altri vettori di stato
n

|a = ai |i
i=1

(1.17)

Possiamo quindi descrivere il vettore di stato |a semplicemente facendo riferimento alle sue componenti ai nella base {|i }n i=1 . Le componenti ai sono numeri complessi (in generale) e sono dati dal prodotto scalare: ai = i|a . Le componenti sono in numero nito e possono essere arrangiate in un vettore colonna a1 a2 a= . . . aN

(1.18)

Il vettore a la rappresentazione dello stato astratto |a nella base nita dei vettori {|i }. Laggiunto di un vettore colonna un vettore riga del tipo
a = (a 1 , a2 , . . . aN )

(1.19)

che non altro che la rappresentazione del vettore astratto a|. Il prodotto scalare nello spazio Cn diventa quindi un prodotto righe per colonne cioe una somma di prodotti di componenti: a1 a2 a|b = a b = (a (1.20) = a i bi 1 , a2 , . . . aN ) . . . i aN Come abbiamo fatto precedentemente, possiamo denire un operatore A come un oggetto che agisce su un ket trasformandolo in un altro A |a = |b (1.21) Un operatore completamente denito se conosciamo il suo effetto sui vettori di base A |i = | j
j

j|A|i = | j Ai j
j

(1.22)

dove Ai j sono gli elementi della matrice A che detta rappresentazione matriciale delloperatore A nella base {|i }. I n questultimo passaggio abbiamo fatto uso del cosidetto teorema di completezza cio che

|i
i

i| = 1 .

Questultima relazione molto importante discende direttamente dal teorema di espansione: |a = ai |i


i

(1.23)

dove ai = i|a

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA


quindi possiamo riscrivere la relazione (1.23) come |a = |i ai = |i i|a =
i i

13

|i
i

i| |a

da cui si vede che lespressione in parentesi loperatore identita I: La scrittura |i i| non che il prodotto tensoriale di un vettore di H per uno del duale H , quindi un operatore su H : lo indicheremo con Pi . Per capirne il signicato, applichiamolo a un generico |u : Pi |u = (|i i|) |u = |i i|u Otteniamo un vettore parallelo a |i , ma moltiplicato per il coefciente i|u . Si tratta dunque della proiezione di |u su |i . Per questa ragione Pi prende il nome di proiettore associato al vettore |i .

E anche possibile ottenere la rappresentazione matriciale del prodotto di due operatori AB. i|AB| j = i|A|k k|B| j = Aik Bk j
k k

(1.24)

che rappresenta lespressione di un prodotto righe per colonne tra due matrici A B.

1.3.1

Il cambio di base di rappresentazione

Abbiamo visto che in uno spazio di Hilbert la scelta della base di rappresentazione non unica 3 . E importante conoscere il metodo per passare da una rappresentazione |i ad unaltra | . Entrambe le basi sono complete quindi possibile esprimere i ket di una nellaltra | = |i i| = Ui |i
i i

(1.25)

dove abbiamo denito la matrice di trasformazione U di elementi Ui . La trasformazione nella direzione opposta ci fornisce |i = | |i = Ui (1.26) | = (U ) i |

perch |i = i| e dove abbiamo usato gli della matrice aggiunta (cio trasposta coniugata) U . La matrice di trasformazione ha limportante propriet di essere unitaria4 UU = 1 infatti i suoi elementi (UU )i j = i| | j = (U)i (U ) j = i| j = i j

elementi Ui

(1.27)

(1.28)

sono non-nulli solo sulla diagonale dove valgono uno. Quindi due basi di rappresentazione diverse sono connesse da una matrice unitaria. In uno spazio a dimensione nita le due basi sono connesse da una rotazione dei loro vettori di base.
3 Questo banalmente vero se si pensa a due basi date dagli autovettori di operatori non commutanti, ma pu succedere anche quando i due operatori commutano: quando uno degli operatori possiede autovettori degeneri. Esiste per un teorema importante dellalgebra degli spazi vettoriali che ci assicura che ogni base in Rn , o in generale negli spazi a dimensione nita, ha lo stesso numero di elementi. 4 Le matrici unitarie sono denite come quelle matrici la cui inversa uguale allaggiunta

A1 = A in sica sono importanti perche possono essere usate per rappresentare le operazioni di rotazione in quanto essendo unitarie non alterano la lunghezza dei vettori su cui operano, ma solo la loro direzione. E altres vero che non tutte le matrici unitarie rappresentino rotazioni.

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

14

Dato un operatore O la cui rappresentazione sia O nella base |i e in quella | , la relazione tra O e si trova utilizzando il teorema di completezza = |O| = |i i|O| j
ij j| == Ui Oi j U j = U ij ij i

(O)i j (U) j

(1.29)

che in forma matriciale pu essere scritto come un prodotto righe per colonne delle tre matrici = U OU quindi anche le rappresentazioni di operatori sono legate da una trasformazione unitaria U. Limportanza dellesistenza di tale trasformazione sta nel fatto che, dato un operatore Hermitiano la cui rappresentazione nella base {|i } O non diagonale, sempre possibile trovare una base {| } in cui loperatore ha rappresentazione diagonale = , dove sono gli autovalori delloperatore O. In altre parole, cambiando base di rappresentazione, si vuole diagonalizzare la matrice O. Il problema della diagonalizzazione quindi equivalente a quello di trovare una matrice unitaria U che converte O nel modo seguente o11 o12 o1n 1 0 o21 o22 o2n 2 U . U = = (1.31) . . .. .. . . . . . . . . on1 on2 onn 0 n Esistono molti differenti algoritmi che permettono di trovare U. In genere non necessario conoscere tutti i dettagli dellalgoritmo, ma basta saperlo usare come una specie di scatola nera in cui entra O ed escono gli autovalori e U (quindi gli autovettori). Il procedimento per trovare gli autovalori di una matrice (cio di diagonalizzarla) corrisponde grossomodo alla trattazione seguente. Data la matrice O vogliamo trovare i numeri e tutti i diversi vettori colonna c per cui si ha Oc = c che pu essere riscritta come (O 1)c = 0 (1.33) dove 1 la matrice identit. Lultima equazione ammette soluzioni non banali solo se il determinante secolare nullo |O 1| = 0 (1.34) Questa condizione ci permette di trovare gli N autovalori (che sono le N radici dellequazione secolare che si ottiene dal determinante) che sostituiti uno per uno dentro leq. (1.32) ci permettono di trovare i vari autovettori c a meno di un fattore moltiplicativo che si trova imponendo la condizione di normalizzazione per uno degli autovettori. (1.35) c i c i = 1
i

(1.30)

= 1, . . . , n

(1.32)

In questo modo abbiamo risolto il problema trovando N soluzioni c . Se costruiamo una matrice U usando gli N autovettori c come colonne, possiamo scrivere c11 c12 c1N 1 0 c11 c12 c1N c21 c22 c2N c21 c22 c2N 2 = O . . . . . . .. .. .. . . . . . . . . . . . . . . . cN 1 cio OU = U Moltiplicando entrambi i membri di (1.36) per U

cN 2

cN

cN 1

cN 2

cNN

n (1.36)

si ottiene proprio la relazione voluta (1.37)

U OU = .

cio che possibile trovare una trasformazione unitaria con cui costruire una nuova base in cui loperatore diagonale.

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

15

1.4

Sistemi a due stati

I sistemi a due stati sono sistemi in cui lo spazio H ha solo due dimensioni. Ci sono numerose situazioni siche in cui uno spazio a due sole dimensioni signicativo: o perch si trascurano parte dei gradi di liberta del sistema (questo il caso degli stati di spin di un elettrone, o degli stati di polarizzazione di un fotone) o perch per ragioni energetiche altri stati sono esclusi dalle condizioni sperimentali. In un sistema a due stati una base di H formata da due soli vettori, che a seconda dei casi potremo indicare con |1 e |2 , oppure con |+ e | . Il vettore generico potr sempre essere scritto come |v = v1 |1 + v2 |2 con |v1 |2 + |v2 |2 = 1. Un fattore di fase sempre arbitrario e possiamo disporne in vario modo: ad es. scegliendo v1 sempre reale e 0. Si vede che restano liberi due soli parametri, e possiamo prendere v1 = cos , v2 = ei sin , [0, ] 2 Non solo la rappresentazione degli stati semplice, ma anche quella delle osservabili. Si vede infatti facilmente che esistono soltanto 4 operatori hermitiani (quindi autoaggiunti) linearmente indipendenti. E tradizionale prendere i seguenti: 1. lidentit I 2. loss. che ha autovalori 1 e -1 sulla base scelta: la chiameremo z ; 3. loss. x denita da x |1 = |2 e x |2 = |1 ; 4. loss. y denita da x |1 = i |2 e x |2 = i |1 ; Gli elementi di matrice delle osservabili x , y , z sono risp. 0 1 1 0 , 0 i i 0 , 1 0 0 1 (1.38)

Si pu vericare in pi modi che ciascuna delle (1.38) ha un autovalore 1 e un autovalore -15 . Le osservabili x , y , z si chiamano matrici di Pauli.

1.5

Lo spin

Consideriamo per cominciare un elettrone isolato. E noto che esso dotato di un momento angolare intrinseco, per il quale si usa il termine inglese spin. Questo spin un grado di libert interno della particella, che si aggiunge ai consueti gradi di libert che ne descrivono il moto nello spazio. Se ci disinteressiamo del moto dellelettrone, possiamo limitarci a studiare questo grado di libert interno, che intrinsecamente quantistico: non ha analogo classico e non pu essere descritto, neppure approssimativamente, con concetti classici ( perci sbagliato e fonte di sicuri errori pensare allelettrone come una minuscola "trottola").
5

0 1 0 i 1 0

1 0 i 0 0 1

= = =

2 1 = 0

= 1 = 1 = 1

2 (i)(i) = 2 1 = 0

(1 )(1 ) = 1 + 2 = 0

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

16

Il momento angolare di spin di un elettrone un vettore e lo indicheremo con s. Se ssiamo una direzione, che prendiamo come asse z, e misuriamo la componente sz di s, troviamo due soli valori: 1 . Per questa 2h ragione si dice che lelettrone ha spin 1/2. Pi esattamente, il sistema dello spin dellelettrone ha due soli stati possibili: si applicano perci tutte le considerazioni fatte nella sez. precedente. In particolare possiamo usare le matrici di Pauli, ponendo 1 s= h 2 (1.39)

Si noti che la (1.39) molto di pi che una semplice denizione, in quanto determina le relazioni algebriche fra la componenti del momento di spin; in particolare il commutatore [sx , sy ] = ih sz La (1.39) mostra che due diverse componenti dello spin non sono mai compatibili e non potranno quindi essere misurate insieme. Dato che un sistema di spin 1/2 formalmente identico al sistema delle polarizzazioni di un fotone, naturale parlare di polarizzazione anche per lo spin. Possiamo e quindi parlare di fasci di elettroni (o di atomi) variamente polarizzati, oppure non polarizzati. Ci sono per alcune differenze, non nel formalismo matematico, ma nellinterpretazione sica. In primo luogo, mentre la polarizzazione dei fotoni necessariamente trasversale (polarizzazione x e y per un fotone che viaggia lungo z) questa restrizione non c per lo spin elettronico: qualunque stato di spin autostato di una certa componente dello spin, il che pu essere espresso dicendo che lo spin polarizzato nella corrispondente direzione. In secondo luogo due stati ortogonali corrispondono ad autovalori opposti per es. della componente sz : sar quindi naturale indicarli con |+ e | . Parlando alla buona si dice spesso "spin in su" e "spin in gi" ma questo modo di dire scorretto: vediamo perch. Lespressione "spin su" fa pensare che il vettore di spin sia diretto ad es. nel verso positivo dellasse z. Allora le componenti sx e sy di s dovrebbero essere nulle, mentre questo non vero, per due ragioni: 1. Un autostato di sz non autostato di sx n di sy , come si vede ad esempio dalle matrici di Pauli: nella base |+ , | loss. sz diagonale, come giusto; ma sx e sy non sono affatto diagonali, anzi gli elementi diagonali sono nulli (vedi le matrici di Pauli). 2. Lultima osservazione mostra che espressioni come +|sx |+ ecc. sono nulle, ossia nullo il valor medio di sx e sy tanto sullo stato |+ quanto su | 6 , ma se si esegue una misura di queste osservabili 1 h non si trovera mai zero (che non fra gli autovalori) ma solo 2 .

1.6

Momenti angolari

Il momento angolare totale di un sistema isolato una costante del moto (vedi Sezione 1.9). Sia classicamente che quantisticamente, la conservazione del momento angolare una conseguenza dellisotropia dello spazio. Le componenti del momento angolare J = (Jx , Jy , Jz ) in meccanica quantistica obbediscono le seguenti regole di commutazione: [Ji , J j ] = i jk ih Jk [J2 , Ji ] = 0

2 + J 2 + J 2 . E quindi possibile individuare autofunzioni simultanee di J2 e di una sola comdove J2 = Jx y z ponente Ji alla volta. Come nel caso dello spin infatti componenti diverse del momento angolare sono incompatibili.

Si pu dimostrare che gli autovalori di J2 sono dati da h 2 j( j + 1) mentre quelli di una sua componente Jz sono nella forma mh . Valgono inoltre le seguenti condizioni:
6 Ad

esempio +|sx |+ = 1 0 0 1 1 0 1 0 = 1 0 0 1 =0

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

17

3 1. i soli possibili valori del numero quantico j sono gli interi e i semi-interi non negativi 0, 1 2 , 1, 2 , . . .

2. dato un j ssato i possibili valori per m sono i (2 j + 1) valori ( j, j + 1, . . . , j 1, j).

Per poter utilizzare le regole di commutazione nel trovare gli autovalori e, pi in generale, per usare i momenti angolari necessario indrodurre i due operatori scala: J = Jx iJy che hanno le seguenti regole di commutazione [J+ , J ] = 2 hJz , [Jz , J ] = h J e [J2 , J ] = 0

Si pu dimostrare che gli stati | j, m non sono autostati di J , ma che valgono le seguenti relazioni J+ | j, m J | j, m = = ( j m)( j + m + 1) | j, m + 1 ( j + m)( j m + 1) | j, m 1

I due operatori J2 e Jz in generale non formano un set completo di osservabili commutanti; sar infatti spesso necessario aggiungere a questi due operatori lhamiltoniano del sistema H con cui commutano. Per esempio nella trattazione dellatomo di idrogeno il momento angolare totale del sistema pu essere descritto tramite i due operatori momento angolare orbitale L2 e Lz (trascurando lo spin). Questi due operatori non determinano completamente lo stato dellelettrone perch i vari autostati |l , m descrivono solo il moto angolare. Gli autostati di un sistema saranno quindi identicati da l , m e da un indice addizionale che risulta determinante per stabilire, per esempio, lenergia degli stati. Nel caso dellatomo di idrogeno gli stati possibili sono indicati dalla terna |n, l , m . In meccanica quantistica esiste lanalogo del momento angolare orbitale L(Lx , Ly , Lz ) e il momento di spin di cui abbiamo gi trattato. Si pu quindi denire il momento angolare totale del sistema J(Jx , Jy , Jz ) = L + S che quello che effettivamente si conserva. Inoltre in sistemi a molte particelle i momenti angolari delle singole particelle devono combinarsi tra loro a dare delle risultanti totali. Per esempio nel caso di un atomo il momento angolare orbitale di tutti gli elettroni dato dalla somma vettoriale di tutti i momenti relativi ad ogni elettrone L = i li . Lo stesso vale per il momento di spin S = i si . Vediamo brevemente come si fa a comporre due momenti angolari. Dato un sistema con due momenti angolari L e S con autovalori e autostati identicati da |l , lz e |s, sz , esistono due possibilit per trattare la dinamica dei momenti angolari: 1. utilizzare autoket simultanei di L2 , S2 , Lz e Sz denotati da |ls; lz sz . I 4 operatori commutano e le equazioni agli autovalori sono L2 |ls; lz sz S2 |ls; lz sz Lz |ls; lz sz Sz |ls; lz sz = l (l + 1)h 2 |ls; lz sz = s(s + 1)h 2 |ls; lz sz = lz h |ls; lz sz = sz h |ls; lz sz

2. laltra possibilit quella di usare autoket simultanei di J2 , L2 , S2 e Jz dove J2 la somma vettoriale dei momenti angolari. Anche questi operatori commutano, infatti [J2 , L2 ] = 0 e [J2 , S2 ] = 0

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA Le equazioni agli autovalori per gli stati |ls; jm sono L2 |ls; jm S2 |ls; jm J |ls; jm Jz |ls; jm
2

18

= l (l + 1)h 2 |ls; jm = s(s + 1)h 2 |ls; jm = j( j + 1)h 2 |ls; jm = mh |ls; jm

E importante notare che se [J2 , Jz ] = 0 pur vero che [J2 , Lz ] = 0 e [J2 , Sz ] = 0. Non possibile aggiungere J2 allinsieme degli operatori della possibilit 1, mentre non si possono aggiungere Lz e Sz alla possibilit 2. Abbiamo due possibili insiemi di ket di base corrispondenti ai due insiemi massimali di osservabili compatibili. E possibile trasformare una base nellaltra utilizzando una trasformazione unitaria. Per esempio possiamo scrivere |ls; jm = |ls; lz sz ls; lz sz |ls; jm
lz sz

gli elementi della matrice di trasformazione ls; lz sz |ls; jm sono i coefcienti di Clebsh-Gordan. Questi coefcienti non sono nulli solo se m = lz + sz e |l s| j l + s

che sono condizioni ovvie se si considera un modello vettoriale di addizione dei momenti angolari. Alcune volte al posto dei coefcienti di C-G si usano quantit ad essi proporzionali detti simboli 3 j.

1.7

Sistemi a due particelle

I sistemi di due particelle hanno un posto importante nella discussione sui fondamenti della meccanica quantistica, almeno a partire dal famoso "paradosso di Einstein-Podolski-Rosen" di cui accenneremo in seguito. Dal punto di vista generale si tratta di denire stati e osservabili di un sistema sico composto di due particelle, per ciascuna delle quali, prese separatamente, stati e osservabili siano gi ben identicati. Per semplicare il discorso ci limiteremo agli stati di spin (o di polarizzazione). Cominciamo perci a riferirci, per concretezza, a un sistema formato da due elettroni. Per ciascuno dei due lo spazio degli stati bidimensionale: li indicheremo con H1 e H2 . Come si costruisce lo spazio degli stati del sistema complessivo? Prendiamo in ciascuno dei due spazi una base; per esempio quella degli autovettori di sz . Li indicheremo rispettivamente con |1+ , |1 e con, |2+ |2 . E allora chiaro che linsieme delle coppie ordinate |1+ |2+ , |1+ |2 , |1 |2+ , |1 |2 (1.40) forma una base per lo spazio H degli stati del sistema complessivo. Indicheremo questo scrivendo H = H1 H2 . In parole, H il prodotto tensoriale di H1 e H2 . Il prodotto tensoriale ha dimensione 4: per non si tratta di 2 + 2, ma di 2 2, come si vede ripetendo il ragionamento per spazi con un numero diverso di dimensioni. Conviene semplicare la notazione, indicando i vettori scritti in (1.40) come segue: |++ , |+ , |+ , | (1.41)

sottintendendo che il primo simbolo si riferisce sempre allelettrone 1, laltro allelettrone 2. I 4 vettori della (1.41) (appartenenti per denizione a H ) hanno uninterpretazione sica immediata: sono autovettori simultanei delle due oss. s1z e s2z . Si noti che in partenza queste due oss. sono denite (come operatori) risp. in H1 e in H2 , ma si estendono in modo ovvio a H , proprio attraverso la loro azione sui vettori (1.41). Loperatore s1z , per esempio, esprimibile nella base dei 4 stati (1.41) come prodotto tensoriale

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA s1z (1) I(2) e la matrice corrispondente nella base (1.41) pu essere sz = 1 z ) 2h 1 0 1 0 1 0 h (s1z )11 I (s1z )12 I 0 1 0 1 = (s1z )21 I (s1z )22 I 1 0 1 0 2 1 0 0 1 0 1

19 generata come (usiamo il fatto che 0 0 0 1

1 0 h = 2 0 0

0 1 0 0

0 0 1 0

Le osservabili del sistema composto non sono soltanto quelle dei due sistemi componenti, come s1z , s2z . Per esempio unosservabile in H la somma s1z + s2z e le altre analoghe; ma anche il prodotto s1z s2z e simili. In particolare, importante considerare lo spin totale S = s1 + s2 . Ci servir conoscere il comportamento di S sui 4 vettori della base (1.41); cominciamo con Sz = s1z + s2z . Dalla denizione di Sz facile ricavare che i (1.41) sono tutti autovettori di Sz risp. con gli autovalori 1, 0, 0, -1 (qui e in seguito esprimeremo gli spin in unit di h ). Per esempio prendiamo Sz |++ dove |++ = (1, 0, 0, 0): 1 1 1 0 0 0 0 0 0 0 0 0 Sz |++ = h 0 0 0 0 0 0 = h 0 0 0 0 0 1 Come si vede, gli autovalori 1 e -1 non sono degeneri, mentre lautovalore 0 due volte degenere. In realt tutto il sottospazio |w = |+ + |+ (1.42) appartiene a questo autovalore. Per capire che cosa ci signichi, proviamo ad applicare Sx = s1x + s2x a |w : otteniamo 1 Sx |w = ( + )(|++ + | ) (1.43) 2 Ci si arriva esprimendo Sx = s1x (1) I(2) + I(1) s2x (2), ricordando che in generale sx = 1 x e quindi 2h ottenendo (s1x )11 I (s1x )12 I (s1x )21 I (s1x )22 I = h 2 + 0 1 1 0 1 0 I11 s1x I21 s1x 0 1 0 1 I12 s1x I22 s1x 1 0 1 0 1 0 0 1 0 1 1 0 0 1 1 0 0 1 = h 1 + 2 0 0 1 0 1 1 0 1 0 0 1 0 1 0 1 1 0 1 0

che risulta nella matrice

0 1 Sx = h 1 0

0 1 1 0

Il vettore |w della (1.42) dato nella base (1.41) dalla quadrupla (0, , , 0)e quindi lazione di Sx su |w data da 0 1 1 0 0 + 1 0 0 1 0 h 1 0 0 1 = h 0 0 1 1 0 0 + Che appunto il risultato riportato espresso in (1.43). Adesso, data larbitrariet di |w , se in particolare scegliamo che + = 0, troviamo Sx (|+ |+ ) = 0

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA e allo stesso modo anche Sy (|+ |+ ) = 0 Dunque il vettore 1 |0 = (|+ |+ ) 2

20

(1.44)

autovettore simultaneo di Sx , Sy , Sz , tutti con autovalore 0 (il fattore 1/ 2 serve per normalizzare). E quindi ragionevole dire che lo stato |0 rappresenta uno stato di spin totale 0 del sistema di due elettroni. Procedendo in maniera analoga si dimostra che con i tre vettori |1, 1 = |++ 1 |1, 0 = (|+ + |+ ) 2 |1, 1 = | (1.45)

che sono per costruzione autovettori di Sz , con autovalori 1, 0, -1, si riesce a costruire, per sovrapposizione, autovettori di Sx e di Sy con gli stessi autovalori. Perci diciamo che essi rappresentano tre stati di spin totale 1. Poich lo stato di spin 0 unico, lo si chiama spesso stato di singoletto, mentre quelli di spin 1 si chiamano stati di tripletto. Un modo alternativo di procedere quello di esprimere loperatore S2 = 2 s2 1 + s2 + 2s1 s2 nella base (1.41) e di trovarne direttamente gli autovalori e autovettori.
Stati intrecciati o entangled Degli stati di due particelle nora introdotti, sono particolarmente interessanti 1 |0 = (|+ |+ ) e 2 1 |1, 0 = (|+ + |+ ) 2

Entrambi sono autostati di Sz per lautovalore 0, e hanno anche in comune di essere costruiti con combinazioni lineari dei due stati |+ e |+ . Ma la cosa interessante questa: mentre |+ e |+ sono autostati e di s1z (e anche di s2z ), |0 e |1, 0 non lo sono: se si esegue una misura di s1z sul sistema preparato nello stato di singoletto, si potr trovare tanto il risultato +1/2 quanto -1/2 (con la stessa probabilit). Per dimostrarlo, basta vedere che lazione di s1z trasforma |0 in |1, 0 e viceversa. Per esempio lazione di s1z = s1z (1) I (2) sul vettore |0 = (0, 1, 1, 0) data da 0 1 0 0 0 0 1 h 0 0 1 = h = |1, 0 0 1 2 0 0 1 0 1 2 1 0 0 0 0 1 0 Lo stesso vero per s2z , e uguale discorso si pu fare per il tripletto. Tra laltro, questo mostra che la misura di s1z o di s2z non basta a distinguere singoletto da tripletto. Applicando il postulato della riduzione del pacchetto si vede che se si parte con |0 e si misura s1z , quando il risultato per es. +1/2 si cade nello stato |+ ; perci una successiva misura di s2z da con certezza il risultato -1/2. Viceversa: se si misura prima s2z tutto va in maniera simmetrica, e lo stato dopo la misura autostato anche di s1z . Quindi se si misura s1z non c bisogno di misurare s2z , perch il risultato prevedibile. Si vede dunque che le operazioni di misura di s1z e s2z sono intrecciate, nel senso che il risultato delluna determina il risultato dellaltra, sebbene in partenza nessuno dei due sia determinato. In un certo senso la cosa ovvia: lo stato di singoletto autostato di Sz , quindi il valore della somma di s1z e di s2z perfettamente noto. Nessuna meraviglia che se si conosce il valore e di una delle due oss. ne segua il valore dellaltra. Tuttavia questa situazione coesiste con liniziale indeterminazione di ciascuna delle due oss. Per questo motivo stati come |0 o |1, 0 vengono chiamati intrecciati (inglese entangled).
1 Consideriamo un sistema di due particelle a spin 2 in uno stato globale di singoletto che si muovono in direzioni opposte come in Figura 1.1. Losservatore in A misura s1z della particella 1 mentre losservatore in B misura s2z . Se A trova s1z positivo, allora pu predire con certezza, prima che B faccia una qualche misura, il risultato della misura di B: s2z negativo. Se A non fa alcuna misura, B ha una probabilit del 50% di trovare s2z positivo o negativo.

La situazione per pu complicarsi considerando le altre componenti dello spin. Se consideriamo la direzione x come asse di quantizzazione avremmo che il singoletto sar descritto da una funzione analoga alla (1.44): 1 |0 = |0 = (|x+, x |x, x+ ) 2 (1.46)

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

21

Figura 1.1: Misure di spin in uno stato di singoletto


Supponiamo che losservatore A possa adesso scegliere quale componente dello spin misurare, mentre B possa misurare solo s2x della particella 2. Se A determina s1z > 0, B, chiaramente avr il 50% di probabili di misurare s2x positivo o negativo. Anche se s2z determinato, non lo s2x . Se, invece, A misura s1x , allora la misura di B sar determinata. Se A decide di non fare misure, B avr il 50% di probabili di misurare s2x positivo o negativo. Queste considerazioni mostrano che i risultati delle misure di B dipendono da cosa A ha deciso di fare. Questo succede anche se A e B sono a distanze macroscopiche e senza possibilit di comunicare. Tutto va come se la particella 2 sappia quale componente di spin della particella 1 stata misurata. Al di l dei problemi epistemiologici che questo tipo di fenomeni hanno portato, mi preme di assicurare una cosa: nonostante queste peculiarit non si possono utilizzare queste misure per trasmettere informazioni utili tra due punti separati dello spazio a velocit superluminali. Supponiamo che A e B si mettano daccordo di misurare la componente sz . Pur senza chiedere nulla ad A, B sa cosa A ha misurato, ciononostante B osserva solamente una sequenza di valori positivi o negativi casuali e nessuna informazione utile. Anche se A cambiasse il suo apparato in modo da misurare sx , B otterrebbe risultati completamente scorrelati da quello che fa A.

1.8

Funzione donda

La denizione formale di funzione donda la proiezione nello spazio delle coordinate dello stato a cui essa si riferisce. Cio la f.d.o data dal prodotto scalare dello stato per un autobra delloperatore della posizione x . Loperatore della posizione un operatore ad autovalori continui e quindi prima di procedere alla denizione della funzione donda dobbiamo trattare brevemente gli autovalori a spettro continuo. Abbiamo no ad ora considerato operatori con uno spettro discreto di autovalori e quindi un numero discreto (nito per lo pi) di autovettori. Ora generalizzeremo le relazioni trovate al caso di operatori con uno spettro continuo. Questa generalizzazione dal punto di vista matematico non semplice, n priva di problemi. Non c spazio qui per una trattazione dettagliata e ci limiteremo ad generalizzare senza andare troppo per il sottile le relazioni gi esaminate: sostituiremo il simbolo i j con la funzione di Dirac e le somme con gli integrali sulla variabile continua (che va a rappresentare lautovalore) i| j = i j x|x = (x x ) |x x| dx = 1 dx| x| |2 = 1 x|A|x = (x x )a

|i
i

i| = 1

|
i

i| |2 = 1

i|A| j = ai i j

Esempi di operatore a spettro continuo sono loperatore della posizione e dellimpulso. Per la posizione infatti abbiamo x |x = x |x se gli autovettori |x formano una base completa possiamo esprimere ogni ket come | = dx |x x|

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA il coefciente dello sviluppo x| viene come al solito interpretato in modo tale che | x| |2 dx

22

sia la probabilit di trovare la particella in un intorno dx di x. Nel formalismo di Dirac x| quello che nella meccanica ondulatoria di Schrdinger si chiama Funzione donda ed indicata con (x). Se prendiamo il prodotto scalare | infatti abbiamo | = dx |x x| =
dx (x) (x)

Possiamo reinterpretare anche lo sviluppo

|i
i

i| = |

dove |i sono gli autoket delloperatore A. Moltiplichiamo entrambi i membri per x| risulta x| = x|i i|
i

che sarebbe lusuale espansione della f.d.o (x) = ci ui (x)


i

dove le u (x) sono le autofunzioni delloperatore A. Come si vede da questi esempi facile passare dalla notazione di Dirac degli autostati a quella matriciale degli autovettori e a quella di Schrdinger delle autofunzioni.
Problema: determinare lespressione in termini della funzione donda dellelemento di matrice |A| nel caso che A sia una funzione delloperatore posizione. Soluzione: Lelemento di matrice pu essere riscritto utilizzando le identit dei ket |A| = dxdx |x x|A|x x | =
dxdx (x) x|A|x (x )

dove x|A|x la rappresentazione nelle coordinate delloperatore A. Se A = f (x ) abbiamo che [A, x] = 0e gli autovalori di A sono uguali ad una funzione degli autovalori di x : a = f (x). Cio in generale x| f (x )|x = f (x) (x x ) e quindi | f (x )| =
dx (x) f (x) (x)

1.9

Simmetria in meccanica quantistica

Data una famiglia di operatori U ( ), lineari, unitari (U U = 1) e differenziabili nel parametro , per i quali valga la condizione U (0) = I, allora loperatore X = ih U

=0

un operatore hermitiano. Se loperatore U ( ) descrive uninvarianza di una osservabile Q, allora X una costante del moto. Loperatore U ( ) viene scelto in modo tale da soddisfare la seguente relazioni di composizione U ( + ) |x = U ( )U ( ) |x

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA e quindi se diventa innitesimo U ( + d ) |x = U ( )U (d ) |x

23

Per ipotesi la famiglia U ( ) differenziabile e quindi possiamo scrivere (usiamo il fatto che U (d ) = U (0 + d ) = U (0) + U (0)d ) U ( ) I + U ( ) i d |x = U ( ) I Xd |x h =0

da cui si ha la seguente relazione operatoriale i U ( + d ) U ( ) = Xd U ( ) h i U ( ) = XU ( ) h che unequazione differenziale che ammette la soluzione formale:
X U ( ) = e h i

che a sua volta diventa

dove X prende il nome di operatore generatore della famiglia U ( ). Per esempio consideriamo la famiglia di operatori delle traslazioni U (Ta ) che traslano un ket di stato della distanza a: U (Ta ) |x = |x + a per ipotesi U (Ta ) differenziabile rispetto ad a e quindi per spostamenti innitesimi da otteniamo loperatore di uno spostamento innitesimo U (Tda ) = U (T0 ) + U (Ta ) a da = I + Dda
a=0

(1.47)

Adesso calcoliamo leffetto di U (Ta ) su una funzione donda (x) = x| . La funzione donda relativa allo stato traslato U (Ta ) | data da (x) = x|U (Ta ) = U (Ta )x| essendo ovviamente U (Ta ) |x = |x a , avremo (x) = x a| = (x a) e quindi leffetto di operare con loperatore delle traslazioni su una funzione donda quello di produrne una copia il cui valore in x + a uguale a quello di (x), o in termini matematici U (Ta ) (x) = (x a). Per uno spostamento innitesimo, usando la (1.47) avremo che U (Tdx ) (x) = (x dx) = (x) + D (x)dx inoltre la funzione donda traslata di dx sar anche data da (x dx) = (x) e quindi confrontando la (1.48) e la (1.49) otteniamo D= (x) x (x) dx x (1.49) (1.48)

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA Si pu quindi vedere che loperatore impulso dato da p = ih D = ih x

24

il generatore della famiglia degli operatori di traslazione (x x + a)


pa U (Ta ) = e h i

quindi la conservazione dellimpulso lineare una conseguenza della simmetria traslazionale o omogeneit dello spazio. Allo stesso modo si pu far vedere che loperatore hamiltoniano di un sistema il generatore dell operatore evoluzione temporale i Ht U (t ) = e h Inne il momento angolare totale di un sistema il generatore degli operatori rotazione attorno allasse n di un angolo i Jn R(n, ) = e h il che ci dice che la conservazione del momento angolare la conseguenza dellisotropia dello spazio. Abbiamo visto che tre propriet del nostro sistema sico (invarianza per traslazione, rotazione o spostamento temporale) si riettono nel fatto che impulso lineare totale, momento angolare totale e energia siano 3 costanti del moto in ogni sistema isolato. Matematicamente la struttura della meccanica quantistica riette questa situazione associando alle tre operazioni traslazione, rotazione ed evoluzione gli operatori hermitiani p, J e H . Esiste per in meccanica quantistica unaltra importante simmetria di cui tenere conto che una simmetria discreta (contrariamente a quanto visto prima); essa la parit o simmetria di inversione spaziale. Loperatore che inverte tutte le coordinate di un sistema unitario = 1 e opera sui ket in questo modo |x = |x . Essendo unitario si pu provare che anticommuta con x loperatore posizione. Questo dovrebbe essere ovvio nel momento in cui pensiamo che il valore di aspettazione di x (il valor medio della posizione della particella) dovr cambiare di segno quando lo stato viene invertito spazialmente | x | = |x | questo si verica solo se x = x e cio quando x = x . Altre propriet interessanti delloperatore sono che hermitiano con autovalori 1 e che 2 = I. Che succede quando applichiamo ad una funzione donda? (x) = x| | = x| = (x). il che piuttosto banale. Una cosa pi interessante succede alle funzioni donda che sono autofunzioni di cio che provengono da un autostato | autostato di : x| | = x| cio (x) = (x) (1.50) esistono quindi funzioni donda pari e dispari rispetto alla simmetria di inversione di tutte le coordinate. E ovvio che non tutte le funzioni donda soddifano la relazione (1.50). Per esempio unautofunzione delloperatore impulso (unonda piana) non autofunzione di (anche perch e p anticommutano), mentre lo sono le autofunzioni del momento angolare (si pu dimostrare che J2 e Jz commutano con e che le loro autofunzioni sono autofunzioni di con autovalore (1) j ). Cosa succede alle autofunzioni dellhamiltoniano? Supponiamo di avere un hamiltoniano tale che [H , ] = 0 e che |n sia un autoket di H non degenere e con autovalore En . Si pu vedere che |n anche un autoket della parit. Quindi quando troviamo un autostato dellhamiltoniana non degenere abbiamo anche un autostato della parit. Il problema nei sistemi sici reali che la degenerazione la regola pi che leccezione. Per esempio una particella libera ha come autostati dellenergia gli autostati dellimpulso, ma i due autostati | p e | p sono degeneri in energia e quindi gli autostati dellimpuslo non sono autostati della parit.

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

25

1.10

Lequazione di Schrdinger

In meccanica quantistica la struttura dellequazione di Schrdinger postulata, anche se esistono giusticazioni pi o meno complesse alla sua forma. Uno dei postulati della meccanica quantistica (anche se prima ne abbiamo dato una giusticazione in termini di simmetria) quello di assumere per loperatore associato al momento lineare la forma ih . Lequazione di Schrdinger per una particella soggetta allazione di un potenziale (x, t ) h 2 ih = 2 + V (x) (x, t ) t 2m Come abbiamo gi visto, se il potenziale non dipende esplicitamente da t si pu risolvere leq. di Schrdinger indipendente dal tempo in modo da ottenere quelli che si chiamano stati stazionari (la cui variazione nel tempo si riduce ad un fattore oscillante exp(iEt /h)). Uno stato stazionario quindi dato dallequazione agli autovalori h 2 2 + V (x) (x) = E (x) (1.51) 2m Questa equazione pu essere risolta in diversi modi: una soluzione analitica possibile solo in pochissimi casi tra i quali il pi importante certamente latomo di idrogeno che risulta il modello base con cui costruiamo anche le molecole. Molto pi comune risolvere (1.51) numericamente. Questi metodi numerici diventano sempre pi complicati allaumentare del numero di gradi di libert interni del sistema ed inoltre per sistemi molto complessi di solito possibile trovare solo lo stato fondamentale e solo con sforzi computationali notevoli. In questo corso noi ci occuperemo di un metodo numerico per risolvere (1.51) nel caso mono-dimensionale cioe in cui il vettore x si riduce ad una sola coordinata. Bench possano sembrare semplici, in realt i problemi monodimensionali con potenziali arbitrari sono molto importanti sia come base per capire le applicazioni di metodi analoghi a problemi multidimensionali, sia perch, non di rado, sono gi descrizioni accurate di alcuni sistemi sici reali: per esempio la dinamica dei nuclei di una molecola biatomica se trattata in approssimazione di Born-Oppenheimer un problema monodimensionale. Lequazione di Schrdinger monodimensionale per una funzione donda u(x) d 2 u(x) 2m + 2 [E V (x)]u(x) = 0 dx2 h dove V (x) un potenziale qualunque.

Figura 1.2: La quantit [E V (x)] divide lasse delle x in diversi segmenti separati dai punti in cui vale zero (che vengono detti Turning Point). Supponiamo che quella quantit si annulli due volte in un intorno di un minimo

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

26

del potenziale: otterremo tre regioni come indicato in Figura 1.2. La prima e la terza regione cio quelle per valori x < T P 1 e x > T P 2 sono regioni in cui [E V (x)] < 0 cio in cui il potenziale maggiore dellenergia totale ovvero lenergia cinetica negativa. Queste sono regioni a cui una particella classica non pu accedere. In meccanica quantistica invece la funzione donda penetra leggermente allinterno di queste regioni a seconda di quanto rapido lincremento dellenergia potenziale7 . In generale la funzione donda ha un andamento esponenziale decrescente al loro interno. Inoltre allinterno delle regioni classicamente proibite, la funzione donda ha sempre concavit rivolta verso lalto e non pu avere nodi.

1.10.1

Autofunzioni ed energie

Linsieme degli autovalori di un operatore detto spettro. La quasi totalit degli operatori Hamiltoniani che si incontrano in meccanica quantistica ha una parte dello spettro composta da autovalori discreti ad energia negativa ed una parte da autovalori continui di energia positiva. Per esempio se prendiamo lHamiltoniano dellatomo di idrogeno (che gi conoscete) sappiamo che esso ha un numero innito di autovalori discreti ad energia negativa (negativa rispetto alla frammentazione protone+elettrone) le cui energie corrispondenti sono quantizzate e date dalla formula En = 1/2n2 (in unit atomiche e nel caso di un sistema di riferimento centrato nel protone). Queste ultime corrispondono ai livelli energetici degli stati legati dellatomo didrogeno e sono quantizzati cio anche se in numero innito sono autovalori discreti. Lo stesso Hamiltoniano per ammette un numero innito di autovalori ad energia positiva, energie che corrispondono ai possibili stati non legati di un elettrone e di un protone. Questi ultimi non sono discreti e rappresentano un continuo di valori. Come vedremo nellapprossimazione di Born-Oppenheimer possibile ridurre il moto vibrazionale di una molecola biatomica ad un problema monodimensionale. Una curva di energia potenziale e la struttura generale dello spettro per una molecola biatomica ha la forma riportata in Figura 1.3. Lequazione di

Figura 1.3: Potenziale intermolecolare tipico e autovalori dellHamiltoniano Schrdinger ha due tipi di soluzione a seconda del segno dellautovalore corrispondente: autofunzioni corrispondenti ad autovalori negativi (negativi rispetto allenergia della dissociazione A+B dove abbiamo posto lo zero dellenergia) che rappresentano gli stati legati del sistema molecolare quindi le vibrazioni e le rotazioni della molecola legata. Il numero di queste soluzioni di solito
7 Se lenergia potenziale diventa innita nei turning point, come nel caso della particella nella scatola, allora la funzione non penetra nelle regioni classicamente proibite, ma si annuller identicamente nei due turning point.

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

27

nito (solo nel caso di potenziali di tipo Coulombiano come nellatomo di idrogeno si hanno inniti stati legati) e gli autovalori sono discreti. autofunzioni corrispondenti ad autovalori ad energia positiva che rappresentano il moto dei due atomi non legati cio i processi di urto tra i due atomi (scattering states). Il numero di queste autofunzioni innito e non numerabile nel senso che gli autovalori rappresentano un insieme continuo di valori. In Figura 1.4 nel pannello di sinistra sono riportate alcune funzioni donda tipiche per stati legati legati di una molecola biatomica sovrapposti al potenziale. Allaumentare dellenergia (identicata approssimativamente dalla posizione della funzione sul potenziale) aumenta il numero di nodi perch le autofunzioni di un operatore Hermitiano sono ortogonali.

Figura 1.4: Stati legati e di scattering di una molecola biatomica Nella stessa gura, ma nel pannello di destra, sono invece disegnate tre autofunzioni del continuo o tre stati di scattering. Questi stati rappresentano i processi di urto tra gli atomi costituenti la molecola. Allaumentare dellenergia anchessi mostrano un pi elevato numero di oscillazioni. A lungo raggio per questi stati non sono nulli, ma diventano delle semplici onde di particella libera (combinazioni di funzioni seno e coseno). Quello che succede che la seconda condizione al contorno per r non la stessa degli stati legati e quindi gli stati non sono discreti. Un altra peculiarit che gli stati del continuo non sono evidentemente normalizzabili (lintegrale su tutto lasse x di sin x o cos x indenito). Gli autostati del continuo (cio ad energia positiva) non appartengono a L2 cio allo spazio delle funzioni che sono al quadrato integrabili. Trattare gli stati del continuo in generale pi complesso rispetto al caso degli stati legati. Lanalisi della struttura e delle propriet degli stati del continuo va sotto il nome di scattering theory e ricopre un ruolo di fondamentale importanza in chimica (anche se non viene mai affrontata nel piano di studi): basti pensare che una qualunque reazione chimica in fase gassosa bench avvenga tra due o pi stati legati (i due o pi reagenti) ha a che fare con il loro moto relativo che produce i prodotti che a loro volta si allontanano gli uni dagli altri. Nel caso pi semplice avremmo AB + B B2 + A dove siamo ovviamente interessati alla funzione donda del sistema ad energia positiva (cio allo stato di scattering tra AB e B), energia che semplicemente lenergia cinetica relativa tra AB e B.

1.11

Principio e metodo variazionale

Lequazione di Schrdinger time-independent unequazione agli autovalori H | = E | . (1.52)

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

28

Il metodo variazionale, basandosi sul principio variazionale, permette di trovare una soluzione approssimata a questa equazione. Questo metodo estremamente importante perch, a parte pochi e semplici casi, leq. di Schrdinger non pu essere risolta esattamente. Dalla teoria degli operatori nello spazio di Hilbert sappiamo che, essendo H un operatore Hermitiano, ammette uno spettro composto da inniti autovalori reali E a cui corrispondono innite autofunzioni ortonormali (che in genere non sappiamo trovare) e che indichiamo con | H | = E | = 0, 1, 2, . . . (1.53) Si pu assumere per semplicit che il set di autovalori {E } sia discreto. Il set di autofunzioni {| } e una base di rappresentazione completa dello spazio di Hilbert e quindi qualunque funzione di questo spazio si pu esprimere come combinazione lineare delle autofunzioni: | = c | = | |

(1.54)

1.11.1

Principio variazionale

Il teorema variazionale recita: con cui si cerca di approssimare lo stato fondadata una funzione donda normalizzata | mentale di un sistema, il valore medio dellenergia calcolato su questa funzione un limite superiore allenergia dello stato fondamentale vero |H | E0 La dimostrazione molto semplice: usando leq. (1.54), possiamo scrivere: | = | | 1=

= |
2

= | | = | | | =

(1.55)

dove abbiamo fatto uso del fatto che le autofunzioni di H sono ortonormali. Il valore medio dellenergia pu essere scritto usando lo stesso procedimento come |H | = | |H |

= E | |

(1.56)

Ora, essendo E E0 per denizione, otteniamo: |H | = E |


2

E0 |

= E0

(1.57)

dove abbiamo usato (1.55) per lultima uguaglianza che dimostra il teorema. Il teorema ci dice una cosa molto importante: il valore medio dellenergia di una funzione donda approssimata e sempre troppo alta ed quindi possibile misurare la qualit di una funzione usando la sua energia: pi bassa lenergia, migliore sar la funzione approssimata. Questo alla base del metodo variazionale in cui una funzione approssimata (funzione di prova) che dipende da alcuni parametri viene ottimizzata variando tali parametri in modo che il valore medio di H sia il minimo possibile.

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

29

1.11.2

Metodo variazionale lineare

Data una funzione di prova dipendente da alcuni parametri il valore medio dellenergia di tale funzione |H | dipende anchesso dagli stessi parametri. Se la funzione di prova contiene solo parametri lineari il problema di ottimizzare questi parametri si riduce ad una diagonalizzazione di una opportuna matrice. Se prendiamo, infatti, un set composto da un numero nito (N ) di funzioni di base ssate {| }, si puo esprimere la funzione di prova come combinazione lineare di queste funzioni
N

= ci |i |
i=1

(1.58)

e si puo ridurre il problema di trovare un set di coefcienti ci ottimali ad una diagonalizzazione di matrice. A questo punto bisogna precisare qualcosa sulle funzioni di base utilizzate: abbiamo due diversi casi a seconda se le funzioni {| } siano o meno ortonormali (assumiamo siano reali per comodit). Il caso con funzioni ortonormali ovviamente matematicamente pi semplice. La rappresentazione matriciale di H sulla base scelta una matrice H reale simmetrica (H hermitiano) N N con elementi H ji = Hi j = i |H | j (1.59) Il valore medio di H dato da |H | = ci c j i H | j = ci c j Hi j
ij ij

(1.60)

ed una funzione dei coefcienti dellespansione. Il nostro problema consiste nel trovare i migliori {ci } cio quelli che rendono minima lenergia (1.60) (rendono minima sta per rendono pi vicina possibile allenergia vera). Il problema si riduce quindi a quella che si chiama una minimizzazione vincolata (o problema di Lagrange) perch la minimizzazione dellenergia deve comunque avvenire mantenendo inalterata la condizione (il vincolo) che la funzione di prova sia normalizzata. Il vincolo in termini matematici | = ci c j i | j = |ci |2 = 1 (1.61)
ij i

Per poter minimizzare una funzione vincolata si ricorre al metodo dei Moltiplicatori di Lagrange, cio si costruisce una funzione Langragiana (che contiene il moltiplicatore di Lagrange E che moltiplica il vincolo in forma implicita): L (c1 , . . . , cn , E ) = = |H | E | 1 = (1.62) (1.63)

ci c j Hi j E |ci |2 1
ij i

|H | coincidono. Per trovare tale minimo imponiamo Il minimo della funzione Langragiana e quello di che la variazione L sia nulla per variazioni degli N coefcienti: L = c j Hk j + ci Hik 2Eck = 0 ck i j essendo H una matrice simmetrica possiamo scrivere: (1.64)

Hi j c j Eci = 0
j

i = 1, . . . , N

(1.65)

In notazione matriciale il primo il prodotto di una matrice con un vettore colonna e quindi si pu scrivere Hc =E c (1.66)

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

30

che un comune problema agli autovalori della matrice H. Essendo una matrice simmetrica H ammette N autovalori reali e N autovettori ortogonali. Quindi esplicitamentre si ha: Hc =E c dove (c ) c = c i ci = 1
i

= 0, 1, . . . N 1

Se si usano questi autovettori come colonne di una matrice C si pu generalizzare le relazione (1.65) a HC = CE dove si costruita la matrice diagonale E con elementi Ei j = i j Ei . Quindi abbiamo trovato N soluzioni (N serie differenti di coefcienti ci ) diverse che rappresentano altrettanti stati del sistema e che risultano ortonormali: | =

C j C j
ij

i | j = Ci C j i j = c i ci =
ij i

I vari Ei che appaiono sono approssimazioni alle energie dei vari stati del sistema. Il valore pi basso di Ei cio E0 la migliore approssimazione possibile allenergia dello stato fondamentale vero del sistema allinterno della base prescelta. Si pu dimostrare che i valori E1 , E2 ecc. sono una buona approssimazione degli stati eccitati del sistema. La condizione per gli stati eccitati tuttavia un po pi complessa, infatti se v e lenergia vera del primo stato eccitato la funzione vera dello stato fondamentale 0 di energia E0 v E1 , le due energie approssimate E0 ed E1 che corrispondono alle due funzioni variazionali 0 e 1 obbediscono alle seguenti condizioni E0 E1
v E0 v v v E1 0 (E1 E0 )

dove la prima condizione il teorema variazionale, e la seconda rappresenta la condizione pi debole valida per stati eccitati dove 0 = 1 | 0 |0 |2 . Perch anche la seconda sia valida necessario che la funzione di prova per lo stato fondamentale sia il pi simile possibile a quella vera. Bench il metodo possa apparire molto semplice, di fondamentale importanza perch su di esso si basano per esempio i calcoli CI (conguration interaction) che vedremo pi avanti e che possono essere considerati i metodi con cui si ottengono le migliori energie energie elettroniche molecolari.
Lo stesso risultato si ottiene in maniera molto semplice (quando si usa una base ortonormale) approssimando direttamente la funzione donda vera su una base nita di funzioni ottenuta dal troncamento di qualche set completo (per esempio):
N

| = Sostituendo questa espressione nelleq. (1.52) si ottiene

i=1

ci |i
= E |i
i

(1.67)

ci H |i
i

premoltiplicando a sinistra per j |

j H |i = E ci j i = Ec j
i

cio

H ji ci = Ec j
i

che esattamente uguale alleq. (1.65). Naturalmente, lequivalenza fra lequazione di autovalore per loperatore e quella per la sua matrice di rappresentazione in una base ortonormale di funzioni vale rigorosamente se e solo se queste funzioni costituiscono un insieme

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

31

completo, cio se la base descrive lintero spazio di Hilbert. Altrimenti chiaro che in generale non sar possibile esprimere qualsiasi funzione, ed in particolare le autofunzioni, come combinazione lineare delle funzioni di base. La completezza dellinsieme di base non per sempre realizzabile in pratica in quanto lo spazio ha spesso dimensione innita. Tuttavia, costruire e diagonalizzare la matrice appare una procedura ragionevole anche in un sottospazio nito per trovare delle autofunzioni approssimate, e viene usata comunemente.

Nel caso che si scelgano invece funzioni di base non ortonormali le cose si fanno pi complesse, ma il procedimento resta lo stesso. Deniamo la Langragiana come prima, ma teniamo conto delle funzioni non ortonormali L (c1 , . . . , cn , E ) = = |H | E | 1 = i | j 1 (1.68)

ci c j Hi j E ci c j
ij ij

dove i j = Si j sono gli elementi della matrice di sovrapposizione. La differenziazione dellespressione qui sopra ora leggermente pi complicata L ck che pu essere riscritta come L = c j Hk j Ec j Sk j + (ci Hik Eci Sik ) = ck i j Lunica che si annullino le quantit tra parentesi cio sia vericata la condizione seguente: (1.70) =

c j Hk j + ci Hik E c j Sk j + ci Sik
j i j i

(1.69)

Hi j c j = E Si j c j
j j

(1.71)

o in notazione matriciale Hc =E Sc (1.72) dove S la matrice di sovrapposizione. Questa essenzialmente una generalizzazione della relazione (1.66) dove avevamo S = I. Questa volta per il problema lineare decisamente pi complesso da risolvere e si dice problema agli autovalori generalizzato. Come vedremo il metodo di Hartree-Fock si basa proprio sulla soluzione di questo tipo di problema (la formulazione di Roothan usa infatti una base non ortogonale). La soluzione si ottiene in genere ortogonalizzando la base e riducendo il problema generalizzato ad un problema lineare tradizionale.

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

32

1.12

Energie e strutture molecolari: problema elettronico (ab-initio) e problema nucleare (dinamica)

Il problema terribilmente complesso del moto di M + N particlelle quantistiche, M nuclei e N elettroni, pu essere scomposto in due fasi grazie allapprossimazione di Born-Oppenheimer (BO). Il problema elettronico viene in genere risolto prima e fornisce quella che si chiama la PES (supercie di energia potenziale) che, secondo BO rappresenta il potenziale in cui si muovono i nuclei.

Figura 1.5: Come indicato schematicamente in Figura 1.5 tramite lapprossimazione di Bon Oppenheimer uno pu risolvere il problema elettronico senza prendere in considerazione i moti nucleari. In pratica si risolve il problema elettronico considerando i nuclei ssi e innitamente massivi. Si ottengono le energie degli stati elettronici (a volte solo lo stato fondamentale) e si spostano i nuclei. Continuando in questo modo si calcolano le energie degli stati elettronici come una funzione delle coordinate nucleari (le energie elettroniche non sono ovviamente funzioni analitiche, ma semplici insiemi di punti discreti). Queste funzioni punto-apunto forniscono, a meno di una costante arbitraria e previa una qualche forma di interpolazione/tting, le superci di energia potenziale (PES). La PES pu (nellambito di validit della Born-Oppenheimer) essere interpretata come il potenziale agente tra i nuclei. Una volta ottenuto questo potenziale possibile far muovere i nuclei sia classicamente sia quantomeccanicamente. Nel secondo caso non si va oltre i pochi atomi e sono veramente rari i casi in cui si raggiungano i 4 atomi. Nel caso si voglia calcolare solo lo stato fondamentale si possono usare metodi sosticati e raggiungere le poche decine di atomi. Se invece i nuclei vengono trattati classicamente come particelle puntiformi si pu arrivare a trattarne anche migliaia. In questultimo caso esistono due possibili approcci al sistema: 1. Calcolare lenergia elettronica con un metodo ab-initio e poi usare il potenziale risultante per muovere i nuclei: che il modo in cui funzionano i metodi di dinamica molecolare di tipo Car-Parrinello e similari (numero di atomi inferiore a cento). 2. Bypassare completamente il calcolo delle energie elettroniche assumendo un campo di forze pi o meno armonico tra i vari nuclei dato da costanti empiriche e ottimizzate su molecole pi semplici (MM2 per esempio): che sarebbero i metodi di meccanica molecolare classica dove il numero di atomi arriva anche ad alcune migliaia. Il metodo Hartree-Fock fornisce la pi semplice approssimazione variazionale alla funzione donda dello stato stazionario fondamentale che si possa costruire rigorosamente (ab-initio) dai principi teorici (cio

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

33

dallhamiltoniano elettronico non-relativistico esatto) senza intervento di parametri aggiustabili empiricamente. Esso corrisponde al minimo sviluppo della funzione donda dotato di senso sico: un singolo determinante o una combinazione lineare di pochi determinanti dettata dai requisiti di simmetria spaziale e di spin. Nonostante ci, oltre a costituire un modello sico di particolarmente facile interpretazione, esso fornisce risultati per alcuni aspetti soddisfacenti e perno di validit semiquantitativa. Ad esempio, lenergia totale HF rappresenta tipicamente oltre il 90% dellenergia totale vera (non-relativistica) di un sistema elettronico. Questo naturalmente riette il fatto che i termini di accoppiamento coulombiano nellhamiltoniano sono termini piccoli rispetto allenergia cinetica e a quella di attrazione verso i nuclei. Questo vero in particolare per gli elettroni di core, per i quali questi ultimi termini sono molto grandi visto che essi orbitano ad altissima velocit vicino ai nuclei, ed il cui moto in pratica trascurabilmente correlato a quello degli elettroni di valenza. Tuttavia, per la gran parte degli scopi di interesse chimico e spettroscopico, il modello HF insufciente e, al pi, solo qualitativo. Le osservabili di interesse pi comune sono infatti in generale differenze di energia fra stati elettronici diversi (spettroscopia) o fra diverse congurazioni nucleari di uno stesso stato (energetica delle reazioni chimiche). Queste differenze di energia, che originano essenzialmente da differenze nelle distribuzioni elettroniche degli elettroni di valenza, sono tipicamente proprio dello stesso ordine di grandezza degli errori nelle energie totali HF e spesso inferiori. Per alcune osservabili che coinvolgano signicativamente rotture o formazioni di legami chimici (un esempio evidente quello dei processi di dissociazione) il modello HF in generale gi a priori qualitativamente sbagliato. Cos pure, si verica spesso una fondamentale inadeguatezza della funzione donda HF per la riproduzione di osservabili diverse dallenergia. La differenza (teorica) fra lenergia esatta non-relativistica di un sistema elettronico e quella (esatta) HF viene denita energia di correlazione elettronica, e tutti i fenomeni e le alterazioni del valore di osservabili che possono essere riprodotti solo da funzioni donda pi accurate di quella HF vengono detti effetti di correlazione. Ecco qui di seguito una breve rassegna di metodologie che vengono comunemente utilizzate per calcolare le energie elettroniche 1. Hartree-Fock (HF): il metodo concettualmente pi semplice. In pratica la metodologia principale che abbiamo per costrire gli orbitali molecolari. Il metodo inoltre permette di calcolare rapidamente una buona apprissimazione allenergia di molecole fortemente legate la cui geometria non sia troppo diversa da quella di equilibrio. Il suo limite che non tiene conto della correlazione elettronica e quindi commette un errore sistematico sullenergia. Anticipiamo qui la denizione di un concetto molto importante nellambito dei calcoli ab-initio: lenergia di correlazione. Tale energia molto semplicemente denita come quello che manca ad un calcolo Hartree-Fock. Se confrontiamo i risultati ottenuti da HF con quelli esatti ottenuti da metodi migliori vediamo che manca sempre qualcosa di simile ad un 10% dellenergia. Questo ammontare detto energia di correlazione che deriva sicamente dallinterazione istantanea tra elettroni che il metodo di HF necessariamente non include perch un metodo basato sullapprossimazione di campo medio (cio non considera le posizioni istantanee relative degli elettroni). Esistono 3 tipi di HF: Restricted HF, Restricted Open-Shell HF, Unrestricted HF. La differenza sta nel modo in cui vengono accoppiati gli spin degli elettroni negli orbitali molecolari. Il primo tra i tre non pu trattare problemi di rottura omolitica di legami. Il costo computazionale di HF relativamente modesto e viene ormai prevalentemente usato quasi esclusivamente per generare orbitali molecolari che possono servire come partenza per metodologie pi complesse e accurate. Se necessario, comunque possibile usare HF per ottimizzare le geometrie delle molecole, ma sarebbe meglio usare metodi computazionalmente equivalenti, ma pi accurati come MP2 o DFT. 2. Density Functional Theory (DFT): una metodologia che si basa sul calcolo della densit elettronica della molecola. Il suo costo computazionale di poco superiore ad HF, ma pu raggiungere accuratezze molto maggiori grazie ad un approccio quasi semiempirico. Viene comunemente impiegata per il calcolo dellenergia in sistemi con molti elettroni come i solidi per esempio. Il suo

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

34

problema principale che il calcolo dellenergia di correlazione (cio la parte mancante ad un calcolo HF) empirica e si basa su formule pi o meno complicate che possono o meno funzionare su un dato sistema. Semplicando molto, tali formule vengono detti funzionali. Ne esistono diversi a seconda delle esigenze e, purtroppo, i risultati sono fortemente dipendenti dalla loro scelta. Alcuni tra i chimici teorici pi intransigenti considerano la DFT alla stregua di un metodo semiempirico. Parte del suo successo anche dovuto al fatto che viene usata per calcolare lenergia elettronica nei metodi di tipo Car-Parrinello dove il calcolo del moto classico dei nuclei accoppiato con un calcolo ab-initio di tipo DFT dellenergia elettronica. 3. Many Body Perturbation Theory (MBPT) o Mller Plesset Theory (MP2-MP4): questi due metodi non sono variazionali e potrebbero produrre energie pi basse di quelle esatte. Questi metodi, infatti, calcolano le energie elettroniche utilizzando la teoria delle perturbazioni al secondo e quarto ordine. Il costo di MP2, come vedremo, non di molto superiore ad un calcolo HF che viene comunque eseguito in quanto entrambi i metodi perturbativi necessitano di orbitali molecolari. MP2 include per gran parte della correlazione elettronica e si pu utilizzare per ottimizzare geometrie molecolari. MP4 invece risulta computazionalmente molto pesante, ma rappresenta uno dei metodi pi accurati in circolazione per il calcolo delle energie elettroniche degli stati fondamentali. 4. CI, Full-CI (Conguration Interaction): un metodo che in linea di principio permetterebbe di ottenere le energie elettroniche esatte dello stato fondamentale e di tutti gli stati eccitati. Purtroppo anche pressoch inutilizzabile dato lo sforzo computazionale richiesto. E stato usato solo in sistemi con pochissimi elettroni. Anche se concettualmente importante, nella pratica gli si preferiscono metodi come i seguenti. 5. DCI, SDCI, QCI e MRCI (Doubles-Conguration Interaction, Singles and Doubles CI, QuadraticCI e Multi Reference CI): sono diversi modi di semplicare un calcolo Full-CI. Possono essere molto accurati, ma sempre difcile giudicare la loro accuratezza. Vengono utilizzati per calcolare le energie elettroniche degli stati eccitati. 6. MCSCF e CASSCF (Multi Congurational Self Consisten Field, Complete Active Space Self Consisten Field): sono lequivalente di HF per situazioni in cui HF non pu funzionare. Sono metodi che servono a costruire orbitali molecolari (ma queata volta adatti anche a descrivere stati elettronici eccitati). Anche loro non includono la correlazione dinamica che deve essere aggiunta utilizzando calcoli di tipo perturbativo o SDCI. Per quello si sente spesso parlate di metodologie CAS-PT2 o CAS-MRCI. Questo ultimo tipo di calcoli molto complesso dal punto di vista teorico, difcile da fare e pesante computazionalmente, ma fornisce energie molto accurate. 7. CC (Coupled Cluster): una serie di metodologie la cui teoria molto complessa. Permette di raggiungere unaccuratezza molto alta, ma solo per lo stato fondamentale a scapito di una notevole pesantezza computazionale. Metodo delezione per lo studio dei legami deboli (dimeri molecolari, sistemi di Van der Waals). 8. Metodi semiempirici (Huckel): vengono utilizzati hamiltoniani modello con cui si costruiscono determinanti secolari in grado di fornire energie molecolari approssimate: sono metodi utili per la trattazione di molecole organiche con molti atomi. I vari metodi hanno accuratezze e campi di applicazione molto diversi che sono riportati qualitativamente in Figura 1.6.

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

35

Figura 1.6:

1.13

La dinamica delle molecole: lapprossimazione di Born-Oppenheimer, la vibrazione e rotazione delle molecole biatomiche
Lapprossimazione di Born-Oppenheimer

1.13.1

La massa degli elettroni molto pi piccola di quella dei nuclei. Le forze a cui sono sottoposti elettroni e nuclei sono invece dello stesso ordine di grandezza. Il moto dei nuclei, quindi, molto lento rispetto a quello elettronico. In chimica importante che sia possibile descrivere i moti nucleari disaccoppiandoli da quelli elettronici. Questo quello che fa lapprossimazione di Born-Oppenheimer. Qui ci limiteremo ad una molecola biatomica per evitare una notazione inutilmente complessa.

Figura 1.7: Coordinate utilizzate per descrivere lapprossimazione di Born-Oppenheimer Lequazione di Schrdinger indipendente dal tempo per una molecola biatomica composta da due nuclei di

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA massa MA e MB e da N elettroni : [TN + Te + V + Hmp ] (R, r) = Etot (R, r)

36

(1.73)

dove con R abbiamo indicato il vettore tra i due nuclei e con r le varie coordinate elettroniche rispetto ad un opportuno sistema di riferimento il cui centro nel centro di massa della molecola (vedi Figura 1.7). I vari termini dellHamiltoniano sono lenergia cinetica relativa dei nuclei e quella elettronica (in unit atomiche) TN = 1 2 2 R e
N 1 Te = 2 2 ri i=1

(1.74)

dove = MA MB /(MA + MB ) la massa ridotta tra i due nuclei. Il termine Hmp detto termine di polarizzazione di massa ed dovuto al fatto che in un sistema descritto dalle coordinate di gura Figura 1.7 loperatore di energia cinetica non una somma di laplaciani. Tale termine dato da Hmp = 1 2(MA + MB )
N i=1 2

ri

(1.75)

Il potenziale consiste nellenergia elettrostatica tra le particelle V =


N 1 ZA ZB ZB ZA + + R i< j ri j i=1 |ri RB | i=1 |ri RA | N

(1.76)

Adesso ssiamo i nuclei, otteniamo unequazione per gli elettroni che possiamo in linea di principio risolvere con uno dei metodi studiati predentemente e quindi trovarne autovalori e autofunzioni: (Te + V )q (R; r) = Eq (R)q (R; r) (1.77)

Lautovalore Eq (R) e la funzione donda elettronica q (R; r) dipendono parametricamente, per ogni stato elettronico q, dalla coordinata internucleare R. Se il set di funzioni elettroniche un set completo {q } e ortonormale, possiamo espandere (tale espansione detta adiabatica) la funzione donda totale come (R; r) = Fq (R)q (R; r)
q

(1.78)

dove i coefcienti di espansione Fq (R) sono coefcienti dipendenti da R. Li possiamo interpretare come funzioni donda che rappresentano il moto nucleare quando lo stato elettronico q. Sostituendo (1.78) nelleq. di Schrdinger (1.73) e moltiplicando a sinistra per s e integrando si ottiene

d r s (R; r)[TN + Te + V Etot ]Fq (R)q (R; r) = 0

(1.79)

che un set di equazioni integro-differenziali per i valori possibili di s = 1, 2, . . .. Queste equazioni sono accoppiate perch q non un autofunzione di TN . Lazione degli altri operatori invece quella delleq. (1.77). Quindi si ottiene

d r s (R; r)TN Fq (R)q (R; r) + [Es (R) Etot ]Fs (R) = 0

(1.80)

dove abbiamo usato la condizione s |q = qs e dove il secondo termine contenente energie disaccoppiato (compare solo lindice s), mentre il primo termine accoppiato. E importante notare che no ad ora non abbiamo utilizzato alcuna approssimazione. Fino ad ora il calcolo esatto. Vediamo qual la struttura del primo termine andando a calcolare lazione delloperatore TN sul prodotto di funzione (q Fq ). Entrambe le funzioni dipendono da R e quindi TN che una derivata seconda rispetto alle stesse coordinate dar 1 2 (1.81) Fq (2 TN (q Fq ) = R q ) + 2(R Fq R q ) + q (R Fq ) 2

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

37

da cui si vede come compaiano due termini daccoppiamento che coinvolgono il gradiente rispetto alle coordinate nucleari delle funzioni donda elettroniche. Lapprossimazione di Born-Oppenheimer consiste nel trascurare |R q | rispetto a |R Fq |. Questo fa s che le equazioni in (1.80) disaccoppino e diventino une serie di equazioni agli autovalori per il moto nucleare 1 2 + Es (R) Etot Fs (R) = 0 2 R (1.82)

dove se interpretiamo lautovalore delleq. donda elettronica (1.77) come un potenziale abbiamo unequazione del tutto analoga ad unequazione di Schrdinger8 . Il senso dellapprossimazione di BornOppenheimer quello di interpretare lenergia totale elettronica della molecola come il potenziale in cui si muovono i nuclei.

1.13.2

Il moto delle molecole biatomiche: rotazione e vibrazione

Lapprossimazione di Born Oppenhemier permette la separazione del moto elettronico da quello nucleare. In pratica abbiamo visto che possibile risolvere il problema elettronico a diverse geometrie nucleari e ottenere lenergia elettronica totale come funzione delle coordinate nucleari. Nel caso di una molecola biatomica si ottiene quindi una curva di energia che funzione della distanza tra i nuclei, mentre nel caso di molecole poliatomiche si ottiene una funzione a pi dimensioni. Lapprossimazione di Born Oppenheimer permette di considerare questa energia totale elettronica come il potenziale in cui si muovono i nuclei. Per questo motivo si parla di Curve di Energia Potenziale (PEC) o Superci di Energia Potenziale (PES). Per semplicit da ora in poi considereremo solemente il caso monodimensionale della curva di energia potenziale in quanto il caso multidimensionale rappresenta una notevole (e a volte insormontabile) complicazione formale e di calcolo. Il moto dei nuclei allinterno del potenziale generato dagli elettroni pu essere trattato in modo quantistico o classico. In questo corso ci limiteremo a sistemi molto semplici e quindi alla soluzione quantistica esatta, ma in problemi pi complessi la scelta della meccanica classica lunica ragionevole. Con buona approssimazione, a parte sistemi particolari, non si procede alla dinamica quantistica in sistemi con piu di 6-8 gradi di libert. Il nostro sistema costituito da due particelle A e B che interagiscono tramite un potenziale che dipende solamente dalla distanza tra le particelle e non dallorientazione della molecola nello spazio V (R) V (R). Lequazione di Schrdinger per il moto di due particelle rispetto al centro di massa data, in termini di una particella di massa ridotta , da:
8 Un

1 2 + V (R) (R) = E (R) 2


s|TN Fq |q + [Es (R) Etot ]Fs = 0

altro modo di vedere lapprossimazione di BO questo: consideriamo leq. (1.80) e riscriviamola in notazione compatta

esplicitando TN si ha 1 2

s|2 R |q Fq + 2 s|R |q R Fq

1 2 Fs + [Es (R) Etot ]Fs = 0 2 R

I termini nella sommatoria sono detti termini non-adiabatici di primo e secondo ordine. Lapprossimazione adiabatica si ottiene troncando la sommatoria e tenendo solo il primo termine non-adiabatico al secondo ordine (quello al primo ordine va a zero per s = q) 1 2
2 s|2 R |s + R Fs + [Es (R) Etot ]Fs = 0

Questultima equazione si pu scrivere in forma pi esplicita come 1 2 + Es (R) + Us (R) Etot Fs (R) = 0 2 R

dove il termine Us (R) detto correzione diagonale ed molto piccolo quando confrontato con Es (R). Lapprossimazione di BornOppenhemier si ottiene trascurando anche Us (R).

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

38

Nel caso di potenziali centrali la risoluzione dellequazione di Schrdinger semplicata e procede come per latomo di idrogeno separando la parte radiale della funzione donda da quella angolare. LHamiltoniano espresso in coordinate polari infatti diventa H = 1 2 1 + V (R) = 2 R 2 1 L2 R2 2 2 R R R R + V (R) (1.83)

dove L2 il solito operatore di momento angolare con autovalori l (l + 1) in unit atomiche. Come nella trattazione dellatomo di idrogeno possiamo fattorizzare la funzione donda (nel caso di potentiali centrali fattorizzare la funzione donda non unapprossimazione!) e scrivere (R) = Rl (R) Yl ,m ( , ) (1.84)

dove con Yl ,m ( , ) abbiamo indicato le armoniche sferiche che sappiamo essere soluzioni della parte angolare dellequazione. Sostituendo leq.(1.84) in (1.83) si ottiene lequazione per il moto radiale (la trattazione del tutto analoga a quella dellatomo di idrogeno) l (l + 1) 1 1 R2 + V (R) Rl (R) = E Rl (R). 2 R2 R R R2 (1.85)

Questa equazione descrive il moto radiale di qualunque sistema a due particelle che interagiscono tramite un potenziale centrale. Nel caso dellatomo di idrogeno il potenziale dato dallespressione V (R) = 1/R e la soluzione delleq. (1.85) analitica ed data, per gli stati legati, dai polinomi associati di Laguerre 2l +1 Ln +l (2r /n) moltiplicati per degli esponenziali decrescenti. Purtroppo nel caso di una molecola biatomica il potenziale non noto analiticamente e come vedremo lequazione radiale va risolta numericamente. Una forma comoda delleq. (1.85) si ottiene scrivendo ul (R) = r Rl (R) e quindi ottenendo 1 d2 l (l + 1) + + V (R) ul (R) = E ul (R). 2 dR2 2 R2 Abbiamo trasformato il problema del moto di due atomi nella risoluzione di unequazione mono-dimensionale con potenziale dato da l (l + 1) Ve f f (R) = + V (R) 2 R2 dove il termine l (l + 1)/2 R2 detto barriera centrifuga e rappresenta il contributo allenergia del momento angolare della molecola. In genere nelle molecole biatomiche il momento angolare l viene indicato con j e il potenziale quello fornito dalla soluzione dellequazione donda elettronica Es (R); quindi lequazione che ci permette di analizzare il moto degli atomi in una molecola biatomica semplicemente: j ( j + 1) 1 d2 + + (Es (R) Erif ) Es j us , j (R) = 0 2 dR2 2 R2 (1.86)

dove abbiamo indicato con Es j lautovalore dellenergia dellequazione nucleare, con j il momento angolare della molecola e con il numero quantico che identica lo stato energetico allinterno della buca di potenziale (lequivalente di n per latomo di idrogeno) e che vedremo sar il numero quantico vibrazionale. Abbiamo inoltre specicato esplicitamente che il potentiale V (r) = Es (R) Erif dato dallenergia di un particolare stato elettronico s calcolato a diverse geometrie usando un metodo ab-initio a meno di una costante che di solito il limite di dissociazione molecolare pi basso cio lenergia elettronica dei due atomi sparati Erif = Es (R ) = Es (A) + Es (B). Lenergia totale Es j della molecola dipender quindi dallo stato elettronico scelto s, dal numero quantico principale e dal momento angolare presente nel sistema j. In Figura 1.8 riportato uno schema per i primi due stati elettronici in una generica molecola biatomica senza eccitazione rotazionale cio con j = 0. Se i due o pi stati elettronici sono molto lontani in energia allora i singoli stati legati al loro interno possono considerarsi indipendenti e quindi possono essere trattati separatamente9 .
9 Nota

bene: gli stati legati che si trovano allinterno dello stato elettronico eccitato nella gura 4 (identicati da E (s = 2)) non

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

39

Figura 1.8: Schema dei livelli vibro-elettronici di una molecola biatomica

1.13.3

Lapprossimazione armonica alle energie molecolari

E possibile ottenere una stima dei valori di Es j usando lapprossimazione armonica. E infatti possibile espandere il potenziale di un determinato stato elettronico in serie di Taylor per distanze vicine alla geometria di equilibrio. Vicino al minimo la derivata prima nulla e il potenziale al secondo ordine dato dallapprossimazione armonica Es (R) Es (Req ) + 1 1 d 2 Es (R Req )2 = Es (Req ) + k(R Req )2 . 2 dR2 2

Allo stesso tempo si approssima lenergia rotazionale utilizzando il valore di equilibrio di R (esplicitando le unit atomiche): h h 2 2 j( j + 1) = B j( j + 1) Ej j( j + 1) = 2 2 Req 2I in modo che lenergia totale risulti una semplice somma (dove le costanti dipendono dallo stato elettronico s: perch dipende dalla forma della curva, B perche dipende da Req che diverso per stati elettronici diversi) 1 Es j = h s ( + ) + Bs j( j + 1). 2 In realt questa una descrizione piuttosto cruda delle energie molecolari e di solito si aggiungono dei termini correttivi per poter ttare i risultati spettroscopici delle transizioni tra i livelli ro-vibrazionali. Lespressione generale a cui si giunge con varie aggiunte la seguente Es, j, = h s + 1 1 s + 2 2
2

+ Bs j( j + 1) Ds j2 ( j + 1)2

(1.87)

dove s la costante di anarmonicit e D una costante che introduce la distorsione centrifuga.


sono veri stati legati, ma stati quasi-legati o metastabili in quanto sempre possibile che decadano nello stato fondamentale per emissione spontanea (rilassamento radiativo). Tutti quegli stati hanno un tempo di vita nito e per il principio di indeterminazione la loro energia afitta da unincertezza data dallinverso del loro tempo di vita E h / . Questa incertezza afigge tutti gli stati eccitati e come noto le probabilit di emissione spontanea sono proporzionali al cubo della frequenza della transizione e quindi i tempi di vita degli stati elettronici eccitati sono particolarmente brevi e le loro energie molto incerte (spettroscopicamente si parla di righe molto allargate perche non esiste una precisa condizione di risonanza non essendoci una precisa energia dello stato). Per esempio pressoch impossibile accorgersi dellincertezza dellenergia uno stato vibrazionale eccitato come E(s=1, v=1, j=0), mentre facile misurarla per uno stato come E(s=2, v=0, j=0).

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

40

1.13.4

LHamiltoniano ro-vibrazionale esatto: la rotazione molecolare e le barriere centrifughe

Lespressione (1.87) bench spieghi qualitativamente lorigine dei vari contributi allenergia molecola, non quantitativamente corretta sopratutto nel considerare le rotazioni. La cosa migliore trovare tutte le soluzioni del problema (??) integrando numericamente. Per prima cosa uno determina le auto-funzioni e le energie ponendo j = 0, quindi passa a j = 1, j = 2 e co via. I vari problemi a diverso valore di j vengono trattati indipendentemente perch j lunico momento angolare e quindi una costante del moto e quindi si conserva10 . Quello che succede al cambiare di j semplice da interpretare se si guarda la dipendenza del potentiale j( j + 1) Ve f f (R) = + Es (R) 2 R2 da j cio si analizza il problema delle barriere centrifughe. In Figura 1.9 ho riportato il comportamento di Ve f f per diversi valori di j per un potenziale generico. Quello che succede che allaumentare di j il

Figura 1.9: Comportamento di Ve f f per diversi valori di j. potenziale diventa sempre pi repulsivo e la buca viene sempre pi ridotta perch appaiono delle contributi detti barriere centrifughe generate dal termine positivo j( j + 1)/2 R2 . Come si vede chiaramente dalla Figura 1.9 il potenziale non avrebbe pi la possibilit di sistemare stati legati gi con j = 15 perche il minimo del potenziale si trova ad energie positive. Una trattazione esatta della rotazione e dei momenti angolari deve tenere conto del fatto che non piu possibile avere una molecola legata per certi valori di j. Le barriere sono dette centrifughe perch in una visione classica di un processo durto le traiettorie con energia positiva minore della barriera non possono avvicinarsi alla buca di potenziale perch in meccanica classica la penetrazione delle barriere proibita. Laumentare di j in genere provoca una diminuzione del numero di stati legati che la molecola supporta: in gura 6 infatti vediamo lo stesso potenziale di prima per due diversi valori di j, 0 e 10. Ho calcolato gli stati legati del sistema e mentre il potenziale per j = 0 supporta 3 stati legati ne ha solo uno per j = 10. Come detto prima per j = 15 la molecola dissocia. Ovviamente i valori di j che riescono a dissociare la molecola dipendono dalla forza del legame chimico e dalle masse in gioco: molecole fortemente legate hanno moltissimi stati legati e ci vogliono valori altissimi di j per dissociarle.
10 Ogni sistema invariante per rotazioni nello spazio cio ogni sistema isolato ha come costante del moto il momento angolare totale J. In una molecola biatomica isolata di tipo , j lunico momento angolare e quindi si conserva.

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA

41

Figura 1.10: Diminuzione degli stati legati vibrazionali allaumentare di j

1.14

Lottimizzazione delle geometrie molecolari usando lenergia elettronica (cenni).

Come si visto possibile calcolare una curva di energia potenziale per una determinata molecola. In questo modo risulta possibile per esempio determinare il minimo della curva di energia potenziale. Questo minimo identica anche una determinata geometria molecolare che detta geometria di minima energia o di equilibrio. Questa geometria quanto di pi vicino a quella che si potrebbe chiamare la geometria della molecola. In realt le molecole sono oggetti quantistici cio oggetti in cui i nuclei componenti sono delocalizzati e quindi descritti da funzioni donda. Ne consegue che non possibile sapere con precisione la posizione di un nucleo allinterno della molecola. Tuttavia, vero che nel caso in cui si stiano analizzando sistemi fortemente interagenti la posizione media dei nuclei, quando la molecola si trova nel suo stato fondamentale, identicher una geometria molto simile a quella minima. Bisogna per tenere conto che nel caso di legami pi deboli che la delocalizzazione nucleare molto pronunciata e non si riesce a stabilire una reale geometria molecolare (questo tanto pi vero quanto pi sono leggeri i nuclei come per esempio nel caso del legame idrogeno). Per sistemi fortemente legati la determinazione della geometria minima molto importante perch permette di fare confronti con dati di tipo cristallograco o spettroscopico (NMR) e quindi di determinare la bont o meno di un calcolo. Spesso non possibile ottenere dati sperimentali sulla posizione dei nuclei e il calcolo quantomeccanico della geometria di equilibrio lunico modo per ipotizzare una struttura. Se nel caso di una molecola biatomica possibile calcolare tutta la curva per poi localizzare il minimo, in sistemi con pi di due o tre atomi non certo possibile esplorare tutta la PES. Per trovare un minimo quindi si usa il gradiente dellenergia elettronica calcolata con un metodo ab-initio HF o Post-HF per farsi quidare verso il minimo. In un sistema a molti gradi di libert il numero dei minimi relativi aumenta in modo vertiginoso: con N atomi si possono avere 2N !eN minimi relativi! Uno dei problemi dei metodi di ottimizzazione che non si possono distinguere i minimi relativi da quello assoluto. Lunica strada possibile quella di calcolare tantissimi minimi e confrontarne le energie. Possiamo dire che lottimizzazione delle geometrie molecolari un problema complicatissimo e esistono moltissimi modi diversi di affrontarlo. Nellapprossimazione di B.O. lenergia di una molecola una funzione continua delle 3N coordinate nucleari E (X) con X = (X1 , X2 , . . . , X3N ). Nellintorno del punto X0 possibile espandere lenergia in serie di Taylor 1 E (X) = E (X0 ) + q f(X0 ) + q H(X0 )q + . . . 2 (1.88)

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA dove q = (X X0 ) fi = E (X) Xi e Hi j = 2 E (X) Xi X j

42

(1.89)

sono rispettivamente il gradiente e lHessiano dellenergia. Allo stesso modo anche il gradiente pu essere espanso in serie di Taylor f(X) = f(X0 ) + H(X0 )q (1.90) Se X0 un punto stazionario, una forma quadratica ottenuta dal troncamento di (1.88) dovrebbe essere sufciente a descrivere lenergia, infatti f (X0 ) = 0 e quindi abbiamo 1 E (X) = E (X0 ) + q H(X0 )q + . . . 2 (1.91)

Se vogliamo trovare lo spostamento q che da un punto qualsiasi ci porta verso un punto stazionario (nellapprossimazione che questo spostamento sia piccolo abbastanza da poter considerare la funzione energia data da una forma quadratica) imponiamo che tale spostamento debba portarci dal punto X verso il punto Xe in cui il gradiente nullo e quindi (usando unequazione analoga alla (1.90)) otteniamo lequazione che il punto di partenza dei metodi di minimizzazione: f(X) = H(X)q Se H non singolare questo spostamento dato da q = H1 (X)f(X) Dalla (1.91) si ottiene una stima dellenergia del punto Xe in cui ci porta lo spostamento q: 1 1 E (Xe ) = E (X) f(X)H1 (X)f(X) = E (X) q H1 (X)q 2 2 La valutazione delle derivate dellenergia piuttosto complessa e quindi non la trattiamo qui: esistono sostanzialmente due possibilit a seconda che si abbia o meno la possibilit di valutare analiticamente le derivate dellenergia rispetto alle coordinate nucleari. Per alcuni metodi ab-initio questo possibile con relativamente poco sforzo (per esempio HF o MP2), mentre per altri praticamente impossibile (metodi CI). (1.93) (1.92)

1.15

Teoria delle perturbazioni indipendente dal tempo


H k = Ek k (1.94)

Data unequazione di Schrdinger non risolubile esattamente, la teoria delle perturbazioni permette di trovare delle soluzioni approssimate sia per suoi autovalori Ek che per le sue autofunzioni k . La condizione necessaria per applicarla che esista un hamiltoniano pi semplice H (0) di cui si conoscano le autofunzioni e gli autovalori: H (0) k = Ek k
(0) (0) (0)

(1.95)

Si denisce perturbatore la differenza H H (0) = H (1) anche se si preferisce introdurre un parametro arbitrario 0 1 detto parametero di switch che misura lentit della perturbazione e quindi scrivere lhamiltoniano totale come H = H (0) + H (1) . (1.96) Per trovare le correzioni allenergia si espandono le funzioni k e gli autovalori Ek in serie di potenze di Ek ( ) = Ek + Ek + 2 Ek + . . . k ( ) = k + k + 2 k + . . .
(0) (1) (2) (0) (1) (2)

(1.97)

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA Sostituendo queste equazioni in (1.94) si ottiene

43

(H (0) + H (1) )(k + k + 2 k ) = (Ek + Ek + 2 Ek )(k + k + 2 k )(1.98) che da vita ad unequazione piuttosto complicata. H (0) k + H (0) k + 2 H (0) k + H (1) k + 2 H (1) k = = Ek k + Ek k + 2 Ek k + Ek k + 2 Ek k + 2 Ek k
(0) (0) (0) (1) (0) (2) (1) (0) (1) (1) (2) (0) (0) (1) (2) (0) (1)

(0)

(1)

(2)

(0)

(1)

(2)

(0)

(1)

(2)

(1.99)

Questultima si pu ridurre ad un set di equazioni equivalenti notando che i coefcienti delle stesse potenze di devono essere uguali. Uguagliando quindi i fattori di 0 = 1 abbiamo lequazione di partenza (0) (0) (0) H (0) k = Ek k ; eguagliando, invece quelli di otteniamo: H (0) k + H (1) k = Ek k + Ek k che pu essere riscritta e premoltiplicata per k | k |(H (0) Ek )|k
(0) (0) (1) (0) (1) (0) (0) (1) (1) (0)

(1.100)

= k |(H (1) + Ek )|k


(0) (0)

(0)

(1)

(0) (0)

(1.101)

Lhamiltoniano H (0) ovviamente Hermitiano e quindi k | H (0) = k | Ek e quindi (1.101) risulta k |(H (1) + Ek )|k
(0) (1) (0)

=0

che ci fornisce la regola per calcolare la correzione al primo ordine per lenergia Ek = k |H (1) |k
(1) (0) (0)

.
(0)

(1.102)

Con la stessa procedura si identicano i termini corrispondenti ad 2 , si premoltiplica per k | e si ottiene Ek = k |H (1) Ek |k
(1) (2) (0) (1) (1)

(1.103)

Per poter trovare la funzione donda al primo ordine k la si espande negli autostati di H (0) k = ai i
i (1) (1) (0)

(1.104)

e la si sostituisce nelleq. al primo ordine (1.100) ottenendo H (0) ai i + H (1) k


i (1) (0) (0)

= Ek

(0)

ai
i

(1)

i + Ek k
(0)

(0)

(1)

(0)

(H (0) Ek ) ai i
i

(0)

(1)

(0)

= (Ek H (1) )k .

(1)

(1.105)

Premoltiplichiamo per una qualunque delle j e integriamo per ottenere a j (E j Ek ) + j |H (1) |k


(1) (0) (0) (0) (0)

(0)

Ek jk = 0

(1)

(1.106)

Per j = k questa equazione si riduce al risultato (1.102), ma per j = k si ha aj = Possiamo riscrivere (1.104) k = ai i
i=k (1) (1) (0)

j |H (1) |k Ek E j
(0) (0)

(0)

(0)

k= j

i |H (1) |k Ek Ei
(0) (0)

(0)

(0)

(0)

(1.107)

i=k

CAPITOLO 1. ISTITUZIONI DI MECCANICA QUANTISTICA e inne trovare la correzione la secondo ordine sostituendo questultimo risultato in (1.103)
(2) (0)

44

Ek =

H (1) Ek |

(1)

i |H (1) |k Ek Ei
(0) (0) (0)

(0)

(0)

i
(0)

(0)

i=k

(0) (1) (0) k |H (1) Ek |i = (0) (0) Ek Ei i=k (0) (0) i |H (1) |k (0) (0) (0) (1) (0) = k |H (1) |i k |Ek |i (0) (0) Ek Ei i=k

i |H (1) |k

=
(0) (0) 2

i |H (1) |k

(0)

(0)

k |H (1) |i
(0)

(0)

(0)

i=k

Ek Ei

(0)

i |H (1) |k Ek Ei
(0)

i=k

(0)

(1.108)

Capitolo 2

Energie elettroniche: Hartree Fock


In questa sezione vedremo come funziona il metodo di HF. Questo metodo permette di calcolare in buona approssimazione lenergia elettronica Born-Oppenheimer (a nuclei ssi) di una molecola qualsiasi utilizzando lapprossimazione degli orbitali molecolari. Lapprossimazione di HF non solo importante in s, ma anche perche gli orbitali molecolari che si ottengono possono essere utilizzati come punto di partenza per calcoli molto pi complessi che includono gli effetti della correlazione elettronica. Questi ultimi sono spesso chiamati metodi post-HF. Il metodo di HF si basa sul metodo variazionale. In pratica si cerca di determinare i migliori spin-orbitali che generano un determinante di Slater capace di descrivere lo stato fondamentale elettronico di una molecola ad una ssata geometria nucleare. Il problema che come vedremo il metodo di HF pi complesso del semplice metodo variazionale lineare. LHamiltoniano elettronico privo delle energie cinetiche nucleari per una molecola con N nuclei e n elettroni e dato da: Hel = Te + V = 1 n 2 n i 2 i =1 i=1
N J =1

RJi

ZJ

ZJ ZI 1 1 + . 2 i, j ri j J,I RJI

(2.1)

La funzione donda di prova e data da un determinante di Slater costruito con spin-orbitali molecolari 1 = n! 1 (1) 2 (1) 1 (2) 2 (2) 1 (n) 2 (n) n (1) n (2) n (n)

|0

= A [1 (1)2 (2) n (n)] = A

(2.2)

dove con la notazione i (i) intendiamo i (ri , i ) li-esimo spin-orbitale molecolare popolato dalli-esimo elettrone e con A abbiamo indicato loperatore di antisimmetrizzazione dato dalla seguente somma di permutatori 1 n1 1 i j + P i jk . . . = A = (1) p P 1P n! p=0 n! ij i jk Lenergia che vogliamo minimizzare rispetto agli spin-orbitali data da: E = 0 | Hel |0 LHamiltoniano elettronico pu essere scritto in forma semplicata:
n 1 Hel = 2 2 i i=1 N J =1

(2.3)

RJi

ZJ

n 1 1 1 + cost = hi + gi j + cost 2 i, j ri j 2 i, j i=1

(2.4)

45

CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK

46

dove cost il termine o i termini di repulsione nucleare ( una costante e non ha importanza), i vari hi sono Hamiltoniani mono-elettronici e rappresentano lenergia di un singolo elettrone nel campo generato dai vari nuclei presenti nella molecola e gi j sono gli operatori bielettronici. Lenergia che vogliamo minimizzare quindi data data da: n 1 (2.5) E [0 ] = 0 hi + gi j |0 . 2 i, j i=1 In pratica vogliamo determinare il migliore set di spin-orbitali molecolari secondo la prescrizione del teorema variazionale. 1 Lenergia (2.5) pu essere riscritta in modo pi comodo tenendo conto dellespressione del determinante di Slater che si ottiene utilizzando loperatore di antisimmetrizzazione e le propriet : A A = n!A A H = H A (2.6) E = 0 | Hel |0 = A | Hel |A = n! | Hel |A = (1) p Hel |P
p

(2.7) (2.8)

Per il termine monoelettronico hi sopravvive solamente la permutazione nulla

(1) p
p

hi |P

= = = =

| hi | = 1 (1)2 (2) . . . n (n)|hi |1 (1)2 (2) . . . n (n) 1 (1)|1 (1) . . . i (i)|hi |i (i) . . . n (n)|n (n) i (i)|hi |i (i)

Per il termine bielettronico solo lidentit e il termine P i j danno un contributo non nullo:

(1) p
p

i j | = gi j | gi j P gi j |P

il primo contributo dato da gi j | = = = 1 (1)2 (2) . . . n (n)|gi j |1 (1)2 (2) . . . n (n) 1 (1)|1 (1) . . . i (i) j ( j)|gi j |i (i) j ( j) . . . n (n)|n (n) i (i) j ( j)|gi j |i (i) j ( j) = Ji j

mentre il secondo uguale, ma con lo scambio delle particelle: i j | gi j P = = = 1 (1)2 (2) . . . n (n)|gi j |1 (1)2 (2) . . . n (n) i j i (i) j ( j) . . . n (n)|n (n) 1 (1)|1 (1) . . . i (i) j ( j)|gi j |P i (i) j ( j)|gi j |i ( j) j (i) = Ki j

Lenergia da minimizzare quindi data dalle espressioni seguenti:


1 E importante notare che oltre a Born-Openheimer abbiamo introdotto una nuova approssimazione: lapprossimazione a singola particella cio abbiamo implicitamente assunto che la funzione donda totale elettronica 0 sia data da un prodotto di funzioni di singola particella (gli spin-orbitali molecolari) anche se opportunamente antisimmetrizzato (determinante di Slater).

CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK

47

E0 [i ] = = = =

i=1 n i=1 n i=1 n i=1

i |h|i + i |h|i + i |h|i + i |h|i +

1 ( i j|i j i j| ji ) 2 i, j 1 i j||i j 2 ij 1 (Ji j Ki j ) 2 ij 1 ( j |Ji | j j |Ki | j ) 2 ij

(2.9) (2.10) (2.11) (2.12)

dove gli operatori di Coulomb e di scambio sono deniti dalle loro operazioni sullorbitale j Ji j (2) = Ki j (2) = 1 i (1) j (2) r12 1 d x1 i (1) j (1) i (2) r12 d x1 i (1)

(2.13)

Mentre il primo operatore non altro che una moltiplicazione dellorbitale con unelemento di matrice, il secondo un operatore molto pi complesso che integra lorbitale su cui opera (operatore non locale). Ripetiamo ancora una volta per chiarezza gli integrali bielettronici e la notazione sica compatta corrispondente: i (1) j (2)| 1 |i (1) j (2) r12 = = i (1) j (2)| 1 | j (1)i (2) r12 =
i (1) j (2)

1 i (1) j (2)d x1 d x2 r12 |i (1) j (2)|2 d x1 d x2 = i j|i j r12 1 i (1) j (2) j (1)i (2)d x1 d x2 = i j| ji r12

(2.14)

Il primo detto integrale di Coulomb, il secondo integrale di scambio. Adesso dobbiamo trovare il minimo di questa espressione seguendo la variazione degli spinorbitali e quindi della funzione donda 0 = 0 + 0 . La Lagrangiana risultante (eq. (1.62)): L [i ] = E0 [i ] i j ( i | j i j )
i j n n

(2.15)

dove i j sono moltiplicatori di Lagrange. Variamo gli spin-orbitali di una quantit innitesema i i + i e imponiamo la condizione di stazionariet della Lagrangiana: E0 i j i | j = 0
ij

(2.16)

il primo termine risulta:


n

E0

i=1

( i |hi |i

+ i |hi | i )

1 ( j |Ji Ki | j + j |Ji Ki | j + 2 i, j (2.17)

+ i |J j K j |i + i |J j K j | i )

CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK

48

Il terzo e quinto termine sono uguali perch la somma estesa su tutti gli indici i, j e cos anche per il quarto e sesto. Riscriviamo lespressione semplicando il fattore 1/2:
n

E0

= =

i=1 n

( i |hi |i ( i |Fi |i

+ i |hi | i ) + ( i |J j K j |i + i |J j K j | i )
i, j

(2.18) (2.19)

+ i |Fi | i )

i=1

dove abbiamo denito loperatore di Fock Fi = hi + (J j K j )


j

che un operatore mono-elettronico (apparentemente! bisogna sempre ricordarsi della non localit di K ) che descrive lenergia cinectica dellelettrone, lattrazione di tutti i nuclei su esso, e la repulsione verso tutti gli altri elettroni. Da notare che loperatore di Fock associato ad una variazione dellenergia, ma non allenergia stessa, infatti H non la somma di operatori di Fock. La variazione della Lagrangiana diventata
n

L = ( i |Fi |i + i |Fi | i ) i j ( i | j + i | j = 0
i=1 ij

che, tenendo conto del fatto che | = | e che i |Fi | i = i |Fi |i , diventa
n i=1 ij n i=1 ij

L = i |Fi |i i j i | j + i |Fi | i i j i | j =
n i=1

i |Fi |i i j i | j + i |Fi |i i j i | j
ij i=1 ij

La variazione sia di | che di | deve rendere L = 0 e quindi sia i primi due termini che i secondi devono essere zero: prendendo la complessa coniugata dei due ultimi termini e sottraendoli ai primi due si ottiene ) i | j = 0 (i j ji
ij

il che signica che i moltiplicatori di Lagrange sono elementi di una matrice Hermitiana. Siamo arrivati ad una espressione matematica semplice della condizione che deve essere soddisfatta dagli spin-orbitali perche diano una energia minima. Questa condizione e uninsieme di equazioni accoppiate integrodifferenziali di Hartree-Fock:
n

F i (1) =

j=1

i j j (1)

i = 1, 2, 3, ...n

(2.20)

Malgrado nel membro di destra di (2.20) compaia una somma dei moltiplicatori di Lagrange sempre possibile fare in modo che compaia un singolo autovalore (spin-orbitali in forma canonica) e le equazioni di HF prendono la forma: F i (1) = i i (1) (2.21) dove le energie i possono essere considerate le energie dei vari spin-orbitali molecolari. Per esempio basta modicare gli spin-orbitali ottenuti dalle eq. (2.20) attraverso una trasformazione unitaria: i moltiplicatori di Lagrange che appaiono in (2.20) infatti sono elementi della matrice di Fock i |F | j = ki i |k = i j
k

che, essendo una matrice hermitiana, sempre possibile diagonalizzare con una trasformazione unitaria U: = U U.

CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK Esiste quindi un diverso set di spin-orbitali detti canonici che soddisfa le equazioni (2.21).

49

In generale ogni arbitraria trasformazione unitaria degli N orbitali ottenuti come soluzione delle equazioni di HF perfettamente equivalente nel senso che non altera il determinante e quindi la sua energia. Tuttavia in generale gli orbitali trasformati pur soddisfacendo le (2.20) non diagonalizzano loperatore di Fock. Le autofunzioni delloperatore di Fock (orbitali canonici) sono speciali e vengono distinte da qualunque altro insieme equivalente di orbitali. Occorre inoltre notare che un operatore di Fock, come ogni altro hamiltoniano, ha uno spettro di soluzioni completo (discreto se abbiamo elettroni legati ai nuclei). Le prime n soluzioni delleq. (2.21) sono gli spinorbitali occupati, mentre i rimanenti vengono comunemente detti orbitali virtuali. Questo signica che nel costruire F bisogna prendere quegli orbitali che compaiono nel determinante cio gli orbitali occupati. In relazione allosservazione fatta pi sopra dovrebbe essere chiaro che, durante la soluzione delle equazioni di HF, le uniche variazioni orbitaliche signicative (al ne di rendere stazionaria lenergia) sono quelle che modicano gli orbitali occupati attraverso lintroduzione di componenti dello spazio degli orbitali virtuali. Infatti una combinazione lineare di orbitali occupati non altera lenergia ed questultima non dipende dagli orbitali virtuali. Le energie degli orbitali possono essere espresse in termini degli integrali di Coulomb e di scambio i = = = i | f |i = i h + (J j K j )|i
j

i |h|i + ( i |J j |i i |K j |i )
j

i|h|i + i j | |i j
j

questa espressione leggermente diversa a seconda se lorbitale i sia o meno occupato. Se i occupato abbiamo
n

i = i|h|i + i j | |i j
j=i

(2.22)

perch ii||ii = 0. Un fatto molto importante che la somma degli autovalori di Fock degli orbitali occupati (2.22) non lenergia elettronica della molecola:
n i n i n i j, j=i

i = i|h|i +
n

i j | |i j

dove invece lenergia ottenuta minimizzando la Langragiana data dalleq. (2.9), cio da Eo = i|h|i +
i

1 i j | |i j . 2 ij

La ragione che la somma degli autovalori conta linterazione dellelettrone i con lelettrone j, ma anche quella dellelettrone j con i. Cio conta due volte lenergia di interazione tra gli elettroni. Lenergia totale correttamente, invece, divide per due questi contributi. In realt gli autovalori di Fock sono importanti lo stesso perch, anche se non lo dimostriamo, quelli relativi ad orbitali occupati rappresentano anche se approssimativamente il potenziale di ionizzazione delli-esimo elettrone, mentre quelli relativi ad orbitali virtuali lafnit elettronica.

2.1

Introduzione di una base atomica nel caso closed-shell: le equazioni di Roothaan.

Non possibile risolvere direttamente le equazioni di HF nel caso di molecole. Un metodo numerico stato proposto da Roothaan ed ancora oggi quasi esclusivamente utilizzato. Il metodo prevede di

CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK

50

espandere ogni spin-orbitale molecolare su una base di funzioni atomiche centrate sui nuclei della molecola (LCAO). La trattazione non pu pi essere generale e cominceremo con vedere cosa succede in una molecola con tutti gli spin appaiati cio closed-shell (N elettroni). In una molecola closed-shell il numero di spin uguale a quelli con spin ed quindi possibile considerare che ogni coppia di elettroni sia descritta dallo stesso orbitale spaziale e da diverse parti di spin. In pratica adesso possiamo occuparci solo della parte spaziale degli spin-orbitali. Un set ristretto di orbitali ha la forma i (x) = i (r) ( ) i (r) ( )

dove la parte spaziale dello spin-orbitale la stessa. Lequazione i-esima di HF quindi data da f (x1 )i (r) (1 ) = i i (r) (1 ), si assume che lequivalente per spin dia lo stesso autovalore. Se premoltiplichiamo per ( ) e integriamo sullo spin: (1 ) f (x1 )i (r) (1 )d 1 = i i (r) (1 ) (1 )d 1 = i i (r)

dove loperatore di Fock adesso solo un operatore nelle variabili spaziali e pu essere espresso come segue f (r1 )i (r1 ) = (1 ) f (x1 )i (r1 ) (1 )d 1 =
N l N

(1 ) h1 + (Jl Kl ) i (r1 ) (1 )d 1 =

(1 )h(1)i (r1 ) (1 )d 1 +

1 l (x2 )d x2 i (r1 ) (1 ) d 1 (1 )l (x2 )r12

1 d 1 (1 )l (x2 )r12 l (x1 )d x2 i (r2 ) (2 )

Lultima espressione va valutata separatamente a seconda dello spin di l (x2 ). La prima somma vale per spin , la seconda per spin : f (r1 )i (r1 ) = h(r1 )+
N /2

l spin

1 d 1 d 2 d r2 (1 )l (r2 ) (2 )r12 l (r2 ) (2 )i (r1 ) (1 ) 1 d 1 d 2 d r2 (1 )l (r2 ) (2 )r12 l (r1 ) (1 )i (r2 ) (2 ) +

N /2

l spin

1 d 1 d 2 d r2 (1 )l (r2 ) (2 )r12 l (r2 ) (2 )i (r1 ) (1 ) 1 d 1 d 2 d r2 (1 )l (r2 ) (2 )r12 l (r1 ) (1 )i (r2 ) (2 )

della seconda somma lultimo termine scompare durante lintegrazione in d 2 per lortonormalit delle funzioni di spin. Quindi per ogni equazione di HF nel caso restricted abbiamo due contributi identici di Coulomb e uno solo di scambio per ogni coppia di elettroni. Per una molecola closed-shell lespressione delloperatore di Fock e dellenergia sono quindi:
n/2

f (r1 ) = h(r1 ) + (2Ja (1) Ka (1))


a n/2 a n/2 a,b n/2 a n/2

(2.23)

E = 2 a|h|a + [2 ab|ab ab|ba ] = 2 haa + [2Jab Kab ]


a,b

(2.24)

CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK dove Jab e Kab sono gli integrali di Coulomb e di scambio.

51

Nel metodo di Roothaan gli spin-orbitali molecolari sono espansi in un set di base atomico di M funzioni atomiche non ortonormali (LCAO):
M

i (r1 ) =

=1

C i

(2.25)

Lo sviluppo qui sopra ha senso solo se il numero di funzioni di base impiegate molto pi grande del numero di orbitali che dobbiamo determinare (orbitali occupati). Se cos non fosse quellespansione sarebbe una combinazione linerare che lascia invariante lenergia del sistema. Sostituendo questa espressione nelle equazioni di HF si ottiene:
M M

=1

C i = i C i
=1

(2.26)

e integrando si ottiene premoltiplicando per M =1

| f | C i = i | C i

cio in forma matriciale FC = SC (2.27) dove S la matrice di sovrapposizione e F quella di Fock. Le incognite sono i coefcienti cio C. Lespressione degli elementi della matrice F in termini del set di base piuttosto complessa:
core F = H + C aC a [2 | | ] a n/2 M

(2.28)

dove
core nucl H = T + V =

1 (1) + d r1 (1) 2 2 1

d r1 (1)

ZJ (1) J =1 RJ 1

(2.29)

il termine monoelettronico. Lespressione


n/2 P = 2 C aC a a

(2.30)

detta density matrix. In termini di matrice densit loperatore di Fock risulta:


M core F = H + P

1 | 2

core = H + G

(2.31)

Problema: trovare lespressione degli elementi della matrice di Fock. Soluzione: loperatore di Fock nella base orbitalica dato da
n/2

j |F |i

j h + (2Ja (1) Ka (1)) |i


a n/2

= j h|i + [2 ia| ja ia|a j ] = hi j + Vi j


a

e soddisfa lequazione seguente (hi j + Vi j ) = i j i (2.32)

CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK


gli orbitali sono espansi nella base atomica
M M M M

52

i = C i ,

j = C j

a = C a = C a

Lhamiltoniano bielettronico Vi j diventa


n/2 M M M n/2 M M M M M

C i C a C j C a

C i C a C a C j


dove V = P

C iC aC j C a [2 | | ] = C iC j V

1 | 2

n/2

con P = 2 C aC a a

abbiamo poi per lhamiltoniano monoelettronico


hi j = C iC j h

inne dobbiamo anche esprimere il termine di destra di (2.32) in termini della base atomica
M M

i j = i| j = Lequazione (2.32) diventa quindi

C i C j

= C i S C j

C iC j h + C iC j V

= =

(C i S C j )i C iC j V = 0

(C i S C j )i

C iC j h

C i [i S h V ]C j

e quindi alla ne avremo

[h V i S ]C j = 0

che altro non che F C =E S C.

Il problema contenuto nelle equazioni di HF-Roothan non di banale soluzione perch loperatore F (secondo leq. (2.28)) dipende dagli stessi coefcienti che vogliamo trovare. Questo la conseguenza del fatto che nelle equazioni di HF si volevano trovare gli spin-orbitali utilizzando un operatore che ne dipende. Quindi il problema FC = SC non e un semplice problema lineare, ma richiede una soluzione iterativa tipica dei problemi non lineari. Inoltre anche assumendo di conoscere loperatore di Fock (almeno allinizio) e quindi di ridursi ad un problema lineare non e comunque semplice risolvere il problema matriciale FC = SC ; sarebbe molto pi semplice risolvere un problema come quello che si ottiene nel caso di basi ortonormali: FC = C , ma questo vorrebbe dire ortogonalizzare la base di orbitali atomici . Effettivamente questo quello che si fa in pratica. Si cerca cio una matrice unitaria X tale che X SX non solo sia diagonale, ma sia anche la matrice identit. Cio si diagonalizza e si rinormalizza la matrice di sovraposizione S. Esistono diversi modi per farlo, uno molto comune quello dellortogonalizzazione canonica: si cerca la matrice Xnella forma 1 X = U s 2 dove U una matrice che diagonalizza S: U SU = s

CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK

53

con s diagonale. Diagonalizzare (e rinormalizzare) S signica modicare gli spin-orbitali e quindi la matrice C. La nuova matrice sar data da C = X1 C. Sostituendo nelle equazioni (2.27) C = XC otteniamo: FXC X FXC cioe inne F C = C . Che quello che volevamo. Lo schema di un calcolo HF-Roothan per una molecola closed-shell e relativamente semplice: 1. Specicare la geometria molecolare e le cariche dei nuclei.
core e gli integrali ( | ). 2. Calcolare S , H

= SXC = X SXC

3. Diagonalizzare la matrice S ottenuta dai S , ottenere s e U, e quindi X. 4. Effettuare una guess ragionevole per la matrice densit P . 5. Calcolare il pezzo bielettronico di F cio gli elementi G a partire dalla matrice densit e dagli integrali bielettronici. 6. Aggiungere ad Hcore la matrice G ottenendo quindi F. 7. Calcolare F nella base ortogonale F = X FX. 8. Diagonalizzare F e quindi ottenere C e gli autovalori . 9. Calcolare C = XC . 10. Formare una nuova P con i coefcienti ottenuti. 11. Controllare se gli autovalori appena calcolati sono molto diversi da quelli precedenti. Se s tornare al punto 5, se no terminare il programma. Avendo denito un basis set { j } c bisogno di calcolare e conservare gli integrali mono e bielettronici che vengono calcolati allinizio del calcolo HF. Gli integrali di sovrapposizione e quelli monoelettronici sono pochi e di facile gestione. Il problema leggermente pi complicato rappresentato da quelli bielettronici infatti se abbiamo K funzioni di base allora il numero di integrali sar dellordine di K 4 /8. Alcuni per si annullano se le funzioni sono centrate su nuclei molto lontani. La guess pi semplice che possiamo immaginare per P zero che corrisponde ad approssimare F con Hcore , ma di solito si preferisce una guess semiempirica di tipo Huckel.

2.2

Un-restricted Harteee-Fock

In maniera analoga a quanto visto per caso restricted , gli spin-orbitali vengono espressi come prodotti di funzioni di spin per orbitali spaziali: questa volta per le parti spaziali non sono le stesse, ma lasciamo che gli elettroni e siano descritti da orbitali diversi: i (x) i (r) ( ) i (r) ( )

da cui possibile ricavare le espressioni delle equazioni di Fock esattamente nella stessa maniera che stata seguita per il caso restricted. E comunque possibile costruire gli operatori di Fock in modo meno rigoroso

CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK

54

considerando la situazione delle occupazioni degli spin-orbitali. Loperatore di Fock f (1) non altro che il campo medio subito da un elettrone di spin : questo include lhamiltoniano di singola particella h1 , gli integrali di Coulomb e di scambio con tutti gli altri N elettroni a spin e gli integrali di Coulomb con tutti gli altri N elettroni a spin (lo scambio si annulla con elettroni a spin opposto):
N N [Ja (1) Ka (1)] +

f (1) = h1 +
a

Ja (1)

analogamente per simmetria si deve avere


N a N a f (1) = h1 + Ja (1) Ka (1) + [Ja (1)]

Le due equazioni non possono essere risolte indipendentemente perche sono accoppiate: per esempio . f dipende dagli orbitali occupati a attraverso Ja In termini di integrali mono e bielettronici lenergia di un UHF data dallespressione seguente
N a N a E0 = h aa + haa + N 1 N 1 ( J K ) + ( J K ) + ab ab Jab ab ab 2 2 a b ab ab N N

Lintroduzione di una base atomica per ottenere la trasformazione da equazioni integro-differenziali in equazioni matriciali da risolvere iterativamente si ottiene analogamente al caso restricted e le equazioni che si ottengono vengono dette di Pople-Nesbet: F C = SC F C = SC dove i coefcienti della base sono adesso distinti per spin. Le matrici di Fock hanno espressioni analoghe a quelle del caso restricted, ma la parte di scambio diversa. Bench il caso UHF sia utilizzato in pratica ha un grave difetto: i suoi determinanti non sono autofunzioni di S2 e questo pu rappresentare un problema piuttosto serio quando si utilizzano le soluzioni (MO) HartreeFock per calcoli pi sosticati.

2.3
2.3.1

I Basis Set
Slater e Gaussian type functions (GTO)

Storicamente, il calcolo quanto-meccanico dellenergia elettronica delle molecole stato quasi sempre fatto usando lapprossimazione LCAO-MO (Linear Combination of Atomic Orbitals - Molecular Orbitals). Come abbiamo visto gli orbitali molecolari vengono costruiti come combinazione lineare di orbitali atomici:
M

i =

=1

C i

dove i li-esimo orbitale molecolare, C i sono i coefcienti della combinazione lineare, il -esimo orbitale atomico e M il numero totale di orbitali atomici di base utilizzati. Rigorosamente parlando, gli orbitali atomici sarebbero la soluzione dellequazione di Hartree-Fock per un atomo, cio una funzione donda monoelettronica atomica. Qualunque altra funzione non un orbitale atomico propriamente detto. Alcune funzioni sono tuttavia molto simili e la terminologia piuttosto confusa a riguardo. Ora come ora il termine orbitale atomico stato quasi interamente sostituito da funzione di base o contrazione.

CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK

55

Fino a non molto tempo fa, i cosidetti Orbitali di Slater (STO - Slater Type Orbital) venivano utilizzati perch erano molto simili alle soluzioni degli atomi idrogenoidi. Questo tipo di orbitali sono descritti da una funzione che dipende da coordinate sferiche e da 3 numeri quantici: i ( , n, l , m|r, , ) = Nrn1 e rYlm ( , ) dove N un fattore di normalizzazione e viene detto esponente. Le r, , e sono coordinate sferiche, e Yl ,m unarmonica sferica. I numeri n, l , e m sono numeri quantici analoghi a quelli idrogenoidi. Sfortunatamente, funzioni come queste non sono facilmente utilizzabili nei calcoli degli integrali bielettronici che devono essere necessariamente veloci. Questo il motivo per cui, storicamente, vennero introdotte le funzioni gaussiane o GTO (Gaussian Type Orbitals). E infatti possibile approssimare una funzione di tipo STO combinando linearmente alcune gaussiane. Anche se la procedura richiede 5 o 6 gaussiane il calcolo di un integrale bielettronico risulta pi rapido con le funzioni GTO. I GTO possono essere espressi dalla seguente formula generale: g( , lx , ly , lz |x, y, z) = Ne r xlx yly zlz o anche g( , l , m, n|r, , ) = Nr(2n2l ) e r Ylm ( , ) dove N una costante di normalizzazione, lesponente, x, y, e z sono coordinate cartesiane centrate sul nucleo. I numeri interi lx , ly , e lz non sono numeri quantici, ma semplici potenze delle coordinate cartesiane dal momento che queste funzioni non sono orbitali atomici. Questi sono alcuni esempi di funzioni gaussiane: 1s 2 px 2 py 2 pz 3dxx 3dxz 4 fxxx 4 fxyz = = = = = = Ne r
2 2 2 2 2 2 2 2

Ne r x Ne r y Ne r z Ne r x2 Ne r xz

... 2 = Ne r x3 = ... Ne r xyz


2

La somma delle potenze delle coordinate cartesiane L = lx + ly + lz viene usata analogamente al numero quantico di momento angolare per gli atomi in modo da contraddistinguere le funzioni per shell: funzioni s (L = 0), p (L = 1), d (L = 2), f (L = 3), ecc. C un problema per quanto riguarda le funzioni di tipo d e quelle corrispondenti a valori di L pi alti: esistono 5 orbitali linearmente indipendenti e ortogonali, ma ci sono 6 gaussiane possibili (le terne di numeri lx , ly , lz sarebbero: 2, 0, 0 o 0, 2, 0 o 0, 0, 2 e 1, 1, 0 o 0, 1, 1 o 1, 0, 1). Se le usiamo tutte e 6 in realt stiamo utilizzando anche un orbitale STO di tipo 3s, infatti: 3dxx (2, 0, 0) + 3dyy (0, 2, 0) + 3dzz (0, 0, 2) = N (x2 + y2 + z2 )e r = Nr2 e r
2 2

Per quanto riguarda le funzioni di tipo f , abbiamo 10 possibili gaussiane, ma solo 7 orbitali. Le gaussiane introducono gli orbitali 4 px , 4 py e 4 pz . Questo effetto si chiama contaminazione. Quasi tutti i metodi ab-initio sono variazioni pi o meno complesse del metodo variazionale lineare. La contaminazione non quindi un problema visto che la base in questi metodi arbitraria. In generale sarebbe meglio eliminare i contaminanti da un set di base per diminuire la dipendenza lineare delle funzioni di base.

CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK

56

La funzioni gaussiane non sono delle buone funzioni di base per gli orbitali atomici e molecolari. La dipendenza da r2 allesponente infatti rende le GTO inferiori allo STO sotto due punti di vista: sul nucleo una GTO ha derivata prima uguale a zero, mentre uno STO ha la tipica cuspide; inoltre una o in generale decresce troppo velocemente con la distanza dal nucleo rispetto alla vera densit elettronica. Sia gli STO che i GTO possono essere utilizzati come base per calcoli variazionali, ma ovviamente ci vorranno molti pi GTO per ottenere una data accuratezza rispetto al numero di STO. Tuttavia la facilit e velocit con cui si possono valutare gli integrali utilizzando GTO rende questi ultimi pi convenienti computazionalmente.

2.3.2

Classicazione dei set di base

I set di base che contengono il pi piccolo numero di GTO sono detti basi minimali. Per lidrogeno e lelio questo signica utilizzare solo una funzione 1s, per gli elementi del primo periodo due funzioni s (1s e 2s) e un set di funzioni di p. Anche se litio e berillio formalmente richiedono solo due funzioni s si soliti utilizzare anche il set p(ibridizzazione). Il miglioramento successivo quello di raddoppiare il numero di funzioni producendo un basis set double zeta (DZ). Una base DZ quindi impiega due funzioni s per idrogeno ed elio, 4 funzioni s(1s, 1s , 2s, 2s ) e due set di funzioni p per gli elementi del primo periodo. Limportanza della presenza delle funzioni aggiuntive in un set DZ rispetto al basis set minimale pu essere illustrata considerando la molecola HCN. Il legame C-H consiste prevalentemente dellorbitale s dellidrogeno e dellorbitale pz del carbonio. Il legame tra carbonio e azoto daltro canto consiste nel mescolamento degli orbitali px (o py ) dei due atomi pesanti ed ha una distribuzione di carica molto pi diffusa. Lesponente ottimale per lorbitale p del carbonio sarebbe quindi pi piccolo nella direzione x che in quella z. Un set di base minimale ha una sola funzione p e quindi un solo esponente e sarebbe possibile solo un compromesso, mentre un set di base DZ ha due orbitali p e quindi due esponenti: la funzione pi contratta andr principalmente nella combinazione del legame C-H, mentre la funzione pi diffusa andr a contribuire al legame C-N. Raddoppiare il numero di funzioni di base quindi permette una descrizione migliore del fatto che in una molecola la densit di carica differente in direzioni diverse. I legami chimici coinvolgono prevalentemente orbitali atomici di valenza. Raddoppiare le funzioni 1s su un atomo del primo o secondo periodo come il carbonio permette una descrizione pi accurata degli elettroni di core che per sono piuttosto insensibili allintorno chimico dellatomo. Una variazione del set minimale che raddoppia il numero di funzioni di valenza detto split valence double zeta. In realt i set di base split valence sono diffusissimi in quanto si rivela del tutto inutile raddoppiare le funzioni degli orbitali di core. Lovvio step successivo quello di creare un set di base triple zeta (TZ) triplicando le funzioni di base di un set minimale. Anche in questo caso pi comune triplicare solo le funzioni di valenza. E ovviamente possibile creare dei set di base che includano delle funzioni di base dette polarizzazioni che vanno oltre la shell di valenza. Queste funzioni servono a fornire al set di base una certa essibilit angolare per formare orbitali molecolari migliori. Le funzioni di polarizzazione hanno il valore del momento angolare pi alto di una unit rispetto alla shell di valenza: includono per esempio funzioni di tipo p per idrogeno ed elio e di tipo d per gli elementi del secondo periodo. In generale le funzioni di polarizzazione vengono aggiunte non contratte. Le funzioni di polarizzazione hanno esponenti tali da avere come estensione radiale quella della shell di valenza. Le funzioni di polarizzazione non sono quindi una descrizione degli orbitali con momento angolare pi alto perch questi ultimi sarebbero molto pi diffusi di quanto siano le funzioni di polarizzazione. La polarizzazione assolutamente necessaria quando vengono utilizzati metodi di calcolo altamente correlati (post-HF). Le polarizzazioni vengono aggiunte ai set di base come il DZ creando i set di base polarizzato come il DZP (double zeta plus polarization). Esiste un ulteriore modo di migliorare i set di base (per esempio se si vogliono descrivere anioni) che consiste nellaggiungere funzioni molto diffuse ad un set gi polarizzato. Questi set di base sono detti aumentati. Gli esponenti di tali funzioni vengono di solito determinati ricostruendo le afnit elettroniche sperimentali degli atomi (infatti non esistono basi aumentate per gli alcalini). Una domanda spontanea a questo punto : come vengono determinati gli esponenti delle funzioni gaussiane? Gli esponenti delle funzioni s e p vengono di solito determinati con calcoli variazionali tipo HF (pi complessi di un calcolo HF come quello illustrato precedentemente dove venivano ottimizzati solo

CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK

57

i coefcienti). Questa procedura non pu essere utilizzata per determinare gli esponenti delle funzioni di polarizzazione. Tali esponenti possono venire infatti determinati con calcoli variazionali su piccole molecole.

2.3.3

Basis set contratti

Uno degli svantaggi di tutti i basis set ottimizzati energeticamente il fatto che dipendono fortemente dalla regione interna della funzione donda: gli elettroni 1s infatti hanno energie molto grandi e minimizzare lenergia tender a rendere ottimale il basis set per gli elettroni di core e meno ottimale per quelli di valenza. Il problema che le propriet chimiche dipendono dagli elettroni di valenza e non da quelli di core. Inoltre alcune propriet chimicamente rilevanti come la polarizzabilit dipendono dalla parte diffusa della densit di carica che energeticamente irrilevante. Un set di base con una buona descrizione della porzione esterna della funzione donda deve essere molto grande e questo non certamente un criterio efciente per la costruzione di set di base. Il fatto che molte funzioni di base niscano per descrivere gli elettroni di core che risultano energeticamente dominanti, ma chimicamente irrilevanti, il motivo dellesistenza dei set di base contratti. Prendiamo ad esempio un set di base di 10 funzioni s e qualche funzione p per il carbonio. Ottimizzando tale set di base energeticamente si otterrebbe che almeno 6 delle funzioni s vanno a descrivere gli elettroni 1s e altre due descrivono la parte interna dellorbitale 2s. Solo due funzioni s rimangono a descrivere la parte chimicamente rilevante della funzione donda. Dato che gli orbitali di core cambiano molto poco al cambiare dellintorno chimico dellatomo anche i coefcienti della loro combinazioni lineari sono pressoch insensibili al resto della molecola (i MO risultanti sarebbero localizzati solo un atomo della molecola e la loro forma ricorderebbe molto quella di un piccolo guscio sferico). Quello che si ottiene in questo modo che lo sforzo computazionale di ottimizzazione viene speso per ottimizzare una parte della funzione donda chimicamente inutile e che risulta praticamente costante. Dato che gli orbitali interni di un atomo richiedo pi o meno sempre le stesse combinazioni di GTO e risultano sostanzialmente indipendenti dallintorno molecolare possibile ssare i coefcienti della combinazione una volta per tutte ed usare tale combinazione come funzione di base. Questo meccanismo alla base della creazione dei set di base contratti: nel nostro esempio sarebbe infatti possibile ssare i coefcienti di mescolamento dei primi 6 GTO e delle due coppie seguenti ottenendo 3 funzioni di base da 10 (ecco perch si parla di contrazione) a scapito della essibilit, ma come si poi visto senza perdere troppo in accuratezza e sicuramente guadagnando in efcienza. La combinazione di pi GTO, dette in questo caso primitive gaussiane (PGTO), in piccole combinazioni detta contrazione e le funzioni risultato sono dette contracted GTO (CGTO). Nel caso di set di base contratti la notazione precedente (DZ, TZ, ecc.) si riferisce al numero di CGTO. La contrazione serve sopratutto a descrivere gli elettroni di core per i quali sono necessarie molte PGTO che servono a riprodurre la condizione di cuspide sul nucleo. Per specicare la contrazione si usa la seguente (ovvia) notazione (10s4 p1d ) [3s2 p1d ] Esistono due modi per contrarre un determinato set di base, e si parla quindi di segmented o general contraction. La contrazione del primo tipo quella utilizzata nellesempio precedente: un dato set di PGTO viene partizionato in set pi piccoli di funzioni che sono poi combinate in CGTO attraverso dei coefcienti opportuni. Un set di base 10s viene contratto 3s prendendo 6 funzioni interne per una CGTO, le seguenti 3 per la seconda CGTO e lultima rimanente come lultima CGTO
6 CGT O 1

= = =

i=1 9 CGT O 2 CGT O 3

ai iPGT O ai iPGT O

i=7 PGT O 10

CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK

58

In una contrazione di tipo generale invece tutte le PGTO di un determinato momento angolare sono utilizzate a formare la CGTO con coefcienti diversi
10 CGT O 1

= = =

i=1 10 CGT O 2

ai iPGT O bi iPGT O ci iPGT O

i=1 10 CGT O 3

i=1

2.3.4

Basi comuni

Basi di Pople STO-nG Sono costruite con Slater Type Orbitals a loro volta costituiti da n PGTO combinate insieme. Sono basi minimali dove gli esponenti delle PGTO sono determinate ttando la loro combinazione al relativo STO piuttosto che ottimizzando lenergia dellatomo. Vengo utilizzate le basi con n = 2 o 3 anche se esistono basi con n no a 6. La base STO-3G la base minimale pi utilizzata. k nlmG Questo tipo di base sono di tipo split-valence dove il k iniziale indica il numero di PGTO utilizzate per gli orbitali di core. Il gruppo nlm dopo il trattino indica sia in quante funzioni sono divisi gli orbitali di valenza sia quante PGTO sono utilizzate per la loro rappresentazione. Eventuali polarizzazioni sono indicate dopo la G. In questo tipo di basi gli esponenti delle funzioni s sono uguali a quelli delle funzioni p e sono determinati variazionalmente. 3 21G: questo un set di base in cui gli orbitali di core sono una contrazione di 3 PGTO e la parte interna di valenza costituita da due PGTO e quella esterna da una sola PGTO. Per il carbonio la contrazione sarebbe (6s3 p) [3s2 p]. Questa base contiene lo stesso numero di PGTO della STO-3G, ma ha il doppio di funzioni di valenza. 6 31G: anche questo uno split valence dove gli elettroni di core sono una contrazione di 6 PGTO, la valenza rappresentata da una contrazione di 3 e di 1 PGTO. Per il carbonio la contrazione sarebbe (10s4 p) [3s2 p]. Ad ognuno di questi possono essere aggiunte funzioni di polarizzazione o diffuse. Le funzioni diffuse sono di tipo s o p e vengono indicate da un + o un ++. Il primo sta ad indicare delle funzioni diffuse sugli atomi pesanti, il secondo laggiunta di una diffusa anche per lidrogeno. Le funzioni di polarizzazione sono invece indicate dopo la G con designazioni diverse a seconda se siano aggiunte agli atomi pesanti o allidrogeno. Il set di base 6 31 + G(d ) uno split valence con un set di diffuse sp sugli atomi pesanti una singola polarizzazione d sugli stessi. Un set di base 6 311 + +G(2d f , 2 pd ) un set split valence con funzioni diffuse addizionali sugli atomi pesanti e sugli idrogeni e con funzioni polarizzanti di tipo d e f sugli atomi pesanti e p e d sullidrogeno. DA notare che esiste una seconda notazione che usa il simbolo : per cui la notazione 6 31G indica il set 6 31G(d ). Basi correlation consistent Unintera serie di set di base tra le pi utilizzate per calcoli molto accurati riassume tutte queste caratteristiche ed la cosidetta correlation consistent (cc) inventati da Dunning. Sono ottenuti tentando di recuperare lenergia di correlazione degli elettroni di valenza e sono molto utilizzati per calcoli su molecole piccole. Il

CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK

59

nome deriva dal fatto che le basi sono disegnate in modo che le funzioni che contribuiscono similmente alla correlazione sono introdotte allo stesso stadio indipendentemente dal tipo di funzione. Lintroduzione delle prime funzioni d provoca un notevole abbassamento dellenergia, ma il contributo delle seconde funzioni d simile a quello delle prime f . Laggiunta delle polarizzazioni viene quindi fatta nel seguente modo: 1d , 2d 1 f , 3d 2 f 1g ecc. Esistono diverse basi cc che usano la notazione tradizionale: cc pV DZ , cc pV T Z , cc pV QZ , cc pV 5Z . La loro composizione data nella tabella seguente. Base cc-pVDZ cc-pVTZ cc-pVQZ cc-pV5Z cc-pV6Z PGTO(atom/H) 9s,4p,1d/4s,1p 10s,5p,2d,1f/5s,2p,1d 12s,6p,3d,2f,1g/6s,3p,2d,1f 14s,9p,4d,3f,2g,1h/8s,4p,3d,2f,1g 16s,10p,5d,4f,3g,2h,1i/10s,5p,4d,3f,2g,1h CGTO(atom/H) 3s,2p,1d/2s,1p 4s,3p,2d,1f/3s,2p,1d 5s,4p,3d,2f,1g/4s,3p,2d,1f 6s,5p,4d,3f,2g,1h/5s,4p,3d,2f,1g 7s,6p,5d,4f,3g,2h,1i/6s,5p,4d,3f,2g,1h

Tabella 2.1: Basi correlation consistent Questi set di base possono essere aumentati da funzioni diffuse e in questo caso prendono il sufsso aug. Il vantaggio principale di questi set di base quello di poter generare una serie di calcoli sempre pi accurati che convergono verso il cosidetto limite della base (basis set limit).

BASIS="cc-pVTZ" H 0 S 3 1.00 33.8700000 0.606800000E-02 5.09500000 0.453080000E-01 1.15900000 0.202822000 S 1 1.00 0.325800000 1.00000000 S 1 1.00 0.102700000 1.00000000 P 1 1.00 1.40700000 1.00000000 P 1 1.00 0.388000000 1.00000000 D 1 1.00 1.05700000 1.00000000

CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK

60

BASIS="aug-cc-pVTZ" H 0 S 3 1.00 33.8700000 0.606800000E-02 5.09500000 0.453080000E-01 1.15900000 0.202822000 S 1 1.00 0.325800000 1.00000000 S 1 1.00 0.102700000 1.00000000 P 1 1.00 1.40700000 1.00000000 P 1 1.00 0.388000000 1.00000000 D 1 1.00 1.05700000 1.00000000 S 1 1.00 0.252600000E-01 1.00000000 P 1 1.00 0.102000000 1.00000000 D 1 1.00 0.247000000 1.00000000

2.4

Orbitali molecolari

Gli orbitali molecolari vengono creati combinando orbitali atomici (nella forma di CGTO come abbiamo visto). Tradizionalmente gli orbitali vengono distinti in orbitali di core e di valenza. Gli orbitali di core non hanno molta importanza per la formazione dei legami chimici perch derivano sostanzialmente dalla combinazione degli orbitali atomici pi interni che, a distanze nucleari non troppo piccole non hanno praticamente sovrapposizione. Gli orbitali di valenza sono invece i principali responsabili del legame chimico e delle sue propriet. La loro struttura determinata dalle forze elettrostatiche interagenti tra gli atomi e quindi dipende dalle distanze interatomiche. A grandi distanze la loro struttura sostanzialmente quella degli orbitali atomici di partenza. In una molecola biatomica o lineare esistono diversi tipi di orbitali. La caratteristica importante delle molecole biatomiche la presenza di una chiara simmetria assiale cio la molecola appartiene al gruppo di simmetria Cv o Dh (nel caso sia simmetrica rispetto al piano ortogonale allasse di legame: per esempio CO2 ). Questo semplicemente dovuto al fatto che il potenziale elettrostatico che compare nellHamiltoniana di una molecola lineare invariante per rotazioni attorno allasse di legame. Una regola della m.q. ci assicura che le operazioni di rotazione sono generate dai momenti angolari nella forma di operatori esponenziali. Nel caso specico, la rotazione di un angolo attorno allasse di legame Cz data dal momento angolare Lz dove z lasse di legame Cz = e
i h Lz

Abbiamo detto che lHamiltoniano invariante per rotazioni attorno allasse z, quindi comuta con Cz , di conseguenza commuta anche con Lz . Un orbitale molecolare sar quindi descritto, oltre che da unenergia, anche dal n.q. m autovalore di Lz Lz MO = ih MO = h mMO

Inoltre dato che lenergia dellorbitale dipende dal quadrato del momento angolare le coppie di orbitali con m = 1 o 2 ecc. sono doppiamente degeneri. Il valore assoluto di m in genere detto : gli orbitali con = 0 sono gli orbitali , quelli con = 1 gli orbitali , con = 2 . In molecole di tipo Dh si ha un centro di simmetria aggiuntivo e ogni orbitale molecolare viene anche distinto per la sua simmetria rispetto al piano perpendicolare allasse molecolare. Si usano i simboli g (gerade) per gli orbitali pari rispetto alla riessione e u (ungerade) per quelli dispari.

CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK

61

Prendiamo la molecola pi semplice di tutte, H2 e vediamone gli orbitali molecolari che otteniamo da una minimale fatta di due funzioni 1s. In Figura 2.1 i due orbitali legante (g o ) sono riportati in termini degli orbitali di partenza e di densit. Come noto si hanno due orbitali molecolari di diversa energia che schemticamente possono essere visti come in

Figura 2.1: In alto a sinistra: Combinazione legante di due orbitali 1s; in alto a destra: combinazione antilegante. In basso a sinistra: densit risultante per lorbitale molecolare g ; in basso a destra: densit risultante per lorbitale u Come noto si ottengono due orbitali molecolari di diversa energia che schematicamente possono essere visti come in 2.2.

CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK

62

Figura 2.2: In alto a sinistra: Schema degli orbitali molecolari in H2 ; in alto a destra: andamento energetico dei due autovalori degli orbitali al variare della distanza internucleare. In basso a sinistra: supercie isodensit per lorbitale molecolare g ; in basso a destra: supercie isodensit risultante per lorbitale u In altre molecole omonucleari o utilizzando basi pi grandi che includano anche orbitali p si avrebbe la possibilit di avere orbitali o dovuti a questi orbitali. I superci di isodensit sono riportate in 2.3.

CAPITOLO 2. ENERGIE ELETTRONICHE: HARTREE FOCK

63

Figura 2.3: In alto: supercie isodensit della combinazione legante(sinistra) e antilegante (destra) di due orbitali pz . In basso: supercie isodensit della combinazione legante(sinistra) e antilegante (destra) di due orbitali px .

Capitolo 3

Energie elettroniche: metodi post Hartee-Fock


Il metodo Hartree-Fock fornisce la pi semplice approssimazione variazionale alla funzione donda di uno stato stazionario e corrisponde al minimo sviluppo della funzione donda dotato di senso sico: un singolo determinante di Slater. Sfortunatamente, come visto in precedenza, nella maggior parte delle situazioni di interesse chimico (rottura e formazione di legami) il modello di HF completamente inadeguato. Una prima macroscopica manifestazione dellerrore insito nel modello RHF emerge nella descrizione della dissociazione della pi semplice molecola biatomica: H2 . Nellintorno della distanza internucleare di equilibrio, la funzione donda elettronica dello stato fondamentale ben descritta dalla congurazione restricted 2 . evidente a priori, tuttavia, che questo modello non pu essere corretto per qualsiasi valore della HF 1g distanza R fra i due nuclei: man mano che questultima aumenta, la funzione donda deve, con continuit, gradualmente trasformarsi in quella asintotica che, rimanendo in un modello mono-congurazionale, deve 1 essere del tipo 1s1 A 1sB con spin opposti a dare S = s1 + s2 = 0. Una congurazione con un solo orbitale doppiamente occupato non pu mai evidentemente trasformarsi in questa, divenendo, al pi, del tipo + 0 1s2 A 1sB e cio corrispondente ad una dissociazione ionica H e H . Questo succede perch nella rappresentazione RHF i due elettroni devono avere la stessa parte spaziale. Il risultato di questo errore qualitativo una energia di dissociazione pi che doppia di quella reale (oltre 10 eV contro 4.75 eV). Vale la pena di osservare che nellesempio precedente la decienza qualitativa del modello a particelle indipendenti non assoluta ma va in pratica interamente attribuita al modo in cui nel metodo RHF si separa il problema di spin da quello spaziale, imponendo luso di orbitali doppiamente occupati. Un modello a spin non ristretti (UHF) descrive almeno al livello qualitativo correttamente la dissociazione di H2 . Questa osservazione mette in evidenza, in generale, una certa ambiguit nella denizione di errore di correlazione, la cui entit e natura sica viene a dipendere dal particolare modello Hartree-Fock cui ci si riferisce. La differenza (teorica) fra lenergia esatta non-relativistica di un sistema elettronico e quella HF viene denita energia di correlazione elettronica, e tutti i fenomeni e le alterazioni del valore di osservabili che possono essere riprodotti solo da funzioni donda pi accurate di quella HF vengono detti effetti di correlazione. Il metodo di gran lunga pi usato per trattare effetti di correlazione elettronica anche quello teoricamente pi semplice ed intuitivo, e cio linterazione di congurazione (CI, conguration interaction). Dal punto di vista strettamente teorico formale ben poco c da aggiungere, e lo faremo fra poco, allanalisi di questo metodo che gi abbiamo sostanzialmente discusso: dato un insieme di orbitali (quale, ad esempio e come tipicamente accade, quello generato da un calcolo HF) si tratta di costruire la matrice dellhamiltoniano in uno spazio pi grande possibile di determinanti e di calcolarne uno o pi autovalori ed autovettori. E tuttavia linterazione di congurazione il metodo che stato oggetto, nel corso degli anni, di forse il maggior numero di studi pubblicati in chimica teorica, rivolti allo sviluppo di sempre nuove e pi efcienti tecniche computazionali. Come vedremo pi sotto per mezzo di alcuni esempi, fare un calcolo CI semplicemente fuori discussione 64

CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK

65

per la maggior parte dei sistemi a molti elettroni a prescindere da qualsiasi prevedibile sviluppo nelle tecniche computazionali e nella potenza dei calcolatori. Sono stati quindi inventati altri metodi oltre CI per cercare di aggiungere la correlazione elettronica ad HF: metodi variazionali basati su approssimazioni a CI come MCSCF (multi congurational self consisten eld) e MRCI (multi reference CI); metodi basati sulla teoria delle perturbazioni a molti corpi (MBPT o MP2/4) metodi basati sul funzionale della densit (DFT) In questa sede ci limiteremo ad accennare le tecniche basate sui metodi Full-CI, MCSCF e MBPT.

3.1

Energia di correlazione

La correlazione dinamica quel contributo energetico strettamente attribuibile alleffettiva interazione istantanea fra coppie di elettroni, cio quella parte intrinsecamente trascurata in qualsiasi modello a particelle indipendenti. La correlazione dinamica rappresenta un vero problema: essa pu essere rappresentata solo considerando leffetto combinato di un numero generalmente grandissimo di determinanti, non individuabili a priori e i cui pesi sono tutti confrontabilmente importanti. Lesperienza indica indubbiamente che la correlazione converge molto lentamente con il numero di congurazioni incluse. Riprendiamo in esame il semplice esempio della dissociazione di H2 . Sebbene il processo di dissociazione (cio la curva di energia elettronica) sia disastrosamente descritto a livello RHF, lenergia di dissociazione pu nondimeno essere ragionevolmente calcolata con questo metodo: basta sottrarre al doppio dellenergia di un atomo di idrogeno (nota esattamente) lenergia RHF dello stato fondamentale di H2 alla distanza di equilibrio, dove la descrizione RHF almeno qualitativamente corretta. Si ottiene in questo modo un valore con un errore di circa il 10%. Questo errore dunque dovuto alla correlazione dinamica. ragionevole supporre che il contributo di energia di correlazione dinamica sia (molto approssimativamente) proporzionale al numero di coppie di elettroni nel sistema. comunque chiaro che, in sistemi pi grandi, con pi elettroni di valenza, lerrore assoluto nelle energie di dissociazione dovuto alla correlazione dinamica destinato ad aumentare. Naturalmente, non solo le energie ma anche tutte le altre osservabili calcolate teoricamente sono affette dallerrore di correlazione. facile immaginare quanto sia importante essere in grado di stimare a priori, se non lentit, se non altro il segno delle correzioni di correlazione. Questo tuttaltro che facile in generale. Parlando ad esempio di differenze di energia, occorre poter stimare la variazione di energia di correlazione fra gli estremi della transizione considerata (sia essa fra due stati elettronici distinti o fra punti diversi della stessa supercie di energia elettronica). Ancora pi complessa lanalisi di propriet elettriche o magnetiche che dipendano dalla effettiva distribuzione di densit elettronica (ad esempio, il momento di dipolo). In termini pi formali lenergia di correlazione denita come Ecorr = E0 EHF (3.1)

cio come la differenza tra lenergia esatta di un sistema polielettronico e lenergia HF ottenuta nel limite di una base monoelettronica completa. Quando, come in pratica, il calcolo HF viene fatto in una base incompleta si determina lenergia di correlazione per quella base monoelettronica (basis set correlation energy). Lenergia di correlazione come abbiamo detto dovuta alle interazioni tra gli elettroni e quindi ci si potrebbe aspettare che questa energia diminuisca allaumentare della distanza tra i nuclei visto che il numero di coppie elettroniche interagenti diminuisce quando le molecole si frammentano. Quello che succede esattamente lopposto come testimoniato dalla seguente tabella calcolata per la molecola di H2 O nella base DZ.

CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK Geometry Req 1.5 Req 2.5 Req Ecorr (u.a.) -0.14 -0.21 -0.31

66

Questo succede perch la denizione (3.1) non include il contributo dovuto alla cosidetta correlazione di degenerazione o correlazione non-dinamica. Questo tipo di errore di correlazione si manifesta quando una sola congurazione elettronica (determinante) non pi dominante, ma lo stato elettronico realistico sarebbe dato da una somma di determinanti di Slater con una differente occupazioni degli orbitali (ne discutiamo pi lungamente in Sezione 3.2.5). Cercando di fare un po di chiarezza potremmo dire che quando sono coinvolte rotture di legame e stati eccitati, la correlazione non-dinamica pu essere ottenuta aggiungendo alla congurazione dominante qualche congurazione aggiuntiva (come vedremo questo quello che fa MCSCF). Questa correlazione dovuta ad artefatti del modello monodeterminatale di HF. Laltro tipo di correlazione (quella dinamica) dovuta alle interazioni elettroniche e si pu calcolare includendo un numero molto grande di congurazioni elettroniche aggiuntive.

3.2

Metodi Variazionali

Lidea dei metodi variazionali post-HF o di tipo CI molto semplice: diagonalizzare lHamiltoniano Nelettronico in una base di funzioni N-elettroniche (determinanti di Slater). In altre parole, non limitarsi a trovare un solo determinante, ma rappresentare la funzione donda come combinazione lineare di molti determinanti. E importante notare che questi metodi hanno bisogno di un determinante di base detto riferimento con cui generare tutti gli altri. Questo determinante di solito dato da un calcolo HF.

3.2.1

Determinanti eccitati e autofunzioni di S2 (Conguration State Functions, CSF)

Cercheremo di vedere con un esempio molto semplice in che modo vengono ottenuti gli altri determinanti di Slater oltre quello HF e che propriet debbano avere per essere utilizzabili. I determinanti di Slater in generale sono autofunzioni delloperatore Sz , ma non sono sempre autofunzioni delloperatore di spin totale S2 . E possibile formare tali autofunzioni usando delle combinazioni lineari di determinanti di Slater. Molti calcoli in effetti sono pi semplici quando vengono effettuati utilizzando autofunzioni dello spint totale (e linterpretazione dei risultati risulta pi semplice). Al posto di fare una trattazione generale ci limitamo ad un esempio semplice: la molecola H2 descritta con un LCAO ed un basis set minimale STO-3G. Nel basis set STO-3G ogni atomo di idrogeno descritto da una contrazione di tipo 1s ottenuto dalla contrazione di 3 GTO di tipo s. Durante un procedimento HF vengono ottimizzati (in realt per una base minimale c poco da ottimizzare) i due orbitali molecolari 1 2 = = A + B A B

il determinante dello stato fondamentale (due elettroni nellorbitale legante 1 ) di HF : 1 = 1 (1) (1)1 (2) (2) 1 (2) (2)1 (1) (1) = 1 (1)1 (2)[ (1) (2) (2) (1)] |0 = |1 che risulta essere una funzione di singoletto con 2S + 1 = 1. I possibili determinanti eccitati vengono costruiti usando gli orbitali vuoti (o virtuali) ottenuti nel calcolo HF (nel caso in esame il solo orbitale

CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK molecolare 2 ). I possibili determinanti singolarmente eccitati risultano essere 4: |2 1
|2 1 |2 1 |2 1

67

= |1 2 2 = |1 1 2 = | 1 2 = |

Dove col il segno di soprasegnato indichiamo spin gi. Esiste un solo determinante doppiamente eccitato che risulta: 22 2 |1 = |2 1 ed anchessa una funzione di singoletto con 2S + 1 = 1. I vari determinanti sono riportati schematicamente in Figura 3.1. Dei 4 determinanti singolarmente eccitati, due sono autofunzioni di S2 con autovalore S = 1

Figura 3.1: Schema energetico qualitativo dei vari determinanti di Slater coinvolti in un ipotetico CI per H2 con un basis-set minimale. |2 1 |2 1

1 2 = [1 (1)2 (2) 1 (2)2 (1)] (1) (2) = | = |1 2 = [1 (1)2 (2) 1 (2)2 (1)] (1) (2)

e rappresentano stati di tripletto. Le altre due, invece, non sono direttamente autostati di S21 . Se le
1 Le

4 possibili combinazioni di due spin di due elettroni sono 1 (1, 2) 2 (1, 2) 3 (1, 2) 4 (1, 2) = = = = (1) (2) (1) (2) (1) (2) (1) (2) Per esempio per la prima abbiamo

z = S1z + S2z , ma non lo sono di tutte sono autofunzioni di S

S2

1 + S2 + 2 S S . = S1 1 2 2

2 2 (1) (2) + S2 (1) (2) + 2S1 S2 (1) (2) = S2 (1) (2) = S1

3 3 3 1 (1) (2) + (1) (2) + [2S1z S2z + S1+ S2 + S1 S2+ ] (1) (2) = + [2 + 0 + 0] (1) (2) = 2 (1) (2) 4 4 2 4 perch S+ = 0, S = , S+ = e S = 0.

CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK combiniamo lineramente possiamo pero ottenere: |1 2 1 |3 2 1
2 2 + | 1 2 = [1 (1)2 (2) + 1 (2)2 (1)][ (1) (2) + (1) (2)] = |2 = |1 1 + |1 2 2 | 1 2 = [1 (1)2 (2) 1 (2)2 (1)][ (1) (2) + (1) (2)] = |2 = |1 1 |1

68

la prima e un singoletto la seconda un tripletto. In totale abbiamo quindi estratto da sei determinanti di Slater sei conguration state functions (CSF) di cui uno stato di singoletto per lo stato fondamentale, 3 stati di tripletto sigolarmente eccitati, 1 stato di singoletto singolarmente eccitato ed inne uno stato di singoletto doppiamente eccitato. In generale possibile lavorare con entrambe le rappresentazioni, alcune metodi usando la rappresentazione dei determinanti (determinantal CI) altri metodi le CFS (GUGA CI).

3.2.2

CI

Il metodo CI o Full-CI il metodo concettualmente pi semplice, ma quello computazionalmente pi pesante e spesso decisamente irrealizzabile. La base concettuale del metodo CI questa: una qualunque funzione per N elettroni pu essere espressa esattamente come una combinazione lineare di tutti i possibili determinanti di Slater ad N elettroni (base polielettronica) formati partendo da un set completo di spin orbitali monoelettronici (base monoelettronica). Se i determinanti di Slater vengono indicati con i gli autovettori dellhamiltoniamo sono dati da
I

k = cki i
i

k = (0, 1, . . . , I 1)

dove I il numero di determinanti possibili (I per una base completa di spin-orbitali) e ci j sono detti coefcienti CI. La matrice H costruita a partire dagli elementi Hi j = i |H | j che possono essere scritti in termini di integrali bielettronici secondo le cosidette regole di Slater (vedi pi sotto). La forza del metodo tutta nella sua generalit: il metodo in linea di principio fornisce la soluzione esatta qualunque sia la congurazione elettronica da descrivere, sia essa uno stato eccitato, uno stato dissociativo, a shell aperta o ad alto spin. In contrasto i metodi perturbativi e Coupled Clutser (vedi sotto) assumono sempre che una congurazione sia dominante (detta congurazione di riferimento o semplicemente riferimento che in genere descritta da un determinante solo). In pratica uno non ha mai a disposizione una base completa di spinorbitali e quindi I sar un numero nito. In genere uno si assicura che la base monoelettronica sia sufcientemente buona incrementando la dimensione di tale base e monitorando le propriet molecolari di interesse2 . La base N-elettronica di determinanti pu essere ridotta nel caso si desideri una funzione donda di una determinata molteplicit di spin o simmetria spaziale. Se uno risolve il problema CI utilizzando la base polielettronica completa (possibilmente ristretta per simmetria o per spin) in una base monoelettronica incompleta o troncata (gli orbitali HF ottenuti da uno dei basis set per esempio) allora la metodologia is dice Full-CI. Purtroppo il Full-CI intrattabile anche per basi mono-elettroniche molto piccole come si vede dagli esempi seguenti. Dato un set di 2K orbitali molecolari che si ottengono da un calcolo HF di cui N occupati dagli N elettroni 2K del sistema possibile formare determinanti di Slater eccitati differenti. Consideriamo ad esemN pio il caso di un calcolo sulla semplice molecola di H2 O (10 elettroni) con un set di base di qualit DZP (26
Per le altre risulta S 2 1 S 2 2 S 3 S 2 4
2

= = = =

2 1 2 + 3 2 + 3 2 4

da cui si capisce perch utilizzare combinazioni lineari. 2 Nota bene: del tutto inutile monitorare lenergia totale della molecola al variare del set di base in quanto questultima una funzione fortemente dipendente dalla dimensione del set stesso. Molto pi utile monitorare una differenza di energia o qualche altra propriet: dipolo, polarizzabilit ecc.

CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK

69

funzioni e dunque 26 orbitali) e calcoliamo per esercizio il numero di determinanti, o meglio autofunzioni di spin, corrispondenti ad una funzione donda di singoletto (tale lo spin dello stato fondamentale). Il calcolo risulta molto facile se classichiamo le funzioni in base al numero di orbitali singolarmente occupati, come mostra la tabella seguente: Orbitali SO 0 2 4 6 8 10 Determinanti 26 = 65780 5 26 24 = 3435450 2 4 26 22 = 23023000 4 3 26 20 = 43743700 6 2 26 18 = 28120950 8 1 26 = 5311735 10 Singoletti 1 1 2 5 14 42 Stati 65780 3453450 46046000 218718500 393693300 223092870

Questa semplice FCI consterebbe dunque di circa 885 milioni di funzioni di spin di singoletto. Se immaginassimo di dover calcolare la matrice hamiltoniana completa su questo insieme di funzioni, anche supponendo di lavorare con funzioni reali per cui la matrice sarebbe simmetrica, e di memorizzare questa 2 9 matrice sul disco occorrerebbero 885 2 8 byte, oppure 313290000 3 10 Gbyte di memoria o di spazio disco. Questa situazione semplicemente inaffrontabile viene, in pratica, anche se di fatto in piccola misura, semplicata da alcune considerazioni. Innanzitutto, come sappiamo, il numero di elementi di matrice non nulli relativamente piccolo, consistendo solo di quelli fra funzioni che siano al pi doppiamente eccitate luna rispetto allaltra. La matrice CI , come si dice, altamente sparsa, mostrando, come facile vericare, una dipendenza in pratica poco pi che lineare (anzich quadratica) del numero di elementi non-nulli dal numero di congurazioni. Questo tipicamente riduce il numero di elementi di matrice che sono effettivamente da calcolare di qualche ordine di grandezza. In secondo luogo, nel calcolo del numero di stati non abbiamo tenuto alcun conto di argomenti di simmetria. chiaro che la matrice hamiltoniana si fattorizza in base alle rappresentazioni irriducibili del gruppo di simmetria della molecola. Se gli orbitali impiegati appartengono a rappresentazioni irriducibili del gruppo (come accade per gli orbitali risultanti da un calcolo HF) questo anche vero per i determinanti costruiti con essi: la rappresentazione irriducibile di un determinante il prodotto diretto delle rappresentazioni degli orbitali occupati. Questo riduce il numero di funzioni per ogni simmetria di un fattore mediamente pari allordine del gruppo. chiaro in denitiva che queste considerazioni, che introducono fattori di riduzione delle dimensioni del problema di qualche ordine di grandezza, sono effettivamente trascurabili rispetto alla velocit di crescita esponenziale del numero di stati con il numero di elettroni e con la dimensione del set di base. Si confronti ad esempio il caso appena visto (H2 O) con lanalogo esempio del numero di stati di singoletto per la molecola di CO (14 elettroni e 32 funzioni di base). Questo corrisponde ad un aumento di appena 1.4 volte nel numero di elettroni e 1.23 volte nel numero di funzioni di base ma, come facilmente calcolabile, comporta un aumento nel numero di stati dellhamiltoniano di oltre 2000 volte! Cenni matematici della procedura Full-CI
... Se indichiamo con il simbolo |cd ab... il determinante dove gli orbitali a e b sono stati sostituiti dagli orbitali virtuali c e d , allora la funzione donda Full-CI data da: r |0 = c0 |0 + cr a |a + a,r

1 1 1 rs rstu crst |rst crs crstu ab |ab + abc + abcd |abcd + ... 2 abc (2!)2 ab ( 3! ) ( 4! )2 abcd ,rs abc,rst ,rstu (3.2)

CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK

70

che sarebbe la somma dei determinanti relativi allo stato fondamentale e alle singole, doppie, triple, quadruple eccitazioni no alle N-uple eccitazioni dove N e il numero di elettroni. Per esempio per H2 e HeH+ bastano le singole e doppie eccitazioni, per He2 e LiH basta arrivare ad includere le quadruple. Di solito la serie Full-CI intrattabile anche sui computer pi potenti in circolazione quando il numero di elettroni supera i 4-5. Una volta costruite le funzioni eccitate ad N elettroni si possono determinare le energie degli stati ad essi associati utilizzando il metodo della diagonalizzazione dellHamiltoniano. La matrice che si deve diagonalizzare detta matrice CI. Lautovalore pi basso un limite superiore allenergia vera dello stato fondamentale sel sistema. Solo se il nostro set di base fosse innito otterremmo lautovalore esatto. Allinterno dello spazio determinato dal set di base utilizzato comunque la soluzione CI quella esatta. La differenza tra lautovalore pi basso della matrice CI e lenergia di HF ottenuta con lo stesso set di base detta energia di correlazione del basis-set. La funzione donda CI si puo scrivere formalmente: |0 = c0 |0 + cS |S + cD |D} + cT |T + cQ |Q + ... (3.3)

E importante notare che la diagonalizzazione della matrice CI si limita a determinare i set di coefcienti c0 , {cS }, {cD } ecc., ma non ottimizza pi gli orbitali che sono stati determinati con il calcolo HF che ha fornito gli orbitali molecolari. E importante analizzare la struttura della matrice CI anche solo per avere unidea di queli sono effettivamente i contributi importanti che vengono dalla serie della funzione donda. La matrice CI ha questa struttura: 0 |H |0 0 |H |S 0 |H |D 0 |H |T 0 |H |Q ... S|H |S S|H |D S|H |T S|H |Q ... ... D | H | D D | H | T D |H |Q (3.4) ... ... ... T |H |T T |H |Q ... ... ... ... Q|H |Q Struttura che in realt si semplica nel momento in cui si analizzano i singoli elementi della matrice. Si possono infarri dimostrare le seguenti propriet: Non c accoppiamento diretto tra lo stato fondamentale e le singole eccitazioni (teorema di Brillouin): 0 |H |r a =0 Non c accoppiamento tra lo stato fondamentale e le eccitazioni triple o quadruple. Similmente non ce accoppiamento tra le singole e le quadruple. In generale tutti gli elementi di matrice tra determinanti che differiscono per pi di 2 spin-orbitali sono sempre zero. La matrice CI risulta quindi pi semplice: 0 |H |0 0 ... S | H |S ... ... ... ... ... ... Ci sono alcuni commenti da fare: 1. A causa del fatto che le singole eccitazioni non accoppiano direttamente con lo stato fondamentale ci si aspetta che abbiano un effetto piccolo sulla sua energia anche se il loro effetto non sar comunque nullo perch accoppiano con le doppie. In realt le singole eccitazioni sono molto importanti per determinare la distribuzione di carica molecolare.

0 |H |D S|H |D D|H |D ... ...

0 S|H |T D|H |T T |H |T ...

0 0 D|H |Q T |H |Q Q|H |Q

(3.5)

CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK

71

2. Le doppie eccitazioni apportano i contributi pi importanti allenergia di correlazione. Anzi si pu dimostrare che una volta determinati coefcienti delle doppie tramite un Full-CI completo, lenergia di correlazione data da 1 Ecorr = crs 0 | H |rs (3.6) ab 4 ab rs ab 3. Le quadruple eccitazioni sono pi importanti delle sigole o delle triple. 4. Tutti gli elementi di matrice che compaiono nella matrice CI si possono calcolare in termini degli integrali di scambio e coulombiani: mentre gli elementi che coinvolgono lo stato fondamentale sono esprimibili direttamente in termini di integrali bielettronici come per esempio: 0 |H |rs ab = ra|sb rb|sa , (3.7)

alcuni elementi richiedono la valutazione dei contributi di scambio e coulombiano direttamente sugli integrali molecolari, come per esempio:
rs rs ab |H |ab

= r + s a b + Jab + Jrs + Kab Krs 3 Jsb Jsa Jrb Jra + (Ksb + Ksa + Krb + Kra ) 2

(3.8)

per poter valutare tali elementi di matrice qualunque calcolo variazionale di tipo CI o approssimazioni ad esso devono eseguire quella che viene detta Four Index Transformation. Cioe passare dalla rappresentazione degli orbitali atomici a quella degli orbitali molecolari. Questa trasformazione molto pesante e delicata da fare ed un passo lento del calcolo post-HF variazionale ( in generale pi pesante lei di un intero calcolo HF). La trasformazione data da una somma quadrupla e permette di esprimere gli integrali bielettronici espressi nalla base delle gaussiane in quella degli orbitali molecolari:
(i j |k l ) = C iC iC kC l ( | )

(3.9)

In pratica il metodo Full-CI si pu utilizzare solamente per sistemi con un limitatissimo numero di elettroni (in genere < 5). Inoltre, per il fatto che la pesantezza del calcolo Full-CI dipende dal set-di base (dal numero di OM ottenuti da HF) in genere si utilizzano set di base piccoli. Lerrore insito in questi set di base spesso maggiore dellaccuratezza che si ottiene dal fatto di usare un calcolo esatto. E in genere meglio utilizzare approssimazioni alla serie CI (sono tutte basate su un qualche tipo di troncamento dellespressione della funzione donda), ma basis set pi grandi.

3.2.3

Singole e doppie CI

Tra le approssimazioni al calcolo di tipo CI pi in voga da ricordare il CI limitato alle singole e doppie eccitazioni (SDCI o CISD) che di facile gestione e piuttosto rapido. Questo metodo permette di recuperare circa il 90% dellenergia di correlazione di piccole molecole intorno alle geometrie di equilibrio. La funzione donda viene scritta come: |DCI = |0 + ctc |tc +
c,t

c<d t <u

tu ctu cd |cd

(3.10)

lenergia di correlazione si pu ottenere da (H E0 ) |SDCI = Ecorr |SDCI , (3.11)

CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK

72

equazione che pu essere ridotta ad un problema matriciale piuttosto semplice. Come si vede qui non c nessun problema non lineare3 e la situazione del tutto analoga al problema variazionale lineare. E importante notare che lenergia di correlazione calcolata da un SDCI non quella esatta: bench lenergia di correlazione dipenda solo dai coefcienti delle doppie (vedi (3.6)), le doppie che darebbero lenergia corretta devono essere trovate risolvendo un Full-CI.

3.2.4

Come Full-CI risolve il problema della correlazione e il problema della dissociazione.

Prendiamo la molecola di H2 nel suo besis set minimale composto da due funzioni 1s, A e B . Un calcolo RHF produrr due orbitali molecolari 1 e 2 che sono somma e differenza dei due orbitali atomici. Dati i due MO abbiamo il seguente determinante di riferimento 0 = 1 (1) 1 (1) 1 (2) 1 (2)

I due orbitali molecolari sono epressi come somma dei due orbitali atomici 1sA e 1sB dei due atomi di idrogeno 1,2 = A B , il riferimento dato da (a parte la normalizzazione) 0 = 1 (1)1 (2) 1 (1)1 (2) = 1 (1)2 (2)[ (1) (2) (2) (1)] cio la parte spaziale di 0 data data due contributi A (1)A (2) + B (1)B (2) = A A + B B A (1)B (2) + B (1)A (2) = A B + B A H+ H HH

Come si vede chiaramente quando la distanza internucleare va llinnito questa funzione di riferimento dissocia per un 50% in una situazione covalente (H-H) e per un altro 50% in una congurazione ionica (H+ H ) da cui lerrore di degenerazione di cui abbimao gi ripetutamente discusso. In questa base possiamo scrivere 4 determinanti singolarmente eccitati e uno doppiamente eccitato 1 2 3 4 5 = = = = = 2 (1) 2 (1) 2 (2) 2 (2) 2 (1) 1 (1) 2 (2) 1 (2) 1 (1) 2 (1) 1 (2) 2 (2) 1 (1) 1 (2) 1 (1) 1 (2) 2 (1) 2 (2) 2 (1) 2 (2)

Come gi ampiamente visto nella sezione 3.2.1, le congurazioni 4 e 5 sono le componenti Sz = 1 e Sz = 1 di uno stato di tripletto. La combinazione + di 2 e 3 la componente Sz = 0 del tripletto, mentre la combinazione una congurazione singoletto. La molecola di H2 appartiene al gruppo puntuale Dh e i due orbitali molecolari trasformano come le rappresentazioni g (1 ) e u (2 ). La CFS singolarmente eccitata (2 3 ) ha simmetria u (g u u), mentre il riferimento 0 e 1 sono di simmetria g . Il problema Full-CI 6 6 si fattorizza in tre blocchi: un blocco 2 2 per il singoletto 1 g , un blocco 1 1
3 Anche se nel caso di Full-CI o SDCI il problema lineare, non detto che la particolare implementazione non faccia uso di iterazioni. Bisogna per rimarcare che queste iterazioni nulla hanno a che fare con quelle di tipo SCF di Hartree-Fock o dei metodi MCSCF, ma sono solo un modo piuttosto veloce per determinare gli autovalori pi bassi in energia di problemi lineari con dimensioni molto grandi. Il metodo che si usa pi spesso detto metodo iterativo di Davidson.

CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK

73

per il singoletto 1 u ed un blocco 3 3 per il tripletto 3 u (il quale gi diagonale per lortogonalit delle tre autofunzioni di Sz ). La matrice Full-CI risulta: 0 1 g H00 H10 0 0 0 0 1 1 g H01 H11 0 0 0 0 (2 3 ) 1 u 0 0 H 0 0 0 4 3 u 0 0 0 H44 0 0 (2 + 3 ) 3 u 0 0 0 0 H++ 0 5 3 u 0 0 0 0 0 H55

0 1 g 1 1 g (2 3 ) 1 u 4 3 u (2 + 3 ) 3 u 5 3 u

Tabella 3.1: Struttura della matrice Full-CI per il problema di H2 in una base minimale. Il problema Full-CI per lo stato 1 g coinvolge solamente 0 e 1 (riferimento e doppia) e genera una funzione donda CI che data da CI = (a0 0 + a1 1 ) = (a0 + a1 )(A A + B B ) + (a0 a1 )(A B + A B ) Se si confronta questa funzione con quella di riferimento si vede come gli elettroni abbiano pi libert di movimento (ce una funzione eccitata che si porta dietro lorbitale antilegante che adesso accessibile) e quindi unenergia minore (correlazione dinamica). Questa funzione inoltre, quando la distanza internucleare va allinnito, non contiene pi il termine ionico nel momento in cui a1 = a0 risolvendo elegantemente il problerma della correlazione di degenerazione che afiggeva il solo riferimento.

3.2.5

MCSCF (CAS-SCF)

In generale la serie che determina la funzione donda CI converge molto lentamente quando si usano gli orbitali molecolari di HF, ma qualunque troncamento a quella serie produce degli errori apprezzabili sopratutto quando si hanno molti elettroni. Esiste una serie di metodi computationali detti Multi Congurazionali (MCSCF) in cui vengono inclusi nella serie CI solamente pochi determinanti o poche CSF. Scegliere i determinanti da includere non sarebbe per possibile se si usassero gli orbitali molecolari forniti da un calcolo HF in quanto, come abbiamo detto, la risultante serie CI converge lentamente con essi. Il metodo MCSCF quindi non si limita a determinare i coefcienti di mescolamento dei determinanti (come il Full-CI o il SDCI), ma ottimizza simultaneamente anche gli orbitali molecolari. Ricordiamo che i metodi CI in genere sono problemi lineari di diagonalizzazione e non di ottimizzazione di orbitali. Il metodo MCSCF, come suggerisce la presenza dellacronimo SCF, determina sia i coefcienti dellespansione multicongurazionale sia nuovi orbitali molecolari. La funzione donda MCSCF : = Ak k
k

(3.12)

dove k pu essere un singolo determinante, una combinazione di determinanti o pi in generale una funzione spin-correct come le CSF che abbiamo visto in precedenza. Le equazioni algebriche del metodo MCSCF sono piuttosto complicate, ma in termini generali il calcolo si pu svolgere in due modi a seconda che i coefcenti CI Ak vengano o meno ottimizzati simultaneamente a quelli LCAO degli orbitali. Il primo set di Ak viene determinato inizialmente risolvendo un problema lineare variazionale utilizzando come orbitali molecolari quelli forniti da un calcolo HF condotto in precedenza. Non in generale una buona idea utilizzare guess semiempiriche per cominciare un MCSCF! La soluzione (lineare) al problema matriciale fornisce le prime energie MCSCF e i coefcienti Ak . A questo punto il metodo MCSCF richiede, a seconda, uno o due insiemi di iterazioni per ottimizzare la funzione donda.

CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK

74

In ogni caso il funzionale dellenergia lineare nei coefcienti Ak , ma ha una dipendenza non lineare (quartica) dai coefcienti LCAO. La condizione stazionaria in termini dei coefcienti LCAO deve essere quindi risolta iterativamente. Lottimizzazione di una funzione (lenergia in questo caso) di molti parametri non lineari soffre di problemi di convergenza e pu trovare minimi locali e non assoluti della Lagrangiana. In una funzione MCSCF lenergia dipende debolmente da quei coefcienti che contribuiscono agli orbitali debolmente occupati in tutte le congurazioni, mentre dipende fortemente da quelli delle congurazioni dominanti. Anche per questo il numero di CSF che si utilizzano in un calcolo MCSCF deve rimanere piccolo in modo da descrivere nel miglior modo possibile la correlazione non-dinamica. In questultimo caso, infatti, lenergia dipende fortemente da quasi tutti i parametri LCAO e il processo MCSCF meno prono a comportamenti patologici. E comodo vedere la funzione donda MCSCF come lanalogo della funzione donda HF in quei casi dove non possibile ridursi alla semplice rappresentazione mono-congurazionale (anche nel caso ROHF si deve poter usare un solo determinante o una piccola somma vincolata al fatto che leq ?? deve potersi ridurre alla ??). Uno non dovrebbe aspettarsi che le energie calcolate con MCSCF siano accurate esattamente come non ci si aspetta lo siano quelle HF. Si dice che trattamenti MCSCF correggono lenergia HF per quanto riguarda il problema della correlazione di degenerazione dovuta allesistenza di soluzioni degeneri del problema elettronico (cio dovuta alla presenza di pi stati elettronici). Tutti gli effetti di correlazione non palesemente attribuibili ad evidenti fenomeni di quasi-degenerazione vengono genericamente detti di correlazione dinamica. evidente che la linea di demarcazione fra queste categorie in generale piuttosto essibile e mal denita. Possiamo dire che la correlazione dinamica quella parte di correlazione pi strettamente attribuibile alleffettiva interazione istantanea fra coppie di elettroni, cio quella parte intrinsecamente trascurata in qualsiasi modello a particelle indipendenti. Mentre effetti di quasi degenerazione possono essere facilmente incorporati nel trattamento teorico includendo nella CI un numero di norma piccolo di congurazioni, la correlazione dinamica rappresenta il vero problema: essa pu essere rappresentata solo considerando leffetto combinato di un numero generalmente grandissimo di congurazioni come gi detto prima. Lesperienza indica indubbiamente che, una volta che siano incorporate le congurazioni quasi degeneri, il resto della correlazione converge molto lentamente con il numero di congurazioni incluse. La correlazione dinamica non quindi inclusa completamente nelle funzioni donda MCSCF ed in genere necessario proseguire il calcolo per includerla con altri metodi. La conclusione che, sebbene la funzione donda MCSCF possieda essibilit sufciente a rappresentare i cambiamenti nelle strutture elettroniche durante le reazioni chimiche, lenergia che si ottiene non ha accuratezza sufciente: lerrore su dati sperimentali termodinamici e di circa 10-20 kcal/mol. La metodologia concettualmente pi semplice per poter introdurre la correlazione elettronica quella di fare un calcolo SDCI dove per la funzione di riferimento da cui calcolare i determinanti eccitati non pi un singolo determinante HF, ma lintera funzione MCSCF. In questo caso il SDCI di chiama MR-SDCI o MR-CI dove MR sta per Multi-Reference. In generale gli orbitali che escono da un conto MCSCF4 vengono distinti in interni (o di valenza) che sono quelli occupati in almeno uno dei determinanti inclusi nellespansione MCSCF e in esterni (o virtuali) che rimangono vuoti. Le singole e doppie eccitazioni del MRCI ovviamente vengono fatte promuovendo elettroni negli orbitali esterni. Inutile dire che MRCI molto pesante in termini computazionali. Un altro metodo molto utile quello nominato MR-PT (Multi Reference Perturbation Theory). La teoria delle perturbazioni (vedi sotto) viene applicata ad una funzione riferimento multideterminantale. Laccuratezza di tale metodo e confrontabile con MRCI, ma il suo costo decisamente inferiore.
4 Che

sono tanti quanti le contrazioni del set di base, esattamente come in un calcolo HF.

CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK Metodo HF MP2 MCSCF MCSCF+SCI MCSCF+SDCI MCSCF+PT2 (smaller basis) Full-CI CAS-SCF Singlet-Triplet Splitting in CH2 (kcal/mol) 26.14 18.05 12.82 14.48 12.00 12.95 11.97

75

Limplementazione pi diffusa del metodo MCSCF si chiama CASSCF (Complete Active Space Self Consisten Field). La nuova sigla identica solo un modo facilmente automatizzabile per la scelta delle k da inserire nella funzione donda MCSCF. In pratica la ricetta questa: si sceglie il cosidetto spazio attivo (di solito determinato dagli orbitali di valenza) e gli elettroni attivi. Per esempio se volessimo descrivere la molecola di H2 potremmo scegliere uno spazio attivo di due orbitali molecolari (come chimici sappiamo che sono importanti gli 1s dellidrogeno per H2 ) . Se volessimo descrivere LiH potremmo scegliere gli orbitali 1s e 2s del Li e lorbitale 1s dellidrogeno cio useremmo uno spazio attivo di 1s + 2s + 1s = 3 orbitali molecolari. Oppure si potrebbe voler andare oltre la valenza per aumentare la essibilit della funzione e poter descrivere gli stati eccitati. La prima eccitazione elettronica possibile in LiH ovviamente quella che porta il Li(2s) in Li(2 p) e quindi potremmo prendere: 1s + 2s + 3 2 p + 1s = 6 orbitali attivi. Si scelgono gli elettroni attivi, cio quelli che possono essere eccitati nella generazione dei determinanti. Quelli non eccitabili vengono chiamati elettroni di core. Nellesempio di LiH potremmo infatti considerare congelati i due 1s del Li riducendo lo spazio attivo a 5 orbitali molecolari e il numero di elettroni a 2. allinterno dello spazio attivo e usando gli elettroni attivi si costruisce una serie Full-CI. Se lo spazio attivo piccolo (da 3 a 10 orbitali molecolari e il numero di elettroni attivi contenuto <10) anche il Full-CI risultante facilmente gestibile. Il Full-CI il punto di partenza cio leq. (3.12) per lalgoritmo MCSCF. I metodi MCSCF non hanno mai avuto una grande diffusione no a che non stata introdotta la ricetta CAS. Adesso sono molto utilizzati ogni qualvolta serve calcolare energie di stati elettronici eccitati. Il fatto che si costruisca una piccola serie Full-CI allinterno dello spazio attivo, infatti, permette di calcolare diversi autovalori dellHamiltoniano con ragionevole accuratezza.

3.2.6

Il problema della size-consistency

Questo un problema piuttosto complesso e ne accenner solamente i concetti basilari. Per capirlo meglio fare un esempio pratico. Supponiamo di fare un calcolo con una qualunque versione di CI troncato (per esempio SDCI) sul sistema H2 H2 a distanza innita tra i due monomeri e poi di calcolare sempre con SDCI una molecola di H2 isolata. Ci si aspetta che lenergia della supermolecola dissociata sia uguale alla somma delle energie dei due monomeri isolati cio che: EH2 H2 (R ) = 2 E (H2 ) Si trova invece che lenergia SDCI della supermolecola H2 H2 quando la distanza tra le molecole molto grande non uguale alla somma SDCI dei due monomeri calcolati isolati. Questo risultato evidente se

CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK

76

consideriamo il fatto che una descrizione SDCI dei monomeri isolati contiene eccitazioni doppie su entrambi i monomeri che sarebbero rappresentate da eccitazioni quadruple nella supermolecola che per non sono incluse nel calcolo. I metodi di calcolo che soffrono di questo problema sono detti size-inconsistent. Tutte le approssimazioni conosciute a Full-CI non sono size-consistent. Full-CI, HF e i metodi perturbativi lo sono. I risultati SDCI sono spesso modicati utilizzando una semplice correzione introdotta da Langhoff e Davidson, che rende lenergia approssimativamente size-consistent, ma non pi variazionale
2 SDCI Ecorrection = (1 C0 )Ecorr

In letteratura i due termini size extensivity e size consistency sono spesso utilizzati in modo piuttosto libero e non rigoroso. La prima propriet forse quella meglio denita: un calcolo size extensive produce un energia che scala con il numero di particelle linearmente. La seconda propriet invece ha pi a che fare con la dissociazione dei sistemi. Lutilizzo dei due termini piuttosto incerto e certi autori considerano per esempio il RHF size extensive, ma non size consistent perch non produce una dissociazione corretta.

3.3
3.3.1

Metodi non variazionali


Metodi perturbativi MP2 e MP4

Questi metodi migliorano lenergia Hartree-Fock a singolo determinante usando la teoria delle perturbazioni. LHamiltoniano viene partizionato in questo modo: lhamiltoniano imperturbato 5 H0 = [h(i) + vHF (i)]
i

(3.13)

e il perturbatore scelto come


HF 1 (i) V = ri j v i< j i

(3.14)

dove vHF il potenziale di HF cio loperatore: vHF (i) = J j (i) K j (i)


j

Lenergia di ordine zero lautovalore di H0 corrispondente allautofunzione di HF 0 e cio la somma degli autovalori di HF (non lenergia elettronica quindi!). E0 = i
i (0)

La correzione al primo ordine E0


(1)

= = =

0 | V |0 0

i< j

rij 1 |0

vHF (i)|0
i

1 ab||ab a|vHF |a 2 a ab 1 ab||ab 2 ab

=
5 La

scelta di quel perturbatore dovuta al semplice fatto che il perturbatore deve essere piccolo rispetto allHamiltoniano imper1 HF (i) piccolo perch gran parte del contributo (precisamente quello medio) delloperatore r 1 turbato. Il termine i< j ri j i v ij inlcuso nel potenziale di HF.

CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK Quindi la somma dellordine zero e del primo ordine non altro che lenergia elettronica HF. E0 = E0 + E0 = a
a (0) (1)

77

1 ab||ab 2 ab

La prima correzione dovuta alla correlazione quindi quella al secondo ordine. La correzione di secondo ordine allenergia data da | 0|V |n |2 (2) E0 = (0) (0) n=0 E0 En cosa sono gli stati |n ? Lunica che siano eccitazioni doppie
(2) E0 1 rs 0 i< j ri j |ab a<b,r<s 2

a + b r s

| ab | |rs |2 a<b,r<s a + b r s

E possibile calcolare le correzioni al terzo, quarto e quinto ordine, ma le formule sono terribilmente complicate e molto poco interessanti. Il metodo MP2 usa la correzione al secondo ordine, mentre quello MP4 arriva no al quarto. Il metodo MP2 di poco pi costoso di HF in termini computazionali, ma pi accurato perch calcola una frazione signicativa dellenergia di correlazione. Pu essere utiltaizzato su sistemi con molti elettroni (spesso, esclusa DFT, lunica possibilit ab-initio) specialmente per le ottimizzazione delle geometrie nucleari. Per esempio viene usato per ottimizzare preliminarmente una geometria per poi procedere ad un successivo miglioramento del risultato con MP4. MP4, insieme a Coupled-Cluster (CC) che non trattiamo, il metodo di elezione per lo studio dei legami deboli come quelli che si trovano nei cluster (Nen ), nei sistemi di Van der Waals (CO-He) e nei dimeri molecolari (H2 O-H2 O). Questi metodi sono size-consistent ma sono destinati a fallire quando non esiste chiaramente una congurazione dominante: includono infatti (specialmente MP4) molta della correlazione dinamica, ma non gestiscono quella dovuta alla degenerazione.

3.3.2

I metodi Coupled Cluster (cenni)

Il metodo SDCI, come tutti i troncamenti alla serie CI, un metodo non size-consistent. Le teorie coupled cluster suppliscono a questo problema anche se a differenza delle metodologie perturbative sono approssimazioni alla serie CI, ma come vedremo non consistono in un semplice troncamento della serie. Trascurando per semplicit le singole, le triple e le eccitazioni dispari la serie CI data da |0 = c0 |0 +

a<b r<s

rs crs ab |ab +

a<b<c<d t <s<t <u

rstu crstu abcd |abcd + ...

(3.15)

come abbiamo visto precedentemente, per trovare lenergia di correlazione dobbiamo sostituire (3.15) nellequazione seguente (H E0 ) |0 = Ecorr |0 e poi premoltiplicare per 0 |, rs ab | ecc. per ottenere un set di equazioni lineari accoppiate del tipo (cfr. con leq. (3.5))

c<d t <u rs ab | H |0 +

tu 0 H |tu cd ccd

Ecorr

c<d t <u

tu tu rs ab H E0 |cd ccd

rs rstu rstu + rs ab H |abcd cabcd = Ecorr cab

(3.16)

CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK

78

le quali formano una gerarchia di equazioni dove lenergia di correlazione dipende dai coefcienti delle doppie, ma questi ultimi devono essere determinati includendo i coefcienti delle eccitazioni superiori. Come abbiamo ripetuto pi volte dobbiamo troncare questa gerarchia o disaccoppiarla in qualche modo per rendere il calcolo possibile. E possibile approssimare i coefcienti delle quadruple come prodotto di coefcenti di doppie, cio formalmente crstu abcd
tu (crs ab ccd )

(3.17)

in realt non esiste un modo solo di ottenere una particolare eccitazione quadrupla dalle doppie e quindi crstu abcd deve essere la somma di tutti i modi possibili il che rende (3.18) una formula del tipo
tu rs tu rs tu (crs ab ccd ) = cab ccd cab ccd

(3.18)
tu rs crs ab ccd = Ecorr cab

dove

tu crs ab ccd unespressione molto complicata. La seconda tu tu rs rs ab | H |0 + ab H E0 |cd ccd

equazione delle (3.16) diventa 0 H |tu abcd

c<d t <u

c<d t <u

Risolvere una tale equazione tuttaltro che semplice dal punto di vista computazionale visto che lequazione non lineare nelle incognite crs ab . Quello che importante ricordare di tale metodologia che queste equazioni danno vita ad unenergia che size-consistent.

3.4

Simboli di termine, congurazioni elettroniche (atomi e molecole lineari)

Atomi e molecole lineari hanno orbitali che possono essere etichettati secondo la simmetria: per gli atomi abbiamo orbitali di tipo s, p ecc., per le molecole abbiamo orbitali , ecc.. Questi orbitali possono essere visti come regioni di spazio in cui gli eletroni si muovono (al massimo due elettroni di spin opposto alla volta ovviamente). Specicare loccupazione del set di orbitali di un atomo o di una molecola (Nota: il numero di orbitali che si ottiene da un calcolo HF o MCSCF uguale al numero di funzioni di base utilizzate) non riesce univocamente a specicare lo stato elettronico dellatomo o molecola: se prendiamo latomo di O nello stato fondamentale con congurazione elettronica 1s2 2s2 2 p4 si pu facilmente vedere che esistono 15 modi diversi di distribuire gli elettroni negli orbitali 2 p. Esistono quindi 15 stati diversi che si raggruppano in 3 livelli energetici distinti. Non tutti gli stati che provengono da una data congurazione elettronica hanno la stessa energia perch gli elettroni occupano gli orbitali degeneri in modo differente: 2 0 2 1 1 nellesempio dellatomo di O abbiamo una congurazione 2 p2 1 2 p0 2 p1 ed anche una 2 p1 2 p0 2 p1 . Linterazione Coulombiana tra gli elettroni nelle due congurazioni diversa e la prima ha unenergia pi bassa (una delle regole di Hund). Quindi, riassumendo, atomi e molecole hanno una serie di orbitali molecolari disponibili; gli elettroni riempiono questi orbitali in un determinato modo dando vita ad una congurazione. Se alcuni di questi orbitali sono parzialmente occupati, allora esiste pi di uno stato elettronico associato alla congurazione. Se, inoltre, alcuni degli orbitali parzialmente occupati sono degeneri questi stati possono dare vita a livelli energetici diversi. LHamiltoniano non relativistico di un atomo o di una molecola rispetta le seguenti regole di commutazione: nel caso di un atomo lhamiltoniano commuta con i momenti angolari orbitali e di spin totali L2 , Lz , S2 e Sz che sono la somma vettoriale dei singoli momenti angolari degli elettroni (nota che lhamiltonianio non commuta singolarmente con questi ultimi). I numeri quantici buoni sono quindi: L, ML , S e MS . per una molecola lineare (biatomica) con Lz , S2 e Sz , dove lasse z lasse internucleare (nota: H non commuta pi con L2 perch una molecola lineare non ha simmetria sferica). I numeri quantici buoni sono quindi: Lz , S e MS .

CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK

79

3.4.1

Accoppiare gli spin

Stati di spin che sono autofunzioni di S2 e di Sz possono essere ottenute utilizzando loperatore S = Sx iSy che opera su uno stato |S, MS in questo modo (abbassa di un valore il numero quantico MS : cio potremmo dire che inverte la proiezione dello spin di un elettrone). S |S, MS = h S(S + 1) MS (MS 1) |S, Ms 1

Si inizia formando lo stato con il massimo MS compatibile con una data congurazione elettronica (che semplice da trovare perch lo stato con MS = S) e quindi creando stati a MS pi basso utilizzando loperatore S . Per esempio in un sistema a 3 elettroni con congurazione 1s2s3s esistono 8 modi di sistremare gli elettroni in 3 orbitali (23 ). Cominciamo con lo stato rappresentato dal determinante |1s 3 2s 3s |che sarebbe | 3 2 , 2 . Applichiamo a questo stato S una volta considerando che loperatore la somma dei vari operatori elettronici S = s1 + s2 + s3 S 3 3 , 2 2 = (s1 + s2 + s3 )|1s 2s 3s | = h (|1s 2s 3s | + |1s 2s 3s | + |1s 2s 3s |) = che, per la denizione di S data pi sopra, deve essere uguale a h e quindi abbiamo 3 1 , 2 2 1 = (|1s 2s 3s | + |1s 2s 3s | + |1s 2s 3s |) 3 3 2 3 3 +1 2 2 3 1 2 3 1 , 2 2 3 1 =h 3 , 2 2

1 3 3 Gli stati | 3 2 , 2 e | 2 , 2 possono essere ottenuti da ulteriori applicazioni di S (o pi facilmente invertendo la proiezione dello spin di tutti gli elettroni). Si sono cos trovati 4 stati con S = 3 2 . I rimanenti 4 stati 1 con S = 2 possono essere costruiti utilizzando combinazioni lineari dei determinanti con MS = 1 2 che risultino ortogonali alle 4 gi trovate. Questo esempio dimostra come sia possibile trovare per costruzione esplicita le 4 funzioni di quartetto e le 4 di doppietto per un sistema a tre elettroni. Nota: non tutti i sistemi a tre elettroni hanno 8 stati elettronici, infatti la congurazione 1s2 2s non pu avere stati di quartetto, ma ne ha solo due di doppietto.

3.4.2

Accoppiamento dei momenti angolari orbitali

Nel caso di atomi uno deve accoppiare direttamente i vari momenti angolari degli elettroni li a formare il momento orbitale totale L = i li . Dati due momenti angolari l1 e l2 , il momento angolare somma ha come valori permessi la serie |l1 l2 |, |l1 l2 | 1, . . . , l1 + l2 1, l1 + l2 . Per esempio una congurazione del tipo p1 d 1 accoppia i momenti angolari l1 = 1 e l2 = 2. I possibili valori di L sono quini 1, 2 e 3. Questi danno vita a 3 stati diversi P, D e F . Inoltre essendo la congurazione a 2 elettroni saranno possibili per ognuno di questi ultimi lo stato di singoletto e di tripletto. Una congurazione atomica di tipo p1 d 1 da vita a 6 stati elettronici. Nel caso di molecole lineari, uno non deve accoppiare vettorialmente i momenti angolari orbitali perch L2 non commuta con H e L non un buon numero quantico. Per laccoppiamento dei momenti angolari si devono soltanto sommare tra loro i valori di lz dei singoli elettroni. Per esempio accoppiando due orbitali (ciascuno con lz = 1) si ottengono i possibili valori di Lz : 1+1, 1-1, -1+1, -1-1 cio rispettivamente 2, 0, 0 e -2. I due livelli con Lz = 2 sono detti livelli e i due stati con Lz = 0 sono detti . Considerando anche qui lo spin avremmo i seguenti 6 stati: 3 , 3 , 3 , 1 , 1 e 1 . Questo quello che si ottiene nel caso gli elettroni se ne stiano su orbitali non equivalenti cio per esempio in un caso del tipo 1 1 2 1 . Se,

CAPITOLO 3. ENERGIE ELETTRONICHE: METODI POST HARTEE-FOCK

80

invece, gli elettroni riempiono orbitali equivalenti (congurazioni tipo 2 per esempio), la situazione si fa pi complessa perch non tutti gli stati di prima sono compatibili con il principio di Pauli. Ricordando che gli orbitali sono doppiamente degeneri possiamo scrivere una tabella di questo tipo costruendo gli opportuni determinanti compatibili con i valori indicati di ML e di Sz (i valori negativi di tali n.q. non vengono indicati perch gli stati risultanti sono semplici immagini speculari di quelli esplicitati): ML 1 0 2 1 1 1 1 1 / / 0 1 1 1 1

Sz

Si pu vedere come non siano possibili stati com ML = 1 (nel caso di un atomo in congurazione p2 lo sarebbero!). Inoltre lo stato ML = 2 e Sz = 1 (1 1 ) non permesso dal principio di Pauli. Ci rimangono 3 determinanti: uno corrisponde ad uno stato 1 , unaltro ad uno 1 e inne ad un 3 . Nel caso di molecole omonucleari esiste una simmetria addizionale che identica gli orbitali: se sono simmetrici rispetto allinversione attraverso il centro di massa dei nuclei si dicono gerade (g) se sono antisimmetrici si dicono ungerade (u). Calcolare il carattere g o u dello stato elettronico risultatnte dal4 2 loccupazione degli orbitali immediato e dato dal prodotto delle simmetrie6 . Per esempio lo stato u g della molecola O2 si calcola dal prodotto u u u u g g = g e quindi la molecola ha come simbolo di termine 3 g . Se lo stato si aggiunge un quarto identicatore al simbolo di termine che tiene conto della simmetria di riessione attraverso un piano passante per i due nuclei. Si avranno cos termini + o a seconda delle propriet di simmetria dello stato.

6 Orbitali

, , , sono sempre g, orbitali , , , sono sempre u.

Capitolo 4

Descrizione Born Oppenheimer delle molecole


4.1 Calcolo degli stati legati delle curve Born Oppenheimer

Le incognite dellequazione (1.86) sono sia la funzione donda us j (R) sia gli autovalori Es j . Per comodit da ora in poi ci riferiremo ad un solo stato elettronico e quindi elimineremo lindice s dallequazione (1.86) che risulta 1 d2 u j (R) + V j (R)u j (R) = E j u j (R) 2 dR2 dove l (l + 1) V j (R) = V (R) + 2 R2 il potenziale efcace con le barriere centrifughe. Lespressione si pu ulteriormente semplicare: d2 + 2 (E j V j (R)) u j (r) = 0 dR2 (4.1)

La risoluzione numerica dellequazione deve quindi trovare contemporaneamente sia gli autovalori sia gli autovettori dellHamiltoniano. Uno dei metodi possibili quello di utilizzare la diagonalizzazione della matrice Hamiltoniana calcolata sulla base di funzioni arbitrarie ortonormali come i polinomi di Hermite. Un altro quello di integrare numericamente lequazione (1.86). Per un sistema monodimensionale i due metodi sono del tutto equivalenti anche se il primo risulterebbe decisamente pi rapido. In realt la scelta tra i due metodi dipende fortemente dal sistema in esame ed entrambi vengono utilizzati (con delle variazioni signicative) per la descrizione di sistemi pi complessi come i sistemi poliatomici o per la ricerca delle funzioni donda del continuo. Ho scelto il secondo metodo (lintegrazione numerica) perche secondo me di gran lunga pi didattico rispetto al primo. In entrambi i casi autofunzioni e autovalori vengono determinati risolvendo leq (1.86) e imponendo due condizioni al contorno: per un qualunque stato legato, infatti, us j (R) deve essere zero sia per R molto piccoli sia per R grandi. La soluzione u deve quindi soddisfare contemporaneamente le due condizioni al contorno: u(0) = 0 e u(R ) = 0 come indicato in 1.2. Le regioni di spazio dove la u(r) deve andare a zero sono le regioni classicamente proibite cio regioni dove lenergia cinetica del sistema risulta negativa. In queste regioni si pu dimostrare che le possibili soluzioni dell eq. (1.86) sono funzioni esponenziali decrescenti. Data unenergia le intercette di questa retta orizzontale con il potenziale vengono detti turning point. Se lenergia negativa si hanno due turning point se positiva solo uno (quello di sinistra). Per energie negative la funzione donda pu oscillare solo allinterno dei due turning point. Allesterno si hanno gli esponenziali decrescenti. Ne consegue che la funzione donda non pu avere nodi allesterno dei tuning point. 81

CAPITOLO 4. DESCRIZIONE BORN OPPENHEIMER DELLE MOLECOLE

82

4.1.1

Il metodo di integrazione di Numerov per le equazioni differenziali al secondo ordine

Il metodo di Numerov serve ad integrare equazioni differenziali della forma d2y = g(x)y(x) + s(x) dx2 dove g(x) e s(x) sono funzioni date. Lequazione radiale (4.1) ha questa forma con g(x) = 2 [E V (x)] e s(x) = 0. Per risolvere il problema si divide lintevallo spaziale di interesse (cio quello in cui si vuole trovare la soluzione) in N intervallini di ampiezza x. Siano xi i nodi della griglia cos ottenuta e yi = y(xi ) i valori della funzione incognita y(x)in corrispondenza di tali punti. Nel caso delleq. (4.1) la funzione s(x) nulla e la formula di Numerov risulta molto semplice: yn+1 = dove per convenienza si posto: x2 2 [E V (xn )] 2 12 h Questa formula permette di ottenere la soluzione al punto yn+1 conoscendo la soluzione nei due punti precedenti. Come evidente bisogna avere due punti di partenza in cui la funzione nota. Nel problema specico delleq. (4.1) questi punti di partenza si trovano nella regione classicamente proibita a sinistra dove sappiamo che u(0) 0. La soluzione viene infatti integrata punto per punto partendo dalla regione classicamente proibita di sinistra applicando la formula di Numerov. Condizione perch questo metodo funzioni che il passo di integrazione (step size) sia molto piccolo dellordine di 102 103 volte lintervallo di integrazione. fn = 1 + (12 10 fn )yn fn1 yn1 fn+1

4.1.2

Condizioni al contorno e divergenza della funzione donda

Come abbiamo visto esiste un modo semplice di integrare leq. (4.1) partendo da sinistra e proseguendo punto per punto verso destra. In questo modo abbiamo gi incluso nel nostro calcolo una delle due condizioni al contorno. Ma la nostra unequazione differenziale al secondo ordine e quindi richiede unaltra condizione per rimuovere lambiguit sulla soluzione. Un problema includere quindi correttamente laltra condizione al contorno u() = 0. Un altro problema quello di trovare la giusta energia da inlare nel ter [E V (xn )] perch come sappiamo lenergia risulta quantizzata. In realt questi due problemi mine noto 2 h 2 sono due facce della stessa medaglia in quanto proprio limposizione delle due condizioni contemporaneamente a quantizzare lenergia. Adesso dimostrer in pratica come lincludere la seconda condizione al contorno ci permetta non solo di trovare la giusta funzione donda, ma anche lenergia quantizzata. Integriamo (4.1) utilizzando il metodo di Numerov utilizzando unenergia negativa a caso scelta allinterno della buca di potenziale e partendo da sinistra dalla condizione u(0) = 0 e procedendo verso destra no ad addentrarci nellaltra regione classicamente proibita. Ovviamente non necessario partire esttamente da R = 0, ma basta partire da una regione che sia sufcientemente allinterno del turning point di sinistra. Per cominciare ad integrare dobbiamo avere i valori della funzione in yn1=0 e yn=1 che possono essere j+1 presi senza troppi problemi come valori molto piccoli per esempio usando la formula yn = rn . Quello che succede rappresentato in Figura 4.1. Dato un potenziale generico come quello indicato nel pannello (a) cominciamo ad integrare una soluzione delleq (4.1) partendo da sinistra e prendendo come valore dellenergia il valore -0.6. Quando cominciamo ad addentrarci nella regione classicamente proibita a destra la nostra soluzione comincia a crescere e a divergere rapidamente (unesponenziale crescente una possibile soluzione della (4.1) in quella regione anche se quella sicamente priva di senso). Questa soluzione non sicamente corretta perch non rispetta la seconda condizione al contorno. Diminuiamo la nostra energia

CAPITOLO 4. DESCRIZIONE BORN OPPENHEIMER DELLE MOLECOLE

83

Figura 4.1: Calcolo della funzione donda per alcune energie trial usando il propagatore di Numerov di prova a -0.63 e ricominciamo. Questa volta la soluzione sembra comportarsi leggermente meglio, ma diverge lo stesso. Se scendiamo in energia no a -0.65 ottentiamo una soluzione che questa volta diverge nel senso opposto. Usiamo quindi una via di mezzo come -0.645 e otteniamo una buona funzione donda almeno no ad un certo valore di R (pannello (e)). Unulteriore piccola diminuzione dellenergia a -0.6455 ci fa ottenere una soluzione in cui la divergenza si spostata ancora verso R maggiori. Continuando di questo passo si pu fare in modo che la divergenza numerica della funzione donda sia connata sempre pi ad R maggiori e quindi ottenere una soluzione sempre pi vicina a quella vera. Contemporaneamente la nostra energia di prova sar sempre pi simile allautovalore cercato. Questo metodo piuttosto semplice permette di trovare unautofunzione ed un autovalore delleq. (4.1). In realt per poter generalizzare il pi possibile questo metodo bisogna introdurre la conta dei nodi della funzione e un metodo di scelta delle energie di prova. In pratica un eventuale programma potrebbe usare questo motodo per calcolare un numero ssato di stati legati partendo dal pi basso in energia. Questo potrebbe essere lalgoritmo da seguire: 1. dividere la buca di potenziale [De , 0] a met in due intervalli di energia (alto [De /2, 0] e basso [De , De /2]) e iniziare con lenergia a met della buca di potenziale (Etrial = De /2); 2. ssare il numero di nodi desiderato a zero per cercare lo stato fondamentale; 3. integrare una funzione donda di prova da destra verso sinistra no al turning point di destra contando il numero di cambi di segno (i nodi si possono avere solo prima del turning point); (a) se il numero di nodi superiore a quello desiderato cambiare il valore dellenergia di prova in modo che quella nuova sia a met del semintervallo basso (Etrial = De /2 De /4) (bisezione dellenergia) e andare al punto 3; (b) se il numero di nodi inferiore a quello desiderato cambiare il valore dellenergia di prova questa volta scegliendo la met del semintervallo alto (bisezione dellenergia) e andare al punto 3; (c) se il numero dei nodi quello cercato andare al punto 4; 4. integrare la funzione oltre il turning point e vedere quando comincia a crescere in valore assoluto; (a) se diverge ad R sufcientemente grandi (la soluzione pu essere considerata accurata) andare al punto 5; (b) se diverge con valori positivi abbassare lenergia bisezionando ulteriormente lintervallo di energie e andare al punto 3;

CAPITOLO 4. DESCRIZIONE BORN OPPENHEIMER DELLE MOLECOLE (c) se diverge con valori negativi alzare lenergia con lo stesso metodo andare al punto 3;

84

5. aumentare il numero dei nodi desiderato di una unit e se questo inferiore al numero di stati cercati andare al punto 3; se superiore o uguale uscire.

4.1.3

Il metodo dello Shooting

In pratica, bench attuabile, il metodo precedente presenta alcune difcolt: calcolare la funzione donda nelle regioni classicamente proibite rischioso perch il computer facilmente va in overow sugli esponenziali crescenti; stabilire un criterio di accuratezza sulle energie difcile; lalgoritmo lento. Il metodo che si utilizza in pratica il metodo dello shooting che non presenta i problemi elencati ed molto pi rapido nel raggiungere la convergenza. Il programma va alla ricerca della soluzione u(R) con un determinato numero di nodi (la conta dei nodi viene fatta come nel metodo precedente) allinterno di un certo intervallo di energie ssato [Emin , Emax ] e considera inizialmente lenergia E corrispondente al punto medio dellintervallo. Lintegrazione viene fatta da destra verso sinistra partendo dalla regione classicamente proibita dove viene imposta la condizione L = 0. Lintegrazione viene portata avanti no al turning point esterno Rc (right TP). Se il numero dei nodi diverso dal numero richiesto, lenergia molto diversa dallautovalore e si procede a cambiare energia usando il metodo della bisezione: se il numero dei nodi maggiore di quello richiesto signica che E troppo alta, se invece il numero di nodi pi piccolo, signica che E troppo bassa; Viene allora scelto il semintervallo opportuno: rispettivamente [Emin , E ] o [E , Emax ] e si ricomincia ad integrare dalla regione classicamente proibita (vedi Figura 4.2 ).

Figura 4.2: Prima fase del metodo dello shooting Quando il numero dei nodi e quello giusto, si procede con lintegrare una seconda soluzione uR (R) da destra verso sinistra a partire dalla regione classicamente proibita di destra no a Rc (vedi Figura 4.3). In Rc ci sono due valori della soluzione uL (Rc ) e uR (Rc ) che saranno in generale diversi. I due valori sarebbero uguali insieme alle loro derivate prime solo se E fosse un autovalore. Usiamo questa condizione per trovare E . Per prima cosa si scala il valore di uR (R) di un fattore uL (Rc )/uR (Rc ) in modo che le due funzioni abbiano un raccordo continuo. Ottenuta cos una funzione donda continua, la si normalizza. La parte cruciale dellalgoritmo e il calcolo della derivata prima delle due soluzioni al punto di contatto Rc . La differenza R (rc ) L (rc ) nulla quando E corrisponde ad un autovalore. Il segno nella differenza delle derivate ci permette di capire se E troppo alta o troppo bassa e quindi di applicare nuovamente il metodo della bisezione per migliorarne la stima. Si ritiene di essere giunti a convergenza quando lampiezza dellintervallo di energia pi piccola di una certa tolleranza.

CAPITOLO 4. DESCRIZIONE BORN OPPENHEIMER DELLE MOLECOLE

85

Figura 4.3: Seconda fase del metodo dello shooting

Appendice A

Gli spazi di Hilbert


Per denire matematicamente uno spazio di Hilbert e le sue propriet geometriche necessario partire da un concetto molto astratto chiamato spazio metrico. Uno spazio metrico cos generale che pu contenere praticamente qualunque cosa: in pratica un insieme in cui esiste un modo di denire una distanza tra gli elementi. Riguardo la notazione ricordiamo brevemente: se X un insieme allora x X signica che x elemento di X e x / X che non ne elemento; La dicitura per tutti gli x in X abbreviata con (x X ) e quella esiste un x in X tale che con (x X ). Il simbolo {x|P(x)} denota linsieme di x che hanno la propriet P(x). Inne linsieme di coppie ordinate { x, y |x X , y Y } detto prodotto cartesiano degli insiemi X e Y ed indicato con X Y . Ricordiamo che data una funzione a singolo valore che connette due insiemi f : X Y esiste un solo elemento f (x) Y per ogni x X ; inoltre se A Y allora f [A] = { f (x)|x A} un sottoinsieme di Y e viceversa f 1 [B] = {x| f (x) B} un sottoinsieme di X se B Y . X viene detto il dominio di f e f [X ] il suo range indicato con Ran f . Una funzione detta iniettiva (o one-one) se y Ran f , x X tale che f (x) = y; detta surriettiva se Ran f = Y . Se f sia surriettiva che iniettiva detta biiniettiva.

A.1

Spazi metrici

Per prima cosa deniamo la distanza in modo pi generale di quanto si faccia in R3 . Uno spazio metrico un insieme M pi una funzione a valori reali d (, ) denita su M M che soddisfa 1. d (x, y) 0 2. d (x, y) = 0 se e solo se x = y 3. d (x, y) = d (y, x) 4. d (x, z) d (x, y)+ d (y, z) che la disuguaglianza triangolare (vale anche per le normali distanze in R3 dove d (x, y) = (x1 y1 )2 + (x2 y2 )2 + (x3 y3 )2 .) Una sequenza di elementi {xn } n=1 di uno spazio metrico M , d si dice convergere allelemento x M se d (x, xn ) 0 as n . Questa propriet si indica con xn x o con limn xn = x. Una sequenza di elementi {xn } n=1 di uno spazio metrico M , d si dice sequenza di Cauchy se > 0 N n, m N implica che d (xn , xm ) < . Tutte le sequenze convergenti sono sequenze di Cauchy, ma lopposto non vero: per esempio dato linsieme di numeri razionali Q in cui la distanza d (x, y) denita come al solito con |x y|, sia x 86
d

APPENDICE A. GLI SPAZI DI HILBERT


d

87

un numero irrazionale. Se xn una sequenza di razionali tale che xn x , allora xn una sequenza di Cauchy, ma non converge perch il limite non elemento di Q. Uno spazio metrico in cui tutte le le sequenze di Cauchy convergono si dice completo. Per esempio R un insieme completo, mentre Q non lo . Questo esempio dovrebbe fare intuire quale loperazione matematica necessaria a creare uno spazio metrico completo da uno incompleto: si devono aggiungere allo spazio incompleto tutti i limiti delle sequenze di Cauchy. La condizione sotto cui questa cosa si pu fare non ovvia n banale. Cominciamo con il denire il concetto di insieme denso: un insieme B si dice denso nello spazio metrico M se ogni m M un limite degli elementi di B. Perch uno spazio incompleto X , aggiugendo i limiti delle serie di Cauchy, dovrebbe essere possa essere trasformato nell spazio completo X un insieme denso nello spazio X . Nellesempio precedente, se vogliamo completare lo spazio dei numeri razionali Q dobbiamo aggiungere tutti i limiti in modo da ottenere lo spazio completo R. La condizione perch questo possa essere fatto che Q sia un insieme denso di R. Il problema che se B non gia contenuto in M (come Q lo in R), la denzione di insieme denso non si sa bene cosa voglia dire. Per risolvere la situazione si deve introdurre un ulteriore concetto, quello di isometria: una trasformazione biiniettiva h da X , d a Y , che preserva la metrica (h(x), h(y)) = d (x, y) chiamata isometria. La cosa pi importante a proposito di isometrie che, se una propriet vale per la struttura metrica X , d , varr anche in tutti gli spazi ad essa isometrici. Ora possiamo formalizzare cosa signica completare uno spazio metrico: esiste, infatti, un teorema che ci assicura che sempre possibile ingrossare uno spazio incompleto in modo da renderlo completo: dato uno spazio metrico incompleto M , d sempre possibile trovare uno spazio metrico tale che M sia isometrico ad un sottospazio denso di M . completo M

A.2

Spazi vettoriali

Passiamo dagli astratti spazi metrici ai pi familiari spazi vettoriali. Deniremo prima gli spazi normati perch sono pi generali e quindi gli spazi dotati di prodotto scalare. Uno spazio lineare normato uno spazio vettoriale V su R o su C pi una funzione norma da V a R che soddisfa 1. 2. 3. 4. v 0 v V v V , C v, w V ,

v = 0 se e solo se v = 0 v = v v+w v + w

La norma nel caso di uno spazio Rn quella tradizionale, cio la lunghezza dei vettori (x1 , . . . , xn ) = i |xi |2 La presenza di una norma induce una metrica naturale d (v, w) = v w . Questo signica che gli spazi normati sono un tipo particolare di spazi metrici. Lesistenza di una norma aggiunge alla possibilit di misurare le distanze tra elementi (metrica) anche la possibilit di misurare la lunghezza dei vettori. Adesso introduciamo il concetto di prodotto scalare (in inglese inner product o dot product) che permette anche di denire in un certo senso anche il concetto di angolo tra i vettori.

APPENDICE A. GLI SPAZI DI HILBERT

88

Uno spazio vettoriale V sui complessi si dice uno spazio con prodotto scalare se esiste una funzione (detta prodotto scalare) a valore complesso (, ) denita su V V che soddisfa le seguenti condizioni per tutti i x, y, z V e C: 1. (x, x) 0 e (x, x) = 0 se e solo se x = 0 2. (x, y + z) = (x, y) + (x, z) 3. (x, y) = (x, y) e ( x, y) = (x, y) 4. (x, y) = (y, x) Esempi: Se lo spazio Cn denota linsieme delle n-uple di numeri complessi, dati x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ) allora una possibile denizione di prodotto scalare (in analogia con lo spazio dei vettori Rn )
(x, y) = xi yi i=1 n

Nello spazio C[a, b] che rappresenta linsieme delle funzioni complesse continue nellintervallo [a, b] il prodotto scalare si denisce, date f (x), g(x) C[a, b]
b

( f , g) =
a

f (x)g(x)dx

Una delle propriet pi importante degli spazi con prodotto scalare che sono anche spazi normati. Ogni spazio con prodotto scalare anche uno spazio normato con norma data da 1 x = (x, x) 2 . Di conseguenza abbiamo una metrica denita in modo naturale d (x, y) = (x y, x y)
1

Uno spazio con prodotto scalare completo rispetto alla norma x = (x, x) 2 detto spazio di Hilbert. Due spazi di Hilbert H1 e H2 sono isomor se esiste un operatore lineare U da H1 a H2 tale che (Ux, Uy)H2 = (x, y)H1 x, y H1 . Questi operatori lineari sono detto operatori unitari (perch preservando il prodotto scalare, preservano anche la norma cio la lunghezza dei vettori). Esempi: Deniamo L2 [a, b] come il set di funzioni integrabili a valore complesso nellintervallo [a, b] che rispettino la condizione ab | f (x)|2 dx < . Deniamo il prodotto scalare come
b a

f (x)g(x)dx

si pu dimostrare che questo spazio completo ed quindi uno spazio di Hilbert in cui norma data da
b

f =
a

| f (x)| dx

1 2

2 Deniamo l 2 lo spazio delle sequenze {xn } n=1 di numeri complessi che soddisfano n=1 |xn | < . Il prodotto scalare pu essere denito come ({xn } n=1 , {yn }n=1 ) = yn xn

n=1

Questo esempio importante perch si pu dimostrare che ogni spazio di Hilbert a dimensione innita, ma numerabile isomorfo a l 2 .

APPENDICE A. GLI SPAZI DI HILBERT

89

A.3

Spazio duale

Adesso abbiamo tutti gli strumenti per poter affrontare il problema dello spazio duale. Prima dobbiamo denire il concetto di trasformazione lineare limitata o operatore limitato. Questi oggetti esistono negli spazi normati (dove si pu in un certo senso stabilire un limite). Un operatore limitato da uno spazio normato V1 , 1 ad un altro V2 , 2 una funzione T che soddisfa 1. T ( v + w) = T v + Tw (v, w V )( , C) 2. dato un numero C > 0, T v 2 C v 1 . Il numero C pi piccolo denisce la norma delloperatore che quindi lestremo inferiore delle norme in V1 T = inf Tv
v 1 =1 2

Prendiamo linsieme di tutte le trasformazioni lineari limitate che connettono due spazi di Hilbert e chiamiamolo L (H1 , H2 ) e poi interessiamoci del caso particolare in cui il secondo spazio di Hilbert coincide con C. Lo spazio L (H1 , C) detto spazio duale di H e pu essere idicato con H . Gli elementi di H sono detti funzionali lineari continui. Esiste un teorema importante dellanalisi (lemma di Riesz) che ci assicura che, preso un funzionale lineare T H qualunque, esiste ed unico un elemento dello spazio di Hilbert y H tale che T (x) = (y, x) per ogni x H . Inoltre y H = T H . Per denizione risulta vero anche linverso del lemma di Riesz cio che ogni y H denisce un funzionale lineare continuo T su H attraverso la relazione T (x) = (y, x) che la denzione di prodotto scalare che abbiamo usato noi precedentemente quando abbiamo introdotto il conceto di spazio dei bra.

A.3.1

Basi

Finiamo questa appendice menzionando 3 teoremi che completano le propriet degli spazi di Hilber che sono rilevanti per la meccanica quantistica elementare: 1. Ogni spazio di Hilbert possiede una base ortonormale. 2. Se H uno spazio di Hilbert e S = {x } A una base ortonormale. Allora ogni y H pu essere espresso come combinazione lineare y=
A

(x , y)x

|(x , y)|2

questo teorema estende al caso innito-dimensionale quello che siamo abituati a vedere come il normale teorema di espansione nel caso di basi o spazi vettoriali niti. 3. Denizione: uno spazio metrico si dice separabile se ha un sottoinsieme numerabile denso. Uno spazio di Hilbert separabile se ha una base ortonormale numerabile S. Se ci sono N < elementi nella base, allora H isomorfo a CN . Se ci sono inniti elementi numerabili in S, allora H isomorfo a l 2 . Questo teorema ci assicura che gli spazi di Hilber a dimensione nita rientrano nel caso pi semplice di spazi vettoriali Cn o Rn .

Appendice B

Il programma LEVEL
Il programma LEVEL determina il numero, le energie e le propriet dei livelli vibro-rotazionali di un dato potenziale monodimensionale. Il nucleo del programma quindi risolve per le autofunzioni e per le energie la seguente equazione h 2 d 2 , j (R) + V j (R) , j (R) = E , j , j (R) 2 dR2 dove e la massa ridotta del sistema a due particelle, j il numero quantico del momento angolare e il potentiale efcace V j (R) la somma dellenergia elettronica Born-Oppenheimer pi il termine centrifugo. Per una molecola biatomica il termine centrifugo dato da: [ j( j + 1)] . 2 R2 Quello che fa il programma determinare le energie E , j e le autofunzioni , j . Laccuratezza del calcolo determinata in massima parte dalla dimensione della griglia radiale di integrazione [Rmin , Rmax ] e dallo step di integrazioneR cio dalla variabile RH che viene letta a riga #4 del le di input. Se lo step di integrazione troppo grande si otterranno valori inaccurati delle energie, mentre se troppo piccolo il tempo di calcolo pu diventare eccessivo. La dimensione della griglia invece deve essere abbastanza grande da poter includere anche gli stati vibrazionali pi diffusi (eccitati). Lintegrazione viene condotta da Rmin verso destra e da a Rmax verso sinistra con il propagatore di Numerov. Per iniziare la propagazione necessario specicare il valore della funzione in due punti adiacenti per ognuno dei due limiti di integrazione: poco oltre Rmax la funzione viene inizializzata ad un valore arbitrario (uno per esempio) mentre al punto adiacente (pi interno) viene calcolata usando lapprossimazione semiclassica WKB: , j [V j (R) E , j ]1/4 exp 2 [ h 2
Rmax Rmin

[V j (R ) E , j ]1/2 dR

A corto raggio i potenziali realistici crescono rapidamente con il diminuire della distanza R e la muore molto rapidamente nella regione classicamente proibita, quindi la funzione donda viene inizializzata a zero ponendo , j (Rmin ) = 0 e dando alla funzione al punto adiacente , j (Rmin + R) un valore piccolo arbitrario. La procedura utilizzata quella dello shooting in cui, per una data energia di prova, lintegrazione viene effettuata verso linterno partendo da Rmax e verso lesterno partendo da Rmin no a quando i due segmenti di funzione donda si incontrano ad un certo punto di matching Rx . La discontinuit delle loro pendenze viene quindi utilizzata come indicatore per migliorare lenergia di prova no a convergenza. Il programma LEVEL sceglie Rx in modo che sia localizzato allinterno dei due turning point nella regione classicamente permessa. In genere le distanze Rmin e Rmax devono trovarsi ben allinterno delle regioni classicamente proibite cos che la funzione donda sia vari ordini di grandezza pi piccola rispetto alla sua ampiezza nella regione classicamente permessa. Il codice LEVEL stampa un messaggio di warning se questo rapido decadimento non 90

APPENDICE B. IL PROGRAMMA LEVEL

91

almeno di un fattore 109 . Se questo accade potrebbe essere necessario diminuire Rmin o aumentare Rmax . Al contrario se Rmin o Rmax sono troppo allinterno delle regioni classicamente proibite il fattore [V j (R) E ] potrebbe risultare troppo grande e il propagatore di Numerov diventare instabile. Per una molecola biatomica questo pu succedere solo per Rmin . Se il caso un messaggio di warning viene stampato e il valore di Rmin viene automaticamente aumentato internamente al programma nch il problema scompare. Allinterno di LEVEL possibile utilizzare molte forme analitiche di potenziale dalle pi semplici come il potenziale di Morse V (R) = De 1 e (RReq ) alle pi complicate come il potenziale HDF V (R) = A R Req
p 2

1 RR 0 RR eq eq

R Req

Rm
m

Cm

o utilizzare direttamente i punti del calcolo ab-initio indicando a LEVEL stesso di utilizzare una forma di interpolazione di questi punti (tipicamente una interpolazione tipo cubic spline).