Professional Documents
Culture Documents
Nous utiliserons la convention habituelle des indices latins pour les coordonnées spatiales et les
indices grecs pour les coordonnées spatio-temporelles. L'indice 0 est le temps.
I. Vers une équation d'onde relativiste
En mécanique quantique, les états d’un système sont représentés par des vecteurs normalisés ψ
(ou des matrices de densités ρ = ∑ pi ψ i ψ i ) d’un espace de Hilbert H : φ ψ
2
(ou φ ρ φ )
est la probabilité de trouver le système dans l’état φ . Les observables physiques sont identifiés
avec les opérateurs hermitiques, A = A + (mais généralement non bornés), sur l’espace H . La
valeur moyenne de l’observable A quand le système est dans l’état ψ , c’est à dire, la valeur
moyenne de plusieurs mesures sur des systèmes préparés identiques, est ψ Aψ . L’évolution dans
le temps du système sous ses auto-interactions ou sous des forces externes représentées par des
champs de forces classiques donnés est décrite par l’équation de Schrödinger :
∂
(1) ih ψ (t ) = H ψ (t )
∂t
ou de manière équivalente
(2) ψ (t 2 ) = U (t 2 , t1 ) ψ (t1 )
Il arrive fréquemment qu’un système soit invariant sous certaines symétries, par exemple, les
symétries des forces externes. Un théorème de Wigner dit alors que de telles symétries sont
représentées par des opérateurs unitaires (ou anti unitaire), qui projettent l’espace de Hilbert sur lui-
même, conservent le module des produits scalaires et commutent avec H.
Un opérateur B est dit être antilinéaire si
(4) B(λ φ + µ ψ ) = λ∗ B φ + µ ∗ B ψ
∗
En définissant son adjoint B + par Bφ ψ = φ B +ψ = B +ψ φ , B est anti unitaire si
∗
Bφ Bψ = φ B + B ψ = φ ψ = ψ φ .
D’un autre coté, la relativité restreinte dit que les lois de la nature sont indépendantes du repère de
l’observateur s'il appartient à la classe des repères, les "repères galiléens", obtenus les uns des
autres par des transformations du groupe de Poincaré. Ce dernier est généré par les translations
spatiales et temporelles, les rotations usuelles de l’espace et les transformations spéciales de
Lorentz (ou mouvements boosts), qui relient des repères relatifs en mouvement avec une vitesse
relative constante. La vitesse de la lumière c est une limite supérieure absolue à la vitesse de tout
signal. L’information originaire du point spatio-temporel (x 0 , t 0 ) atteint seulement les points
(x1 ,t1 ) dans le cône du futur
(5) c 2 (t1 − t 0 ) − (x1 − x 0 ) ≥ 0 t1 − t 0 ≥ 0
2 2
C’est l’expression relativiste de la causalité. Pour des vitesses typiques beaucoup plus petite que c,
la mécanique galiléenne est une approximation valable.
Nous pouvons nous attendre à quelques problèmes dans la recherche d’une description relativiste et
quantique de la particule ponctuelle. En effet, la relativité associe une échelle de moment p = mc à
une particule de masse m. Mais les relations d’indétermination ∆x ⋅ ∆p ~ h nous disent que pour
des échelles de longueur plus petite que la longueur d’onde de Compton D = h / mc ( D = 3.8 × 10 −11
cm pour l’électron), le concept de particule ponctuelle peut souffrir de difficultés. Analyser la
position d’une particule avec une plus grande précision nécessite une énergie-impulsion du même
ordre que la masse au repos, donc permet la création de nouvelles particules. Nous voyons que cela
conduit inévitablement au concept d’anti particule. Néanmoins, à une échelle intermédiaire, la
mécanique quantique relativiste est applicable et justifie les développements suivants.
Pour combiner l’invariance relativiste avec la mécanique quantique, retournons au principe de
correspondance. Dans la représentation usuelle de représentation coordonnées de la mécanique
( )
quantique, nous associons les opérateurs ih(∂ / ∂t ) et (h / i )∇ i = (h / i ) ∂ / ∂x i à l’énergie E et au
i
moment p respectivement. Pour une particule massive libre, l’énergie est donnée en terme de
moment par
p2
(6) E = + constante
2m
dans le schéma non relativiste et par
(7) E 2 = p 2 c 2 + m 2 c 4
dans le cas relativiste.
A moins que cela soit spécifié explicitement, nous utiliserons le système d’unités pratique tel que
h = c = 1.
Bien que cette équation n’ait pas la forme de Schrödinger (1), nous pouvons y remédier en la
mettant sous forme matricielle. En introduisant les notations
ψ −1 ≡ mψ
∂ψ
(10) ψ 0 ≡
∂t
∂ψ
ψ i ≡ i i = 1,2,3
∂x
le vecteur ψ = {ψ ε }(α = −1,0, K ,3) satisfait
~
∂ψ
1
(11) i ~ = mβ + α ⋅ ∇ ψ
∂t i ~
pour un ensemble souhaitable de matrices hermitiques 5x5.
Si nous désirons interpréter ψ comme une fonction d’onde, nous devons trouver une norme non
négative, conservée par l’évolution dans le temps. Il existe en effet une équation de continuité :
∂
(12) ρ + div j ≡ ∂ µ j µ = 0
∂t
( )
où le quadrivecteur j µ ≡ j 0 = ρ , j i est définit comme
i ∗ ∂ ∂ψ ∗
ρ= ψ ψ− ψ
2m ∂t ∂t
(13)
j=
1
2im
[ψ ∗∇ψ − (∇ψ )∗ψ ]
Sous forme intégrale nous avons de manière équivalente
∂
(14) − ∫ ρ d 3 x = ∫ j ⋅ dS
∂t V S
qui exprime que le changement dans la "charge" totale à l’intérieur du volume V correspond au flux
de j à travers la surface S enfermant V. Cependant, la densité ρ n’est pas définie positive. Donc,
elle peut être considérée comme la densité d’une quantité conservée (la charge électrique par
exemple), mais pas comme une probabilité positive.
Un second problème apparaît quand nous constatons l’existence de solutions d’énergie négative.
Toute fonction d’onde plane
(15) ψ (x, t ) = N exp[− i (Et − p ⋅ x )]
satisfait l’équation (9), pourvu que E 2 = p 2 + m 2 . Donc les énergies négatives E = − p 2 + m 2
sont sur le même pied que les énergies physiques E = p 2 + m 2 . C’est une difficulté sévère parce
que le spectre n’est plus limité par le bas. Il semble qu’une somme arbitrairement grande d’énergie
puisse être extraite du système. Pour une particule initialement au repos, cela sera le cas si une
perturbation externe lui permet de sauter le gap d’énergie ∆E = 2m entre le continuum d’états
positif et négatif. C’est clairement un défaut dans le concept de particule stationnaire stable.
Ces raisons semblaient à ce point si insurmontable, qu’elles conduisirent Dirac à introduire une
autre équation. Bien que cette dernière ait une norme positive, nous serons ultimement face au
même problème d’interprétation physique des états d’énergie négative.
Exercices
1. Ecrivez explicitement un ensemble de matrices 5x5 ainsi qu'une condition auxiliaire afin de
reproduire un ensemble d’équations équivalentes à (8) de la section I.1.
II. Equation de Dirac
1. Les composantes de ψ doivent satisfaire l’équation de Klein-Gordon, ainsi une onde plane
avec E 2 = p 2 + m 2 est une solution.
2. Il existe un quadrivecteur densité de courant qui est conservé et dont la quatrième composante
est une densité positive.
3. Les composantes de ψ ne doivent satisfaire aucune condition auxiliaire, c’est-à-dire qu'à un
temps donné elles sont des fonctions indépendantes de x..
Introduisons la notation γ µ :
γ0 =β
(4) γ i = βα i i = 1,2,3
{γ µ
,γ ν
}= 2g µν
L’équation de Klein-Gordon est alors obtenue en multipliant par (i∂/ + m ) . Quatre est la plus petite
dimension pour laquelle des matrices satisfaisant (2) peuvent être trouvées.
existe seulement trois matrices hermitiques anticommutantes, les matrices de Pauli, nous avons
d ≥ 4.
Parmi tout les représentations équivalentes, obtenues par une transformation non singulière :
γ → UγU −1 , la représentation de Majorana joue un rôle spécial. Elle est choisie pour rendre
l’équation de Dirac réelle. Ceci est obtenu en échangeant α 2 et β et en changeant le signe de α 1 et
α dans la représentation précédente : αˆ = −α , αˆ = β , αˆ = −α , βˆ = α . Alors seul β̂ est
3 1 1 2 3 3 2
imaginaire et l’équation de Dirac :
∂
(8) + αˆ ⋅ ∇ + iβˆ m ψ = 0
∂t
est réelle. Ses solutions sont des combinaisons linéaires de solutions réelles. La matrice U qui
effectue ce changement de représentation et la nouvelle forme des matrices peut facilement être
déterminée.
ϕ
Dans la représentation à quatre dimensions (7), ψ peut être écrit comme un bispineur ψ = en
χ
terme de spineurs à deux composantes ϕ et χ . Pour des raisons qui seront bientôt claires, ϕ et χ
sont appelées respectivement les grandes et petites composantes. Elles satisfont
∂ϕ 1
i ∂t = mϕ + i σ ⋅ ∇χ
(9)
∂χ 1
i = − mχ + σ ⋅ ∇ϕ
∂t i
Il est intéressant de noter la similarité entre ces équations de deux des quatre équations de Maxwell
:
∂B
rot E + =0
∂t
(10)
∂E
rot B + =0
∂t
ou explicitement
∂E 1
i = S ⋅ ∇(iB )
∂t i
(11)
∂(iB ) 1
i = S ⋅ ∇(E )
∂t i
( )
où S jk = (1 / i )ε ijk .
i
Les matrices de spin S i jouent pour le spin 1 du champ électromagnétique le même rôle que les
matrices de Pauli σ i pour le spin 1/2 et (E, iB ) est l’analogue de (ϕ , χ ) .
La principale raison pour la construction de l’équation de Dirac était d’obtenir une densité de
probabilité positive ρ = j 0 , avec l’équation de continuité ∂ µ j µ = 0 . Puisque ψ est un spineur
complexe, ρ doit avoir la forme ψ + Rψ afin d’être réel et positif. Dérivons premièrement
l’équation de Dirac pour ψ + . De (6) nous déduisons
←
(12) ψ + iγ + µ ∂ + m = 0
Donc en introduisant ψ :
(14) ψ = ψ + γ 0
nous avons
←
(15) ψ i ∂/ + m = 0
En combinant les équations (6) et (15) on a
← →
( )
(16) ψ ∂/ + ∂/ ψ ≡ ∂ µ ψ γ µψ = 0
La densité ρ est positive. Les petites et grandes composantes contribuent également à ρ tandis
que j implique des termes croisés. Nous verrons ci-dessous que j µ se transforme comme un
quadrivecteur de Lorentz.
II.2. Covariance relativiste
En accord avec le principe de la relativité, nous désirons vérifier que l’équation de Dirac garde sa
forme dans deux repères reliés par une transformation de Poincaré. Alternativement, nous
nécessitons que pour un système satisfaisant l’équation avec certaines conditions de liaison dans un
repère donné nous pouvons associer par les transformations de Poincaré une famille d’états
transformés satisfaisant la même équation avec les conditions de liaisons transformées.
Pour le premier point de vue (indépendance par rapport à l’observateur), nous remarquons
premièrement que l’invariance à la translation est évidente. Considérons maintenant une
transformation de Lorentz Λ . Soit notre système décrit par la fonction d’onde ψ dans le premier
repère et par ψ ′ dans le second. Les deux doivent satisfaire l’équation de Dirac :
∂
(1) iγ µ µ ψ ( x ) − mψ ( x ) = 0
∂x
∂
(2) iγ µ µ ψ ′( x ′) − mψ ′( x ′) = 0 avec x ′ = Λx
∂x
Il doit y avoir une relation locale entre ψ et ψ ′ , telle que l’observateur dans le deuxième repère
doit pouvoir reconstruire ψ ′ lorsque ψ est donné. Nous supposons que cette relation est linaire :
(3) ψ ′( x ′) = S (Λ )ψ ( x )
où S (Λ ) est une matrice 4x4 non singulière. L’équation (2) s’écrit maintenant
∂xν ∂
(4) iγ µ
S (Λ )ψ ( x ) − mS (Λ )ψ ( x ) = 0
∂x ′ µ ∂xν
( )
Afin que cette équation soit une conséquence de (1) pour tout ψ , et puisque ∂xν / ∂x ′ µ = Λ−1
ν
µ ,
nous devons avoir
( )
(4) S (Λ )γ µ S −1 (Λ ) = Λ−1
µ
ν γν
Construisons d’abord S (Λ ) pour une transformation propre infinitésimale Λ , qui peut être écrite
comme
Λµ ν = g µ ν + ω µ ν
(5)
( ) µ
Λ−1 ν = g µ ν − ω µ ν + L
où la matrice infinitésimale ω µν est anti symétrique. Nous écrivons
S (Λ ) = I − σ µν ω µν + L
i
(6) 4
S −1 (Λ ) = I + σ µν ω µν + L
i
4
où les matrices σ µν sont antisymétriques en µν . Au premier ordre en ω , l'équation (4) donne
[ ] (
(7) γ µ , σ αβ = 2i g µ α γ β − g µ β γ α )
Un ensemble de matrices σ µν satisfaisant ces relations est donné par
(8) σ µν =
i
2
[
γ µ ,γ ν ]
Une transformation finie est de la forme
[
(9) S (Λ ) = exp − (i / 4)σ µν ω µν ]
µν
où ω est maintenant fini.
Pour des rotations spatiales S est unitaire, tandis qu’il est hermitique pour des translations de
Lorentz.
La forme des transformations finies est plus facilement dérivée dans la représentation chirale des
matrices γ :
0 −I σ 0 0 σ
γ 0 = β = α = γ =
− I 0 0 −σ −σ 0
σ 0
(10) σ 0i = [γ 0 , γ i ] = −iα i i
i
2 0 −σi
σ
i
[ ] [
i
]
σ ij = γ i , γ j = − α i ,α j = ε ijk k
0
2 2 0 σk
Nous rappelons que les représentations du groupe de Poincaré sont classées en accord avec les
valeurs de deux opérateurs de Casimir P 2 et W 2 . Pµ est l’opérateur énergie-impulsion, qui est le
générateur infinitésimal des translations, tandis que Wµ est construit à partir de l’opérateur moment
angulaire J µν , le générateur infinitésimal des transformations de Lorentz, comme
1
(11) Wµ = − ε µνρσ J νρ P σ
2
Finalement, nous dérivons la loi de transformation du spineur ψ sous la parité. Nous avons à
nouveau à trouver S (Λ ) satisfaisant (4), où Λ dénote la matrice
1
−1
(18) Λµ ν =
−1
− 1
Les formes bilinéaires variées construites avec ψ et ψ jouent un rôle important en physique des
particules. Le reste de cette section est dévoué à leurs propriétés de transformation sous les
transformations de Lorentz. De l’équation (3), nous déduisons que
(20) ψ ′( x ) = ψ ( x )γ 0 S (Λ ) γ 0 = ψ ( x )S −1 (Λ )
+
où la seconde expression est vérifiée en utilisant les expressions explicites (9) de [et (19) pour la
parité]. Donc un produit bilinéaire ψ ( x ) Aψ ( x ) se transforme selon
(20) ψ ′( x ′)Aψ ′( x ′) = ψ ( x )S −1 (Λ ) AS (Λ )ψ ( x )
Plus généralement, toute matrice 4x4 peut-être développée sur une base de 16 matrices. On peut
montrer que l’algèbre générée par les matrices γ , une algèbre de Clifford pour les mathématiciens,
n’est rien d’autre que l’algèbre complète de ces matrices 4x4. Introduisons la notation
(22) γ 5 ≡ γ 5 ≡ iγ 0γ 1γ 2γ 3
Un consensus n’a pas été obtenu sur cette notation. Quelques auteurs introduisent le facteur i (alors
γ 52 = −1 ), ou utilisent un signe différent.
La matrice γ 5 satisfait
{ }
(23) γ 5 , γ µ = 0 et γ 5 ( ) 2
=I
(24) Γ T µν ≡ σ µν =
i
2
[
γ µ ,γ ν ]
Γ A µ ≡ γ 5γ µ
ΓP ≡ γ 5
± 1 ou ± i .
{ }
5. De ces propriétés, nous déduisons l’indépendance linéaire de notre ensemble Γ a . Supposons
que
∑ λa Γ a = 0
a
En utilisant cette base, nous donnons maintenant les propriétés des combinaisons ψ ( x ) Aψ ( x )
bilinéaires correspondante sous les transformations propres de Lorentz ou de parités :
S ψ ′(x ′)ψ ′( x ′) = ψ ( x )ψ ( x ) scalaire
V ψ ′( x ′)γ ψ ′( x ′) = Λ ν ψ ( x )γ ψ ( x )
µ µ ν
vecteur
(26) T ψ ′( x ′)σ µνψ ′( x ′) = Λµ ρ Λν σ ψ ( x )σ ρσ ψ (x ) tenseur antisymétrique
A ψ ′( x ′)γ 5γ ψ ′( x ′) = det (Λ )Λ νψ ( x )γ 5γ ψ ( x )
µ µ ν
pseudovecteur
P ψ ′(x ′)γ 5ψ ′( x ′) = det (Λ )ψ ( x )γ 5ψ ( x ) pseudoscalaire
χ (m,0 )
(α )
2m
De même, soit
Λ − (k ) ≡ ∑ v (α ) (k ) ⊗ v (α ) (k )
α =1, 2
(k/ − m )1 − γ (k/ − m )
0
1
(11) =
2m(m + E ) 2
− k/ + m
=
2m
Les opérateurs Λ + et Λ − projettent sur les états d'énergie positive et négative respectivement. Ils
satisfont
Λ2× (k ) = Λ ± (k )
(12) tr Λ ± (k ) = 2
Λ + (k ) + Λ − (k ) = I
La normalisation dans (8) est invariante de Lorentz. Cependant, la densité définie positive par unité
de volume est ρ = j 0 (k ) = ψ (k )γ 0ψ (k ) . Calculons cette densité pour nos fonctions d’onde plane
ψ ( + )(α )
(x )γ 0ψ (+ )( β ) (x ) = u (α ) (k )γ 0 u (β ) (k )
(13) = u (α ) (k )
{k/ , γ }u ( ) (k )
0
β
2m
E
= δ αβ
m
pour les solutions d’énergie positive et
ψ (− )(α ) ( x )γ 0ψ (− )( β ) ( x ) = v (α ) (k )γ 0 u ( β ) (k )
(k ) {k/ , γ }u ( ) (k )
0
(α ) β
(14) = −v
2m
E
= δ αβ
m
pour les négatives. Les spineurs ont été normalisés au repos. Puisque la densité fois le volume doit
rester constant, quand ce dernier est réduit par le facteur de contraction E/m, le précédent doit
s’accroître de la même quantité.
Les états d’énergie positive et négative sont mutuellement orthogonaux, si nous considérons les
états avec des énergies opposées mais de même moment :
ψ (+ )(α ) (k ) = e −i (k )u (α ) (k )
0 x 0 −k ⋅ x
ψ (− )( β ) (k ) = e i (k
0 x 0 + k ⋅x )u ( β ) (k~ )
~
k ≡ k 0 , −k ( )
()
(15) ψ (− )( β ) ( x )ψ (+ )(α ) ( x ) = e − 2ik 0 x0 v ( β ) k~ γ 0 u (α ) (k )
~ ~
1 − 2ik 0 x0 ( β ) ~ k/ 0
= e
2
v k − γ + γ ()m
0 k
m
/ (α )
u (k ) = 0
La signification physique des solutions d'énergie négative n’a pas encore été clarifiée. De plus,
notre construction d’états en ondes planes n’a pas de sens pour des particules de masse zéro. Cela
sera étudié en détail plus loin.
Pour caractériser le reste de la dégénérescence des solutions d’onde plane u et v, nous construisons
les projecteurs sur les états de polarisation définie. Pour tout quadrivecteur normalisé de type
spatial n ( n 2 = −1 ) orthogonal à k, nous avons
1
W ⋅ n = − ε µνρσ n µ k ν σ ρσ
(16) 4
1
= − γ 5 n/ k/
2
σ 0
Dans la base usuelle, Σ = . Si nous choisissons n le long de l’axe z, n = n(3 ) ≡ (0,0,0,1) ,
0 σ
nous voyons que les solutions (4) sont des états propres de − W ⋅ n(3 ) / m = W 3 / m , avec les valeurs
propres +½ (spin haut) pour u (1) et v (1) et –½ (spin bas) pour u (2 ) et v (2 ) . Les projecteurs sur
u (1) (m,0 ) et v (2 ) (m,0 ) peuvent être écrits
I + γ 5 n/ (3) 1 I + σ 3 0
(18) P (n(3) ) = =
2 2 0 I − σ 3
(20) P(n ) = (I + γ 5 n/ )
1
2
Cette expression reste valide pour un vecteur n arbitraire normalisé, orthogonal à k. P(n) projette
sur les états qui, dans le repère au repos, ont un spin σ ⋅ n / 2 = 1 / 2 pour les solutions d’énergie
positive et un spin σ ⋅ n / 2 = −1 / 2 pour celles d’énergie négative (notez les signes !).
Il existe un choix particulier de n tel que n est proportionnel à k dans le repère au repos. Soit n k
égal à
k k0 k
(25) n k = ,
m m k
Donc P(n k ) projette sur les états d’hélicités positives, énergie positive et d’hélicité négative,
énergie négative.
[ ]
Le facteur 1 / (2π ) (m / E ) est choisi pour rendre la condition de normalisation plus simple :
3
∫d
3
x j (+ )0 (t , x )
d 3x m2
(2) = ∫ ∫∫ d pd p ′
3 3
∑ b ∗ ( p, α )b( p ′, α ′)u (α )+ ( p )u (α ′ ) ( p ′)e i ( E − E ′ )t −i (p −p′ )⋅x
(2π )6 EE ′ α ,α ′
d3p m
= ∑∫ b( p, α ) = 1
2
α (2π ) E
3
Nous avons besoin ici de l’identité de Gordon qui dit que pour toute paire de solutions d’énergie
positive u (α ) ( p ) et u ( β ) (q ) de l’équation de Dirac, nous avons
(4) u (α ) ( p )γ µ u ( β ) (q ) =
2m
[ ]
u ( p + q ) + iσ µν ( p − q )ν u ( β ) (q )
1 (α ) µ
Donc le courant total pour une superposition de solutions d’énergie positive est juste la vitesse de
groupe. C’est l’analogue de ce qui se passe dans la théorie de Schrödinger et semble satisfaisant.
Cependant, il y a une inconsistance dans la supposition de superposition de solutions d’énergie
positives seules.
Pour illustrer ce point, considérons l’évolution dans le temps d’un paquet d’onde donné au temps t
= 0 par une distribution gaussienne de demi-largeur d :
(7) ψ (0, x ) =
1 2 2
e −x / 2 d w
πd 2( )
3 / 4
ϕ
où w est un spineur fixé, disons .
0
(8) ψ (t , x ) = ∫
d3p m
∑ [ ]
b( p, α )u (α ) ( p )e −ip⋅ x + d ∗ ( p, α )v (α ) ( p )e ip⋅ x
(2π ) E α
3
Puisque la transformée de Fourier d’une gaussienne est une gaussienne
(9) ∫ d 3 xe −x
2 / 2 d 2 − i p⋅ x
(
= 2πd 2 )3/ 2
e −p
2d 2 / 2
(11)
b( p,α ) = 4πd 2 ( )
3/ 4
e −p
2d 2 / 2
u (α )+ ( p )w
d ∗ ( p,α ) = 4πd 2 ( )
3/ 4
e −p
2d 2 / 2
v (α )+ ( p )w
En utilisant les expressions explicites de u et v, nous voyons que le rapport b / d ∗ est typiquement
de l’ordre de p / (m + E ) et devient important lorsque p ~ m . Si le paquet d’onde est dispersé sur
une distance d >> 1/m, la contribution du moment p ~ m >> 1 / d est fortement amortie, et les
composantes d’énergie négative sont négligeables. La théorie à une particule semble consistante.
Cependant, si nous désirons localiser le paquet d’ondes dans une région de l’espace du même ordre
que la longueur d’onde de Compton, c’est à dire d < 1/m, les solutions d’énergie négative jouent un
rôle appréciable. Cette discussion quantitative est en accord avec les arguments heuristiques
présentés au début. Pour un paquet d’ondes avec des contributions d’énergie négative comme dans
(8), nous calculons comme ci-dessus la condition de normalisation
(12) ∫
d3p m
(2π ) E α
3 ∑
2
(
b ( p , α ) + d ( p, α ) = 1
2
)
et, avec la notation ~ (
p = p 0 ,−p , le courant total est )
d 3 p m pi
J i (t ) = ∫
(2π ) E E α
3
[
∑ b ( p, α ) + d ( p, α )
2 2
]
(13)
b∗ (~
p , α )d ∗ ( p, α ′)e 2iEt u (α ) ( ~p )σ i 0 v (α ′ ) ( p )
+ i∑
αα ′ − b( p , α )d ( p, α ′ )e v ( p )σ i 0 u (α ) ( ~ p )
~ − 2 iEt (α ′ )
Il est maintenant dépendant du temps. A coté du terme de vitesse de groupe, il y a un terme réel
oscillant. La fréquence de ces oscillations est très grande, plus grande que
c2
(14) 2m ≅ 2 × 10 21 s −1
h
Ce phénomène, traditionnellement appelé zitterbewegung, est un exemple des difficultés dues aux
états d’énergie négative dans le schéma d’une théorie à une particule.
Une manifestation plus frappante est le fameux paradoxe de Klein. Idéalisons le processus de
localisation par une barrière de potentiel de hauteur V dans le demi-espace z ≡ x 3 > 0 (figure ci-
dessous).
Considérons maintenant dans le demi-espace z < 0 une onde plane incidente d’énergie positive de
moment k > 0 le long de l’axe z :
1
0
(15) ψ inc ( z ) = e ikz k (le spin le long de l'axe z)
E + m
0
L’onde réfléchie a la forme
1 0
0 1
(16) ψ ref ( z ) = ae ikz − k + be −ikz 0
E + m k
0
E + m
(superposition de solutions d’énergie positive de spin haut et spin bas). Dans le demi-espace z > 0,
c’est à dire en présence du potentiel constant V, l’onde transmise a une forme similaire :
1 0
0 1
(17) ψ trans ( z ) = ce iqz q
− iqz
+ de 0
E −V + m −q
0
E −V + m
Aussi longtemps que E − V < m , q est imaginaire, et l’onde transmise décroît exponentiellement.
Au-delà de quelques longueurs d’onde de Compton, elle est négligeable. Si nous augmentons V
afin de restreindre cette région de pénétration, l’onde transmise devient oscillante quand
V ≥ E + m.
Malheureusement, puisque r < 0, le flux réfléchi est plus grand que l’incident ! Nous avons à
nouveau des troubles lorsque nous essayons de localiser la particule sur une distance de l’ordre de
la longueur d’onde de Compton.
En dépit de ces difficultés, l’équation de Dirac et son interprétation à une particule sont très utiles et
physiquement sensibles aussi longtemps que nous considérons des forces externes qui varient
lentement sur une échelle de quelques longueurs d’onde de Compton. Elle nous fournit les
premières corrections relativistes au schéma de Schrödinger. C’est ce que nous allons explorer tout
au long des prochaines sections, avant de retourner à une investigation plus profonde de la
signification des états d’énergie négative. Nous réalisons maintenant que les difficultés qui nous ont
conduits à écarter l’équation de Klein-Gordon n’ont pas réellement été résolues. Même si nous
poursuivrons notre discussion dans le schéma de la théorie du spin ½ à cause de ses importantes
implications physiques, nous pourrions nous intéresser au cas scalaire avec le même domaine de
validité. C’est un autre exemple ou des théories physiques importantes furent construites à partir de
ce qui semblait a priori de mauvaises motivations.
III.3. Couplage électromagnétique
Nous voulons maintenant étudier les interactions d’une particule de Dirac avec un champ
électromagnétique externe (classique) caractérisé par son potentiel Aµ (x ) . Le couplage correct est
obtenu à partir l’équation libre de Dirac à l’aide de la prescription de couplage minimal :
(1) ∂ µ → ∂ µ + ieAµ
(3)
Aµ ( x ) → Aµ ( x ) − ∂ µ a ( x )
Ici e dénote la charge de la particule. Elle est négative e = − e pour l’électron. La covariance de
Lorentz de ces équations est claire. Si nous changeons notre repère de référence, le potentiel
électromagnétique se transforme comme un vecteur
( )
(4) Aµ′ ( x ′ = Λx ) = Λ−1 µ Aν ( x )
ν
= i[H , r ] = α
dr
dt
(7)
dπ ∂A
= i[H , π ] − e = e(E + α × B )
dt ∂t
avec
∂A
E=− − ∇A 0
(8) ∂t
B = rot A
La seconde équation est la version opératorielle de l’équation de force de Lorentz. A la vue des
paradoxes rencontrés dans la sous-section précédente, l’interprétation de r et π comme la position
et le moment doit, cependant, être limitée.
Pour étudier les implications physiques de ces équations, nous considérons leur limite non
ϕ I 0 0 σ
relativiste. Nous écrivons ψ = et nous utilisons la représentation β = , α = .
χ 0 − I σ 0
L’équation (5) conduit à
∂ϕ
i = σ ⋅ πχ + eA 0ϕ + mϕ
∂t
(9)
∂χ
i = σ ⋅ πϕ + eA 0 χ − mχ
∂t
A la limite non relativiste, la grande énergie m est le terme dominant dans (9). Nous introduisons
les fonctions variant lentement dans le temps Φ et Χ :
ϕ = e − imt Φ
(10)
χ = e −imt Χ
Ce qui justifie l’utilisation des termes grandes et petites composantes pour ϕ et χ (ou Φ et Χ ,
respectivement). Comme pour l’équation (13), c’est une généralisation aux spineurs de l’équation
de Schrödinger dans un champ électromagnétique. Après de simples manipulations algébriques,
[ ][ ]
(14) (σ ⋅ π ) = σ iσ j π iπ j = π 2 + σ i , σ j π i , π j = π 2 − eσ ⋅ B
2 1
4
nous pouvons la réécrire comme
∂Φ (p − eA )
2
e
(15) i = − σ ⋅ B + eA 0 Φ
∂t 2m 2m
La seule dépendance du spin se fait à travers l’interaction magnétique σ ⋅ B . En restaurant les
facteurs h et c,
h
(16) H magn = − σ ⋅ B = −µ ⋅ B
2mc
où le moment magnétique µ est défini comme
e hσ e
(17) µ ≡ = 2 S
mc 2 2mc
L’opérateur de spin S est hσ / 2 . Le rapport gyromagnétique g vaut 2. C’est une prédiction non
triviale de la théorie de Dirac, dérivée dans un contexte non relativiste de l’équation de Pauli.
Les corrections radiatives provenant de la théorie quantique des champs affectent la valeur mesurée
expérimentalement de g par une petite somme.
L’équation de Pauli (15) peut être encore plus réduite, si nous considérons un champ magnétique
uniforme B = rot A , avec le choix A = 1 / 2B × R , et en négligeant les termes quadratiques en A
(approximation du champ faible). Nous obtenons
∂Φ p 2
(19) i = −
e
(L + 2S ) ⋅ B Φ
∂t 2m 2m
où L = r × P est l’opérateur moment angulaire orbital.
L’étude précédente peut, en fait, aussi être effectuée sur la forme quadratique de l’équation de
Dirac, c’est à dire sans supposer l’approximation non relativiste. En partant de (2), nous multiplions
par l’opérateur (i∂/ − eA
/ + m ) . Cela donne
[(i∂/ − eA/ ) 2
] 2 1
2i
[
− m 2 ψ = (i∂ − eA) + σ µν i∂ µ − eAµ , i∂ν − eAν ]ψ
(20)
= (i∂ − eA) − σ µν Fµν − m 2 ψ = 0
2 e
2
Il est intéressant de déterminer les niveaux d’énergie dans un champ magnétique uniforme.
Supposons le champ B le long de l’axe z. Le potentiel vecteur A peut être choisi tel que
ϕ
A 0 = A x = A z = 0 , A y = Bx . Pour une solution stationnaire de l’énergie E, ψ = e −iEt , les
χ
équations (9) deviennent
(E − m )ϕ = σ ⋅ (p − eA )χ
(23)
(E + m )χ = σ ⋅ (p − eA )ϕ
En éliminant χ on obtient une équation pour ϕ :
(E − m )ϕ = [σ ⋅ (p − eA ) ]ϕ = [(p − eA )
2 2 2 2
]
− eσ ⋅ B ϕ
= [p + e B x − eB(σ + 2 xp )]ϕ
(24) 2 2 2 2
z y
C’est l’hamiltonien d’un oscillateur harmonique. Puisque p y , p z et σ z commutent avec le coté
droit, nous cherchons une solution de la forme
i(p y+ p z )
(25) ϕ (x ) = e y z f ( x )
où f ( x ) satisfait
d2
( )
(26) − 2 + (eBx − p y ) − eBσ z f ( x ) = E 2 − m 2 − p x2 f ( x )
2
dx
Supposons que le signe de B soit tel que eB > 0, nous introduisons les variables auxiliaires
py
ξ = eB x −
eB
(27)
E 2 − m 2 − p z2
a=
eB
de cette manière (26) se réduit à
d2
(28) − 2 + ξ 2 − σ z f = af
dξ
à condition que a + α = 2n + 1 , n entier, n=0,1,2,…. Donc les niveaux d’énergies sont donnés par
(32) E 2 = m 2 + p z2 + eB(2n + 1 − α )
et les fonctions d’onde correspondantes peuvent facilement être écrites. Ces niveaux ont à la fois
une dégénérescence discrète (n, α = −1 et n + 1, α = 1 ) et continue (en p y ). Cette dernière peut
être réduite à une dégénérescence discrète si nous considérons une particule dans une boite finie.
L’équation (32) donne une généralisation relativiste des niveaux de Landau. La valeur g = 2 est
telle que le spectre s’étend sous E 2 = m 2 .
Comme second exemple, étudions le cas d’une particule de Dirac dans une onde plane
électromagnétique. L’onde plane, qui est supposée être linéairement polarisée, est caractérisée par
son vecteur de propagation n µ ( n 2 = 0 ) et son vecteur polarisation ε µ ( ε 2 = −1 , ε ⋅ n = 0 ). Nous
écrivons Aµ = ε µ f (ξ ) où ξ ≡ n ⋅ x et ∂ µ Aν = n µ Aν′ avec Aν′ ≡ ε ν f ′(ξ ) . L’équation quadratique
(20) prend la forme
( )
/ ′ψ = 0
(33) − − 2ieA ⋅ ∂ + e 2 A 2 − m 2 − ien/ A
µ
où ≡ ∂ µ ∂ est le d'alembertien.
1/ 2
m
(38) ψ p ( x ) = 1 +
e
n/ A ue iI
2n ⋅ p p 0
où I est l'action d’une particule classique dans une onde plane (amortie à l’infini), avec
p = mu (∞ ) = p(∞ ) :
n⋅ x e e2
(39) I = − p ⋅ x − ∫ dξ A(ξ ) ⋅ p − A 2 (ξ )
0
n ⋅ p 2n ⋅ p
Pour que ψ satisfasse l’équation originale de Dirac et pas seulement l’équation au carré (20), u doit
obéir à une condition auxiliaire. Après un peu d’algèbre, nous trouvons que
1/ 2
m
(40) (i∂/ − eA
/ − m )ψ p ( x ) = n/ A ( p/ − m )ue iI
e
1 +
p0 2p⋅n
Donc
(41) ( p/ − m )u = 0
et u = u ( p ) est une solution de l’équation libre de Dirac.
d 3 xψ p+ (t , x )ψ p′ (t , x ) = δ 3 (p − p ′)
1
3 ∫
(42)
(2π )
et le courant associé est
1 p ⋅ A e 2 A 2
(43) j µ = ψ p ( x )γ µψ p ( x ) = 0 p µ − eA µ + n µ e −
p n ⋅ p 2 n ⋅ p
Si A(ξ ) est une fonction quasi périodique de ξ (lentement amortie à l’infini), la valeur moyenne
de j µ est
1 µ e2
(44) j µ =
0
p − A 2 n µ
p 2n ⋅ p
montrant le même phénomène que sa contrepartie classique. Ces expressions furent originellement
obtenues par Volkow en 1935.
Exercices
1. Dérivez un ensemble complet de solutions à l'équation (19) de la section III.3.
2. Vérifiez que l'équation (37) de la section III.3 est correctement normalisée.
III.4. Transformation de Foldy-Wouthuysen
Nous venons d'analyser le contenu physique de l’équation de Dirac en utilisant une approximation
non relativiste. Il vaut la peine de montrer que cela peut être poursuivi de manière systématique.
C’est l’objet de la transformation de Foldy-Wouthuysen. Pour être plus explicite, nous désirons
trouver une transformation unitaire
(1) ψ = − iS ψ ′
qui découple les petites et grandes composantes et où S peut dépendre du temps.
Appelons impairs les opérateurs tel que α qui couplent les petites et grandes composantes, et pairs
ceux qui ne le font pas (par exemple I, β , …). Puisque ψ ′ satisfait l’équation
[ ]
(2) i∂ tψ ′ = e iS (H − i∂ t )e − iS ψ ′ ≡ H ′ψ ′
notre problème est de trouver S tel qu’il enlève les opérateurs impairs dans H ′ à un ordre donné en
1/m. En pratique, nous le ferons jusqu’à des termes de l’ordre de (énergie cinétique/ m ) ou
3
(énergie cinétique× énergie potentielle/ m ). Cela nous conduira plus loin dans les corrections
2
Dans le cas libre, nous pouvons construire S exactement. Il est indépendant du temps et peut être
choisi comme
σ ⋅p γ ⋅p
(3) S = −iβ θ = −i θ
p p
comme cous nous y attendions. En d’autres mots, nous avons décomposé H en une somme directe
de deux hamiltonien non locaux ± m 2 + p 2 . Il est clair que ces racines carrées ne peuvent pas être
représentées dans l’espace de configuration par un ensemble fini d’opérateurs différentiels.
Dans le cas en interaction, nous nous attendons donc à ce que S soit de l’ordre m −1 , et nous
développons H ′ à l’ordre désiré :
H ′ = H + i[S , H ] − [S , [S , H ]] − [S , [S ; [S , H ]]]
1 i
2 6
(7)
1
24
i
2
1
6
[ ] [ [ ]]
+ [S , [S , [S , [S , H ]]]] − S& − S , S& + S , S , S& + L
O′ est maintenant d’ordre 1/m. Nous itérons alors le processus. Une seconde transformation e − iS ′ ,
avec S ′ = −i (βO′ / 2m ) , conduit à
(12) H ′′ = βm + E ′′ + O′′
( )
où O′′ = O m −2 . Finalement, une troisième étape avec S ′′ = −i(βO′′ / 2m ) élimine ce terme impair
laissant l’hamiltonien désiré
H ′′′ = β m +
(p − eA )2 − (p )4 + eA0 − e βσ ⋅ B
2m 8m 3 2m
(13)
ie
σ ⋅ (E × p ) − 2 div E
e e
+ − 2
σ ⋅ rot E − 2
8m 4m 8m
L'interprétation des divers termes nécessite quelques commentaires. Le terme entre crochets est le
[
développement (à l’ordre requit) de (p − eA ) + m 2
2
]
1/ 2
. Le deuxième terme eA 0 est l’énergie
électrostatique d’une charge ponctuelle, tandis que le troisième représente l’énergie d’un dipôle
magnétique pour g = 2. Le terme entre parenthèses peut être vu comme correspondant à
l’interaction spin - orbite (s.o.). En effet, pour un potentiel statique à symétrie sphérique, rot E = 0
et E = −∇A 0 . Donc
1 dA 0 1 dA 0
(14) σ ⋅ (E × p ) = − σ ⋅ (r × p ) = − σ ⋅L
r dr r dr
et le terme entre parenthèses est
e dA 0
(15) H s .o. = σ ⋅L
4m 2 r dr
σ ⋅ B ′ = − 2 σ ⋅ (E × p )
e e
(16) H s .o. = −
2m 2m
mais à cause de la précession de Thomas, ce résultat est réduit par un facteur deux.
( )
Finalement le dernier terme dans l’équation (13), appelé le terme de Darwin − e / 8m 2 div E , peut-
être relié au zitterbewegung. La position de l’électron fluctue d’une somme δr telle que
δr 2 ~ 1 / m 2 , et l’énergie électrostatique effective est la moyenne
e ∂ 2 A 0 (r ) i j
(17) eA 0 (r + δr ) = eA 0 (r ) + δr δr + L
2 ∂r i ∂r j
( )
(19) δ eA 0 =
e
2
∆A 0 = −
e
div E
6m 6m 2
en bon accord avec le signe et la grandeur du terme de Darwin.
Le lecteur aura noté que comme la transformation de Foldy-Wouthuysen est dépendante du temps,
les valeurs moyennes de H ′ dans l’état ψ ′ sont, en général, différentes de celles de H dans l’état
correspondant ψ .
IV. Hydrogénoïdes
Une importante application de l’équation de Dirac est la discussion de la structure fine du spectre
atomique. C’est un domaine de notoriété pour les succès de la mécanique quantique et ses
généralisations relativistes, incluant les corrections radiatives. A la vue des intrications de la
méthode de Foldy-Wouthuysen, il est assez remarquable qu’une solution exacte de l’équation de
Dirac dans un champ statique de Coulomb existe et conduit à un excellent accord avec les résultats
observés sur les atomes hydrogénoïdes. On ne s'attend pas à ce que les difficultés discutées
précédemment jouent un rôle significatif. En physique atomique, l’échelle de longueur pertinente,
le rayon de Bohr a 0 = h / me cα = 0.53Å , est 137 fois plus grande que la longueur d’onde de
l’électron. Pour des atomes lourds ces difficultés réapparaissent et d’autres méthodes doivent être
développées.
IV.1. Spectre non relativiste contre relativiste
Rappelons le résultat non relativiste obtenu de l’équation de Schrödinger, un triomphe pour les
débuts de la mécanique quantique. L’équation d’onde est
∆ Ze 2
− − − ε n,l ψ n,l (r ) = 0
2m 4πr
(1)
∂ 2 2 ∂ L2
−∆ = − 2 − +
∂r r ∂r r 2
où
(2) L2ψ n,l = l (l + 1)ψ n ,l
et m est la masse réduite du système électron noyau :
(3) m −1 = me−1 + m N−1 ≅ me−1
La condition de quantification nécessite que n′ = n − (l + 1) soit un entier non négatif (le nombre de
zéros de la fonction d’onde), et les niveaux d’énergie sont
m (Z α )
2
(4) ε n,l = − n = 1,2, K
2n 2
(5) ψ (0 ) =
π 1/ 2 n
Puisque pour n ≥ 1 donné, l prend des valeurs entières de 0 à n - 1, chaque niveau a une
n −1
dégénérescence égale à ∑ (2l + 1) = n
0
2
. Ceci est relié à une symétrie dynamique du problème de
Coulomb en accord à un groupe O(4) de rotations dans un espace à quatre dimensions, qui fut
utilisé, comme nous l'avons vu, par Pauli et Fock dans les débuts de la mécanique quantique pour
donner une dérivation algébrique du spectre de Balmer. Cette dégénérescence disparaît dans le
traitement relativiste conduisant à la structure fine du spectre.
En ignorant pour le moment les effets du spin, voyons les prédictions de la théorie de Klein-Gordon
quand le couplage électromagnétique est introduit de manière minimale. Soit E l’énergie totale
égale à l’énergie au repos mc 2 plus l’énergie négative de liaison ε :
Zα
2
(6) E + + ∆ − m φ = 0
2
r
ou
∂ 2 2 ∂ L2 − Z 2α 2 2ZαE
(7) − 2 −
r ∂r
+ − ( )
− E 2 − m 2 φ = 0
∂r
2
r r
Cette équation est formellement identique à l’équation de Schrödinger après les substitutions
L2 → L2 − Z 2α 2 ≡ λ (λ + 1)
E
(8) α → α
m
E − m2
2
ε→
2m
(9) δ l = l + − l + − Z 2α 2
2 2
et le nombre quantique principal n est, de même, déplacé par la même valeur, puisque
n′ = n − (l + 1) doit être un entier. Donc, les niveaux d’énergies sont donnés par
E nl2 − m 2 mZ 2α 2 E nm
2
1
=−
2m 2 m (n − δ l )2
2
m
(9) E nl =
[
1 + Z α 2 / (n − δ l )
2 2
]
mZ 2α 2 mZ 4α 4 3 mZ 4α 4
=m−
2n 2
− +
n (2l + 1) 8 n
3 4
( )
+Oα6
Le deuxième terme est l’énergie de liaison non relativiste et le troisième brise la dégénérescence
O(4). Nous n’allons pas discuter les pathologies de ce cas, c’est-à-dire le comportement singulier
( )
de la fonction d’onde à l’origine du terme attractif − Z 2α 2 / r 2 ou la catastrophe qui se produit
lorsque Z > 137/2 ( δ l et donc E nl deviennent complexe !). L’équation (9) est en faible accord avec
la situation expérimentale, ce qui signifie que les effets du spin ne peuvent pas être négligés.
IV.2. Théorie de Dirac
Retournons maintenant aux prédictions de l’équation de Dirac. Avant de construire la fonction
d’onde, nous procéderons d’abord à une simple dérivation du spectre comme dans le cas de Klein-
Gordon. Dans ce but, nous élevons l’équation au carré et nous insérons la composante non nulle du
potentiel A0 = −(Ze / 4π ) , tandis que F0i = − Fi 0 = −∂ i A0 = E i . Il est utile de travailler dans la
σ i 0
représentation chirale pour les matrices γ où σ 0i
est diagonal : σ 0i
= i . Alors le terme
0 − σ i
de spin s’écrit
e σ ⋅ rˆ
(1) σ µν Fµν = ±ieσ ⋅ E = m iZα 2
2 r
où r̂ est le vecteur unité r / r . L’analogue de l’équation de Klein-Gordon est une équation pour
spineurs à deux composantes :
∂2 2 ∂ 1 2 ZαE
(2) − 2 + ( )
+ L2 − Z 2α 2 m iZασ ⋅ rˆ 2 −
r ∂r
(
− E 2 − m 2 ψ ± = 0 )
∂r r r
et
[
(5) λ = ( j + 1 / 2 ) − Z 2α 2
2
] 1/ 2
−1
qui peut être écrit
(6) λ = ( j ± 1 / 2 ) − δ j
avec
Z 2α 2
2
(7) δ j = j +
1 1
− j + − Z 2α 2 ≅
2 j +1
(
+ O Z 4α 4 )
2 2
avec n = 1, 2, … et j = 1/2, 3/2, …, n - 1/2. Une catastrophe se produit maintenant pour Z = 137.
δ 1 / 2 devient imaginaire au-delà de cette valeur.
Les états dégénérés peuvent être distingués par leur moment angulaire orbital l, qui prend les
valeurs j ± 1 / 2 (excepté pour j = n - 1/2 où l = n - 1). Ceci est relié aux propriétés de
transformation de l’état sous la parité. Les énergies des états les plus bas sont représentés dans la
figure ci-dessous où nous avons utilisé la notation spectroscopique non relativiste habituelle nl j .
Le nouveau phénomène est l’apparition de la structure fine, c’est à dire la différence d’énergie entre
les niveaux de j différents, pour la même valeur de n. Typiquement pour Z = 1,
mα 4
(9) E (2 P3 / 2 ) − E (2 P1 / 2 ) ≅ = 4.53 × 10 −5 eV = 10.9 GHz
32
Cette structure fine peut être vue comme une conséquence du couplage spin - orbite :
Zα σ ⋅ L
(10) ∆E =
4m 2 r 3
( )
Ce terme s’annule pour une onde s, tandis que pour une onde p, L ⋅ σ = J 2 − L2 − σ 2 / 4 prend les
valeurs 1 et –2 pour j = 3/2 et j = 1/2 respectivement. D’un autre coté, la valeur moyenne de 1 / r 3
est, sur base dimensionnelle, de la forme nl 1 / r 3 nl = k nl (mZα ) , où k nl est un pur nombre. Tout
3
[ ]
livre sur la mécanique quantique nous dit que k nl = 8 / (2l + 1)n 3 (2l + 1) − 1 (=1/24 pour n = 2 et l
2
= 1) :
m (Z α )
4
(11) ∆E s.o. (2 P3 / 2 − 2 P1 / 2 ) =
32
en accord avec l’estimation précédente (cela est valable aussi pour des plus grandes valeurs de n et
de l).
Construisons maintenant les spineurs qui sont états propres de l’énergie de ce problème. En
ϕ
retournant à la représentation de Dirac, nous écrivons les bispineurs ψ = et cherchons les
χ
2 2
spineurs à deux composantes qui sont états propres de J , J z et L avec les valeurs propres j(j+1),
m et l(l+1), respectivement. Soit ϕ (j±,m) l’état propre pour j = l ± 1 / 2 .
Où nous utilisons la notation standard Yl µ pour les harmoniques sphériques. Ils doivent aussi être
états propres de J z = L z + S z avec la valeur propre m et états propres de L ⋅ σ = J 2 − L2 − 3 / 4
avec la valeur propre l pour ϕ (j+,m) et -(l + 1) pour ϕ (j−,m) . La première condition donne µ = m − 1 / 2 et
µ ′ = m + 1 / 2 , la seconde avec la condition de normalisation a + b , détermine a et b. Nous
2 2
Puisque σ ⋅ r̂ est un opérateur pseudoscalaire, ϕ (j+,m) et ϕ (j−,m) ont des parités opposées (de plus, leur
moment angulaire l diffère d’une unité). Il est pratique d’introduire une notation commune. Soit
ϕ lj ,m dénote ϕ (j+,m) si j = l + 2 et ϕ (j−,m) si j = l - 1/2. Nous vérifions par inspection que ϕ lj ,m a la parité
(− 1)l .
Puisque l’équation de Dirac dans le potentiel de Coulomb
1 Zα
(16) Eψ = α ⋅ ∇ + βm − ψ ≡ Hψ
i r
est invariante sous la réflexion spatiale, les états propres impairs et pairs peuvent être construit,
c’est-à-dire
(17) βψ (j±, m) (~
x ) = ±ψ (jm± ) (x )
r
ont la parité (− 1) . Dans (16) les facteurs i et 1/r ont été introduit pour la facilité ultérieure. Notant
l
En éliminant F2 en faveur de F1 , nous obtenons une équation différentielle du second ordre dont la
solution est
γ − ZαE / λ λ Zα
F1 = ρ F γ + 1 − ,2γ + 1; ρ
− λ + Zαm / λ λ
(24)
ZαE
F2 = ρ γ F γ − ,2γ + 1; ρ
λ
avec
[
(25) γ ≡ ( j + 1 / 2) − Z 2α 2
2
]
1/ 2
j + 1/ 2 − δ j
∫ (F )
+ Glj2 dr = 1 , implique que [Γ(γ − ZαE / λ )]
∞ −1
2
Glj soient normalisables, soit lj doit s’annuler.
0
C’est la condition de quantification désirée
ZαE
− γ = nγ (entier non négatif )
(27) λ
≡ n − ( j + 1 / 2)
qui conduit à :
ZαE
(28) = n −δ j
(
m2 − E 2 )
1/ 2
En collectant tous les facteurs, il est alors possible d’écrire l’expression des solutions normalisées
Flj et Glj , et donc de ψ ljm .
(4π )1 / 2 2Γ(1 + 2γ ) Zα
− i (1 − γ )
cosθ
Zα
( )
Notons que γ = 1 − Z 2α 2 ~ 1 − Z 2α 2 / 2 . A la limite non relativiste, γ → 1 , nous retrouvons les
fonctions d’onde de Schrödinger multipliées par les spineurs de Pauli. D’un autre coté, ces
fonctions d’onde sont singulières à l’origine, mais cet effet est notable seulement pour
2 2 2
(30) 2mZαr ≤ e − 2 / Z α ≈ 10 −16300 / Z
c’est à dire dans une région plutôt petite !
Pour comparer ces résultats avec les niveaux expérimentaux, plusieurs autres effets doivent être
pris en compte.
V. Théorie des trous
Une solution fut proposée au début des années 1930 en terme de théorie à plusieurs particules. Bien
que cette approche soit limitée, puisqu’elle ne peut pas s’appliquer aux particules scalaires par
exemple, il est intéressant de retracer son raisonnement. Elle fournit un schéma physique intuitif
utile dans les cas pratiques, et permet des analogies fécondes avec différentes situations tel que les
électrons dans un métal. Sa supposition majeure est que tous les états d’énergie négative sont
remplis dans l’état du vide. En accord avec le principe d’exclusion de Pauli, cela empêche tout
électron de tomber dans ces états d’énergie négative et par conséquent assure la stabilité des états
d’énergie positive. En retour, un électron de la "mer" d’énergie négative peut être excité vers un
état d’énergie positive. Il laisse alors un trou dans la mer. Ce trou dans les états d’énergie négative
et négativement chargé apparaît comme une particule d’énergie positive chargée positivement, le
positron. En plus des propriétés du positron, sa charge e = −e et sa masse au repos me , cette
théorie prédit aussi l’observation de nouveaux phénomènes :
1. L’annihilation d’une paire électron – positron. Un électron (d’énergie positive) tombe dans un
trou dans la mer d’énergie négative avec l’émission de radiation. Suite à la conservation de
l’énergie-impulsion, au moins deux photons doivent être émis, à moins qu’un noyau présent
absorbe l’énergie et l'impulsion.
2. Inversement, une paire électron – positron peut être créée du vide par un photon incident en la
présence d’une cible pour la balance de l’énergie-impulsion. C’est le processus mentionné ci-
dessus. Un trou est créé tandis que l’électron excité acquiert une énergie positive.
Donc la théorie prédit l’existence de positrons qui furent en fait observés en 1932. Puisque les
positrons et les électrons peuvent s’annihiler, nous devons abandonner l’interprétation de l’équation
de Dirac comme une fonction d’onde. De plus, les raisons pour écarter l’équation de Klein-Gordon
ne tiennent plus. Elle décrit les particules sans spin tel que les pions. Cependant, l’interprétation des
trous n’est pas satisfaisante pour les bosons puisque la statistique de Fermi-Dirac joue un rôle
crucial dans l’argument de Dirac.
Même pour les fermions, le concept d’une mer inobservable infiniment chargée semble plutôt
bizarre. Il est préférable de construire une vraie théorie à plusieurs particules pour accommoder
particules et antiparticules d’une manière consistante. Cela est obtenu par la "seconde
quantification", c’est à dire l’introduction de champs quantifiés capable de créer ou annihiler des
particules. Nous n'aborderons pas ces développements fort vastes et complexes mais vous en avez
déjà eut un léger aperçu avec les phonons ainsi que la théorie BCS.
V.2. Conjugaison de charge
La théorie des trous implique l’existence d’électrons et de positrons avec la même masse et des
charges opposées qui obéissent à la même équation. L’équation de Dirac doit donc admettre une
nouvelle symétrie correspondant à l’échange particule ⇔ anti particule. Nous cherchons donc une
transformation ψ → ψ c renversant la charge, c’est-à-dire telle que
(i∂/ − eA/ − m)ψ = 0
(1)
(i∂/ + eA/ − m )ψ c = 0
Nous demandons que cette transformation soit locale et que son carré multiplie ψ par une phase
inobservable. Pour construire ψ c nous conjuguons et transposons la première équation et nous
trouvons
[ ]
(2) γ µT (− i∂ µ − eAµ ) − m ψ T = 0
avec ψ = γ ψ . Dans toute représentation de l’algèbre γ il doit exister une matrice C qui
T 0T ∗
satisfait
(3) Cγ µT C −1 = −γ µ
avec η c une phase arbitraire inobservable, généralement prise égale à l’unité. Dans le schéma
présent, la conjugaison de charge est une transformation anti-linéaire. Ceci est consistant avec
l’interprétation des trous puisque lorsque l’on calcule une probabilité de transition, la présence
d’une particule dans un certain état est représentée par ψ et son absence par ψ ∗ . Examinons de
plus près les propriétés de cette conjugaison de charge. Nous calculons ψ c pour ψ décrivant un
électron de spin bas d’énergie négative au repos. En l’absence de champ externe
0 1
imt 0 −imt 0
(7) ψ = e ψ = η c Cψ = η c e
c T
0 0
1 0
Donc la conjugaison de charge d’un électron d’énergie négative spin bas est en effet équivalent à
un électron d’énergie positive spin haut.
Pour une solution ψ arbitraire d’énergie-impulsion p polarisé le long de n, nous savons que
εp + m 1 + γ 5 n/
(8) ψ = / ψ p0 > 0
2m 2
où ε = ±1 dénote le signe de l’énergie. Puisque C commute avec ε dans la représentation de Dirac
∗
εp + m 1 + γ 5 n/ c
(9) ψ = Cψ
c T
= Cγ /
0
ψ
2m 2
ψ c est décrit par les mêmes quadrivecteurs p et n, mais le signe de l’énergie a été renversé. Nous
avons
u ( p, n ) = η ( p, n )v c ( p, n )
(10)
v( p, n ) = η ( p, n )u c ( p, n )
où la phase η ( p, n ) peut dépendre de p et n. Nous rappelons que le projecteur (1 + γ 5 n/ ) / 2 projette
sur les états de spin ± 1 / 2 le long de n selon le signe de l’énergie. Donc le spin est renversé par la
conjugaison de charge.
Nous notons, de plus, que sous une transformation commune sur le spineur ψ et le potentiel A,
ψ → ψ c = η c Cψ T
(11)
Aµ → Aµc = − Aµ
l’équation de Dirac (1) reste inchangée.
En réalité, on sait maintenant que les neutrinos ont une masse, extrêmement faible. Mais cette
approche reste intéressante.
Donc la chiralité égale l’hélicité (elles sont opposées pour les solutions d’énergie négative).
Etiquetons les solutions indépendantes de (1) par leur chiralité :
e u ± (k )
− ik ⋅ x
ψ ( x ) = ik ⋅ x avec k 2 = 0, k 0 = k > 0
e v ± (k )
(5) γ 5 u ± (k ) = ±u ± (k )
γ 5 v ± (k ) = ±v ± (k )
0 I
Dans la représentation usuelle γ 5 = :
I 0
1 a ± (k )
u ± (k ) =
2 ± a ± (k )
(6)
1 b± (k )
v ± (k ) =
2 ± b± (k )
et
θ
cos
a + (k ) = σ ⋅ kˆa + (k ) = 2 = iσ a ∗ (k )
sin θ e iϕ
2 −
2
(7)
θ iϕ
− sin e
a − (k ) = −σ ⋅ kˆa − (k ) = 2 = −iσ 2 a +∗ (k )
cos θ
2
où θ et ϕ sont les angles polaires de k̂ . De même
1 b+ (k ) = −iσ 2 a −∗ (k )
v + (k ) = Cu −T (k ) = = −u + (k )
2 b+ (k )
(8)
1 b− (k ) = iσ 2 a + (k )
∗
v − (k ) = Cu +T (k ) = = −u − (k )
2 − b− (k )
L’observation expérimentale montre que seul les neutrinos de chiralité négative existent. Les
neutrinos ont l’hélicité –1, les antineutrinos l’hélicité +1. Cela sera mieux compris en terme de
spineur à deux composantes. En effet les raisons pour utiliser des spineurs à quatre composantes ne
tiennent plus dans le cas de l’équation de Dirac sans masse
∂ψ 1
(9) i = α ⋅ ∇ψ
∂t i
où l’algèbre
(10) {α i , α j } = 2δ ij
peut être réalisée par les trois matrices de Pauli à deux dimensions. L’identification α i → σ i
conduit à des particules d’hélicité positive, énergie positive, tandis que α i → −σ i donne l’hélicité
négative. De tels spineurs initialement introduit par H. Weyl, furent rejetés parce qu’ils sont
incompatibles avec la conservation de parité (qui renverse le signe de l’hélicité). Ce n’est pas une
objection sérieuse puisque les neutrinos sont impliqués dans les interactions faibles qui ne
conservent pas la parité.
ϕ
Pour la chiralité positive, γ 5 = +1 , ψ = et γ ⋅ pψ = 0 se réduit à
0
( )
(12) − p + p ⋅ σ ϕ = 0
0
0
tandis que pour γ 5 = −1 , ψ = et
χ
( )
(13) p 0 + p ⋅ σ ϕ = 0
Dans les deux cas, nous avons une théorie à deux composantes, et l’équation de Dirac est
équivalente à une paire d’équation de Weyl. La transformation également appelée conjugaison de
charge (les neutrinos n’ont pas de charge) relie les deux chiralités et change le signe de l’énergie. Il
n’y a pas d’invariance C si la nature utilise seulement les neutrinos d’une chiralité définie. En
réalité, puisque l’opération de parité P relie aussi les deux types de solutions
(14) ψ (t , x ) → γ 0ψ (t ,− x )
( γ 0 est anti-diagonal), l’opération combinée CP laisse les équations de Weyl invariantes. Dans la
nouvelle représentation, la matrice C s’écrit
− iσ 2 0
(14) C =
0 iσ 2
Nous observons que les normalisations invariantes de Lorentz des solutions massives doivent être
modifiées dans le cas sans masse. Donc nous écrivons
u (α ) (k )γ 0 u ( β ) (k ) = 2 Eδ αβ
(16) (α )
v (k )γ 0 v ( β ) (k ) = 2 Eδ αβ
Exercices
1. Construisez les solutions en onde plane appropriées pour les neutrinos.
VI. Propagation et diffusion
L’introduction de γ 0 sera bientôt justifiée. Toute solution ψ est une superposition linéaire de
solutions d’ondes planes
(2) ψ (t , x ) = ∑ ∫
d 3 k m (α )
[
a (k )u (α ) (k )e −ik ⋅ x + b (α )∗ (k )v (α ) (k )e ik ⋅ x ]
(α ) (2π )
3
E
Donc
(4) ψ (t 2 , x 2 ) = ∫
d 3k m
∑
(2π ) E (α )
3
[
u (α ) (k ) ⊗ u (α ) (k )e
− ik ⋅( x2 − x1 )
]
ik ⋅( x − x )
+ v (α ) (k ) ⊗ v (α ) (k )e 2 1 γ 0ψ (t1 , x1 )
(6) K ( x 2 , x1 ) = θ (t 2 − t1 )∫
d 3k
2 E (2π )
3
[
(k/ + m )e −ik ⋅(x2 − x1 ) + (k/ − m )e ik ⋅(x2 − x1 ) ]
Nous dénotons ce noyau retardé par K ret . Montrons directement que c’est une fonction de Green de
l’équation de Dirac. En agissant sur K ret ( x 2 , x1 ) avec (i∂/ 2 − m ) nous obtenons
K ret ( x 2 , x1 ) peut aussi être exprimé en terme de la fonction de Green retardée scalaire comme
(9) K ret ( x 2 , x1 ) = −i (i∂/ 2 + m )Gret ( x 2 − x1 )
L’équation (8) suit aussi de l’identité satisfaite par les fonctions de Green :
(10) (2 + m 2 )Gret ( x 2 − x1 ) = δ 4 ( x 2 − x1 )
De
1 e − ik ⋅ x
(11) Gret = − ∫d k
4
(2π )4 (k 0 + iε )2 − k 2 − m 2
il suit que
k/ + m
(12) K ret ( x ) =
i
ke −ik ⋅ x
(2π ) ∫
4
d
4
(k 0 + iε )2 − k 2 − m 2
où l’intégration sur k 0 est effectuée en premier le long du contour en tirets de la figure ci-dessous.
La théorie des trous suggère l’introduction d’une fonction de Green différente, le propagateur de
Feynman. Il apparaît d’une manière naturelle dans la théorie du champ quantifié. Néanmoins,
soulignons les idées qui conduisirent Feynman et Stueckelberg à sa construction.
Une fonction de Green peut être considérée comme décrivant trois étapes successives :
(13) S F ( x 2 , x1 ) = ∫
d 3k
(2π ) 2 E
3
[θ (t 2 − t1 )a (k/ + m )e
− ik ⋅( x2 − x1 )
+ θ (t1 − t 2 )b(k/ − m )e
ik ⋅( x2 − x1 )
]
Les constantes a et b sont déterminées en imposant que
(14) (i∂/ 2 − m )S F ( x 2 , x1 ) = δ 4 ( x 2 − x1 )
(notez le changement de normalisation par rapport à (8)). Il suit d’un calcul direct que
[ ]
3
(i∂/ 2 − m )S F (x2 , x1 ) = iδ (t2 − t1 )∫ d 3k γ 0 a(k/ + m )eik⋅(x2 −x1 ) − b(k/ − m)e −ik ⋅(x2 −x1 )
(2π ) 2 E
(15)
= iδ (t 2 − t1 )∫
d 3k ik ⋅(x − x )
[(
e 2 1 γ 0 a Eγ 0 − γ ⋅ k + m − b Eγ 0 + γ ⋅ k − m ) ( )]
(2π ) 2 E
3
(16) S F ( x2 , x1 ) = ∫
1 d 3k
i (2π ) 2 E3
[ − ik ⋅( x − x ) ik ⋅( x − x )
θ (t 2 − t1 )(k/ + m )e 2 1 − θ (t1 − t 2 )(k/ − m )e 2 1 ]
K ret ( x 2 − x1 ) et iS F ( x 2 − x1 ) peuvent différer seulement par une solution de l’équation homogène
de Dirac. C’est en effet ce qui est trouvé par un calcul direct :
d 3k
(17) K ret ( x2 − x1 ) − iS F ( x2 − x1 ) = ∫ (k/ − m )eik ⋅(x2 − x1 )
2 E 2π 3
( )
Une expression covariante est obtenue au moyen de la représentation intégrale
∞ dω e i ω t
(18) θ (t ) = lim ∫
ε →0 − ∞ 2iπ ε − iε
La limite ε → 0 + sera sous-entendue dans ce qui suit. Les quantités que nous manipulons sont des
distributions agissant sur des fonctions tests variant lentement. Après insertion de ces expressions
dans (16), nous avons
d 3k 1 ∞ dω iω t ∞ dω −iω t
(19) S F ( x ) = − ∫ (k/ + m )e −ik ⋅ x
∫ e − (k/ − m )e ik ⋅ x
∫ e
(2π ) 2 E
4 − ∞ ω − iε − ∞ ω − iε
d 4 p e −ip⋅ x Eγ 0 + γ ⋅ p − m Eγ 0 − γ ⋅ p + m
(20) S F ( x ) = ∫ −
(2π )4 2E E + p 0 − iε E − p 0 − iε
Finalement
d4p p/ + m
(22) S F ( x ) = ∫ e −ip⋅ x
(2π ) 4
p − m 2 + iε
2
Le terme iε donne la prescription pour l’intégrale sur l'impulsion. L’intégration sur p 0 est
effectuée en premier le long du contour continu montré dans la figure précédente, puis nous
intégrons sur p. Si nous considérons m comme complexe mc = m − iε , ε → 0 + , nous avons
p/ + m p + mc
= /2
1 1
(23) = =
p − m + iε p − m c
2 2 2
p/ − mc p/ − m + iε
Donc, nous pouvons écrire la transformée de Fourier de S F ( x ) comme
p+m
(24) S F ( p ) = 2 / 2
1
=
p − m + iε p/ − m + iε
Pour résumer, le rôle du propagateur de Feynman est de propager les fréquences positives vers les
temps positifs et les négatives en arrière dans le temps.
Soit ψ (+ ) (t1 , x ) et ψ (− ) (t 2 , x ) les composantes positives et négatives d’une solution, données pour t1
et t 2 , respectivement, t1 <t 2 et tout x. Le propagateur S F nous permet de trouver ψ (t , x ) à tout
temps intermédiaire t :
[ ]
(26) ψ (t , x ) = i ∫ d 3 y S F (t − t1 , x − y )γ 0ψ (+ ) (t1 , y ) − S F (t − t 2 , x − y )γ 0ψ (− ) (t 2 , y )
VI.2. Propagation dans un champ électromagnétique externe arbitraire
En pratique, nous traiterons avec la propagation en présence d’obstacles : processus de diffusion,
champs externes, interaction avec d’autres particules. Traitons la propagation dans un champ
électromagnétique externe
(1) [i∂/ 2 − eA
/ (x 2 ) − m]S A (x 2 , x1 ) = δ 4 ( x 2 − x1 )
A très peu d’exceptions près, nous sommes incapables de trouver une expression compacte pour
S A . Heureusement, il arrive fréquemment que le terme e/A soit suffisamment petit pour être traité
comme une perturbation, et S A peut être exprimé comme un développement (asymptotique) en e/A .
Pour le dériver, nous multiplions les deux cotés de (1) par S F ( x3 , x 2 ) et intégrons sur x 2 :
→
S F ( x3 , x1 ) = ∫ d 4 x 2 S F ( x3 , x 2 )i ∂ 2 − eA / ( x 2 ) − m S A ( x 2 , x1 )
(2)
←
= ∫ d 4 x 2 S F ( x3 , x 2 )− i ∂ 2 − eA / ( x 2 ) − m S A ( x 2 , x1 )
L’équation (3) est adaptée pour un développement de la théorie des perturbations obtenue par
itération :
S A (x f , xi ) = S F (x f , xi ) + ∫ d 4 x1 S F (x f , x1 )eA/ ( x1 )S F ( x1 , xi )
(4)
+ ∫∫ d 4 x1 d 4 x 2 S F (x f , x1 )eA
/ ( x1 )S F ( x1 , x 2 )eA
/ ( x 2 )S F ( x 2 , xi ) + L
Ce qu'on peut représenter graphiquement comme :
d4p
Aµ ( x ) = ∫ Aµ ( p )
−ip⋅ x
(2π ) 4
(nous utilisons la même notation dans l'espace de configuration et l’espace des moments pour la
simplicité) un développement de la théorie des perturbations de S A ( p f , pi ) peut aussi être écrit.
Puisque S F (x f , xi ) = S F (x f − xi ) est invariant par translation
(6) S F ( p f , p i ) = (2π ) δ 4 ( p f − p i )S F ( p i )
4
et
S A ( p f , pi ) = S F ( pi )(2π ) δ 4 ( p f − p i )
4
+ ∫ d 4 p1 S F ( p f )eA
/ ( p1 )S F ( p i )(2π ) δ ( p f − p1 − p i )
4
(7)
+ ∫∫ d 4 p1 d 4 p 2 S F ( p f )eA / ( p 2 )S F ( p i )(2π ) δ ( p f − p1 − p 2 − p i )
/ ( p1 )S F ( p 2 + pi )eA
4
+L
VI.3. Application à la diffusion de Coulomb
La diffusion de Coulomb servira comme un test de base pour la méthode du propagateur. Le
processus étudié est la diffusion d’un électron chargé de masse m par un centre avec une charge
− Ze et une masse infinie. Ce dernier crée un potentiel A0 = − Ze / 4πr , A = 0 , où r est le vecteur
joignant le centre à la charge.
En mécanique classique non relativiste, les trajectoires sont des hyperboles. L’angle de diffusion θ
est relié au paramètre d’impact b (voir la figure ci-dessus pour les notations) par
1. Relations géométriques
a θ b θ
(1) = tan = cos
b 2 c 2
2. Conservation de l’énergie
pi2 p 2f p2 Zα
(2) ε = = = A −
2m 2m 2m c − a
( p A est l'impulsion au point A).
3. Conservation du moment angulaire
(3) l = p i b = p f b = p A (c − a )
Donc, la section efficace différentielle, définie comme le rapport de dN / dtdΩ au flux incident, est
dσ Zα 2Z 2α 2 m 2
2
1
(6) = =
dΩ 4 sin 4 θ / 2 2ε q
4
Nous retournons au cas quantique relativiste. Nous utiliserons l’expression dérivée pour les
propagateurs après substitution de S A pour S F et en prenant les conditions de liaisons suivantes :
pour t1 = −∞ , ψ (+ ) (t1 , x ) est une onde plane incidente d’électrons d’énergie positive, tandis que
pour t 2 = −∞ , ψ (− ) (t 2 , x ) s’annule. Puisque nous ne connaissons pas S A , nous nous contenterons
des deux premiers ordres du développement de la théorie des perturbations. Soit ψ inc (t , x ) la
solution de l’équation libre de Dirac qui se réduit à l’onde incidente quand t → t1 = −∞ . La
fonction d’onde perturbative s’écrit
(7) ψ ( x ) = ψ inc ( x ) + ψ diff ( x )
où
(8) ψ diff ( x ) = lim i ∫ d 3 y ∫ d 4 zS F ( x − z )eA
/ ( z )S F ( z − y )γ 0ψ inc (t1 , y )
t1 → −∞
et y ≡ (t1 , y ) .
Puisque pour ,
(9) z 0 > t1
nous avons
(10) ψ diff ( x ) = ∫ d 4 zS F ( x − z )eA
/ ( z )ψ inc ( z )
Lorsque x 0 tend vers + ∞ , ψ diff se comporte comme une pure solution d’énergie positive de
l’équation libre de Dirac. En effet, en utilisant l’expression du propagateur de Feynman, nous
voyons que seul le premier terme contribue à cette limite, et nous avons
d 3 p m 4 p/ + m −ip⋅( x − z )
ψ diff ( x ) = ∫ [− ieA/ (z )]ψ inc (z )
(2π )3 E ∫
d z e
2m
(11) 1/ 2
m
e f u (α ) ( p f )S fi
−ip ⋅ x
= ∑
k f ,α VE f
où
1/ 2
m
u (α ) ( p f )A
/ ( z )e ψ i (z )
ip f ⋅ z
(12) S fi = −ie ∫ d z 4
VE
f
Dans la deuxième expression de (11), la somme ∫ d 3 p / (2π ) a été remplacée par une somme sur
3
les états finaux dans un volume d’espace fini V : 1 / V ∑états finaux k . Alors l’onde
f ,α
(m / VE )1 / 2
u (α ) ( p ) décrit une particule de vitesse p / E et de polarisation α dans le volume V.
− ip⋅ x
) ∫
(14) S fi = −ie 4
V (Ei E f
1/ 2
d
Nous utilisons des ondes planes stationnaires au lieu de paquets d’ondes. Pas d’inquiétude alors si
l’amplitude (15) ne peut pas être élevée au carré. On y remédie si en accord avec la règle d’or de
Fermi, nous considérons un intervalle de temps fini et remplaçons les fonctions δ par
( ) ( )
(17) 2πδ (E f − Ei ) = ∫ dte
∞ i E f − Ei t T/2 i E f − Ei t
→∫ dte
−∞ −T / 2
La probabilité de transition entre les états i et f par unité de temps et par particule incidente est alors
2
iZα 4π (α ) d3pf
dPfi
=∫
m
( )γ 0 (β )
( ) πδ ( − )
V (Ei E f )1 / 2 q 2
(18) u p u p 2 E E V
dt
f i f i
(2π )3
La sommation se fait sur tous les états finaux possibles, dont le nombre dans l’élément de volume
d'impulsion d 3 p f est Vd 3 p f / (2π ) . En divisant par le flux incident [1 / V ]( p i / Ei ) nous obtenons
3
Nous avons besoin maintenant des identités pour les traces de matrices . Pour tout produit d’un
nombre impair de matrices γ , la trace s’annule. Pour un nombre pair, les identités suivantes
peuvent être prouvées par induction :
(22) tr (a/ 1 a/ 2 L a/ 2 n ) = a1 ⋅ a 2 tr (a/ 3 L a/ 2 n ) − a1 ⋅ a3 tr (a/ 2 a/ 4 L a/ 2 n ) + L
Ici, cela se réduit à
tr γ 0 p/ i γ 0 p/ f = 4(Ei E f − p i ⋅ p f + Ei E f )
(23)
tr γ 0γ 0 = 4
2 2
L’expression finale de la section efficace non polarisée (section efficace de Mott) est
dσ fi Z 2α 2 2 θ
= 2 2 1 − β sin
2
(26)
dΩ non polarisé 4p β sin θ / 2
4
2
Lorsque β → 0 , elle se réduit à la formule de Rutherford. Notons aussi que la correction relativiste
(1 − β 2
)(
sin 2 θ / 2 1 − β 2 )
−1
affecte de manière prédominante la diffusion vers l’arrière.
Ce résultat a été dérivé pour des électrons incidents. Discutons brièvement de la diffusion de
positrons dans le même champ de Coulomb. La force de Coulomb attractive est maintenant
remplacée par une force répulsive. En mécanique classique non relativiste, cela conduit à la même
formule de Rutherford (ce résultat remarquable est un phénomène particulier au champ de
Coulomb). Dans notre traitement quantique, nous savons que la théorie est invariante sous
conjugaison de charge. La diffusion d’un électron par une charge -Ze est le même qu’un positron
par une charge +Ze. D’un autre coté, à l’ordre le plus bas, la section efficace est une fonction paire
de Z. Donc la section efficace de Mott est également valide pour les positrons.
Nous pouvons le vérifier par un calcul direct. Nous utiliserons plutôt l’interprétation de la théorie
des trous. Un positron sortant de quadri impulsion p f et de polarisation α est représenté par une
solution d’énergie négative "entrante" allant en arrière dans le temps :
(27) ψ (− ) ( x ) = e v (−α ) ( p f )
ip f ⋅ x
p 0f > 0
Nous retournons donc à l’équation de départ en utilisant des conditions de liaisons temporelles
ψ (+ ) (t1 , x ) = 0 t1 = −∞
ψ (t 2 , x ) = e v ( p f ) x = t 2 = +∞
(28) (− ) ip f ⋅ x ( −α ) 0
En répétant les étapes qui conduisirent de (7) à (14), avec une attention portée au signe, nous avons
)
1/ 2
m2 (
v (− β ) ( pi )e / ( z )v (−α ) ( p f )
i p f − pi ⋅ z
(29) S fi = ie ∫ d z 2
4 A
V E E
i f
Ceci est en accord avec un calcul direct. Le positron entrant est décrit par la fonction d’onde
(30) ψ ic ( z ) = e i u ( β ) ( pi ) = Ce i v (− β )T ( pi )
− p ⋅z − p ⋅z
(à une phase près). En accord avec l’équation (12), la diffusion de ces positrons de charge sera
décrite par
S fi = ie ∫ d 4 zψ fc ( z ) A
/ ( z )ψ ic ( z )
)
1/ 2
m2 (
zv (−α )T ( p f )C −1 A
/ Cv (− β )T ( pi )e
i p f − pi ⋅ z
(31) = −ie 2
∫d
4
V E E
i f
)
1/ 2
m2 (
/ v (−α ) ( p f )e
zv ( − β ) ( p i ) A
i p f − pi ⋅ z
= ie 2
∫d
4
V E E
i f
Il est maintenant clair que cette expression conduit à la section efficace (20).
Introduisons le concept utile de facteur de forme. Supposons que nous étudiions la diffusion par
une distribution de charge finie, un noyau de rayon fini, au lieu d’une charge ponctuelle. La
symétrie sphérique de la distribution − Zeρ (r ) sera normalisée selon
∫ ρ (r )d r =1
3
(32)
Comme dans (15), la section efficace à l’ordre le plus bas en α est proportionnelle à V (q ) , où
~ 2
(33) ρ~ (q ) = ∫ ρ (r )e − iq⋅r d 3 r
par V (q ) = (1 / q 2 )ρ~(q ) . Donc la section efficace doit être amendée pour s’écrire
~
dσ dσ
ρ~(q )
2
(34) =
dΩ dΩ Mott
Exercices
1. Discutez des effets de la polarisation et du recul du noyau sur les résultats de la section VI.3.
VI.4. Méthode du temps propre de Fock-Schwinger
Comme complément à l’étude précédente des propagateurs, nous présenterons la belle méthode
introduite par Fock et Schwinger et l’utiliserons pour donner les expressions exactes du
propagateur de Dirac dans deux configurations particulières du champ électromagnétique : le
champ uniforme constant et le champ d’ondes planes.
Nous avons
(6) U ( x, x ′;τ ) = x e − iHτ x ′ ≡ x U (τ ) x ′
(7) G ( x, x ′) = −i ∫ dτ U ( x, x ′;τ )
0
−∞
L’équation (3) peut être réécrite comme
(8) i∂ t x U (τ ) x ′ = x H ( x, p )U (τ ) x ′ = x U (τ )U + (τ )H ( x, p )U (τ ) x ′
ou
(9) i∂ t x(τ ) x ′(0 ) = x(τ ) H ( x(τ ), p (τ )) x ′(0 )
avec des notations évidentes. Dans les cas favorables, nous sommes capables de résoudre pour x(τ )
et p(τ ) montrant la relation entre traitement classique et quantique. Nous exprimons alors
H ( x(τ ), p(τ )) comme une fonction d'opérateurs correctement ordonnés x(τ ) et x ′(0 ) :
(10) x(τ ) H ( x(τ ), p (τ )) x ′(0 ) = F ( x, x ′;τ ) x[τ ] x ′(0 )
Alors l’équation pour U ( x, x ′;τ ) devient une équation différentielle linéaire ordinaire qui peut être
intégrée comme
τ
(11) U ( x, x ′;τ ) = exp − i ∫ dτ ′F ( x, x ′;τ )C ( x, x ′)
où C ( x, x ′) doit encore être déterminé afin que U ( x, x ′;τ ) satisfasse les relations correctes entre
position et moment. Par exemple
[ ]
i∂ µx − eAµ ( x ) x(τ ) x ′(0) = x(τ )π µ (τ ) x(0)
π µ ≡ p µ − eAµ
[ ]
(12)
− i∂ µx′ − eAµ ( x ′) x(τ ) x ′(0) = x(τ )π µ (0) x(0)
Dans le cas d’une particule de Dirac interagissant avec un champ électromagnétique externe, nous
devons résoudre
(13) [i∂/ − eA
/ ( x ) − m]S A ( x, x ′) = δ 4 ( x − x ′)
G A ( x, x ′) définit par
(14) S A ( x, x ′) = [i∂/ − eA
/ ( x ) + m]G A ( x, x ′)
satisfait
(14) HG A ≡ (i∂ − eA) − m 2 − σ µν F µν G A ( x, x ′) = δ 4 ( x − x ′)
2 e
2
2
et en utilisant l’antisymétrie de F :
(19) π 2 (τ ) = [x(τ ) − x(0 )]K [x(τ ) − x(0 )]
où K ≡ 14 e 2 F 2 [sinh (eFτ )] − 2
Réarranger cette expression implique le commutateur [x(τ ), x(0)] :
e −2eFτ − 1
[ ]
(20) x µ (τ ), xν (τ ) = i
eF µν
(23) i
× exp ( x − x ′)eF coth (eFτ )( x − x ′) + σ µν F µν τ + im 2τ
i
4 2
2
La solution a la forme
(25) C ( x, x ′) = C ( x ′) exp− ie ∫ dξ [A(ξ ) + 12 F (ξ − x ′)]
x′
x
Puisque Aµ (ξ ) + 12 Fµν (ξ − x ′) a un rotationel nul, l’intégrale est indépendante du chemin
ν
d’intégration. En prenant une ligne droite de x ′ à x, le deuxième terme ne contribue pas, à cause de
l’antisymétrie de Fµν , et nous pouvons écrire
x′
(26) C ( x, x ′) = C exp− ie ∫ A(ξ )dξ
x
−∞
avec
U ( x, x ′;τ ) =
−i
(4π ) τ
2 2
exp
− ie ∫
x
x′ 2
[ ]
dξ µ Aµ (ξ ) − tr ln (eFτ ) sinh (eFτ )
1 −1
(29)
+
i
(
(x − x ′)eF coth(eFτ )(x − x ′) + i σ µν F µν τ + i m 2 − iε τ )
4 2
Notons la présence du terme − iε [afin de satisfaire (5)] et le facteur de phase exp− ie ∫ Adξ . Son
rôle est de rendre U invariant de jauge, lorsque
Aµ ( x ) → Aµ ( x ) + ∂ µ Λ( x )
(30)
U ( x, x ′;τ ) → e −ieΛ ( x )U (x, x ′;τ )e ieΛ ( x′ )
Nous retournons maintenant au cas de l’onde plane. Le calcul est assez analogue au précédent, et
nous soulignerons simplement les étapes successives. Nous considérons une onde plane polarisée
linéairement : Aµ = ε µ f (ξ ) avec ξ = n ⋅ x , n 2 = 0 , Fµν = φ µν f ′(ξ ) où φ µν = n µ ε ν − nν ε µ . Notons
que ∂ ρ Fµρ = 0 . Donc les équations (15) prennent la forme
dx µ
= −2π µ
dτ
(31)
dπ µ
= −2eφ µρ π ρ f ′(ξ ) − n µ φ ρν σ ρν f ′′(ξ )
e
dτ 2
Ici Dµ est un nouvel opérateur constant qui commute avec π ⋅ n . Nous calculons alors x(τ ) − x(0)
et éliminons Dµ :
x µ (τ ) − x µ (0 ) τ ξ (τ )
π µ (τ ) = − dξ 2eC µ f (ξ ) + e n µ f (ξ ) + n µ φνρ σ νρ f ′(ξ )
e
+ ∫
2 2
(35)
2τ [ξ (τ ) − ξ (0)] ξ ( )
2 0 2
τ
2eC µ f [ξ (τ )] + e n µ f [ξ (τ )] + n µ φ ρν σ f ′[ξ (τ )]
e ρν
− 2 2
ξ (τ ) − ξ (0) 2
(36) C µ = −
1
2τ
[
φ µρ x ρ (τ ) − x ρ (0) − ] en µ
∫
ξ (τ )
ξ (τ ) − ξ (0) ξ (0 )
f (ξ )dξ
Après le calcul des divers commutateurs
[ ]
ξ (τ ), x µ (0) = 0
(37) [ξ (0), x (τ )] = 2in τ
µ µ
[x (τ ), x (0)] = −8iτ
µ
µ
δf 2 dénote la quantité
dξ f 2 (ξ ) ξ (τ ) dξ f (ξ )
2
ξ (τ )
(39) δf 2
=∫ − ∫
ξ (0 ) ξ (τ ) − ξ (0 )
ξ (0 ) ξ (τ ) − ξ (0 )
2
) ξ − ξ ′
où la fonction C ( x, x ′) est à nouveau déterminée par les relations (12). Nous trouvons
µ φ µρ ( y ρ − x ′ρ ) n⋅ y du f (u )
(41) C ( x, x ′) = C ( x ′) exp − ie ∫ dy µ A ( y ) −
( )
x
n ⋅ y − ξ ∫ξ n ⋅ y − ξ
− f n ⋅ y
x′
où l’intégrale est indépendante du chemin. Pour une ligne droite, le seul terme restant dans la phase
est exp− ie ∫ dy µ A µ ( y ) , et nous trouvons finalement
x
x′
U ( x, x ′;τ ) = −
i
(4π )2 τ 2
(42)
( x − x ′ )2 2 f (ξ ) − f (ξ ′)
− iε τ − e ∫ dy µ A µ ( y )
e x
× exp i + e δf 2
+ m 2 + φ ρν σ ρν
4τ 2 ξ −ξ′ x′
Ce résultat rappelle le résultat classique. Pour une fonction périodique f (ξ ) , le terme proportionnel
à φνρ σ νρ est amorti si nous moyennons sur quelques périodes. L’effet net est un décalage de masse
2
(43) meff = m 2 + e 2 δf 2
= m2 + e2 f 2
De tels effets non linéaires sont durs à détecter. Des faisceaux à hautes intensités sont requis,
puisque pour une onde plane monochromatique de fréquence ω / 2π = c / λ et de densité d’énergie
E = E 2 = f 2ω 2 = ρhω , nous avons
∆m 2 e 2 f 2 ρc
(44) = 2 2 = 4παD 2e = 2αD 2e λρ
m 2
m c ω
Ici D e est la longueur d’onde de Compton de l’électron et ρ est le nombre de photons par unité de
volume dans le faisceau incident. Jusqu’à maintenant, les plus puissants faisceaux lasers ne sont pas
capables d’atteindre une valeur mesurable pour ce rapport.
Exercices
1. On put introduire un potentiel pour l'équation de Klein-Gordon tout comme on le fait pour
l'équation de Schrödinger. Répétez les raisonnements de la section I.1 pour obtenir l'équation
avec potentiel. On l'appelle parfois équation de Schrödinger relativiste.
2. Résolvez l'équation de Schrödinger relativiste pour un puits de potentiel carré attractif de
profondeur V0 et un rayon a, après avoir déterminé les conditions de continuité en r = a.
Obtenez une expression explicite pour la valeur V0 minimale avec a donné qui donne juste un
état lié pour une particule de masse m.
3. Trouvez la solution de l'équation de Schrödinger relativiste qui est finie en r = 0 et qui
correspond à l'énergie potentielle eφ = − Ze 2 / a pour r < a et eφ = − Ze 2 / r pour r > a, quand a
est très petit. Notez que seuls les deux premiers termes de chaque développement en r ont
besoin d'être retenu.
4. Résolvez l'équation de Dirac pour un puits de potentiel carré attractif de profondeur V0 et un
rayon a, après avoir déterminé les conditions de continuité en r = a. Obtenez une expression
explicite pour la valeur V0 minimale avec a donné qui donne juste un état lié pour une particule
de masse m. Comparez à l'exercice 2.